中文字幕日韩人妻|人人草人人草97|看一二三区毛片网|日韩av无码高清|阿v 国产 三区|欧洲视频1久久久|久久精品影院日日

整車道路試驗(yàn)大數(shù)據(jù)分析

時(shí)間:2023-05-08 11:18:04

序論:好文章的創(chuàng)作是一個(gè)不斷探索和完善的過(guò)程,我們?yōu)槟扑]一篇整車道路試驗(yàn)大數(shù)據(jù)分析范例,希望它們能助您一臂之力,提升您的閱讀品質(zhì),帶來(lái)更深刻的閱讀感受。

整車道路試驗(yàn)大數(shù)據(jù)分析

1引言

整車道路試驗(yàn)(VehicleRoadTest,VRT)[1]是指在公共/測(cè)試道路上進(jìn)行一定強(qiáng)度的預(yù)生產(chǎn)車輛駕駛操作,以評(píng)估車輛的設(shè)計(jì)功能和性能。VRT與仿真測(cè)試相比,具有更強(qiáng)的客觀優(yōu)勢(shì),通常被認(rèn)為是原型車輛距離交付市場(chǎng)階段的“最后一公里”。未關(guān)聯(lián)用戶的VRT可能導(dǎo)致某些子系統(tǒng)的過(guò)度設(shè)計(jì)或者欠設(shè)計(jì)[2]。這是由于消費(fèi)者對(duì)主機(jī)廠過(guò)去售出車輛的使用信息未能有效向車輛研發(fā)與測(cè)試工程師反饋的結(jié)果。故朱佳琦[3]提出了基于用戶使用數(shù)據(jù)分析的整車道路試驗(yàn)優(yōu)化方案,江毓等人[4]提出了一種關(guān)聯(lián)用戶使用情況的相對(duì)合理的試驗(yàn)場(chǎng)整車耐久性試驗(yàn)方案。用戶關(guān)聯(lián)的VRT可用于測(cè)試認(rèn)證規(guī)范的制定,以發(fā)現(xiàn)和消除潛在的設(shè)計(jì)缺陷,從而減少售后索賠和召回成本。車聯(lián)網(wǎng)[5][6]允許從開(kāi)放道路上運(yùn)行的車輛中收集車輛參數(shù),為關(guān)聯(lián)用戶駕駛提供了數(shù)據(jù)收集渠道。然而,隨著長(zhǎng)期和高頻的數(shù)據(jù)積累,研發(fā)工程師正面臨著處理大數(shù)據(jù)的挑戰(zhàn)。利用大數(shù)據(jù)技術(shù)可以為汽車行業(yè)提供轉(zhuǎn)型的機(jī)會(huì)。2014年初,JohansonMathias等人[7]開(kāi)發(fā)了一個(gè)大數(shù)據(jù)框架,以探索利用汽車大數(shù)據(jù)進(jìn)行知識(shí)驅(qū)動(dòng)的產(chǎn)品開(kāi)發(fā)。龔蓉軍[8]開(kāi)發(fā)了一個(gè)針對(duì)道路試驗(yàn)的數(shù)據(jù)平臺(tái),使用Hadoop、Hive和Spark工具實(shí)現(xiàn)數(shù)據(jù)收集、存儲(chǔ)、分析和報(bào)告展示。然而,當(dāng)將大數(shù)據(jù)技術(shù)應(yīng)用于VRT領(lǐng)域時(shí),以往的系統(tǒng)忽略了領(lǐng)域?qū)<业膶W(xué)習(xí)成本,導(dǎo)致可用性體驗(yàn)較差。更糟糕的是,沒(méi)有定制的分析組件來(lái)整合領(lǐng)域知識(shí)并協(xié)助業(yè)務(wù)專家應(yīng)用到具體的案例級(jí)分析。本文的目標(biāo)是設(shè)計(jì)和實(shí)現(xiàn)一個(gè)大數(shù)據(jù)科學(xué)指導(dǎo)的VRT系統(tǒng)以屏蔽大數(shù)據(jù)的復(fù)雜性,使用戶能夠直觀地探索、分析和可視化數(shù)據(jù)。如圖1所示,該系統(tǒng)扮演著利用大數(shù)據(jù)科學(xué)指導(dǎo)工程師進(jìn)行關(guān)聯(lián)分析的最后一公里的角色,為關(guān)聯(lián)用戶駕駛的道路試驗(yàn)分析提供更直觀的信息挖掘過(guò)程。

2系統(tǒng)概述

圖2為該系統(tǒng)的技術(shù)架構(gòu),其將整個(gè)系統(tǒng)分為三層架構(gòu):大數(shù)據(jù)平臺(tái)層。我們選擇了Hadoop、Spark、Oozie用于分布式數(shù)據(jù)存儲(chǔ)、計(jì)算和作業(yè)調(diào)度。該平臺(tái)基于SparkSQL和ML來(lái)執(zhí)行分析操作。Spark的數(shù)據(jù)源是存儲(chǔ)在HDFS文件系統(tǒng)上的汽車傳感器數(shù)據(jù)。然后,選擇Oozie工作流調(diào)度器來(lái)調(diào)度特定作業(yè)(如ScalaSpark程序和Pyspark腳本)。一旦后端服務(wù)提交了一個(gè)Spark作業(yè),這個(gè)作業(yè)將立即被發(fā)送到相應(yīng)的Oozie調(diào)度器。這個(gè)平臺(tái)層主要用于探索和分析從全國(guó)客戶處收集的大量真實(shí)駕駛數(shù)據(jù)?;旌戏?wù)層。中間層是一個(gè)混合的Java和Python服務(wù),用于本地和集群計(jì)算,實(shí)現(xiàn)自動(dòng)和智能的數(shù)據(jù)驅(qū)動(dòng)分析。在我們的設(shè)計(jì)中,提供了兩種后端服務(wù)。基于Python的分析(Python-basedAnalysis,PA)和基于Java的分析(Java-basedAnalysis,JA)服務(wù)。PA服務(wù)可以提交Spark分布式作業(yè),也可以用本地進(jìn)程服務(wù)處理本地?cái)?shù)據(jù)。這個(gè)由Flask提供的本地進(jìn)程服務(wù)結(jié)合了pandas和scikit-learn等軟件包,用于提供快速統(tǒng)計(jì)或機(jī)器學(xué)習(xí)API。同樣,JA服務(wù)也有兩個(gè)分支,其本地進(jìn)程服務(wù)在處理其他事務(wù)性功能方面具有優(yōu)勢(shì)。在某些情況下,本地?cái)?shù)據(jù)分析仍然是必要的,測(cè)試工程師希望上傳一個(gè)本地MDF文件,傾向于更節(jié)省時(shí)間的本地分析。當(dāng)分析任務(wù)返回時(shí),結(jié)果被提交給系統(tǒng)的展示層。這個(gè)服務(wù)層分別處理來(lái)自測(cè)試車輛和售出車輛的數(shù)據(jù)樣本的實(shí)時(shí)計(jì)算任務(wù)。展示層。我們選擇使用一個(gè)基于web的用戶界面,其采用了React框架實(shí)現(xiàn),并使用Echart插件來(lái)繪制圖表。這個(gè)展示層能夠?qū)崿F(xiàn)豐富的互動(dòng)操作和選項(xiàng),以指導(dǎo)數(shù)據(jù)科學(xué)流程。同時(shí),如果定義了一個(gè)分析任務(wù),對(duì)數(shù)據(jù)進(jìn)行的分析類型將被記錄。根據(jù)所要求的分析類型,分析任務(wù)的結(jié)果可以是不同種類的圖表或圖形,通過(guò)基于web的用戶界面進(jìn)行組合并提供給用戶。

3系統(tǒng)重點(diǎn)實(shí)現(xiàn)描述

該系統(tǒng)從業(yè)務(wù)目標(biāo)的確定,數(shù)據(jù)準(zhǔn)備,先樣本后總體分析以得出結(jié)論,最后以web報(bào)告的形式可視化四個(gè)主要階段輔助工程師快速利用大數(shù)據(jù)手段進(jìn)行業(yè)務(wù)分析。

3.1業(yè)務(wù)目標(biāo)

VRT分析的一個(gè)共同業(yè)務(wù)目標(biāo)是在用性能比(InUsePerformanceRatio,IUPR)[9]研究,通常包括:(1)發(fā)動(dòng)機(jī)怠速時(shí)長(zhǎng)分析;(2)車速持續(xù)時(shí)間分析;(3)油門(mén)位置From-To分析;(4)油門(mén)位置與車速的距離范圍;(5)發(fā)動(dòng)機(jī)停機(jī)時(shí)間分析。這些案例具有強(qiáng)烈的實(shí)際意義,都可以通過(guò)我們的系統(tǒng)來(lái)實(shí)現(xiàn)。

3.2數(shù)據(jù)準(zhǔn)備

該階段將準(zhǔn)備一個(gè)關(guān)于業(yè)務(wù)目標(biāo)的目標(biāo)數(shù)據(jù)集。首先,測(cè)試人員既可以通過(guò)JA服務(wù)上傳一個(gè)本地文件,也可以使用PA服務(wù)訪問(wèn)HDFS文件。無(wú)論數(shù)據(jù)集如何添加,它都被稱為VRT域中的總體。然后,后端服務(wù)將啟動(dòng)一個(gè)本地或Spark作業(yè),以獲得關(guān)于此總體的摘要以及這個(gè)總體的子集。摘要是對(duì)數(shù)據(jù)的統(tǒng)計(jì)描述(計(jì)數(shù)、最小值、平均值等),以及所有信號(hào)的缺失值、唯一值情況。先樣本后總體(FirstSampleThenPopulation,F(xiàn)STP)是測(cè)試工程師進(jìn)行IUPR分析的工業(yè)經(jīng)驗(yàn)。這里的樣本指的就是剛才的子集。對(duì)上述大數(shù)據(jù)的一步步操作是很耗時(shí)的,用戶的耐心會(huì)隨著時(shí)間的推移逐漸耗盡。采樣已被證明是處理大數(shù)據(jù)問(wèn)題的一種有效方式。為了使我們的系統(tǒng)更加友好,我們將首先采樣總體數(shù)據(jù)并將其加載到本地MySQL數(shù)據(jù)庫(kù)中。因?yàn)閯?dòng)力學(xué)片段是測(cè)試工程師重點(diǎn)關(guān)注的樣本,我們讓采樣過(guò)程中除了均勻隨機(jī)的方式外,還選擇幾個(gè)動(dòng)力學(xué)片段。提取部分動(dòng)力學(xué)片段被稱為線性采樣??紤]到要分析的整個(gè)數(shù)據(jù)集,我們假設(shè)由均勻和線性抽樣產(chǎn)生的相對(duì)較小的比例可以近似于總體的分布。那么,我們對(duì)樣本包含不同參數(shù)的缺失和異常情況就有更大的把握。這樣一來(lái),對(duì)樣本的數(shù)據(jù)預(yù)處理步驟就可以完全復(fù)制到總體數(shù)據(jù)集上,有效避免在樣本上的預(yù)處理步驟與總體數(shù)據(jù)集上的不一致問(wèn)題。

3.3FSTP分析

一旦數(shù)據(jù)準(zhǔn)備好了,測(cè)試人員就可以為特定的用戶群體分析創(chuàng)建一個(gè)新的工作臺(tái)。相應(yīng)的分析界面會(huì)根據(jù)信號(hào)的類型進(jìn)行分類和顯示,然后列出可選的分析組件。測(cè)試人員只需點(diǎn)擊相關(guān)的分析組件,將需要分析的信號(hào)拖到相應(yīng)的輸入框中,就會(huì)立即計(jì)算并顯示該組件對(duì)樣本數(shù)據(jù)的分析結(jié)果??梢暬矫?,我們提供了一些繪圖組件,如直方圖、散點(diǎn)圖、柱狀圖、折線圖和熱圖。它們可以用于不同的情況,例如,直方圖可以用來(lái)檢查汽車的速度分布,折線圖可以用來(lái)觀察制動(dòng)狀態(tài)的變化,熱圖可以顯示發(fā)動(dòng)機(jī)轉(zhuǎn)速和扭矩的使用規(guī)律??梢暬ㄔ诠こ處熆扇萑虝r(shí)間內(nèi)的樣本級(jí)分析呈現(xiàn),和最終總體級(jí)別分析結(jié)果的呈現(xiàn)。通過(guò)樣本集上分析可視化,工程師可快速?zèng)Q定數(shù)據(jù)準(zhǔn)備和分析邏輯是否是他們所期望的。如果這些操作是它們希望在總體級(jí)別上執(zhí)行的操作,則將啟動(dòng)一個(gè)Spark作業(yè),以分布式的方式進(jìn)行集群計(jì)算。

4案例研究

在本節(jié)中,我們將以某汽車研究院的某個(gè)應(yīng)用為例進(jìn)行闡述。該系統(tǒng)導(dǎo)入了基于車載T-BOX從市場(chǎng)用戶車輛采集的各種車載傳感器數(shù)據(jù)。典型的信號(hào)包括速度、轉(zhuǎn)向角速度、里程表、轉(zhuǎn)速、制動(dòng)踏板狀態(tài)、加速度開(kāi)啟度等。自2019年以來(lái),該大數(shù)據(jù)平臺(tái)已經(jīng)存儲(chǔ)了五千多輛汽車的數(shù)據(jù)。平均每天收集1800萬(wàn)條記錄,容量為3.6GB,數(shù)據(jù)總?cè)萘繛?328GB,其中包括225億條記錄。在本示例中,工程師A、B和C想要獲得一份關(guān)于所有用戶車輛上動(dòng)力系統(tǒng)極端溫度分布的報(bào)告。他們的任務(wù)分工為:A進(jìn)行數(shù)據(jù)準(zhǔn)備和電機(jī)的極端溫度分布分析,B負(fù)責(zé)蓄電池的極端溫度分布,C最后匯報(bào)報(bào)告。首先,A選擇2019年7月1日在中國(guó)全省運(yùn)行的所有車輛,并選擇所需的信號(hào),即車輛識(shí)別號(hào)(VIN)、電機(jī)和電池溫度。然后,系統(tǒng)根據(jù)用戶的選擇開(kāi)始數(shù)據(jù)準(zhǔn)備任務(wù),獲得相應(yīng)數(shù)據(jù)集上的描述性統(tǒng)計(jì)信息。同時(shí),通過(guò)提出的采樣策略,獲得采樣數(shù)據(jù)集并將其存儲(chǔ)在MySQL表中。上一階段完成后,工程師A可以預(yù)覽樣本和相應(yīng)的描述性統(tǒng)計(jì)結(jié)果,以檢查是否存在空值或異常情況。如果數(shù)據(jù)質(zhì)量不好,則將啟動(dòng)數(shù)據(jù)編輯操作。在編輯階段,A可以選擇刪除或填充空值,并過(guò)濾掉相關(guān)的值。一旦確定,編輯步驟將被記錄并封裝成一系列的Spark操作,這些操作將提交給Oozie進(jìn)行任務(wù)調(diào)度。用戶可能需要很長(zhǎng)時(shí)間來(lái)等待大數(shù)據(jù)平臺(tái)才能完成數(shù)據(jù)編輯階段。數(shù)據(jù)編輯階段是可重復(fù)的,用戶可以重復(fù)執(zhí)行預(yù)覽、探索和編輯操作,直到數(shù)據(jù)質(zhì)量滿足要求。接下來(lái),以準(zhǔn)備好的樣本數(shù)據(jù)作為輸入,A和B可以并行完成他們的分析任務(wù)。分析工作臺(tái)如圖3所示,在我們的系統(tǒng)中,VIN顯示為一個(gè)“維度”,因?yàn)樗臄?shù)據(jù)類型是字符串;電池和電機(jī)溫度信號(hào)是數(shù)值類型,所以它被分為“指標(biāo)”欄。為了完成它們的工作,A和B都應(yīng)該首先選擇要分析的組件,在示例中是一個(gè)多維的條形圖。對(duì)于電機(jī)部件,A將VIN和電機(jī)溫度拖動(dòng)到相應(yīng)的輸入箱中。通過(guò)點(diǎn)擊電池溫度并選擇所提供的匯總方法中的最大選項(xiàng),將顯示所有車輛的最大電機(jī)溫度的直方圖。需要注意的是,這里給出的結(jié)果仍然是基于樣本數(shù)據(jù)集的。如果樣本集上的顯示結(jié)果是他們想要的,他們保存這個(gè)項(xiàng)目。然后提交一個(gè)Spark作業(yè),以對(duì)總體執(zhí)行分析過(guò)程。完成后,電機(jī)和電池部件的結(jié)果圖將共享給C制作最終報(bào)告。通過(guò)這份報(bào)告,工程師發(fā)現(xiàn)用戶駕駛數(shù)據(jù)中的動(dòng)力系統(tǒng)溫度分布與零部件供應(yīng)商提供的溫度分布有所偏差。動(dòng)力系統(tǒng)溫度是熱管理系統(tǒng)中一些故障的關(guān)鍵。因此,研發(fā)人員修改了一些相關(guān)測(cè)試標(biāo)準(zhǔn)的參數(shù)。

5結(jié)語(yǔ)

VRT的最終目標(biāo)不僅是滿足清晰的要求,還要涵蓋用戶的駕駛習(xí)慣,提高研發(fā)測(cè)試認(rèn)證與實(shí)際使用的相關(guān)性,從而減少售后問(wèn)題和召回成本。然而,該行業(yè)仍沒(méi)有完全整合其用于道路試驗(yàn),還有很多工作要做。為了應(yīng)對(duì)測(cè)試工程師所面臨的大數(shù)據(jù)挑戰(zhàn),我們提出了一個(gè)可視化的大分析系統(tǒng)。它是一個(gè)自助服務(wù)環(huán)境,支持整個(gè)分析周期——整合、準(zhǔn)備、分析和可視化。此外,易于使用的界面和即時(shí)建模使業(yè)務(wù)分析師能夠輕松工作,無(wú)需額外的IT協(xié)助。它還可以促進(jìn)測(cè)試數(shù)據(jù)的收集和處理,這些數(shù)據(jù)可以用來(lái)更新整個(gè)車輛原型,從而減少現(xiàn)實(shí)和模擬測(cè)試之間的差距。在未來(lái),我們將嘗試涵蓋更多的商業(yè)案例。

參考文獻(xiàn):

[3]朱佳琦.基于用戶使用數(shù)據(jù)分析的整車道路試驗(yàn)優(yōu)化方案[J].上海汽車,2017(03):16-19.

[4]江毓,王驍磊,鄭燕萍,王羽塵.與用戶使用關(guān)聯(lián)的整車耐久性試驗(yàn)方案確定[J].時(shí)代汽車,2017,No.282(06):81-83+85.

[6]趙津,張博,潘霞,謝蓉.車聯(lián)網(wǎng)通信技術(shù)及應(yīng)用前景研究[J].時(shí)代汽車,2021(06):15-16+32.

作者:陸林 熊珂 單位:國(guó)汽智圖(北京)科技有限公司 湖北交投宜昌高速公路運(yùn)營(yíng)管理有限公司

上一篇: 新能源純電驅(qū)動(dòng)技術(shù)分析 下一篇: 夜間道路標(biāo)線亮度對(duì)駕駛行為的...
友情鏈接