女人被狂躁到高潮视频免费无遮挡,内射人妻骚骚骚,免费人成小说在线观看网站,九九影院午夜理论片少妇,免费av永久免费网址

當(dāng)前位置:首頁 > 汽車電子 > 汽車電子
[導(dǎo)讀]汽車工程師采用多種智能技術(shù)幫助人們安全駕駛汽車。汽車系統(tǒng)中的主要技術(shù)包括雷達(dá)、超聲和攝像/視覺感測(cè)。這些技術(shù)統(tǒng)稱駕駛員輔助 (DA) 系統(tǒng),用于在惡劣條件和危險(xiǎn)路況下協(xié)助安全駕駛。第一代攝像 DA 系統(tǒng)目前可見于

汽車工程師采用多種智能技術(shù)幫助人們安全駕駛汽車。汽車系統(tǒng)中的主要技術(shù)包括雷達(dá)、超聲和攝像/視覺感測(cè)。這些技術(shù)統(tǒng)稱駕駛員輔助 (DA) 系統(tǒng),用于在惡劣條件和危險(xiǎn)路況下協(xié)助安全駕駛。

第一代攝像 DA 系統(tǒng)目前可見于各種生產(chǎn)用車型。這類系統(tǒng)大多為駕駛員提供車輛周邊環(huán)境的視頻圖像。最常見的是泊車/倒車輔助系統(tǒng),這種系統(tǒng)用后視攝像頭拍攝本車后面的景物,并且在無線電/導(dǎo)航系統(tǒng)的屏幕上或者在儀表板中的小型顯示器上顯示圖像。

第二代攝像系統(tǒng)正處于開發(fā)測(cè)試階段,目前使用有限。第二代系統(tǒng)并非僅為駕駛員提供圖像,而是運(yùn)用圖像處理與解析從視頻流中提取信息,并且對(duì)車輛環(huán)境進(jìn)行表征和評(píng)估。必要時(shí)駕駛員會(huì)收到相應(yīng)警示。

隨著工程師們獲取車輛環(huán)境表征方面的實(shí)際經(jīng)驗(yàn),未來的 DA 技術(shù)會(huì)更復(fù)雜,將為消費(fèi)者提供更強(qiáng)大的實(shí)用工具并且增強(qiáng)其他汽車子系統(tǒng)的性能。圖 1 概括了目前和未來的多種 DA 功能。

高級(jí)處理要求

DA 系統(tǒng)的處理要求可能超過目前汽車級(jí)串行 DSP 處理器的能力。另外,為了提高消費(fèi)價(jià)值,在一套視覺傳感器上捆綁多種 DA 功能的需求日益高漲。

例如,前瞻視覺模塊可能需要同時(shí)支持車道偏離警示、智能大燈控制和標(biāo)志識(shí)別功能,而所有這些都需要不同的處理算法。因此,對(duì)于用 FPGA 通過原始圖像數(shù)據(jù)處理、配置靈活性和器件可縮放性來提供系統(tǒng)價(jià)值,DA 市場(chǎng)提供了實(shí)實(shí)在在的機(jī)會(huì)。

視覺 DA 系統(tǒng)的圖像處理與解析功能可以包括空間/時(shí)間濾波、鏡頭失真校正、圖像清晰化、對(duì)比度增強(qiáng)、邊沿檢測(cè)、圖像匹配、物體識(shí)別和物體跟蹤,在某些情況下還包括圖形疊加。尤其值得關(guān)注的是一種支持運(yùn)動(dòng)估計(jì)或立體視差計(jì)算的圖像匹配功能。

為了說明 FPGA 處理的性能價(jià)值,我們來考慮這樣一個(gè)視覺系統(tǒng):以 30 Hz 幀速率 (fps) 生成視頻的寬幅 VGA 分辨率成像器件(752×480 像素),而且需要估計(jì)幀間物體運(yùn)動(dòng)(或流動(dòng))。有一種算法(也適用于立體視差計(jì)算)是將圖像劃分為若干個(gè)塊(如大小為 4×4 像素),然后判斷第一幀中各圖像塊對(duì)第二幀中指定搜索區(qū)(如 20×20 像素)內(nèi)某位置的匹配條件。

一種常用的匹配條件是用算子 SAD(絕對(duì)差和)求出第一幀圖像中的 4×4 塊與第二幀圖像上搜索區(qū)內(nèi)的像素之間的像素灰度最小絕對(duì)誤差 (MAE)。

我們的 4×4 塊匹配示例需要 250 MMAE/s(每秒百萬次 MAE 計(jì)算)以上的性能,因?yàn)?(752 像素)×(480 行)×(20 ×20 像素搜索區(qū))×(30 fps)/(4×4 像素塊大小) = 270,720,000 MAE/s。MAE 表示 4×4 像素塊的最終匹配誤差,而 SAD 是指根據(jù)四個(gè)獨(dú)立元素對(duì)進(jìn)行計(jì)算得到的絕對(duì)差和。所以,每 MAE 需要四次 SAD 運(yùn)算。

處理選項(xiàng)

由汽車設(shè)計(jì)工程師決定的處理選項(xiàng)包括超長(zhǎng)指令字 (VLIW) DSP-CPU 和 FPGA。FPGA 的處理能力遠(yuǎn)遠(yuǎn)高于任何現(xiàn)有的 VLIW DSP-CPU。這是由于 FPGA 的架構(gòu):大量并行功能單元(包括可編程 MAC)使 FPGA 的性能比任何 DSP 都高出 10-30 倍(具體性能取決于所實(shí)現(xiàn)的應(yīng)用),即使 FPGA 的時(shí)鐘頻率比 DSP-CPU 的時(shí)鐘頻率低得多。我們使用塊匹配運(yùn)算示例,是要證明 Xilinx® FPGA 的性能比任何 VLIW DSP-CPU 處理器都高。

VLIW DSP-CPU 處理器中的 SAD 和 MAE 計(jì)算

在一個(gè) 32 位架構(gòu)的單指令多數(shù)據(jù) (SIMD) DSP-CPU 中可實(shí)現(xiàn)四個(gè) 8 位像素視頻數(shù)據(jù)單元的 SAD 運(yùn)算,因此,僅在一個(gè)周期內(nèi)即可有效執(zhí)行相當(dāng)于 11 條基本指令的運(yùn)算,如圖2 所示。

圖2

例如,Nexperia PNX1500 媒體處理器配有 32 位 TriMedia VLIW-CPU,對(duì)于具有二周期延遲的 8 位像素,可以在一個(gè)時(shí)鐘周期內(nèi)執(zhí)行兩條四路 SAD 指令。算上超長(zhǎng)指令字,就是每時(shí)鐘周期最多五條基本 RISC/SIMD 指令,其中只有兩條可以是 SAD 指令(在 TriMedia 數(shù)據(jù)手冊(cè)中稱為“8meii”)。

所以,對(duì) 4×4 大小的塊進(jìn)行 MAE 計(jì)算需要五個(gè)時(shí)鐘周期,如表 1 所示:兩個(gè)周期用于兩條四路 SAD 指令的流水線處理(周期 1 用于 sad1/sad2,周期 2 用于 sad3/sad4);三個(gè)周期用于部分結(jié)果的累加(周期3、4 和 5)。因此,如果只處理一個(gè)塊,則一個(gè) 300 MHz 的 Nexperia PNX1500 處理器的處理能力最高可達(dá) 60 MMAE/s。

如果每次處理一個(gè)以上 4×4 塊,最高性能可略有提高。例如,可以在七個(gè)周期內(nèi)計(jì)算兩個(gè)并行 4×4 塊的 MAE,這時(shí)性能可達(dá) 85.71 MMAE/s;而處理三個(gè)塊需要九個(gè)周期,即性能為 100 MMAE/s。

可并行處理的最大塊數(shù)分別受限于任意長(zhǎng)指令字中允許的 SIMD SAD 運(yùn)算次數(shù)、VLIW-CPU 的通用寄存器數(shù)和優(yōu)化編譯器的調(diào)度算法。如果繼續(xù)增加塊數(shù),整體性能會(huì)趨于飽和,因此我們考慮并行處理的 MAE 不超過三個(gè)。

德州儀器 (TI) 的 TMSD320DM6437 數(shù)字媒體處理器每周期有一條由八次基本 RISC 運(yùn)算組成的長(zhǎng)指令,分別通過兩條數(shù)據(jù)通路,各通路每周期有四個(gè)時(shí)隙。其 VLIW-CPU 每周期最多可執(zhí)行兩條 SAD 指令(在 TI DM6437 數(shù)據(jù)手冊(cè)中稱為“subabs4”),各指令有一個(gè)周期的延遲。但是,要累加部分結(jié)果,就必須使用常數(shù) 0x01010101 執(zhí)行具有三周期延遲的 SIMD MAC 運(yùn)算(稱為“dotpsu4”)。

所以,600 MHz 的 TI DM6437 DSP-CPU 可以用七個(gè)周期計(jì)算一個(gè) MAE(如表 2 所示),因此對(duì)于 4 x 4 像素塊的最高性能為 85.71 MMAE/s。如果并行處理兩個(gè)塊,就需要九個(gè)周期,性能為 133.33 MMAE/s;而三個(gè)塊需要 11 個(gè)周期,性能為 163.64 MMAE/s,這仍然低于我們的 250 MSAD/s 要求。

VLIW DSP-CPU 性能不足

至此,我們一直假定每像素 8 位,這很適合 32 位架構(gòu)的 DSP-CPU 處理器。然而,新型 CMOS 圖像傳感器的分辨率范圍較高,即每像素 12 到 14 位。對(duì)于這些數(shù)據(jù)類型,32 位架構(gòu)的傳統(tǒng)四路 8 位子字 SIMD 不夠有效,必須換用雙路 16 位半字 SIMD,其中的子字并行度僅為二。因此,由于計(jì)算一個(gè) MAE 需要較多時(shí)鐘周期,最高性能大幅度下降。

表3 所示為在 TI VLIW DSP-CPU 上使用 16 位子字指令計(jì)算 SAD 時(shí)可能的偽匯編代碼,假定延遲正確且函數(shù)發(fā)射時(shí)隙允許執(zhí)行這種指令。因此,一個(gè) 4×4 的塊需要八個(gè)周期,而并行處理兩個(gè)和三個(gè)塊分別需要 10 個(gè)和 12 個(gè)周期。這時(shí),相應(yīng)的最高性能分別為 75 MMAE/s、120 MMAE/s 和 150 MMAE/s。這些數(shù)字都比使用 8 位子字指令得到的數(shù)字小。

Spartan-3A DSP FPGA 的 SAD 和 MAE 性能

為了填補(bǔ) Spartan™-3 和 Virtex™-4 器件之間的處理性能空白,Xilinx 推出了 Spartan 3A-DSP 1800A 和 3400A FPGA。這些器件采納了 Virtex-4 器件中的 DSP48 Slice 的修改版。另外,3A-DSP 器件包括大量片上存儲(chǔ)器(Block RAM)。這兩方面增強(qiáng)加上針對(duì)大量應(yīng)用制訂的價(jià)位使 3A-DSP 器件非常適合汽車視覺 DA 系統(tǒng)。

圖 3 所示為 Spartan-3A DSP 1800 (XC3SD1800A-4FG676) 器件上的四路 12 位像素的 SAD 計(jì)算方案。此實(shí)現(xiàn)是使用 System Generator for DSP 設(shè)計(jì)流程(Xilinx 提供的 Simulink 工具中的數(shù)位和周期都精確的可綜合庫)完成的。所需資源數(shù)量是 121 個(gè) Slice(236 個(gè) LUT 和 140 個(gè)觸發(fā)器)。將此結(jié)構(gòu)復(fù)制四次并且加上部分結(jié)果,即得到整個(gè) 4×4 塊的計(jì)算方案,該方案需要 508 個(gè) Slice(990 個(gè)觸發(fā)器和 606 個(gè) LUT),具有一個(gè)周期吞吐量(這意味著可從任意時(shí)鐘周期開始計(jì)算新的 MAE)和七個(gè)周期延遲。

如果使用 150 MHz 時(shí)鐘頻率(該器件最高時(shí)鐘頻率為 250 MHz),只需要兩個(gè)并行結(jié)構(gòu)(約占器件面積的 6%)即可達(dá)到 300 MMAE/s 的性能,從而滿足示例應(yīng)用的 250 MMAE/s 性能要求。這樣可以節(jié)省大量資源用來實(shí)現(xiàn)其他圖像處理功能、數(shù)據(jù)路由管道、存儲(chǔ)器接口控制器以及一個(gè)用于串行處理和外部通信的 32 位 MicroBlaze™ 嵌入式處理器。

作為參考,仍然用 150 MHz 頻率,Spartan 3A-DSP 1800A 器件僅使用整個(gè) FPGA 器件的 70% 即可并行處理多達(dá) 23 個(gè)塊(70%×16,640 Slice/508 Slice/塊 = 23 塊)。與此對(duì)應(yīng)的最高性能是 3,529 MMAE/s,這至少要比 600 MHz 的 TI DSP-CPU 的最高性能高 25 倍。

結(jié)論

我們以汽車視覺應(yīng)用為例說明了如何利用中型低成本 Xilinx FPGA 的可編程并行處理能力提供超過 VLIW DSP-CPU 的處理性能。表 4 列出了我們的分析結(jié)果。

請(qǐng)注意,對(duì)于 12 位像素?cái)?shù)據(jù)的 4 x 4 塊的 MAE 計(jì)算,Spartan-3A DSP 的性能僅以四分之一時(shí)鐘速度即可達(dá)到 TI TMS320DM6437 的兩倍。另外,F(xiàn)PGA 的資源占用率僅為 6%,因此可以在同一器件上實(shí)現(xiàn)其他圖像處理功能(必要時(shí)可采納并行處理)。

另一方面,VLIW DSP-CPU 在 SAD 計(jì)算期間被完全占用,消耗串行處理器長(zhǎng)指令的可用時(shí)隙,因此很少有機(jī)會(huì)同時(shí)執(zhí)行其他功能。

我們對(duì)于 FPGA 的估算時(shí)鐘頻率相當(dāng)保守(以 150 MHz 對(duì) 250 MHz),對(duì)于運(yùn)動(dòng)估算的搜索區(qū)也是如此(搜索區(qū)越大,需要計(jì)算的 MAE 的數(shù)量就越多)。例如,30×30 的搜索區(qū)需要 609 MMAE/s 的性能(遠(yuǎn)遠(yuǎn)超過 VLIW DSP-CPU 的能力),然而卻僅占用 1800A 器件上 Slice 的 12%。

最后,我們?cè)趯?shí)現(xiàn) MAE 時(shí)根本未使用 DSP48 MAC 單元:據(jù)我們估計(jì),如果用四個(gè) DSP48 單元取代由 100 個(gè) Slice 組成的加法器樹,則一個(gè) 12 位輸入數(shù)據(jù) MAE 的 4×4 塊會(huì)占用 400 個(gè) Slice(782 個(gè)觸發(fā)器和 400 個(gè) LUT)和四個(gè) DSP48。

因此,Spartan-3A DSP 1800A 器件非常適合需要極高處理性能、靈活性和可縮放性的視覺應(yīng)用,如未來型汽車駕駛員輔助系統(tǒng)中的視覺應(yīng)用。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

隨著在線會(huì)議、直播和游戲語音交流的普及,高質(zhì)量的音頻輸入設(shè)備變得越來越重要。為此,邊緣AI和智能音頻專家XMOS攜手其全球首家增值分銷商飛騰云科技,利用其集邊緣AI、DSP、MCU和靈活I(lǐng)/O于一顆芯片的xcore處理器...

關(guān)鍵字: AI DSP MCU

在電子系統(tǒng)中,電源如同人體的心臟,為各個(gè)元器件提供持續(xù)穩(wěn)定的能量。而電源系統(tǒng)電流的合理分配,更是決定了整個(gè)系統(tǒng)能否穩(wěn)定、高效運(yùn)行的關(guān)鍵因素。不合理的電流分配,可能導(dǎo)致某些元器件供電不足,無法正常工作;也可能使部分器件電流...

關(guān)鍵字: 電源系統(tǒng) 器件 電流

多DSP集群的實(shí)時(shí)信號(hào)處理系統(tǒng),通信拓?fù)涞膬?yōu)化直接決定任務(wù)調(diào)度效率與系統(tǒng)吞吐量。RapidIO與SRIO作為嵌入式領(lǐng)域的主流互連協(xié)議,其帶寬利用率差異與QoS配置策略對(duì)集群性能的影響尤為顯著。以無線基站、雷達(dá)陣列等典型應(yīng)...

關(guān)鍵字: DSP 通信拓?fù)鋬?yōu)化

隨著5G網(wǎng)絡(luò)普及與物聯(lián)網(wǎng)設(shè)備爆發(fā)式增長(zhǎng),邊緣計(jì)算正從概念驗(yàn)證走向規(guī)?;渴?。據(jù)IDC預(yù)測(cè),2025年全球邊緣數(shù)據(jù)量將占總體數(shù)據(jù)量的50%,這對(duì)邊緣節(jié)點(diǎn)的實(shí)時(shí)處理能力提出嚴(yán)苛要求。在此背景下,AI加速器的DSP化趨勢(shì)與可重...

關(guān)鍵字: AI加速器 DSP

在工業(yè)控制領(lǐng)域,數(shù)字信號(hào)處理器(DSP)的性能直接決定了系統(tǒng)的實(shí)時(shí)控制能力和可靠性。德州儀器(TI)的C2000系列芯片憑借其卓越的采樣、控制和功率管理能力,長(zhǎng)期以來在全球工業(yè)控制市場(chǎng)占據(jù)絕對(duì)領(lǐng)導(dǎo)地位,廣泛應(yīng)用于能源、電...

關(guān)鍵字: TI C2000 DSP 格見半導(dǎo)體 芯來 RISC-V 工控

2025年7月16日 – 專注于引入新品的全球電子元器件和工業(yè)自動(dòng)化產(chǎn)品授權(quán)代理商貿(mào)澤電子 (Mouser Electronics) 持續(xù)供貨Texas Instruments (TI) 的新產(chǎn)品和解決方案。作為一家授權(quán)...

關(guān)鍵字: 線性穩(wěn)壓器 柵極驅(qū)動(dòng)器 DSP

在當(dāng)今數(shù)字化浪潮的推動(dòng)下,數(shù)據(jù)流量呈爆炸式增長(zhǎng),數(shù)據(jù)中心、5G通信網(wǎng)絡(luò)以及云計(jì)算等領(lǐng)域?qū)Ω咚俟馔ㄐ诺男枨笥l(fā)迫切。800G光模塊作為高速光通信的關(guān)鍵組件,其性能直接影響著整個(gè)通信系統(tǒng)的傳輸效率和可靠性。數(shù)字信號(hào)處理(DS...

關(guān)鍵字: 800G DSP PAM4均衡算法

以氫燃料電池空壓機(jī)為研究對(duì)象 ,開發(fā)超高速永磁同步電機(jī)控制器 ,采用傳統(tǒng)的IGBT主功率器件 ,且為兩電平主回 路結(jié)構(gòu)形式 ,通過改進(jìn)的V/F控制算法 ,完成了控制器的設(shè)計(jì)。搭建了試驗(yàn)平臺(tái)進(jìn)行測(cè)試 ,結(jié)果表明 ,控制器能...

關(guān)鍵字: 超高速永磁同步電機(jī) V/F控制 DSP

醫(yī)療設(shè)備智能化進(jìn)程,數(shù)字信號(hào)處理器(DSP)作為核心計(jì)算單元,承擔(dān)著實(shí)時(shí)處理生物電信號(hào)、醫(yī)學(xué)影像等敏感數(shù)據(jù)的重任。然而,隨著醫(yī)療設(shè)備與網(wǎng)絡(luò)互聯(lián)的深化,數(shù)據(jù)泄露風(fēng)險(xiǎn)顯著增加。美國《健康保險(xiǎn)流通與責(zé)任法案》(HIPAA)明確...

關(guān)鍵字: 醫(yī)療設(shè)備 DSP

數(shù)字信號(hào)處理器(DSP)作為實(shí)時(shí)信號(hào)處理的核心器件,其架構(gòu)設(shè)計(jì)直接決定了運(yùn)算效率與功耗表現(xiàn)。自20世紀(jì)70年代DSP理論誕生以來,其硬件架構(gòu)經(jīng)歷了從馮·諾依曼結(jié)構(gòu)到哈佛結(jié)構(gòu)的演進(jìn),這一過程體現(xiàn)了對(duì)實(shí)時(shí)性、并行性與存儲(chǔ)帶寬...

關(guān)鍵字: DSP 馮·諾依曼
關(guān)閉