女人被狂躁到高潮视频免费无遮挡,内射人妻骚骚骚,免费人成小说在线观看网站,九九影院午夜理论片少妇,免费av永久免费网址

當前位置:首頁 > EDA > 電子設計自動化
[導讀]摘要 針對FFT算法基于FPGA實現(xiàn)可配置的IP核。采用基于流水線結構和快速并行算法實現(xiàn)了蝶形運算和4k點FFT的輸入點數(shù)、數(shù)據(jù)位寬、分解基自由配置。使用Verilog語言編寫,利用ModelSim仿真,由ISE綜合并下載,在Xilinx

摘要 針對FFT算法基于FPGA實現(xiàn)可配置的IP核。采用基于流水線結構和快速并行算法實現(xiàn)了蝶形運算和4k點FFT的輸入點數(shù)、數(shù)據(jù)位寬、分解基自由配置。使用Verilog語言編寫,利用ModelSim仿真,由ISE綜合并下載,在Xilinx公司的Virtex-5 xc5vfx70t器件上以200 MHz的時鐘實現(xiàn)驗證,運算結果與其他設計的運算效率對比有一定優(yōu)勢。

在現(xiàn)代聲納、雷達、通信、圖像處理等領域中,數(shù)字信號處理系統(tǒng)經常要進行高速、高精度的FFF運算?,F(xiàn)場可編程邏輯陣列(FPGA)是一種可定制集成電路,具有面向數(shù)字信號處理算法的物理結構。用FPGA實現(xiàn)FFT處理器具有硬件系統(tǒng)簡單、功耗低的優(yōu)點,同時具有開發(fā)時間較短、成本較低的優(yōu)勢?;贔PGA實現(xiàn)的數(shù)字信號處理系統(tǒng)具有較高的實時性和嵌入性,并能方便地實現(xiàn)系統(tǒng)集成與功能擴展?;贔PGA的硬件實現(xiàn)FFT通常有兩種方法:(1)并行方法,其采用多個蝶形處理器并行運算,能對較高的數(shù)據(jù)采樣率進行運算,但其硬件規(guī)模較大,當在FPGA上要實現(xiàn)較大點數(shù)的FFT時較為困難。(2)串行方法,采用一個蝶形處理器完成運算,使用的邏輯資源較少,但運算速度較慢。本文在串行方法的基礎上實現(xiàn)了一種在FPGA上實現(xiàn)的可配置FFT IP核,具有輸入點數(shù)可配置(實現(xiàn)0~4 096點自由配置)、數(shù)據(jù)位寬可配置、分解基可配置的特性。

1 原理分析

自從基2快速算法出現(xiàn)以來,人們仍在不斷尋求更快的算法。基4 FFT算法比最初的基2 FFT算法更快,但從理論上講,用較大的基數(shù)還可進一步減少運算次數(shù),但要以程序(或硬件)變得更復雜為代價。提高FFF處理速度的4個主要技術途徑是采用流水線結構、并行運算、增加蝶形處理單元數(shù)目和高基數(shù)結構。

1.1 基2算法基本原理

點數(shù)N是2的整數(shù)次冪,將x(n)先按n的奇偶分成兩組

1.2 基4算法基本原理

與基2算法類似,對于N點有限長序列x(n)的DFT按照時域分解展開有

2 可配置FFT IP核硬件結構

現(xiàn)有的FFT IP核在硬件實現(xiàn)時不具備并行度可配置能力,只提供全循環(huán)、全流水、循環(huán)展開與流水結合等形式下的某種特定實現(xiàn),可重用性較差,難以適應不同的計算吞吐量和對計算資源和計算時間的需求。可配置FFT IP核技術實現(xiàn)FFT算法流水、循環(huán)等并行化參數(shù)的可配置問題,兼顧FFT轉換點數(shù)、輸入輸出數(shù)據(jù)位寬、蝶形運算基數(shù)、輸入輸出FIFO深度的可配置,滿足不同應用條件下IP復用的需求,適應各種環(huán)境和數(shù)據(jù)吞吐量的FFT運算??膳渲肍FTIP核功能組成如圖1所示。

如圖1所示,該IP主要包括RAM、ROM、地址產生模塊、移位模塊、選擇數(shù)據(jù)排序模塊、可配置蝶形運算單元、精度調整模塊和輸出數(shù)據(jù)排序模塊,Din_R和Din_I是FFT輸入數(shù)據(jù)的實部和虛部,Dout_R和Dout_I是FFT變換結果的實部和虛部。RAM1和RAM2存儲了FFT迭代過程中的輸入數(shù)據(jù),RAM3和RAM4存儲了FFT迭代過程中的計算結果,RAM1和RAM2、RAM3和RAM4均為乒乓結構。地址產生模塊主要產生向RAM寫入數(shù)據(jù)和從RAM讀出數(shù)據(jù)的地址。ROM中存儲了FFT需要的旋轉因子。

2.1 IP核整體方案

設計可配置FFT處理,其整體結構如圖2所示,設計采用基2蝶形和基4蝶形運算兩種配置方式,供用戶選擇。輸入數(shù)據(jù)實部和虛部分開存儲,需4個RAM,為實現(xiàn)對連續(xù)流輸入可連續(xù)流輸出,其模塊構成如圖2所示。

如圖2所示,外部輸入數(shù)據(jù)的實數(shù)部分Din_R、虛數(shù)部分Din_I,以及輸入數(shù)據(jù)的地址信號ADR,首先進入RAM_ADDR單元,選擇合適的時鐘周期將不同點數(shù)的原始數(shù)據(jù)送入RAM單元,當輸入數(shù)據(jù)的實數(shù)和虛數(shù)以及其地址準備好的時候,RDY輸出1。BIT_SFT單元完成輸入數(shù)據(jù)地址的移位變換,實現(xiàn)奇偶分離。當數(shù)據(jù)地址準備好時,RDY輸出1,當RAM_ADDR或BIT_SFT這兩個單元中的一個單元準備好時,便可觸發(fā)RAM單元,將外部數(shù)據(jù)寫入到RAM的指定地址。RAM中的數(shù)據(jù)符合可配置點數(shù)要求后,進入NUM_IN單元,其中輸出的數(shù)據(jù)DOR/DOI就是符合基2蝶形或基4蝶形運算的數(shù)據(jù)順序。這些原始數(shù)據(jù)進入蝶形運算單元BUTTERFLY,蝶形單元通過U_SELECT單元選擇蝶形運算的分解基,實現(xiàn)基2蝶形運算、基4蝶形運算的可配置功能。其中R4_FFT是基4蝶形運算單元,B2_FFT是基2蝶形運算單元,蝶形運算過程中所需的旋轉因子存儲在ROM_RAT單元中,根據(jù)選擇不同分解基的蝶形運算,BUTIERFLY單元產生相應的地址,選擇其計算過程中的旋轉因子。當?shù)芜\算完成后,結果數(shù)據(jù)進入U_CNORM單元,進行順序調整和精度處理;其中PR信號是用戶指定的精度信號,PR[1:0]可提供3種精度,OVF信號是數(shù)據(jù)溢出信號,若置1表明FFT結果數(shù)據(jù)超出了表示范圍,則要按照截位處理以保證數(shù)據(jù)準確。當數(shù)據(jù)輸入完成后,結果數(shù)據(jù)進入NUM_OUT單元,由于DIT算法輸出結果以倒序形式輸出,所有需要NUM_OUT進行地址調整,F(xiàn)FT變換結束后的結果實數(shù)部分Dout_R,虛數(shù)部分是Dout_I,地址信號是R_ADDR,以正確的順序和形式輸出。

2.2 可配置蝶形單元模塊

在FFT IP核的蝶形運算單元設計中,蝶形單元的運算過程:第一個時鐘周期是將下結點與旋轉因子復乘的實數(shù)乘法進行計算;第二個時鐘周期是將復乘中的實數(shù)進行加減運算;在第三個時鐘周期是計算復乘結果與上結點的加減運算,即將蝶形運算單元的結果輸出??膳渲玫芜\算通過在基2和基4兩種分解基之間切換來實現(xiàn),其模塊圖如圖3所示。

如圖3所示,數(shù)據(jù)輸入時能信號EN信號置1,則整個蝶形運算單元的數(shù)據(jù)輸入模塊NUM_IN、旋轉因子模塊ROM_RAT、分解基選擇模塊U_SELECT進入使能狀態(tài);START信號置1,則分解基選擇單元U_SELECT模塊開始進入狀態(tài)機。根據(jù)用戶設置,如果選擇基2算法蝶形運算單元,則將輸入數(shù)據(jù)的實部和虛部送入R2_FFT模塊;如果選擇基4算法蝶形運算單元,則將輸入數(shù)據(jù)的實部和虛部送入R4_FFT模塊;如果選擇混合基,則需要在狀態(tài)機中加入判斷條件,準確控制分支。當?shù)芜\算完成時,F(xiàn)FT運算結果數(shù)據(jù)的實數(shù)部分Dout_R[nb+2:0],虛數(shù)部分Dout_I[nb+2:0]比輸入數(shù)據(jù)的位數(shù)[nb:0]擴展了3位,用于精度調整模塊進行精度控制。

蝶形運算的旋轉因子存儲在ROM_RAT中,其中存儲了基4運算和基2運算的旋轉因子,實部和虛部分開存儲,通過外部信號EN對其使能,為控制ROM存儲空間的占用,不同分解基的旋轉因子可公用,通過地址信號ADR選取控制。

3 仿真、綜合結果分析與驗證

將設計的IP核進行基于ModelSim的仿真,設置時鐘頻率為200 MHz,數(shù)據(jù)位寬為36位,在基2和基4兩種分解基下,分析1 024點和4 096點的運算效率,其仿真圖像如下所示。

圖4是1 024,點的基2算法仿真結果,在這種算法下完成數(shù)據(jù)錄入的時間點為113.1μs,完成結果輸出的時間點為123.4μs,運算時間為10.3μs。圖5是1 024點的基4算法仿真結果,在該種算法下完成數(shù)據(jù)錄入的時間點51.3μs,完成結果輸出的時間點是61.6μs,運算時間為8.3 μs。

圖6是4 096點的基2算法仿真結果,在這種算法下完成數(shù)據(jù)錄入的時間點533.1μs,完成結果輸出的時間點是574.1μs,運算時間為40 μs。圖7是4096點的基4算法仿真結果,在該種算法下完成數(shù)據(jù)錄入的時間點為245.7 μs,完成結果輸出的時間點是286.9μs,運算時間為41.2μs。

板級驗證選用Xilinx公司的Virtex-5 xc5vfx70t器件進行綜合、布局布線和時序分析。將得到的數(shù)據(jù)與其他設計實現(xiàn)進行比較,其消耗的資源,以及在200 MHz時鐘情況下不同點數(shù)的FFT處理器進行一次處理需要的時間,與文獻換算后得到的數(shù)值對比如表1所示。

4 結束語

本文設計的可配置FFT IP核具有靈活性強、容易擴展和設計可復用的特點,實現(xiàn)分解基可配置、位寬可配置、輸入輸出點數(shù)可配置。從驗證結果可以看出,本文數(shù)據(jù)的可配置IP核具有結構簡單及占用硬件資源適當?shù)奶攸c,在FPGA中以實現(xiàn)高速數(shù)字信號處理,在處理速度和靈活性方面更有優(yōu)勢。隨著處理點數(shù)的增加,其優(yōu)越性將更加明顯。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

在數(shù)字化浪潮席卷全球的今天,F(xiàn)PGA技術正成為驅動創(chuàng)新的核心引擎。2025年8月21日,深圳將迎來一場聚焦FPGA技術與產業(yè)應用的盛會——2025安路科技FPGA技術沙龍。本次沙龍以“定制未來 共建生態(tài)”為主題,匯聚行業(yè)...

關鍵字: FPGA 核心板 開發(fā)板

在現(xiàn)代電子系統(tǒng)中,現(xiàn)場可編程門陣列(FPGA)憑借其開發(fā)時間短、成本效益高以及靈活的現(xiàn)場重配置與升級等諸多優(yōu)點,被廣泛應用于各種產品領域。從通信設備到工業(yè)控制,從汽車電子到航空航天,F(xiàn)PGA 的身影無處不在。為了充分發(fā)揮...

關鍵字: 可編程門陣列 FPGA 數(shù)字電源

2025年8月4日 – 提供超豐富半導體和電子元器件?的業(yè)界知名新品引入 (NPI) 代理商貿澤電子 (Mouser Electronics) 即日起開售Altera?的Agilex? 3 FPGA C系列開發(fā)套件。此開...

關鍵字: FPGA 邊緣計算 嵌入式應用

內窺鏡泛指經自然腔道或人工孔道進入體內,并對體內器官或結構進行直接觀察和對疾病進行診斷的醫(yī)療設備,一般由光學鏡頭、冷光源、光導纖維、圖像傳感器以及機械裝置等構成。文章介紹了一款基于兩片圖像傳感器和FPGA組成的微型3D內...

關鍵字: 微創(chuàng) 3D內窺鏡 OV6946 FPGA

運用單片機和FPGA芯片作為主控制器件 , 單片機接收從PC機上傳過來的顯示內容和顯示控制命令 , 通過命令解釋和數(shù)據(jù)轉換 , 生成LED顯示屏所需要的數(shù)據(jù)信號和同步的控制信號— 數(shù)據(jù)、時鐘、行同步和面同步 。FPGA芯...

關鍵字: 單片機 FPGA LED顯示屏

在異構計算系統(tǒng)中,ARM與FPGA的協(xié)同工作已成為高性能計算的關鍵架構。本文基于FSPI(Fast Serial Peripheral Interface)四線模式,在150MHz時鐘頻率下實現(xiàn)10.5MB/s的可靠數(shù)據(jù)...

關鍵字: ARM FPGA FSPI

在全球FPGA市場被Xilinx(AMD)與Intel壟斷的格局下,國產FPGA廠商高云半導體通過構建自主IP核生態(tài)與智能時序約束引擎,走出差異化高端化路徑。本文深入解析高云半導體FPGA工具鏈的兩大核心技術——全棧IP...

關鍵字: FPGA 高云半導體
關閉