軟件加解密(在50m的頻率下使用軟件來(lái)進(jìn)行加解密)與硬件加解密時(shí)間做了對(duì)比:如表3所示。該方案充分有效的利用了spartan3e的資源,尤其為可編程邏輯和ram的利用。其中aes加解密中的乘法運(yùn)算均由lut查找表來(lái)實(shí)現(xiàn),用空間換取時(shí)間,獲得了很高的算法速度。在aes算法測(cè)試時(shí)我們發(fā)現(xiàn)80%的aes加解密時(shí)間都用于密鑰擴(kuò)展算法中,如果能再進(jìn)一步把算法優(yōu)化,比如做成流水線的算法模式的話,加解密時(shí)間又能減少近20%,即由現(xiàn)在的6.74us減少到略大于5.39us,效率又可以增加很多。
fpga是通過(guò)邏輯組合電路來(lái)實(shí)現(xiàn)各種功能的器件。由于fpga內(nèi)部集成了大量的邏輯資源和可配置的i/o引腳,加上獨(dú)特的并行處理架構(gòu),可以輕松實(shí)現(xiàn)同時(shí)對(duì)多個(gè)外部設(shè)備的配置和管理,以及內(nèi)外各種接口數(shù)據(jù)的傳輸。現(xiàn)在開(kāi)發(fā)廠商又在fpga內(nèi)部加入了大量的dsp和blockram資源,非常適合圖像處理、數(shù)字信號(hào)處理等運(yùn)算密集的應(yīng)用,因此在這些領(lǐng)域取得了廣泛的應(yīng)用。但是由于fpga程序編寫(xiě)的靈活性和功能的多樣性,使得它在一個(gè)復(fù)雜工程中對(duì)各個(gè)程序的使用調(diào)度、統(tǒng)籌管理上有很大的局限性,這樣就引入操作系統(tǒng)進(jìn)行統(tǒng)一的管理。linux系統(tǒng)則因?yàn)槠淞己玫目刹脺p、可配置等特點(diǎn)在嵌入式領(lǐng)域應(yīng)用廣泛。linux操作系統(tǒng)提供了許多系統(tǒng)級(jí)的應(yīng)用,例如網(wǎng)絡(luò)協(xié)議的實(shí)現(xiàn)、進(jìn)程調(diào)度、內(nèi)存管理等,同時(shí)linux是一個(gè)成熟的開(kāi)源操作系統(tǒng),有豐富的應(yīng)用資源,利用這些資源和強(qiáng)大的系統(tǒng)功能,用戶可以快速地開(kāi)發(fā)基于嵌入式環(huán)境復(fù)雜系統(tǒng)。因此,結(jié)合fpga和linux雙方優(yōu)勢(shì),可以很好地滿足嵌入式系統(tǒng)設(shè)計(jì)需求,量體裁衣,去除冗余。本文給出了一種基于xilinxfpga的嵌入式linux操作系統(tǒng)解決方案。
本設(shè)計(jì)是基于xilinxxc4vfx40系列fpga,它內(nèi)部集成了兩個(gè)powerpc405處理器,4個(gè)10/100/1000m以太網(wǎng)mac模塊,運(yùn)行頻率300mhz時(shí),具有420d-mips性能,能解決高速網(wǎng)絡(luò)數(shù)據(jù)傳輸問(wèn)題,并且能解決通過(guò)網(wǎng)絡(luò)加載操作系統(tǒng)和交叉編譯等問(wèn)題。它內(nèi)部有448個(gè)可配置i/o口,2592kbblockram,能實(shí)現(xiàn)對(duì)各種外部設(shè)備的并行控制以及較多數(shù)據(jù)的存儲(chǔ)與處理。加載一個(gè)操作系統(tǒng),一般需要幾十兆的內(nèi)存空間,fpga內(nèi)部自帶的ram空間是遠(yuǎn)遠(yuǎn)不夠的,本設(shè)計(jì)在板上擴(kuò)展了兩片micron公司的256mbddr內(nèi)存,作為上電時(shí)操作系統(tǒng)的加載和運(yùn)行空間。現(xiàn)在主流的嵌入式操作系統(tǒng),都需要搭建交叉編譯環(huán)境,把在主機(jī)上編寫(xiě)好的可執(zhí)行文件下載到目標(biāo)板上,這就需要實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)的傳輸。由于xc4vfx40自帶了以太網(wǎng)mac模塊,只需要在外面添加個(gè)phy芯片和帶隔離器的rj45接口就能實(shí)現(xiàn)這個(gè)功能。本設(shè)計(jì)由于對(duì)網(wǎng)絡(luò)數(shù)據(jù)實(shí)時(shí)性要求很高,因此采用marvell公司的千兆以太網(wǎng)phy芯片88e1111-rcj。它能根據(jù)自身配置和主機(jī)設(shè)計(jì),實(shí)現(xiàn)10/100/1000m自適應(yīng)傳輸,并且linux本身對(duì)這個(gè)芯片提供了驅(qū)動(dòng)支持,實(shí)現(xiàn)無(wú)縫鏈接。操作系統(tǒng)加載到ddr中能快速有效的運(yùn)行,但是掉電就會(huì)丟失,因此加入flash芯片,把系統(tǒng)文件存儲(chǔ)到外部flash中。加電時(shí),fpga把操作系統(tǒng)文件從flash讀入到ddr中運(yùn)行。fpga設(shè)計(jì)當(dāng)然會(huì)擴(kuò)展很多接口出來(lái),利用自身并行處理的優(yōu)勢(shì),控制很多設(shè)備,本設(shè)計(jì)也不例外,擴(kuò)展了8個(gè)通用的gpio,2個(gè)ps/2接口,1個(gè)usb接口,1個(gè)ac97聲卡接口,1個(gè)hotlink接口,以及4個(gè)rs422接口,同時(shí)擴(kuò)展了兩個(gè)cpci接口,引出了16位數(shù)據(jù)地址線和ethernet控制線,整個(gè)系統(tǒng)的硬件框圖如圖1所示。
在進(jìn)行電路設(shè)計(jì)時(shí),是以fpga為核心,向外擴(kuò)展各種設(shè)備,因此特別注意了fpga各個(gè)引腳的連接。由于ddr和phy芯片都需要提供+2.5v電壓,因此和ddr、phy芯片連接引腳所在的bank需要提供+2.5v電壓參考,并且不能接以lvttl或lvcmos為電壓參考的引腳。重要快速的時(shí)鐘信號(hào)接到全局時(shí)鐘引腳上。由于fpga需要通過(guò)外部flash啟動(dòng)操作系統(tǒng),需要并行配置,以減少加載時(shí)間,配置電路如圖2所示。在ddr布線時(shí),數(shù)據(jù)和地址線需要走等長(zhǎng)線,數(shù)據(jù)線之間不能相差10mil,地址線要控制在20mil以內(nèi),時(shí)鐘也需要走差分等長(zhǎng)線,長(zhǎng)度應(yīng)大于地址線,ddr各個(gè)信號(hào)還需要47Ω的并行端接,改善信號(hào)質(zhì)量。千兆phy輸出mdi信號(hào)也需要在頂層做差分等長(zhǎng),不然在進(jìn)行1000m數(shù)據(jù)傳輸時(shí)很可能不穩(wěn)定。ddr和phy需要完整的電源回路做參考,電源層劃分時(shí)也要特別注意,其他電路做常規(guī)處理就可以了。
首先需要調(diào)用xilinx提供的edk軟件,對(duì)各個(gè)模塊加入必要的ipcore,以便操作系統(tǒng)能正常調(diào)用這些器件的驅(qū)動(dòng)操作他們。本設(shè)計(jì)采用的是edk10.1.2版本,ppc方面選用ppc405內(nèi)核,頻率設(shè)定在300mhz,同時(shí)需要添加中斷輸入引腳,以便響應(yīng)以太網(wǎng)、串口等外部中斷,其他使用默認(rèn)設(shè)置。ddr控制器采用edk提供的multi-port-memorycontroller模塊,需要設(shè)置ddr芯片廠商、大小和數(shù)據(jù)位數(shù)等,特別指出的是,要設(shè)置獨(dú)立的兩條plb總線和ppc連接,作為ppc的指令和數(shù)據(jù)總線。mac單元需要加入xps_ll_temac模塊來(lái)控制,本設(shè)計(jì)需要設(shè)置phy類型為gmii(千兆以太網(wǎng)),同時(shí)要物理地址和收發(fā)fifo大小。flash單元需要加入xps_mch_emc模塊,同時(shí)設(shè)置flash類型和讀寫(xiě)時(shí)間。為了方便調(diào)試,還需要加入串口控制臺(tái)模塊,本設(shè)計(jì)使用的是uartlite模塊,設(shè)置需要的波特率和校驗(yàn)類型。特別注意的是,系統(tǒng)還需要時(shí)鐘管理模塊(dcm),提供各個(gè)模塊需要的不同時(shí)鐘,還要設(shè)置一段fpga內(nèi)部ram區(qū)域,放置ppc的.boot文件。外部這些模塊都通過(guò)plb總線和ppc通信,需要統(tǒng)一編址,一般把ddr內(nèi)存空間地址分配到0x0開(kāi)始,整個(gè)系統(tǒng)的構(gòu)建如圖3所示。
本設(shè)計(jì),除了在edk中搭建了操作系統(tǒng)的各種模塊后,還需要在ise中編寫(xiě)各個(gè)時(shí)序電路程序,因此把edk中編寫(xiě)好的工程作為一個(gè)模塊,加入到ise中,然后統(tǒng)一編譯,這樣生成了我們需要的完整功能的程序。特別指出的是,ppc405數(shù)據(jù)地址采用的是大端模式,接入到ise中時(shí),需要把數(shù)據(jù)顛倒位置,如data[0:31]變?yōu)閐ata[31:0],才能正常讀寫(xiě)。
加載linux操作系統(tǒng)需要利用edk軟件提供的板級(jí)包(bsp)配置內(nèi)核。bsp包含了所選定處理器架構(gòu)的屬性文件以及相關(guān)硬件的驅(qū)動(dòng)源文件。首先要在edkprojectoption中projectperipheralresitory選項(xiàng)下設(shè)置xilinx提供的gen-mhs-devtree/edk_lib庫(kù)路徑,然后在軟件平臺(tái)設(shè)置中選擇dts模式,編譯更新包,生成.dts配置文件。dts文件包含了所有模塊地址分配,中斷以及驅(qū)動(dòng)信息,把他加入到linux內(nèi)核中,然后配置內(nèi)核選項(xiàng)選擇對(duì)應(yīng)的處理器架構(gòu)、所選硬件的驅(qū)動(dòng)模塊以及需要的其他內(nèi)核模塊,之后再對(duì)完成配置的內(nèi)核進(jìn)行編譯,生成linux的內(nèi)核image文件。生成內(nèi)核image文件之后,還需要生成系統(tǒng)運(yùn)行所需要的根文件系統(tǒng)。根文件系統(tǒng)中包含了嵌入式linux系統(tǒng)的所有應(yīng)用程序、庫(kù)以及系統(tǒng)配置等相關(guān)文件。根文件系統(tǒng)中常用的程序和命令可利用開(kāi)源軟件busybox構(gòu)造。構(gòu)造完成之后,在busybox生成的目錄和文件的基礎(chǔ)上再構(gòu)造根文件系統(tǒng)的目錄樹(shù),并添加相關(guān)設(shè)備文件和配置文件以及系統(tǒng)運(yùn)行時(shí)需要的腳本文件,從而形成終的根文件系統(tǒng),ramdisk.image。把他拷貝到內(nèi)核中的../arch/powerpc/boot目錄下,在linux2.6.x根目錄下運(yùn)行makezlmage.initrt,生成終的系統(tǒng)文件。需要指出的是,在編譯linux內(nèi)核時(shí),需要設(shè)置好交叉編譯環(huán)境:首先安裝eldk編譯軟件,然后在編輯自己的帳戶目錄下的.bashrc(例如:/home/ppc/)中加入下面內(nèi)容:
$path=$path:/home/ppc/powerpc/eldk/usr/bin:/home/ppc/powerpc/eldk/binexportcross_compilepath把生成的zlmage.initrd文件通過(guò)edk軟件下的xmd調(diào)試窗口,使用dowzlmage.initrd命令下載到ddr中,然后運(yùn)行run命令,就正常啟動(dòng)linux了。