發(fā)布日期:2022-07-15 點(diǎn)擊率:48
DRC公司首席執(zhí)行官Larry Laurich表示,該技術(shù)初期主要瞄準(zhǔn)石油和天然氣、金融和生命科學(xué)應(yīng)用,在這些領(lǐng)域,計(jì)算密集型算法可在FPGA硬件中并行執(zhí)行。首批開發(fā)系統(tǒng)會(huì)在今年第三季度面市,售價(jià)將為約2.5萬美元。
在過去20年來,FPGA吸引了產(chǎn)業(yè)界和學(xué)術(shù)界的廣泛興趣,一直被用作可配置計(jì)算平臺(tái)。Laurich透露,早在上世紀(jì)八十年代末,DRC創(chuàng)辦人Steve Casselman就對(duì)此產(chǎn)生濃厚興趣,有意開發(fā)基于FPGA的計(jì)算平臺(tái)。Casselman在1987年創(chuàng)辦Virtual Computer公司,但該公司在2000年的低迷時(shí)期倒閉。
而隨著規(guī)模更大、速度更快的FPGA的問世,Casselman成為率先認(rèn)識(shí)到HyperTransport總線有可能打破另一個(gè)瓶頸—相對(duì)低速的PCI總線—的人士之一。Casselman在2004年找到新的投資人,創(chuàng)辦了DRC公司,公司名“DRC”即取“自動(dòng)態(tài)可重配置協(xié)處理器”(Dynamic Reconfigurable coprocessor)之意。Casselman現(xiàn)擔(dān)任DRC公司的首席科學(xué)家兼首席技術(shù)官。
Laurich介紹,總部設(shè)在英國的Celoxica公司是與DRC簽約的首個(gè)軟件開發(fā)伙伴。他希望今后有更多的公司參與共同開發(fā)。
Celoxica(美國)公司總經(jīng)理Jeff Jussel表示,Celoxica的工具提供了重新編譯C代碼以用于DRC協(xié)處理器模塊的能力。他說,FPGA能并行運(yùn)行許多算法,與傳統(tǒng)服務(wù)器處理器相比,其功耗要低很多。
Jussel表示:“舉例來說,為了運(yùn)行諸如Black Scholes這樣的金融分析算法,銀行會(huì)購買大量CPU和機(jī)架,其占用的空間越來越大,且需要大量能耗進(jìn)行冷卻。作為改進(jìn)措施,銀行可以采用FPGA協(xié)處理器來分擔(dān)其中一些關(guān)鍵算法,這樣功耗要低很多的,同時(shí)性能表現(xiàn)卻能提高100倍。”
Jussel指出,相比過去一些用戶通過開發(fā)ASIC來實(shí)現(xiàn)算法加速,如今這種基于FPGA的方法要便宜很多,且為熟悉C語言編程工具的程序設(shè)計(jì)人員敞開了大門。
圖2:DRC的協(xié)處理器可實(shí)現(xiàn)計(jì)算算法加速。
Laurich介紹,DRC的協(xié)處理器模塊與AMD的Opteron處理器管腳兼容,能插到IBM、惠普等大公司及其他十多家較小公司采用Opteron處理器的主板上。HyperTransport總線向Opteron處理器傳輸數(shù)據(jù)的延遲時(shí)間約為60ns,這項(xiàng)指標(biāo)僅是PCI總線的大約1/10。此外,DRC的協(xié)處理器模塊可連接主板上的大量DRAM存儲(chǔ)器。
“與那些DIMM插槽通信的DDR控制器是我們知識(shí)產(chǎn)權(quán)(IP)的一部分。我們的IP使算法能以極低的延遲訪問主板存儲(chǔ)器。”Laurich表示。一旦容量更大的DDR-2普及,DRC的協(xié)處理器就有能力訪問最高可達(dá)32GB的可用內(nèi)存。
DRC的協(xié)處理器模塊由增加了幾條指令的Linux BIOS控制。該協(xié)處理器的標(biāo)準(zhǔn)配置是200MHz@8位,且可通過調(diào)整一個(gè)可協(xié)商(negotiated)接口來實(shí)現(xiàn)不同位寬度和位速率。
用戶可期待該模塊硬件能實(shí)現(xiàn)賽靈思承諾的性價(jià)比曲線。“我們已著手設(shè)計(jì)一款16位版本,預(yù)計(jì)在今年年中推出。眼下,該模塊的最高速度為400MHz,但今后會(huì)變得更快,”Laurich表示。現(xiàn)在,一個(gè)基于LX-60 Virtex-4 FPGA的模塊,售價(jià)4,500美元,但他估計(jì),明年將降為3,000美元。相關(guān)的開發(fā)系統(tǒng)包括一個(gè)帶DRC協(xié)處理器和Opteron處理器的工作站、Celoxica的工具,以及來自DRC和賽靈思的軟件。
Laurich稱,DRC估計(jì)其技術(shù)能將整數(shù)應(yīng)用程序加速約100倍、單精度浮點(diǎn)應(yīng)用程序加速10倍,而雙精度浮點(diǎn)應(yīng)用程序運(yùn)行速度可提高5倍。
作者:來大偉