日前,龍芯發(fā)布了龍芯3C5000服務(wù)器處理器,并聯(lián)合生態(tài)伙伴共同發(fā)布新一代國(guó)產(chǎn)服務(wù)器基礎(chǔ)軟硬件平臺(tái)。這次發(fā)布會(huì)有兩個(gè)亮點(diǎn),一是3C5000處理器,二是3A6000仿真成績(jī)。
龍芯3C5000彌補(bǔ)服務(wù)器不足
過去,龍芯一直致力于提升單核性能,沒有盲目去堆核心數(shù)量。這種穩(wěn)扎穩(wěn)打的做法使龍芯在過去10年中IPC提升了3-4倍,在桌面CPU上成效立竿見影。
但在服務(wù)CPU上,由于國(guó)內(nèi)ARM CPU往往采用“堆核戰(zhàn)術(shù)”,也就是用64核、128核堆出一款服務(wù)器CPU,這導(dǎo)致龍芯的四核CPU雖然在單核性能上更好,但在多核性能上不如ARM CPU。這使龍芯在服務(wù)器CPU市場(chǎng)競(jìng)爭(zhēng)中處于不利地位。
3C5000是龍芯第一款16核CPU,采用完全自主的LoongArch指令架構(gòu),16核心單芯片unixbench分值9500以上,雙精度計(jì)算能力達(dá)560GFlops,16核處理器峰值性能與典型ARM 64核處理器的峰值性能相當(dāng),并支持最高16路互連,搭配新一代龍芯7A2000橋片,PCIe吞吐帶寬比上一代提升400%以上。就SPEC2006測(cè)試來看,單核定點(diǎn)浮點(diǎn)Base分均大于10/G,單芯片分值超過200。可滿足通用計(jì)算、大型數(shù)據(jù)中心、云計(jì)算中心的計(jì)算需求。該處理器通過芯片級(jí)安全機(jī)制可為等保2.0、可信計(jì)算、國(guó)密算法替代、網(wǎng)絡(luò)安全漏洞防護(hù)等提供CPU級(jí)內(nèi)生支持。
3C5000最大特點(diǎn)是單核性能強(qiáng),特別是unixbench這種看重單核核內(nèi)存性能,多核加速比很低的測(cè)試,龍芯只用16核就能跑到9500,某ARM CPU即便有64核也跑不到這個(gè)成績(jī)。從公開的數(shù)據(jù)來看,3C5000的性能在信創(chuàng)市場(chǎng)足夠用了,而且16核的核心是使其部署比較靈活。另外,龍芯還會(huì)有3D5000,也就是把兩個(gè)3C5000封裝到一起的膠水32核芯片,主要針對(duì)一些對(duì)性能有更高要求的場(chǎng)景。
龍芯3A6000 IPC追平Zen3
相對(duì)于3C5000,鐵流認(rèn)為3A6000更加值得關(guān)注。相對(duì)于一些技術(shù)引進(jìn)CPU在引進(jìn)海外技術(shù)后CPU IPC增長(zhǎng)緩慢,性能提高基本依靠購(gòu)買更好的EDA工具和買臺(tái)積電更好的工藝。龍芯一直致力于提升CPU微結(jié)構(gòu)設(shè)計(jì)水平來提升CPU的性能。CPU的IPC在過去10年中提升了3-4倍,這使龍芯可以在制造工藝上落后技術(shù)引進(jìn)的某ARM CPU一代的情況下,依然可以依靠CPU微結(jié)構(gòu)設(shè)計(jì)水平做到性能持平或略優(yōu)于技術(shù)引進(jìn)的某ARM CPU。當(dāng)龍芯與引進(jìn)的某ARM CPU采用相同工藝時(shí),龍芯可以憑借其IPC上的優(yōu)勢(shì)在性能上領(lǐng)先某ARM CPU。
3A6000和3A5000采用相同制造工藝,龍芯依靠其設(shè)計(jì)能力把CPU性能大幅提升。從仿真成績(jī)看,定點(diǎn)相對(duì)于3A5000提升30%,浮點(diǎn)相對(duì)于3A5000提升60%,這種提升是非常駭人的——如果仿真成績(jī)與最終成績(jī)相當(dāng),那么,3A6000 SPEC06單核定點(diǎn)Base分大于13/G,浮點(diǎn)Base分大于16/G,如果3A5000為2.5G至2.8G,那么,3A6000的 SPEC06單核定點(diǎn)Base分大于35,浮點(diǎn)將大于45,這個(gè)性能對(duì)于信創(chuàng)和日常使用而言都已經(jīng)明顯過剩了。
(gcc,1165G7測(cè)試過程的頻率大約是 4.2GHz,換算IPC 13.3/G。下圖5600G的編譯參數(shù)和1165G7基本是一樣的。感謝guee幫忙測(cè)試)
(gcc,int_base 48.6。測(cè)試過程中頻率基本保持在 4GHz,也就是說 IPC 為12/G,由于測(cè)試還有調(diào)優(yōu)空間,及5600G的緩存要比5600X少一半,可以認(rèn)為調(diào)優(yōu)后的Zen3可以達(dá)到13/G)
作為參照,11代酷睿的IPC大約是定點(diǎn)13+/G,12代酷睿IPC大約是定點(diǎn)15+/G,Zen3的IPC大約是定點(diǎn)13/G,龍芯LA664能夠達(dá)到定點(diǎn)13/G,浮點(diǎn)16/G,這已經(jīng)追平或接近Zen3和11代酷睿。
當(dāng)下,在同頻性能上追平11代酷睿和Zen3已經(jīng)很不錯(cuò)了,唯一的問題就在于主頻了。當(dāng)龍芯把7000系列把工藝換成5/7nm就可以把主頻做到3G以上,可以實(shí)現(xiàn) SPEC06單核定點(diǎn)Base分大于40,浮點(diǎn)Base分大于50,這種性能已經(jīng)達(dá)到英特爾、AMD市場(chǎng)主流水平,即便龍芯平臺(tái)移植了3A大型游戲,龍芯7000系列CPU也足以應(yīng)對(duì)。
結(jié)語
經(jīng)過20多年的磨礪,龍芯終于把LA664提升到11代酷睿和Zen3的水平。LA664不僅超越了現(xiàn)有技術(shù)引進(jìn)的ARM CPU,還超越了某些ARM CPU廠商PPT上的下一代CPU核。即便是當(dāng)下國(guó)內(nèi)首屈一指的海光,如果不把CPU IPC提升30%以上,面對(duì)LA664也要敗下陣來。
回溯歷史,在10年前,龍芯的IPC是不如技術(shù)引進(jìn)CPU的,某技術(shù)引進(jìn)ARM CPU的IPC是當(dāng)時(shí)龍芯的2倍左右。然后,技術(shù)引進(jìn)是存在代價(jià)和陷阱的,往往是知其然不知其所以然,進(jìn)而導(dǎo)致發(fā)展后勁不足。
相比之下,自主研發(fā)雖然在起步階段慢一些,苦一些,累一些,無法像技術(shù)引進(jìn)CPU那要快速拿出產(chǎn)品,但自主研發(fā)發(fā)展后勁更足,這一點(diǎn)從龍芯過去10年的發(fā)展就能看出來。
龍芯的性能已經(jīng)不再是應(yīng)用的障礙,唯一的障礙是軟件生態(tài)。期待龍芯能以應(yīng)用為階梯,在合作伙伴的幫助下循序漸進(jìn)構(gòu)建可以與Wintel、AA體系相媲美的自主技術(shù)體系。
「 支持烏有之鄉(xiāng)!」
您的打賞將用于網(wǎng)站日常運(yùn)行與維護(hù)。
幫助我們辦好網(wǎng)站,宣傳紅色文化!
歡迎掃描下方二維碼,訂閱烏有之鄉(xiāng)網(wǎng)刊微信公眾號(hào)
