也許是龍芯名稱中的“龍”字,承載著太多國人的希望,自誕生之初就處于社會輿論的風口浪尖。有人說龍芯是騙經費的項目,也有人說龍芯的科研人員是為理想而奮斗的志士,還有人說龍芯的科研人員“太天真”,是土八路斗美械師,自尋死路。龍芯究竟怎么樣?無數篇橫看成嶺側成峰的報道給龍芯包裹上了層層迷霧。那么今天,就讓我們一起揭開迷霧下的真相,洞察志士的艱辛與心血。
1、龍芯的誕生
回溯歷史,中國也曾經擁有過自己的CPU和全自主的半導體產業。但因在上世紀80年代奉行“造不如買、買不如租”、“市場換技術”等方針路線,不僅沒能拉近和國外的技術差距,反而把原本的家底敗得精光,國內市場完全被外資占領。在中國失去獨立研制高性能計算機的能力之后,美國要求中國把高價進口的高性能計算機放在透明玻璃房中,并提出了非常苛刻的要求——玻璃房門的鑰匙在美國人手里,使用用途需要向美國人匯報,使用前都要經過美國人許可。
龍芯課題組成立之初是著眼于解決國防和信息安全領域無芯可用的困境。課題組成立于2001年,成立的時候可以說用臺詞“七八號人,兩三條槍”來形容再合適不過了。只有一間50-60平米的實驗室,人員也是東拼西湊——有已經年近70,曾在上世紀70年代參與國產芯片研發的老研究院員,聽說計算機所要設計龍芯,就主動帶著幾個學生過來,其中也有剛走出校門的青年學子。
課題組成立時,龍芯團隊總計也就10來個人。到2006年,龍芯團隊逐步發展為將近100人的研發設計團隊。時至今日,龍芯中科公司員工也不過幾百人的規模。
2、龍芯是國家的“親兒子”?
龍芯的“龍”字會給國人一種錯覺,認為龍芯是國家的“親兒子”,是用舉國體制輸送資金和人才打造的國產芯片。但實際上,龍芯成立之初僅僅是中科院計算機所里的一個芯片研發課題組,國家對龍芯的扶持也非常有限。
在人才方面,在課題組成立時候才10來個人,龍芯團隊的骨干人才都是自己培養的,不少設計師都是胡偉武親自帶出來的博士生。在資金方面,自2001年成立以來,從國家863計劃、核高基專項中累計獲得項目經費5億人民幣。龍芯中科公司成立后,獲得北京市政府2億人民幣的股權投資。
與之形成鮮明對比的是華芯通、宏芯和上海一家CPU公司。華芯通成立之初地方政府投資近20億元。宏芯成立后也獲得地方政府和國資輸血。上海某家公司則獲得核高基01專線扶持。即便是以民營企業自居的華為,也獲得了核高基支持,而且還斬獲了海量政府采購,這些采購項目都以億計算,其中僅東莞一個政府采購項目,金額就高達27億元
若以國外巨頭作參照,則差距更大,最近幾年,Intel每年研發經費在100億美元左右,員工達10萬余人。
(胡偉武)
3、龍芯經營現狀
自2010年龍芯市場化運營以后,龍芯選擇了走主動挖掘民用市場、提升造血能力的道路,將過去的向國家要經費轉變為從市場賺收入。2014年,龍芯在純商業行為的收入占總收入的比重從0上升到1/3,國家安全市場的比重占2/3,實現了自主經營、自負盈虧、收支平衡。近幾年,龍芯的收入穩步增長。
4、微結構、主頻和性能
龍芯自2001年以來,共研發GS132、GS232、GS264、GS464、GS464E、GS464V共6個微結構,以龍芯及其有限的人力和財力,實現了微結構的技術迭代,相較于國家非常有限的扶持,龍芯拿出了遠遠超過投入的產出。
據悉,龍芯3A4000主頻為1.8G至2G,SPEC2006定點浮點均為20+。這個成績已經基本追平AMD老一代推土機、挖掘機架構3G主頻的CPU,同主頻性能接近AMD的Zen。就日常黨政辦公來說已經是性能過剩了。
近些年,龍芯專注于微結構的提升,在制造工藝上普遍落后于同時期其他國產CPU,比如2015年前后問世的龍芯3A2000,工藝為40nm,而在此時,國內同行CPU的工藝大多為28nm。2019年問世的龍芯3A4000,制造工藝為28nm,國內同行的工藝普遍為7/16nm。
在制造工藝落后國內同行1至2代的情況下,龍芯能夠把CPU性能做到同一檔次水平,實屬不易。從龍芯3B1500至龍芯3A4000,龍芯在制造工藝處于同一水平的情況下,通過自身設計能力,把CPU的性能翻了6倍,SPEC20006測試每G主頻性能達到10分,在微結構設計水平上是國內數一數二的存在。
這充分體現了龍芯的CPU設計能力,折射出能力建設和培養比引進國外技術更重要,與一些高度依賴臺積電先進工藝的廠商形成鮮明對比。
必須指出的是,龍芯3A4000的制造工藝為28nm,后續升級制造工藝的潛力巨大,在小改CPU核,采用14/16nm工藝升級之后,SPEC2006定點浮點成績有望達到25至27。
5、 龍芯產品。
目前,龍芯有龍芯1、龍芯2、龍芯3三個系列。
龍芯1系列芯片的微結構為GS232(部分型號是GS132),龍芯1A、1B、1C是龍芯根據市場需求研發的低功耗嵌入式芯片。
龍芯2系列芯片的微結構為GS264,龍芯2H被用于工控市場。
龍芯3號系列被用于個人電腦和服務器,目前主要市場是黨政國產化替代,在這方面市場份額龍芯相對于國產X86和ARM有明顯優勢。
6、堅持“從開源中來,到開源中去”
誠然,龍芯走自主路線,但這并不意味著龍芯是“封閉”的。相反,龍芯堅持“從開源中來,到開源中去”,而且在產業鏈上下游擁有大量合作伙伴。
就軟件來說,龍芯就選擇擁抱開源。目前國際上的四大瀏覽器平臺Firefox、Chrome、Edge、safari,其中Firefox由mozilla完全開源、Chrome的開源版本有Chromium、Edge部分開源、safari基于開源webkit而來。龍芯同時支持Firefox瀏覽器和Chromium瀏覽器。
瀏覽器的用戶體驗有產品皮膚功能特點的因素,更多的則在于內部技術通路的打通。JS引擎作為瀏覽器的三大核心組件之一,對產品功能和用戶體驗有著重要影響,瀏覽器團隊經過長時間打磨,完成了JIT技術的研發,累計4萬多行代碼,并協助開源社區人員,完成了MIPS分支在Mozilla和Chromium國際開源社區的代碼提交。
為了支持黨政信息化業務,JS引擎技術是瀏覽器的核心技術之一,目前國內從事該技術的團隊估計不會超過20人。為了提升瀏覽器HTML5、WebRTC等音視頻應用用戶體驗,龍芯完成FFmpeg、libvpx、openH264等基礎視頻編解碼庫的優化,獨立累計向開源社區提交數萬行代碼。為了提升圖形圖像用戶體驗,龍芯完成了skia、jpeg、libyuv、pixman等基礎圖形圖像庫的優化并開源,部分已經提交到國際開源社區,累計1萬多行代碼。
另外,龍芯還在2019年4月正式發布了基于龍芯3B3000 CPU的KVM虛擬機產品解決方案,可以支持全功能的虛擬化云主機系統,支持以Spice協議和QXL虛擬圖形為基礎的云桌面應用,支持Openstack等主流云計算環境。這是中國IT企業首次完成”從CPU到系統”全鏈條虛擬機產品的自主研制,也使得龍芯CPU生態系統具備了支撐完整云計算環境的應用能力。
7、關于自主可控
自主,顧名思義,是自主知識產權,不需要給國外繳納專利費,可以自由選擇發展方向和技術路線。以龍芯為例,龍芯可以自由擴展指令集,比如龍芯擴展了上千條指令,形成了自己的LoongISA,使龍芯微結構的浮點性能大幅提升,以至于都能客串DSP。在龍芯最新的白皮書中,指令集已經變成了LoongISA2.0。
從國外購買指令集授權的話,比如購買ARM授權不僅要支付頗為不菲的授權費,而且授權到期要再購買一次,外商每一次更新指令集還要再購買。每生產一片ARM芯片,都要向ARM支付“ARM稅”。另外,還會受到很多限制,比如不具備發展權,不能擴展指令集,只能按照國外巨頭的劃定路線圖走,跟在身后亦步亦趨。最要命的是,買ARM授權還有政治風險,會遭遇制裁。
自主可控還有一點是CPU核必須是自己寫的。縱觀Intel、AMD、IBM、ARM、蘋果、Risc-V的發展史,CPU核都是迭代演進的。不存在橫空出世,一空氣吃成胖子的情況。蘋果半路插隊,也是拿ARM A8 A9 A15改了3代5款處理器后,才推出了自己的CPU核。伯利克這么牛,Risc-V也是迭代演進。就國內來說,龍芯和申威每一代CPU核的升級進步都有跡可循,是循序漸進,迭代演進的,其中更是不乏血淚教訓。
而現在國內一些ARM CPU,一下子橫空出世,而且不止一次性能與同時期ARM公版CPU核性能相當,或者推出一個CPU核之后,后續升級趨于停滯,IPC在 5年時間里增長僅20%,擠牙膏程度足以讓英特爾自慚形穢。這就很讓人對其的自主性的含金量產生懷疑。
申威之所以被認為是自主,主要是因為從指令集、CPU核等開始自主研發。申威有別于引進的CPU指令集,是完全自主的,知識產權和自主研發能力不受限制。不會被斷供、制裁,或停止收取的風險,可以威關鍵領域提供長遠的、可控的供應鏈和技術支撐。能同時解決“下絆子”、“卡脖子”、“捅刀子”等問題。此外,申威CPU的結構設計、邏輯設計、正確性驗證、物理設計、及測試封狀等由我方獨立完成。申威CPU不存在人為安全隱患,現行木馬、病毒無法攻擊,開展了高等級安全的特色設計。
龍芯被符合自主可控,原因也是類似,初步形成了自己的LoongISA,CPU核迭代演進技術路線清晰。而且IP高度自主,龍芯3號所有CPU中,沒有一款CPU需要到廠家merge第三方IP。尤其是龍芯3A2000和3A3000,除了廠家提供的標準單元庫、單/雙端口RAM以及低速IO單元,每一行代碼(包括CPU核、內存控制器、HT控制器、互連網絡等)以及每一個定制模塊(包括多端口寄存器堆、鎖相環、HT PHY、DDR2/3 PHY等)都自主設計。
8、龍芯3A5000完成測試片流片
日前,網上流傳了一則消息:
8月18日,在龍芯中科成立18周年前夕,芯片研發部定制組赴小湯山,開始了定制組期盼已久的且有著特殊意義的團建活動。
從2018年11月16nm預研、2019年2月3A5000測試片正式立項開始,定制組全體員工面對新工藝,新流程,克服前期資料不完備和人員不足等各種困難與阻力,全身心撲入到測試片的工作中,全體成員加班加點,任勞任怨,在規定的時間內準時交付芯片。這次活動不僅緩解了半年以來的工作壓力,大家在各種熱鬧的小游戲和愉悅的聚餐中暢所欲言,增進了解,消除隔閡。在活動中大家積極參與,在感受到團隊游戲的趣味性的同時,也培養了我們的恒心,增強了團隊的凝聚力和戰斗力。
這是一次有著特殊意義的活動, 3A5000測試片順利交付流片的同時也是向龍芯中科成立18周年的獻禮。希望定制組砥礪前行,勇攀高峰,也祝福龍芯中科越來越好。乘風破浪會有時,直掛云帆濟滄海!
據鐵流了解,這次流片的是測試片,并非龍芯3A5000量產,由于得等測試片完全正確后才能流片,量產估計要6至9個月后。參考龍芯3A2000至龍芯3A3000的升級,龍芯3A5000進度會很快,因為最關鍵的CPU核已經在4000上驗證過了,龍芯只要對3A4000內核進行小改,然后換新工藝即可。估計明年的這個時候會有龍芯3A5000的SPEC2006成績了。
9、獨立根生、自立自強
龍芯課題組成立18年來,忍受著社會上的冷嘲熱諷,用少得可憐的人力和財力研發了自己的loongISA,設計了6個微結構,研發了自己的LCC編譯器,開發了自己的社區操作系統loongnix。推出了幾十款產品,涵蓋裝備芯片(十月一日有上千片龍芯經過帝都廣場)、宇航級芯片、服務器芯片,桌面芯片,嵌入式芯片以及這些芯片配套的軟件生態。構建了一個涵蓋兩三百家企業,上萬名技術人員的產業聯盟。而這一切都是一支只有幾百人的研發團隊完成的。
實踐證明,聯想作整機利潤偏低,英特爾做芯片利潤很高。展銳做芯片利潤不高,但蘋果做芯片和整機利潤高。華為同樣做芯片和整機,但主要利潤來自通信設備,手機利潤非常有限,任正非就批評余承東手機利潤低。
歸根結底,CPU的價值在于其所承載的生態。IT產業的本質是“解決方案為王”,就PC行業而言,Wintel說了算,聯想說了不算。就手機行業來說,ARM、谷歌、蘋果說了算,華為、展銳、小米說了不算。
目前,在別人的生態體系里,聯想、華為已經做到極致,跟在洋人身后吃土的道路已經走到了頭了。中國IT產業的根本出路在于拋開英特爾、ARM、微軟、谷歌,建立自己的技術體系。只有這樣才能實現產業發展不受制于人,信息安全不受制于人。
建立自主技術體系,雖然難度極大,但中國有市場、有人才、有資金,具備另起爐灶的條件,是有機會把事情做起來的。目前,我們缺的是“精神之鈣”,缺的是愚公移山的精神,諸多大公司傾向于跟著英特爾、ARM身后吃土賺快錢。
鐵流堅信,星星之火,可以燎原。
相關文章
「 支持烏有之鄉!」
您的打賞將用于網站日常運行與維護。
幫助我們辦好網站,宣傳紅色文化!
歡迎掃描下方二維碼,訂閱烏有之鄉網刊微信公眾號
