隨著當(dāng)前人工智能技術(shù)普遍應(yīng)用于日常生活和傳統(tǒng)產(chǎn)業(yè),對(duì)于底層芯片計(jì)算能力的需求一直 在飛速增長(zhǎng),其增速已經(jīng)大幅超過(guò)了摩爾定律的速度。例如在 2021 年,由Google提出的Switch Transformer網(wǎng)絡(luò)及Facebook提出的DLRM12T網(wǎng)絡(luò),分別是 2017 年Google提出的Transformer網(wǎng)絡(luò)模型大小的7, 600 倍和57, 000 倍。人工智能運(yùn)算常常具有大運(yùn)算量、高并發(fā)度、訪存頻繁的特點(diǎn),且不同子領(lǐng)域(如視覺(jué)、語(yǔ)音與自然語(yǔ)言處理)所涉及的運(yùn)算模式具有高度多樣性,對(duì)于芯片的微架構(gòu)、指令集、制造工藝甚至配套系統(tǒng)軟件都提出了巨大的挑戰(zhàn)。
寒武紀(jì)的主營(yíng)業(yè)務(wù)是各類云服務(wù)器、邊緣計(jì)算設(shè)備、終端設(shè)備中人工智能核心芯片的研發(fā)、設(shè)計(jì)和銷售,主要產(chǎn)品為云端智能芯片及加速卡、訓(xùn)練整機(jī)、邊緣智能芯片及加速卡、終端智能處理器IP以及上述產(chǎn)品的配套軟件開(kāi)發(fā)平臺(tái)。
寒武紀(jì)所研發(fā)的通用型智能芯片產(chǎn)品,具備靈活的指令集和精巧的處理器架構(gòu),技術(shù)壁壘高但應(yīng)用面廣,可覆蓋人工智能領(lǐng)域高度多樣化的應(yīng)用場(chǎng)景(如 視覺(jué)、語(yǔ)音、自然語(yǔ)言理解、傳統(tǒng)機(jī)器學(xué)習(xí)、生成式人工智能等)。與CPU、GPU等芯片相比,通用型智能芯片能夠更好地匹配和支持人工智能算法中的關(guān)鍵運(yùn)算操作,在性能和功耗上存在顯著優(yōu)勢(shì)。根據(jù)市場(chǎng)調(diào)研公司 Tractica 的研究報(bào)告,人工智能芯片的市場(chǎng)規(guī)模將由 2018 年的 51 億美元增長(zhǎng)到 2025 年的 726 億美元,年均復(fù)合增長(zhǎng)率將達(dá)到 46.14%。隨著人工智能市場(chǎng)需求潛力逐 步釋放,通用型人工智能芯片未來(lái)將成為該市場(chǎng)的主流產(chǎn)品。
集成電路設(shè)計(jì)行業(yè)屬于技術(shù)密集型行業(yè),而智能芯片作為集成電路領(lǐng)域新興的方向,在集成 電路和人工智能方面有著雙重技術(shù)門(mén)檻。通用型智能芯片及其基礎(chǔ)系統(tǒng)軟件的研發(fā)需要全面掌握核心芯片與系統(tǒng)軟件的大量關(guān)鍵技術(shù),技術(shù)難度高、涉及方向廣,是一個(gè)極端復(fù)雜的系統(tǒng)工程。
寒武紀(jì)憑借領(lǐng)先的核心技術(shù),較早實(shí)現(xiàn)了多項(xiàng)技術(shù)的產(chǎn)品化。自 2016 年 3 月成立以來(lái),寒武紀(jì)先后推出了用于終端場(chǎng)景的寒武紀(jì)1A、寒武紀(jì)1H、寒武紀(jì)1M系列智能處理器;基于思元100、思元270、思元 290 芯片和思元 370 的云端智能加速卡系列產(chǎn)品;基于思元 220 芯片的邊緣智能加速卡。其中,寒武紀(jì)智能處理器IP產(chǎn)品已集成于超過(guò) 1 億臺(tái)智能手機(jī)及其他智能終端設(shè)備中,思元系列產(chǎn)品也已應(yīng)用于浪潮、聯(lián)想等多家服務(wù)器廠商的產(chǎn)品中。此外,思元 270 芯片、思元 290 芯片還分別獲得第六屆世界互聯(lián)網(wǎng)大會(huì)、世界人工智能大會(huì)頒布的獎(jiǎng)項(xiàng)。思元 220 自發(fā)布以來(lái),累計(jì)銷量突破百萬(wàn)片。
同時(shí),寒武紀(jì)通過(guò)技術(shù)創(chuàng)新和設(shè)計(jì)優(yōu)化,持續(xù)提升產(chǎn)品的性能、能效和易用性,推動(dòng)產(chǎn)品競(jìng)爭(zhēng)力不斷提升。此外,寒武紀(jì)通過(guò)對(duì)硬件產(chǎn)品及軟件生態(tài)的不斷技術(shù)創(chuàng)新和設(shè)計(jì)優(yōu)化,實(shí)現(xiàn)了產(chǎn)品的多次迭代更新,使得公司產(chǎn)品的成熟度達(dá)到了新高度。
2022 年寒武紀(jì)的基礎(chǔ)系統(tǒng)軟件平臺(tái)相比前期版本也進(jìn)行了優(yōu)化和迭代。一方面,推理軟件平臺(tái)持續(xù)完善了推理加速引擎 MagicMind 及其周邊生態(tài),在功能上已全面支持視頻理解、圖像分類、相似度檢測(cè)、語(yǔ)義分割、文本檢測(cè)、OCR、語(yǔ)音及自然語(yǔ)言處理、搜索、推薦等領(lǐng)域的云邊端推理業(yè)務(wù),并完善了公有云、私有云部署的功能組件及管理模塊;在性能上,MagicMind 在多個(gè)領(lǐng)域的典型模型上,均取得不弱于同檔位友商產(chǎn)品的表現(xiàn);在兼容性上,MagicMind 達(dá)到了穩(wěn)定狀態(tài),版本發(fā)布保持了對(duì)前序版本的 API、ABI 兼容。另一方面,訓(xùn)練軟件平臺(tái)的研發(fā)和改進(jìn)工作亦持續(xù)進(jìn)行,在功能上支撐了寒武紀(jì)新的硬件平臺(tái)以及 FP19 數(shù)據(jù)精度,支撐了新的 PyTorch 版本,算子覆蓋度達(dá)到 80%,TensorFlow 的算子數(shù)量及交付網(wǎng)絡(luò)模型均有所增加,支持了包括 GPT 類語(yǔ)言模型在內(nèi)的多種主流模型的分布式訓(xùn)練。
值得注意的是,各類人工智能應(yīng)用廠商如能在云、邊、端三個(gè)領(lǐng)域進(jìn)行協(xié)同開(kāi)發(fā)和部署,將大幅節(jié)省開(kāi)發(fā)成本并提升研發(fā)效率。從硬件及開(kāi)發(fā)工具角度而言,低效的軟硬件生態(tài)最終會(huì)被逐步淘汰,人工智能軟件生態(tài)在云端、邊緣端和終端將走向一體化,同時(shí)具備云、邊、端芯片產(chǎn)品和生態(tài)開(kāi)發(fā)能力的智能芯片企業(yè)會(huì)獲得更顯著的協(xié)同優(yōu)勢(shì)。
而寒武紀(jì)研發(fā)的云邊端一體化開(kāi)發(fā)環(huán)境,為智能芯片/處理器產(chǎn)品提供統(tǒng)一、完整、有效的應(yīng)用開(kāi)發(fā)、功能調(diào)試和性能調(diào)優(yōu)的軟件工具鏈。在該軟件平臺(tái)的支持下,程序員可實(shí)現(xiàn)跨云邊端平臺(tái)的應(yīng)用開(kāi)發(fā),大幅提升人工智能應(yīng)用在不同硬件平臺(tái)的開(kāi)發(fā)效率和部署速度,同時(shí)也使云邊端異構(gòu)硬件資源的統(tǒng)一管理、調(diào)度和協(xié)同計(jì)算成為可能。
(推廣)