2月3日,云天勵(lì)飛(688343.SH)舉辦大算力芯片戰(zhàn)略前瞻會(huì),首次對(duì)外公布未來(lái)三年的大算力AI推理芯片戰(zhàn)略布局。面對(duì)人工智能從“基礎(chǔ)模型構(gòu)建”邁向“規(guī)模化應(yīng)用落地”的重要轉(zhuǎn)折點(diǎn),公司宣布將核心研發(fā)資源集中于攻克大模型落地的“成本壁壘”,致力于通過(guò)底層架構(gòu)創(chuàng)新,力爭(zhēng)實(shí)現(xiàn)百萬(wàn)Tokens推理成本降低100倍以上的目標(biāo),推動(dòng)AI從技術(shù)嘗鮮走向普惠生產(chǎn)力。
GPNPU 技術(shù)路線確立 系統(tǒng)級(jí)協(xié)同架構(gòu)破局
過(guò)去一年,全球算力產(chǎn)業(yè)的重心正加速向推理側(cè)傾斜,同時(shí),圍繞“更低時(shí)延、更低成本”的推理芯片與系統(tǒng)能力,產(chǎn)業(yè)整合動(dòng)作也在加速。推理側(cè)競(jìng)爭(zhēng)從參數(shù)競(jìng)賽向效能競(jìng)賽轉(zhuǎn)變,單位推理成本與交付效率已成為規(guī)?;涞氐淖畲箝T檻。
為了實(shí)現(xiàn)“既要承接主流軟件生態(tài),又要在推理負(fù)載下實(shí)現(xiàn)更優(yōu)能效與更低時(shí)延”的系統(tǒng)級(jí)協(xié)同,云天勵(lì)飛確立了GPNPU技術(shù)路線,并提出了“GPNPU=GPGPU+NPU+3D堆疊存儲(chǔ)”的核心公式,旨在兼顧通用計(jì)算的“通用性”與NPU的“高效性”,在工程層面同時(shí)解決可遷移、可部署、可持續(xù)降本三大難題。
從通用生態(tài)層面來(lái)看,鑒于CUDA仍是全球最成熟、覆蓋最廣的加速計(jì)算平臺(tái)之一,云天勵(lì)飛的GPNPU架構(gòu)致力于正視主流生態(tài)的遷移成本問(wèn)題,實(shí)現(xiàn)一行代碼完成CUDA程序兼容,極大降低了進(jìn)入生產(chǎn)系統(tǒng)的門檻。
從推理能效層面來(lái)看,NPU能夠?qū)崿F(xiàn)更高的計(jì)算效率和能效比,針對(duì)大模型推理高度結(jié)構(gòu)化、可被體系化優(yōu)化的負(fù)載,專用化設(shè)計(jì)帶來(lái)的能效優(yōu)勢(shì)更容易轉(zhuǎn)化為真實(shí)成本優(yōu)勢(shì),這也是國(guó)際廠商持續(xù)加碼專用路線的重要原因。
同時(shí),針對(duì)行業(yè)公認(rèn)的“內(nèi)存墻”瓶頸,云天勵(lì)飛正深度研發(fā)3D堆疊存儲(chǔ)及更前沿的互連技術(shù),以提升帶寬與能效,降低推理時(shí)延。
在架構(gòu)工程與產(chǎn)品化路徑上,云天勵(lì)飛強(qiáng)調(diào)了兩個(gè)方面可落地的優(yōu)勢(shì):一是“算力積木”架構(gòu)通過(guò)Chiplet擴(kuò)展與互連思路,將標(biāo)準(zhǔn)計(jì)算單元進(jìn)行模塊化封裝與組合,讓算力形成從邊緣到更大規(guī)模推理的彈性產(chǎn)品形態(tài);二是面向推理的系統(tǒng)級(jí)優(yōu)化能力,公司主張把“模型怎么跑得更省”沉淀到架構(gòu)里,圍繞真實(shí)業(yè)務(wù)負(fù)載持續(xù)迭代,逐項(xiàng)擊穿推理鏈路中的成本與時(shí)延瓶頸,最終形成可復(fù)制交付的綜合最優(yōu)解。
五大維度協(xié)同筑基 錨定大算力芯片戰(zhàn)略
云天勵(lì)飛董事長(zhǎng)兼CEO陳寧在演講中將公司核心競(jìng)爭(zhēng)力總結(jié)為技術(shù)、產(chǎn)能、生態(tài)、市場(chǎng)、資本五大關(guān)鍵要素。五大維度的協(xié)同共振,不僅是公司應(yīng)對(duì)行業(yè)激烈競(jìng)爭(zhēng)的底氣,更為未來(lái)三年戰(zhàn)略的穩(wěn)步落地提供了堅(jiān)實(shí)的體系化保障。
針對(duì)行業(yè)普遍關(guān)注的供應(yīng)鏈安全問(wèn)題,云天勵(lì)飛高級(jí)副總裁、CFO兼董秘鄧浩然強(qiáng)調(diào),公司目前是國(guó)內(nèi)為數(shù)不多的手握充足國(guó)產(chǎn)產(chǎn)能保障的企業(yè)之一,這一戰(zhàn)略儲(chǔ)備為后續(xù)芯片的大規(guī)模量產(chǎn)與交付提供了極高的確定性。
陳寧還詳細(xì)解讀了云天勵(lì)飛的“1+4”架構(gòu):“1”指聚焦于AI大算力推理芯片,“4”則是解決芯片從“研發(fā)生產(chǎn)、優(yōu)化打磨到市場(chǎng)推廣”的核心難題的四大事業(yè)部。其中,政企事業(yè)部作為基石,將憑借深厚的行業(yè)經(jīng)驗(yàn),將戰(zhàn)略重點(diǎn)轉(zhuǎn)向推理設(shè)備和智算中心的建設(shè)。此外,云天勵(lì)飛還計(jì)劃打造區(qū)域級(jí)“千卡集群”,樹立城市AI算力賦能的新標(biāo)桿。
云天勵(lì)飛CTO李愛(ài)軍表示,未來(lái)三年公司將不遺余力投入大算力芯片DeepVerse的研發(fā),圍繞推理成本、時(shí)延與吞吐的核心矛盾持續(xù)迭代,并按產(chǎn)品節(jié)奏梯度覆蓋市場(chǎng)需求。這一路線圖將對(duì)標(biāo)國(guó)際主流平臺(tái)的代際演進(jìn),聚焦長(zhǎng)上下文預(yù)填充(Prefill)、低時(shí)延解碼(Decode)等關(guān)鍵推理階段的系統(tǒng)優(yōu)化,在真實(shí)負(fù)載下持續(xù)兌現(xiàn)“更便宜、更穩(wěn)定、更易部署”的交付目標(biāo)。
未來(lái),云天勵(lì)飛將以GPNPU架構(gòu)為核心,大力推進(jìn)云端大算力強(qiáng)化軟硬協(xié)同與存儲(chǔ)體系攻堅(jiān),力爭(zhēng)將百萬(wàn)Tokens推理成本降低100倍以上,推動(dòng)大模型從示范應(yīng)用走向規(guī)模化交付。

