終端承接大模型:不能承受之輕?

2023-08-23 16:05:16     來源:中國(guó)電子報(bào)、電子信息產(chǎn)業(yè)網(wǎng)     編輯:    


【資料圖】

小米創(chuàng)始人、董事長(zhǎng)雷軍在年度演講中介紹小米大模型
近日,聯(lián)發(fā)科正式宣布與百度聯(lián)合發(fā)起飛槳和文心大模型硬件生態(tài)共創(chuàng)計(jì)劃,雙方將共同推進(jìn)聯(lián)發(fā)科硬件平臺(tái)與飛槳和文心大模型的適配,支持基于聯(lián)發(fā)科芯片的智能手機(jī)、汽車、智能家居、物聯(lián)網(wǎng)等終端設(shè)備運(yùn)行文心大模型;小米創(chuàng)始人、董事長(zhǎng)雷軍在年度演講中也表示,小米已經(jīng)在手機(jī)上跑通了13億參數(shù)的大模型,輕量化和本地部署是小米大模型技術(shù)的主力突破方向。
作為連接多個(gè)生活場(chǎng)景、硬件消費(fèi)市場(chǎng)、信息消費(fèi)市場(chǎng)、基礎(chǔ)通信和互聯(lián)網(wǎng)應(yīng)用的樞紐,手機(jī)等智能終端在AI大模型時(shí)代愈發(fā)關(guān)鍵。當(dāng)大模型部署在終端,芯片作為算力底座如何更好地與之適配,也成為業(yè)內(nèi)熱議的話題。
大模型輕量化是重要發(fā)展方向之一
當(dāng)前,ChatGPT引領(lǐng)的生成式AI大模型風(fēng)潮已經(jīng)席卷全球,人工智能正在從云端走向終端。記者注意到,除小米和聯(lián)發(fā)科之外,谷歌、微軟和蘋果等廠商也在發(fā)力終端大模型,輕量化已成為大模型在終端部署的重要發(fā)展方向。
全球大模型分布情況
來源:中國(guó)科學(xué)技術(shù)信息研究所《中國(guó)人工智能大模型地圖研究報(bào)告》
比如,今年5月,谷歌發(fā)布了適用邊緣的大模型PaLM2。具體來看,PaLM2大模型一共有四種規(guī)格,分別是Gecko(壁虎)、Otter(水獺)、Bison(野牛)和Unicorn(獨(dú)角獸)。其中,Gecko非常輕量,可在移動(dòng)設(shè)備上工作。記者了解到,一個(gè)更輕量但具有更高質(zhì)量的模型能夠顯著提高推理效率并降低服務(wù)成本,使模型的下游應(yīng)用程序適配更多應(yīng)用程序和用戶,使AI邊緣部署成為可能。
谷歌的競(jìng)爭(zhēng)對(duì)手同樣不甘落后。7月份,蘋果正式宣布啟動(dòng)開發(fā)AppleGPT,加入終端AI大模型戰(zhàn)局。據(jù)了解,AppleGPT是蘋果公司基于其自研的Ajax框架開發(fā)的AI工具,目前已在蘋果公司內(nèi)部展開小范圍內(nèi)測(cè)。
同時(shí),微軟開源了DeepSpeedChat訓(xùn)練模型、Meta開源LLaMA,在AI開發(fā)者中快速興起基于LLaMA的訓(xùn)練風(fēng)潮,加速Lora等訓(xùn)練方法的滲透。據(jù)悉,Deepspeed與Lora模型給中小開發(fā)者提供了低成本、快速訓(xùn)練專屬于自己的“小模型”的完整工具,加速建立大模型梯度分布的格局。
芯片廠商方面,高通在MWC 2023大會(huì)發(fā)布全球首個(gè)運(yùn)行在Android 手機(jī)上的Stable Diffusion終端側(cè)演示。據(jù)介紹,Stable Diffusion模型參數(shù)超過10億,高通利用其AI軟件棧對(duì)模型進(jìn)行量化、編譯和硬件加速優(yōu)化,使其成功在搭載第二代驍龍8移動(dòng)平臺(tái)的手機(jī)上運(yùn)行。
ChatGPT 在芯片自動(dòng)生成各個(gè)領(lǐng)域的開創(chuàng)性創(chuàng)新
數(shù)據(jù)來源:中科院計(jì)算所
在AI計(jì)算的實(shí)現(xiàn)上,軟件和硬件同樣重要,因?yàn)楸仨氃诙藗?cè)做到運(yùn)算更快、效率更高,并推動(dòng)AI應(yīng)用在廣泛終端上的部署和普及。記者了解到,高通早在2022年6月就推出了AI軟件棧(Qualcomm AI Stack),支持包括TensorFlow、Pytorch和ONNX在內(nèi)的所有主流開發(fā)框架,所有runtimes(運(yùn)行時(shí),即某門編程語言的運(yùn)行環(huán)境)和操作系統(tǒng)。借助高通AI軟件棧,開發(fā)者在智能手機(jī)領(lǐng)域開發(fā)的軟件可以快速擴(kuò)展至汽車、XR、可穿戴設(shè)備等其他產(chǎn)品線進(jìn)行使用。
高通技術(shù)公司產(chǎn)品管理高級(jí)副總裁兼AI負(fù)責(zé)人Ziad Asghar表示,未來公司需要加大終端側(cè)技術(shù)上的研發(fā),尤其是進(jìn)一步提升量化的算法。例如服務(wù)器上訓(xùn)練的模型一般采用32位浮點(diǎn)運(yùn)算(FP32),而其在手機(jī)端現(xiàn)在能夠支持INT4計(jì)算,這能大大提高端側(cè)的處理能力。
大模型在終端的輕量化部署需要芯片在算力與功耗之間找到平衡點(diǎn)。賽迪顧問研究員鄧楚翔對(duì)《中國(guó)電子報(bào)》記者表示,大模型“由云向端”趨勢(shì),對(duì)手機(jī)、可穿戴設(shè)備、智能家電等電子電器產(chǎn)品SoC中GPU算力與功耗平衡提出了更高要求。特別是在手機(jī)等終端產(chǎn)品中,“便利性”是第一要素,因此大模型在參數(shù)上會(huì)進(jìn)行適度壓縮,算力芯片需要同時(shí)考慮算力與功耗比。同時(shí),當(dāng)大模型應(yīng)用于終端領(lǐng)域時(shí),低延時(shí)響應(yīng)能力也是對(duì)專用GPU性能的重要評(píng)判指標(biāo)。
事實(shí)上,在終端應(yīng)用場(chǎng)景,芯片、硬件等主要進(jìn)行的是推理過程。根據(jù)應(yīng)用場(chǎng)景的不同,不同大模型對(duì)硬件需求也是不一樣的。
“比如,需要隨時(shí)更新學(xué)習(xí)數(shù)據(jù)的通用大模型,終端大模型應(yīng)用需要端云協(xié)作,對(duì)硬件的互連性能和網(wǎng)絡(luò)情況有較高要求;有些比較‘精簡(jiǎn)’的、不需要基于在線數(shù)據(jù)的大模型應(yīng)用,如內(nèi)容生成大模型應(yīng)用場(chǎng)景的一種—圖片修改,就可以在終端設(shè)備中運(yùn)行,但這種場(chǎng)景對(duì)終端設(shè)備本身的算力就有較高要求。”本土GPU獨(dú)角獸廠商技術(shù)專家對(duì)《中國(guó)電子報(bào)》記者表示。
芯片面臨性能與算力等多重挑戰(zhàn)

全球眾多科技企業(yè)都在積極研究AI大模型,并致力于實(shí)現(xiàn)大模型在終端的輕量化部署。但由于算力的參數(shù)規(guī)模太大,從算力硬件來看,由于AI芯片針對(duì)AI算法做了特殊加速設(shè)計(jì),大多數(shù)AI訓(xùn)練和推理工作負(fù)載對(duì)AI芯片的性能和算力要求很高,這也讓芯片面臨存儲(chǔ)、計(jì)算能力、功耗等方面的多重挑戰(zhàn)。

“端側(cè)和邊緣設(shè)備的算力、功耗、成本往往有限,不像算力中心可以無限增加設(shè)備。因此,如何在一個(gè)資源受限的情況下去完成推理,就需要根據(jù)特定領(lǐng)域的特定需求去做特定優(yōu)化。”澎峰科技聯(lián)合創(chuàng)始人兼首席運(yùn)營(yíng)官王軍輝對(duì)《中國(guó)電子報(bào)》記者表示,一方面,這需要AI軟件棧對(duì)模型進(jìn)行量化、編譯和軟件加速優(yōu)化。另外一方面,針對(duì)大模型的異構(gòu)計(jì)算芯片將成為未來的主流發(fā)展趨勢(shì)。而其挑戰(zhàn)在于,由于目前算法依然處于快速迭代階段,因此投入和產(chǎn)出具有很高的不確定性。
從芯片架構(gòu)的角度來看,異構(gòu)計(jì)算將是實(shí)現(xiàn)終端和邊緣側(cè)大模型部署的必然選擇。Arm物聯(lián)網(wǎng)事業(yè)部業(yè)務(wù)拓展副總裁馬健對(duì)《中國(guó)電子報(bào)》記者表示,邊緣側(cè)設(shè)備集成的芯片從同構(gòu)CPU架構(gòu)發(fā)展到異構(gòu)及加速器架構(gòu),能夠更好地支持大模型稀疏化后形成的小模型,使它們能夠在邊緣側(cè)和端側(cè)實(shí)現(xiàn)部署。
在本土GPU獨(dú)角獸廠商技術(shù)專家看來,大模型部署在終端的最大技術(shù)挑戰(zhàn)主要在于設(shè)備。這是因?yàn)榻K端設(shè)備往往對(duì)芯片功耗和芯片面積非常敏感,因此在算力提升上難度很大。
“這其實(shí)也是移動(dòng)芯片所面臨的技術(shù)挑戰(zhàn)。摩爾定律基本走到盡頭,在功耗和面積限制下,提升算力的難度巨大、成本巨大。”該技術(shù)專家認(rèn)為,提升算力的解決方案主要有兩方面。一方面是利用好5G通信技術(shù)帶來的優(yōu)勢(shì),更多采用云端計(jì)算的方式來部署大模型應(yīng)用;另一方面則是加強(qiáng)在芯片制造、封裝等方面的技術(shù)研發(fā)力度,爭(zhēng)取突破摩爾定律,尋找新的解決方案。
大模型在終端部署前還要通過機(jī)器學(xué)習(xí)等方式進(jìn)行訓(xùn)練。記者了解到,在算力挑戰(zhàn)下,現(xiàn)階段的大模型訓(xùn)練主要在云端或邊緣進(jìn)行。本土GPU獨(dú)角獸廠商技術(shù)專家對(duì)記者表示:“大模型在訓(xùn)練過程需要龐大的算力,推理工作也很難在終端平臺(tái)上進(jìn)行計(jì)算,因此需要云端算力。對(duì)于終端設(shè)備而言,要想利用好當(dāng)前大模型的這波熱潮,關(guān)鍵還是利用好通信技術(shù)的發(fā)展,結(jié)合云端算力進(jìn)行大模型的終端部署。”
關(guān)鍵詞:
相關(guān)新聞
相關(guān)新聞
最近更新
最近更新
v 終端承接大模型:不能承受之輕? 2023-08-23
v 央媒省媒看揚(yáng)州 | 央視一日三次聚焦廣陵仁豐里七夕巧市 2023-08-23
v 桂林園林植物園在哪里 桂林園林植物園門票價(jià)格 2023-08-23
v 居老師和倪妮領(lǐng)銜主演《消失的她》8.25日首播 2023-08-23
v 8月23日午間評(píng)論 2023-08-23
v 請(qǐng)給外賣加把“食安鎖”——東城區(qū)市場(chǎng)監(jiān)管局關(guān)于外賣使用“食安封... 2023-08-23
v 信創(chuàng)板塊震蕩走低 中國(guó)軟件觸及跌停 2023-08-23
v AI分享|世短意常多,斯人樂久生 2023-08-23
v 湖南啟動(dòng)今年第二批省級(jí)企業(yè)技術(shù)中心認(rèn)定工作 2023-08-23
v 8月23日證券之星早間消息匯總:證券日?qǐng)?bào)發(fā)文再談挺起A股的脊梁 2023-08-23
v 家常雞絲粥怎么做好吃又簡(jiǎn)單 2023-08-23
v “企”舞吧!生力軍② | 這家土生土長(zhǎng)的廣州企業(yè) 為工業(yè)制造研... 2023-08-23
v “哪哪都是古偶”!古偶劇“霸屏”,破圈者寥寥 2023-08-23
v wlan密碼忘記了 怎么查看密碼(wlan) 2023-08-23
v 中國(guó)船舶租賃(03877)將于10月28日派發(fā)中期股息每股0.03港元 2023-08-23
v 中方召見日本駐華大使!嚴(yán)正交涉 2023-08-22
v 廣東建華職業(yè)學(xué)院新校區(qū) 廣東建華職業(yè)學(xué)院 2023-08-22
v 備注ohh是什么意思_ohh是什么意思 2023-08-22
v 平均年齡為41歲!這120個(gè)項(xiàng)目(人選)獲2022年度青島市科學(xué)技術(shù)獎(jiǎng) 2023-08-22
v 重點(diǎn)梳理!2023年3D打印龍頭股票有哪些?(附名單) 2023-08-22
v 南大光電:公司正在抓緊推進(jìn)ArF光刻膠驗(yàn)證和市場(chǎng)拓展工作,力爭(zhēng)早日... 2023-08-22
v 南昌消防:一未投產(chǎn)車間發(fā)生火災(zāi),明火被撲滅,無人員傷亡 2023-08-22
v 無償獻(xiàn)血活動(dòng)走進(jìn)玉屏 2023-08-22
v 倪瓚 巖居圖、疏林圖、筠石喬柯圖、林亭春靄圖、山水秋雨枯樹圖等 2023-08-22
v 共17人!武漢科技職業(yè)學(xué)院發(fā)布2023年秋季招聘公告 2023-08-22
v 甘肅四六級(jí)出分時(shí)間 2023-08-22
v 大全能源:擬以2億元-4億元回購(gòu)公司股份 2023-08-22
v 愛車加油站 自駕游出行注意事項(xiàng) 2023-08-22
v 【愛在“七夕”】“90后”飛行員與妻子的“空中約定” 2023-08-22
v 周杰倫呼市演唱會(huì)門票 呼市公交保障周杰倫演唱會(huì)出行需求 基本情況講解 2023-08-22
分享到:
更多