《大模型專題:大模型的異構(gòu)計(jì)算和加速》由英特爾院士戴金權(quán)在AiCon全球人工智能開(kāi)發(fā)與應(yīng)用大會(huì)上的演講內(nèi)容整理而成。報(bào)告介紹了大語(yǔ)言模型的異構(gòu)計(jì)算和加速相關(guān)技術(shù)。首先闡述大語(yǔ)言模型基于Transformer解碼器架構(gòu)的自回歸模型原理。接著分析大模型推理和訓(xùn)練面臨的瓶頸,包括內(nèi)存帶寬、計(jì)算、顯存大小和分布式計(jì)算等方面。
報(bào)告重點(diǎn)介紹了大模型的異構(gòu)計(jì)算和加速方法。包括XPU異構(gòu)計(jì)算,涉及CPU、GPU、NPU等硬件加速;低比特計(jì)算,如模型量化/壓縮、數(shù)據(jù)類型選擇、低比特算子應(yīng)用以及對(duì)顯存使用量和訓(xùn)練微調(diào)的影響,并對(duì)比了不同量化方式下多個(gè)模型的精度;還介紹了推理算法優(yōu)化,涵蓋Self - speculative decoding、KV Cache compression等多種方式。
此外,報(bào)告還介紹了IPEX - LLM開(kāi)源大模型XPU加速框架及其應(yīng)用場(chǎng)景,如在Intel Core Ultra AI PC、Intel Arc A770 GPU等不同硬件上的加速體驗(yàn),包括Office助手、工業(yè)機(jī)器人代碼生成、AI座艙 - 汽車(chē)助理等多個(gè)應(yīng)用案例展示了英特爾XPU在大模型應(yīng)用創(chuàng)新方面的成果,并鼓勵(lì)關(guān)注和試用IPEX - LLM,在Intel XPU平臺(tái)開(kāi)發(fā)大模型及其應(yīng)用。
附件:大模型的異構(gòu)計(jì)算和加速:加速方法,包括XPU異構(gòu)計(jì)算,多個(gè)模型的精度,推理算法優(yōu)化
增強(qiáng)型工作,智能企業(yè)開(kāi)始利用人工智能創(chuàng)造真正價(jià)值的方式;實(shí)時(shí)自動(dòng)決策帶來(lái)更高的效率和對(duì)變化中的客戶習(xí)慣與市場(chǎng)狀況更快的反應(yīng)速度
基于對(duì)視頻的AI智能分析,實(shí)現(xiàn)皮帶運(yùn)輸各類異常情況的智能視頻分析和判別;實(shí)現(xiàn)設(shè)備的一鍵啟停、遠(yuǎn)程操作控制等功能,有效降低危險(xiǎn)作業(yè)區(qū)域安全事故發(fā)生率
AI 技術(shù)的發(fā)展揭示了第五種科學(xué)研究范式, 即通過(guò)機(jī)器猜想的方式應(yīng)用于 科學(xué)智能,通過(guò)不同的算法思維和應(yīng)用場(chǎng)景的對(duì)撞,得到不同領(lǐng)域?qū)I(yè)知識(shí),從而推導(dǎo)位置結(jié)論的范式
AI 發(fā)展中產(chǎn)生了 五大悖論,揭示了AI 作為技術(shù)的局限性和未來(lái)可能應(yīng)用方向的限制;AI 依然是一種意義重大的技術(shù),它將顯著提高生產(chǎn)和工 作效率
AI是一種更強(qiáng)的工具,像超級(jí)計(jì)算機(jī)一樣可被購(gòu)買(mǎi);AI無(wú)所不能,人類是執(zhí)行器,AI將取代人類;AI將和人類具備平等的地位
第二章提供全景式的 AI 產(chǎn)業(yè)鏈圖譜和 中美 AI 能力對(duì)比;第三章闡述了生成式 AI 的核心技術(shù)及發(fā)展趨勢(shì);展望 AI 商業(yè)化路徑和產(chǎn)業(yè)競(jìng)爭(zhēng)格局演變
B端及C端AI應(yīng)用,目前B端應(yīng)用落地較快,C端應(yīng)用靜待殺手級(jí)應(yīng)用出現(xiàn);C端應(yīng)用頭部格局穩(wěn)定,但用戶需求不明確,往往是供給激發(fā)需求
國(guó)內(nèi)通用類大模型正在持續(xù)拓展應(yīng)用領(lǐng)域,包括文心一 言、通義千問(wèn)、星火認(rèn)知等一批通用大模型正在快速發(fā)展,垂直領(lǐng)域?qū)I(yè)類大模型也在不斷深化落地
生成式 AI 等創(chuàng)新技術(shù),正在引領(lǐng)未來(lái)商業(yè)發(fā)展的新方向;將 AI 技術(shù)和 AI 應(yīng)用視為增加企業(yè)營(yíng)銷能力的伙伴,共同 生成商業(yè)新未來(lái)
當(dāng)Al與勞動(dòng)高度互補(bǔ)時(shí),互補(bǔ)效應(yīng)變得強(qiáng)于位移效應(yīng),特別是在收入分配的上半部分,導(dǎo)致與低互補(bǔ)情況相比
模型無(wú)法做到無(wú)限制的創(chuàng)意賦能,隨著海量設(shè)計(jì)師利用同一模型 進(jìn)行設(shè)計(jì)流程的迭代,產(chǎn)品的設(shè)計(jì)風(fēng)格可能趨于同化,擴(kuò)大設(shè)計(jì)師在 實(shí)踐中所創(chuàng)造知識(shí)的影響力
訓(xùn)練與微調(diào)成本,該訓(xùn)練成本僅針對(duì)企業(yè)應(yīng)用基礎(chǔ)模型結(jié)合行業(yè)知識(shí)與數(shù)據(jù)集進(jìn)行訓(xùn)練與微調(diào)的成本,并非基礎(chǔ)大模型訓(xùn)練成本,該成本仍然為行業(yè)知識(shí)壁壘顯著的企業(yè)必須承擔(dān)的成本