1月8日,北京智源人工智能研究院(以下簡(jiǎn)稱(chēng)“智源研究院”)發(fā)布“2025十大AI技術(shù)趨勢(shì)”。今年的十大AI技術(shù)趨勢(shì)是智源研究院根據(jù)行業(yè)技術(shù)及應(yīng)用熱點(diǎn),給出的年度AI趨勢(shì)預(yù)測(cè)。從基礎(chǔ)設(shè)施到產(chǎn)品應(yīng)用,智源研究院對(duì)Scaling Law(尺度定律)、基礎(chǔ)模型、具身智能、超級(jí)應(yīng)用、AI安全等關(guān)鍵方向作出預(yù)測(cè)。針對(duì)每個(gè)趨勢(shì)觀點(diǎn),報(bào)告給出其可成為2025年度趨勢(shì)的論證邏輯。
在十大AI技術(shù)趨勢(shì)發(fā)布會(huì)現(xiàn)場(chǎng),來(lái)自清華等高校和企業(yè)界的專(zhuān)家,以及智源相關(guān)研究中心負(fù)責(zé)人對(duì)每項(xiàng)趨勢(shì)進(jìn)行了深入分析和點(diǎn)評(píng)。
智源研究院副院長(zhǎng)兼總工程師林詠華發(fā)布“2025十大AI技術(shù)趨勢(shì)”。新京報(bào)貝殼財(cái)經(jīng)記者 羅亦丹/攝
在十大AI技術(shù)趨勢(shì)的代表案例中,不乏中國(guó)自研技術(shù)和產(chǎn)品的身影。
在多模態(tài)領(lǐng)域,智源研究院發(fā)布完全自研的基于自回歸技術(shù)的原生多模態(tài)世界模型Emu3,實(shí)現(xiàn)了視頻、圖像、文本三種模態(tài)的統(tǒng)一理解和生成。
在模型應(yīng)用領(lǐng)域,豆包月活躍用戶(hù)數(shù)于2024年12月達(dá)到了7116萬(wàn),成為國(guó)內(nèi)第一、全球第二的AI原生應(yīng)用。在服務(wù)類(lèi)智能體賽道,螞蟻集團(tuán)旗下支小寶、螞小財(cái)?shù)认盗蠥I管家產(chǎn)品,重塑了AI產(chǎn)品形態(tài)。
與此同時(shí),在AI大模型及深度數(shù)字化趨勢(shì)下,安全科技的價(jià)值在放大。智源研究院持續(xù)推進(jìn)AI安全底層關(guān)鍵技術(shù)研究,同時(shí)積極推進(jìn)AI安全國(guó)際合作:2024年3月,發(fā)起并承辦我國(guó)首個(gè)AI安全國(guó)際對(duì)話(huà)高端閉門(mén)論壇,與全球AI領(lǐng)袖學(xué)者及產(chǎn)業(yè)專(zhuān)家聯(lián)合簽署《北京AI安全國(guó)際共識(shí)》。2024年4月,聯(lián)合國(guó)科技大會(huì)發(fā)布了兩項(xiàng)大模型安全標(biāo)準(zhǔn),其中《大語(yǔ)言模型安全測(cè)試方法》由螞蟻集團(tuán)牽頭。
智源研究院院長(zhǎng)王仲遠(yuǎn)表示,“當(dāng)前,我們處在人工智能發(fā)展的新拐點(diǎn),大模型的能力涌現(xiàn)加速通用人工智能時(shí)代的到來(lái),原生統(tǒng)一多模態(tài)、具身智能、AI for Science,將進(jìn)一步深化人工智能對(duì)世界的感知、理解與推理,連接數(shù)字世界與物理世界,驅(qū)動(dòng)科學(xué)研究創(chuàng)新突破。智源研究院作為聚焦人工智能領(lǐng)域的新型研發(fā)機(jī)構(gòu),我們希望在這個(gè)特殊的時(shí)刻以十大趨勢(shì)為出發(fā)點(diǎn),為人工智能行業(yè)的從業(yè)者指明發(fā)展方向,攜手共進(jìn)”。
以下為十大AI技術(shù)趨勢(shì)的具體介紹:
趨勢(shì)一 科學(xué)的未來(lái):AI4S驅(qū)動(dòng)科學(xué)研究范式變革
大模型引領(lǐng)下的AI4S(AI for Science 人工智能幫助科學(xué)發(fā)展),已成為推動(dòng)科學(xué)研究范式變革的關(guān)鍵力量。2024年,科研人員使用AI的比例快速增加,AI對(duì)科學(xué)研究方法和流程的變革效應(yīng)也開(kāi)始顯現(xiàn)。2025年,多模態(tài)大模型將進(jìn)一步融入科學(xué)研究,賦能多維數(shù)據(jù)的復(fù)雜結(jié)構(gòu)挖掘,輔助科研問(wèn)題的綜合理解與全局分析,為生物醫(yī)學(xué)、氣象、材料發(fā)現(xiàn)、生命模擬、能源等基礎(chǔ)與應(yīng)用科學(xué)的研究開(kāi)辟新方向。
趨勢(shì)二 具身智能元年:具身腦和本體的協(xié)同進(jìn)化
2025年的具身智能,將繼續(xù)從本體擴(kuò)展到具身腦的敘事主線,我們可以從三方面有更多期待。在行業(yè)格局上,近百家的具身初創(chuàng)或?qū)⒂瓉?lái)洗牌,廠商數(shù)量開(kāi)始收斂;在技術(shù)路線上,端到端模型繼續(xù)迭代,小腦大模型的嘗試或有突破;在商業(yè)變現(xiàn)上,也必將看到更多的工業(yè)場(chǎng)景下的具身智能應(yīng)用,部分人形機(jī)器人迎來(lái)量產(chǎn)。
趨勢(shì)三 下一個(gè)Token預(yù)測(cè):統(tǒng)一的多模態(tài)大模型實(shí)現(xiàn)更高效AI
人工智能的本質(zhì)在于對(duì)人的思維信息過(guò)程的模擬。當(dāng)前的語(yǔ)言大模型、拼接式的多模態(tài)大模型,在對(duì)人類(lèi)思維過(guò)程的模擬存在天然的局限性。從訓(xùn)練之初就打通多模態(tài)數(shù)據(jù),實(shí)現(xiàn)端到端輸入和輸出的原生多模態(tài)技術(shù)路線給出了多模態(tài)發(fā)展的新可能?;诖?,訓(xùn)練階段即對(duì)齊視覺(jué)、音頻、3D等模態(tài)的數(shù)據(jù),實(shí)現(xiàn)多模態(tài)的統(tǒng)一,構(gòu)建原生多模態(tài)大模型成為多模態(tài)大模型進(jìn)化的重要方向。
趨勢(shì)四 Scaling Law擴(kuò)展:模型泛化從預(yù)訓(xùn)練向后訓(xùn)練、推理遷移
基于Scaling Law推動(dòng)基礎(chǔ)模型性能提升的訓(xùn)練模式“性?xún)r(jià)比”持續(xù)下降,后訓(xùn)練與特定場(chǎng)景的Scaling Law不斷被探索。強(qiáng)化學(xué)習(xí)作為發(fā)現(xiàn)后訓(xùn)練、推理階段的Scaling Law的關(guān)鍵技術(shù),也將會(huì)得到更多的應(yīng)用和創(chuàng)新使用。
趨勢(shì)五 世界模型加速發(fā)布,有望成為多模態(tài)大模型的下一階段
更注重“因果”推理的世界模型賦予AI更高級(jí)別的認(rèn)知和更符合邏輯的推理與決策能力,這種能力不僅能推動(dòng)AI在自動(dòng)駕駛、機(jī)器人控制及智能制造等前沿領(lǐng)域的深度應(yīng)用,更有望突破傳統(tǒng)的任務(wù)邊界,探索人機(jī)交互的新可能。
趨勢(shì)六 合成數(shù)據(jù)將成為大模型迭代與應(yīng)用落地的重要催化劑
高質(zhì)量數(shù)據(jù)的短缺將成為大模型進(jìn)一步Scaling Up(尺度發(fā)展)的發(fā)展阻礙。合成數(shù)據(jù)已經(jīng)成為基礎(chǔ)模型廠商補(bǔ)充數(shù)據(jù)的首選。合成數(shù)據(jù)可以降低人工治理和標(biāo)注的成本,緩解對(duì)真實(shí)數(shù)據(jù)的依賴(lài),不再涉及數(shù)據(jù)隱私問(wèn)題;提升數(shù)據(jù)的多樣性,有助于提高模型處理長(zhǎng)文本和復(fù)雜問(wèn)題的能力。此外,合成數(shù)據(jù)可以緩解通用數(shù)據(jù)被大廠壟斷、專(zhuān)有數(shù)據(jù)存在獲取成本等問(wèn)題,促進(jìn)大模型的應(yīng)用落地。
趨勢(shì)七 推理優(yōu)化迭代加速,成為AI Native應(yīng)用落地的必要條件
大模型硬件載體從云端向手機(jī)、PC等端側(cè)硬件滲透。在這些資源受限(AI算力、內(nèi)存等)的設(shè)備上,大模型的落地應(yīng)用會(huì)面臨較大的推理側(cè)的開(kāi)銷(xiāo)限制,對(duì)部署資源、用戶(hù)體驗(yàn)、經(jīng)濟(jì)成本等均帶來(lái)巨大挑戰(zhàn)。算法加速和硬件優(yōu)化技術(shù)持續(xù)迭代,雙輪驅(qū)動(dòng)加速AI Native應(yīng)用落地。
趨勢(shì)八 重塑產(chǎn)品應(yīng)用形態(tài),Agentic AI成為產(chǎn)品落地的重要模式
2025年,更通用、更自主的智能體將重塑產(chǎn)品應(yīng)用形態(tài),進(jìn)一步深入工作與生活場(chǎng)景,成為大模型產(chǎn)品落地的重要應(yīng)用形態(tài)。從Chatbot、Copilot到AI Agent、Agentic AI,2023年以來(lái)行業(yè)對(duì)于AI應(yīng)用形態(tài)的理解越發(fā)深入。從更強(qiáng)調(diào)產(chǎn)品概念的AI Agent,到更強(qiáng)調(diào)應(yīng)用智能程度的Agentic AI,我們?cè)?025年將看到更多智能化程度更高、對(duì)業(yè)務(wù)流程理解更深的多智能體系統(tǒng)在應(yīng)用側(cè)的落地。(記者注:以上英文的含義均與人工智能代理有關(guān))
趨勢(shì)九 AI應(yīng)用熱度漸起,超級(jí)應(yīng)用花落誰(shuí)家猶未可知
近一年時(shí)間,生成式模型在圖像、視頻側(cè)的處理能力得到大幅提升,疊加推理優(yōu)化帶來(lái)的降本,Agent/RAG框架、應(yīng)用編排工具等技術(shù)的持續(xù)發(fā)展,為AI超級(jí)應(yīng)用的落地積基樹(shù)本。雖然Super APP花落誰(shuí)家尚未塵埃落定,但從用戶(hù)規(guī)模、交互頻次、停留時(shí)長(zhǎng)等維度來(lái)看,AI應(yīng)用熱度持續(xù)攀升,已到應(yīng)用爆發(fā)的黎明前夕。
趨勢(shì)十 模型能力提升與風(fēng)險(xiǎn)預(yù)防并重,AI安全治理體系持續(xù)完善
作為復(fù)雜系統(tǒng),大模型的Scaling(尺度)帶來(lái)了涌現(xiàn),但復(fù)雜系統(tǒng)特有的涌現(xiàn)結(jié)果不可預(yù)測(cè),循環(huán)反饋等特有屬性也對(duì)傳統(tǒng)工程的安全防護(hù)機(jī)制帶來(lái)了挑戰(zhàn)?;A(chǔ)模型在自主決策上的持續(xù)進(jìn)步帶來(lái)了潛在的失控風(fēng)險(xiǎn),如何引入新的技術(shù)監(jiān)管方法,如何在人工監(jiān)管上平衡行業(yè)發(fā)展和風(fēng)險(xiǎn)管控?這對(duì)參與AI的各方來(lái)說(shuō),都是一個(gè)值得持續(xù)探討的議題。
新京報(bào)貝殼財(cái)經(jīng)記者 羅亦丹
編輯 王真真
校對(duì) 劉軍