新京報(bào)貝殼財(cái)經(jīng)訊(記者羅亦丹)3月27日,阿里巴巴發(fā)布并開源首個(gè)端到端全模態(tài)大模型通義千問Qwen2.5-Omni-7B,可同時(shí)處理文本、圖像、音頻和視頻等多種輸入,并實(shí)時(shí)生成文本與自然語音合成輸出。


在權(quán)威的多模態(tài)融合任務(wù)OmniBench等測(cè)評(píng)中,Qwen2.5-Omni刷新業(yè)界紀(jì)錄,全維度超越Google的Gemini-1.5-Pro等同類模型。Qwen2.5-Omni以接近人類的多感官方式“立體”認(rèn)知世界并與之實(shí)時(shí)交互,還能通過音視頻識(shí)別情緒。目前開發(fā)者和企業(yè)可免費(fèi)下載商用Qwen2.5-Omni,手機(jī)等終端智能硬件也可部署運(yùn)行。


編輯 岳彩周

校對(duì) 楊許麗