新京報貝殼財經訊(記者羅亦丹)1月15日,貝殼財經記者獲悉,邏輯智能發(fā)布了AudioX-Thai語音大模型。


據了解,受限于泰語獨特的規(guī)則,有關泰語的語音模型工作一直進展緩慢,泰語語音合成難度較大。目前市面上的泰語語音模型技術,大多缺乏感情與表現力,且均不支持聲音克隆,難以滿足日益增長的市場需求。


在這樣的情況下,AudioX-Thai語音大模型在10萬小時的泰語語音數據集上進行訓練,具有高情感表現力,僅需要10秒的參考音頻,就可以克隆參考音頻音色,為泰語語音合成領域帶來了新的突破。


泰國是東南亞AI領域 “橋頭堡”,根據該國制定的《國家人工智能發(fā)展戰(zhàn)略》,其目標是到2027年發(fā)展成為東南亞人工智能中心。英偉達、谷歌、亞馬遜等AI巨頭也宣布將在泰國投資。


而AudioX-Thai具有支持泰英混讀的能力,即使文本中包含英語,也能夠流暢合成,這無疑為各類AI應用軟硬件在東南亞多語言環(huán)境下的拓展提供了更廣闊的空間。


目前,登錄邏輯智能官網:https://luoji.cn/,點擊泰語男聲,即可試用生成效果。


校對 柳寶慶