新京報貝殼財經訊（記者羅亦丹）1月15日，貝殼財經記者獲悉，邏輯智能發(fā)布了AudioX-Thai語音大模型。

據了解，受限于泰語獨特的規(guī)則，有關泰語的語音模型工作一直進展緩慢，泰語語音合成難度較大。目前市面上的泰語語音模型技術，大多缺乏感情與表現力，且均不支持聲音克隆，難以滿足日益增長的市場需求。

在這樣的情況下，AudioX-Thai語音大模型在10萬小時的泰語語音數據集上進行訓練，具有高情感表現力，僅需要10秒的參考音頻，就可以克隆參考音頻音色，為泰語語音合成領域帶來了新的突破。

泰國是東南亞AI領域 “橋頭堡”，根據該國制定的《國家人工智能發(fā)展戰(zhàn)略》，其目標是到2027年發(fā)展成為東南亞人工智能中心。英偉達、谷歌、亞馬遜等AI巨頭也宣布將在泰國投資。

而AudioX-Thai具有支持泰英混讀的能力，即使文本中包含英語，也能夠流暢合成，這無疑為各類AI應用軟硬件在東南亞多語言環(huán)境下的拓展提供了更廣闊的空間。

目前，登錄邏輯智能官網：https://luoji.cn/，點擊泰語男聲，即可試用生成效果。

校對柳寶慶

微博

我要評論

直播