近日,階躍星辰在官方公眾號(hào)上宣布了一項(xiàng)重大突破——推出Step-1o千億參數(shù)端到端語(yǔ)音大模型。該模型被譽(yù)為“國(guó)內(nèi)首個(gè)千億參數(shù)端到端語(yǔ)音大模型”,標(biāo)志著我國(guó)在語(yǔ)音技術(shù)領(lǐng)域取得了新的里程碑。
據(jù)階躍星辰介紹,傳統(tǒng)的語(yǔ)音模型通常采用級(jí)聯(lián)方案,即先將用戶輸入的語(yǔ)音信息轉(zhuǎn)化為文本,再進(jìn)行二次轉(zhuǎn)化以生成語(yǔ)音輸出。這種方案不僅過(guò)程繁瑣,降低了傳輸效率,而且在轉(zhuǎn)化過(guò)程中容易折損掉包括情緒在內(nèi)的關(guān)鍵信息。這導(dǎo)致傳統(tǒng)語(yǔ)音模型存在時(shí)延長(zhǎng)、反應(yīng)慢、回答質(zhì)量和智能水平不足,以及情感表達(dá)空洞刻板等缺陷。
而階躍星辰推出的Step-1o模型則采用了端到端的語(yǔ)音方案,實(shí)現(xiàn)了語(yǔ)音理解和生成的一體化。這一創(chuàng)新設(shè)計(jì)不僅提升了模型的智商上限,還使其能夠更好地理解和表達(dá)情感,從而克服了傳統(tǒng)語(yǔ)音模型的諸多缺陷。
Step-1o千億參數(shù)端到端語(yǔ)音大模型的發(fā)布,不僅展示了階躍星辰在語(yǔ)音技術(shù)領(lǐng)域的深厚實(shí)力,也為我國(guó)語(yǔ)音技術(shù)的發(fā)展注入了新的活力。未來(lái),隨著該模型的不斷優(yōu)化和應(yīng)用推廣,相信將為用戶帶來(lái)更加智能、高效和自然的語(yǔ)音交互體驗(yàn)。
-
語(yǔ)音交互
+關(guān)注
關(guān)注
3文章
286瀏覽量
28002 -
大模型
+關(guān)注
關(guān)注
2文章
2423瀏覽量
2640
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論