自研端到端語(yǔ)音通話大模型上線，Soul App語(yǔ)音大模型再升級(jí)

2024-09-03 17:00 · 稿源：站長(zhǎng)之家用戶

近日，社交平臺(tái)Soul App（以下簡(jiǎn)稱“Soul”）語(yǔ)音大模型再次升級(jí)，上線自研端到端全雙工語(yǔ)音通話大模型，具備超低交互延遲、快速自動(dòng)打斷、超真實(shí)聲音表達(dá)和情緒感知理解能力等特點(diǎn)，能夠直接理解豐富的聲音世界，支持超擬人化的多風(fēng)格語(yǔ)言，實(shí)現(xiàn)更接近生活日常的交互對(duì)話和“類真人”的情感陪伴體驗(yàn)。目前，Soul自研的端到端語(yǔ)音通話大模型能力已上線旗下“異世界回響”實(shí)時(shí)通話場(chǎng)景（內(nèi)測(cè)中），并將在后續(xù)拓展至AI茍蛋等多個(gè)AI陪伴、AI互動(dòng)場(chǎng)景。

自 2016 年上線，Soul一直致力于以創(chuàng)新的技術(shù)方案和產(chǎn)品設(shè)計(jì)，實(shí)現(xiàn)社交體驗(yàn)的拓展。 2020 年，Soul啟動(dòng)對(duì)AIGC的技術(shù)研發(fā)工作，系統(tǒng)推進(jìn)在智能對(duì)話、語(yǔ)音技術(shù)、虛擬人等AIGC關(guān)鍵技術(shù)能力研發(fā)工作，并推動(dòng)AI能力在社交場(chǎng)景的深度落地。

以AI升級(jí)社交的過(guò)程中，Soul的技術(shù)重點(diǎn)之一是致力于實(shí)現(xiàn)擬人化、自然化情感陪伴體驗(yàn)。其中，聲音是重要環(huán)節(jié)之一。作為傳遞信息和情感的重要媒介，聲音最能在溝通中賦予“情緒溫度”和“陪伴感”。特別是在社交場(chǎng)景中，情感化、低延遲、多風(fēng)格、類真實(shí)的聲音能力，可以打破“次元壁”，讓線上社交尤其是人機(jī)互動(dòng)中，也能實(shí)現(xiàn)真實(shí)生活場(chǎng)景聊天的自然流暢感和沉浸現(xiàn)場(chǎng)感，真正完成類現(xiàn)實(shí)生活化互動(dòng)場(chǎng)景中的交互體驗(yàn)。

因此，為給用戶帶來(lái)更好的情緒反饋和陪伴感，情緒理解、延遲問(wèn)題一直是Soul技術(shù)團(tuán)隊(duì)關(guān)注的焦點(diǎn)。

此前，Soul團(tuán)隊(duì)推出了自研的語(yǔ)音生成大模型、語(yǔ)音識(shí)別大模型、語(yǔ)音對(duì)話大模型、音樂(lè)生成大模型等語(yǔ)音大模型能力，支持真實(shí)音色生成、語(yǔ)音DIY、多語(yǔ)言切換、多情感擬真人實(shí)時(shí)對(duì)話等，目前已應(yīng)用于Soul “AI茍蛋”、站內(nèi)狼人游戲“狼人魅影”AI語(yǔ)音實(shí)時(shí)互動(dòng)、獨(dú)立新產(chǎn)品“異世界回響”等場(chǎng)景。

與國(guó)際最前沿的技術(shù)發(fā)展保持同頻，Soul持續(xù)完善自身語(yǔ)音技術(shù)能力積累，創(chuàng)新AI社交應(yīng)用體驗(yàn)。今年 7 月，在人工智能領(lǐng)域頂級(jí)的國(guó)際學(xué)術(shù)會(huì)議——國(guó)際人工智能聯(lián)合會(huì)議（International Joint Conference on Artificial Intelligence，IJCAI）舉辦的第二屆多模態(tài)情感識(shí)別挑戰(zhàn)賽（MER24）上，Soul 語(yǔ)音技術(shù)團(tuán)隊(duì)于SEMI（半監(jiān)督學(xué)習(xí)）賽道獲得第一名，在國(guó)際賽事舞臺(tái)上展現(xiàn)了Soul的前沿洞察和技術(shù)能力。

如今，自研端到端語(yǔ)音通話大模型的率先上線，再次證明了Soul在行業(yè)中扎實(shí)的技術(shù)能力積累。

區(qū)別于傳統(tǒng)的級(jí)聯(lián)方案，語(yǔ)音到語(yǔ)音的端到端建模，意味著語(yǔ)音交互體系的顛覆式升級(jí)，即不再需要從“語(yǔ)音識(shí)別、自然語(yǔ)言理解、語(yǔ)音生成”等多個(gè)環(huán)節(jié)流轉(zhuǎn)，直接語(yǔ)音輸入—語(yǔ)音輸出的端到端模型能夠最大程度實(shí)現(xiàn)信息無(wú)損傳遞，降低響應(yīng)延遲時(shí)間。

此次Soul自研的端到端語(yǔ)音通話大模型便具備超低交互延遲、快速自動(dòng)打斷、超真實(shí)聲音表達(dá)和豐富情緒感知理解能力的特點(diǎn)，支持更自然的人機(jī)交互體驗(yàn)。

在延遲方面，于實(shí)際應(yīng)用過(guò)程中，用戶體驗(yàn)與“異世界回響”中虛擬人實(shí)時(shí)語(yǔ)音通話效果時(shí)，延遲時(shí)間少于行業(yè)平均水平，真正實(shí)現(xiàn)即時(shí)的AI交流和陪伴。

值得一提的是，端到端的語(yǔ)音語(yǔ)義理解和響應(yīng)以及更自然的語(yǔ)音指令控制，讓Soul語(yǔ)音通話大模型不僅能夠給予情感關(guān)懷、理解人聲情緒情感并給出有溫度的回應(yīng)，還能夠理解物理世界的聲音場(chǎng)景，模擬物理世界動(dòng)物聲音、理解多人聊天內(nèi)容，實(shí)現(xiàn)多風(fēng)格語(yǔ)言切換、文藝內(nèi)容創(chuàng)作和即興演唱，接近現(xiàn)實(shí)交流互動(dòng)場(chǎng)景需要。

接下來(lái)，Soul將持續(xù)推進(jìn)多模態(tài)端到端大模型能力建設(shè)和應(yīng)用落地，以AI輔助社交、提升關(guān)系建立的質(zhì)量和效率的同時(shí)，構(gòu)建人機(jī)交互新場(chǎng)景，讓用戶可以與AI進(jìn)行更加有溫度、沉浸、趣味的互動(dòng)交流，不斷創(chuàng)新社交體驗(yàn)。

（推廣）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長(zhǎng)傳媒平臺(tái)用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)，對(duì)本頁(yè)面內(nèi)容所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任，相關(guān)信息僅供參考。站長(zhǎng)之家將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。任何單位或個(gè)人認(rèn)為本頁(yè)面內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，可及時(shí)向站長(zhǎng)之家提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明（點(diǎn)擊查看反饋聯(lián)系地址）。本網(wǎng)站在收到上述法律文件后，將會(huì)依法依規(guī)核實(shí)信息，溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

相關(guān)推薦

關(guān)鍵詞：

何以“解憂”——Soul App“解憂房”，讓心事不再沉重

文章聚焦當(dāng)代年輕人面臨的心理壓力與情感困擾，介紹了Soul App上三種不同風(fēng)格的"解憂房"：劉健的"戀愛(ài)大師"以犀利分析見(jiàn)長(zhǎng)，提供直接解決方案；"德芬妮姑姑"營(yíng)造溫暖客廳氛圍，專注傾聽(tīng)與陪伴；"秋月老師"則開(kāi)設(shè)心理課堂，培養(yǎng)用戶自我覺(jué)察能力。這些線上空間通過(guò)匿名機(jī)制和語(yǔ)音互動(dòng)，為用戶提供情感支持、歸屬感和成長(zhǎng)機(jī)會(huì)，展現(xiàn)了Soul平臺(tái)在滿足都市青年心理需求方面的獨(dú)特價(jià)值，成為他們短暫停靠、獲取力量的心靈港灣。

?心理壓力 ?靈魂社交 ?情感支持
魅族Flyme AIOS 2宣布接入阿里云端到端大模型Qwen Omni

Flyme AIOS2系統(tǒng)引入全新設(shè)計(jì)的智能助手Aicy，其界面設(shè)計(jì)更具呼吸感與動(dòng)態(tài)效果，同時(shí)搭載升級(jí)后的思考引擎，可實(shí)現(xiàn)更精準(zhǔn)的語(yǔ)義理解和場(chǎng)景響應(yīng)。值得關(guān)注的是，該系統(tǒng)成為業(yè)內(nèi)首家接入阿里云自主研發(fā)的Qwen Omni云端到端大模型的操作系統(tǒng)，支持超低延遲的自然語(yǔ)音交互，并覆蓋多地

?魅族Note16 ?Flyme ?AIOS2
Soul App發(fā)起“職場(chǎng)妙計(jì)”活動(dòng)，幫助年輕人職場(chǎng)人際破冰

Soul App成為330萬(wàn)職場(chǎng)人的"深夜樹(shù)洞"，通過(guò)"職場(chǎng)妙計(jì)"等活動(dòng)幫助用戶突破職業(yè)困境。北京師范大學(xué)錢(qián)婧教授指出，建立在共同成長(zhǎng)基礎(chǔ)上的職場(chǎng)關(guān)系互助轉(zhuǎn)化率高達(dá)67%，遠(yuǎn)超物質(zhì)維系的12%。平臺(tái)用戶通過(guò)知識(shí)共享建立信任網(wǎng)絡(luò)，如某產(chǎn)品經(jīng)理分享的"敏捷開(kāi)發(fā)避坑指南"被下載超2萬(wàn)次，助其獲得跨部門(mén)推薦。Soul從社交工具進(jìn)化為成長(zhǎng)伙伴，通過(guò)群聊房"職場(chǎng)急診"等場(chǎng)景實(shí)現(xiàn)即時(shí)智慧流動(dòng)，重構(gòu)職場(chǎng)學(xué)習(xí)場(chǎng)景。AI技術(shù)匹配、社群關(guān)系、內(nèi)容養(yǎng)分共同培育適應(yīng)液態(tài)職場(chǎng)的生存能力，為探索者提供"數(shù)字地圖"，在連接中成就獨(dú)特價(jià)值軌跡。
阿丘科技李嘉悅：大模型驅(qū)動(dòng)的AI檢測(cè)范式變革——大模型、小模型、智能體的協(xié)同進(jìn)化

3月28日，由機(jī)器視覺(jué)產(chǎn)業(yè)聯(lián)盟主辦、慕尼黑展覽有限公司承辦的VisionChina2025機(jī)器視覺(jué)展在上海新國(guó)際博覽中心圓滿落幕。阿丘科技產(chǎn)品總監(jiān)李嘉悅在機(jī)器視覺(jué)及工業(yè)應(yīng)用研討會(huì)現(xiàn)場(chǎng)，圍繞“大模型驅(qū)動(dòng)的AI檢測(cè)范式變革:大模型、小模型與智能體的協(xié)同進(jìn)化”的主題，發(fā)表了精彩演講?！苯衲?，在這個(gè)快速變化的時(shí)代，我要補(bǔ)充一句:“AI工業(yè)視覺(jué)的格局正在加速變革，不會(huì)用大模型的將會(huì)被善用大模型的人淘汰。

?機(jī)器視覺(jué) ?AI檢測(cè) ?工業(yè)應(yīng)用
合合信息發(fā)布“大模型加速器 2.0”，助力大模型跨越“幻覺(jué)”障礙

近日，上海合合信息科技股份有限公司（簡(jiǎn)稱“合合信息”）TextIn“大模型加速器 2.0”版本正式上線，憑借其多維度升級(jí)，為降低大模型“幻覺(jué)”風(fēng)險(xiǎn)、推動(dòng)大模型精準(zhǔn)應(yīng)用提供了強(qiáng)大助力。訓(xùn)練數(shù)據(jù)是影響大模型“認(rèn)知能力”的關(guān)鍵，合合信息“大模型加速器 2.0”基于領(lǐng)先的智能文檔處理技術(shù)，從數(shù)據(jù)源頭入手，對(duì)復(fù)雜文檔的版式、布局和元素進(jìn)行精準(zhǔn)解析及結(jié)構(gòu)化處理，

?大模型加速器 ?合合信息 ?智能文檔處理
大模型時(shí)代的新燃料|標(biāo)貝科技推出大規(guī)模擬真多風(fēng)格語(yǔ)音合成數(shù)據(jù)集

本文探討了人工智能語(yǔ)音交互領(lǐng)域的發(fā)展現(xiàn)狀與挑戰(zhàn)。文章指出，大模型技術(shù)驅(qū)動(dòng)下語(yǔ)音交互應(yīng)用場(chǎng)景持續(xù)拓展，但面臨數(shù)據(jù)質(zhì)量、隱私合規(guī)等挑戰(zhàn)。當(dāng)前語(yǔ)音大模型訓(xùn)練需要TB至PB級(jí)數(shù)據(jù)，而傳統(tǒng)數(shù)據(jù)供給模式難以滿足需求。合成數(shù)據(jù)作為真實(shí)數(shù)據(jù)的重要補(bǔ)充，能通過(guò)參數(shù)化生成機(jī)制規(guī)避隱私風(fēng)險(xiǎn)，突破傳統(tǒng)數(shù)據(jù)在多樣性和場(chǎng)景覆蓋上的局限性。國(guó)內(nèi)外科技企業(yè)已開(kāi)始廣泛應(yīng)用合成數(shù)據(jù)訓(xùn)練AI模型，如Meta的LLaMA3和微軟的Phi-4模型。標(biāo)貝科技推出超大規(guī)模擬真多風(fēng)格語(yǔ)音合成數(shù)據(jù)集，包含上萬(wàn)小時(shí)數(shù)據(jù)，覆蓋中英混合場(chǎng)景，支持情感合成、風(fēng)格遷移等前沿任務(wù)，為虛擬偶像、數(shù)字人等元宇宙場(chǎng)景提供實(shí)時(shí)語(yǔ)音生成方案。該數(shù)據(jù)集基于32kHz高保真采樣率技術(shù)，在自然度、流暢度等方面達(dá)到行業(yè)領(lǐng)先水平。

?大模型技術(shù) ?人工智能變革 ?語(yǔ)音交互
奔馳新款CLA接入豆包大模型

4月22日，奔馳與火山引擎合作的首款國(guó)產(chǎn)純電車型CLA全球首發(fā)亮相。該車搭載奔馳自研MB.OS架構(gòu)，接入火山引擎大模型，支持個(gè)性化智能交互體驗(yàn)。智能系統(tǒng)可識(shí)別4種情緒并給予反饋，交互效率提升50%，喚醒僅需0.2秒。虛擬助手能解答百科問(wèn)題并協(xié)助車輛功能設(shè)置。這是雙方繼2024年8月達(dá)成AI戰(zhàn)略合作后落地的首款量產(chǎn)車型，結(jié)合生成式AI和大數(shù)據(jù)技術(shù)，為中國(guó)用戶打造更智能的用車體驗(yàn)。

?梅賽德斯-奔馳 ?全新純電長(zhǎng)軸距 ?CLA
迅雷一鍵即可完成大模型下載

近日，迅雷為提升用戶使用體驗(yàn)，讓用戶能夠更快更好地批量下載大模型所有文件，已針對(duì)大模型下載場(chǎng)景進(jìn)行了優(yōu)化，并上線了新版本插件，下載迅雷客戶端且在瀏覽器安裝迅雷插件即可使用。值得一提的是，在使用迅雷該插件功能創(chuàng)建任務(wù)時(shí)，將同時(shí)創(chuàng)建相對(duì)應(yīng)的文件夾，下載完成后，所有文件都將在一個(gè)文件夾中，相比傳統(tǒng)瀏覽器——需要用戶逐個(gè)手動(dòng)點(diǎn)擊下載圖標(biāo)并?

?迅雷 ?大模型下載 ?下載優(yōu)化
九為健康聯(lián)合華為云發(fā)布神農(nóng)中醫(yī)大模型智能體，解碼如何用大模型重構(gòu)“望聞問(wèn)切”

2025 年 4 月 11 日，在華為云生態(tài)大會(huì)上，浙江九為健康科技股份有限公司（以下簡(jiǎn)稱"九為健康"）正式發(fā)布基于華為云盤(pán)古大模型的"九為神農(nóng)中醫(yī)大模型智能體"。該解決方案依托AI技術(shù)，系統(tǒng)性攻克中醫(yī)藥研發(fā)周期長(zhǎng)、作用機(jī)制解析困難、個(gè)性化方案制定復(fù)雜等產(chǎn)業(yè)難題，通過(guò)智能化手段推動(dòng)中醫(yī)藥現(xiàn)代化進(jìn)程，為醫(yī)藥全產(chǎn)業(yè)鏈提供覆蓋研發(fā)、診療及健康管理的全流程智能服?
薦微信，OpenAI和Kimi想一起去了：大模型的盡頭依然還是社交平臺(tái)

AI圈最近彌漫著一股微妙的氣息。人們似乎不再熱議大語(yǔ)言模型的最新突破、以及AI應(yīng)用的無(wú)限可能時(shí)，一些代表著未來(lái)的AI巨頭，卻似乎正將目光投向互聯(lián)網(wǎng)那熟悉得不能再熟悉的角落——社交網(wǎng)絡(luò)與社區(qū)。近期的傳聞和動(dòng)作頗具代表性，在大洋彼岸，手握ChatGPT和Sora等王牌的OpenAI，據(jù)稱正內(nèi)部測(cè)試類X的社交功能，其CEO Sam Altman甚至在私下征求反饋；而在國(guó)內(nèi)，憑借長(zhǎng)文本能力

?AI社交網(wǎng)絡(luò) ?語(yǔ)言模型 ?OpenAI動(dòng)態(tài)

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

自研端到端語(yǔ)音通話大模型上線，Soul App語(yǔ)音大模型再升級(jí)

何以“解憂”——Soul App“解憂房”，讓心事不再沉重

魅族Flyme AIOS 2宣布接入阿里云端到端大模型Qwen Omni

Soul App發(fā)起“職場(chǎng)妙計(jì)”活動(dòng)，幫助年輕人職場(chǎng)人際破冰

阿丘科技李嘉悅：大模型驅(qū)動(dòng)的AI檢測(cè)范式變革——大模型、小模型、智能體的協(xié)同進(jìn)化

合合信息發(fā)布“大模型加速器 2.0”，助力大模型跨越“幻覺(jué)”障礙

大模型時(shí)代的新燃料|標(biāo)貝科技推出大規(guī)模擬真多風(fēng)格語(yǔ)音合成數(shù)據(jù)集

奔馳新款CLA接入豆包大模型

迅雷一鍵即可完成大模型下載

九為健康聯(lián)合華為云發(fā)布神農(nóng)中醫(yī)大模型智能體，解碼如何用大模型重構(gòu)“望聞問(wèn)切”

薦微信，OpenAI和Kimi想一起去了：大模型的盡頭依然還是社交平臺(tái)

熱文

全網(wǎng)最大的“AI色情網(wǎng)站”MrDeepfakes宣布永久關(guān)閉

馬斯克稱地球會(huì)被太陽(yáng)焚化，網(wǎng)友：有科學(xué)依據(jù)，但…

20周年紀(jì)念版iPhone迎來(lái)重大變革，全屏設(shè)計(jì)+屏下攝像頭

不顧特朗普的阻撓，??Uber繼續(xù)全球擴(kuò)張…攜手土耳其及中國(guó)企

今年第二次，亞馬遜的 Zoox 召回 270 輛無(wú)人駕駛出租車

全網(wǎng)最大的“AI色情網(wǎng)站”MrDeepfakes宣布永久關(guān)閉

馬斯克稱地球會(huì)被太陽(yáng)焚化，網(wǎng)友：有科學(xué)依據(jù)，但…

20周年紀(jì)念版iPhone迎來(lái)重大變革，全屏設(shè)計(jì)+屏下攝像頭

不顧特朗普的阻撓，??Uber繼續(xù)全球擴(kuò)張…攜手土耳其及中國(guó)企

今年第二次，亞馬遜的 Zoox 召回 270 輛無(wú)人駕駛出租車

站長(zhǎng)商機(jī)

自研端到端語(yǔ)音通話大模型上線，Soul App語(yǔ)音大模型再升級(jí)

熱文

站長(zhǎng)商機(jī)

自研端到端語(yǔ)音通話大模型上線，Soul App語(yǔ)音大模型再升級(jí)