11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買(mǎi)1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵?lái)騰訊云選購(gòu)吧!
下面的兩個(gè)有聲書(shū)演播片段,你能分辨是真人還是AI合成的嗎?實(shí)際上這兩個(gè)小說(shuō)片段都是AI合成的,方案來(lái)自于豆包語(yǔ)音模型團(tuán)隊(duì)。為了逼近一流真人主播的演播效果,豆包語(yǔ)音模型基于原有Seed-TTS框架進(jìn)一步加入上下文理解,最終實(shí)現(xiàn)了高表現(xiàn)力、高自然度、高語(yǔ)義理解的小說(shuō)演播效果。未來(lái)豆包語(yǔ)音模型會(huì)繼續(xù)探索前沿科技與業(yè)務(wù)場(chǎng)景的結(jié)合,追求更極致的“聽(tīng)”體驗(yàn)。
今日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布,豆包實(shí)時(shí)語(yǔ)音大模型今日正式上線,并在豆包App全量開(kāi)放,將App升級(jí)至7.2.0版本即可體驗(yàn)。豆包實(shí)時(shí)語(yǔ)音大模型是一款語(yǔ)音理解和生成一體化的模型,實(shí)現(xiàn)了端到端語(yǔ)音對(duì)話。豆包大模型團(tuán)隊(duì)也坦言,現(xiàn)階段的模型主要支持中文,其他語(yǔ)種尚未較好支持,中文范圍內(nèi),模型也僅支持小部分方言和地方口音的理解和表達(dá)。
歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、月之暗面Kimi多模態(tài)圖片理解模型API發(fā)布2025年1月15日,北京月之暗面科技有限公司正式發(fā)布了全新多模態(tài)圖片理解模型moonshot-v1-vision-preview,該模型在原有moonshot-v1系列的基礎(chǔ)上進(jìn)一步增強(qiáng)了多模態(tài)能力,旨在幫助Kimi更好地理解世界。通過(guò)模塊化設(shè)計(jì),MiniCPM-o2.6集成了多種強(qiáng)大組件,支持實(shí)時(shí)處理和多語(yǔ)言功能。
出門(mén)問(wèn)問(wèn)多模態(tài)大模型又添新備案!出門(mén)問(wèn)問(wèn)語(yǔ)音大模型「序列猴子」成功通過(guò)上海市生成式人工智能服務(wù)備案,這是出門(mén)問(wèn)問(wèn)繼「序列猴子」大模型完成相應(yīng)備案后的又一次成就。出門(mén)問(wèn)問(wèn)將繼續(xù)AIGC應(yīng)用場(chǎng)景中深耕,借助公司的領(lǐng)先及先發(fā)優(yōu)勢(shì),持續(xù)探索AIGC的技術(shù)與應(yīng)用邊界,為推動(dòng)我國(guó)生成式人工智能的建設(shè)與發(fā)展貢獻(xiàn)力量。
10月24日,趣丸科技宣布與香港中文大學(xué)聯(lián)合研發(fā)的語(yǔ)音大模型“MaskGCT”正式在Amphion系統(tǒng)中開(kāi)源,面向全球用戶(hù)開(kāi)放使用。區(qū)別于傳統(tǒng)TTS模型,該模型采用掩碼生成模型與語(yǔ)音表征解耦編碼的創(chuàng)新范式,在聲音克隆、跨語(yǔ)種合成、語(yǔ)音控制等任務(wù)中展現(xiàn)出卓越效果。以“趣丸千音”為代表的產(chǎn)品的出現(xiàn),將加速?lài)?guó)產(chǎn)短劇“走出去”,進(jìn)一步推動(dòng)中華文化在全球不同語(yǔ)境下的傳播。
近日灰豚數(shù)字人發(fā)布首個(gè)為直播生的AI語(yǔ)音大模型。該聲音大模型在我國(guó)獲得多個(gè)之最?;译郃I語(yǔ)音大模型還將推出獨(dú)立的AI配音品牌APP,做一個(gè)讓短視頻創(chuàng)作者用得好、讓人人用得起的大平臺(tái)。
9月5日,在外灘大會(huì)“大模型的創(chuàng)造力邊界與應(yīng)用想象力”論壇上,大模型創(chuàng)業(yè)企業(yè)西湖心辰正式發(fā)布并上線國(guó)內(nèi)首個(gè)端到端語(yǔ)音大模型“心辰Lingo”?!靶某絃ingo”實(shí)現(xiàn)了端到端語(yǔ)音技術(shù),在處理對(duì)話時(shí)直接理解語(yǔ)音,捕捉語(yǔ)氣、節(jié)奏和情緒,并進(jìn)行語(yǔ)音回復(fù),減少了信息處理過(guò)程中的損失,讓“機(jī)器”更懂人。西湖心辰已獲得湯姆貓、藍(lán)馳創(chuàng)投、凱泰資本、百度風(fēng)投、西湖科創(chuàng)投,西湖教育基金會(huì)可持續(xù)發(fā)展平臺(tái)等知名機(jī)構(gòu)數(shù)千萬(wàn)美金投資。
歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、Anthropic發(fā)布企業(yè)版AI助手ClaudeEnterpriseAnthropic最近推出了企業(yè)級(jí)AI助手ClaudeEnterprise,旨在幫助企業(yè)提升工作效率,利用內(nèi)部知識(shí)資產(chǎn)。最新發(fā)布的Qwen2-VL視覺(jué)語(yǔ)言模型在多項(xiàng)評(píng)測(cè)中表現(xiàn)優(yōu)異,超越業(yè)界領(lǐng)先的閉源模型。
社交平臺(tái)SoulApp語(yǔ)音大模型再次升級(jí),上線自研端到端全雙工語(yǔ)音通話大模型,具備超低交互延遲、快速自動(dòng)打斷、超真實(shí)聲音表達(dá)和情緒感知理解能力等特點(diǎn),能夠直接理解豐富的聲音世界,支持超擬人化的多風(fēng)格語(yǔ)言,實(shí)現(xiàn)更接近生活日常的交互對(duì)話和“類(lèi)真人”的情感陪伴體驗(yàn)。Soul自研的端到端語(yǔ)音通話大模型能力已上線旗下“異世界回響”實(shí)時(shí)通話場(chǎng)景,并將在后續(xù)拓展至AI茍蛋等多個(gè)AI陪伴、AI互動(dòng)場(chǎng)景。Soul將持續(xù)推進(jìn)多模態(tài)端到端大模型能力建設(shè)和應(yīng)用落地,以AI輔助社交、提升關(guān)系建立的質(zhì)量和效率的同時(shí),構(gòu)建人機(jī)交互新場(chǎng)景,讓用戶(hù)可以與AI進(jìn)行更加有溫度、沉浸、趣味的互動(dòng)交流,不斷創(chuàng)新社交體驗(yàn)。
和喜歡的虛擬人實(shí)時(shí)通話是一種什么樣的體驗(yàn)?近日,社交平臺(tái)SoulApp語(yǔ)音生成大模型上線,同時(shí)自研語(yǔ)音大模型“伶?zhèn)悺闭缴?jí),現(xiàn)階段,Soul語(yǔ)音大模型“伶?zhèn)悺卑苏Z(yǔ)音生成大模型、語(yǔ)音識(shí)別大模型、語(yǔ)音對(duì)話大模型、音樂(lè)生成大模型等,可支持真實(shí)音色生成、語(yǔ)音DIY、多語(yǔ)言切換、多情感擬真人實(shí)時(shí)對(duì)話等能力?!傲?zhèn)悺币褢?yīng)用于Soul“AI茍蛋”、站內(nèi)狼人游戲“狼人魅影”AI語(yǔ)音實(shí)時(shí)互動(dòng)、獨(dú)立新產(chǎn)品“異世界回響”等場(chǎng)景。”基于對(duì)社交場(chǎng)景的深刻理解,Soul將圍繞用戶(hù)的實(shí)際使用場(chǎng)景和核心社交需求,不斷提升技術(shù)能力,從AI推薦關(guān)系到AI輔助對(duì)話,從降低表達(dá)門(mén)檻到提升互動(dòng)體驗(yàn),推進(jìn)AIGC技術(shù)與社交場(chǎng)景的深度融合,實(shí)現(xiàn)AI原生社交場(chǎng)景創(chuàng)新。