WhisperFusion官網(wǎng)體驗入口 AI實時語音轉(zhuǎn)文字在線使用地址

2024-01-31 08:32 · 稿源：站長之家用戶

WhisperFusion是一款基于WhisperLive和WhisperSpeech功能的產(chǎn)品，通過在實時語音轉(zhuǎn)文字流程中集成Mistral大型語言模型（LLM）來實現(xiàn)與AI的無縫對話。Whisper和LLM均經(jīng)過TensorRT引擎優(yōu)化，以最大程度提升性能和實時處理能力。WhisperSpeech則使用torch.compile來優(yōu)化。產(chǎn)品定位于提供超低延遲的AI實時對話體驗。

截屏2024-01-31 上午8.35.22.png

點擊前往WhisperFusion官網(wǎng)體驗入口

需求人群：

用戶可以通過使用預(yù)構(gòu)建的TensorRT-LLM Docker容器快速開始與[WhisperFusion](https://top.aibase.com/tool/whisperfusion)進行交互。同時，也可以構(gòu)建適用于不同cuda架構(gòu)的docker鏡像。

使用場景示例：

在網(wǎng)站上與WhisperFusion的AI進行實時對話
通過WhisperFusion的小程序進行語音轉(zhuǎn)文字交互
使用WhisperFusion插件在桌面客戶端上進行實時語音識別

產(chǎn)品特色：

實時語音轉(zhuǎn)文字：利用OpenAI WhisperLive實現(xiàn)實時語音轉(zhuǎn)文字。
大型語言模型集成：整合Mistral大型語言模型，增強對轉(zhuǎn)錄文本的理解和語境。
TensorRT優(yōu)化：LLM和Whisper均優(yōu)化為TensorRT引擎，確保高性能和低延遲處理。
torch.compile：WhisperSpeech使用torch.compile來加速推斷，通過將PyTorch代碼即時編譯為優(yōu)化內(nèi)核，使PyTorch代碼運行更快。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

WhisperFusion

鴻蒙版QQ迎重大更新：語音轉(zhuǎn)文字等十大功能上線

華為終端云宣布鴻蒙版QQ迎來重大更新，新增語音轉(zhuǎn)文字、消息合并轉(zhuǎn)發(fā)等10項實用功能。鴻蒙生態(tài)近期取得突破性進展：原生應(yīng)用超2萬個，開發(fā)者超720萬，生態(tài)設(shè)備超10億臺。余承東表示2025年將實現(xiàn)10萬應(yīng)用目標，標志著生態(tài)成熟。此次QQ9.1.50版本更新包含空間相冊一鍵瀏覽、群作業(yè)公告查看、表情收藏發(fā)送等優(yōu)化，持續(xù)完善社交體驗。目前鴻蒙版QQ已支持單聊、群聊、視頻通話等基礎(chǔ)功能，其他功能正在迭代中。

?鴻蒙生態(tài) ?華為終端 ?QQ更新
蘋果Siri團隊大換血！Vision Pro班底全面上馬

蘋果正對Siri團隊進行大規(guī)模重組，由新任工程主管Mike Rockwell主導(dǎo)改革。Rockwell從Vision Pro項目調(diào)來核心成員，重組了語音、理解、性能等關(guān)鍵團隊。Vision Pro項目副手Ranjit Desai將負責Siri主要工程事務(wù)，Olivier Gutknecht接手用戶體驗設(shè)計。此次重組旨在簡化開發(fā)流程，提升Siri功能。蘋果AI/ML團隊此前因管理混亂被員工戲稱為"AI/less"。業(yè)內(nèi)建議蘋果應(yīng)考慮重塑Siri品牌形象，推出全新數(shù)字助手以擺脫負面評價。

?蘋果 ?Siri重組 ?用戶體驗
蘋果要 all in 智能眼鏡？Vision Pro 2 也已準備就緒

蘋果已著手開發(fā)輕便且低價的 AR 智能眼鏡，同時也在開發(fā)第二代頭顯設(shè)備 Vision Pro。

?蘋果AR眼鏡 ?VisionPro ?AR眼鏡
蘋果Vision Air曝光：采用鈦金屬設(shè)備更輕

快科技4月17日消息，當前Vision Pro 256G版本售價為29999元起，設(shè)備重量為600克至650克，根據(jù)遮光罩和頭帶配置不同可能有所差異，其單獨的電池重量為353克，不少線下體驗者表示，該頭顯的重量影響其體驗舒適度。蘋果也意識到了這個問題，其下一代頭顯的研發(fā)重點是減重”，有博主在社交平臺上爆料稱，蘋果正在研發(fā)全新頭顯Vision Air，其特點是采用輕量化設(shè)計，同時帶來午夜?

?蘋果 ?Vision ?Pro
vivo申請注冊MR頭顯商標首款產(chǎn)品vivo Vision已亮相

近日，維沃移動通信有限公司申請注冊多枚VIVOAI眼鏡”VIVOAR”VIVOMRHeadset”VIVOMR智能眼鏡”商標，國際分類均為科學(xué)儀器，當前商標狀態(tài)均為等待實質(zhì)審查。在前不久的博鰲亞洲論壇上，vivoVision產(chǎn)品已經(jīng)首次亮相，這是vivo首款MR混合現(xiàn)實頭顯設(shè)備。vivo還已經(jīng)啟動機器人領(lǐng)域的技術(shù)專家招聘工作，確認成立機器人LAB。

?VIVO ?混合現(xiàn)實 ?MR眼鏡
曝蘋果Vision Pro2有望年內(nèi)上市性能和設(shè)計上有望全面升級

有關(guān)蘋果第二代XR頭顯產(chǎn)品的消息不斷傳出。該產(chǎn)品已進入規(guī)模生產(chǎn)階段，有望在年內(nèi)正式發(fā)布。市場期待蘋果能夠為用戶帶來更多創(chuàng)新的產(chǎn)品和服務(wù)。

?蘋果XR頭顯 ?Vision ?Pro2
蘋果兩款Vision Pro開發(fā)中！一款更輕更便宜、一款近乎零延遲

快科技4月14日消息，據(jù)媒體報道，蘋果正在開發(fā)兩款新的Vision Pro設(shè)備，一款更輕、更便宜，另一款則主打近乎零延遲的體驗。Mark Gurman透露，蘋果正在開發(fā)一款比當前Vision Pro更輕、更便宜的設(shè)備。當前Vision Pro起售價高達3499美元，重量約600-650克，而新款設(shè)備將針對普通消費者，解決重量和價格兩大問題。具體價格尚未披露，但有消息稱其價格可能與高端iPhone相當，預(yù)計在1600美

?蘋果 ?Vision ?Pro
vivo Vision混合現(xiàn)實頭顯宣布下半年發(fā)布

vivo宣布其MR設(shè)備vivo Vision將于今年下半年正式發(fā)布，引發(fā)市場廣泛關(guān)注。該設(shè)備可能與vivo X300系列手機同步上市，形成產(chǎn)品矩陣效應(yīng)。Vision頭顯設(shè)計借鑒夏普Vision Pro風格，采用曲面拋光鏡片，集成了多顆攝像頭，但具體技術(shù)參數(shù)尚未公開。此布局被視為vivo戰(zhàn)略轉(zhuǎn)型的關(guān)鍵一步，旨在通過MR技術(shù)強化實時空間計算能力，為基礎(chǔ)的未來機器人物聯(lián)網(wǎng)應(yīng)用奠定基礎(chǔ)。vivo計劃打造一套視覺感知系統(tǒng)，重點提升機器人的視覺捕捉、處理、理解、空間建模及邊緣計算等五大維度的智能化水平。這一戰(zhàn)略定位依賴于依圖科技在AI大模型與混合現(xiàn)實技術(shù)領(lǐng)域的積累，vivo加速布局機器人賽道的相關(guān)落地措施已進入實質(zhì)推進階段。伴隨Vision頭顯的發(fā)布，行業(yè)或?qū)⒂瓉硇乱惠喖夹g(shù)競爭。這被寄予厚望的設(shè)備能否在空間計算領(lǐng)域?qū)崿F(xiàn)突破，仍需等待市場驗證。

?vivo ?X200系列 ?MR頭顯
Antropic加入“AI語音助手”賽道，能追上OpenAI、谷歌們嗎？

隨著 AI 語音產(chǎn)品的出現(xiàn)，人們對其模仿他人說話風格的擔憂也在加劇……

?Anthropic ?AI語音助手 ?Claude
蘋果AI廣告具有誤導(dǎo)性：蘋果官網(wǎng)頁面緊急調(diào)整

蘋果官網(wǎng)近日移除了Apple Intelligence頁面的"Available Now"標識。此前廣告監(jiān)管部門NAD認定蘋果AI廣告具有誤導(dǎo)性，因未說明部分AI功能僅限iPhone16系列使用。蘋果證實將推遲發(fā)布新一代AI語音助手Siri，預(yù)計明年推出。新版Siri可訪問用戶郵件、消息等數(shù)據(jù)，但開發(fā)進度慢于預(yù)期。據(jù)悉蘋果內(nèi)部對AI進展不滿，CEO庫克已調(diào)整管理層，由Vision Pro負責人Mike Rockwell接管Siri業(yè)務(wù)。

?蘋果 ?人工智能 ?Siri

熱文

3 天
7天

1

累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

站長商機

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘