无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

AI日報：SD 3宣布開源；中文語音AIChatTTS官網(wǎng)上線；Veo支持單圖生成視頻；ElevenLabs推多樣化AI音頻模型

2024-06-03 16:14 · 稿源：站長之家

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

新鮮AI產(chǎn)品點擊了解：https://top.aibase.com/

1、抖音：將打擊使用AI技術(shù)P圖侮辱他人等行為

抖音發(fā)布公告表示嚴(yán)厲打擊網(wǎng)絡(luò)暴力行為，已處置162件網(wǎng)暴輿情，警示教育施暴者近70萬個。建立網(wǎng)絡(luò)暴力線索反饋機制，提供一鍵防網(wǎng)暴功能保護用戶安全。用戶可申請法律咨詢服務(wù)保護自身權(quán)益。

【AiBase提要:】
?? 嚴(yán)厲打擊網(wǎng)絡(luò)暴力行為，處理162件網(wǎng)暴輿情，警示教育施暴者近70萬個
?? 建立網(wǎng)絡(luò)暴力線索反饋機制，與公安機關(guān)合作打擊違法犯罪行為
?? 提供一鍵防網(wǎng)暴功能保護用戶安全，用戶可申請法律咨詢服務(wù)維護權(quán)益

2、Stability AI開源SD 3：6月12日可下載不可商用

我對Stability AI宣布Stable Diffusion3 Medium開放發(fā)布日期為6月12日的消息感到興奮。這款20億參數(shù)的SD3 Medium模型具有照片真實感、優(yōu)秀的排版效果和高性能，適合消費者系統(tǒng)和企業(yè)工作負載。Stable Diffusion3 Medium是Stability AI最新推出的產(chǎn)品，預(yù)計將為用戶帶來更加穩(wěn)定和高效的使用體驗。

【AiBase提要:】
?? 照片真實感: 克服手和臉上的常見工件，提供高質(zhì)量的圖像，無需復(fù)雜工作流程。
?? 排版優(yōu)秀: 在排版上獲得健壯的結(jié)果，優(yōu)于更大的最先進的模型。
?? 高性能: 優(yōu)化的大小和效率，非常適合消費者系統(tǒng)和企業(yè)工作負載。
詳情鏈接:https://stability.ai/stablediffusion3

3、英偉達發(fā)布數(shù)字人AI技術(shù)NVIDIA ACE 提升角色互動體驗

NVIDIA最近推出了名為Avatar Cloud Engine （ACE）的先進數(shù)字人AI技術(shù)，旨在提升游戲和虛擬世界中角色的互動體驗。該技術(shù)將游戲中的NPC賦予智能對話能力，實現(xiàn)自然、智能的交流，提升角色生動性和真實感。ACE技術(shù)可靈活部署在云端或本地設(shè)備，保證流暢高質(zhì)量的互動體驗，同時優(yōu)化神經(jīng)網(wǎng)絡(luò)以減少延遲，確保實時互動。這一技術(shù)有望在游戲開發(fā)和虛擬現(xiàn)實領(lǐng)域帶來革命性變革，拓展至客戶服務(wù)、教育和娛樂領(lǐng)域，提供更自然智能的表現(xiàn)。

【AiBase提要:】
??? 智能對話能力: ACE技術(shù)賦予游戲NPC真實對話能力，超越預(yù)設(shè)臺詞模式。
?? 語音和面部動畫生成: ACE利用AI技術(shù)生成真實回復(fù)，增強角色生動性和真實感。
?? 靈活部署和低延遲: ACE可在云端或本地設(shè)備部署，確保流暢高質(zhì)量互動體驗，減少延遲影響。

4、Claude 3全系已支持函數(shù)調(diào)用工具Tool use

Claude 3現(xiàn)在支持函數(shù)調(diào)用工具Tool use，使其能夠與外部工具和API進行交互，提供更動態(tài)和準(zhǔn)確的響應(yīng)。這項技術(shù)的發(fā)展展示了AI在提高工作效率和創(chuàng)新服務(wù)方式方面的巨大潛力。

【AiBase提要:】
??? 從非結(jié)構(gòu)化文本中提取結(jié)構(gòu)化數(shù)據(jù)，減少手動輸入工作量。
?? 自然語言請求轉(zhuǎn)換為結(jié)構(gòu)化API調(diào)用，簡化自助服務(wù)流程。
? 協(xié)調(diào)多個Claude子代理執(zhí)行細化任務(wù)，如自動協(xié)調(diào)會議時間。
詳情鏈接:https://docs.anthropic.com/en/docs/tool-use

5、英偉達推AI游戲助手G-Assist

G-Assist是英偉達的游戲AI助手，通過語音查詢回答游戲問題并個性化指導(dǎo)玩家。它能優(yōu)化PC設(shè)置、提出游戲性能建議，甚至超頻GPU。Nvidia展示的G-Assist展示了AI助手未來的可能性，盡管仍需謹(jǐn)慎態(tài)度。

【AiBase提要:】
? G-Assist是英偉達的游戲AI助手，可指導(dǎo)玩家完成游戲并配置最佳設(shè)置。
? 該助手可以通過語音查詢回答游戲中的問題，并根據(jù)屏幕上的情況進行個性化指導(dǎo)。
? 不僅可以優(yōu)化和調(diào)整PC設(shè)置，還可以為游戲性能提出建議，并甚至超頻GPU。

6、DeepMind視頻生成模型Veo支持從單個參考圖像生成視頻片段

Google DeepMind的Veo模型是一項創(chuàng)新的視頻生成模型，可以根據(jù)單個參考圖像生成視頻剪輯，并通過文本提示調(diào)整視覺風(fēng)格。該模型為創(chuàng)意產(chǎn)業(yè)和視頻制作領(lǐng)域帶來新可能性，但也提醒用戶注意不要分散注意力。

【AiBase提要:】
?? Veo模型支持從單個參考圖像生成視頻片段，并可調(diào)整視覺風(fēng)格。
?? 應(yīng)用包括實驗性工具VideoFX，用戶可體驗部分Veo模型功能。
?? Veo模型具有潛力根據(jù)圖像內(nèi)容和文本提示生成符合用戶要求的視頻剪輯。
詳情鏈接:https://blog.google/technology/ai/google-labs-video-fx-generative-ai/

7、一上線就爆火出圈！中文語音AI天花板ChatTTS官網(wǎng)上線

ChatTTS是一款備受關(guān)注的中文語音AI項目，上線不久就引起轟動。用戶可以通過ChatTTS實現(xiàn)文字轉(zhuǎn)語音、實時語音對話等功能，同時具有多語言支持和細粒度控制等特點。該項目適用于多種場景，包括電商直播、自媒體、在線教育和客服服務(wù)等。

【AiBase提要:】
?? 文字轉(zhuǎn)語音、實時語音對話功能
?? 多語言支持和中英文混合表現(xiàn)
?? 多說話人支持和大規(guī)模訓(xùn)練數(shù)據(jù)應(yīng)用
詳情鏈接:https://chattts.com/

8、ControlNet作者推新項目Omost 一句話變構(gòu)圖小作文

Omost是一個革新性的圖像生成項目，通過簡單的提示詞就能生成詳細且準(zhǔn)確的圖像，極大地簡化了圖像描述的過程。用戶只需輸入簡單提示詞，即可獲得高質(zhì)量、符合預(yù)期的圖像。同時，Omost具有自動擴展提示詞、高靈活性和圖像位置編碼等優(yōu)點，為圖像生成提供了強大的工具支持。

【AiBase提要：】
? 很短的提示詞就可以生成非常詳細并且空間表現(xiàn)很準(zhǔn)確的圖片
? 高靈活性，保留圖像布局，一句提示詞即可修改元素
? 提供詳細描述，支持復(fù)雜圖像生成，應(yīng)用于AI繪畫、廣告創(chuàng)意等領(lǐng)域
項目頁:https://top.aibase.com/tool/omost
試玩地址:https://huggingface.co/spaces/lllyasviel/Omost

9、ElevenLabs推出創(chuàng)新AI音頻模型

ElevenLabs最近推出了一款創(chuàng)新的AI音頻模型，可以通過文本提示生成各種音效、短樂器曲目、音景和角色聲音，為內(nèi)容創(chuàng)作者、視頻游戲開發(fā)者和電影電視制片廠帶來巨大福音。這項技術(shù)極大簡化了音頻內(nèi)容創(chuàng)作過程，提高創(chuàng)作效率，拓展創(chuàng)意空間。

【AiBase提要:】
?? 文本到音頻轉(zhuǎn)換: 用戶輸入文本提示，AI生成相應(yīng)音效和音樂。
?? 多樣性: 能生成各種音效滿足不同場景需求。
?? 角色聲音生成: 為動畫、游戲或影視作品中不同角色創(chuàng)造獨特聲音。
詳情鏈接:https://top.aibase.com/tool/elevenlabs-text-to-sound-effects

10、PixVerse發(fā)布運動筆刷功能Magic Brush 比Runway更方便和直觀

PixVerse最新推出的運動筆刷功能Magic Brush極大提升了產(chǎn)品的可用性和用戶體驗，為動畫和動態(tài)圖像創(chuàng)作帶來了靈活性和高效性。用戶可以通過手繪箭頭自定義圖像區(qū)域的運動方向和距離，實現(xiàn)更精確的動態(tài)效果控制。操作簡便直觀，無需復(fù)雜學(xué)習(xí)曲線，提高了創(chuàng)意表達空間和工作效率。

【AiBase提要:】
? 自定義運動方向和距離，精確控制動態(tài)效果
?? 操作簡便直觀，提升用戶友好度和創(chuàng)意表達空間
?? 簡化動畫制作流程，提高工作效率和創(chuàng)作速度
詳情鏈接:https://top.aibase.com/tool/pixverse

11、Nvidia發(fā)布GeForce RTX增強版，為AI PC數(shù)字助手提供支持

Nvidia在Computex展會上推出了新的RTX技術(shù)，為新的GeForce RTX AI筆記本電腦提供動力，同時推出Project G-Assist技術(shù)演示為PC游戲和應(yīng)用提供上下文感知的幫助。此外，Nvidia ACE數(shù)字人物平臺首次亮相，為數(shù)字人物提供支持。這些技術(shù)加速了500多個PC應(yīng)用和游戲以及200多個OEM筆記本設(shè)計，為超過1億的RTX AI PC用戶帶來下一代AI動力體驗。

【AiBase提要:】
? Nvidia推出新的RTX技術(shù)，為GeForce RTX AI筆記本電腦提供動力
? Project G-Assist技術(shù)演示為PC游戲和應(yīng)用提供上下文感知的幫助
? Nvidia ACE數(shù)字人物平臺首次亮相，為數(shù)字人物提供支持

12、麥肯錫調(diào)查顯示：生成式AI應(yīng)用大中華區(qū)增長最快

生成式AI應(yīng)用在大中華區(qū)和亞太地區(qū)蓬勃發(fā)展，65%受訪者經(jīng)常使用生成式AI并已開始產(chǎn)生商業(yè)價值。企業(yè)主要通過使用現(xiàn)成產(chǎn)品、與AI廠商合作微調(diào)模型或自主開發(fā)產(chǎn)品三種方式應(yīng)用生成式AI。應(yīng)用場景主要包括文本、代碼、音頻、視頻、圖片等生成能力，隨著多模態(tài)大模型的出現(xiàn)，應(yīng)用場景將進一步擴大【AiBase提要:】

?? 生成式AI應(yīng)用增長：大中華區(qū)和亞太地區(qū)成為增長最快地區(qū)，原生數(shù)字人口使用頻繁是主要原因。
?? 企業(yè)應(yīng)用方式：現(xiàn)成產(chǎn)品使用、與AI廠商合作微調(diào)模型、自主開發(fā)產(chǎn)品三種方式。
?? 應(yīng)用場景擴大：生成式AI功能與應(yīng)用場景掛鉤，包括文本、代碼、音頻、視頻、圖片等生成能力，隨著多模態(tài)大模型出現(xiàn)，應(yīng)用場景將進一步擴大。

13、字節(jié)跳動旗下 AI 助手豆包推出PC客戶端、瀏覽器插件版本

作為字節(jié)跳動旗下 AI 助手豆包推出PC客戶端和瀏覽器插件版本，為用戶提供了更多便捷的AI功能體驗。用戶可以通過豆包實現(xiàn)快捷劃詞翻譯、AI搜索、一鍵常駐桌面等功能，同時還支持網(wǎng)頁與視頻總結(jié)、寫作和文本修改等功能。豆包的AI大模型系列涵蓋了多種功能模型，為用戶提供全面的AI輔助服務(wù)。

【AiBase提要:】
?? 豆包PC客戶端版本支持快捷劃詞翻譯、AI搜索、一鍵常駐桌面等功能
?? 插件版提供一鍵總結(jié)網(wǎng)頁與視頻、寫作和文本修改等功能
?? 豆包大模型系列包括豆包通用模型Pro、角色扮演模型、語音合成模型等，提供多樣化的AI功能

14、沙特阿美投資中國AI初創(chuàng)企業(yè)智譜AI

這篇文章報道了沙特阿美旗下的Prosperity7 投資了中國生成式人工智能初創(chuàng)企業(yè)智譜AI，使其估值達到 30 億美元。這一投資不僅為智譜AI帶來了資金支持，也有助于其在國際市場上拓展。智譜AI在人工智能領(lǐng)域的發(fā)展勢頭強勁，受到國際資本關(guān)注。

【AiBase提要:】
?? 智譜AI獲得沙特阿美旗下Prosperity7 的 4 億美元投資，估值達 30 億美元。
?? 智譜AI是清華大學(xué)計算機系技術(shù)成果轉(zhuǎn)化公司，由唐杰教授領(lǐng)銜，在生成式人工智能領(lǐng)域取得顯著成就。
?? 智譜AI曾獲得超過 25 億元人民幣融資，參與方包括多家知名機構(gòu)和公司。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

薦AI日報：ChatGPT重磅上線圖像庫功能；白嫖！Veo2登陸谷歌AI Studio；螞蟻百寶箱推“MCP專區(qū)”

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、報道稱字節(jié)跳動整合 AI 研發(fā)團隊，AI Lab 即將并入 Seed字節(jié)跳動正在進行AI研發(fā)團隊的整合，將獨立的字節(jié)AI Lab并入Seed團隊。這一舉措體現(xiàn)了字節(jié)在AI領(lǐng)域戰(zhàn)略布局的調(diào)整，旨在進?

?字節(jié)跳動 ?AI研發(fā) ?AI
AI日報：即夢3.0內(nèi)測直出2K商業(yè)海報；ChatGPT又更新圖片生成功能；餓了么推“AI入駐智能經(jīng)理”

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。7、Genspark發(fā)布自動化AI代理SuperAgent具備自主思考、調(diào)用工具的能力Genspark最近推出了其全新的自動化AI代理SuperAgent，憑借其強大的自主思考和任務(wù)執(zhí)行能力，迅速成為行業(yè)的焦點。用戶只需輸入感興趣的主題，系統(tǒng)便能?

?人工智能 ?圖像生成 ?AI產(chǎn)品
薦AI日報：Kimi全新音頻基礎(chǔ)模型Kimi-Audio；階躍星辰開源圖像編輯模型Step1X-Edit；?夸克AI超級框上線 “拍照問夸克”

本期AI日報聚焦多項AI技術(shù)突破與應(yīng)用：1)Moonshot AI推出開源音頻模型Kimi-Audio，基于13億小時訓(xùn)練數(shù)據(jù)，支持語音識別等任務(wù)；2)階躍星辰開源圖像編輯模型Step1X-Edit，展現(xiàn)強大生成能力；3)夸克AI上線"拍照問夸克"功能，實現(xiàn)視覺問答；4)蘋果iOS18.5將在中國推送，帶來智能功能；5)谷歌發(fā)布601個生成式AI應(yīng)用案例，覆蓋多行業(yè)；6)微軟推出深度整合Windows的UFO2自動化系統(tǒng)；7)OpenAI升級ChatGPT至GPT-4o版本，提升STEM領(lǐng)域能力；8)Ema公司推出高性價比語言模型EmaFusion；9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型；10)LemonAI推出實時音視頻數(shù)字人產(chǎn)品Slice Live。此外，國內(nèi)方面，智譜與生數(shù)科技達成戰(zhàn)略合作推動大模型發(fā)展，寶馬中國宣布新車將接入DeepSeek技術(shù)。

?AI日報 ?音頻技術(shù) ?開源模型
薦AI日報：智譜開源32B/9B系列GLM模型并啟用Z.ai域名；OpenAI發(fā)布GPT-4.1系列模型；阿里魔搭上線MCP廣場

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、智譜AI啟用全新域名Z.ai 并開源32B/9B 系列 GLM 模型智譜技術(shù)團隊近期宣布開源32B和9B系列的GLM模型，并推出全新交互體驗平臺Z.ai。這些模型遵循MIT許可協(xié)議，支持商業(yè)用途，提升了

?人工智能 ?開源模型 ?GLM模型
ChatGPT上線圖庫功能：可管理AI生成圖片

快科技4月16日消息，據(jù)報道，OpenAI近日宣布將為ChatGPT推出全新的Image Library圖庫功能，該功能將幫助用戶更高效地管理和查看AI生成的圖像。這項創(chuàng)新功能將逐步向所有用戶開放，包括移動端和網(wǎng)頁端的免費版、Plus版及Pro版用戶。新功能的設(shè)計充分考慮了用戶體驗的便捷性。用戶只需點擊ChatGPT側(cè)邊欄的Library入口，就能進入一個直觀的圖像網(wǎng)格界面。在這個界面中，用戶可以輕?

?OpenAI ?ChatGPT ?Image
薦AI日報：阿里新模型Qwen3即將來襲；GitHub開源MCP服務(wù)器；Runway發(fā)布Gen-4 Turbo

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、Qwen3即將來襲:阿里云新模型相關(guān)支持已正式合并至vLLM代碼庫阿里云的Qwen3模型即將發(fā)布，標(biāo)志著其在AI領(lǐng)域的又一重要進展。新推出的AI聽歌報告能夠精準(zhǔn)識別用戶音樂偏好，場景

?人工智能 ?阿里云 ?Qwen3
薦AI日報：通義千問Qwen3重磅發(fā)布；抖音AI搜索能力開放；ChatGPT 搜索新增網(wǎng)購功能；Suno V4.5版本將發(fā)布

本期AI日報重點內(nèi)容： 1. 通義千問發(fā)布Qwen3大模型，在代碼、數(shù)學(xué)和通用能力方面表現(xiàn)突出，支持兩種思考模式并開源多個模型權(quán)重 2. 抖音開放AI搜索能力接口，為第三方應(yīng)用提供豐富內(nèi)容資源 3. ChatGPT新增網(wǎng)購功能，通過對話獲取個性化商品推薦 4. Suno AI即將推出V4.5版本，提升音樂生成真實度 5. Simular AI登陸macOS，打造本地化智能助手 6. 暗月之面開源Kimi-VL模型，可處理文本、圖像和視頻 7. UCLA與Meta推出d1框架，提升大語言模型推理速度 8. 通義靈碼上線Qwen3編程智能體 9. Gen-4References圖像生成技術(shù)驚艷亮相 10. Hugging Face推出可編程機械臂SO-101 11. Windsurf推出全新品牌標(biāo)志 12. Ollama全面支持Qwen3模型本地部署

?人工智能 ?大型語言模型 ?Qwen3
薦AI日報：小米首個推理大模型開源Xiaomi MiMo；快手上線AI筆記工具“喵記多”；騰訊拆分AI團隊

本文匯總了AI領(lǐng)域最新動態(tài)：1)小米開源70億參數(shù)大模型Xiaomi MiMo，在數(shù)學(xué)推理和代碼競賽中超越OpenAI和阿里模型；2)快手推出AI筆記工具"喵記多"，簡化筆記管理；3)Luma AI發(fā)布電影級鏡頭控制API，降低視頻生成門檻；4)騰訊重組AI團隊，加大語言模型研發(fā)投入；5)Anthropic為Claude引入新語音"Glassy"；6)谷歌NotebookLM新增50+語言音頻概述功能；7)xAI將發(fā)布Grok3.5模型；8)Meta推出獨立AI助手應(yīng)用挑戰(zhàn)ChatGPT；9)OpenAI緊急修復(fù)GPT-4o"諂媚"問題；10)Mac本地AI助手Simular升級隱私保護；11)CameraBench項目幫助AI理解鏡頭運動；12)谷歌推出個性化語言學(xué)習(xí)AI工具。

?人工智能 ?Xiaomi ?MiMo
薦AI日報：Vidu Q1正式上線；MCP SDK 正式支持流式 HTTP；抖音一季度封禁AI黑產(chǎn)賬號260萬個

本文介紹了AI領(lǐng)域多項重要進展：1)MCP SDK支持流式HTTP協(xié)議，提升開發(fā)效率；2)Vidu Q1視頻生成模型上線，提供專業(yè)級視覺體驗；3)馬斯克計劃籌資250億美元開發(fā)Colossus 2超級計算機；4)Sand AI開源MAGI-1視頻生成模型；5)電商AI助手Add To Cart AI優(yōu)化購物體驗；6)Anthropic發(fā)布Claude Code編程指南；7)真我推出支持32種語言的AI翻譯耳機；8)2025年AI視頻企業(yè)TOP20榜單發(fā)布；9)清華GLM大模型免費開放；10)AI面試作弊工具引爭議；11)抖音AI治理封禁260萬違規(guī)賬號；12)全球首款具備嗅覺的機器人問世。這些創(chuàng)新展示了AI技術(shù)在視頻生成、編程輔助、電商、翻譯等領(lǐng)域的快速發(fā)展與應(yīng)用潛力。

?人工智能 ?開發(fā)者工具 ?技術(shù)趨勢
阿里開源通義新模型：指定首尾圖片生成視頻

快科技4月18日消息，據(jù)報道，阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面，智能生成720p高清過渡視頻，為視頻創(chuàng)作帶來全新可能。該模型通過先進的深度學(xué)習(xí)算法，能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后，模型會智能分析畫面中的視覺元素，包括物體形?

?阿里巴巴 ?通義萬相 ?視頻生成技術(shù)

熱文

3 天
7天

站長商機

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM