无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > 抖音最新資訊  > 正文

    AI日報:SD 3宣布開源;中文語音AIChatTTS官網(wǎng)上線;Veo支持單圖生成視頻;ElevenLabs推多樣化AI音頻模型

    2024-06-03 16:14 · 稿源:站長之家

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

    新鮮AI產(chǎn)品點擊了解https://top.aibase.com/

    1、抖音:將打擊使用AI技術(shù)P圖侮辱他人等行為

    抖音發(fā)布公告表示嚴(yán)厲打擊網(wǎng)絡(luò)暴力行為,已處置162件網(wǎng)暴輿情,警示教育施暴者近70萬個。建立網(wǎng)絡(luò)暴力線索反饋機制,提供一鍵防網(wǎng)暴功能保護用戶安全。用戶可申請法律咨詢服務(wù)保護自身權(quán)益。

    【AiBase提要:】

    ?? 嚴(yán)厲打擊網(wǎng)絡(luò)暴力行為,處理162件網(wǎng)暴輿情,警示教育施暴者近70萬個

    ?? 建立網(wǎng)絡(luò)暴力線索反饋機制,與公安機關(guān)合作打擊違法犯罪行為

    ?? 提供一鍵防網(wǎng)暴功能保護用戶安全,用戶可申請法律咨詢服務(wù)維護權(quán)益

    2、Stability AI開源SD 3:6月12日可下載 不可商用

    我對Stability AI宣布Stable Diffusion3 Medium開放發(fā)布日期為6月12日的消息感到興奮。這款20億參數(shù)的SD3 Medium模型具有照片真實感、優(yōu)秀的排版效果和高性能,適合消費者系統(tǒng)和企業(yè)工作負載。Stable Diffusion3 Medium是Stability AI最新推出的產(chǎn)品,預(yù)計將為用戶帶來更加穩(wěn)定和高效的使用體驗。

    image.png

    【AiBase提要:】

    ?? 照片真實感: 克服手和臉上的常見工件,提供高質(zhì)量的圖像,無需復(fù)雜工作流程。

    ?? 排版優(yōu)秀: 在排版上獲得健壯的結(jié)果,優(yōu)于更大的最先進的模型。

    ?? 高性能: 優(yōu)化的大小和效率,非常適合消費者系統(tǒng)和企業(yè)工作負載。

    詳情鏈接:https://stability.ai/stablediffusion3

    3、英偉達發(fā)布數(shù)字人AI技術(shù)NVIDIA ACE 提升角色互動體驗

    NVIDIA最近推出了名為Avatar Cloud Engine (ACE)的先進數(shù)字人AI技術(shù),旨在提升游戲和虛擬世界中角色的互動體驗。該技術(shù)將游戲中的NPC賦予智能對話能力,實現(xiàn)自然、智能的交流,提升角色生動性和真實感。ACE技術(shù)可靈活部署在云端或本地設(shè)備,保證流暢高質(zhì)量的互動體驗,同時優(yōu)化神經(jīng)網(wǎng)絡(luò)以減少延遲,確保實時互動。這一技術(shù)有望在游戲開發(fā)和虛擬現(xiàn)實領(lǐng)域帶來革命性變革,拓展至客戶服務(wù)、教育和娛樂領(lǐng)域,提供更自然智能的表現(xiàn)。

    image.png

    【AiBase提要:】

    ??? 智能對話能力: ACE技術(shù)賦予游戲NPC真實對話能力,超越預(yù)設(shè)臺詞模式。

    ?? 語音和面部動畫生成: ACE利用AI技術(shù)生成真實回復(fù),增強角色生動性和真實感。

    ?? 靈活部署和低延遲: ACE可在云端或本地設(shè)備部署,確保流暢高質(zhì)量互動體驗,減少延遲影響。

    4、Claude 3全系已支持函數(shù)調(diào)用工具Tool use

    Claude 3現(xiàn)在支持函數(shù)調(diào)用工具Tool use,使其能夠與外部工具和API進行交互,提供更動態(tài)和準(zhǔn)確的響應(yīng)。這項技術(shù)的發(fā)展展示了AI在提高工作效率和創(chuàng)新服務(wù)方式方面的巨大潛力。

    image.png

    【AiBase提要:】

    ??? 從非結(jié)構(gòu)化文本中提取結(jié)構(gòu)化數(shù)據(jù),減少手動輸入工作量。

    ?? 自然語言請求轉(zhuǎn)換為結(jié)構(gòu)化API調(diào)用,簡化自助服務(wù)流程。

    ? 協(xié)調(diào)多個Claude子代理執(zhí)行細化任務(wù),如自動協(xié)調(diào)會議時間。

    詳情鏈接:https://docs.anthropic.com/en/docs/tool-use

    5、英偉達推AI游戲助手G-Assist

    G-Assist是英偉達的游戲AI助手,通過語音查詢回答游戲問題并個性化指導(dǎo)玩家。它能優(yōu)化PC設(shè)置、提出游戲性能建議,甚至超頻GPU。Nvidia展示的G-Assist展示了AI助手未來的可能性,盡管仍需謹(jǐn)慎態(tài)度。

    image.png

    【AiBase提要:】

    ? G-Assist是英偉達的游戲AI助手,可指導(dǎo)玩家完成游戲并配置最佳設(shè)置。

    ? 該助手可以通過語音查詢回答游戲中的問題,并根據(jù)屏幕上的情況進行個性化指導(dǎo)。

    ? 不僅可以優(yōu)化和調(diào)整PC設(shè)置,還可以為游戲性能提出建議,并甚至超頻GPU。

    6、DeepMind視頻生成模型Veo支持從單個參考圖像生成視頻片段

    Google DeepMind的Veo模型是一項創(chuàng)新的視頻生成模型,可以根據(jù)單個參考圖像生成視頻剪輯,并通過文本提示調(diào)整視覺風(fēng)格。該模型為創(chuàng)意產(chǎn)業(yè)和視頻制作領(lǐng)域帶來新可能性,但也提醒用戶注意不要分散注意力。

    image.png

    【AiBase提要:】

    ?? Veo模型支持從單個參考圖像生成視頻片段,并可調(diào)整視覺風(fēng)格。

    ?? 應(yīng)用包括實驗性工具VideoFX,用戶可體驗部分Veo模型功能。

    ?? Veo模型具有潛力根據(jù)圖像內(nèi)容和文本提示生成符合用戶要求的視頻剪輯。

    詳情鏈接:https://blog.google/technology/ai/google-labs-video-fx-generative-ai/

    7、一上線就爆火出圈!中文語音AI天花板ChatTTS官網(wǎng)上線

    ChatTTS是一款備受關(guān)注的中文語音AI項目,上線不久就引起轟動。用戶可以通過ChatTTS實現(xiàn)文字轉(zhuǎn)語音、實時語音對話等功能,同時具有多語言支持和細粒度控制等特點。該項目適用于多種場景,包括電商直播、自媒體、在線教育和客服服務(wù)等。

    image.png

    【AiBase提要:】

    ?? 文字轉(zhuǎn)語音、實時語音對話功能

    ?? 多語言支持和中英文混合表現(xiàn)

    ?? 多說話人支持和大規(guī)模訓(xùn)練數(shù)據(jù)應(yīng)用

    詳情鏈接:https://chattts.com/

    8、ControlNet作者推新項目Omost 一句話變構(gòu)圖小作文

    Omost是一個革新性的圖像生成項目,通過簡單的提示詞就能生成詳細且準(zhǔn)確的圖像,極大地簡化了圖像描述的過程。用戶只需輸入簡單提示詞,即可獲得高質(zhì)量、符合預(yù)期的圖像。同時,Omost具有自動擴展提示詞、高靈活性和圖像位置編碼等優(yōu)點,為圖像生成提供了強大的工具支持。

    【AiBase提要:】

    ? 很短的提示詞就可以生成非常詳細并且空間表現(xiàn)很準(zhǔn)確的圖片

    ? 高靈活性,保留圖像布局,一句提示詞即可修改元素

    ? 提供詳細描述,支持復(fù)雜圖像生成,應(yīng)用于AI繪畫、廣告創(chuàng)意等領(lǐng)域

    項目頁:https://top.aibase.com/tool/omost

    試玩地址:https://huggingface.co/spaces/lllyasviel/Omost

    9、ElevenLabs推出創(chuàng)新AI音頻模型

    ElevenLabs最近推出了一款創(chuàng)新的AI音頻模型,可以通過文本提示生成各種音效、短樂器曲目、音景和角色聲音,為內(nèi)容創(chuàng)作者、視頻游戲開發(fā)者和電影電視制片廠帶來巨大福音。這項技術(shù)極大簡化了音頻內(nèi)容創(chuàng)作過程,提高創(chuàng)作效率,拓展創(chuàng)意空間。

    image.png

    【AiBase提要:】

    ?? 文本到音頻轉(zhuǎn)換: 用戶輸入文本提示,AI生成相應(yīng)音效和音樂。

    ?? 多樣性: 能生成各種音效滿足不同場景需求。

    ?? 角色聲音生成: 為動畫、游戲或影視作品中不同角色創(chuàng)造獨特聲音。

    詳情鏈接:https://top.aibase.com/tool/elevenlabs-text-to-sound-effects

    10、PixVerse發(fā)布運動筆刷功能Magic Brush 比Runway更方便和直觀

    PixVerse最新推出的運動筆刷功能Magic Brush極大提升了產(chǎn)品的可用性和用戶體驗,為動畫和動態(tài)圖像創(chuàng)作帶來了靈活性和高效性。用戶可以通過手繪箭頭自定義圖像區(qū)域的運動方向和距離,實現(xiàn)更精確的動態(tài)效果控制。操作簡便直觀,無需復(fù)雜學(xué)習(xí)曲線,提高了創(chuàng)意表達空間和工作效率。

    image.png

    【AiBase提要:】

    ? 自定義運動方向和距離,精確控制動態(tài)效果

    ?? 操作簡便直觀,提升用戶友好度和創(chuàng)意表達空間

    ?? 簡化動畫制作流程,提高工作效率和創(chuàng)作速度

    詳情鏈接:https://top.aibase.com/tool/pixverse

    11、Nvidia發(fā)布GeForce RTX增強版,為AI PC數(shù)字助手提供支持

    Nvidia在Computex展會上推出了新的RTX技術(shù),為新的GeForce RTX AI筆記本電腦提供動力,同時推出Project G-Assist技術(shù)演示為PC游戲和應(yīng)用提供上下文感知的幫助。此外,Nvidia ACE數(shù)字人物平臺首次亮相,為數(shù)字人物提供支持。這些技術(shù)加速了500多個PC應(yīng)用和游戲以及200多個OEM筆記本設(shè)計,為超過1億的RTX AI PC用戶帶來下一代AI動力體驗。

    【AiBase提要:】

    ? Nvidia推出新的RTX技術(shù),為GeForce RTX AI筆記本電腦提供動力

    ? Project G-Assist技術(shù)演示為PC游戲和應(yīng)用提供上下文感知的幫助

    ? Nvidia ACE數(shù)字人物平臺首次亮相,為數(shù)字人物提供支持

    12、麥肯錫調(diào)查顯示:生成式AI應(yīng)用大中華區(qū)增長最快

    生成式AI應(yīng)用在大中華區(qū)和亞太地區(qū)蓬勃發(fā)展,65%受訪者經(jīng)常使用生成式AI并已開始產(chǎn)生商業(yè)價值。企業(yè)主要通過使用現(xiàn)成產(chǎn)品、與AI廠商合作微調(diào)模型或自主開發(fā)產(chǎn)品三種方式應(yīng)用生成式AI。應(yīng)用場景主要包括文本、代碼、音頻、視頻、圖片等生成能力,隨著多模態(tài)大模型的出現(xiàn),應(yīng)用場景將進一步擴大【AiBase提要:】

    ?? 生成式AI應(yīng)用增長:大中華區(qū)和亞太地區(qū)成為增長最快地區(qū),原生數(shù)字人口使用頻繁是主要原因。

    ?? 企業(yè)應(yīng)用方式:現(xiàn)成產(chǎn)品使用、與AI廠商合作微調(diào)模型、自主開發(fā)產(chǎn)品三種方式。

    ?? 應(yīng)用場景擴大:生成式AI功能與應(yīng)用場景掛鉤,包括文本、代碼、音頻、視頻、圖片等生成能力,隨著多模態(tài)大模型出現(xiàn),應(yīng)用場景將進一步擴大。

    13、字節(jié)跳動旗下 AI 助手豆包推出PC客戶端、瀏覽器插件版本

    作為字節(jié)跳動旗下 AI 助手豆包推出PC客戶端和瀏覽器插件版本,為用戶提供了更多便捷的AI功能體驗。用戶可以通過豆包實現(xiàn)快捷劃詞翻譯、AI搜索、一鍵常駐桌面等功能,同時還支持網(wǎng)頁與視頻總結(jié)、寫作和文本修改等功能。豆包的AI大模型系列涵蓋了多種功能模型,為用戶提供全面的AI輔助服務(wù)。

    【AiBase提要:】

    ?? 豆包PC客戶端版本支持快捷劃詞翻譯、AI搜索、一鍵常駐桌面等功能

    ?? 插件版提供一鍵總結(jié)網(wǎng)頁與視頻、寫作和文本修改等功能

    ?? 豆包大模型系列包括豆包通用模型Pro、角色扮演模型、語音合成模型等,提供多樣化的AI功能

    14、沙特阿美投資中國AI初創(chuàng)企業(yè)智譜AI

    這篇文章報道了沙特阿美旗下的Prosperity7 投資了中國生成式人工智能初創(chuàng)企業(yè)智譜AI,使其估值達到 30 億美元。這一投資不僅為智譜AI帶來了資金支持,也有助于其在國際市場上拓展。智譜AI在人工智能領(lǐng)域的發(fā)展勢頭強勁,受到國際資本關(guān)注。

    【AiBase提要:】

    ?? 智譜AI獲得沙特阿美旗下Prosperity7 的 4 億美元投資,估值達 30 億美元。

    ?? 智譜AI是清華大學(xué)計算機系技術(shù)成果轉(zhuǎn)化公司,由唐杰教授領(lǐng)銜,在生成式人工智能領(lǐng)域取得顯著成就。

    ?? 智譜AI曾獲得超過 25 億元人民幣融資,參與方包括多家知名機構(gòu)和公司。

    舉報

    • 相關(guān)推薦
    • AI日報ChatGPT重磅上線圖像庫功能;白嫖!Veo2登陸谷歌AI Studio;螞蟻百寶箱“MCP專區(qū)”

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、報道稱字節(jié)跳動整合 AI 研發(fā)團隊,AI Lab 即將并入 Seed字節(jié)跳動正在進行AI研發(fā)團隊的整合,將獨立的字節(jié)AI Lab并入Seed團隊。這一舉措體現(xiàn)了字節(jié)在AI領(lǐng)域戰(zhàn)略布局的調(diào)整,旨在進?

    • AI日報:即夢3.0內(nèi)測直出2K商業(yè)海報;ChatGPT又更新圖片生成功能;餓了么AI入駐智能經(jīng)理”

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。7、Genspark發(fā)布自動化AI代理SuperAgent具備自主思考、調(diào)用工具的能力Genspark最近推出了其全新的自動化AI代理SuperAgent,憑借其強大的自主思考和任務(wù)執(zhí)行能力,迅速成為行業(yè)的焦點。用戶只需輸入感興趣的主題,系統(tǒng)便能?

    • AI日報:Kimi全新音頻基礎(chǔ)模型Kimi-Audio;階躍星辰開源像編輯模型Step1X-Edit;?夸克AI超級框上線 “拍照問夸克”

      本期AI日報聚焦多項AI技術(shù)突破與應(yīng)用:1)Moonshot AI推出開源音頻模型Kimi-Audio,基于13億小時訓(xùn)練數(shù)據(jù),支持語音識別等任務(wù);2)階躍星辰開源圖像編輯模型Step1X-Edit,展現(xiàn)強大生成能力;3)夸克AI上線"拍照問夸克"功能,實現(xiàn)視覺問答;4)蘋果iOS18.5將在中國推送,帶來智能功能;5)谷歌發(fā)布601個生成式AI應(yīng)用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動化系統(tǒng);7)OpenAI升級ChatGPT至GPT-4o版本,提升STEM領(lǐng)域能力;8)Ema公司推出高性價比語言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型;10)LemonAI推出實時音視頻數(shù)字人產(chǎn)品Slice Live。此外,國內(nèi)方面,智譜與生數(shù)科技達成戰(zhàn)略合作推動大模型發(fā)展,寶馬中國宣布新車將接入DeepSeek技術(shù)。

    • AI日報:智譜開源32B/9B系列GLM模型并啟用Z.ai域名;OpenAI發(fā)布GPT-4.1系列模型;阿里魔搭上線MCP廣場

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、智譜AI啟用全新域名Z.ai 并開源32B/9B 系列 GLM 模型智譜技術(shù)團隊近期宣布開源32B和9B系列的GLM模型,并推出全新交互體驗平臺Z.ai。這些模型遵循MIT許可協(xié)議,支持商業(yè)用途,提升了

    • ChatGPT上線圖庫功能:可管理AI生成圖

      快科技4月16日消息,據(jù)報道,OpenAI近日宣布將為ChatGPT推出全新的Image Library圖庫功能,該功能將幫助用戶更高效地管理和查看AI生成的圖像。這項創(chuàng)新功能將逐步向所有用戶開放,包括移動端和網(wǎng)頁端的免費版、Plus版及Pro版用戶。新功能的設(shè)計充分考慮了用戶體驗的便捷性。用戶只需點擊ChatGPT側(cè)邊欄的Library入口,就能進入一個直觀的圖像網(wǎng)格界面。在這個界面中,用戶可以輕?

    • AI日報:阿里新模型Qwen3即將來襲;GitHub開源MCP服務(wù)器;Runway發(fā)布Gen-4 Turbo

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、Qwen3即將來襲:阿里云新模型相關(guān)支持已正式合并至vLLM代碼庫阿里云的Qwen3模型即將發(fā)布,標(biāo)志著其在AI領(lǐng)域的又一重要進展。新推出的AI聽歌報告能夠精準(zhǔn)識別用戶音樂偏好,場景

    • AI日報:通義千問Qwen3重磅發(fā)布;抖音AI搜索能力開放;ChatGPT 搜索新增網(wǎng)購功能;Suno V4.5版本將發(fā)布

      本期AI日報重點內(nèi)容: 1. 通義千問發(fā)布Qwen3大模型,在代碼、數(shù)學(xué)和通用能力方面表現(xiàn)突出,支持兩種思考模式并開源多個模型權(quán)重 2. 抖音開放AI搜索能力接口,為第三方應(yīng)用提供豐富內(nèi)容資源 3. ChatGPT新增網(wǎng)購功能,通過對話獲取個性化商品推薦 4. Suno AI即將推出V4.5版本,提升音樂生成真實度 5. Simular AI登陸macOS,打造本地化智能助手 6. 暗月之面開源Kimi-VL模型,可處理文本、圖像和視頻 7. UCLA與Meta推出d1框架,提升大語言模型推理速度 8. 通義靈碼上線Qwen3編程智能體 9. Gen-4References圖像生成技術(shù)驚艷亮相 10. Hugging Face推出可編程機械臂SO-101 11. Windsurf推出全新品牌標(biāo)志 12. Ollama全面支持Qwen3模型本地部署

    • AI日報:小米首個推理大模型開源Xiaomi MiMo;快手上線AI筆記工具“喵記多”;騰訊拆分AI團隊

      本文匯總了AI領(lǐng)域最新動態(tài):1)小米開源70億參數(shù)大模型Xiaomi MiMo,在數(shù)學(xué)推理和代碼競賽中超越OpenAI和阿里模型;2)快手推出AI筆記工具"喵記多",簡化筆記管理;3)Luma AI發(fā)布電影級鏡頭控制API,降低視頻生成門檻;4)騰訊重組AI團隊,加大語言模型研發(fā)投入;5)Anthropic為Claude引入新語音"Glassy";6)谷歌NotebookLM新增50+語言音頻概述功能;7)xAI將發(fā)布Grok3.5模型;8)Meta推出獨立AI助手應(yīng)用挑戰(zhàn)ChatGPT;9)OpenAI緊急修復(fù)GPT-4o"諂媚"問題;10)Mac本地AI助手Simular升級隱私保護;11)CameraBench項目幫助AI理解鏡頭運動;12)谷歌推出個性化語言學(xué)習(xí)AI工具。

    • AI日報:Vidu Q1正式上線;MCP SDK 正式支持流式 HTTP;抖音一季度封禁AI黑產(chǎn)賬號260萬個

      本文介紹了AI領(lǐng)域多項重要進展:1)MCP SDK支持流式HTTP協(xié)議,提升開發(fā)效率;2)Vidu Q1視頻生成模型上線,提供專業(yè)級視覺體驗;3)馬斯克計劃籌資250億美元開發(fā)Colossus 2超級計算機;4)Sand AI開源MAGI-1視頻生成模型;5)電商AI助手Add To Cart AI優(yōu)化購物體驗;6)Anthropic發(fā)布Claude Code編程指南;7)真我推出支持32種語言的AI翻譯耳機;8)2025年AI視頻企業(yè)TOP20榜單發(fā)布;9)清華GLM大模型免費開放;10)AI面試作弊工具引爭議;11)抖音AI治理封禁260萬違規(guī)賬號;12)全球首款具備嗅覺的機器人問世。這些創(chuàng)新展示了AI技術(shù)在視頻生成、編程輔助、電商、翻譯等領(lǐng)域的快速發(fā)展與應(yīng)用潛力。

    • 阿里開源通義新模型:指定首尾圖片生成視頻

      快科技4月18日消息,據(jù)報道,阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面,智能生成720p高清過渡視頻,為視頻創(chuàng)作帶來全新可能。該模型通過先進的深度學(xué)習(xí)算法,能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后,模型會智能分析畫面中的視覺元素,包括物體形?