无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > 微軟最新資訊  > 正文

    AI日報:微軟發(fā)布iPhone可運行AI模型;全國首例AI聲音侵權(quán)案判了;Kimi創(chuàng)始人套現(xiàn)數(shù)千萬美金;中文聊天模型Llama3發(fā)布

    2024-04-23 15:57 · 稿源:站長之家

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

    新鮮AI產(chǎn)品點擊了解https://top.aibase.com/

    1、騰訊SaaS產(chǎn)品智能化升級 全面接入混元模型

    騰訊宣布旗下協(xié)作SaaS產(chǎn)品全面接入混元模型,實現(xiàn)軟件服務(wù)智能化。騰訊樂享、騰訊電子簽、騰訊問卷等產(chǎn)品已實現(xiàn)智能化升級,為用戶提供更智能、高效的服務(wù)?;煸竽P鸵褦U展至萬億級參數(shù)規(guī)模,在國內(nèi)率先采用混合專家模型結(jié)構(gòu),性能表現(xiàn)優(yōu)異。外部開發(fā)者和企業(yè)可以通過騰訊云上API直接調(diào)用騰訊混元能力,解決用戶痛點。

    【AiBase提要:】

    ?? 騰訊SaaS產(chǎn)品實現(xiàn)智能化升級,提供更智能、高效的服務(wù)。

    ?? 混元大模型擴展至萬億級參數(shù)規(guī)模,性能在多方面表現(xiàn)優(yōu)異。

    ?? 外部開發(fā)者和企業(yè)可通過騰訊云API調(diào)用混元能力,解決不同場景下的痛點。

    2、微軟發(fā)布iPhone可運行的ChatGPT級AI模型Phi-3系列 挑戰(zhàn)OpenAI地位

    微軟最新推出的Phi-3系列小型AI模型在AI領(lǐng)域引起轟動,尤其是Phi-3-mini模型在多項基準(zhǔn)測試中超越了參數(shù)更大的Llama3模型。該系列模型能在iPhone14Pro和iPhone15上實現(xiàn)每秒12token的運行速度,達到了ChatGPT水平。微軟強調(diào)訓(xùn)練數(shù)據(jù)的重要性,通過精心設(shè)計數(shù)據(jù)和訓(xùn)練方法提升模型性能。

    image.png

    【AiBase提要:】

    ?? Phi-3-mini模型參數(shù)僅3.8B,性能超越8B參數(shù)的Llama3模型。

    ?? Phi-3系列包括Phi-3-small和Phi-3-medium版本,性能優(yōu)越。

    ?? 微軟團隊通過精心設(shè)計訓(xùn)練數(shù)據(jù)和獨特訓(xùn)練方法提升了Phi-3系列模型的性能。

    詳情鏈接:https://arxiv.org/pdf/2404.14219.pdf

    3、全國首例AI聲音侵權(quán)案一審宣判 自己聲音被AI化出售獲賠25萬元

    這篇文章報道了全國首例AI聲音侵權(quán)案的一審判決結(jié)果,涉及配音師聲音被AI技術(shù)濫用的案件引起社會廣泛關(guān)注。法院裁定被告未經(jīng)授權(quán)擅自使用配音師聲音開發(fā)AI產(chǎn)品構(gòu)成侵權(quán),需賠償25萬元。判決強調(diào)聲音作為人格權(quán)益應(yīng)受法律保護,為聲音創(chuàng)作者提供了重要法律保障。

    【AiBase提要:】

    ?? 首例AI聲音侵權(quán)案一審判決結(jié)果:被告未經(jīng)授權(quán)使用配音師聲音開發(fā)AI產(chǎn)品,需賠償25萬元。

    ?? 法院強調(diào)聲音作為獨特人格權(quán)益應(yīng)受法律保護,未經(jīng)授權(quán)擅自使用聲音構(gòu)成侵權(quán)行為。

    ????? 判決為聲音創(chuàng)作者提供了重要法律保障,將堅決維護聲音權(quán)益并打擊侵權(quán)行為。

    4、中文聊天模型Llama3-8B-Chinese-Chat發(fā)布

    這篇文章介紹了基于Meta-Llama-3-8B-Instruct模型經(jīng)過ORPO方法微調(diào)的中文聊天模型Llama3-8B-Chinese-Chat。該模型減少了中英混合回答和表情符號的使用,使得回答更正式和專業(yè)。它在理解中文問題意圖、提供恰當(dāng)回答、拒絕不當(dāng)請求等方面表現(xiàn)出色。

    【AiBase提要:】

    ?? Llama3-8B-Chinese-Chat是基于Meta-Llama-3-8B-Instruct模型通過ORPO方法微調(diào)的中文聊天模型,減少了中英混合回答和表情符號的使用。

    ?? ORPO方法利用賠率比概念調(diào)整模型偏好設(shè)置,優(yōu)化模型在特定任務(wù)中的表現(xiàn),Llama3-8B-Chinese-Chat模型使用ORPO優(yōu)化中英文生成偏好。

    ?? Llama3-8B-Chinese-Chat模型在安全、道德、數(shù)學(xué)問題解答、寫作和編程示例等方面表現(xiàn)出色,提供更準(zhǔn)確、專業(yè)的回答和示例代碼。

    詳情鏈接:https://top.aibase.com/tool/llama3-8b-chinese-chat

    5、Adobe發(fā)布視頻超分辨率項目VideoGigaGAN

    Adobe最近推出了視頻超分辨率項目VideoGigaGAN,該項目在視頻放大技術(shù)方面取得了顯著進展,能將視頻放大至原始分辨率的8倍,保持時間連貫性和高頻細節(jié)清晰度。這一技術(shù)將視頻處理帶入新階段,極大擴展了視頻內(nèi)容的應(yīng)用范圍和質(zhì)量。

    image.png

    【AiBase提要:】

    ? VideoGigaGAN實現(xiàn)視頻放大至8倍原始分辨率,保持時間連貫性和高頻細節(jié)清晰度。

    ?? Adobe優(yōu)化GigaGAN模型,增強視頻穩(wěn)定性,展示卓越性能。

    ?? VideoGigaGAN提升視頻視覺質(zhì)量,適應(yīng)不同風(fēng)格視頻內(nèi)容,具有廣泛的應(yīng)用潛力。

    詳情鏈接:https://top.aibase.com/tool/videogigagan

    6、Midjourney發(fā)布random功能 可基于提示詞生成完全隨機的圖像風(fēng)格

    Midjourney發(fā)布了一個有趣的功能,可以基于提示詞生成完全隨機的圖像風(fēng)格。用戶可以通過隨機生成的圖像風(fēng)格來探索不同的創(chuàng)作方向,同時還可以與其他用戶進行實時交流和分享,共同探討創(chuàng)作過程中的靈感和想法。這一功能的推出將進一步豐富用戶的圖像生成體驗,為他們提供更多的創(chuàng)作選擇和交流平臺。

    image.png

    【AiBase提要:】

    ?? 可基于提示詞生成完全隨機的圖像風(fēng)格

    ?? 用戶可以通過Room功能進行實時交流和分享

    ?? 探索不同的創(chuàng)作方向,豐富用戶的圖像生成體驗

    7、AI獨角獸月之暗面創(chuàng)始人楊植麟套現(xiàn)數(shù)千萬美金 官方回應(yīng)

    楊植麟作為月之暗面創(chuàng)始人,通過個人股份銷售套現(xiàn)數(shù)千萬美元,引起廣泛關(guān)注。公司成立僅一年便獲得巨額融資,估值超過25億美元。月之暗面的成功不僅在估值上體現(xiàn),旗艦產(chǎn)品Kimi Chat的成功也備受矚目。

    【AiBase提要:】

    ?? 月之暗面創(chuàng)始人楊植麟通過個人股份銷售套現(xiàn)數(shù)千萬美元,公司估值超過25億美元。

    ?? 月之暗面創(chuàng)立僅一年便迅速崛起,成為中國大模型領(lǐng)域獨角獸之一。

    ?? 月之暗面旗艦產(chǎn)品Kimi Chat憑借“長文本”功能在AI大模型領(lǐng)域脫穎而出,引發(fā)資本市場熱潮。

    8、毫不猶豫!小扎自曝愿開源100億美元模型 直言2025年之前AGI不可能實現(xiàn)

    最新的播客訪談中,小扎展現(xiàn)了開源英雄形象,表示愿意開源價值100億美元模型,強調(diào)開源降低成本促進創(chuàng)新,但也需綜合考慮經(jīng)濟利弊。他對2025年之前AGI實現(xiàn)持悲觀態(tài)度,認(rèn)為能源短缺是瓶頸,解決可能需數(shù)十年。批評蘋果和谷歌獨占移動生態(tài),希望通過開源改變局面,防范競爭對手威脅。對于人工智能發(fā)展瓶頸,擔(dān)憂能源限制和數(shù)據(jù)中心挑戰(zhàn),持保留態(tài)度未來AI模型能力提升。

    【AiBase提要:】

    ?? 小扎愿意開源價值100億美元模型,認(rèn)為開源降低成本促進創(chuàng)新,但需綜合考慮經(jīng)濟利弊。

    ?? 對2025年之前AGI實現(xiàn)持悲觀態(tài)度,認(rèn)為能源短缺是瓶頸,解決可能需數(shù)十年。

    ?? 批評蘋果和谷歌獨占移動生態(tài),希望通過開源改變局面,防范競爭對手威脅。

    9、字節(jié)跳動發(fā)布圖像模型蒸餾算法Hyper-SD

    這篇文章介紹了字節(jié)跳動的Lightning團隊發(fā)布的新圖像模型蒸餾算法Hyper-SD,該算法在圖像處理和機器學(xué)習(xí)領(lǐng)域取得重要進展。通過創(chuàng)新的方法提升了模型性能,在保持模型精簡的同時提高了推理速度和效率。

    image.png

    【AiBase提要:】

    ?? 分段軌跡一致性蒸餾:Hyper-SD技術(shù)確保了原始ODE軌跡的完整性。

    ?? 人類反饋學(xué)習(xí)機制:引入人類反饋學(xué)習(xí),提升模型表現(xiàn),減少性能損失。

    ?? 分?jǐn)?shù)蒸餾技術(shù):增強了模型在低步推理下的生成能力,進一步提升性能。

    詳情鏈接:https://top.aibase.com/tool/hyper-sd

    10、AI音樂生成工具AI Jukebox 輸入提示詞選擇曲風(fēng)即可創(chuàng)作音樂

    AI Jukebox是一款利用人工智能技術(shù)的音樂生成工具,通過Hugging Face平臺提供服務(wù)。它簡化音樂創(chuàng)作過程,智能化且用戶友好。用戶可以通過輸入提示詞指導(dǎo)AI生成特定風(fēng)格音樂,實現(xiàn)智能化音樂創(chuàng)作。AI Jukebox鼓勵人機合作模式,為音樂人和音樂愛好者提供靈感和創(chuàng)作工具,探索無限可能性。

    image.png

    【AiBase提要:】

    ?? 本地化模型加載: 用戶打開AI Jukebox的網(wǎng)頁后,系統(tǒng)自動加載生成模型,無需復(fù)雜設(shè)置。

    ?? 基于提示詞的音樂生成: 用戶通過輸入特定提示詞指導(dǎo)AI生成特定風(fēng)格音樂,包括音樂類型、情感、樂器等描述。

    ?? 人機合作模式: AI Jukebox鼓勵用戶與AI合作,探索新的音樂創(chuàng)作方式,提供靈感和創(chuàng)作工具。

    詳情鏈接:https://top.aibase.com/tool/ai-jukebox

    11、虛擬人聊天系統(tǒng)Live2D

    這篇文章介紹了基于Unity開發(fā)的Live2D虛擬人聊天系統(tǒng)項目,利用Live2D技術(shù)展現(xiàn)動態(tài)虛擬人形象,提供流暢的動畫效果,增強用戶交互體驗。項目集成了Azure、OpenAI和APISpace等API支持自然語言處理和生成,實現(xiàn)實時文本交流。同時支持圖像處理和人臉檢測,高清分辨率顯示,以及自定義擴展功能。

    image.png

    【AiBase提要:】

    ????? Live2D虛擬人形象集成,提供流暢的動畫效果,增強用戶體驗。

    ?? 實時聊天功能,虛擬人能理解并回應(yīng)用戶文本輸入,實現(xiàn)實時交流。

    ?? 圖像處理和人臉檢測,讓虛擬人更好地響應(yīng)用戶視覺輸入。

    詳情鏈接:https://top.aibase.com/tool/live2d-virtual-human-for-chatting-based-on-unity

    12、港大與浙大聯(lián)合研發(fā)SC-GS模型

    本文介紹了香港大學(xué)CVMI實驗室與3D大模型公司VAST以及浙江大學(xué)聯(lián)合研究團隊提出的SC-GS模型,該模型在數(shù)字資產(chǎn)創(chuàng)造和3D重建領(lǐng)域取得突破性成果。通過稀疏控制點實時交互編輯,實現(xiàn)了對動態(tài)場景的高效編輯和合成,展現(xiàn)了巨大潛力。

    image.png

    【AiBase提要:】

    ?? SC-GS模型在新視角合成領(lǐng)域掀起革命性浪潮,展現(xiàn)出對動態(tài)高斯的稀疏控制點進行實時交互編輯的能力。

    ?? 用戶可以通過簡單的鼠標(biāo)拖拽和鍵盤組合按鍵操作,輕松實現(xiàn)對重建動態(tài)場景的編輯。

    ?? SC-GS模型通過神經(jīng)網(wǎng)絡(luò)預(yù)測控制點運動狀態(tài),驅(qū)動整個場景中的動態(tài)高斯進行變形,提升了動態(tài)新視角合成的性能。

    詳情鏈接:https://top.aibase.com/tool/sc-gs

    13、新視頻分割技術(shù)SAM 可高效識別移動物體

    本文介紹了在視頻分割領(lǐng)域,研究團隊探索新的視頻對象分割技術(shù),通過結(jié)合SAM模型和光流技術(shù),提高了視頻分割性能。兩種模型展示了潛力,實現(xiàn)了顯著性能提升,并將分割技術(shù)擴展到整個視頻序列,實現(xiàn)物體追蹤。這些技術(shù)提升了視頻分割精度和效率,降低了計算復(fù)雜度,對多個應(yīng)用場景具有重要意義。

    image.png

    【AiBase提要:】

    ?? SAM與光流結(jié)合的模型展示了提高視頻分割性能的潛力。

    ?? SAM與RGB圖像結(jié)合的模型增強了模型對視頻中物體運動的識別和分割能力。

    ?? 將基于幀的分割方法擴展到整個視頻序列,實現(xiàn)了物體在視頻連續(xù)幀中的身份追蹤。

    詳情鏈接:https://www.robots.ox.ac.uk/~vgg/research/flowsam/

    舉報

    • 相關(guān)推薦
    • AI日報kimi宣布降價;OpenRouter發(fā)布免費模型Quasar Alpha;Midjourney V7重磅上線

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、IDC:到2028年中國人工智能投資將突破1000億美元根據(jù)國際數(shù)據(jù)公司的預(yù)測,中國在人工智能領(lǐng)域的投資將顯著增長,預(yù)計到2028年總投資將突破1000億美元,年均復(fù)合增長率達到35.2%。

    • AI日報Kimi新音頻基礎(chǔ)模型Kimi-Audio;階躍星辰開源圖像編輯模型Step1X-Edit;?夸克AI超級框上線 “拍照問夸克”

      本期AI日報聚焦多項AI技術(shù)突破與應(yīng)用:1)Moonshot AI推出開源音頻模型Kimi-Audio,基于13億小時訓(xùn)練數(shù)據(jù),支持語音識別等任務(wù);2)階躍星辰開源圖像編輯模型Step1X-Edit,展現(xiàn)強大生成能力;3)夸克AI上線"拍照問夸克"功能,實現(xiàn)視覺問答;4)蘋果iOS18.5將在中國推送,帶來智能功能;5)谷歌發(fā)布601個生成式AI應(yīng)用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動化系統(tǒng);7)OpenAI升級ChatGPT至GPT-4o版本,提升STEM領(lǐng)域能力;8)Ema公司推出高性價比語言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型;10)LemonAI推出實時音視頻數(shù)字人產(chǎn)品Slice Live。此外,國內(nèi)方面,智譜與生數(shù)科技達成戰(zhàn)略合作推動大模型發(fā)展,寶馬中國宣布新車將接入DeepSeek技術(shù)。

    • 全國首例保護AI模型結(jié)構(gòu)判決!抖音訴B612害著作權(quán) 獲賠160萬

      快科技4月17日消息,據(jù)媒體報道,近日,北京知識產(chǎn)權(quán)法院審結(jié)的抖音公司訴億??乒厩趾χ鳈?quán)及不正當(dāng)競爭案正式生效。該院在二審判決中認(rèn)定億睿科公司構(gòu)成不正當(dāng)競爭,需賠償抖音公司損失及合理開支共計160萬元。該案作為全國首例保護AI模型結(jié)構(gòu)和參數(shù)的生效判決,明確了人工智能模型結(jié)構(gòu)和參數(shù)的可保護性,為未來AI模型的保護提供了指引。據(jù)案件披露,抖音公司發(fā)現(xiàn),億??乒具\營的B612咔嘰APP上線了與抖音公司一款變身漫畫特效具有相同功能的少女漫畫特效,二者在對同一張圖片進行風(fēng)格轉(zhuǎn)換時生成高度近似的結(jié)果,且在結(jié)構(gòu)、參數(shù)等?

    • AI日報:字節(jié)發(fā)布豆包1.5深度思考模型;微信首個AI助手 “元寶” 上線;OpenAI發(fā)布o4-mini、滿血版o3

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、OpenAI發(fā)布兩款多模態(tài)推理模型o4-mini、滿血版o3OpenAI在技術(shù)直播中推出了其最新的多模態(tài)模型o4-mini和滿血版o3,這兩款模型具備同時處理文本、圖像和音頻的能力,并能調(diào)用外部工?

    • 苦等一年 Meta終于放大招 正式發(fā)布開源大模型Llama 4

      美國科技巨擘Meta重磅推出其迄今最為強大的開源AI模型Llama4,恰逢Llama3上市一周年之際。Llama4系列采用了先進的混合專家架構(gòu),這一架構(gòu)在模型訓(xùn)練及用戶查詢回答過程中展現(xiàn)出更高效率,通過將模型劃分為多個專注于特定任務(wù)的專家”子模型,實現(xiàn)精準(zhǔn)高效的處理。Meta首席執(zhí)行官扎克伯格表示:他們的目標(biāo)是建立世界領(lǐng)先的人工智能,將其開源,并使其普遍可用,以便世界上每個人都能受益。

    • Llama 4大模型跌落神壇:作弊刷榜、代碼能力極差、和DeepSeek比就是偽開源

      被寄予厚望的美國Meta公司的最新開源大模型Llama4發(fā)布不到2天時間,口碑急轉(zhuǎn)直下,被質(zhì)疑為刷榜作弊實際效果差、開源條件多部署門檻高是偽開源等。大模型評測平臺LMArena親自下場發(fā)文,打臉Meta提供給平臺的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開放之間搖擺,恐將在AI競賽中進一步失去開發(fā)者支持。

    • AI日報:小米首個推理大模型開源Xiaomi MiMo;快手上線AI筆記工具“喵記多”;騰訊拆分AI團隊

      本文匯總了AI領(lǐng)域最新動態(tài):1)小米開源70億參數(shù)大模型Xiaomi MiMo,在數(shù)學(xué)推理和代碼競賽中超越OpenAI和阿里模型;2)快手推出AI筆記工具"喵記多",簡化筆記管理;3)Luma AI發(fā)布電影級鏡頭控制API,降低視頻生成門檻;4)騰訊重組AI團隊,加大語言模型研發(fā)投入;5)Anthropic為Claude引入新語音"Glassy";6)谷歌NotebookLM新增50+語言音頻概述功能;7)xAI將發(fā)布Grok3.5模型;8)Meta推出獨立AI助手應(yīng)用挑戰(zhàn)ChatGPT;9)OpenAI緊急修復(fù)GPT-4o"諂媚"問題;10)Mac本地AI助手Simular升級隱私保護;11)CameraBench項目幫助AI理解鏡頭運動;12)谷歌推出個性化語言學(xué)習(xí)AI工具。

    • AI日報:智譜開源32B/9B系列GLM模型并啟用Z.ai域名;OpenAI發(fā)布GPT-4.1系列模型;阿里魔搭上線MCP廣場

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、智譜AI啟用全新域名Z.ai 并開源32B/9B 系列 GLM 模型智譜技術(shù)團隊近期宣布開源32B和9B系列的GLM模型,并推出全新交互體驗平臺Z.ai。這些模型遵循MIT許可協(xié)議,支持商業(yè)用途,提升了

    • Llama 4五大疑點曝光,逐層扒皮,AI進步停滯,NYU教授稱Scaling徹底結(jié)束

      令人失望的Llama4,只是前奏已。接下來我們恐將看到——全球局勢的改變,將徹底阻止AI進步!最近,一位AICEO做出長視頻,逐級對Llama4身上的六大疑點進行了扒皮。GaryMarcus正在尋找對開發(fā)更可靠替代方法有興趣的投資者。

    • 能理解海豚聲音!谷歌開發(fā)AI模型DolphinGemma

      快科技4月15日消息,谷歌公布了一款名為DolphinGemma”的大型語言模型,旨在幫助科學(xué)家理解海豚的聲音,并生成類似海豚的聲音序列。研究人員預(yù)計在未來幾個月內(nèi)測試DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry(CHAT)發(fā)聲系統(tǒng),以探索是否能夠翻譯并模仿海豚的聲音,進而實現(xiàn)與海豚的某種對話”。海豚是地球上最聰明且最善于溝通的動物之一,其社交互動極其復(fù)雜?