无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > CogView3最新資訊  > 正文

    AI日報:智譜開源圖像生成模型CogView3;AI聲音克隆差點騙走律師父親3萬美金;GGHead?顛覆3D建模

    2024-09-30 14:24 · 稿源:站長之家

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

    新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/

    1、文生圖卷起來了!智譜開源圖像生成模型CogView3生成速度比SDXL快10倍!

    智譜AI最新開源的CogView3和CogView-3Plus-3B為文生圖領(lǐng)域注入新活力,CogView3采用獨特的級聯(lián)擴(kuò)散方法,生成質(zhì)量超越SDXL,且推理速度快10倍。CogView-3Plus-3B基于DiT框架,優(yōu)化了Zero-SNR擴(kuò)散噪聲調(diào)度和聯(lián)合文本-圖像注意力機(jī)制,支持廣泛的圖像分辨率范圍。智譜AI提供建議和工具幫助用戶優(yōu)化提示詞,降低使用門檻。

    image.png

    【AiBase提要:】

    ?? CogView3采用級聯(lián)擴(kuò)散方法,生成質(zhì)量超越SDXL,推理速度快10倍。

    ?? CogView-3Plus-3B基于DiT框架,引入Zero-SNR擴(kuò)散噪聲調(diào)度和聯(lián)合文本-圖像注意力機(jī)制。

    ?? 智譜AI提供建議和示例腳本,幫助用戶優(yōu)化提示詞,降低使用門檻。

    詳情鏈接:https://github.com/THUDM/CogView3

    2、AI聲音克隆詐騙升級!一通電話差點騙走律師父親3萬美金

    最近爆發(fā)的AI聲音克隆詐騙案件引發(fā)了廣泛關(guān)注,凸顯了這項技術(shù)可能帶來的巨大風(fēng)險。事件揭示了人類在面對高度逼真的AI聲音克隆時的脆弱性,呼吁加強對AI行業(yè)的監(jiān)管以保護(hù)消費者免受侵害。文章還提到了聲音克隆技術(shù)的潛在風(fēng)險和積極用途,以及應(yīng)對高科技詐騙的建議。

    【AiBase提要:】

    ?? 高科技詐騙:AI聲音克隆技術(shù)引發(fā)警示,騙子利用AI模仿聲音進(jìn)行詐騙,成功率驚人。

    ?? 安全挑戰(zhàn):人類在識別AI生成聲音時存在高錯誤率,緊迫需要開發(fā)深度偽造檢測工具。

    ?? 風(fēng)險警示:新型攻擊手法音頻劫持結(jié)合多種AI技術(shù),可能導(dǎo)致資金被轉(zhuǎn)移到虛假賬戶。

    3、顛覆3D建模!GGHead:實現(xiàn)超高速高質(zhì)量、角色一致3D頭部生成

    GGHead是一種新穎的3D建模技術(shù),由慕尼黑工業(yè)大學(xué)的Tobias Kirschstein等人研發(fā)。它能在超快速度下生成高質(zhì)量、視角一致的3D人頭模型,降低了3D建模門檻,為未來的人類建模研究開辟新可能性。

    image.png

    【AiBase提要:】

    ?? 使用普通GPU實時生成高分辨率的3D人頭模型

    ?? 利用3D高斯點云表示和2D CNN生成高斯屬性,提高建模效率

    ?? 引入“全變差損失”技術(shù)提升幾何精度,保證圖像質(zhì)量和一致性

    詳情鏈接:https://tobias-kirschstein.github.io/gghead/

    4、全新視覺識別技術(shù)Revisit Anything

    這篇文章介紹了一種創(chuàng)新的視覺位置識別技術(shù)Revisit Anything,通過輸入圖片即可識別出圖片中的地點。該技術(shù)結(jié)合了SAM和DINO技術(shù),提升了圖像段的檢索效果,實現(xiàn)更精確的地點重識別。研究團(tuán)隊使用了多個數(shù)據(jù)集進(jìn)行測試,建議用戶從17places數(shù)據(jù)集開始,快速上手。通過特征提取、聚類中心生成和SegVLAD管道運行,用戶可以獲取高效的識別結(jié)果。這項研究推動了視覺位置識別領(lǐng)域的發(fā)展。

    【AiBase提要:】

    ?? 結(jié)合SAM和DINO技術(shù),推出新穎的視覺位置識別方法。

    ?? 用戶可快速上手并運行實驗,通過詳細(xì)的步驟和腳本獲取高效結(jié)果。

    ?? 提供了一種新的視覺位置識別方案,利用現(xiàn)代深度學(xué)習(xí)模型進(jìn)行圖像分析,推動了該領(lǐng)域的發(fā)展。

    詳情鏈接:https://github.com/AnyLoc/Revisit-Anything

    5、海信發(fā)布AI電視E7N,內(nèi)置AI芯片

    海信發(fā)布的E7N超畫質(zhì)Mini LED電視搭載了海信自主研發(fā)的Mini LED控光芯片,亮度高達(dá)4000nits,背光調(diào)控精細(xì),畫面清晰明暗分明。內(nèi)置信芯AI芯片通過深度學(xué)習(xí)優(yōu)化畫質(zhì),觀看體驗極佳。性能強勁,支持4路HDMI2.1接口,適合游戲玩家使用。

    image.png

    【AiBase提要:】

    ?? E7N搭載海信自主研發(fā)的Mini LED控光芯片,每個芯片可控制8個燈珠,達(dá)4224個分區(qū),亮度高達(dá)4000nits。

    ?? 內(nèi)置海信首款國產(chǎn)高端畫質(zhì)芯片信芯AI芯片,通過深度學(xué)習(xí)優(yōu)化色彩、對比度和清晰度,觀看各種節(jié)目畫質(zhì)達(dá)會員級別。

    ?? E7N首次搭載MT9655SOC芯片,性能提升164%和219%,支持4路HDMI2.1接口,游戲體驗全面提升。

    6、自稱開源版Cursor 剛?cè)谫Y350萬的PearAI被指抄襲

    PearAI作為自稱開源版Cursor的AI編程工具,最近獲得YCombinator50萬美元融資,引發(fā)了關(guān)于創(chuàng)新、借鑒與商業(yè)化的爭論。創(chuàng)始人Pan聲稱產(chǎn)品性能超越C0pilot,但被指抄襲其他開源項目。爭議暴露了開源世界中創(chuàng)新與借鑒的界限問題,以及科技創(chuàng)業(yè)中夸大項目獨特性可能帶來的負(fù)面影響。

    【AiBase提要:】

    ?? PearAI獲YCombinator融資,引發(fā)創(chuàng)新、借鑒與商業(yè)化爭論

    ?? Pan聲稱產(chǎn)品性能超越C0pilot,但被指抄襲其他開源項目

    ?? 開源社區(qū)面臨如何保持創(chuàng)新、展示項目價值的挑戰(zhàn)

    詳情鏈接:https://x.com/CodeFryingPan/status/1840464744626675719

    7、加州AI監(jiān)管法案遭否決:紐瑟姆稱初衷良好但方法不當(dāng)

    加州州長紐瑟姆否決了備受矚目的SB1047法案,引發(fā)了科技界和政界的廣泛討論。紐瑟姆認(rèn)為該法案雖初衷良好,但未考慮AI系統(tǒng)具體應(yīng)用環(huán)境及風(fēng)險程度,不是最佳保護(hù)公眾方法。這一決定凸顯了AI監(jiān)管的復(fù)雜性,挑戰(zhàn)在促進(jìn)創(chuàng)新與確保安全之間尋求平衡。

    【AiBase提要:】

    ?? SB1047法案旨在規(guī)范大型人工智能模型的開發(fā),要求公司實施安全協(xié)議,但遭到硅谷多方反對。

    ?? 紐瑟姆否決法案,認(rèn)為未考慮AI系統(tǒng)具體應(yīng)用環(huán)境及風(fēng)險程度,不是最佳保護(hù)公眾方法。

    ?? 紐瑟姆強調(diào)已簽署17項AI相關(guān)法案,并邀請專家協(xié)助制定可行的AI監(jiān)管措施,凸顯了AI監(jiān)管的復(fù)雜性。

    8、科幻雜志遭遇AI作品泛濫沖擊

    在近年來人工智能技術(shù)迅猛發(fā)展的背景下,在線科幻與幻想雜志《Clarkesworld》遭遇到前所未有的挑戰(zhàn)。編輯們感到無奈與沮喪,創(chuàng)作環(huán)境惡化,但志愿者幫助建立垃圾郵件過濾器僅是臨時措施,長期解決方案仍需探索。

    【AiBase提要:】

    ??編輯們感到沮喪,雜志創(chuàng)始人關(guān)閉投稿通道是無奈之舉

    ??AI泛濫令創(chuàng)作環(huán)境惡化,志愿者幫助建立垃圾郵件過濾器

    ??長期解決方案仍需探索,科幻雜志面臨AI作品泛濫的生存威脅

    9、告別繁瑣!ScreenPipe讓你的屏幕“自動”工作24小時無休!

    厭倦了無休止的會議記錄和不同軟件間的切換?開源AI屏幕錄制工具ScreenPipe能解決你的煩惱。它不僅可以24小時不間斷記錄屏幕活動和音頻,還能自動完成工作任務(wù),節(jié)省時間精力。

    【AiBase提要:】

    ?24小時不間斷錄制:完整記錄屏幕活動和音頻數(shù)據(jù)。

    ?? 智能輔助服務(wù):自動更新筆記、生成報告、填充數(shù)據(jù)等。

    ?? 即時內(nèi)容概覽:快速提取關(guān)鍵信息,節(jié)省時間,抓住重點。

    詳情鏈接:https://github.com/mediar-ai/screenpipe

    10、智譜AI國慶大促:1折調(diào)用+1億免費tokens

    智譜AI和清言科技分別推出國慶特別活動和全新大會員體系,為用戶提供更多實惠和選擇。智譜AI開放平臺bigmodel.cn推出1折調(diào)用AI模型和1億tokens免費額度,降低企業(yè)和開發(fā)者使用高級AI服務(wù)成本。清言科技推出大會員體系,19元/月享受多項權(quán)益,讓更廣泛用戶群體負(fù)擔(dān)得起高級AI功能。

    image.png

    【AiBase提要:】

    ?? 智譜AI國慶大促,1折調(diào)用AI模型,降低企業(yè)和開發(fā)者成本。

    ?? 活動贈送1億tokens免費額度,讓更多人體驗先進(jìn)AI技術(shù)。

    ?? 清言科技推出19元起大會員體系,讓更廣泛用戶群體享受高級AI功能。

    舉報

    • 相關(guān)推薦
    • AI日報:阿里騰訊全面支持MCP協(xié)議;階躍星辰多模態(tài)推理模型Step-R1-V-Mini;美WHEE圖像生成模型Miracle F1

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日,中國人工智能領(lǐng)域迎來技術(shù)標(biāo)準(zhǔn)的變革,ModelContextProtocol成為國內(nèi)AI生態(tài)的事實標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B,性能?

    • AI日報:騰訊混元3D生成模型2.5版本發(fā)布;海螺推出圖像人物參考功能;百度上線移動端超級智能體心響App

      本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展:1)Kortix-AI推出開源通用AI智能體平臺Suna;2)騰訊混元3D生成模型升級至2.5版本;3)海螺AI推出基于單張圖像生成多角度角色圖像功能;4)百度發(fā)布"心響"App整合多智能體協(xié)作;5)Nari Labs開源媲美真人的對話語音模型Dia;6)Grok新增視覺處理和多語言支持;7)Genspark推出AI幻燈片工具;8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型;9)pad.ws結(jié)合白板和代碼編輯器;10)OpenBMB開源社區(qū)推出長文本生成模型"卷姬";11)騰訊推出AI閱讀助手"企鵝讀伴";12)OpenAI有意收購Chrome瀏覽器;13)字節(jié)跳動調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動化、3D生成、語音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

    • AI日報: OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP能工具箱;中國占全球AI專利60%

      【AI日報】欄目聚焦人工智能領(lǐng)域最新動態(tài):1) OpenAI推出ChatGPT圖像生成API,開發(fā)者可輕松集成AI繪圖功能,已生成超7億張圖片;2) 谷歌Gemini月活用戶突破3.5億,但仍落后于ChatGPT的6億用戶;3) OpenAI預(yù)測2029年收入將達(dá)1250億美元,AI代理業(yè)務(wù)成主要增長點;4) Ostris發(fā)布8B參數(shù)擴(kuò)散模型Flex.2-preview,優(yōu)化ComfyUI工作流;5) 英偉達(dá)推出多模態(tài)LLM模型Describe Anything,支持指定區(qū)域生成詳細(xì)描?

    • AI日報智譜開源32B/9B系列GLM模型并啟用Z.ai域名;OpenAI發(fā)布GPT-4.1系列模型;阿里魔搭上線MCP廣場

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、智譜AI啟用全新域名Z.ai 并開源32B/9B 系列 GLM 模型智譜技術(shù)團(tuán)隊近期宣布開源32B和9B系列的GLM模型,并推出全新交互體驗平臺Z.ai。這些模型遵循MIT許可協(xié)議,支持商業(yè)用途,提升了

    • 日銷破千元!AI生成3D掛件,被我們賣爆了

      先說結(jié)論:我們花15天做的AI3D掛件,在線下賣爆了,單日營收破千元!故事的開始,是因為我們發(fā)現(xiàn)把AI3D打印手辦做成一門小生意的可行性越來越高,這也激發(fā)了我們的“搞錢基因”。再加上前不久新榜在上海舉辦了「新榜內(nèi)容節(jié)」,一拍即合,我們于是做了一批模型去大會現(xiàn)場擺攤試水!最后結(jié)果還不錯,單日最高收入突破1000元,是我們“創(chuàng)業(yè)史”上的一個高光表現(xiàn)。歡迎大家

    • 雷軍愿望成真:AI換臉、聲音克隆假冒企業(yè)家將被重點整治

      快科技4月30日消息,近日,中央網(wǎng)信辦印發(fā)通知,在全國范圍內(nèi)部署開展為期3個月的清朗整治AI技術(shù)濫用”專項行動。其中,利用AI假冒他人實施侵權(quán)違法行為的將被重點整治。包括通過AI換臉、聲音克隆等深度偽造技術(shù),假冒專家、企業(yè)家、明星等公眾人物,欺騙網(wǎng)民,甚至營銷牟利。去年國慶假期,就曾有人用AI捏造雷軍配音,從吐槽假期到罵人,各種內(nèi)容應(yīng)有盡有。這讓雷軍非常困擾,發(fā)視頻呼吁大家不要再惡搞。今年3月,小米集團(tuán)創(chuàng)始人、董事長兼CEO雷軍在2025全國兩會上將提出5項建議。其中就有關(guān)于加強AI換臉擬聲”違法侵權(quán)重災(zāi)區(qū)治理的建議?

    • AI日報:即夢3.0內(nèi)測直出2K商業(yè)海報;ChatGPT又更新圖片生成功能;餓了么推“AI入駐智能經(jīng)理”

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。7、Genspark發(fā)布自動化AI代理SuperAgent具備自主思考、調(diào)用工具的能力Genspark最近推出了其全新的自動化AI代理SuperAgent,憑借其強大的自主思考和任務(wù)執(zhí)行能力,迅速成為行業(yè)的焦點。用戶只需輸入感興趣的主題,系統(tǒng)便能?

    • 字節(jié)發(fā)布豆包1.5深度思考模型:“實拍級”圖像生成

      快科技4月17日消息,據(jù)報道,今日,在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場,字節(jié)跳動旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出,豆包1.5深度思考模型在多個關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中,它能夠精準(zhǔn)高效地處理復(fù)雜問題;在創(chuàng)意寫作等通用任務(wù)方面,同樣表現(xiàn)出色。該模型采用MoE架構(gòu),總參數(shù)為200B,激?

    • AI日報:Kimi全新音頻基礎(chǔ)模型Kimi-Audio;階躍星辰開源圖像編輯模型Step1X-Edit;?夸克AI超級框上線 “拍照問夸克”

      本期AI日報聚焦多項AI技術(shù)突破與應(yīng)用:1)Moonshot AI推出開源音頻模型Kimi-Audio,基于13億小時訓(xùn)練數(shù)據(jù),支持語音識別等任務(wù);2)階躍星辰開源圖像編輯模型Step1X-Edit,展現(xiàn)強大生成能力;3)夸克AI上線"拍照問夸克"功能,實現(xiàn)視覺問答;4)蘋果iOS18.5將在中國推送,帶來智能功能;5)谷歌發(fā)布601個生成式AI應(yīng)用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動化系統(tǒng);7)OpenAI升級ChatGPT至GPT-4o版本,提升STEM領(lǐng)域能力;8)Ema公司推出高性價比語言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型;10)LemonAI推出實時音視頻數(shù)字人產(chǎn)品Slice Live。此外,國內(nèi)方面,智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動大模型發(fā)展,寶馬中國宣布新車將接入DeepSeek技術(shù)。

    • AI日報:阿里新模型Qwen3即將來襲;GitHub開源MCP服務(wù)器;Runway發(fā)布Gen-4 Turbo

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、Qwen3即將來襲:阿里云新模型相關(guān)支持已正式合并至vLLM代碼庫阿里云的Qwen3模型即將發(fā)布,標(biāo)志著其在AI領(lǐng)域的又一重要進(jìn)展。新推出的AI聽歌報告能夠精準(zhǔn)識別用戶音樂偏好,場景