无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > 多模態(tài)最新資訊  > 正文

    AI視野:多模態(tài)ChatGPT即將上線;抖音“AI美式證件照”走紅;百度發(fā)布交通大模型“ACE3.0”

    2023-09-26 14:58 · 稿源:站長之家

    文頭.jpg

    ??????AI新鮮事

    多模態(tài)ChatGPT即將上線 會看圖、聽聲音、說話

    OpenAI在美東時間9月25日宣布對ChatGPT進行重磅升級,實現(xiàn)了看圖、聽聲音、輸出語音內(nèi)容的三大功能,為通用人工智能(AGI)邁出重要一步。

    微信截圖_20230926075244.png

    AiBase提要:

    ?? ChatGPT實現(xiàn)多模態(tài)功能,支持看圖、聽聲音、說話

    ??? 新語音功能能生成人類音頻,圖片理解功能提供多種應(yīng)用

    ?? OpenAI重視安全,逐步推出功能,防范風(fēng)險

    ?? Spotify和Be My Eyes已經(jīng)使用新功能,拓寬應(yīng)用領(lǐng)域

    DeepMind研究:LLMs在圖像和音頻壓縮方面出色表現(xiàn)

    Google旗下的DeepMind研究人員發(fā)現(xiàn),大型語言模型(LLMs)除了在文本領(lǐng)域表現(xiàn)出色,還在圖像和音頻數(shù)據(jù)的壓縮方面具備出色能力,超越了專用的壓縮算法如PNG和FLAC。

    AiBase提要:

    ?? 研究人員發(fā)現(xiàn)LLMs不僅在文本上表現(xiàn)出色,還在圖像和音頻壓縮上取得顯著成功。

    ?? 這項研究將LLMs視為強大的數(shù)據(jù)壓縮器,提供了新的理解模型能力的視角。

    ?? LLMs的性能與數(shù)據(jù)集大小相關(guān),壓縮率成為評估模型學(xué)習(xí)數(shù)據(jù)集信息的指標(biāo)。

    SambaNova發(fā)布全新AI芯片SN40L,可運行5萬億參數(shù)模型

    SambaNova發(fā)布了一款新型AI芯片SN40L,支持運行高達5萬億參數(shù)的大模型,提升模型質(zhì)量和推理速度,降低總體擁有成本。

    AiBase提要

    ?? SambaNova的新AI芯片SN40L支持單節(jié)點上運行5萬億參數(shù)模型,大大提升了模型質(zhì)量和推理速度。

    ?? SN40L采用先進設(shè)計,同時支持HBM和DRAM內(nèi)存,算法可以根據(jù)需要選擇合適的內(nèi)存類型。

    ?? SN40L集成到SambaNova的全棧大語言模型平臺,幫助客戶訓(xùn)練和部署大模型如GPT-4。

    SK電訊宣布AI金字塔戰(zhàn)略,力爭成為全球AI巨頭

    SK電訊宣布AI金字塔戰(zhàn)略,加速創(chuàng)新與投資,重點聚焦AI基礎(chǔ)設(shè)施、轉(zhuǎn)型和服務(wù),力爭成為全球AI巨頭。

    AiBase提要:

    SK電訊未來5年AI相關(guān)投資將從12%大幅提升至33%

    AI基礎(chǔ)設(shè)施包括數(shù)據(jù)中心、AI芯片和多語言模型,是SK電訊AI能力的集中體現(xiàn)

    SK電訊正式推出個人AI助手A.,并計劃帶入全球市場

    Snap 與微軟合作在其「My AI」聊天機器人對話中投放廣告

    Snapchat 與微軟合作,將在其 AI 產(chǎn)品 My AI 中插入廣告。這個合作意味著用戶與 AI 聊天機器人對話時,可能會收到與他們的查詢相關(guān)的贊助商鏈接建議。這個廣告形式類似于與對話相關(guān)的 Sponsored Links,而微軟的廣告業(yè)務(wù)正取得新的進展,與其他科技公司競爭合作伙伴。Snapchat 表示這一功能還處于早期實驗階段,但他們計劃與更多合作伙伴合作,以增強 My AI。

    ?? AiBase提要:

    1. Snapchat 與微軟合作,為 My AI 聊天機器人插入廣告,提供用戶相關(guān)的贊助商鏈接建議。

    2. 微軟的廣告業(yè)務(wù)取得進展,與超過7500個合作伙伴品牌合作,在 AI 聊天機器人中插入廣告。

    3. Snap 表示這一功能仍在早期實驗階段,計劃與更多合作伙伴合作,以增強 My AI。

    哈佛研究發(fā)現(xiàn)GPT-4使得企業(yè)員工績效提升了40%

    哈佛大學(xué)領(lǐng)導(dǎo)的研究發(fā)現(xiàn),使用生成式人工智能的波士頓咨詢集團顧問的任務(wù)完成質(zhì)量、速度和頻率均有顯著提升,相較不使用AI的同行,提高了40%的績效。

    AiBase提要

    ??研究發(fā)現(xiàn)GPT-4使波士頓咨詢集團顧問的績效提高了40%

    ??這是首次大規(guī)模研究企業(yè)中生成式AI的實際應(yīng)用效果

    ??部分顧問采用“Cyborg”和“Centaur”方式使用AI,為未來應(yīng)用提供啟示

    抖音網(wǎng)友用AI生成各國版蜘蛛俠獲贊6.7萬

    一位抖音網(wǎng)友使用AI軟件生成不同國家風(fēng)格的蜘蛛俠形象,獲得了大量好評和點贊。這些蜘蛛俠形象充滿了各國的特色和代表性元素,例如中國風(fēng)格的武俠風(fēng)、冰島冰霜氣息、牙買加的紅黃綠經(jīng)典三色以及沙特的富裕感。目前,該系列作品已獲得6.7萬點贊。

    image.png

    AiBase提要:

    ???♂? 一位抖音網(wǎng)友使用AI軟件生成不同國家風(fēng)格的蜘蛛俠形象。

    ??這些蜘蛛俠形象融入了各國的文化特色,獲得了6.7萬的點贊。

    ?? AI軟件生成熱門IP形象成為獲得更高曝光的趨勢。

    抖音上線“亞運加油盲盒”AI特效

    抖音官方在杭州亞運會期間推出了“亞運加油盲盒”AI特效,可以給用戶照片添加卡通化的亞運造型,已有超過147萬人使用。

    image.png

    AiBase提要:

    ?? 亞運加油盲盒AI特效可以為用戶照片生成卡通化的亞運造型,衣服可變?yōu)檫\動裝

    ?? 特效可能使用了ControlNet等技術(shù)來分析人物動作和體態(tài)

    ?? 本屆亞運還展示了多項AI技術(shù)應(yīng)用,如修復(fù)老照片、數(shù)字人點燃火炬等

    抖音“AI美式證件照”走紅 相關(guān)話題播放量過億

    AI生成的證件照模板越來越受歡迎,抖音上AI美式證件照話題播放量過億,但部分網(wǎng)友認為生成效果不太像。

    image.png

    AiBase提要:

    ?? AI證件照走紅,抖音相關(guān)話題播放過億

    ?? 剪映AI美式證件照受歡迎,但部分網(wǎng)友認為生成效果不像

    ?? 相比抖音,AI寫真軟件生成效果更好,門檻更高

    富士通推出新技術(shù)保護對話型AI免受幻覺和對抗性攻擊

    富士通推出兩項新技術(shù)可檢測對話型AI中的幻覺和網(wǎng)絡(luò)釣魚網(wǎng)址,以提高對話型AI的可靠性和安全性。

    AiBase提要:

    ?? 富士通推出技術(shù)可檢測對話AI回復(fù)中的幻覺,提高檢測準(zhǔn)確率約22%。

    ?? 富士通開發(fā)技術(shù)可檢測對話AI中植入的網(wǎng)絡(luò)釣魚網(wǎng)址,防止用戶受到欺騙。

    ?? 兩項新技術(shù)將集成到富士通AI平臺,有助保護企業(yè)用戶免受各種威脅。

    DeepMind利用無監(jiān)督學(xué)習(xí)開發(fā)AlphaMissense,預(yù)測7100萬種基因突變

    DeepMind開發(fā)AlphaMissense,利用AlphaFold模型預(yù)測蛋白質(zhì)結(jié)構(gòu),再結(jié)合無監(jiān)督學(xué)習(xí)對7100萬種基因錯義突變進行預(yù)測,在多個數(shù)據(jù)集上的預(yù)測正確率達90%以上。

    論文地址:https://www.science.org/doi/10.1126/science.adg7492

    AiBase提要

    ?? 利用AlphaFold分析蛋白質(zhì)結(jié)構(gòu),基于此開發(fā)AlphaMissense模型

    ?? 訓(xùn)練數(shù)據(jù)集包括已知的良性和預(yù)測的致病錯義突變

    ?? 在多個數(shù)據(jù)集上表現(xiàn)優(yōu)異,總體預(yù)測正確率達90%以上

    ??????聚焦開發(fā)者

    Rerender A Video源代碼放出!解決AI視頻閃爍問題

    Rerender A Video項目通過零訓(xùn)練的文本引導(dǎo)視頻到視頻翻譯框架,實現(xiàn)了低成本的時間一致性,解決了AI視頻閃爍問題。

    image.png

    項目地址:https://github.com/williamyang1991/Rerender_A_Video

    AiBase提要:

    ?? 通過交叉幀約束實現(xiàn)時間一致性

    ?? 無需訓(xùn)練即可應(yīng)用于各類視頻翻譯任務(wù)

    ?? 支持結(jié)合現(xiàn)有圖像生成模型進行自定義翻譯

    高效開源LLM框架Haystack 助力打造高效應(yīng)用程序

    Haystack是一個端到端的自然語言處理框架,能夠幫助構(gòu)建由大型語言模型、Transformer模型、向量搜索等驅(qū)動的應(yīng)用程序。

    image.png

    項目地址:https://github.com/deepset-ai/haystack

    AiBase提要

    ?? Haystack的核心功能包括流水線、節(jié)點、代理、工具和文檔存儲。

    ?? Haystack支持多種文檔存儲,包括ElasticSearch、Opensearch、Weaviate等。

    ?? Haystack可以幫助使用最先進的NLP模型構(gòu)建端到端的NLP應(yīng)用程序。

    萬能AI編程工具包插件Sidekick 提供個性化編程幫助

    文章介紹了微軟開發(fā)的萬能AI編程工具包插件Sidekick,通過GPT-4引擎提供支持,根據(jù)用戶編程習(xí)慣提供個性化編程幫助,提高編程效率。

    image.png

    體驗地址:

    https://marketplace.visualstudio.com/items?itemName=InvisibleTools.sidekickai&%3Butm_source=9527ai&utm_source=talkingdev.uwl.me

    AiBase 提要:

    Sidekick AI能根據(jù)用戶編程需求提供個性化編程幫助

    Sidekick AI具有快速聊天、代碼附加等功能幫助開發(fā)

    Sidekick AI通過GPT-4提高編碼效率,重新定義AI編程工具

    EmoPP模型開源:一款基于情感感知的韻律短語生成模型

    EmoPP-Demo是一款基于情感感知的韻律短語生成模型,通過預(yù)測短語分隔符來提升端到端文本轉(zhuǎn)語音的自然度和情感表達能力,開源代碼在GitHub。

    image.png

    地址:https://ai-s2-lab.github.io/EmoPP/

    AiBase提要:

    ?? EmoPP-Demo可以自動識別話語中的情感線索,并生成韻律短語分隔符。

    ?? 經(jīng)過評估,EmoPP-Demo在情感表達方面表現(xiàn)出色,優(yōu)于基線模型。

    ?? EmoPP-Demo提供語音演示,驗證其在人類感知中的優(yōu)越性。

    ??????AI應(yīng)用

    Getty Images與Nvidia合作開發(fā)生成式AI圖片工具

    圖片庫巨頭Getty Images與芯片制造商Nvidia宣布合作,共同開發(fā)生成式AI圖片工具,這引發(fā)了有關(guān)創(chuàng)作者應(yīng)獲取創(chuàng)作權(quán)的爭議,將推動思考AI如何影響文化創(chuàng)意產(chǎn)業(yè)。

    image.png

    AiBase提要:

    ?? Getty推出基于自有圖庫訓(xùn)練的生成AI,為AI藝術(shù)品提供版權(quán)保障

    ?? 該技術(shù)為藝術(shù)家提供新的創(chuàng)作工具,也帶來創(chuàng)作靈感和資源

    ?? 合作引發(fā)版權(quán)和創(chuàng)作者權(quán)益保護等爭議,需要找到平衡

    Spotify 將使用 OpenAI 人工智能技術(shù)克隆播客聲音

    Spotify正在測試使用OpenAI的語音生成技術(shù),讓播客主持人用自己的聲音模擬不同語言版本,以方便觸達其他語言區(qū)的聽眾。

    AiBase提要:

    ?? Spotify與部分播客主持人合作,用AI技術(shù)把他們的英語內(nèi)容翻譯成其他語言。

    ?? Spotify表示該技術(shù)來自O(shè)penAI,可以保留播客獨特的語音特征。

    ?? 這種新技術(shù)被稱為“語音翻譯”,已在西班牙推出,其他語言版本也將陸續(xù)推出。

    ????????大模型動態(tài)

    百度智能云發(fā)布交通行業(yè)大模型“ACE3.0”

    百度智能云在全球可持續(xù)交通高峰論壇上,發(fā)布了基于大模型重構(gòu)的智能交通解決方案ACE3.0,利用大模型的知識壓縮能力,實現(xiàn)對交通行業(yè)的AI原生重構(gòu)。

    AiBase提要:

    ??百度表示,ACE3.0利用大模型強大的知識壓縮能力,將車、路、云、圖的基本能力進行了聚合和泛化升級,打造交通大模型。

    ??模型層即交通行業(yè)大模型,基于語言、視覺和跨模態(tài)大模型構(gòu)成;應(yīng)用層則包含智慧網(wǎng)聯(lián)、智慧交管等智能交通場景。

    ??百度智能交通已聯(lián)合140多家生態(tài)伙伴,為200多個城市提供智能交通服務(wù)。未來還將依托行業(yè)大模型,繼續(xù)推動交通智能化。

    什么值得買開發(fā)大模型

    值得買表示,大數(shù)據(jù)和大模型是公司非常關(guān)注的領(lǐng)域,公司已經(jīng)在該領(lǐng)域加大了投入。在大數(shù)據(jù)層面,目前隨著公司逐步沉淀來自于消費內(nèi)容業(yè)務(wù)板塊和營銷服務(wù)業(yè)務(wù)板塊等的更多數(shù)據(jù)資源,已形成一個能夠涵蓋人、貨、場等多種維度的底層數(shù)據(jù)體系。

    AiBase提要

    ?? 公司關(guān)注大數(shù)據(jù)和大模型領(lǐng)域,加大投入

    ?? 積累多維度數(shù)據(jù)資源,包括人、貨、場

    ?? 開發(fā)“值得買消費內(nèi)容大模型”和應(yīng)用產(chǎn)品探索

    聆心智能開源定制角色對話交互模型CharacterGLM-6B

    聆心智能發(fā)布了CharacterGLM-6B模型,用于定制化角色對話。該模型基于ChatGLM模型,有6B、12B和66B三個不同參數(shù)量的版本。聆心智能將開放12B和66B模型的API訪問,并開源CharacterGLM-6B模型,以促進AI角色扮演和AI在心理學(xué)中的應(yīng)用。性能評估結(jié)果顯示,CharacterGLM在大多數(shù)類別和話題下表現(xiàn)優(yōu)于競爭對手,并提供了不同類別角色的對話交互效果示例。

    開源地址:

    https://huggingface.co/LingxinAI/CharacterGLM-6b

    API調(diào)用地址:

    CharacterGLM API: https://bigmodel.cn/dev/api#characterglm

    AiBase提要

    ?? 聆心智能發(fā)布CharacterGLM-6B,定制角色對話交互模型

    ?? 基于ChatGLM模型,包括6B、12B和66B版本

    ?? 開源CharacterGLM-6B,推動AI角色扮演和心理學(xué)應(yīng)用

    舉報

    • 相關(guān)推薦