??????AI新鮮事
多模態(tài)ChatGPT即將上線 會看圖、聽聲音、說話
OpenAI在美東時間9月25日宣布對ChatGPT進行重磅升級,實現(xiàn)了看圖、聽聲音、輸出語音內(nèi)容的三大功能,為通用人工智能(AGI)邁出重要一步。
AiBase提要:
?? ChatGPT實現(xiàn)多模態(tài)功能,支持看圖、聽聲音、說話
??? 新語音功能能生成人類音頻,圖片理解功能提供多種應(yīng)用
?? OpenAI重視安全,逐步推出功能,防范風(fēng)險
?? Spotify和Be My Eyes已經(jīng)使用新功能,拓寬應(yīng)用領(lǐng)域
DeepMind研究:LLMs在圖像和音頻壓縮方面出色表現(xiàn)
Google旗下的DeepMind研究人員發(fā)現(xiàn),大型語言模型(LLMs)除了在文本領(lǐng)域表現(xiàn)出色,還在圖像和音頻數(shù)據(jù)的壓縮方面具備出色能力,超越了專用的壓縮算法如PNG和FLAC。
AiBase提要:
?? 研究人員發(fā)現(xiàn)LLMs不僅在文本上表現(xiàn)出色,還在圖像和音頻壓縮上取得顯著成功。
?? 這項研究將LLMs視為強大的數(shù)據(jù)壓縮器,提供了新的理解模型能力的視角。
?? LLMs的性能與數(shù)據(jù)集大小相關(guān),壓縮率成為評估模型學(xué)習(xí)數(shù)據(jù)集信息的指標(biāo)。
SambaNova發(fā)布全新AI芯片SN40L,可運行5萬億參數(shù)模型
SambaNova發(fā)布了一款新型AI芯片SN40L,支持運行高達5萬億參數(shù)的大模型,提升模型質(zhì)量和推理速度,降低總體擁有成本。
AiBase提要
?? SambaNova的新AI芯片SN40L支持單節(jié)點上運行5萬億參數(shù)模型,大大提升了模型質(zhì)量和推理速度。
?? SN40L采用先進設(shè)計,同時支持HBM和DRAM內(nèi)存,算法可以根據(jù)需要選擇合適的內(nèi)存類型。
?? SN40L集成到SambaNova的全棧大語言模型平臺,幫助客戶訓(xùn)練和部署大模型如GPT-4。
SK電訊宣布AI金字塔戰(zhàn)略,力爭成為全球AI巨頭
SK電訊宣布AI金字塔戰(zhàn)略,加速創(chuàng)新與投資,重點聚焦AI基礎(chǔ)設(shè)施、轉(zhuǎn)型和服務(wù),力爭成為全球AI巨頭。
AiBase提要:
SK電訊未來5年AI相關(guān)投資將從12%大幅提升至33%
AI基礎(chǔ)設(shè)施包括數(shù)據(jù)中心、AI芯片和多語言模型,是SK電訊AI能力的集中體現(xiàn)
SK電訊正式推出個人AI助手A.,并計劃帶入全球市場
Snap 與微軟合作在其「My AI」聊天機器人對話中投放廣告
Snapchat 與微軟合作,將在其 AI 產(chǎn)品 My AI 中插入廣告。這個合作意味著用戶與 AI 聊天機器人對話時,可能會收到與他們的查詢相關(guān)的贊助商鏈接建議。這個廣告形式類似于與對話相關(guān)的 Sponsored Links,而微軟的廣告業(yè)務(wù)正取得新的進展,與其他科技公司競爭合作伙伴。Snapchat 表示這一功能還處于早期實驗階段,但他們計劃與更多合作伙伴合作,以增強 My AI。
?? AiBase提要:
1. Snapchat 與微軟合作,為 My AI 聊天機器人插入廣告,提供用戶相關(guān)的贊助商鏈接建議。
2. 微軟的廣告業(yè)務(wù)取得進展,與超過7500個合作伙伴品牌合作,在 AI 聊天機器人中插入廣告。
3. Snap 表示這一功能仍在早期實驗階段,計劃與更多合作伙伴合作,以增強 My AI。
哈佛研究發(fā)現(xiàn)GPT-4使得企業(yè)員工績效提升了40%
哈佛大學(xué)領(lǐng)導(dǎo)的研究發(fā)現(xiàn),使用生成式人工智能的波士頓咨詢集團顧問的任務(wù)完成質(zhì)量、速度和頻率均有顯著提升,相較不使用AI的同行,提高了40%的績效。
AiBase提要
??研究發(fā)現(xiàn)GPT-4使波士頓咨詢集團顧問的績效提高了40%
??這是首次大規(guī)模研究企業(yè)中生成式AI的實際應(yīng)用效果
??部分顧問采用“Cyborg”和“Centaur”方式使用AI,為未來應(yīng)用提供啟示
抖音網(wǎng)友用AI生成各國版蜘蛛俠獲贊6.7萬
一位抖音網(wǎng)友使用AI軟件生成不同國家風(fēng)格的蜘蛛俠形象,獲得了大量好評和點贊。這些蜘蛛俠形象充滿了各國的特色和代表性元素,例如中國風(fēng)格的武俠風(fēng)、冰島冰霜氣息、牙買加的紅黃綠經(jīng)典三色以及沙特的富裕感。目前,該系列作品已獲得6.7萬點贊。
AiBase提要:
???♂? 一位抖音網(wǎng)友使用AI軟件生成不同國家風(fēng)格的蜘蛛俠形象。
??這些蜘蛛俠形象融入了各國的文化特色,獲得了6.7萬的點贊。
?? AI軟件生成熱門IP形象成為獲得更高曝光的趨勢。
抖音上線“亞運加油盲盒”AI特效
抖音官方在杭州亞運會期間推出了“亞運加油盲盒”AI特效,可以給用戶照片添加卡通化的亞運造型,已有超過147萬人使用。
AiBase提要:
?? 亞運加油盲盒AI特效可以為用戶照片生成卡通化的亞運造型,衣服可變?yōu)檫\動裝
?? 特效可能使用了ControlNet等技術(shù)來分析人物動作和體態(tài)
?? 本屆亞運還展示了多項AI技術(shù)應(yīng)用,如修復(fù)老照片、數(shù)字人點燃火炬等
抖音“AI美式證件照”走紅 相關(guān)話題播放量過億
AI生成的證件照模板越來越受歡迎,抖音上AI美式證件照話題播放量過億,但部分網(wǎng)友認為生成效果不太像。
AiBase提要:
?? AI證件照走紅,抖音相關(guān)話題播放過億
?? 剪映AI美式證件照受歡迎,但部分網(wǎng)友認為生成效果不像
?? 相比抖音,AI寫真軟件生成效果更好,門檻更高
富士通推出新技術(shù)保護對話型AI免受幻覺和對抗性攻擊
富士通推出兩項新技術(shù)可檢測對話型AI中的幻覺和網(wǎng)絡(luò)釣魚網(wǎng)址,以提高對話型AI的可靠性和安全性。
AiBase提要:
?? 富士通推出技術(shù)可檢測對話AI回復(fù)中的幻覺,提高檢測準(zhǔn)確率約22%。
?? 富士通開發(fā)技術(shù)可檢測對話AI中植入的網(wǎng)絡(luò)釣魚網(wǎng)址,防止用戶受到欺騙。
?? 兩項新技術(shù)將集成到富士通AI平臺,有助保護企業(yè)用戶免受各種威脅。
DeepMind利用無監(jiān)督學(xué)習(xí)開發(fā)AlphaMissense,預(yù)測7100萬種基因突變
DeepMind開發(fā)AlphaMissense,利用AlphaFold模型預(yù)測蛋白質(zhì)結(jié)構(gòu),再結(jié)合無監(jiān)督學(xué)習(xí)對7100萬種基因錯義突變進行預(yù)測,在多個數(shù)據(jù)集上的預(yù)測正確率達90%以上。
論文地址:https://www.science.org/doi/10.1126/science.adg7492
AiBase提要
?? 利用AlphaFold分析蛋白質(zhì)結(jié)構(gòu),基于此開發(fā)AlphaMissense模型
?? 訓(xùn)練數(shù)據(jù)集包括已知的良性和預(yù)測的致病錯義突變
?? 在多個數(shù)據(jù)集上表現(xiàn)優(yōu)異,總體預(yù)測正確率達90%以上
??????聚焦開發(fā)者
Rerender A Video源代碼放出!解決AI視頻閃爍問題
Rerender A Video項目通過零訓(xùn)練的文本引導(dǎo)視頻到視頻翻譯框架,實現(xiàn)了低成本的時間一致性,解決了AI視頻閃爍問題。
項目地址:https://github.com/williamyang1991/Rerender_A_Video
AiBase提要:
?? 通過交叉幀約束實現(xiàn)時間一致性
?? 無需訓(xùn)練即可應(yīng)用于各類視頻翻譯任務(wù)
?? 支持結(jié)合現(xiàn)有圖像生成模型進行自定義翻譯
高效開源LLM框架Haystack 助力打造高效應(yīng)用程序
Haystack是一個端到端的自然語言處理框架,能夠幫助構(gòu)建由大型語言模型、Transformer模型、向量搜索等驅(qū)動的應(yīng)用程序。
項目地址:https://github.com/deepset-ai/haystack
AiBase提要
?? Haystack的核心功能包括流水線、節(jié)點、代理、工具和文檔存儲。
?? Haystack支持多種文檔存儲,包括ElasticSearch、Opensearch、Weaviate等。
?? Haystack可以幫助使用最先進的NLP模型構(gòu)建端到端的NLP應(yīng)用程序。
萬能AI編程工具包插件Sidekick 提供個性化編程幫助
文章介紹了微軟開發(fā)的萬能AI編程工具包插件Sidekick,通過GPT-4引擎提供支持,根據(jù)用戶編程習(xí)慣提供個性化編程幫助,提高編程效率。
體驗地址:
https://marketplace.visualstudio.com/items?itemName=InvisibleTools.sidekickai&%3Butm_source=9527ai&utm_source=talkingdev.uwl.me
AiBase 提要:
Sidekick AI能根據(jù)用戶編程需求提供個性化編程幫助
Sidekick AI具有快速聊天、代碼附加等功能幫助開發(fā)
Sidekick AI通過GPT-4提高編碼效率,重新定義AI編程工具
EmoPP模型開源:一款基于情感感知的韻律短語生成模型
EmoPP-Demo是一款基于情感感知的韻律短語生成模型,通過預(yù)測短語分隔符來提升端到端文本轉(zhuǎn)語音的自然度和情感表達能力,開源代碼在GitHub。
地址:https://ai-s2-lab.github.io/EmoPP/
AiBase提要:
?? EmoPP-Demo可以自動識別話語中的情感線索,并生成韻律短語分隔符。
?? 經(jīng)過評估,EmoPP-Demo在情感表達方面表現(xiàn)出色,優(yōu)于基線模型。
?? EmoPP-Demo提供語音演示,驗證其在人類感知中的優(yōu)越性。
??????AI應(yīng)用
Getty Images與Nvidia合作開發(fā)生成式AI圖片工具
圖片庫巨頭Getty Images與芯片制造商Nvidia宣布合作,共同開發(fā)生成式AI圖片工具,這引發(fā)了有關(guān)創(chuàng)作者應(yīng)獲取創(chuàng)作權(quán)的爭議,將推動思考AI如何影響文化創(chuàng)意產(chǎn)業(yè)。
AiBase提要:
?? Getty推出基于自有圖庫訓(xùn)練的生成AI,為AI藝術(shù)品提供版權(quán)保障
?? 該技術(shù)為藝術(shù)家提供新的創(chuàng)作工具,也帶來創(chuàng)作靈感和資源
?? 合作引發(fā)版權(quán)和創(chuàng)作者權(quán)益保護等爭議,需要找到平衡
Spotify 將使用 OpenAI 人工智能技術(shù)克隆播客聲音
Spotify正在測試使用OpenAI的語音生成技術(shù),讓播客主持人用自己的聲音模擬不同語言版本,以方便觸達其他語言區(qū)的聽眾。
AiBase提要:
?? Spotify與部分播客主持人合作,用AI技術(shù)把他們的英語內(nèi)容翻譯成其他語言。
?? Spotify表示該技術(shù)來自O(shè)penAI,可以保留播客獨特的語音特征。
?? 這種新技術(shù)被稱為“語音翻譯”,已在西班牙推出,其他語言版本也將陸續(xù)推出。
????????大模型動態(tài)
百度智能云發(fā)布交通行業(yè)大模型“ACE3.0”
百度智能云在全球可持續(xù)交通高峰論壇上,發(fā)布了基于大模型重構(gòu)的智能交通解決方案ACE3.0,利用大模型的知識壓縮能力,實現(xiàn)對交通行業(yè)的AI原生重構(gòu)。
AiBase提要:
??百度表示,ACE3.0利用大模型強大的知識壓縮能力,將車、路、云、圖的基本能力進行了聚合和泛化升級,打造交通大模型。
??模型層即交通行業(yè)大模型,基于語言、視覺和跨模態(tài)大模型構(gòu)成;應(yīng)用層則包含智慧網(wǎng)聯(lián)、智慧交管等智能交通場景。
??百度智能交通已聯(lián)合140多家生態(tài)伙伴,為200多個城市提供智能交通服務(wù)。未來還將依托行業(yè)大模型,繼續(xù)推動交通智能化。
什么值得買開發(fā)大模型
值得買表示,大數(shù)據(jù)和大模型是公司非常關(guān)注的領(lǐng)域,公司已經(jīng)在該領(lǐng)域加大了投入。在大數(shù)據(jù)層面,目前隨著公司逐步沉淀來自于消費內(nèi)容業(yè)務(wù)板塊和營銷服務(wù)業(yè)務(wù)板塊等的更多數(shù)據(jù)資源,已形成一個能夠涵蓋人、貨、場等多種維度的底層數(shù)據(jù)體系。
AiBase提要
?? 公司關(guān)注大數(shù)據(jù)和大模型領(lǐng)域,加大投入
?? 積累多維度數(shù)據(jù)資源,包括人、貨、場
?? 開發(fā)“值得買消費內(nèi)容大模型”和應(yīng)用產(chǎn)品探索
聆心智能開源定制角色對話交互模型CharacterGLM-6B
聆心智能發(fā)布了CharacterGLM-6B模型,用于定制化角色對話。該模型基于ChatGLM模型,有6B、12B和66B三個不同參數(shù)量的版本。聆心智能將開放12B和66B模型的API訪問,并開源CharacterGLM-6B模型,以促進AI角色扮演和AI在心理學(xué)中的應(yīng)用。性能評估結(jié)果顯示,CharacterGLM在大多數(shù)類別和話題下表現(xiàn)優(yōu)于競爭對手,并提供了不同類別角色的對話交互效果示例。
開源地址:
https://huggingface.co/LingxinAI/CharacterGLM-6b
API調(diào)用地址:
CharacterGLM API: https://bigmodel.cn/dev/api#characterglm
AiBase提要
?? 聆心智能發(fā)布CharacterGLM-6B,定制角色對話交互模型
?? 基于ChatGLM模型,包括6B、12B和66B版本
?? 開源CharacterGLM-6B,推動AI角色扮演和心理學(xué)應(yīng)用
(舉報)