无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

AI視野：多模態(tài)ChatGPT即將上線；抖音“AI美式證件照”走紅；百度發(fā)布交通大模型“ACE3.0”

2023-09-26 14:58 · 稿源：站長之家

文頭.jpg

??????AI新鮮事

多模態(tài)ChatGPT即將上線會看圖、聽聲音、說話

OpenAI在美東時間9月25日宣布對ChatGPT進行重磅升級，實現(xiàn)了看圖、聽聲音、輸出語音內(nèi)容的三大功能，為通用人工智能（AGI）邁出重要一步。

微信截圖_20230926075244.png

AiBase提要:
?? ChatGPT實現(xiàn)多模態(tài)功能，支持看圖、聽聲音、說話
??? 新語音功能能生成人類音頻，圖片理解功能提供多種應(yīng)用
?? OpenAI重視安全，逐步推出功能，防范風(fēng)險
?? Spotify和Be My Eyes已經(jīng)使用新功能，拓寬應(yīng)用領(lǐng)域

DeepMind研究:LLMs在圖像和音頻壓縮方面出色表現(xiàn)

Google旗下的DeepMind研究人員發(fā)現(xiàn)，大型語言模型（LLMs）除了在文本領(lǐng)域表現(xiàn)出色，還在圖像和音頻數(shù)據(jù)的壓縮方面具備出色能力，超越了專用的壓縮算法如PNG和FLAC。

AiBase提要:
?? 研究人員發(fā)現(xiàn)LLMs不僅在文本上表現(xiàn)出色，還在圖像和音頻壓縮上取得顯著成功。
?? 這項研究將LLMs視為強大的數(shù)據(jù)壓縮器，提供了新的理解模型能力的視角。
?? LLMs的性能與數(shù)據(jù)集大小相關(guān)，壓縮率成為評估模型學(xué)習(xí)數(shù)據(jù)集信息的指標(biāo)。

SambaNova發(fā)布全新AI芯片SN40L，可運行5萬億參數(shù)模型

SambaNova發(fā)布了一款新型AI芯片SN40L，支持運行高達5萬億參數(shù)的大模型，提升模型質(zhì)量和推理速度，降低總體擁有成本。

AiBase提要
?? SambaNova的新AI芯片SN40L支持單節(jié)點上運行5萬億參數(shù)模型，大大提升了模型質(zhì)量和推理速度。
?? SN40L采用先進設(shè)計，同時支持HBM和DRAM內(nèi)存，算法可以根據(jù)需要選擇合適的內(nèi)存類型。
?? SN40L集成到SambaNova的全棧大語言模型平臺，幫助客戶訓(xùn)練和部署大模型如GPT-4。

SK電訊宣布AI金字塔戰(zhàn)略，力爭成為全球AI巨頭

SK電訊宣布AI金字塔戰(zhàn)略，加速創(chuàng)新與投資，重點聚焦AI基礎(chǔ)設(shè)施、轉(zhuǎn)型和服務(wù)，力爭成為全球AI巨頭。

AiBase提要:
SK電訊未來5年AI相關(guān)投資將從12%大幅提升至33%
AI基礎(chǔ)設(shè)施包括數(shù)據(jù)中心、AI芯片和多語言模型，是SK電訊AI能力的集中體現(xiàn)
SK電訊正式推出個人AI助手A.，并計劃帶入全球市場

Snap 與微軟合作在其「My AI」聊天機器人對話中投放廣告

Snapchat 與微軟合作，將在其 AI 產(chǎn)品 My AI 中插入廣告。這個合作意味著用戶與 AI 聊天機器人對話時，可能會收到與他們的查詢相關(guān)的贊助商鏈接建議。這個廣告形式類似于與對話相關(guān)的 Sponsored Links，而微軟的廣告業(yè)務(wù)正取得新的進展，與其他科技公司競爭合作伙伴。Snapchat 表示這一功能還處于早期實驗階段，但他們計劃與更多合作伙伴合作，以增強 My AI。

?? AiBase提要:
1. Snapchat 與微軟合作，為 My AI 聊天機器人插入廣告，提供用戶相關(guān)的贊助商鏈接建議。
2. 微軟的廣告業(yè)務(wù)取得進展，與超過7500個合作伙伴品牌合作，在 AI 聊天機器人中插入廣告。
3. Snap 表示這一功能仍在早期實驗階段，計劃與更多合作伙伴合作，以增強 My AI。

哈佛研究發(fā)現(xiàn)GPT-4使得企業(yè)員工績效提升了40%

哈佛大學(xué)領(lǐng)導(dǎo)的研究發(fā)現(xiàn)，使用生成式人工智能的波士頓咨詢集團顧問的任務(wù)完成質(zhì)量、速度和頻率均有顯著提升，相較不使用AI的同行，提高了40%的績效。

AiBase提要
??研究發(fā)現(xiàn)GPT-4使波士頓咨詢集團顧問的績效提高了40%
??這是首次大規(guī)模研究企業(yè)中生成式AI的實際應(yīng)用效果
??部分顧問采用“Cyborg”和“Centaur”方式使用AI，為未來應(yīng)用提供啟示

抖音網(wǎng)友用AI生成各國版蜘蛛俠獲贊6.7萬

一位抖音網(wǎng)友使用AI軟件生成不同國家風(fēng)格的蜘蛛俠形象，獲得了大量好評和點贊。這些蜘蛛俠形象充滿了各國的特色和代表性元素，例如中國風(fēng)格的武俠風(fēng)、冰島冰霜氣息、牙買加的紅黃綠經(jīng)典三色以及沙特的富裕感。目前，該系列作品已獲得6.7萬點贊。

AiBase提要:
???♂? 一位抖音網(wǎng)友使用AI軟件生成不同國家風(fēng)格的蜘蛛俠形象。
??這些蜘蛛俠形象融入了各國的文化特色，獲得了6.7萬的點贊。
?? AI軟件生成熱門IP形象成為獲得更高曝光的趨勢。

抖音上線“亞運加油盲盒”AI特效

抖音官方在杭州亞運會期間推出了“亞運加油盲盒”AI特效，可以給用戶照片添加卡通化的亞運造型，已有超過147萬人使用。

AiBase提要:
?? 亞運加油盲盒AI特效可以為用戶照片生成卡通化的亞運造型，衣服可變?yōu)檫\動裝
?? 特效可能使用了ControlNet等技術(shù)來分析人物動作和體態(tài)
?? 本屆亞運還展示了多項AI技術(shù)應(yīng)用，如修復(fù)老照片、數(shù)字人點燃火炬等

抖音“AI美式證件照”走紅相關(guān)話題播放量過億

AI生成的證件照模板越來越受歡迎，抖音上AI美式證件照話題播放量過億，但部分網(wǎng)友認為生成效果不太像。

AiBase提要:
?? AI證件照走紅，抖音相關(guān)話題播放過億
?? 剪映AI美式證件照受歡迎，但部分網(wǎng)友認為生成效果不像
?? 相比抖音，AI寫真軟件生成效果更好，門檻更高

富士通推出新技術(shù)保護對話型AI免受幻覺和對抗性攻擊

富士通推出兩項新技術(shù)可檢測對話型AI中的幻覺和網(wǎng)絡(luò)釣魚網(wǎng)址，以提高對話型AI的可靠性和安全性。

AiBase提要:
?? 富士通推出技術(shù)可檢測對話AI回復(fù)中的幻覺，提高檢測準(zhǔn)確率約22%。
?? 富士通開發(fā)技術(shù)可檢測對話AI中植入的網(wǎng)絡(luò)釣魚網(wǎng)址，防止用戶受到欺騙。
?? 兩項新技術(shù)將集成到富士通AI平臺，有助保護企業(yè)用戶免受各種威脅。

DeepMind利用無監(jiān)督學(xué)習(xí)開發(fā)AlphaMissense，預(yù)測7100萬種基因突變

DeepMind開發(fā)AlphaMissense，利用AlphaFold模型預(yù)測蛋白質(zhì)結(jié)構(gòu)，再結(jié)合無監(jiān)督學(xué)習(xí)對7100萬種基因錯義突變進行預(yù)測，在多個數(shù)據(jù)集上的預(yù)測正確率達90%以上。

論文地址:https://www.science.org/doi/10.1126/science.adg7492

AiBase提要
?? 利用AlphaFold分析蛋白質(zhì)結(jié)構(gòu)，基于此開發(fā)AlphaMissense模型
?? 訓(xùn)練數(shù)據(jù)集包括已知的良性和預(yù)測的致病錯義突變
?? 在多個數(shù)據(jù)集上表現(xiàn)優(yōu)異，總體預(yù)測正確率達90%以上

??????聚焦開發(fā)者

Rerender A Video源代碼放出!解決AI視頻閃爍問題

Rerender A Video項目通過零訓(xùn)練的文本引導(dǎo)視頻到視頻翻譯框架，實現(xiàn)了低成本的時間一致性，解決了AI視頻閃爍問題。

項目地址:https://github.com/williamyang1991/Rerender_A_Video

AiBase提要:
?? 通過交叉幀約束實現(xiàn)時間一致性
?? 無需訓(xùn)練即可應(yīng)用于各類視頻翻譯任務(wù)
?? 支持結(jié)合現(xiàn)有圖像生成模型進行自定義翻譯

高效開源LLM框架Haystack 助力打造高效應(yīng)用程序

Haystack是一個端到端的自然語言處理框架，能夠幫助構(gòu)建由大型語言模型、Transformer模型、向量搜索等驅(qū)動的應(yīng)用程序。

項目地址:https://github.com/deepset-ai/haystack

AiBase提要
?? Haystack的核心功能包括流水線、節(jié)點、代理、工具和文檔存儲。
?? Haystack支持多種文檔存儲，包括ElasticSearch、Opensearch、Weaviate等。
?? Haystack可以幫助使用最先進的NLP模型構(gòu)建端到端的NLP應(yīng)用程序。

萬能AI編程工具包插件Sidekick 提供個性化編程幫助

文章介紹了微軟開發(fā)的萬能AI編程工具包插件Sidekick，通過GPT-4引擎提供支持，根據(jù)用戶編程習(xí)慣提供個性化編程幫助，提高編程效率。

體驗地址:

https://marketplace.visualstudio.com/items?itemName=InvisibleTools.sidekickai&%3Butm_source=9527ai&utm_source=talkingdev.uwl.me

AiBase 提要:
Sidekick AI能根據(jù)用戶編程需求提供個性化編程幫助
Sidekick AI具有快速聊天、代碼附加等功能幫助開發(fā)
Sidekick AI通過GPT-4提高編碼效率，重新定義AI編程工具

EmoPP模型開源:一款基于情感感知的韻律短語生成模型

EmoPP-Demo是一款基于情感感知的韻律短語生成模型，通過預(yù)測短語分隔符來提升端到端文本轉(zhuǎn)語音的自然度和情感表達能力，開源代碼在GitHub。

地址:https://ai-s2-lab.github.io/EmoPP/

AiBase提要:
?? EmoPP-Demo可以自動識別話語中的情感線索，并生成韻律短語分隔符。
?? 經(jīng)過評估，EmoPP-Demo在情感表達方面表現(xiàn)出色，優(yōu)于基線模型。
?? EmoPP-Demo提供語音演示，驗證其在人類感知中的優(yōu)越性。

??????AI應(yīng)用

Getty Images與Nvidia合作開發(fā)生成式AI圖片工具

圖片庫巨頭Getty Images與芯片制造商Nvidia宣布合作，共同開發(fā)生成式AI圖片工具，這引發(fā)了有關(guān)創(chuàng)作者應(yīng)獲取創(chuàng)作權(quán)的爭議，將推動思考AI如何影響文化創(chuàng)意產(chǎn)業(yè)。

AiBase提要:
?? Getty推出基于自有圖庫訓(xùn)練的生成AI，為AI藝術(shù)品提供版權(quán)保障
?? 該技術(shù)為藝術(shù)家提供新的創(chuàng)作工具，也帶來創(chuàng)作靈感和資源
?? 合作引發(fā)版權(quán)和創(chuàng)作者權(quán)益保護等爭議，需要找到平衡

Spotify 將使用 OpenAI 人工智能技術(shù)克隆播客聲音

Spotify正在測試使用OpenAI的語音生成技術(shù)，讓播客主持人用自己的聲音模擬不同語言版本，以方便觸達其他語言區(qū)的聽眾。

AiBase提要:
?? Spotify與部分播客主持人合作，用AI技術(shù)把他們的英語內(nèi)容翻譯成其他語言。
?? Spotify表示該技術(shù)來自O(shè)penAI，可以保留播客獨特的語音特征。
?? 這種新技術(shù)被稱為“語音翻譯”，已在西班牙推出，其他語言版本也將陸續(xù)推出。

????????大模型動態(tài)

百度智能云發(fā)布交通行業(yè)大模型“ACE3.0”

百度智能云在全球可持續(xù)交通高峰論壇上，發(fā)布了基于大模型重構(gòu)的智能交通解決方案ACE3.0，利用大模型的知識壓縮能力，實現(xiàn)對交通行業(yè)的AI原生重構(gòu)。

AiBase提要:
??百度表示，ACE3.0利用大模型強大的知識壓縮能力，將車、路、云、圖的基本能力進行了聚合和泛化升級，打造交通大模型。
??模型層即交通行業(yè)大模型，基于語言、視覺和跨模態(tài)大模型構(gòu)成;應(yīng)用層則包含智慧網(wǎng)聯(lián)、智慧交管等智能交通場景。
??百度智能交通已聯(lián)合140多家生態(tài)伙伴，為200多個城市提供智能交通服務(wù)。未來還將依托行業(yè)大模型，繼續(xù)推動交通智能化。

什么值得買開發(fā)大模型

值得買表示，大數(shù)據(jù)和大模型是公司非常關(guān)注的領(lǐng)域，公司已經(jīng)在該領(lǐng)域加大了投入。在大數(shù)據(jù)層面，目前隨著公司逐步沉淀來自于消費內(nèi)容業(yè)務(wù)板塊和營銷服務(wù)業(yè)務(wù)板塊等的更多數(shù)據(jù)資源，已形成一個能夠涵蓋人、貨、場等多種維度的底層數(shù)據(jù)體系。

AiBase提要
?? 公司關(guān)注大數(shù)據(jù)和大模型領(lǐng)域，加大投入
?? 積累多維度數(shù)據(jù)資源，包括人、貨、場
?? 開發(fā)“值得買消費內(nèi)容大模型”和應(yīng)用產(chǎn)品探索

聆心智能開源定制角色對話交互模型CharacterGLM-6B

聆心智能發(fā)布了CharacterGLM-6B模型，用于定制化角色對話。該模型基于ChatGLM模型，有6B、12B和66B三個不同參數(shù)量的版本。聆心智能將開放12B和66B模型的API訪問，并開源CharacterGLM-6B模型，以促進AI角色扮演和AI在心理學(xué)中的應(yīng)用。性能評估結(jié)果顯示，CharacterGLM在大多數(shù)類別和話題下表現(xiàn)優(yōu)于競爭對手，并提供了不同類別角色的對話交互效果示例。

開源地址:

https://huggingface.co/LingxinAI/CharacterGLM-6b

API調(diào)用地址:

CharacterGLM API: https://bigmodel.cn/dev/api#characterglm

AiBase提要
?? 聆心智能發(fā)布CharacterGLM-6B，定制角色對話交互模型
?? 基于ChatGLM模型，包括6B、12B和66B版本
?? 開源CharacterGLM-6B，推動AI角色扮演和心理學(xué)應(yīng)用

（舉報）

相關(guān)推薦

關(guān)鍵詞：

多模態(tài)

?AI創(chuàng)企Reka發(fā)布多模態(tài)AI助手Yasa-1，欲與ChatGPT競爭

由DeepMind、Google、百度和Meta的研究人員共同創(chuàng)立的AI創(chuàng)企Reka，最近宣布了最新產(chǎn)品一款多模態(tài)AI助手Yasa-1。這款助手被設(shè)計成可以理解和互動文本、圖像、視頻和音頻等多種媒體形式，被認為有望成為OpenAI的ChatGPT的競爭對手。Yasa-1的發(fā)布標(biāo)志著多模態(tài)AI助手領(lǐng)域的競爭愈發(fā)激烈，預(yù)示著未來AI助手將在不同媒體類型之間進行更多復(fù)雜的交互，為用戶提供更多有趣和實用的功能。

?Yasa-1 ?多模態(tài)AI助手 ?ChatGPT
薦重磅！OpenAI將發(fā)布DALL·E 3，多模態(tài)ChatGPT來了！

9月21日凌晨，OpenAI在官網(wǎng)宣布，在今年10月份將通過API向ChatGPTPlus和企業(yè)版用戶提供全新文本生成圖片產(chǎn)品——DALL·E3。ChatGPT在DALL·E3加持下將開啟久違的多模態(tài)輸出模式，用戶通過文本就能直接在ChatGPT中生成各種類型圖片。從展示可以看出，DALL·E3可以生成寫實、二次元、平面、創(chuàng)意、朋克、3D等多種類型的圖片。

?DALL·E
百度智能云發(fā)布交通行業(yè)大模型“ACE3.0”

在近日的全球可持續(xù)交通高峰論壇上，百度智能云展示了基于大模型全面重構(gòu)的智能交通解決方案ACE3.0。ACE3.0利用了大模型強大的知識壓縮能力，將車、路、云、圖的基本能力和交通全要素進行了聚合和泛化升級，打造了交通大模型。百度將依托智能交通行業(yè)大模型，繼續(xù)為交通強國建設(shè)貢獻力量，致力成為中國智能交通現(xiàn)代化開路先鋒。
ChatGPT推出語音和圖像多模態(tài)功能預(yù)計未來兩周內(nèi)上線

OpenAI宣布將在ChatGPT中推出新的語音和圖像功能。這些功能可以通過語音對話或展示圖片的方式與ChatGPT進行交互。語音功能將在iOS和Android平臺上使用圖像功能將在所有平臺上提供。
薦AI視野：ChatGPT用戶可以訪問互聯(lián)網(wǎng)了；Photoshop網(wǎng)頁版正式推出；微調(diào)多模態(tài)大模型會災(zāi)難性遺忘

OpenAI宣布ChatGPT用戶現(xiàn)在可以瀏覽互聯(lián)網(wǎng)，不再受限于2021年9月之前的數(shù)據(jù)。這一更新允許用戶訪問最新信息，拓展了ChatGPT的應(yīng)用領(lǐng)域。該模型性能出色，免費下載無限制。

?ChatGPT
抖音“AI美式證件照”走紅相關(guān)話題播放量過億

AI生成的證件照模板越來越受歡迎，其中美式復(fù)古證件照和韓系證件照最受歡迎。在剪映APP中，用戶只需選擇“剪同款”并上傳自己的照片，AI就能自動生成一張美式證件照。從這一點來看，門檻低、操作簡單的產(chǎn)品更容易贏得市場和用戶的青睞，因此剪映的AI證件照和AI寫真特效能夠吸引更多用戶也就不足為奇了。

?AI證件照
薦AI視野：圖文混合創(chuàng)作大模型浦語靈筆發(fā)布；微軟GitHub Copilot每個用戶倒賠20美元；AI天才楊植麟交卷大模型產(chǎn)品Kimi Chat；ChatGPT 移動應(yīng)用9月收入創(chuàng)紀錄

清華AI楊植麟創(chuàng)業(yè)公司MoonshotAI發(fā)布KimiChat，支持20萬字長文本，解決大模型上下文窗口長度問題，旨在打造C端SuperApp。目前Claude支持最大長文本為100kGPT-4則是32k。Fotor最新推出的全套AI工具包括AI文字生圖、AI以圖生圖、AI擴圖、AI背景創(chuàng)作、AI換臉、AI編輯、智能消除和人像編輯等功能。

?浦語靈筆
薦AI視野：文心大模型4.0將發(fā)布;Stability AI發(fā)布移動端語言模型Stable LM3B;OpenAI舉辦ChatGPT應(yīng)用開發(fā)大賽；視覺中國、華為云攜手打造視覺大模型

百度正在加速訓(xùn)練文心大模型4.0，并計劃在10月17日的百度世界大會上發(fā)布。這一新版本將是文心大模型3.5的重要升級，重點提升基礎(chǔ)模型能力，尤其在邏輯推理、代碼和數(shù)學(xué)等方面取得顯著進展。GoogleDeepMind提出DRaFT算法以高效優(yōu)化擴散模型GoogleDeepMind最新提出的DRaFT算法用于高效優(yōu)化擴散模型，提高了文本到圖像生成等實際應(yīng)用的效率和性能，成為機器學(xué)習(xí)領(lǐng)域的有價值工具?

?文心大模型
ChatGPT的“地下經(jīng)濟”，給AI行業(yè)帶來了什么？

自從ChatGPT問世以來，大模型如何落地、盈利，就成了無數(shù)創(chuàng)業(yè)者都在思考的問題。一個尷尬的現(xiàn)實是，現(xiàn)階段C端最受歡迎的一類AI應(yīng)用，實在讓人很難以啟齒……盡管ChatGPT發(fā)布后，OpenAI十分注重模型的安全性、合規(guī)性，但還是有很多開發(fā)者攻破了ChatGPT的安全漏洞，讓GPT實現(xiàn)了“越獄”，并開發(fā)出了各種突破限制的AI應(yīng)用。這樣的“預(yù)演”，在C端大模型落地困難的今天，無疑提供了一種另類的“經(jīng)驗”。

?ChatGPT
生數(shù)科技發(fā)布自研多模態(tài)通用大模型同時推出PixWeaver、VoxCraft等工具

9月20日，生數(shù)科技發(fā)布了自主研發(fā)的多模態(tài)通用大模型，并同時推出了兩款應(yīng)用產(chǎn)品:視覺創(chuàng)意設(shè)計平臺PixWeaver和3D資產(chǎn)創(chuàng)建工具VoxCraft。生數(shù)科技的多模態(tài)通用大模型采用底層融合的思路，將Transformer架構(gòu)引入擴散模型，實現(xiàn)文本、圖像、3D、視頻等多模態(tài)知識的融合。生數(shù)科技的大模型還面向游戲制作、影視制作、廣告營銷等多個行業(yè)提供服務(wù)能力，支持各類創(chuàng)意內(nèi)容的生成。

熱文

3 天
7天

站長商機

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM