?????????聚焦開發(fā)者
OpenAI開發(fā)者大會正式開始接受申請
2023年OpenAI開發(fā)者大會正式開始接受申請,計劃于11月6日在舊金山舉行,涵蓋主題演講、分組會議和晚間招待會。參會者需提交申請,門票費用為450美元,名額有限。主題演講將通過直播方式提供。分組會議將涵蓋API技術、AI產品開發(fā)最佳實踐等內容。
申請地址:https://devday.openai.com/
站長之家提要:
1. OpenAI將舉辦首屆開發(fā)者大會,匯聚開發(fā)者和團隊,預覽新工具和交流想法。
2. 參會者需提交申請,門票費用為450美元,名額有限,提前申請較有機會。
3. 主題演講將通過直播提供,分組會議將探討API技術和AI產品開發(fā)實踐等議題。
微軟在開發(fā)AI模型時泄露了38TB敏感數(shù)據(jù)
微軟在GitHub上錯誤使用Azure平臺的共享訪問簽名令牌(SAS),導致38TB的私人數(shù)據(jù)泄露,包括密碼、密鑰和內部消息。這次事件凸顯了AI模型訓練過程中的安全風險和挑戰(zhàn),需要更強的安全措施和協(xié)同工作來確保數(shù)據(jù)的安全性和隱私保護。
圖源備注:圖片由AI生成,圖片授權服務商Midjourney
站長之家提要:
1. 微軟在GitHub上分享AI模型訓練數(shù)據(jù)時,錯誤使用了權限過于寬松的SAS令牌,導致數(shù)據(jù)泄露。
2. 數(shù)據(jù)泄露包括38TB的私人文件,其中包括密碼、密鑰和內部Microsoft Teams消息,威脅了數(shù)據(jù)的安全性。
3. 事件突顯了SAS令牌的安全風險,強調AI模型訓練過程需要更強的安全措施和監(jiān)控以防止類似事件再次發(fā)生。
AI在玩一種很新的藝術!螺旋控制圖像Illusion Diffusion爆火
AI創(chuàng)作了一種新的藝術形式,引發(fā)了近700萬網(wǎng)友的圍觀,使用ControlNet技術,創(chuàng)造了一種螺旋圖形的錯覺圖像,受到廣泛關注。有網(wǎng)友甚至直接在Hugging Face上制作了——Illusion Diffusion,普通用戶只要打開瀏覽器就能玩。
項目地址:https://huggingface.co/spaces/AP123/IllusionDiffusion
站長之家提要:
1、AI創(chuàng)作了一系列圖像藝術作品,其中以棋盤和螺旋樣式最為流行,吸引了數(shù)百萬網(wǎng)友觀看和點贊。
2、這些AI作品被認為具有錯覺圖形大師埃舍爾的感覺,展示了AI在圖像創(chuàng)作領域的潛力。
3、使用ControlNet技術和開源AI文生圖模型,網(wǎng)友可以嘗試自己創(chuàng)作這種風格的圖像,而且還可以應用在視頻和其他領域。
Repilot開源:自動程序修復的高效補丁生成工具
Repilot是一款基于語義代碼補全和大型語言模型的程序修復工具,能夠自動分析代碼錯誤并生成修復補丁,具有錯誤修復、智能補全、Docker支持等核心功能,旨在提高開發(fā)和維護效率。
項目地址:https://github.com/ise-uiuc/Repilot
站長之家提要:
1. Repilot可自動分析源碼找出錯誤,并生成語義合理的補丁進行修復。
2. Repilot集成了語義代碼補全引擎,保證補丁語義正確。
3. Repilot支持Docker部署,提供詳盡文檔,易于上手使用。
JoJoGAN:可一鍵生成藝術化面部圖像的深度學習模型
JoJoGAN是一個深度學習模型,可將普通面部圖像轉化為藝術化作品,無需專業(yè)干預。它采用感知損失和身份損失的結合,確保生成圖像保持個體特征。使用Nvidia T4GPU,平均耗時14秒,成本0.0077美元。但僅適用于面部圖像,對GPU性能要求高。
項目地址:
https://www.aimodels.fyi/models/replicate/903681b6-e6d3-428c-b611-f6afb60b3d18
站長之家提要:
1. JoJoGAN是深度學習模型,將普通面部圖像轉化為藝術化作品,無需專業(yè)干預。
2. 它結合感知損失和身份損失,保持生成圖像的個體特征。
3. 需要Nvidia T4GPU,僅適用于面部圖像,對GPU性能要求高。
SyncDreamer:從單視圖圖像生成多視圖一致圖像以實現(xiàn)3D重建
SyncDreamer是一個端到端的框架,可以從單個視角的圖像生成多視圖一致的圖像,以實現(xiàn)3D重建。
項目地址:https://github.com/liuyuan-pal/SyncDreamer
站長之家提要:
1. SyncDreamer包含一個diffusion模型和一個differentiable renderer,可以生成質量高、多視圖一致的圖像。
2. 先通過diffusion模型生成圖像,再通過renderer生成對應的多視圖,計算一致性損失進行優(yōu)化。
3. SyncDreamer生成的圖像可用于高質量3D重建,有助于推動3D生成技術的進步。
韓國AI研究機構出品!MagiCapture:個性化生成高分辨率肖像照片
韓國AI研究機構推出MagiCapture技術,實現(xiàn)高分辨率肖像照片的多概念個性化生成。該方法采用多概念定制,融合主題和風格概念,只需少量參考即可生成高分辨率肖像照片。
論文網(wǎng)址:https://arxiv.org/abs/2309.06895
站長之家提要:
1、MagiCapture采用多概念定制方法,融合主題和風格概念,生成高質量個性化肖像照。
2、研究人員提供新的注意力重新聚焦損失和即時學習策略,明顯優(yōu)于基線方法。
3、MagiCapture代表肖像生成領域的重要技術進步,為用戶提供更便捷的個性化肖像生成。
??????AI新鮮事
B站UP主手作AI男士婚紗引圍觀 視頻播放量超43萬
一句話概括:B站UP主受AI男士婚紗照啟發(fā),策劃一個月成功制作了一套男士婚紗,視頻展示了設計過程,播放量超過43萬。
站長之家提要:
1. UP主在女士婚紗基礎上改造,加入了露腰設計,使用蕾絲和網(wǎng)紗呼應上衣,創(chuàng)新以網(wǎng)紗替代裙擺。
2. 男士婚紗在現(xiàn)實不常見,需要大膽創(chuàng)新,難度較高,UP主克服了種種困難成功制作。
3. 視頻在B站上引發(fā)熱議,播放量超過43萬,許多網(wǎng)友紛紛分享喜好。
小紅書博主用AI生成電商模特圖賺到2000
小紅書博主“知影Studio”使用AI技術為客戶生成電商模特形象照,僅用一個下午的時間就完成了6-7套照片創(chuàng)作,質量較高,為電商領域開辟了新的應用場景。
站長之家提要:
1、博主用AI工具為客戶快速生成電商形象照片,只用一個下午完成6-7套照片。
2、AI生成的電商模特圖像效率高、質量較好,難以找出破綻。
3、小紅書用戶希望看到更豐富、更實用的AI生成電商內容,有利于電商領域創(chuàng)新。
Nvidia第二季度交付900噸AI芯片 Meta可能是最大單客戶
Nvidia在第二季度交付了900噸AI芯片,其中大部分可能供應給Meta,引發(fā)了市場的廣泛關注。Omdia的研究表明,對Nvidia AI芯片的需求激增,導致服務器平均價格上漲30%,并且市場規(guī)模預測將增長8%。
站長之家提要:
1. Nvidia第二季度向客戶交付了900噸H100AI芯片。
2. 根據(jù)Omdia報告,Nvidia AI芯片需求激增,服務器平均價格上漲30%。
3. 盡管AI硬件需求增加,但AI實際采用增長相對較慢,未來領域特定AI模型將成為重點。
MSN刪除了抄襲、亂編的AI文章,但問題仍未解決
MSN刊登了一篇似乎由人工智能生成的文章,涉及前NBA球員Brandon Hunter的死訊,后來被撤下。這篇文章被指責抄襲TMZ Sports博客,并且內容混亂不堪,由一家名為Race Track的出版社制作。盡管MSN刪除了這篇文章,但Race Track仍然發(fā)布一連串難以理解的文章,MSN繼續(xù)轉載。這問題尚未得到解決。
圖源備注:圖片由AI生成,圖片授權服務商Midjourney
站長之家提要:
1. MSN新聞發(fā)布了一篇似乎由人工智能生成的文章,內容涉及前NBA球員Brandon Hunter的消息,后來被指責抄襲并撤下。
2. 這篇文章由名為Race Track的出版社制作,內容混亂不堪,很可能抄襲了TMZ Sports博客的內容。
3. 雖然MSN刪除了有爭議的文章,但Race Track繼續(xù)發(fā)布難以理解的文章,而MSN則繼續(xù)轉載,凸顯了內容審查方法的缺失問題。
ChatGPT競爭對手Writer,獲得1億美元融資
Writer獲得1億美元B輪融資,主要面向企業(yè)市場,提供類似于ChatGPT的功能,注重數(shù)據(jù)安全和可解釋性。
站長之家提要:
Writer的融資由ICONIQ Growth領投,已吸引知名企業(yè)投資,收入增長迅速。
Writer的核心技術是Palmyra大語言模型,已在不同領域取得成功。
Writer提供多種功能,包括文本生成和數(shù)據(jù)安全,適用于各種主流業(yè)務場景。
騰訊AI新專利可判斷文件對應情緒
騰訊近日獲得了一項關于利用AI處理文本情感的專利。該專利提出了一種方法,可以根據(jù)用戶查看文檔時的情緒反饋,來判斷并展示文檔的情緒傾向,從而讓用戶對文檔內容有更明確的預判。
站長之家提要:
1. 專利可以獲取用戶查看文檔時的情緒數(shù)據(jù),并展示文檔的情緒可視化圖像。
2. 根據(jù)用戶情緒數(shù)據(jù)實時更新并展示情緒可視化圖像。
3. 通過情緒可視化圖像,用戶可以判斷文檔內容的情緒傾向,提升體驗。
英國公布AI監(jiān)管原則 開發(fā)者須對輸出內容負責
英國競爭與市場管理局提出新的AI監(jiān)管標準,強調開發(fā)者對AI輸出內容負責,關注問責和透明度,英國政府致力于推動健康發(fā)展的AI技術。
站長之家提要:
1、英國競爭與市場管理局引領AI監(jiān)管,要求開發(fā)者負責AI系統(tǒng)輸出內容,關注問責和透明度。
2、英國政府計劃成為全球AI產業(yè)和監(jiān)管的領導者,將舉辦全球AI峰會,同時放寬AI文本和數(shù)據(jù)的版權限制,吸引AI企業(yè)入駐。
3、全球范圍內,AI監(jiān)管成為熱議話題,各國在制定AI法規(guī)和原則方面積極行動,旨在平衡創(chuàng)新和消費者權益。
英偉達與 Anyscale 合作
英偉達與Anyscale合作,旨在提高大型語言模型和生成式AI應用的開發(fā)效率,解決處理器需求增加和資源受限的問題。
圖片來自NVIDIA
站長之家提要:
1. 大型語言模型在生成式AI工具中需要更多處理器,但處理器價格高昂且供應有限,云資源也無法完全解決擴展規(guī)模的問題。
2. 英偉達將其AI技術引入Anyscale平臺,支持流行的開源模型嵌入到應用程序中,并提供自動擴展推理功能,提高性能。
3. Anyscale的Ray框架是全球增長最快的可擴展計算統(tǒng)一框架,與英偉達的合作旨在加速大型語言模型和生成AI應用的開發(fā),提供前所未有的速度和效率。
甲骨文發(fā)布語音AI助手,助力醫(yī)療保健領域
甲骨文公司發(fā)布語音生成式AI助手,旨在改善醫(yī)療保健領域的工作流程,將整合到電子健康記錄解決方案中,提供多模態(tài)支持,自動化管理醫(yī)療記錄,幫助醫(yī)護人員提高患者護理質量。
圖源備注:圖片由AI生成,圖片授權服務商Midjourney
站長之家提要:
1. 甲骨文推出生成式AI助手,解決醫(yī)療保健領域的工作效率和人員短缺問題。
2. 助手通過文本或語音命令工作,提供多模態(tài)支持,改善電子健康記錄的管理和患者護理流程。
3. 助手還提供患者自助服務體驗,可用于安排約會或支付賬單,預計在未來12個月內全面推出以改善醫(yī)護工作流程。
人工智能可以檢測癡呆癥了!有望改善治療效果
最近賓夕法尼亞州蓋辛格健康系統(tǒng)的研究發(fā)現(xiàn),人工智能工具在檢測未確診癡呆癥方面具有潛在有效性,提供了改善早期診斷和治療的新希望。這項研究表明AI在早期癡呆癥識別中準確性顯著,可為提高生活質量和治療效果提供支持。
圖源備注:圖片由AI生成,圖片授權服務商Midjourney
站長之家提要:
1. 賓夕法尼亞州蓋辛格健康系統(tǒng)的研究發(fā)現(xiàn),AI算法在早期癡呆癥的診斷中表現(xiàn)出卓越準確性。
2. 早期癡呆癥的診斷對干預和治療至關重要,傳統(tǒng)方法通常耗時且困難。
3. AI診斷工具有望提高癡呆癥患者的生活質量,加速診斷速度和準確性在臨床實踐中的應用。
????????大模型動態(tài)
OpenAI多模態(tài)AI系統(tǒng)GPT-Vision即將推出 與谷歌Gemini競爭
OpenAI即將推出GPT-Vision多模態(tài)AI系統(tǒng),與谷歌Gemini形成直接競爭。GPT-Vision可支持圖像和文本輸入,實現(xiàn)視覺能力增強。OpenAI加速商業(yè)化布局,意在搶占先機。業(yè)內認為OpenAI與谷歌競爭將推動行業(yè)技術進步。
站長之家提要:
1、OpenAI將推出GPT-Vision多模態(tài)AI系統(tǒng),與谷歌Gemini直接競爭
2、GPT-Vision支持圖像和文本輸入,實現(xiàn)視覺能力增強
3、OpenAI與谷歌競爭有利于行業(yè)技術進步
多模態(tài)大模型MMICL霸榜 支持文本圖像視頻輸入
北京交通大學等機構推出多模態(tài)大模型MMICL,它支持文本、圖像、視頻三種模態(tài)混合輸入,在多項評測中表現(xiàn)搶眼,已開源兩個版本,有望成為多模態(tài)領域新寵。
項目地址:https://github.com/HaozheZhao/MIC
站長之家提要:
1. MMICL支持文本、圖像、視頻三種模態(tài)混合輸入,在多項多模態(tài)能力評測中表現(xiàn)突出。
2. MMICL采用兩階段訓練,可實現(xiàn)“現(xiàn)學現(xiàn)賣”,有效緩解視覺語言模型中的語言偏見。
3. MMICL已開源可商用的Flan版和僅科研用的Vicuna版,都發(fā)布在GitHub上。
??????AI應用
字節(jié)跳動旗下云服務火山引擎數(shù)智平臺VeDI發(fā)布AI助手
字節(jié)跳動旗下云服務火山引擎在數(shù)據(jù)驅動科技峰會上推出了數(shù)智平臺VeDI的AI助手,通過接入大語言模型,可以幫助企業(yè)提升數(shù)據(jù)處理和查詢分析效率,即使不懂編程的員工也可以進行業(yè)務運營數(shù)據(jù)的分析。
站長之家提要:
1. 火山引擎推出VeDI數(shù)智平臺的AI助手
2. AI助手接入大語言模型,提升數(shù)據(jù)處理效率
3. 即使不會編程也可以進行業(yè)務數(shù)據(jù)分析
谷歌AI聊天機器人 Bard 新增Gmail等谷歌應用插件
谷歌AI聊天機器人Bard最近更新,新增對Gmail、Docs、Drive等谷歌應用的插件支持,可以實時獲取谷歌服務信息并與用戶交互。
站長之家提要:
1. Bard支持應用插件,可以獲取谷歌服務實時數(shù)據(jù),如地圖、YouTube等。
2. 用戶可以點擊插件圖標或輸入前綴@調用插件與Bard交互。
3. Bard新增公共鏈接分享功能,用戶可以分享對話給他人在自己設備上繼續(xù)交互。
Chat Video:用GPT分析和總結視頻
ChatVideo是基于人工智能的視頻分析和管理工具,利用其獨特的AI技術,能夠通過語音識別快速轉錄視頻內容成文字,自動生成視頻大綱和總結,并提供強大的問答功能,同時還具備多種可視化功能,提高了視頻的可用性,使用戶能夠高效學習和管理視頻。
站長之家提要:
1. ChatVideo利用AI技術實現(xiàn)高效視頻管理,包括語音識別、自動生成大綱和總結、強大問答功能等。
2. 用戶能夠通過文字稿件快速定位視頻內容,無需重復播放,提高學習效率。
3. 多種可視化功能提升視頻理解,用戶可選擇不同模式獲得最佳體驗。
(舉報)