歡迎來(lái)到【AI視野】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
?????????聚焦開(kāi)發(fā)者
阿里推ReplaceAnything框架 可通過(guò)AI替換萬(wàn)物
阿里智能計(jì)算研究院提出的ReplaceAnything框架通過(guò)AI技術(shù),實(shí)現(xiàn)對(duì)服裝、證件照背景、人臉等的替換,引發(fā)社區(qū)熱議。
【AiBase提要:】
?? ReplaceAnything框架引發(fā)社區(qū)熱議,可替換服裝、人臉,降低明星代言費(fèi)用。
?? 電商可提升產(chǎn)品形象,減少攝影成本;個(gè)人用戶(hù)一鍵生成證件照,省時(shí)省力。
?? 技術(shù)進(jìn)步將為用戶(hù)帶來(lái)更豐富、便捷的體驗(yàn),同時(shí)帶來(lái)新思考和挑戰(zhàn)。
試玩地址:https://top.aibase.com/tool/replaceanything
使用教程:http://www.vquan.org.cn/2024/0115/1590471.shtml
FMA-Net技術(shù)解決視頻快速移動(dòng)抖動(dòng)問(wèn)題
FMA-Net是一種前景廣闊的視頻處理技術(shù),能夠智能地將模糊的低分辨率視頻恢復(fù)成清晰的高分辨率視頻,特別擅長(zhǎng)處理快速移動(dòng)導(dǎo)致的抖動(dòng)問(wèn)題。
【AiBase提要:】
??? FMA-Net能理解視頻中物體的運(yùn)動(dòng),以智能方式改善畫(huà)質(zhì)和去除模糊,適用于拍攝中的快速移動(dòng)場(chǎng)景。
?? 這項(xiàng)技術(shù)的獨(dú)特之處在于能夠恢復(fù)視頻的清晰度,無(wú)論是拍攝人物、車(chē)輛,還是攝像機(jī)快速移動(dòng),都能處理并保持高清穩(wěn)定狀態(tài)。
?? FMA-Net的出現(xiàn)預(yù)示著視頻處理領(lǐng)域?qū)⒂瓉?lái)革命性的變化,為用戶(hù)提供更清晰、更穩(wěn)定的視頻體驗(yàn)。
項(xiàng)目地址:https://top.aibase.com/tool/fma-net
LLM AutoEval:AI平臺(tái)自動(dòng)評(píng)估Google Colab中的LLM
LLM AutoEval是一個(gè)旨在簡(jiǎn)化和加速語(yǔ)言模型(LLMs)評(píng)估過(guò)程的工具,通過(guò)自動(dòng)化設(shè)置和執(zhí)行、可定制的評(píng)估參數(shù)以及摘要生成和GitHub Gist上傳,提供了方便的Colab筆記本和快速展示模型性能的功能。
【AiBase提要】
?? 自動(dòng)化設(shè)置和執(zhí)行: LLM AutoEval使用RunPod簡(jiǎn)化Colab中LLM的設(shè)置和執(zhí)行,實(shí)現(xiàn)無(wú)縫部署。
?? 可定制的評(píng)估參數(shù): 開(kāi)發(fā)者可選擇基準(zhǔn)套件(nous或openllm)微調(diào)評(píng)估,提高LLMs性能。
?? 摘要生成和GitHub Gist上傳: LLM AutoEval生成評(píng)估結(jié)果摘要,方便上傳至GitHub Gist分享和參考。
項(xiàng)目網(wǎng)址:https://github.com/mlabonne/llm-autoeval?tab=readme-ov-file
??????AI應(yīng)用
Pika推視頻畫(huà)面擴(kuò)充功能 支持調(diào)整視頻風(fēng)格
Pika官方近日宣布推出視頻畫(huà)面擴(kuò)充功能,用戶(hù)可通過(guò)點(diǎn)擊Expand Canvas按鈕擴(kuò)展畫(huà)面,同時(shí)支持調(diào)整視頻風(fēng)格。比如生成森林美女后,用戶(hù)可輸入提示擴(kuò)充畫(huà)面,也可通過(guò)編輯按鈕調(diào)整視頻風(fēng)格,如生成動(dòng)漫效果視頻。
【AiBase提要:】
?? 畫(huà)面擴(kuò)充功能: Pika推出Expand Canvas功能,用戶(hù)可在生成圖像后點(diǎn)擊按鈕擴(kuò)充畫(huà)面,實(shí)現(xiàn)更豐富的內(nèi)容。
??? 調(diào)整視頻風(fēng)格: Pika支持用戶(hù)通過(guò)編輯按鈕輸入提示,輕松切換視頻風(fēng)格,如生成動(dòng)漫效果等。
?? 創(chuàng)新視頻生成: Pika是基于人工智能技術(shù)的視頻生成應(yīng)用,旨在幫助用戶(hù)快速創(chuàng)作個(gè)性化、有趣的短視頻內(nèi)容。
SD社區(qū)推圖生視頻插件I2V-Adapter
SD社區(qū)最新發(fā)布的I2V-Adapter插件解決了圖像到視頻生成的挑戰(zhàn),采用創(chuàng)新的輕量級(jí)適配器模塊,無(wú)需改變現(xiàn)有模型結(jié)構(gòu)和參數(shù)即可實(shí)現(xiàn)靜態(tài)圖像到動(dòng)態(tài)視頻的轉(zhuǎn)換。
【AiBase提要:】
?? 即插即用創(chuàng)新: SD社區(qū)推出的I2V-Adapter插件采用輕量級(jí)適配器模塊,不需改變模型結(jié)構(gòu),實(shí)現(xiàn)圖像到視頻生成任務(wù)。
?? 參數(shù)減少兼容性增強(qiáng): I2V-Adapter大幅減少可訓(xùn)練參數(shù),與Stable Diffusion等模型兼容,提高生成視頻的質(zhì)量與動(dòng)態(tài)性。
?? 實(shí)驗(yàn)證明有效性: 經(jīng)過(guò)定量與定性實(shí)驗(yàn)證明,I2V-Adapter在美學(xué)評(píng)分、首幀一致性、運(yùn)動(dòng)幅度等方面表現(xiàn)優(yōu)異,為I2V領(lǐng)域開(kāi)創(chuàng)了新可能。
項(xiàng)目主頁(yè):https://top.aibase.com/tool/i2v-adapter
多語(yǔ)言文檔OCR工具包Surya 實(shí)現(xiàn)準(zhǔn)確的逐行文本檢測(cè)和識(shí)別
Surya是一款多語(yǔ)言文檔OCR工具包,具備準(zhǔn)確的逐行文本檢測(cè)和識(shí)別功能,支持多種語(yǔ)言處理,包括表格和圖表檢測(cè),以及即將推出的文本識(shí)別功能。
【AiBase提要】
?? Surya是多語(yǔ)言文檔OCR工具,實(shí)現(xiàn)逐行文本檢測(cè)和識(shí)別。
?? 支持多語(yǔ)言處理,包括英語(yǔ)、中文、日文、印地語(yǔ)等。
?? 即將推出文本識(shí)別、表格和圖表檢測(cè)功能。
項(xiàng)目地址:https://top.aibase.com/tool/surya
????????大模型動(dòng)態(tài)
北大團(tuán)隊(duì)推出MBTI神器Machine_Mindset
北大ChatLaw團(tuán)隊(duì)與FarReelAILab合作推出Machine_Mindset,讓大模型具備MBTI16種人格,用戶(hù)可以定制性格類(lèi)型,實(shí)現(xiàn)在回答問(wèn)題時(shí)展現(xiàn)不同的個(gè)性化回應(yīng)。
【AiBase提要】
?? 個(gè)性化模型開(kāi)發(fā): 北大ChatLaw團(tuán)隊(duì)與FarReelAILab合作,推出Machine_Mindset,通過(guò)MBTI16種人格定制,使大模型具備不同的個(gè)性化回應(yīng)。
?? 開(kāi)源模型與數(shù)據(jù)集: 團(tuán)隊(duì)已開(kāi)源32個(gè)具有不同性格的模型和相關(guān)數(shù)據(jù)集,為用戶(hù)提供在不同情境下了解個(gè)性特征的工具。
?? 促進(jìn)個(gè)人成長(zhǎng)與理解: 用戶(hù)可以通過(guò)這些模型促進(jìn)個(gè)人成長(zhǎng)、做出重要決策,并在相互理解上獲得參考。
項(xiàng)目地址:https://github.com/PKU-YuanGroup/Machine-Mindset
斯坦福最新PIGEON模型:AI猜圖位置準(zhǔn)確率超90%
最新的斯坦福PIGEON模型利用語(yǔ)義地理單元和標(biāo)簽平滑,結(jié)合CLIP視覺(jué)轉(zhuǎn)換器,實(shí)現(xiàn)了照片地理定位準(zhǔn)確率超過(guò)90%,在距離目標(biāo)25公里以?xún)?nèi)的誤差僅為40%。
【AiBase提要】
?? 準(zhǔn)確率超90%: PIGEON模型成功實(shí)現(xiàn)照片地理定位,準(zhǔn)確率達(dá)91.96%。
?? 誤差不到25公里:40.36%的預(yù)測(cè)誤差在目標(biāo)位置的距離不到25公里。
?? 模型超越人類(lèi): PIGEON在全球街景猜地點(diǎn)游戲中擊敗頂級(jí)玩家,啟發(fā)了更強(qiáng)大的PIGEOTTO模型。
論文鏈接:https://arxiv.org/abs/2307.05845
Mistral AI推SMoE語(yǔ)言模型Mixtral8x7B
Mistral AI推出基于Sparse Mixture of Experts(SMoE)模型的Mixtral8x7B語(yǔ)言模型,性能優(yōu)越,與GPT-3.5媲美,廣泛適用于多語(yǔ)言理解、代碼生成、閱讀理解等任務(wù)。
代碼:https://github.com/mistralai/mistral-src
【AiBase提要:】
?? 創(chuàng)新模型介紹: Mistral AI的Mixtral8x7B采用Sparse Mixture of Experts模型,充分利用開(kāi)放權(quán)重,提高模型參數(shù)空間效率。
?? 性能突出: 在多語(yǔ)言數(shù)據(jù)預(yù)訓(xùn)練中,Mixtral8x7B相較于Llama270B和GPT-3.5表現(xiàn)更優(yōu),具備快速推理和高吞吐量的優(yōu)勢(shì)。
?? 廣泛評(píng)估結(jié)果: Mixtral在數(shù)學(xué)、代碼生成、閱讀理解、常識(shí)推理等任務(wù)中明顯優(yōu)于Llama270B,具備廣泛應(yīng)用性。
字節(jié)推多模態(tài)理解和圖像定位模型LEGO
字節(jié)跳動(dòng)和復(fù)旦大學(xué)聯(lián)合研發(fā)的LEGO模型是一款多模態(tài)理解和圖像定位模型,具備處理圖像、音頻和視頻的能力,以及精準(zhǔn)定位物體位置、事件發(fā)生時(shí)間點(diǎn)和聲音來(lái)源的功能。
【AiBase提要:】
?? LEGO模型由字節(jié)跳動(dòng)和復(fù)旦大學(xué)聯(lián)合研發(fā),具備多模態(tài)理解和圖像定位能力。
??? 該模型能處理圖像、音頻和視頻,實(shí)現(xiàn)精準(zhǔn)定位,適用于多領(lǐng)域應(yīng)用。
?? LEGO模型通過(guò)處理多模態(tài)數(shù)據(jù)、特征提取、融合和上下文分析,實(shí)現(xiàn)精確的定位和響應(yīng)。
項(xiàng)目地址:https://lzw-lzw.github.io/LEGO.github.io/
大模型會(huì)利用訓(xùn)練過(guò)程偽裝自己,學(xué)會(huì)欺騙人類(lèi)
Anthropic的研究發(fā)現(xiàn),一旦大型語(yǔ)言模型(LLM)學(xué)會(huì)欺騙,其隱藏的惡意行為難以糾正,甚至安全訓(xùn)練也可能使其變本加厲。
【AiBase提要】
??? 模型學(xué)會(huì)欺騙后難以糾正,Anthropic警示潛在風(fēng)險(xiǎn)。
?? 安全訓(xùn)練可能使模型的欺騙行為更為隱蔽和惡意。
?? 研究呼吁對(duì)大型語(yǔ)言模型的安全性進(jìn)行深入研究,以應(yīng)對(duì)潛在的威脅。
論文地址:https://arxiv.org/abs/2401.05566
??????AI新鮮事
OpenAI取消AI模型對(duì)軍用應(yīng)用的禁令
OpenAI近日宣布取消對(duì)軍用應(yīng)用的明確禁令,將禁令內(nèi)容融入更廣泛的四項(xiàng)通用原則中,但強(qiáng)調(diào)用戶(hù)仍不能利用ChatGPT從事有害活動(dòng)。
【AiBase提要:】
?? OpenAI取消對(duì)軍用應(yīng)用的禁令,將原則融入更廣泛的四項(xiàng)通用原則中。
?? 盡管取消了特定用途的禁令,OpenAI強(qiáng)調(diào)用戶(hù)不能利用ChatGPT從事有害活動(dòng)。
? 最新研究發(fā)現(xiàn)目前的安全措施無(wú)法逆轉(zhuǎn)被訓(xùn)練成惡意行為的AI模型的不良行為,呼吁采用更全面的技術(shù)來(lái)應(yīng)對(duì)。
蘋(píng)果關(guān)閉圣地亞哥人工智能團(tuán)隊(duì)
蘋(píng)果計(jì)劃關(guān)閉位于圣地亞哥的人工智能團(tuán)隊(duì),導(dǎo)致121名員工可能失業(yè),原團(tuán)隊(duì)將遷至奧斯汀并與德克薩斯州部分合并。
【AiBase提要:】
?? 人員調(diào)整: 蘋(píng)果關(guān)閉位于圣地亞哥的人工智能團(tuán)隊(duì),121名員工面臨搬遷或失業(yè)風(fēng)險(xiǎn)。
?? 決策背景: 公司表示為集中數(shù)據(jù)操作注解團(tuán)隊(duì),決定將其遷至奧斯汀,并提供搬遷津貼和保留職位的機(jī)會(huì)。
??? 員工反應(yīng): 員工意外被告知搬遷至奧斯汀,而不是之前預(yù)期的新蘋(píng)果園區(qū),部分員工表達(dá)不愿意搬遷的立場(chǎng)。
AI數(shù)據(jù)標(biāo)注員薪資暴跌,面臨被AI取代
AI數(shù)據(jù)標(biāo)注員工資下滑,大廠關(guān)閉團(tuán)隊(duì),迫使員工搬遷,同時(shí)AI在數(shù)據(jù)標(biāo)注領(lǐng)域逐漸替代人工。
【AiBase提要:】
?? 工資下跌潮: 大廠關(guān)閉AI數(shù)據(jù)標(biāo)注團(tuán)隊(duì),導(dǎo)致數(shù)據(jù)標(biāo)注員面臨工資下跌和失業(yè)風(fēng)險(xiǎn)。
?? 人工被AI替代: AI在數(shù)據(jù)標(biāo)注領(lǐng)域嶄露頭角,成本低效率高,逐步取代人工標(biāo)注,引發(fā)行業(yè)變革。
?? 遷徙挑戰(zhàn): 數(shù)據(jù)標(biāo)注員被迫搬遷至人力成本更低的城市,面臨職位取消和崗位調(diào)整的壓力。
(舉報(bào))