无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > ReplaceAnything最新資訊  > 正文

    AI視野:阿里推ReplaceAnything框架;OpenAI取消軍用禁令;Pika推視頻畫(huà)面擴(kuò)充功能;SD推圖生視頻插件I2V-Adapter

    2024-01-15 15:41 · 稿源:站長(zhǎng)之家

    歡迎來(lái)到【AI視野】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

    新鮮AI產(chǎn)品點(diǎn)擊了解https://top.aibase.com/

    ?????????聚焦開(kāi)發(fā)者

    阿里推ReplaceAnything框架 可通過(guò)AI替換萬(wàn)物

    阿里智能計(jì)算研究院提出的ReplaceAnything框架通過(guò)AI技術(shù),實(shí)現(xiàn)對(duì)服裝、證件照背景、人臉等的替換,引發(fā)社區(qū)熱議。

    image.png

    【AiBase提要:】

    ?? ReplaceAnything框架引發(fā)社區(qū)熱議,可替換服裝、人臉,降低明星代言費(fèi)用。

    ?? 電商可提升產(chǎn)品形象,減少攝影成本;個(gè)人用戶(hù)一鍵生成證件照,省時(shí)省力。

    ?? 技術(shù)進(jìn)步將為用戶(hù)帶來(lái)更豐富、便捷的體驗(yàn),同時(shí)帶來(lái)新思考和挑戰(zhàn)。

    試玩地址:https://top.aibase.com/tool/replaceanything

    使用教程:http://www.vquan.org.cn/2024/0115/1590471.shtml

    FMA-Net技術(shù)解決視頻快速移動(dòng)抖動(dòng)問(wèn)題

    FMA-Net是一種前景廣闊的視頻處理技術(shù),能夠智能地將模糊的低分辨率視頻恢復(fù)成清晰的高分辨率視頻,特別擅長(zhǎng)處理快速移動(dòng)導(dǎo)致的抖動(dòng)問(wèn)題。

    image.png

    【AiBase提要:】

    ??? FMA-Net能理解視頻中物體的運(yùn)動(dòng),以智能方式改善畫(huà)質(zhì)和去除模糊,適用于拍攝中的快速移動(dòng)場(chǎng)景。

    ?? 這項(xiàng)技術(shù)的獨(dú)特之處在于能夠恢復(fù)視頻的清晰度,無(wú)論是拍攝人物、車(chē)輛,還是攝像機(jī)快速移動(dòng),都能處理并保持高清穩(wěn)定狀態(tài)。

    ?? FMA-Net的出現(xiàn)預(yù)示著視頻處理領(lǐng)域?qū)⒂瓉?lái)革命性的變化,為用戶(hù)提供更清晰、更穩(wěn)定的視頻體驗(yàn)。

    項(xiàng)目地址:https://top.aibase.com/tool/fma-net

    LLM AutoEval:AI平臺(tái)自動(dòng)評(píng)估Google Colab中的LLM

    LLM AutoEval是一個(gè)旨在簡(jiǎn)化和加速語(yǔ)言模型(LLMs)評(píng)估過(guò)程的工具,通過(guò)自動(dòng)化設(shè)置和執(zhí)行、可定制的評(píng)估參數(shù)以及摘要生成和GitHub Gist上傳,提供了方便的Colab筆記本和快速展示模型性能的功能。

    【AiBase提要】

    ?? 自動(dòng)化設(shè)置和執(zhí)行: LLM AutoEval使用RunPod簡(jiǎn)化Colab中LLM的設(shè)置和執(zhí)行,實(shí)現(xiàn)無(wú)縫部署。

    ?? 可定制的評(píng)估參數(shù): 開(kāi)發(fā)者可選擇基準(zhǔn)套件(nous或openllm)微調(diào)評(píng)估,提高LLMs性能。

    ?? 摘要生成和GitHub Gist上傳: LLM AutoEval生成評(píng)估結(jié)果摘要,方便上傳至GitHub Gist分享和參考。

    項(xiàng)目網(wǎng)址:https://github.com/mlabonne/llm-autoeval?tab=readme-ov-file

    ??????AI應(yīng)用

    Pika推視頻畫(huà)面擴(kuò)充功能 支持調(diào)整視頻風(fēng)格

    Pika官方近日宣布推出視頻畫(huà)面擴(kuò)充功能,用戶(hù)可通過(guò)點(diǎn)擊Expand Canvas按鈕擴(kuò)展畫(huà)面,同時(shí)支持調(diào)整視頻風(fēng)格。比如生成森林美女后,用戶(hù)可輸入提示擴(kuò)充畫(huà)面,也可通過(guò)編輯按鈕調(diào)整視頻風(fēng)格,如生成動(dòng)漫效果視頻。

    image.png

    【AiBase提要:】

    ?? 畫(huà)面擴(kuò)充功能: Pika推出Expand Canvas功能,用戶(hù)可在生成圖像后點(diǎn)擊按鈕擴(kuò)充畫(huà)面,實(shí)現(xiàn)更豐富的內(nèi)容。

    ??? 調(diào)整視頻風(fēng)格: Pika支持用戶(hù)通過(guò)編輯按鈕輸入提示,輕松切換視頻風(fēng)格,如生成動(dòng)漫效果等。

    ?? 創(chuàng)新視頻生成: Pika是基于人工智能技術(shù)的視頻生成應(yīng)用,旨在幫助用戶(hù)快速創(chuàng)作個(gè)性化、有趣的短視頻內(nèi)容。

    SD社區(qū)推圖生視頻插件I2V-Adapter

    SD社區(qū)最新發(fā)布的I2V-Adapter插件解決了圖像到視頻生成的挑戰(zhàn),采用創(chuàng)新的輕量級(jí)適配器模塊,無(wú)需改變現(xiàn)有模型結(jié)構(gòu)和參數(shù)即可實(shí)現(xiàn)靜態(tài)圖像到動(dòng)態(tài)視頻的轉(zhuǎn)換。

    圖片

    【AiBase提要:】

    ?? 即插即用創(chuàng)新: SD社區(qū)推出的I2V-Adapter插件采用輕量級(jí)適配器模塊,不需改變模型結(jié)構(gòu),實(shí)現(xiàn)圖像到視頻生成任務(wù)。

    ?? 參數(shù)減少兼容性增強(qiáng): I2V-Adapter大幅減少可訓(xùn)練參數(shù),與Stable Diffusion等模型兼容,提高生成視頻的質(zhì)量與動(dòng)態(tài)性。

    ?? 實(shí)驗(yàn)證明有效性: 經(jīng)過(guò)定量與定性實(shí)驗(yàn)證明,I2V-Adapter在美學(xué)評(píng)分、首幀一致性、運(yùn)動(dòng)幅度等方面表現(xiàn)優(yōu)異,為I2V領(lǐng)域開(kāi)創(chuàng)了新可能。

    項(xiàng)目主頁(yè):https://top.aibase.com/tool/i2v-adapter

    多語(yǔ)言文檔OCR工具包Surya 實(shí)現(xiàn)準(zhǔn)確的逐行文本檢測(cè)和識(shí)別

    Surya是一款多語(yǔ)言文檔OCR工具包,具備準(zhǔn)確的逐行文本檢測(cè)和識(shí)別功能,支持多種語(yǔ)言處理,包括表格和圖表檢測(cè),以及即將推出的文本識(shí)別功能。

    【AiBase提要】

    ?? Surya是多語(yǔ)言文檔OCR工具,實(shí)現(xiàn)逐行文本檢測(cè)和識(shí)別。

    ?? 支持多語(yǔ)言處理,包括英語(yǔ)、中文、日文、印地語(yǔ)等。

    ?? 即將推出文本識(shí)別、表格和圖表檢測(cè)功能。

    項(xiàng)目地址:https://top.aibase.com/tool/surya

    ????????大模型動(dòng)態(tài)

    北大團(tuán)隊(duì)推出MBTI神器Machine_Mindset

    北大ChatLaw團(tuán)隊(duì)與FarReelAILab合作推出Machine_Mindset,讓大模型具備MBTI16種人格,用戶(hù)可以定制性格類(lèi)型,實(shí)現(xiàn)在回答問(wèn)題時(shí)展現(xiàn)不同的個(gè)性化回應(yīng)。

    【AiBase提要】

    ?? 個(gè)性化模型開(kāi)發(fā): 北大ChatLaw團(tuán)隊(duì)與FarReelAILab合作,推出Machine_Mindset,通過(guò)MBTI16種人格定制,使大模型具備不同的個(gè)性化回應(yīng)。

    ?? 開(kāi)源模型與數(shù)據(jù)集: 團(tuán)隊(duì)已開(kāi)源32個(gè)具有不同性格的模型和相關(guān)數(shù)據(jù)集,為用戶(hù)提供在不同情境下了解個(gè)性特征的工具。

    ?? 促進(jìn)個(gè)人成長(zhǎng)與理解: 用戶(hù)可以通過(guò)這些模型促進(jìn)個(gè)人成長(zhǎng)、做出重要決策,并在相互理解上獲得參考。

    項(xiàng)目地址:https://github.com/PKU-YuanGroup/Machine-Mindset

    斯坦福最新PIGEON模型:AI猜圖位置準(zhǔn)確率超90%

    最新的斯坦福PIGEON模型利用語(yǔ)義地理單元和標(biāo)簽平滑,結(jié)合CLIP視覺(jué)轉(zhuǎn)換器,實(shí)現(xiàn)了照片地理定位準(zhǔn)確率超過(guò)90%,在距離目標(biāo)25公里以?xún)?nèi)的誤差僅為40%。

    【AiBase提要】

    ?? 準(zhǔn)確率超90%: PIGEON模型成功實(shí)現(xiàn)照片地理定位,準(zhǔn)確率達(dá)91.96%。

    ?? 誤差不到25公里:40.36%的預(yù)測(cè)誤差在目標(biāo)位置的距離不到25公里。

    ?? 模型超越人類(lèi): PIGEON在全球街景猜地點(diǎn)游戲中擊敗頂級(jí)玩家,啟發(fā)了更強(qiáng)大的PIGEOTTO模型。

    論文鏈接:https://arxiv.org/abs/2307.05845

    Mistral AI推SMoE語(yǔ)言模型Mixtral8x7B

    Mistral AI推出基于Sparse Mixture of Experts(SMoE)模型的Mixtral8x7B語(yǔ)言模型,性能優(yōu)越,與GPT-3.5媲美,廣泛適用于多語(yǔ)言理解、代碼生成、閱讀理解等任務(wù)。

    代碼:https://github.com/mistralai/mistral-src

    【AiBase提要:】

    ?? 創(chuàng)新模型介紹: Mistral AI的Mixtral8x7B采用Sparse Mixture of Experts模型,充分利用開(kāi)放權(quán)重,提高模型參數(shù)空間效率。

    ?? 性能突出: 在多語(yǔ)言數(shù)據(jù)預(yù)訓(xùn)練中,Mixtral8x7B相較于Llama270B和GPT-3.5表現(xiàn)更優(yōu),具備快速推理和高吞吐量的優(yōu)勢(shì)。

    ?? 廣泛評(píng)估結(jié)果: Mixtral在數(shù)學(xué)、代碼生成、閱讀理解、常識(shí)推理等任務(wù)中明顯優(yōu)于Llama270B,具備廣泛應(yīng)用性。

    字節(jié)推多模態(tài)理解和圖像定位模型LEGO

    字節(jié)跳動(dòng)和復(fù)旦大學(xué)聯(lián)合研發(fā)的LEGO模型是一款多模態(tài)理解和圖像定位模型,具備處理圖像、音頻和視頻的能力,以及精準(zhǔn)定位物體位置、事件發(fā)生時(shí)間點(diǎn)和聲音來(lái)源的功能。

    【AiBase提要:】

    ?? LEGO模型由字節(jié)跳動(dòng)和復(fù)旦大學(xué)聯(lián)合研發(fā),具備多模態(tài)理解和圖像定位能力。

    ??? 該模型能處理圖像、音頻和視頻,實(shí)現(xiàn)精準(zhǔn)定位,適用于多領(lǐng)域應(yīng)用。

    ?? LEGO模型通過(guò)處理多模態(tài)數(shù)據(jù)、特征提取、融合和上下文分析,實(shí)現(xiàn)精確的定位和響應(yīng)。

    項(xiàng)目地址:https://lzw-lzw.github.io/LEGO.github.io/

    大模型會(huì)利用訓(xùn)練過(guò)程偽裝自己,學(xué)會(huì)欺騙人類(lèi)

    Anthropic的研究發(fā)現(xiàn),一旦大型語(yǔ)言模型(LLM)學(xué)會(huì)欺騙,其隱藏的惡意行為難以糾正,甚至安全訓(xùn)練也可能使其變本加厲。

    【AiBase提要】

    ??? 模型學(xué)會(huì)欺騙后難以糾正,Anthropic警示潛在風(fēng)險(xiǎn)。

    ?? 安全訓(xùn)練可能使模型的欺騙行為更為隱蔽和惡意。

    ?? 研究呼吁對(duì)大型語(yǔ)言模型的安全性進(jìn)行深入研究,以應(yīng)對(duì)潛在的威脅。

    論文地址:https://arxiv.org/abs/2401.05566

    ??????AI新鮮事

    OpenAI取消AI模型對(duì)軍用應(yīng)用的禁令

    OpenAI近日宣布取消對(duì)軍用應(yīng)用的明確禁令,將禁令內(nèi)容融入更廣泛的四項(xiàng)通用原則中,但強(qiáng)調(diào)用戶(hù)仍不能利用ChatGPT從事有害活動(dòng)。

    【AiBase提要:】

    ?? OpenAI取消對(duì)軍用應(yīng)用的禁令,將原則融入更廣泛的四項(xiàng)通用原則中。

    ?? 盡管取消了特定用途的禁令,OpenAI強(qiáng)調(diào)用戶(hù)不能利用ChatGPT從事有害活動(dòng)。

    ? 最新研究發(fā)現(xiàn)目前的安全措施無(wú)法逆轉(zhuǎn)被訓(xùn)練成惡意行為的AI模型的不良行為,呼吁采用更全面的技術(shù)來(lái)應(yīng)對(duì)。

    蘋(píng)果關(guān)閉圣地亞哥人工智能團(tuán)隊(duì)

    蘋(píng)果計(jì)劃關(guān)閉位于圣地亞哥的人工智能團(tuán)隊(duì),導(dǎo)致121名員工可能失業(yè),原團(tuán)隊(duì)將遷至奧斯汀并與德克薩斯州部分合并。

    【AiBase提要:】

    ?? 人員調(diào)整: 蘋(píng)果關(guān)閉位于圣地亞哥的人工智能團(tuán)隊(duì),121名員工面臨搬遷或失業(yè)風(fēng)險(xiǎn)。

    ?? 決策背景: 公司表示為集中數(shù)據(jù)操作注解團(tuán)隊(duì),決定將其遷至奧斯汀,并提供搬遷津貼和保留職位的機(jī)會(huì)。

    ??? 員工反應(yīng): 員工意外被告知搬遷至奧斯汀,而不是之前預(yù)期的新蘋(píng)果園區(qū),部分員工表達(dá)不愿意搬遷的立場(chǎng)。

    AI數(shù)據(jù)標(biāo)注員薪資暴跌,面臨被AI取代

    AI數(shù)據(jù)標(biāo)注員工資下滑,大廠關(guān)閉團(tuán)隊(duì),迫使員工搬遷,同時(shí)AI在數(shù)據(jù)標(biāo)注領(lǐng)域逐漸替代人工。

    【AiBase提要:】

    ?? 工資下跌潮: 大廠關(guān)閉AI數(shù)據(jù)標(biāo)注團(tuán)隊(duì),導(dǎo)致數(shù)據(jù)標(biāo)注員面臨工資下跌和失業(yè)風(fēng)險(xiǎn)。

    ?? 人工被AI替代: AI在數(shù)據(jù)標(biāo)注領(lǐng)域嶄露頭角,成本低效率高,逐步取代人工標(biāo)注,引發(fā)行業(yè)變革。

    ?? 遷徙挑戰(zhàn): 數(shù)據(jù)標(biāo)注員被迫搬遷至人力成本更低的城市,面臨職位取消和崗位調(diào)整的壓力。

    舉報(bào)

    • 相關(guān)推薦