??????AI新鮮事
Pika1.0首批用戶資格揭曉
Pika Labs最新視頻生成產(chǎn)品Pika1.0引起轟動(dòng),已開始向候補(bǔ)名單用戶發(fā)放使用資格。Pika1.0以文生成視頻為特色,提供3秒視頻快速生成、背景修改等功能。用戶可在推特或郵箱確認(rèn)是否成為首批體驗(yàn)者。
【AiBase提要】:
?? Pika1.0發(fā)布: Pika Labs推出視頻生成工具Pika1.0,引起廣泛關(guān)注。
?? 首批用戶資格: Pika向部分候補(bǔ)用戶發(fā)放體驗(yàn)資格,用戶可查收確認(rèn)郵件。
?? 功能亮點(diǎn): Pika1.0支持文生成視頻,提供快速生成、背景修改等特色功能。
英偉達(dá)2023年投資了35家人工智能公司
英偉達(dá)在2023年大幅擴(kuò)大對(duì)AI初創(chuàng)企業(yè)的投資,已投資35家公司,涵蓋范圍從大型新人工智能平臺(tái)到小型初創(chuàng)企業(yè),成為人工智能領(lǐng)域最活躍的投資者之一。
【AiBase提要:】
?? 英偉達(dá)在2023年成為AI領(lǐng)域最活躍的投資者之一,投資35家公司,投資范圍廣泛。
?? 投資標(biāo)準(zhǔn)以技術(shù)相關(guān)性為主,注重與使用其技術(shù)、依賴其技術(shù)的公司建立緊密關(guān)系。
?? 投資組合包括與OpenAI競(jìng)爭(zhēng)對(duì)手Inflection AI和其他公司,強(qiáng)調(diào)對(duì)技術(shù)基礎(chǔ)的依賴。
體育畫報(bào)出版商發(fā)生AI丑聞后解雇CEO
著名雜志《體育畫報(bào)》The Arena Group宣布,其董事會(huì)已終止了其首席執(zhí)行官羅斯·萊文索恩的雇傭關(guān)系。
【AiBase提要:】
?? 體育畫報(bào)出版商解雇CEO羅斯·萊文索恩,公司曾發(fā)布由不存在的作家署名的人工智能生成文章,引起爭(zhēng)議。
?? 揭露后,兩名高管被解雇,公司高級(jí)副總裁宣布終止與萊文索恩的雇傭關(guān)系。
?? 新的臨時(shí)CEO由多數(shù)投資者馬諾吉·巴爾加接任,公司回應(yīng)解雇與人工智能丑聞無(wú)關(guān)。
抖音正式上線AI創(chuàng)作功能 最新AI特效破6億次播放
抖音最新推出AI創(chuàng)作功能,博主通過使用AI生成的漫畫特效制作創(chuàng)意視頻,受到熱烈關(guān)注,標(biāo)志著AI技術(shù)在短視頻創(chuàng)作領(lǐng)域的廣泛應(yīng)用。
【AiBase提要:】
?? AI創(chuàng)作橫空出世:抖音正式推出AI創(chuàng)作功能,博主們通過AI生成的漫畫特效創(chuàng)作獨(dú)特視頻,引起用戶極大興趣。
?? 熱門特效引爆關(guān)注:博主運(yùn)用AI漫畫特效、古風(fēng)形象生成等功能,視頻播放次數(shù)突破6億,展示AI技術(shù)在短視頻創(chuàng)作中的威力。
?? AI賦能創(chuàng)意生態(tài):引入AI繪畫技術(shù)降低門檻,普通人也能輕松融入AI創(chuàng)作,預(yù)示著AI技術(shù)在創(chuàng)意領(lǐng)域?qū)⒂瓉?lái)更廣泛應(yīng)用。
抖音博主用AI生成春晚圖 網(wǎng)友辣評(píng):這是過春節(jié)還是過鬼節(jié)?
抖音知名博主通過AI技術(shù)創(chuàng)作了中式春晚圖,但在指令發(fā)布后圖像變幻莫測(cè),引發(fā)網(wǎng)友熱議,質(zhì)疑圖像中的怪異現(xiàn)象。
【AiBase提要:】
?? 博主通過AI技術(shù)創(chuàng)作中式春晚圖,呈現(xiàn)奇幻太空?qǐng)鼍啊?/p>
?? 指令發(fā)布后圖像變化引發(fā)網(wǎng)友關(guān)注,出現(xiàn)怪異現(xiàn)象,疑似“春晚變鬼節(jié)”。
?? 網(wǎng)友熱議中發(fā)現(xiàn)AI生成圖像的局限性,同時(shí)推動(dòng)更多人涉足AI領(lǐng)域。
Astra Starter Templates 集成 ZipWP AI 網(wǎng)站生成器
Astra Starter Templates 宣布與 ZipWP AI 網(wǎng)站構(gòu)建器整合,用戶可在60秒內(nèi)創(chuàng)建完整網(wǎng)站,包括內(nèi)容和圖像。
Starter Templates3.5.2:全新基于 AI 的模板工具包庫(kù):
https://wpastra.com/changelog/version-3-5-2/
【AiBase提要】
?? 模板整合AI構(gòu)建器: Astra Starter Templates整合ZipWP AI構(gòu)建器,提供280+可自定義網(wǎng)站模板,支持用戶快速創(chuàng)建專業(yè)外觀網(wǎng)站。
?? ZipWP AI構(gòu)建器功能: ZipWP利用人工智能在60秒內(nèi)創(chuàng)建完整WordPress網(wǎng)站,無(wú)需編碼或技術(shù)知識(shí),提供自動(dòng)化設(shè)計(jì)和內(nèi)容生成。
?? 靈活選擇高級(jí)版: ZipWP提供免費(fèi)和高級(jí)版,高級(jí)版每天可創(chuàng)建10個(gè)網(wǎng)站,價(jià)格為399美元/年,支持在開源WordPress環(huán)境中定制使用。
????????大模型動(dòng)態(tài)
李飛飛聯(lián)袂谷歌推出視頻生成模型W.A.L.T
谷歌與李飛飛的斯坦福團(tuán)隊(duì)聯(lián)合推出基于Transformer的視頻生成模型W.A.L.T,采用因果編碼器和窗口注意的變壓器架構(gòu),在圖像和視頻領(lǐng)域取得Gen-2水平的逼真效果。
論文地址:https://walt-video-diffusion.github.io/assets/W.A.L.T.pdf
【AiBase提要:】
?? W.A.L.T利用因果編碼器和變壓器架構(gòu)將圖像和視頻壓縮到共享潛在空間,實(shí)現(xiàn)了聯(lián)合訓(xùn)練和生成,取得SOTA性能。
?? 兩個(gè)關(guān)鍵決策使W.A.L.T成功解決視頻生成建模難題,采用潛在視頻擴(kuò)散模型,在多個(gè)基準(zhǔn)測(cè)試上表現(xiàn)出色。
?? W.A.L.T的突破性設(shè)計(jì)標(biāo)志著視頻生成進(jìn)入新時(shí)代,為AI視頻技術(shù)拓展發(fā)展空間,展示了Transformer的廣泛適用性。
Runway官宣下場(chǎng)通用世界模型
Runway公司宣布發(fā)展通用世界模型(GWM),旨在解決AI視頻領(lǐng)域的難題。該模型旨在模擬廣泛和多樣的真實(shí)世界情景,提高視頻生成系統(tǒng)的理解和逼真度。公司表示將面臨許多研究挑戰(zhàn),招募團(tuán)隊(duì)?wèi)?yīng)對(duì)。
【AiBase提要】:
?? Runway宣布開發(fā)通用世界模型(GWM)解決視頻AI難題。
?? GWM旨在模擬真實(shí)世界情景,提高視頻生成系統(tǒng)逼真度。
?? 公司面臨挑戰(zhàn),招募團(tuán)隊(duì)?wèi)?yīng)對(duì),迎接人工智能視頻新時(shí)代。
阿里推出東南亞專用AI大語(yǔ)言模型SeaLLM
阿里研究部門發(fā)布SeaLLM,首個(gè)專為東南亞市場(chǎng)設(shè)計(jì)的大語(yǔ)言模型,在語(yǔ)言和安全任務(wù)上表現(xiàn)優(yōu)異,突顯阿里對(duì)該地區(qū)增長(zhǎng)市場(chǎng)的重視。
【AiBase提要:】
?? 阿里推出首個(gè)專為東南亞市場(chǎng)設(shè)計(jì)的SeaLLM,展現(xiàn)在該地區(qū)的市場(chǎng)拓展雄心。
?? SeaLLM在語(yǔ)言和安全任務(wù)方面優(yōu)于其他開源模型,經(jīng)過越南語(yǔ)、印尼語(yǔ)等八種語(yǔ)言數(shù)據(jù)集的預(yù)訓(xùn)練。
?? SeaLLM的性能超越其他大型語(yǔ)言模型,尤其在非拉丁語(yǔ)系任務(wù)和英語(yǔ)與低資源語(yǔ)言翻譯方面取得顯著成果。
Meta AI開源T2V模型AVID 可修復(fù)視頻改變紋理
Meta AI最近開源的T2V模型AVID具備先進(jìn)的修復(fù)和擴(kuò)展能力,通過文本編輯視頻,支持修復(fù)視頻、更改對(duì)象、改變紋理和顏色,甚至刪除或替換視頻內(nèi)容。
項(xiàng)目地址:https://zhang-zx.github.io/AVID/
【AiBase提要:】
?? 先進(jìn)修復(fù)與擴(kuò)展能力: Meta AI的AVID模型開源,具備先進(jìn)的運(yùn)動(dòng)模塊和可調(diào)節(jié)的結(jié)構(gòu)引導(dǎo),能有效修復(fù)和擴(kuò)展視頻,處理不同修復(fù)類型且質(zhì)量高。
?? 時(shí)間一致性與可變長(zhǎng)度處理: AVID解決文本引導(dǎo)視頻修復(fù)的挑戰(zhàn),引入新穎的時(shí)間多重?cái)U(kuò)散采樣管道,具備中幀注意力引導(dǎo)機(jī)制,可穩(wěn)健處理不同視頻持續(xù)時(shí)間范圍。
????? 培訓(xùn)階段方法: 在培訓(xùn)階段,AVID模型采用兩步方法,集成運(yùn)動(dòng)模塊和優(yōu)化視頻數(shù)據(jù),保留UNet參數(shù)并專門訓(xùn)練結(jié)構(gòu)指導(dǎo)模塊,推理過程中構(gòu)建連續(xù)幀片段并計(jì)算結(jié)果。
??????AI應(yīng)用
妙鴨相機(jī)推出AI修圖
妙鴨相機(jī)的新AI修圖功能引起關(guān)注,通過數(shù)字分身和大模型算法實(shí)現(xiàn)智能修臉,挑戰(zhàn)美圖秀秀等傳統(tǒng)修圖軟件在美顏市場(chǎng)的地位。
【AiBase提要】
?? 技術(shù)創(chuàng)新: 妙鴨相機(jī)推出基于大模型的“AI修臉”,以智能、快速的修圖體驗(yàn)刷新用戶對(duì)美圖軟件的認(rèn)知。
?? 功能強(qiáng)大: 用戶通過上傳照片生成數(shù)字分身,可選擇不同修臉模式,包括煥新和重塑,實(shí)現(xiàn)個(gè)性化、智能的修圖效果。
?? 市場(chǎng)競(jìng)爭(zhēng): 妙鴨相機(jī)的AI修圖功能挑戰(zhàn)傳統(tǒng)美圖軟件,預(yù)示著修圖美顏市場(chǎng)將迎來(lái)激烈的用戶爭(zhēng)奪戰(zhàn)。
Google發(fā)布編程工具AlphaCode2
谷歌發(fā)布了由Gemini模型提升的AlphaCode2,是一款A(yù)I編程工具,在編程競(jìng)賽中以Python、Java、C++和Go等多語(yǔ)言表現(xiàn)優(yōu)異,通過復(fù)雜技術(shù)解決了原AlphaCode的局限。
【AiBase提要:】
?? 性能提升: AlphaCode2由Gemini模型驅(qū)動(dòng),在編程競(jìng)賽中表現(xiàn)顯著優(yōu)于前代,擊敗約85%競(jìng)爭(zhēng)對(duì)手。
?? 多語(yǔ)言支持: 該工具在Python、Java、C++和Go等多語(yǔ)言中表現(xiàn)卓越,展現(xiàn)了強(qiáng)大的編程能力。
?? 復(fù)雜問題解決: 利用動(dòng)態(tài)規(guī)劃等復(fù)雜技術(shù),AlphaCode2能理解涉及“復(fù)雜”數(shù)學(xué)和理論計(jì)算機(jī)科學(xué)的編程挑戰(zhàn),解決了原版無(wú)法應(yīng)對(duì)的問題。
AI繪圖產(chǎn)品Visual Electric圖片質(zhì)量可媲美Adobe Firefly
Visual Electric是一個(gè)為創(chuàng)意過程打造的圖像生成器,它擁有一個(gè)令人驚嘆的圖像庫(kù)和相應(yīng)的提示,可以激發(fā)靈感。它可以通過迭代來(lái)發(fā)展創(chuàng)意,嘗試不同的風(fēng)格和顏色。
體驗(yàn)地址:https://visualelectric.com/
【AiBase提要:】
?? 創(chuàng)意激發(fā): Visual Electric為創(chuàng)意工作者提供強(qiáng)大的圖像生成能力,通過簡(jiǎn)單輸入提示即可生成高質(zhì)量圖像。
??? 直觀創(chuàng)作空間: 白板式界面讓用戶清晰看到生成過程,可隨時(shí)編輯和處理圖像,集成了摳圖等便捷功能。
?? 多樣風(fēng)格選擇: 提供精心打造的多種風(fēng)格,讓用戶輕松嘗試不同創(chuàng)意可能性,實(shí)現(xiàn)直觀而多樣的創(chuàng)作。
?????????聚焦開發(fā)者
阿里推視頻生成框架DreaMovin
DreaMoving是阿里基于擴(kuò)散模型的視頻生成框架,通過圖文輸入可定制高質(zhì)量人類舞蹈視頻??蚣馨琕ideo ControlNet和Content Guider兩大組件,實(shí)現(xiàn)運(yùn)動(dòng)控制和身份保留。通過姿勢(shì)序列和簡(jiǎn)單描述,如文本和圖像,DreaMoving生成高保真度視頻。
項(xiàng)目網(wǎng)址:https://dreamoving.github.io/dreamoving/
【AiBase提要:】
?? 框架介紹: DreaMoving是基于擴(kuò)散模型的視頻生成框架,可通過圖文輸入生成高質(zhì)量舞蹈視頻。
?? 架構(gòu)解析: Video ControlNet和Content Guider是關(guān)鍵組件,分別實(shí)現(xiàn)運(yùn)動(dòng)控制和身份保留,適用于不同風(fēng)格的擴(kuò)散模型。
?? 成果展示: DreaMoving通過姿勢(shì)序列和簡(jiǎn)單描述生成高保真度的定制視頻,實(shí)現(xiàn)身份控制和外觀控制。
UCLA推出Chameleon框架,大模型表格數(shù)學(xué)推理準(zhǔn)確率達(dá)98.78%
由UCLA等機(jī)構(gòu)推出的Chameleon框架通過多工具融合,包括LLMs、視覺模型、搜索引擎等,解決大型語(yǔ)言模型在實(shí)時(shí)信息獲取和數(shù)學(xué)推理上的不足,在表格數(shù)學(xué)推理任務(wù)上達(dá)到98.78%準(zhǔn)確率。
項(xiàng)目地址:https://chameleon-llm.github.io/
【AiBase提要:】
?? 多工具融合: Chameleon框架融合LLMs、視覺模型、搜索引擎等多種工具,彌補(bǔ)大型語(yǔ)言模型在實(shí)時(shí)信息獲取和數(shù)學(xué)推理方面的不足。
?? 表格數(shù)學(xué)推理準(zhǔn)確率: Chameleon在表格數(shù)學(xué)推理任務(wù)中表現(xiàn)優(yōu)異,準(zhǔn)確率高達(dá)98.78%,超越現(xiàn)有模型,核心在于LLM規(guī)劃器生成自然語(yǔ)言程序。
?? 靈感來(lái)源: Chameleon模型靈感來(lái)源于變色龍,象征大型語(yǔ)言模型在執(zhí)行外部工具組合推理任務(wù)時(shí)的多功能性和適應(yīng)性,在學(xué)術(shù)界和開發(fā)者社區(qū)受到廣泛關(guān)注。
(舉報(bào))