无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > AI頭條  > 正文

    字節(jié)Seed 團(tuán)隊(duì)推出 PHD-Transformer,成功擴(kuò)展預(yù)訓(xùn)練長(zhǎng)度,解決 KV 緩存問(wèn)題!

    2025-04-28 16:20 · 來(lái)源: AIbase基地

    近日,字節(jié)跳動(dòng)的 Seed 團(tuán)隊(duì)在人工智能領(lǐng)域再傳佳音,推出了一種新型的 PHD-Transformer(Parallel Hidden Decoding Transformer),這項(xiàng)創(chuàng)新突破了預(yù)訓(xùn)練長(zhǎng)度的限制,有效解決了推理過(guò)程中的 KV 緩存膨脹問(wèn)題。隨著大型推理模型的迅速發(fā)展,研究人員在后訓(xùn)練階段嘗試通過(guò)強(qiáng)化學(xué)習(xí)方法來(lái)生成更長(zhǎng)的推理鏈,并在復(fù)雜的推理任務(wù)上取得了顯著成果。受到啟發(fā),字節(jié) Seed 團(tuán)隊(duì)決定探索在預(yù)訓(xùn)練階段進(jìn)行長(zhǎng)度擴(kuò)展的可能性。

    傳統(tǒng)的長(zhǎng)度擴(kuò)展方法常常涉及在序列中插入文本或潛在向量,這些方式往往導(dǎo)致 KV 緩存占用過(guò)多內(nèi)存,推理速度慢。而 PHD-Transformer 則采用了一種更為簡(jiǎn)便的策略 —— 直接重復(fù)輸入的 tokens。盡管這種方法在訓(xùn)練損失和模型性能上有明顯的提升,卻也帶來(lái)了 KV 緩存線性增長(zhǎng)、內(nèi)存壓力加大和解碼延遲等新問(wèn)題。

    image.png

    為了解決這些挑戰(zhàn),PHD-Transformer 通過(guò)創(chuàng)新的 KV 緩存管理策略,保留了與原始 Transformer 相同的緩存大小。在推理時(shí),PHD-Transformer 只保留由原始 tokens 生成的 KV 緩存,而對(duì)重復(fù)的 tokens 則在預(yù)測(cè)后立即丟棄,顯著加快了推理速度。此外,研究團(tuán)隊(duì)還引入了滑動(dòng)窗口注意力機(jī)制,稱之為 PHD-SWA,以保持局部滑動(dòng)窗口緩存的性能優(yōu)勢(shì)。為進(jìn)一步優(yōu)化預(yù)填充時(shí)間,研究者提出了逐塊滑動(dòng)窗口注意力機(jī)制 PHD-CSWA,限制了每個(gè)塊內(nèi)的順序依賴,從而大幅縮短了預(yù)填充時(shí)間。

    在一系列實(shí)驗(yàn)中,PHD-CSWA 表現(xiàn)出色,在多個(gè)公開(kāi)基準(zhǔn)測(cè)試集上均實(shí)現(xiàn)了準(zhǔn)確率的提升。研究團(tuán)隊(duì)表示,PHD-CSWA 在保持原有效率的同時(shí),為模型帶來(lái)了更大的性能提升,標(biāo)志著在大規(guī)模推理任務(wù)中,預(yù)訓(xùn)練長(zhǎng)度擴(kuò)展取得了實(shí)質(zhì)性進(jìn)展。

    • 相關(guān)推薦
    • AI日?qǐng)?bào):國(guó)內(nèi)首個(gè)多模態(tài)AI程序員上崗;字節(jié)啟動(dòng)Top Seed計(jì)劃招募AI人才;DeepSeek R1T Chimera上線OpenRouter

      【AI日?qǐng)?bào)】今日AI領(lǐng)域重要?jiǎng)討B(tài):1.百度發(fā)布文心快碼3.5及多模態(tài)AI程序員"文心快碼Comate Zulu",提升開(kāi)發(fā)效率;2.字節(jié)跳動(dòng)啟動(dòng)"Top Seed"計(jì)劃,招募30名AI博士人才;3.DeepSeek開(kāi)源R1T Chimera模型上線OpenRouter平臺(tái);4.阿里AI工程師余亮獲"全國(guó)勞動(dòng)模范"稱號(hào);5.開(kāi)源圖像編輯工具Step1X-Edit登陸Hugging Face,性能媲美GPT-4o;6.谷歌被曝每月向三星支付巨額資金預(yù)裝Gemini應(yīng)用

    • Trae國(guó)內(nèi)版怎么用?Trae IDE 內(nèi)置 MCP 市場(chǎng)配置使用指南

      字節(jié)跳動(dòng)旗下Trae+IDE發(fā)布新版本,通過(guò)MCP協(xié)議實(shí)現(xiàn)AI智能體與外部工具的深度集成。MCP作為標(biāo)準(zhǔn)化橋梁,讓開(kāi)發(fā)者能靈活接入Supabase、FireCrawl等第三方服務(wù),只需@符號(hào)即可調(diào)用智能體完成數(shù)據(jù)庫(kù)操作、文檔搜索等復(fù)雜任務(wù)。新版本內(nèi)置MCP市場(chǎng),支持Token快速配置,并演示了如何通過(guò)Figma+AI自動(dòng)生成前端代碼。該技術(shù)可應(yīng)用于Blender建模、K8s管理等多元場(chǎng)景,顯著提升開(kāi)發(fā)效率。Trae+IDE將持續(xù)擴(kuò)展工具生態(tài),推動(dòng)AI協(xié)作開(kāi)發(fā)新時(shí)代。

    • 誠(chéng)意滿滿!小米為SU7 Ultra Club首批會(huì)員推出限定禮盒

      小米汽車這次真是誠(chéng)意滿滿!SU7 Ultra Club首批會(huì)員收到了一份專屬的限定禮盒。里面的東西可不少:SU7 Ultra的1:43合金車模,做工精致,完全按照真車比例打造;除此之外,還有紐北成績(jī)限定車牌和冰箱貼,再加上專屬會(huì)員卡,這身份感瞬間拉滿。100%; word-break: break-word;"據(jù)悉,SU7 Ultra Club會(huì)員俱樂(lè)部是2月27日成立的,年費(fèi)3999元,首批限量2000人,入會(huì)就能拿到6

    • 小米澎湃OS問(wèn)題處理公告:小米14 Ultra影像風(fēng)格預(yù)設(shè)消失等已解決

      快科技4月21日消息,小米近日公布了對(duì)澎湃OS的問(wèn)題處理進(jìn)展,其中提到了小米15、14Ultra機(jī)型的體驗(yàn)問(wèn)題優(yōu)化情況,主要針對(duì)Beta版本系統(tǒng)。具體如下:已優(yōu)化問(wèn)題Beta版本部分場(chǎng)景自動(dòng)鎖屏的問(wèn)題Beta版本部分場(chǎng)景充電與使用時(shí)長(zhǎng)時(shí)間不準(zhǔn)的問(wèn)題Beta版本部分場(chǎng)景Xiaomi152.0.200.10版本徠卡水印不支持后期關(guān)閉的問(wèn)題Beta版本部分場(chǎng)景Xiaomi14Ultra2.0.200.5版本影像風(fēng)格預(yù)設(shè)消失的問(wèn)題處理中?

    • iPhone 17 Pro Max保護(hù)殼撞臉小米11 Ultra:外觀近乎一樣

      快科技4月15日消息,有博主在社交平臺(tái)上曬出了iPhone 17 Pro Max的保護(hù)殼,其攝像頭開(kāi)孔跟小米11 Ultra近乎一致,因?yàn)閮煽顧C(jī)型都是橫向大矩陣相機(jī)DECO設(shè)計(jì),擁有極高的辨識(shí)度。不過(guò)兩款機(jī)型的按鍵開(kāi)孔并不一致,小米11 Ultra的電源鍵、音量鍵位于同一側(cè),iPhone 17 Pro系列的電源鍵和音量鍵位于機(jī)身兩側(cè),并且iPhone還多了一枚拍照按鍵。這次iPhone 17 Pro系列不僅僅是改變了工業(yè)設(shè)計(jì)?

    • 反擊DeepSeek失敗!Llama 4效果不好,Meta承認(rèn)有問(wèn)題

      今天凌晨1點(diǎn)半,Meta生成式AI領(lǐng)導(dǎo)者AhmadAl-Dahle在社交平臺(tái)發(fā)布了一篇長(zhǎng)文,對(duì)前天剛開(kāi)源的Llama4質(zhì)疑進(jìn)行了官方回應(yīng)。Ahmad表示,Llama4一開(kāi)發(fā)完就發(fā)布了,所以,不同服務(wù)中模型質(zhì)量難免會(huì)有一些差異。由于關(guān)稅大戰(zhàn)的原因,Meta的股票遭遇重創(chuàng),他們也需要一個(gè)利好消息來(lái)拉升股票,現(xiàn)在適得其反。

    • 努比亞Z70S Ultra攝影師版官宣:今年唯一真全面屏Ultra

      快科技4月18日消息,今天,努比亞宣布努比亞AI雙旗艦新品發(fā)布會(huì)將于4月28日舉行,努比亞Z70S Ultra攝影師版和努比亞首款神秘新品將同時(shí)亮相。本次發(fā)布會(huì)的重頭戲是努比亞Z70S Ultra攝影師版,對(duì)比其它Ultra機(jī)型,Z70S Ultra攝影師版采用1.5K真全面屏形態(tài),是今年唯一一款真全面屏Ultra。據(jù)悉,這塊屏幕采用全屏藍(lán)鉆排列,通過(guò)FIAA極致壓縮走線技術(shù)實(shí)現(xiàn)超高屏占比,加上內(nèi)置UDC Ultra

    • OPPO Find X8 Ultra堪稱電子阿膠:拍照直出氣血感

      今日晚間,OPPOFindX8Ultra正式亮相。該機(jī)帶來(lái)全新夜神五攝影像系統(tǒng),包括5000萬(wàn)超廣角、5000萬(wàn)1英寸LYT900主攝、5000萬(wàn)像素3X鏡頭、5000萬(wàn)像素6X望遠(yuǎn)鏡頭以及丹霞原彩鏡頭,同時(shí)配備OPPO超晶態(tài)藍(lán)玻璃,配合分區(qū)色溫感知技術(shù)和多模態(tài)協(xié)同計(jì)算技術(shù),一次性解決夜景人像細(xì)節(jié)糊、色彩偏、膚色怪的三大難題。根據(jù)官方實(shí)拍的對(duì)比樣張,F(xiàn)indX8Ultra能準(zhǔn)確還原人臉的膚色以及人像背后的環(huán)境,然后分別處理,讓人像看上去更有氣血感”,相比之下,iPhone16ProMax的人像樣張?jiān)朦c(diǎn)較多,膚色質(zhì)感跟OPPO有明顯差距。

    • AI日?qǐng)?bào):阿里通義萬(wàn)相首尾幀生視頻模型;豆包開(kāi)源Seed智能體模型UI-TARS-1.5;OpenAI首發(fā)“智能體實(shí)踐指南”

      歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里通義萬(wàn)相首尾幀生視頻模型Wan2.1-FLF2V-14B開(kāi)源阿里巴巴的通義實(shí)驗(yàn)室在Hugging Face和GitHub上開(kāi)源了Wan2.1-FLF2V-14B模型,標(biāo)志著AI視頻生成技術(shù)的重大進(jìn)步。該模型支持高清視頻生成

    • 最有誠(chéng)意的Ultra!努比亞Z70S Ultra攝影師版外觀公布:真全面屏形態(tài) 同檔罕見(jiàn)

      快科技4月18日消息,努比亞宣布,努比亞Z70S Ultra攝影師版將于4月28日正式發(fā)布,倪飛稱這是今年最有誠(chéng)意的Ultra。根據(jù)官方公布的外觀,努比亞Z70S Ultra攝影師版后殼采用了原生復(fù)古經(jīng)典相機(jī)設(shè)計(jì)元素,相機(jī)模組通過(guò)一條富有動(dòng)感的分割線一分為二,上方是全新35mm大底主攝,下方是潛望長(zhǎng)焦以及超廣角。與此同時(shí),影像模組右上角延續(xù)了經(jīng)典相機(jī)的紅圈設(shè)計(jì),Neovision圖章致敬專

    今日大家都在搜的詞: