无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<label id="dhjx1"><samp id="dhjx1"></samp></label>

<form id="dhjx1"></form>

<option id="dhjx1"></option>

<option id="dhjx1"><acronym id="dhjx1"><sup id="dhjx1"></sup></acronym></option>

字節(jié)Seed 團(tuán)隊(duì)推出 PHD-Transformer，成功擴(kuò)展預(yù)訓(xùn)練長(zhǎng)度，解決 KV 緩存問(wèn)題！

2025-04-28 16:20 · 來(lái)源： AIbase基地

近日，字節(jié)跳動(dòng)的 Seed 團(tuán)隊(duì)在人工智能領(lǐng)域再傳佳音，推出了一種新型的 PHD-Transformer（Parallel Hidden Decoding Transformer），這項(xiàng)創(chuàng)新突破了預(yù)訓(xùn)練長(zhǎng)度的限制，有效解決了推理過(guò)程中的 KV 緩存膨脹問(wèn)題。隨著大型推理模型的迅速發(fā)展，研究人員在后訓(xùn)練階段嘗試通過(guò)強(qiáng)化學(xué)習(xí)方法來(lái)生成更長(zhǎng)的推理鏈，并在復(fù)雜的推理任務(wù)上取得了顯著成果。受到啟發(fā)，字節(jié) Seed 團(tuán)隊(duì)決定探索在預(yù)訓(xùn)練階段進(jìn)行長(zhǎng)度擴(kuò)展的可能性。

傳統(tǒng)的長(zhǎng)度擴(kuò)展方法常常涉及在序列中插入文本或潛在向量，這些方式往往導(dǎo)致 KV 緩存占用過(guò)多內(nèi)存，推理速度慢。而 PHD-Transformer 則采用了一種更為簡(jiǎn)便的策略 —— 直接重復(fù)輸入的 tokens。盡管這種方法在訓(xùn)練損失和模型性能上有明顯的提升，卻也帶來(lái)了 KV 緩存線性增長(zhǎng)、內(nèi)存壓力加大和解碼延遲等新問(wèn)題。

為了解決這些挑戰(zhàn)，PHD-Transformer 通過(guò)創(chuàng)新的 KV 緩存管理策略，保留了與原始 Transformer 相同的緩存大小。在推理時(shí)，PHD-Transformer 只保留由原始 tokens 生成的 KV 緩存，而對(duì)重復(fù)的 tokens 則在預(yù)測(cè)后立即丟棄，顯著加快了推理速度。此外，研究團(tuán)隊(duì)還引入了滑動(dòng)窗口注意力機(jī)制，稱之為 PHD-SWA，以保持局部滑動(dòng)窗口緩存的性能優(yōu)勢(shì)。為進(jìn)一步優(yōu)化預(yù)填充時(shí)間，研究者提出了逐塊滑動(dòng)窗口注意力機(jī)制 PHD-CSWA，限制了每個(gè)塊內(nèi)的順序依賴，從而大幅縮短了預(yù)填充時(shí)間。

在一系列實(shí)驗(yàn)中，PHD-CSWA 表現(xiàn)出色，在多個(gè)公開(kāi)基準(zhǔn)測(cè)試集上均實(shí)現(xiàn)了準(zhǔn)確率的提升。研究團(tuán)隊(duì)表示，PHD-CSWA 在保持原有效率的同時(shí)，為模型帶來(lái)了更大的性能提升，標(biāo)志著在大規(guī)模推理任務(wù)中，預(yù)訓(xùn)練長(zhǎng)度擴(kuò)展取得了實(shí)質(zhì)性進(jìn)展。

相關(guān)推薦

薦AI日?qǐng)?bào)：國(guó)內(nèi)首個(gè)多模態(tài)AI程序員上崗；字節(jié)啟動(dòng)Top Seed計(jì)劃招募AI人才；DeepSeek R1T Chimera上線OpenRouter

【AI日?qǐng)?bào)】今日AI領(lǐng)域重要?jiǎng)討B(tài)：1.百度發(fā)布文心快碼3.5及多模態(tài)AI程序員"文心快碼Comate Zulu"，提升開(kāi)發(fā)效率；2.字節(jié)跳動(dòng)啟動(dòng)"Top Seed"計(jì)劃，招募30名AI博士人才；3.DeepSeek開(kāi)源R1T Chimera模型上線OpenRouter平臺(tái)；4.阿里AI工程師余亮獲"全國(guó)勞動(dòng)模范"稱號(hào)；5.開(kāi)源圖像編輯工具Step1X-Edit登陸Hugging Face，性能媲美GPT-4o；6.谷歌被曝每月向三星支付巨額資金預(yù)裝Gemini應(yīng)用

?人工智能 ?AI編程工具 ?多模態(tài)交互
Trae國(guó)內(nèi)版怎么用？Trae IDE 內(nèi)置 MCP 市場(chǎng)配置使用指南

字節(jié)跳動(dòng)旗下Trae+IDE發(fā)布新版本，通過(guò)MCP協(xié)議實(shí)現(xiàn)AI智能體與外部工具的深度集成。MCP作為標(biāo)準(zhǔn)化橋梁，讓開(kāi)發(fā)者能靈活接入Supabase、FireCrawl等第三方服務(wù)，只需@符號(hào)即可調(diào)用智能體完成數(shù)據(jù)庫(kù)操作、文檔搜索等復(fù)雜任務(wù)。新版本內(nèi)置MCP市場(chǎng)，支持Token快速配置，并演示了如何通過(guò)Figma+AI自動(dòng)生成前端代碼。該技術(shù)可應(yīng)用于Blender建模、K8s管理等多元場(chǎng)景，顯著提升開(kāi)發(fā)效率。Trae+IDE將持續(xù)擴(kuò)展工具生態(tài)，推動(dòng)AI協(xié)作開(kāi)發(fā)新時(shí)代。

?字節(jié)跳動(dòng) ?Trae ?IDE
誠(chéng)意滿滿！小米為SU7 Ultra Club首批會(huì)員推出限定禮盒

小米汽車這次真是誠(chéng)意滿滿！SU7 Ultra Club首批會(huì)員收到了一份專屬的限定禮盒。里面的東西可不少：SU7 Ultra的1:43合金車模，做工精致，完全按照真車比例打造；除此之外，還有紐北成績(jī)限定車牌和冰箱貼，再加上專屬會(huì)員卡，這身份感瞬間拉滿。100%; word-break: break-word;"據(jù)悉，SU7 Ultra Club會(huì)員俱樂(lè)部是2月27日成立的，年費(fèi)3999元，首批限量2000人，入會(huì)就能拿到6
小米澎湃OS問(wèn)題處理公告：小米14 Ultra影像風(fēng)格預(yù)設(shè)消失等已解決

快科技4月21日消息，小米近日公布了對(duì)澎湃OS的問(wèn)題處理進(jìn)展，其中提到了小米15、14Ultra機(jī)型的體驗(yàn)問(wèn)題優(yōu)化情況，主要針對(duì)Beta版本系統(tǒng)。具體如下:已優(yōu)化問(wèn)題Beta版本部分場(chǎng)景自動(dòng)鎖屏的問(wèn)題Beta版本部分場(chǎng)景充電與使用時(shí)長(zhǎng)時(shí)間不準(zhǔn)的問(wèn)題Beta版本部分場(chǎng)景Xiaomi152.0.200.10版本徠卡水印不支持后期關(guān)閉的問(wèn)題Beta版本部分場(chǎng)景Xiaomi14Ultra2.0.200.5版本影像風(fēng)格預(yù)設(shè)消失的問(wèn)題處理中?

?小米 ?澎湃OS ?Beta版本
iPhone 17 Pro Max保護(hù)殼撞臉小米11 Ultra：外觀近乎一樣

快科技4月15日消息，有博主在社交平臺(tái)上曬出了iPhone 17 Pro Max的保護(hù)殼，其攝像頭開(kāi)孔跟小米11 Ultra近乎一致，因?yàn)閮煽顧C(jī)型都是橫向大矩陣相機(jī)DECO設(shè)計(jì)，擁有極高的辨識(shí)度。不過(guò)兩款機(jī)型的按鍵開(kāi)孔并不一致，小米11 Ultra的電源鍵、音量鍵位于同一側(cè)，iPhone 17 Pro系列的電源鍵和音量鍵位于機(jī)身兩側(cè)，并且iPhone還多了一枚拍照按鍵。這次iPhone 17 Pro系列不僅僅是改變了工業(yè)設(shè)計(jì)?

?iPhone ?17 ?Pro
薦反擊DeepSeek失敗！Llama 4效果不好，Meta承認(rèn)有問(wèn)題

今天凌晨1點(diǎn)半，Meta生成式AI領(lǐng)導(dǎo)者AhmadAl-Dahle在社交平臺(tái)發(fā)布了一篇長(zhǎng)文，對(duì)前天剛開(kāi)源的Llama4質(zhì)疑進(jìn)行了官方回應(yīng)。Ahmad表示，Llama4一開(kāi)發(fā)完就發(fā)布了，所以，不同服務(wù)中模型質(zhì)量難免會(huì)有一些差異。由于關(guān)稅大戰(zhàn)的原因，Meta的股票遭遇重創(chuàng)，他們也需要一個(gè)利好消息來(lái)拉升股票，現(xiàn)在適得其反。

?Meta ?Llama4 ?生成式AI
努比亞Z70S Ultra攝影師版官宣：今年唯一真全面屏Ultra

快科技4月18日消息，今天，努比亞宣布努比亞AI雙旗艦新品發(fā)布會(huì)將于4月28日舉行，努比亞Z70S Ultra攝影師版和努比亞首款神秘新品將同時(shí)亮相。本次發(fā)布會(huì)的重頭戲是努比亞Z70S Ultra攝影師版，對(duì)比其它Ultra機(jī)型，Z70S Ultra攝影師版采用1.5K真全面屏形態(tài)，是今年唯一一款真全面屏Ultra。據(jù)悉，這塊屏幕采用全屏藍(lán)鉆排列，通過(guò)FIAA極致壓縮走線技術(shù)實(shí)現(xiàn)超高屏占比，加上內(nèi)置UDC Ultra

?努比亞 ?AI雙旗艦 ?Z70S
OPPO Find X8 Ultra堪稱電子阿膠：拍照直出氣血感

今日晚間，OPPOFindX8Ultra正式亮相。該機(jī)帶來(lái)全新夜神五攝影像系統(tǒng)，包括5000萬(wàn)超廣角、5000萬(wàn)1英寸LYT900主攝、5000萬(wàn)像素3X鏡頭、5000萬(wàn)像素6X望遠(yuǎn)鏡頭以及丹霞原彩鏡頭，同時(shí)配備OPPO超晶態(tài)藍(lán)玻璃，配合分區(qū)色溫感知技術(shù)和多模態(tài)協(xié)同計(jì)算技術(shù)，一次性解決夜景人像細(xì)節(jié)糊、色彩偏、膚色怪的三大難題。根據(jù)官方實(shí)拍的對(duì)比樣張，F(xiàn)indX8Ultra能準(zhǔn)確還原人臉的膚色以及人像背后的環(huán)境，然后分別處理，讓人像看上去更有氣血感”，相比之下，iPhone16ProMax的人像樣張?jiān)朦c(diǎn)較多，膚色質(zhì)感跟OPPO有明顯差距。

?OPPO ?Find ?X8
薦AI日?qǐng)?bào)：阿里通義萬(wàn)相首尾幀生視頻模型；豆包開(kāi)源Seed智能體模型UI-TARS-1.5；OpenAI首發(fā)“智能體實(shí)踐指南”

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里通義萬(wàn)相首尾幀生視頻模型Wan2.1-FLF2V-14B開(kāi)源阿里巴巴的通義實(shí)驗(yàn)室在Hugging Face和GitHub上開(kāi)源了Wan2.1-FLF2V-14B模型，標(biāo)志著AI視頻生成技術(shù)的重大進(jìn)步。該模型支持高清視頻生成

?AI視頻生成 ?開(kāi)源模型 ?阿里巴巴
最有誠(chéng)意的Ultra！努比亞Z70S Ultra攝影師版外觀公布：真全面屏形態(tài) 同檔罕見(jiàn)

快科技4月18日消息，努比亞宣布，努比亞Z70S Ultra攝影師版將于4月28日正式發(fā)布，倪飛稱這是今年最有誠(chéng)意的Ultra。根據(jù)官方公布的外觀，努比亞Z70S Ultra攝影師版后殼采用了原生復(fù)古經(jīng)典相機(jī)設(shè)計(jì)元素，相機(jī)模組通過(guò)一條富有動(dòng)感的分割線一分為二，上方是全新35mm大底主攝，下方是潛望長(zhǎng)焦以及超廣角。與此同時(shí)，影像模組右上角延續(xù)了經(jīng)典相機(jī)的紅圈設(shè)計(jì)，Neovision圖章致敬專

?努比亞Z70S ?Ultra ?攝影師版

今日大家都在搜的詞：

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<ol id="ks6xg"><label id="ks6xg"></label></ol>

<mark id="ks6xg"><tt id="ks6xg"></tt></mark>

<samp id="ks6xg"><pre id="ks6xg"></pre></samp>