无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > 字節(jié)跳動(dòng)最新資訊  > 正文

    提升大模型自動(dòng)修Bug能力 豆包正式開(kāi)源首個(gè)多語(yǔ)言類(lèi)SWE數(shù)據(jù)集

    2025-04-10 15:11 · 稿源: 快科技

    快科技4月10日消息,今日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布,正式開(kāi)源首個(gè)多語(yǔ)言類(lèi)SWE數(shù)據(jù)集Multi-SWE-bench,可用于評(píng)估和提升大模型自動(dòng)修 Bug”能力。

    在SWE-bench基礎(chǔ)上,Multi-SWE-bench首次覆蓋Python之外的7種主流編程語(yǔ)言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全棧工程”的評(píng)測(cè)基準(zhǔn)。

    Multi-SWE-bench包含1632個(gè)實(shí)例,均來(lái)自GitHub issue,并經(jīng)過(guò)統(tǒng)一的測(cè)試標(biāo)準(zhǔn)和專(zhuān)業(yè)開(kāi)發(fā)者的審核篩選,確保每個(gè)樣本具備清晰的問(wèn)題描述、正確的修復(fù)補(bǔ)丁以及可復(fù)現(xiàn)的運(yùn)行測(cè)試環(huán)境。

    豆包大模型團(tuán)隊(duì)希望,Multi-SWE-bench能作為大模型在多種主流編程語(yǔ)言與真實(shí)代碼環(huán)境中的系統(tǒng)性評(píng)測(cè)基準(zhǔn),推動(dòng)自動(dòng)編程能力向更實(shí)用、更工程化的方向發(fā)展。

    團(tuán)隊(duì)表示,相比于以往聚焦Python的單語(yǔ)言任務(wù),Multi-SWE-bench更貼近現(xiàn)實(shí)中的多語(yǔ)言開(kāi)發(fā)場(chǎng)景,也更能反映當(dāng)前模型在自動(dòng)化軟件工程”方向上的實(shí)際能力邊界。

    舉報(bào)

    • 相關(guān)推薦
    • 大模型時(shí)代的新燃料|標(biāo)貝科技推出大規(guī)模擬真多風(fēng)格語(yǔ)音合成數(shù)據(jù)集

      本文探討了人工智能語(yǔ)音交互領(lǐng)域的發(fā)展現(xiàn)狀與挑戰(zhàn)。文章指出,大模型技術(shù)驅(qū)動(dòng)下語(yǔ)音交互應(yīng)用場(chǎng)景持續(xù)拓展,但面臨數(shù)據(jù)質(zhì)量、隱私合規(guī)等挑戰(zhàn)。當(dāng)前語(yǔ)音大模型訓(xùn)練需要TB至PB級(jí)數(shù)據(jù),而傳統(tǒng)數(shù)據(jù)供給模式難以滿(mǎn)足需求。合成數(shù)據(jù)作為真實(shí)數(shù)據(jù)的重要補(bǔ)充,能通過(guò)參數(shù)化生成機(jī)制規(guī)避隱私風(fēng)險(xiǎn),突破傳統(tǒng)數(shù)據(jù)在多樣性和場(chǎng)景覆蓋上的局限性。國(guó)內(nèi)外科技企業(yè)已開(kāi)始廣泛應(yīng)用合成數(shù)據(jù)訓(xùn)練AI模型,如Meta的LLaMA3和微軟的Phi-4模型。標(biāo)貝科技推出超大規(guī)模擬真多風(fēng)格語(yǔ)音合成數(shù)據(jù)集,包含上萬(wàn)小時(shí)數(shù)據(jù),覆蓋中英混合場(chǎng)景,支持情感合成、風(fēng)格遷移等前沿任務(wù),為虛擬偶像、數(shù)字人等元宇宙場(chǎng)景提供實(shí)時(shí)語(yǔ)音生成方案。該數(shù)據(jù)集基于32kHz高保真采樣率技術(shù),在自然度、流暢度等方面達(dá)到行業(yè)領(lǐng)先水平。

    • 奔馳新款CLA接入豆包大模型

      4月22日,奔馳與火山引擎合作的首款國(guó)產(chǎn)純電車(chē)型CLA全球首發(fā)亮相。該車(chē)搭載奔馳自研MB.OS架構(gòu),接入火山引擎大模型,支持個(gè)性化智能交互體驗(yàn)。智能系統(tǒng)可識(shí)別4種情緒并給予反饋,交互效率提升50%,喚醒僅需0.2秒。虛擬助手能解答百科問(wèn)題并協(xié)助車(chē)輛功能設(shè)置。這是雙方繼2024年8月達(dá)成AI戰(zhàn)略合作后落地的首款量產(chǎn)車(chē)型,結(jié)合生成式AI和大數(shù)據(jù)技術(shù),為中國(guó)用戶(hù)打造更智能的用車(chē)體驗(yàn)。

    • 媲美OpenAI-o3,剛剛開(kāi)源模型DeepCoder,訓(xùn)練方法、數(shù)據(jù)集大公開(kāi)

      今天凌晨4點(diǎn),著名大模型訓(xùn)練平臺(tái)TogetherAI和智能體平臺(tái)Agentica,聯(lián)合開(kāi)源了新模型DeepCoder-14B-Preview。該模型只有140億參數(shù),但在知名代碼測(cè)試平臺(tái)LiveCodeBench的測(cè)試分為60.6%,高于OpenAI的o1模型,略低于o3-mini。TogetherAI剛獲得3.05億美元的B輪融資,其估值也從去年的12.5億美元翻倍至33億美元。

    • 英偉達(dá)開(kāi)源15T數(shù)據(jù)集:32萬(wàn)個(gè)機(jī)器人訓(xùn)練軌跡

      全球AI領(lǐng)導(dǎo)者英偉達(dá)開(kāi)源了,用于實(shí)體機(jī)器人和自動(dòng)化駕駛的超大訓(xùn)練數(shù)據(jù)合集——NVIDIAPhysicalAIDataset。這個(gè)數(shù)據(jù)集一共15T,涵蓋了超過(guò)320,000個(gè)機(jī)器人訓(xùn)練軌跡,以及多達(dá)1,000個(gè)通用場(chǎng)景描述包括一個(gè)SimReady集合。英偉達(dá)表示,未來(lái)將繼續(xù)擴(kuò)展PhysicalAIDataset,將其建設(shè)成世界最大、統(tǒng)一的開(kāi)源數(shù)據(jù)集,可用于AI模型、醫(yī)療、自動(dòng)化駕駛等不同領(lǐng)域,加速AI、實(shí)體機(jī)器人的訓(xùn)練效?

    • Qwen3深夜正式開(kāi)源,小尺寸也能大力出奇跡。

      阿里發(fā)布通義千問(wèn)Qwen3大模型系列,包含8個(gè)不同規(guī)模的模型,從0.6B到235B參數(shù)全覆蓋。亮點(diǎn)包括:1)全球頂尖模型能力;2)首個(gè)開(kāi)源的混合推理模型;3)支持119種語(yǔ)言;4)部署成本僅為DeepSeek+R1的三分之一;5)支持MCP協(xié)議。其中235B旗艦?zāi)P托阅軐?duì)標(biāo)頂級(jí)閉源模型,30B-MoE模型激活參數(shù)僅3B。所有模型均采用Apache2.0協(xié)議開(kāi)源,支持商用。實(shí)測(cè)顯示Qwen3在代碼和寫(xiě)作方面優(yōu)于DeepSeek

    • 長(zhǎng)安馬自達(dá)EZ-60全球首秀,接入豆包大模型

      4月23日,長(zhǎng)安馬自達(dá)EZ-60在2025上海國(guó)際車(chē)展全球首發(fā)。作為品牌新能源戰(zhàn)略轉(zhuǎn)型產(chǎn)品,該車(chē)在美學(xué)設(shè)計(jì)、AI智能座艙、電感駕控及主被動(dòng)安全性能等方面實(shí)現(xiàn)突破。最大亮點(diǎn)是全面接入豆包大模型,用戶(hù)可通過(guò)語(yǔ)音指令實(shí)現(xiàn)復(fù)雜操作、互聯(lián)網(wǎng)信息問(wèn)答及短視頻搜索等功能,打造"人-車(chē)-環(huán)境"跨模態(tài)交互體驗(yàn)。專(zhuān)屬AI助手支持超700項(xiàng)功能語(yǔ)音調(diào)用,實(shí)現(xiàn)"所說(shuō)即所得"的智能交互。長(zhǎng)安馬自達(dá)與火山引擎達(dá)成深度合作,將持續(xù)推進(jìn)大模型在智能座艙領(lǐng)域的創(chuàng)新應(yīng)用。

    • “奧迪助手”來(lái)了!全新AUDI車(chē)型接入豆包大模型

      2025年4月24日上海車(chē)展期間,上汽奧迪發(fā)布全新A5L Sportback和首款量產(chǎn)車(chē)型E5 Sportback。同時(shí)推出與火山引擎合作開(kāi)發(fā)的"奧迪助手"智能交互系統(tǒng),基于豆包大模型實(shí)現(xiàn)自然對(duì)話(huà)體驗(yàn)。該系統(tǒng)將搭載于兩款新車(chē),并同步部署在車(chē)載端和手機(jī)APP端,支持跨設(shè)備對(duì)話(huà)記錄同步?;鹕揭鏋橄到y(tǒng)提供大模型技術(shù)支持,實(shí)現(xiàn)語(yǔ)音指令控制、車(chē)輛功能講解等智能服務(wù),并整合抖音、汽水音樂(lè)等內(nèi)容生態(tài)。上汽奧迪表示,該合作將助力品牌打造更智能、個(gè)性化的產(chǎn)品矩陣。

    • AI 大模型的困境:數(shù)據(jù)才是真正的“燃料”

      一旦掉入AI墳場(chǎng),幻覺(jué)將永遠(yuǎn)存在,噩夢(mèng)才剛開(kāi)始。最近有許多客戶(hù)在考慮上AI大模型一體機(jī)、AI私有化、AI大模型部署等項(xiàng)目,但小心進(jìn)入AI大模型的墳場(chǎng),在光鮮亮麗的背后,AI大模型也面臨著諸多困境,其中最為核心的問(wèn)題便是數(shù)據(jù)。只有擁有高質(zhì)量、多樣化、易于管理的數(shù)據(jù),AI大模型才能發(fā)揮出其真正的潛力,為企業(yè)帶來(lái)更大的價(jià)值。

    • 偉世通×火山引擎:發(fā)布基于豆包大模型的智能座艙解決方案

      2025年上海車(chē)展期間,火山引擎與偉世通聯(lián)合發(fā)布基于AI大模型的下一代智能座艙解決方案。該方案融合豆包大模型AI能力和偉世通高性能域控平臺(tái),通過(guò)端云協(xié)同架構(gòu)和多模態(tài)交互技術(shù),實(shí)現(xiàn)離線(xiàn)功能閉環(huán)運(yùn)行和快速響應(yīng)。方案接入火山豐富的內(nèi)容生態(tài),支持個(gè)性化推薦和"千人千面"自適應(yīng)設(shè)計(jì),同時(shí)具備多模態(tài)交互能力,實(shí)現(xiàn)更自然的人機(jī)交互。雙方還將共同探索AI大模型在智能座艙場(chǎng)景的優(yōu)化適配,助力車(chē)企打造差異化智能座艙體驗(yàn)。

    • Switch2價(jià)格公布:日版約2400元 多語(yǔ)言版約3400元

      任天堂正式發(fā)布了其新一代游戲機(jī)Switch2,距離上一代產(chǎn)品發(fā)布已經(jīng)過(guò)去了八年。此次發(fā)布的Switch2在屏幕、手柄、性能等多個(gè)方面均帶來(lái)了重大提升,引起了廣泛關(guān)注。幾個(gè)版本在硬件上不會(huì)有區(qū)別,只是單獨(dú)推出了一個(gè)售價(jià)更低的日語(yǔ)版,變相給本國(guó)人提供優(yōu)惠。