无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

大規(guī)模專家并行推理集群實(shí)現(xiàn)性能3倍躍遷，聯(lián)通元景開啟推理新紀(jì)元

2025-04-07 19:36 · 稿源：站長之家用戶

近日，中國聯(lián)通持續(xù)技術(shù)攻堅(jiān)，依托元景大模型MaaS平臺(tái)成功搭建“大規(guī)模專家并行” 推理集群，實(shí)現(xiàn)DeepSeek MoE 大模型在多節(jié)點(diǎn)間的超有效集群推理，單卡吞吐提升 3 倍，解碼時(shí)延降低 50%。這一成果不僅為人工智能技術(shù)的創(chuàng)新發(fā)展提供了強(qiáng)大助力，也讓各行業(yè)以更有效率應(yīng)用 AI 技術(shù)，加速推動(dòng)千行百業(yè)的數(shù)字化轉(zhuǎn)型。

伴隨大模型MoE結(jié)構(gòu)重大技術(shù)革新，以往少量“全能型”專家的模式逐漸被取代，大量“?？菩汀毙＜抑饾u成為主流。這一轉(zhuǎn)變，極大地提升了模型的針對(duì)性和精細(xì)化程度，使得模型效果顯著改善。

推理應(yīng)用在各行業(yè)的落地隨之全面加速，市場(chǎng)對(duì)于推理服務(wù)的需求呈井噴式增長，Tokens 處理量的需求與日俱增，這對(duì)推理系統(tǒng)的性能提出了更高的要求。為應(yīng)對(duì)這一挑戰(zhàn)，大規(guī)模專家并行推理技術(shù)應(yīng)運(yùn)而生，為大模型推理的加速規(guī)模應(yīng)用提供了強(qiáng)大的技術(shù)支撐。

聯(lián)通元景大模型與昇騰深度合作，圍繞大規(guī)模專家并行推理技術(shù)展開全方位創(chuàng)新，將 DeepSeek 671B滿血版大模型的數(shù)百個(gè)“?？菩汀?小專家按特出方式分布到不同的NPU上，使得單卡權(quán)重占用顯存降低 75%，權(quán)重加載耗時(shí)大幅減少，可用于數(shù)據(jù)計(jì)算的顯存顯著增加。

在通信環(huán)節(jié)，雙方對(duì)集群跨機(jī)通信方案進(jìn)行深度優(yōu)化，通過引入先進(jìn)計(jì)算與通信并行算法，整體通信效率提升40%。此外，雙方聯(lián)合創(chuàng)新多級(jí)負(fù)載均衡算法，準(zhǔn)確識(shí)別并均衡各NPU 的負(fù)載，將卡間負(fù)載差異成功控制在 10% 以下，有效提升系統(tǒng)吞吐和計(jì)算資源利用率。

聯(lián)通元景大模型MaaS平臺(tái)結(jié)合大規(guī)模專家并行推理集群系統(tǒng)，基于DeepSeek 671B 滿血版大模型持續(xù)進(jìn)行針對(duì)性推理優(yōu)化創(chuàng)新，打造高可靠、高性能、易運(yùn)維推理服務(wù)。

圍繞高可靠

依托實(shí)例內(nèi)和實(shí)例間的多級(jí)容災(zāi)機(jī)制，保障業(yè)務(wù)連續(xù)性，提供長穩(wěn)推理服務(wù)。圍繞高性能，進(jìn)行高并發(fā)請(qǐng)求調(diào)度、管理、轉(zhuǎn)發(fā)等，打造整個(gè)集群的有效數(shù)據(jù)請(qǐng)求管理入口。

圍繞易運(yùn)維

進(jìn)行集群內(nèi)推理業(yè)務(wù)狀態(tài)監(jiān)控、以及PD身份和資源管理與決策等，打造整個(gè)推理集群的狀態(tài)監(jiān)控器和決策大腦，持續(xù)提升大規(guī)模專家并行推理集群易用性。

在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的浪潮中，中國聯(lián)通始終勇立潮頭，全面發(fā)力人工智能。從精心搭建智算基礎(chǔ)設(shè)施，構(gòu)建強(qiáng)大算力“引擎”，到成功落地大規(guī)模專家并行推理集群，打造高性能低時(shí)延推理“中樞”，聯(lián)通元景大模型持續(xù)筑牢國產(chǎn)化智算底座，以技術(shù)需求雙輪驅(qū)動(dòng)，打造“普惠速成”的元景MaaS平臺(tái)，讓人工智能更簡單，為 AI 產(chǎn)業(yè)發(fā)展注入強(qiáng)勁的“加速度”。

這一推理創(chuàng)新舉措必將助力各行業(yè)在復(fù)雜多變、競(jìng)爭激烈的市場(chǎng)環(huán)境中搶占先機(jī)，以智能化驅(qū)動(dòng)數(shù)字化轉(zhuǎn)型，進(jìn)而推動(dòng)實(shí)體經(jīng)濟(jì)高質(zhì)量發(fā)展。

（推廣）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺(tái)用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)，對(duì)本頁面內(nèi)容所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任，相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。任何單位或個(gè)人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，可及時(shí)向站長之家提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明（點(diǎn)擊查看反饋聯(lián)系地址）。本網(wǎng)站在收到上述法律文件后，將會(huì)依法依規(guī)核實(shí)信息，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

相關(guān)推薦

關(guān)鍵詞：

LIFETOO品牌麥角硫因：開啟抗衰養(yǎng)顏新紀(jì)元

LIFETOO是一個(gè)專注于抗衰老營養(yǎng)健康的品牌，由多位生物學(xué)博士創(chuàng)立，依托美日先進(jìn)營養(yǎng)科學(xué)技術(shù)研發(fā)產(chǎn)品。其明星產(chǎn)品麥角硫因膠囊具有強(qiáng)效抗氧化功效，能改善皮膚狀態(tài)、增強(qiáng)彈性。品牌擁有專業(yè)研發(fā)團(tuán)隊(duì)和自有生產(chǎn)線，產(chǎn)品通過嚴(yán)格質(zhì)量控制，在全球多個(gè)國家銷售并獲得消費(fèi)者認(rèn)可。LIFETOO堅(jiān)持"探索營養(yǎng)與健康的未來"理念，致力于為消費(fèi)者提供高品質(zhì)、個(gè)性化的營養(yǎng)呵護(hù)方案。

?抗衰老 ?年輕美麗 ?膳食營養(yǎng)
行業(yè)先行者，艾娑姟雅(EXOGAIA)開啟抗衰護(hù)膚新紀(jì)元

艾嬈嬋雅(EXOGAIA)在美博會(huì)上展示前沿細(xì)胞科研成果，推出"雙外泌體"護(hù)膚理念。品牌采用TFF外泌體提取技術(shù)，從羊胎盤和蓮葉中提取高活性物質(zhì)，通過膜融合機(jī)制促進(jìn)膠原再生。其產(chǎn)品線涵蓋抗衰修護(hù)全系列，包括微囊精華液、人參精華油等明星單品。依托廣東慈惠生物科技強(qiáng)大的科研團(tuán)隊(duì)，品牌專注于肌衰老機(jī)理研究，已獲得國際INCI認(rèn)證。艾嬈嬋雅通過創(chuàng)新技術(shù)重新?

?艾娑姟雅 ?細(xì)胞科研 ?雙外泌體
英氏攜手中國營養(yǎng)學(xué)會(huì)開啟科學(xué)喂養(yǎng)新紀(jì)元

4月18日，中國營養(yǎng)學(xué)會(huì)與英氏控股集團(tuán)在瀏陽經(jīng)開區(qū)共同舉辦"嬰幼兒輔食科學(xué)5階喂養(yǎng)標(biāo)準(zhǔn)體系化建設(shè)暨深度科研啟動(dòng)儀式"?；顒?dòng)聚焦嬰幼兒輔食行業(yè)標(biāo)準(zhǔn)化發(fā)展，推出"科學(xué)5階精準(zhǔn)喂養(yǎng)體系"，針對(duì)不同發(fā)育階段嬰幼兒營養(yǎng)需求進(jìn)行精準(zhǔn)劃分。英氏與江南大學(xué)、湖南省農(nóng)科院簽署戰(zhàn)略協(xié)議，共建"嬰童未來食品實(shí)驗(yàn)室"和"嬰幼兒輔食與營養(yǎng)產(chǎn)業(yè)發(fā)展研究院"，推動(dòng)產(chǎn)學(xué)研深度融合。英氏投資建設(shè)的嬰幼兒營養(yǎng)與健康科學(xué)產(chǎn)業(yè)基地一期已在瀏陽建成投產(chǎn)，致力于全生命周期營養(yǎng)產(chǎn)品研發(fā)。專家指出，科學(xué)喂養(yǎng)直接影響嬰幼兒成長發(fā)育，行業(yè)標(biāo)準(zhǔn)實(shí)施將規(guī)范市場(chǎng)秩序，提升國民嬰幼兒營養(yǎng)健康水平。
Funcom宣布《沙丘：覺醒》大規(guī)模測(cè)試即將開啟

《沙丘：覺醒》將于6月10日正式上線，5月10日將在倫敦與PAX East同步舉行全球在線派對(duì)直播，并發(fā)放數(shù)萬測(cè)試密鑰。5月9日至12日將開啟大規(guī)模測(cè)試，玩家可體驗(yàn)前20小時(shí)內(nèi)容及第一章劇情。游戲基于弗蘭克·赫伯特經(jīng)典科幻小說改編，融合電影化敘事與開放世界生存玩法，玩家將探索厄拉科斯沙漠星球，揭開神秘預(yù)言與古老陰謀交織的故事。購買豪華版或終極版可提前5天進(jìn)入游戲。開發(fā)商Funcom曾推出《流放者柯南》等知名作品。

?沙丘覺醒 ?在線派對(duì) ?游戲測(cè)試
妙音數(shù)科領(lǐng)航 VR 創(chuàng)新，《一念幻世》開啟沉浸式科技新紀(jì)元

北京妙音數(shù)科推出國內(nèi)首個(gè)"AI覺醒與人類文明存續(xù)"主題VR大空間沉浸項(xiàng)目《一念幻世》。該項(xiàng)目融合AI與VR技術(shù)，采用厘米級(jí)精準(zhǔn)追蹤系統(tǒng)，支持玩家在數(shù)百平米真實(shí)場(chǎng)地自由探索虛擬場(chǎng)景。創(chuàng)新性地結(jié)合AI智能實(shí)時(shí)語音對(duì)話與手勢(shì)識(shí)別技術(shù)，實(shí)現(xiàn)"所見即所感"的沉浸體驗(yàn)。項(xiàng)目以AI覺醒危機(jī)為主線，通過交互式解謎引導(dǎo)玩家思考科技倫理問題。首發(fā)落地河北邯鄲?

?AI技術(shù) ?虛擬現(xiàn)實(shí) ?沉浸式體驗(yàn)
超聚變探索者大會(huì)2025：算力煥新，開啟智能新紀(jì)元

4 月 15 日- 17 日，以“共建智能體時(shí)代”為主題的超聚變探索者大會(huì) 2025 在鄭州成功舉行。大會(huì)匯聚 2500 余名行業(yè)領(lǐng)袖、專家、媒體等伙伴及客戶，提出并深入探討智能體時(shí)代的發(fā)展趨勢(shì)、驅(qū)動(dòng)要素與價(jià)值應(yīng)用，重磅發(fā)布超聚變算力業(yè)務(wù)、城企數(shù)智業(yè)務(wù)、智慧能源解決方案三大業(yè)務(wù)領(lǐng)域的全新產(chǎn)品矩陣，共同聚焦技術(shù)創(chuàng)新的廣闊應(yīng)用，與全球生態(tài)伙伴積極擁抱戰(zhàn)略機(jī)遇，攜手共

?智能體時(shí)代 ?超聚變探索者大會(huì) ?算力產(chǎn)業(yè)
薦不要思考過程，推理模型能力能夠更強(qiáng)

UC伯克利和艾倫實(shí)驗(yàn)室的最新研究表明，推理模型無需依賴冗長的思考過程也能有效工作。研究人員提出的"無思考(NoThinking)"方法通過簡單提示直接生成解決方案，跳過了傳統(tǒng)推理模型中的顯性思考步驟。實(shí)驗(yàn)證明，在低資源(低token數(shù)量、少模型參數(shù))或低延遲情況下，NoThinking方法的表現(xiàn)優(yōu)于傳統(tǒng)思考方式，能減少token使用量并提高推理速度。該方法在數(shù)學(xué)問題解決、編程和形式定理證明等任務(wù)中表現(xiàn)優(yōu)異，尤其在資源受限時(shí)優(yōu)勢(shì)更明顯。研究還發(fā)現(xiàn)，結(jié)合并行計(jì)算擴(kuò)展后，NoThinking能進(jìn)一步提升性能，在保持準(zhǔn)確性的同時(shí)顯著降低延遲和計(jì)算成本。這一發(fā)現(xiàn)挑戰(zhàn)了"推理模型必須依賴詳細(xì)思考過程"的傳統(tǒng)認(rèn)知。

?推理模型 ?無思考方法 ?解決方案
薦國產(chǎn)六大推理模型激戰(zhàn)OpenAI？

2025年春節(jié)前夕，DeepSeek-R1模型發(fā)布，標(biāo)志著中國AI進(jìn)入推理模型新時(shí)代。文章梳理了國產(chǎn)大模型發(fā)展歷程：從2022年ChatGPT引發(fā)國內(nèi)追趕OpenAI熱潮，到2023年"百模大戰(zhàn)"，再到2024年"AI六小虎"格局形成。重點(diǎn)分析了六大國產(chǎn)推理模型（DeepSeek、百度、阿里、科大訊飛、字節(jié)、騰訊）的技術(shù)特點(diǎn)與市場(chǎng)表現(xiàn)，指出國產(chǎn)模型在性能上已接近GPT-4水平。特別強(qiáng)調(diào)科大訊飛星火X1憑借全國產(chǎn)化技術(shù)路線獲得政企青睞，以及DeepSeek-R1以560萬美元超低成本實(shí)現(xiàn)高性能的突破。文章還探討了英偉達(dá)芯片斷供危機(jī)下，國產(chǎn)全棧技術(shù)路徑的重要性，認(rèn)為自主可控將成為對(duì)抗國際不確定性的關(guān)鍵。最后指出，隨著推理模型成為競(jìng)爭焦點(diǎn)，國產(chǎn)大模型正從技術(shù)追隨轉(zhuǎn)向自主創(chuàng)新階段。

?AI技術(shù) ?DeepSeek-R1 ?云服務(wù)器
新增自主決策推理模型！理想汽車OTA 7.2開啟推送

快科技4月3日消息，我們從理想汽車官方獲悉，OTA7.2版本車機(jī)系統(tǒng)正式開啟推送，預(yù)計(jì)一周內(nèi)完成，升級(jí)耗時(shí)約50分鐘。本次更新新增自主決策推理模型，該模型基于車載場(chǎng)景數(shù)據(jù)及通用推理模型數(shù)據(jù)打造，可根據(jù)問題內(nèi)容自主決策是否深度思考，面對(duì)車控指令等簡單問題時(shí)，能夠保障響應(yīng)速度。智能座艙方面，新增全能兒童鎖功能，支持一鍵鎖定副駕老板鍵、后排座椅物理按?

?理想汽車 ?OTA更新 ?智能座艙
猿輔導(dǎo)開啟“教育+AI”新紀(jì)元，小猿AI三大產(chǎn)品重塑學(xué)習(xí)全場(chǎng)景體驗(yàn)

4月15日，猿輔導(dǎo)集團(tuán)發(fā)布教育行業(yè)首個(gè)AI范式"小猿AI"，推出覆蓋家校場(chǎng)景的三大戰(zhàn)略級(jí)產(chǎn)品。該AI系統(tǒng)基于十年教育數(shù)據(jù)沉淀，構(gòu)建四層技術(shù)架構(gòu)：動(dòng)態(tài)學(xué)情數(shù)據(jù)庫、自研大模型矩陣和個(gè)性化學(xué)習(xí)方案。核心產(chǎn)品包括：1）小猿AI App，首創(chuàng)"五重錯(cuò)因分析系統(tǒng)"，學(xué)習(xí)效率提升40%；2）小猿AI學(xué)習(xí)機(jī)，搭載13英寸護(hù)眼屏和智能基座；3）飛象人工智能通識(shí)課，國內(nèi)首套K12全學(xué)段AI課程。創(chuàng)新亮點(diǎn)包括知識(shí)導(dǎo)航系統(tǒng)精準(zhǔn)度達(dá)91%、情感計(jì)算引擎識(shí)別8類情緒狀態(tài)。集團(tuán)宣布實(shí)施普惠計(jì)劃，基礎(chǔ)功能向全國中小學(xué)生免費(fèi)開放。此次發(fā)布標(biāo)志著我國教育智能化進(jìn)入新階段，通過"技術(shù)+內(nèi)容+終端"立體化布局，重新定義因材施教內(nèi)涵。

熱文

3 天
7天

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<nobr id="c50w6"></nobr>

<span id="c50w6"><pre id="c50w6"><ins id="c50w6"></ins></pre></span>