无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

自回歸模型BLOOMZ來了！性能時延僅3.7秒，推理變得更容易了！

2023-08-25 09:16 · 稿源：站長之家

文章要點:
BLOOMZ是擁有1760億參數(shù)的大規(guī)模語言模型，在Habana Gaudi?2硬件上進行推理時延僅3.7秒。
Habana Gaudi?2具有強大的計算能力和內(nèi)存容量，可支持大模型的訓(xùn)練和推理。
利用DeepSpeed的模型并行技術(shù)，可以在多臺Gaudi?2設(shè)備上分布一個極大規(guī)模的模型進行推理。

站長之家（ChinaZ.com）8月25日消息:最近，Anthropic公司開源了語言理解模型BLOOMZ，它擁有高達1760億個參數(shù)，是目前公開的參數(shù)量最大的語言模型之一。以這種規(guī)模的模型進行推理，對硬件的算力和內(nèi)存提出了極高的要求。

論文地址:https://arxiv.org/abs/2211.05100

Habana Labs推出的第二代AI芯片Gaudi?2在此方面具有獨特優(yōu)勢。單塊Gaudi?2芯片就具有96GB內(nèi)存，8塊芯片可以組成一個服務(wù)器，提供768GB的總內(nèi)存。Habana自主研發(fā)的SynapseAI軟件棧可以將模型有效分配到多塊芯片上，實現(xiàn)模型并行。

Hugging Face的工程師使用Gaudi?2對BLOOMZ模型進行了測試。結(jié)果顯示，在8塊芯片上以16位浮點精度進行推理，延遲只有3.7秒，達到了接近實時的速度。相比之下，在第一代Gaudi芯片上推理需時20秒。Habana團隊表示，通過持續(xù)優(yōu)化，有望進一步提升BLOOMZ的推理性能。

Gaudi?2芯片強大的算力和巨大的內(nèi)存，配合Habana自主研發(fā)的SynapseAI軟件棧，可以輕松支持千億級參數(shù)的語言模型進行實時推理。這為大模型的實際應(yīng)用帶來了新的可能性。未來Habana計劃支持更低精度的推理，以進一步提升性能并降低功耗。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

模型

大規(guī)模專家并行推理集群實現(xiàn)性能3倍躍遷，聯(lián)通元景開啟推理新紀(jì)元

中國聯(lián)通持續(xù)技術(shù)攻堅，依托元景大模型MaaS平臺成功搭建“大規(guī)模專家并行”推理集群，實現(xiàn)DeepSeekMoE大模型在多節(jié)點間的超高效集群推理，單卡吞吐提升3倍，解碼時延降低50%。這一成果不僅為人工智能技術(shù)的創(chuàng)新發(fā)展提供了強大助力，也讓各行業(yè)以更高效率應(yīng)用AI技術(shù)，加速推動千行百業(yè)的數(shù)字化轉(zhuǎn)型。這一推理創(chuàng)新舉措必將助力各行業(yè)在復(fù)雜多變、競爭激烈的市場環(huán)境中搶占先機，以智能化驅(qū)動數(shù)字化轉(zhuǎn)型，進推動實體經(jīng)濟高質(zhì)量發(fā)展。

?中國聯(lián)通 ?大模型 ?人工智能
薦不要思考過程，推理模型能力能夠更強

UC伯克利和艾倫實驗室的最新研究表明，推理模型無需依賴冗長的思考過程也能有效工作。研究人員提出的"無思考(NoThinking)"方法通過簡單提示直接生成解決方案，跳過了傳統(tǒng)推理模型中的顯性思考步驟。實驗證明，在低資源(低token數(shù)量、少模型參數(shù))或低延遲情況下，NoThinking方法的表現(xiàn)優(yōu)于傳統(tǒng)思考方式，能減少token使用量并提高推理速度。該方法在數(shù)學(xué)問題解決、編程和形式定理證明等任務(wù)中表現(xiàn)優(yōu)異，尤其在資源受限時優(yōu)勢更明顯。研究還發(fā)現(xiàn)，結(jié)合并行計算擴展后，NoThinking能進一步提升性能，在保持準(zhǔn)確性的同時顯著降低延遲和計算成本。這一發(fā)現(xiàn)挑戰(zhàn)了"推理模型必須依賴詳細思考過程"的傳統(tǒng)認(rèn)知。

?推理模型 ?無思考方法 ?解決方案
薦國產(chǎn)六大推理模型激戰(zhàn)OpenAI？

2025年春節(jié)前夕，DeepSeek-R1模型發(fā)布，標(biāo)志著中國AI進入推理模型新時代。文章梳理了國產(chǎn)大模型發(fā)展歷程：從2022年ChatGPT引發(fā)國內(nèi)追趕OpenAI熱潮，到2023年"百模大戰(zhàn)"，再到2024年"AI六小虎"格局形成。重點分析了六大國產(chǎn)推理模型（DeepSeek、百度、阿里、科大訊飛、字節(jié)、騰訊）的技術(shù)特點與市場表現(xiàn)，指出國產(chǎn)模型在性能上已接近GPT-4水平。特別強調(diào)科大訊飛星火X1憑借全國產(chǎn)化技術(shù)路線獲得政企青睞，以及DeepSeek-R1以560萬美元超低成本實現(xiàn)高性能的突破。文章還探討了英偉達芯片斷供危機下，國產(chǎn)全棧技術(shù)路徑的重要性，認(rèn)為自主可控將成為對抗國際不確定性的關(guān)鍵。最后指出，隨著推理模型成為競爭焦點，國產(chǎn)大模型正從技術(shù)追隨轉(zhuǎn)向自主創(chuàng)新階段。

?AI技術(shù) ?DeepSeek-R1 ?云服務(wù)器
薦DeepSeek R2來了？全新推理時Scaling論文聯(lián)手清華震撼發(fā)布！

【新智元導(dǎo)讀】DeepSeek新論文來了!在清華研究者共同發(fā)布的研究中，他們發(fā)現(xiàn)了獎勵模型推理時Scaling的全新方法。DeepSeekR2，果然近了。他們用包含300個樣本的降采樣測試集測試了DeepSeek-R1，發(fā)現(xiàn)其性能甚至不如236BMoERFT模型，這表明延長推理任務(wù)的思維鏈并不能顯著提升通用RM的性能。

?DeepSeek ?獎勵模型 ?推理方法
4月30日9至11時！今年首個“蛇年蛇月蛇日蛇時”來了

4月30日9-11時將迎來今年首個"蛇年蛇月蛇日蛇時"特殊現(xiàn)象。我國傳統(tǒng)干支紀(jì)年法將天干地支組合形成60甲子循環(huán)，今年農(nóng)歷為乙巳蛇年。古人用十二地支標(biāo)記月份和時間，對應(yīng)現(xiàn)代24小時制，9-11時為巳時。今年將出現(xiàn)3次"蛇年蛇月蛇日蛇時"現(xiàn)象，分別在4月30日、5月12日和5月24日的9-11時。這一有趣現(xiàn)象源于我國傳統(tǒng)干支紀(jì)年與生肖紀(jì)法的結(jié)合，體現(xiàn)了古人獨特的時間記錄智慧。

?蛇年 ?干支紀(jì)法 ?中國傳統(tǒng)文化
零百加速5.7秒！長城汽車：魏牌高山是性能最強的插混MPV

比亞迪新款高端MPV車型高能登場，加速表現(xiàn)卓越，零百加速僅需5.7秒，綜合功率高達358kW，扭矩達762Nm。搭載智能四驅(qū)系統(tǒng)與Hi4混動技術(shù)，優(yōu)化整車效率，解決用戶對高性能四驅(qū)車油耗高的痛點。在高速場景中，效率提升13%-20%，并具備應(yīng)對極端路況的開發(fā)系統(tǒng)，提供更安全的駕駛體驗。此外，該車型全系標(biāo)配四驅(qū)系統(tǒng)，不僅提升了高速行駛的精準(zhǔn)度和穩(wěn)定性，還能輕松應(yīng)對雪地等復(fù)雜路況，有效避免車輛打滑帶來的安全隱患。
薦高考考上985的AI來了！超強數(shù)理推理橫掃真題，訓(xùn)練秘籍劍指AGI

全球首個工業(yè)界多模態(tài)推理模型Skywork-R1V升級至2.0版本，全面開源38B參數(shù)模型權(quán)重。該模型在高考物理、生物等學(xué)科題目上展現(xiàn)出強大的圖文推理能力，準(zhǔn)確率媲美985考生水平。技術(shù)突破包括：1）首創(chuàng)視覺獎勵模型Skywork-VL Reward，在視覺和文本獎勵基準(zhǔn)測試中均獲SOTA；2）引入混合偏好優(yōu)化(MPO)機制，平衡推理深度與通用能力；3）采用選擇性樣本緩沖(SSB)技術(shù)解決訓(xùn)練中的優(yōu)勢?

?多模態(tài)推理 ?Skywork-R1V ?模型升級
安卓性能小鋼炮！聯(lián)想拯救者Y700四代來了：更輕薄性能更強

文章報道了某電子產(chǎn)品的召回事件，針對該產(chǎn)品Y700系列中的一個缺陷進行了詳細解釋。產(chǎn)品在長時間使用后可能出現(xiàn)屏幕失常、圖像扭曲、亮度變化等問題。通過改進設(shè)計，優(yōu)化了產(chǎn)品的耐用性和電池壽命，確保了8.8小時的續(xù)航能力，電池容量增加到7000mAh，同時配備了雙攝像頭和面部解鎖功能，提升了用戶體驗。改進后的產(chǎn)品在8月10日上市。文章指出，改進后的Y700系列不僅解決了電池壽命問題，還提高了攝像頭的性能和電池續(xù)航能力，改善了整體體驗。

?聯(lián)想拯救者 ?Y700平板 ?驍龍8至尊版
薦剛剛，商湯發(fā)布第六代大模型：6000億參數(shù)多模態(tài)MoE，中長視頻直接可推理

現(xiàn)在的國產(chǎn)AI應(yīng)用，一口氣看好幾分鐘的視頻，都可以直接做推理和解析了!瞧~只需“喂”上一段柯南片段，AI就搖身一變成“名偵探”做剖析:它會對整個視頻的內(nèi)容先做一個總結(jié)，再按照秒級，對視頻片段做內(nèi)容上的推演。商湯科技聯(lián)合創(chuàng)始人楊帆認(rèn)為:銀河通用合伙人、大模型負責(zé)人張直政表示:除此之外，上海交通大學(xué)副教授閆維新對這個問題的看法是:總言之，商湯作為國?

?國產(chǎn)AI ?視頻解析 ?智能剪輯
半價理想L8再上強度！零跑C16推限時一口價：11.87萬起降價超3.7萬

零跑汽車日前宣布，即日起至2025年4月26日24點，通過零跑官方渠道下定C16車系且在2025年6月30日前交付的用戶，可享限時一口價118701元起，其指導(dǎo)價區(qū)間15.58萬-18.98萬元。此次限時一口價，相當(dāng)于起售價降價超3.7萬元。標(biāo)配800V碳化硅高壓平臺，從30%充到80%最快僅需15分鐘。

?零跑汽車 ?C16車系 ?中大型SUV

熱文

3 天
7天

1

累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

站長商機

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM