无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > 模型最新資訊  > 正文

    自回歸模型BLOOMZ來了!性能時延僅3.7秒,推理變得更容易了!

    2023-08-25 09:16 · 稿源:站長之家

    文章要點:

    • BLOOMZ是擁有1760億參數(shù)的大規(guī)模語言模型,在Habana Gaudi?2硬件上進行推理時延僅3.7秒。

    • Habana Gaudi?2具有強大的計算能力和內(nèi)存容量,可支持大模型的訓(xùn)練和推理。

    • 利用DeepSpeed的模型并行技術(shù),可以在多臺Gaudi?2設(shè)備上分布一個極大規(guī)模的模型進行推理。

    站長之家(ChinaZ.com)8月25日 消息:最近,Anthropic公司開源了語言理解模型BLOOMZ,它擁有高達1760億個參數(shù),是目前公開的參數(shù)量最大的語言模型之一。以這種規(guī)模的模型進行推理,對硬件的算力和內(nèi)存提出了極高的要求。

    image.png

    論文地址:https://arxiv.org/abs/2211.05100

    Habana Labs推出的第二代AI芯片Gaudi?2在此方面具有獨特優(yōu)勢。單塊Gaudi?2芯片就具有96GB內(nèi)存,8塊芯片可以組成一個服務(wù)器,提供768GB的總內(nèi)存。Habana自主研發(fā)的SynapseAI軟件棧可以將模型有效分配到多塊芯片上,實現(xiàn)模型并行。

    image.png

    Hugging Face的工程師使用Gaudi?2對BLOOMZ模型進行了測試。結(jié)果顯示,在8塊芯片上以16位浮點精度進行推理,延遲只有3.7秒,達到了接近實時的速度。相比之下,在第一代Gaudi芯片上推理需時20秒。Habana團隊表示,通過持續(xù)優(yōu)化,有望進一步提升BLOOMZ的推理性能。

    Gaudi?2芯片強大的算力和巨大的內(nèi)存,配合Habana自主研發(fā)的SynapseAI軟件棧,可以輕松支持千億級參數(shù)的語言模型進行實時推理。這為大模型的實際應(yīng)用帶來了新的可能性。未來Habana計劃支持更低精度的推理,以進一步提升性能并降低功耗。

    舉報

    • 相關(guān)推薦
    • 大規(guī)模專家并行推理集群實現(xiàn)性能3倍躍遷,聯(lián)通元景開啟推理新紀(jì)元

      中國聯(lián)通持續(xù)技術(shù)攻堅,依托元景大模型MaaS平臺成功搭建“大規(guī)模專家并行”推理集群,實現(xiàn)DeepSeekMoE大模型在多節(jié)點間的超高效集群推理,單卡吞吐提升3倍,解碼時延降低50%。這一成果不僅為人工智能技術(shù)的創(chuàng)新發(fā)展提供了強大助力,也讓各行業(yè)以更高效率應(yīng)用AI技術(shù),加速推動千行百業(yè)的數(shù)字化轉(zhuǎn)型。這一推理創(chuàng)新舉措必將助力各行業(yè)在復(fù)雜多變、競爭激烈的市場環(huán)境中搶占先機,以智能化驅(qū)動數(shù)字化轉(zhuǎn)型,進推動實體經(jīng)濟高質(zhì)量發(fā)展。

    • 不要思考過程,推理模型能力能夠更強

      UC伯克利和艾倫實驗室的最新研究表明,推理模型無需依賴冗長的思考過程也能有效工作。研究人員提出的"無思考(NoThinking)"方法通過簡單提示直接生成解決方案,跳過了傳統(tǒng)推理模型中的顯性思考步驟。實驗證明,在低資源(低token數(shù)量、少模型參數(shù))或低延遲情況下,NoThinking方法的表現(xiàn)優(yōu)于傳統(tǒng)思考方式,能減少token使用量并提高推理速度。該方法在數(shù)學(xué)問題解決、編程和形式定理證明等任務(wù)中表現(xiàn)優(yōu)異,尤其在資源受限時優(yōu)勢更明顯。研究還發(fā)現(xiàn),結(jié)合并行計算擴展后,NoThinking能進一步提升性能,在保持準(zhǔn)確性的同時顯著降低延遲和計算成本。這一發(fā)現(xiàn)挑戰(zhàn)了"推理模型必須依賴詳細思考過程"的傳統(tǒng)認(rèn)知。

    • 國產(chǎn)六大推理模型激戰(zhàn)OpenAI?

      2025年春節(jié)前夕,DeepSeek-R1模型發(fā)布,標(biāo)志著中國AI進入推理模型新時代。文章梳理了國產(chǎn)大模型發(fā)展歷程:從2022年ChatGPT引發(fā)國內(nèi)追趕OpenAI熱潮,到2023年"百模大戰(zhàn)",再到2024年"AI六小虎"格局形成。重點分析了六大國產(chǎn)推理模型(DeepSeek、百度、阿里、科大訊飛、字節(jié)、騰訊)的技術(shù)特點與市場表現(xiàn),指出國產(chǎn)模型在性能上已接近GPT-4水平。特別強調(diào)科大訊飛星火X1憑借全國產(chǎn)化技術(shù)路線獲得政企青睞,以及DeepSeek-R1以560萬美元超低成本實現(xiàn)高性能的突破。文章還探討了英偉達芯片斷供危機下,國產(chǎn)全棧技術(shù)路徑的重要性,認(rèn)為自主可控將成為對抗國際不確定性的關(guān)鍵。最后指出,隨著推理模型成為競爭焦點,國產(chǎn)大模型正從技術(shù)追隨轉(zhuǎn)向自主創(chuàng)新階段。

    • DeepSeek R2來了?全新推理Scaling論文聯(lián)手清華震撼發(fā)布!

      【新智元導(dǎo)讀】DeepSeek新論文來了!在清華研究者共同發(fā)布的研究中,他們發(fā)現(xiàn)了獎勵模型推理時Scaling的全新方法。DeepSeekR2,果然近了。他們用包含300個樣本的降采樣測試集測試了DeepSeek-R1,發(fā)現(xiàn)其性能甚至不如236BMoERFT模型,這表明延長推理任務(wù)的思維鏈并不能顯著提升通用RM的性能。

    • 4月30日9至11!今年首個“蛇年蛇月蛇日蛇來了

      4月30日9-11時將迎來今年首個"蛇年蛇月蛇日蛇時"特殊現(xiàn)象。我國傳統(tǒng)干支紀(jì)年法將天干地支組合形成60甲子循環(huán),今年農(nóng)歷為乙巳蛇年。古人用十二地支標(biāo)記月份和時間,對應(yīng)現(xiàn)代24小時制,9-11時為巳時。今年將出現(xiàn)3次"蛇年蛇月蛇日蛇時"現(xiàn)象,分別在4月30日、5月12日和5月24日的9-11時。這一有趣現(xiàn)象源于我國傳統(tǒng)干支紀(jì)年與生肖紀(jì)法的結(jié)合,體現(xiàn)了古人獨特的時間記錄智慧。

    • 零百加速5.7!長城汽車:魏牌高山是性能最強的插混MPV

      比亞迪新款高端MPV車型高能登場,加速表現(xiàn)卓越,零百加速僅需5.7秒,綜合功率高達358kW,扭矩達762Nm。搭載智能四驅(qū)系統(tǒng)與Hi4混動技術(shù),優(yōu)化整車效率,解決用戶對高性能四驅(qū)車油耗高的痛點。在高速場景中,效率提升13%-20%,并具備應(yīng)對極端路況的開發(fā)系統(tǒng),提供更安全的駕駛體驗。此外,該車型全系標(biāo)配四驅(qū)系統(tǒng),不僅提升了高速行駛的精準(zhǔn)度和穩(wěn)定性,還能輕松應(yīng)對雪地等復(fù)雜路況,有效避免車輛打滑帶來的安全隱患。

    • 高考考上985的AI來了!超強數(shù)理推理橫掃真題,訓(xùn)練秘籍劍指AGI

      全球首個工業(yè)界多模態(tài)推理模型Skywork-R1V升級至2.0版本,全面開源38B參數(shù)模型權(quán)重。該模型在高考物理、生物等學(xué)科題目上展現(xiàn)出強大的圖文推理能力,準(zhǔn)確率媲美985考生水平。技術(shù)突破包括:1)首創(chuàng)視覺獎勵模型Skywork-VL Reward,在視覺和文本獎勵基準(zhǔn)測試中均獲SOTA;2)引入混合偏好優(yōu)化(MPO)機制,平衡推理深度與通用能力;3)采用選擇性樣本緩沖(SSB)技術(shù)解決訓(xùn)練中的優(yōu)勢?

    • 安卓性能小鋼炮!聯(lián)想拯救者Y700四代來了:更輕薄性能更強

      文章報道了某電子產(chǎn)品的召回事件,針對該產(chǎn)品Y700系列中的一個缺陷進行了詳細解釋。產(chǎn)品在長時間使用后可能出現(xiàn)屏幕失常、圖像扭曲、亮度變化等問題。通過改進設(shè)計,優(yōu)化了產(chǎn)品的耐用性和電池壽命,確保了8.8小時的續(xù)航能力,電池容量增加到7000mAh,同時配備了雙攝像頭和面部解鎖功能,提升了用戶體驗。改進后的產(chǎn)品在8月10日上市。文章指出,改進后的Y700系列不僅解決了電池壽命問題,還提高了攝像頭的性能和電池續(xù)航能力,改善了整體體驗。

    • 剛剛,商湯發(fā)布第六代大模型:6000億參數(shù)多模態(tài)MoE,中長視頻直接可推理

      現(xiàn)在的國產(chǎn)AI應(yīng)用,一口氣看好幾分鐘的視頻,都可以直接做推理和解析了!瞧~只需“喂”上一段柯南片段,AI就搖身一變成“名偵探”做剖析:它會對整個視頻的內(nèi)容先做一個總結(jié),再按照秒級,對視頻片段做內(nèi)容上的推演。商湯科技聯(lián)合創(chuàng)始人楊帆認(rèn)為:銀河通用合伙人、大模型負責(zé)人張直政表示:除此之外,上海交通大學(xué)副教授閆維新對這個問題的看法是:總言之,商湯作為國?

    • 半價理想L8再上強度!零跑C16推限時一口價:11.87萬起 降價超3.7

      零跑汽車日前宣布,即日起至2025年4月26日24點,通過零跑官方渠道下定C16車系且在2025年6月30日前交付的用戶,可享限時一口價118701元起,其指導(dǎo)價區(qū)間15.58萬-18.98萬元。此次限時一口價,相當(dāng)于起售價降價超3.7萬元。標(biāo)配800V碳化硅高壓平臺,從30%充到80%最快僅需15分鐘。