无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

vLLM

vLLM

近日，摩爾線程上線了大語(yǔ)言模型高速推理框架開(kāi)源項(xiàng)目vLLM的MUSA移植版本，為開(kāi)發(fā)者提供基于摩爾線程全功能GPU進(jìn)行開(kāi)源項(xiàng)目MUSA移植的范例。摩爾線程表示，正努力圍繞自主研發(fā)的統(tǒng)一系統(tǒng)架構(gòu)GPU、MUSA軟件平臺(tái)，構(gòu)建完善好用的MUSA應(yīng)用生態(tài)。摩爾線程通過(guò)MUSA軟件棧對(duì)CUDA軟件棧接口兼容，大幅提升了應(yīng)用移植的效率，縮短了開(kāi)發(fā)周期提供MUSIFY自動(dòng)代碼移植工具等一系列實(shí)用工具和腳本。...

特別聲明：本頁(yè)面標(biāo)簽名稱(chēng)與頁(yè)面內(nèi)容，系網(wǎng)站系統(tǒng)為資訊內(nèi)容分類(lèi)自動(dòng)生成，僅提供資訊內(nèi)容索引使用，旨在方便用戶索引相關(guān)資訊報(bào)道。如標(biāo)簽名稱(chēng)涉及商標(biāo)信息，請(qǐng)?jiān)L問(wèn)商標(biāo)品牌官方了解詳情，請(qǐng)勿以本站標(biāo)簽頁(yè)面內(nèi)容為參考信息，本站與可能出現(xiàn)的商標(biāo)名稱(chēng)信息不存在任何關(guān)聯(lián)關(guān)系，對(duì)本頁(yè)面內(nèi)容所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。站長(zhǎng)之家將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。任何單位或個(gè)人認(rèn)為本頁(yè)面內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，可及時(shí)向站長(zhǎng)之家提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明，并提權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明（點(diǎn)擊查看反饋聯(lián)系地址）。本網(wǎng)站在收到上述反饋文件后，將會(huì)依法依規(guī)核實(shí)信息，第一時(shí)間溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

與“vLLM”的相關(guān)熱搜詞：

相關(guān)“vLLM” 的資訊3篇

【騰訊云】11.11云上盛惠！云服務(wù)器首年1.8折起，買(mǎi)1年送3個(gè)月！

11.11云上盛惠！海量產(chǎn)品 · 輕松上云！云服務(wù)器首年1.8折起，買(mǎi)1年送3個(gè)月！超值優(yōu)惠，性能穩(wěn)定，讓您的云端之旅更加暢享。快來(lái)騰訊云選購(gòu)吧！

Docker容器鏡像
去看看

Docker容器鏡像 60元/15天

爆款產(chǎn)品組合購(gòu)
去看看

爆款產(chǎn)品組合購(gòu) 低至1元

騰訊云x NVIDIA加速計(jì)劃
去看看

騰訊云x NVIDIA加速計(jì)劃最高獲贈(zèng)10萬(wàn)元扶持基金

2核2G云服務(wù)器
去看看

2核2G云服務(wù)器 112元/1年

查看更多相關(guān)信息>>

騰訊云 12-20

廣告
加速替代CUDA！摩爾線程開(kāi)源vLLM-MUSA 加速國(guó)產(chǎn)GPU AI

近日，摩爾線程上線了大語(yǔ)言模型高速推理框架開(kāi)源項(xiàng)目vLLM的MUSA移植版本，為開(kāi)發(fā)者提供基于摩爾線程全功能GPU進(jìn)行開(kāi)源項(xiàng)目MUSA移植的范例。摩爾線程表示，正努力圍繞自主研發(fā)的統(tǒng)一系統(tǒng)架構(gòu)GPU、MUSA軟件平臺(tái)，構(gòu)建完善好用的MUSA應(yīng)用生態(tài)。摩爾線程通過(guò)MUSA軟件棧對(duì)CUDA軟件棧接口兼容，大幅提升了應(yīng)用移植的效率，縮短了開(kāi)發(fā)周期提供MUSIFY自動(dòng)代碼移植工具等一系列實(shí)用工具和腳本。

摩爾線程大語(yǔ)言模型 GPU推理
魔搭社區(qū)與vLLM和FastChat展開(kāi)合作提供高效LLM推理和部署服務(wù)

魔搭社區(qū)與vLLM和FastChat展開(kāi)合作，聯(lián)合為中國(guó)開(kāi)發(fā)者提供更快更高效的LLM推理和部署服務(wù)。開(kāi)發(fā)者可以使用vLLM作為FastChat中的推理引擎，提供高吞吐量的模型推理。還可以結(jié)合FastChat和vLLM搭建一個(gè)網(wǎng)頁(yè)Demo或者類(lèi)OpenAIAPI服務(wù)器。
開(kāi)源機(jī)器學(xué)習(xí)庫(kù)vLLM 提升大語(yǔ)言模型推理速度

大語(yǔ)言模型在改變?nèi)藗兊纳詈吐殬I(yè)方面影響越來(lái)越大，因?yàn)樗鼈儗?shí)現(xiàn)了編程助手和通用聊天機(jī)器人等新應(yīng)用。這些應(yīng)用的運(yùn)行需要大量硬件加速器如GPU，操作成本非常高。更大的模型、更復(fù)雜的解碼算法和更長(zhǎng)的序列會(huì)導(dǎo)致更明顯的改進(jìn)。

vLLM

熱文

3 天
7天

1

累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM