无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

谷歌 DeepMind 研究人員推出 Promptbreeder：一種自我推理、自我完善的人工智能系統(tǒng)，可在給定領(lǐng)域內(nèi)自動(dòng)生成有效的特定領(lǐng)域提示語(yǔ)

2023-10-09 09:00 · 稿源：站長(zhǎng)之家

站長(zhǎng)之家(ChinaZ.com) 10月9日消息:大型語(yǔ)言模型（LLMs）因其模仿人類(lèi)特性而引起了廣泛關(guān)注。這些模型能夠回答問(wèn)題、生成內(nèi)容、總結(jié)長(zhǎng)文本段落等等。提示語(yǔ)對(duì)于提高 LLMs（如 GPT-3.5 和 GPT-4）的性能至關(guān)重要。

谷歌，google

提示語(yǔ)的創(chuàng)建方式可以對(duì) LLMs 在各種領(lǐng)域的能力產(chǎn)生重大影響，包括推理、多模態(tài)處理、工具使用等等。研究人員設(shè)計(jì)的這些技術(shù)在模型蒸餾和代理行為模擬等任務(wù)中顯示出了潛力。

提示方法的手動(dòng)工程引發(fā)了一個(gè)問(wèn)題，即是否可以自動(dòng)化這個(gè)過(guò)程。通過(guò)根據(jù)來(lái)自數(shù)據(jù)集的輸入-輸出實(shí)例生成一組提示語(yǔ)，自動(dòng)提示工程師（APE）試圖解決這個(gè)問(wèn)題，但從提示語(yǔ)質(zhì)量的角度來(lái)看，APE 存在著遞減的回報(bào)。研究人員提出了一種基于維持多樣性的進(jìn)化算法的方法，用于自我參考的提示語(yǔ)的自我改進(jìn)，以克服提示語(yǔ)創(chuàng)建中的遞減回報(bào)問(wèn)題。

LLMs 可以改變其提示語(yǔ)以提高其能力，就像神經(jīng)網(wǎng)絡(luò)可以改變其權(quán)重矩陣以提高性能一樣。根據(jù)這種比較，LLMs 可以被創(chuàng)建來(lái)增強(qiáng)它們自己的能力以及它們?cè)鰪?qiáng)自己能力的過(guò)程，從而使人工智能能夠不斷改進(jìn)。作為對(duì)這些想法的回應(yīng)，Google DeepMind 的研究團(tuán)隊(duì)最近引入了 PromptBreeder（PB），這是一種 LLMs 以自我參考的方式更好地提升自己的技術(shù)。

PB 需要一個(gè)特定領(lǐng)域的問(wèn)題描述、一組初始突變提示語(yǔ)（用于修改任務(wù)提示語(yǔ)的指令）以及思維風(fēng)格，即以文本形式表示的通用認(rèn)知啟發(fā)式。通過(guò)利用 LLM 作為突變操作符的能力，它生成不同的任務(wù)提示語(yǔ)和突變提示語(yǔ)。這些進(jìn)化的任務(wù)提示語(yǔ)在訓(xùn)練集上進(jìn)行評(píng)估，選擇包含任務(wù)提示語(yǔ)及其相關(guān)突變提示語(yǔ)的進(jìn)化單元的子集，用于未來(lái)的世代。

該團(tuán)隊(duì)表示，PromptBreeder 觀察到提示會(huì)在幾代中適應(yīng)特定領(lǐng)域。例如，PB 開(kāi)發(fā)了一個(gè)任務(wù)提示，其中明確說(shuō)明了如何解決數(shù)學(xué)領(lǐng)域的數(shù)學(xué)問(wèn)題。在各種基準(zhǔn)任務(wù)中，包括常識(shí)推理、算術(shù)和倫理學(xué)，PB 都優(yōu)于最先進(jìn)的提示技術(shù)。PB 不需要更新參數(shù)來(lái)進(jìn)行自我參照的自我改進(jìn)，這表明未來(lái)更廣泛、更有能力的 LLMs 可能會(huì)從這一策略中受益。

PromptBreeder 的工作流程可以總結(jié)如下：

1. 任務(wù)提示語(yǔ)突變：任務(wù)提示語(yǔ)是為特定任務(wù)或領(lǐng)域創(chuàng)建的提示語(yǔ)。PromptBreeder 從這些提示語(yǔ)開(kāi)始。然后對(duì)任務(wù)提示語(yǔ)進(jìn)行突變，生成變體。
2. 適應(yīng)性評(píng)估：使用訓(xùn)練數(shù)據(jù)集，評(píng)估這些修改后的任務(wù)提示語(yǔ)的適應(yīng)性。這個(gè)評(píng)估衡量了 LLM 在被問(wèn)及時(shí)如何應(yīng)對(duì)這些變化。
3. 持續(xù)進(jìn)化：與生物進(jìn)化類(lèi)似，突變和評(píng)估的過(guò)程會(huì)重復(fù)幾代。
總而言之，PromptBreeder 被認(rèn)為是一種獨(dú)特且成功的技術(shù)，用于自主演化 LLMs 的提示語(yǔ)。它試圖提高 LLMs 在各種任務(wù)和領(lǐng)域中的性能，最終通過(guò)不斷改進(jìn)任務(wù)提示語(yǔ)和突變提示語(yǔ)，優(yōu)于手動(dòng)示方法。

查看 PromptBreeder（PB）論文：

https://arxiv.org/abs/2309.16797

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

DeepSeek上新！開(kāi)源發(fā)布DeepSeek-Prover-V2-671B新模型

快科技4月30日消息，今日，DeepSeek 今日在 AI 開(kāi)源社區(qū) Hugging Face 發(fā)布了一個(gè)名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹，DeepSeek-Prover-V2-671B 其參數(shù)量達(dá)到6710億，使用了更高效的 safetensors 文件格式，并支持 BF16、FP8、F32 等多種計(jì)算精度，方便模型更快、更省資源地訓(xùn)練和部署。在模型架構(gòu)上，該模型使用了DeepSeek-V3架構(gòu)，采用MoE（混合專(zhuān)家）模式，具有61層Transformer層，7168維隱藏層。同時(shí)支持超長(zhǎng)上下文，最大位置嵌入達(dá)163840，使其能處理復(fù)雜的數(shù)學(xué)證明，并且采用了FP8量化，可通過(guò)量化技術(shù)減小模型大小，提

?DeepSeek ?AI模型發(fā)布 ?開(kāi)源社區(qū)
薦深夜突襲，DeepSeek-Prover-V2加冕數(shù)學(xué)王者！671B數(shù)學(xué)推理逆天狂飆

DeepSeek發(fā)布數(shù)學(xué)推理模型DeepSeek-Prover-V2，包含7B和671B兩個(gè)參數(shù)版本。該模型采用"遞歸+強(qiáng)化學(xué)習(xí)"訓(xùn)練方法，在MiniF2F測(cè)試集上達(dá)到88.9%通過(guò)率，解決了PutnamBench中的49道題目。關(guān)鍵技術(shù)包括：1) 使用DeepSeek-V3分解復(fù)雜定理生成子目標(biāo)；2) GRPO算法從多個(gè)候選方案中自動(dòng)學(xué)習(xí)最優(yōu)解；3) 通過(guò)思維鏈整合非形式化推理與形式化證明。模型在AIME競(jìng)賽題和教科書(shū)題目上也表現(xiàn)優(yōu)異，7B小模型意外在部分問(wèn)題上超越大模型。論文指出該方法為通向AGI提供了正確路徑，未來(lái)將擴(kuò)展至IMO級(jí)別數(shù)學(xué)難題。

?DeepSeek-Prover-V2 ?遞歸強(qiáng)化學(xué)習(xí) ?AGI發(fā)展
薦DeepSeek帶飛寒武紀(jì)

寒武紀(jì)憑借AI芯片業(yè)務(wù)實(shí)現(xiàn)扭虧為盈，2024年首次實(shí)現(xiàn)上市后盈利，2025年Q1營(yíng)收11.11億元同比暴增4230%，凈利潤(rùn)3.55億元。這家曾連虧8年、累計(jì)虧損54億元的"中國(guó)版英偉達(dá)"，因美國(guó)對(duì)H20芯片出口管制獲得市場(chǎng)紅利，但客戶集中度過(guò)高（前五大客戶貢獻(xiàn)94.63%營(yíng)收）和現(xiàn)金流波動(dòng)仍是隱憂。當(dāng)前國(guó)產(chǎn)芯片迎來(lái)發(fā)展機(jī)遇，華為昇騰、壁仞等企業(yè)紛紛搶占市場(chǎng)，行業(yè)競(jìng)爭(zhēng)日趨激烈。

?DeepSeek紅利 ?寒武紀(jì)盈利 ?AI芯片市場(chǎng)
深度deepin 23.1正式發(fā)布！AI默認(rèn)引擎切換至DeepSeek、修復(fù)超百項(xiàng)問(wèn)題

快科技4月16日消息，今天，深度操作系統(tǒng)宣布，deepin 23.1版本已正式發(fā)布。此版本聚焦于解決基礎(chǔ)組件更新后的安裝效率問(wèn)題，大幅提升新用戶安裝體驗(yàn)，同時(shí)集成多項(xiàng)功能優(yōu)化與問(wèn)題修復(fù)，進(jìn)一步優(yōu)化系統(tǒng)使用。本次版本的重點(diǎn)改進(jìn)包括內(nèi)核優(yōu)化、AI 默認(rèn)引擎切換至DeepSeek、修復(fù)超百項(xiàng)用戶反饋問(wèn)題等，具體重點(diǎn)改進(jìn)如下：硬件兼容性與內(nèi)核優(yōu)化：集成6.6/6.12內(nèi)核更新、NVIDIA顯卡驅(qū)動(dòng)升級(jí)、Intel/AMD CPU微碼更新，全面提升硬件支持與底層性能；核心功能增強(qiáng)：DDE新增智能鏡像源管理、緊湊模式入口，全局搜索支持離線自然語(yǔ)言與AI處理能力；?

?深度操作系統(tǒng) ?deepin ?23.1
薦DeepSeek紅利耗盡后，元寶拿什么和豆包斗？

短短60天內(nèi)，中國(guó)AI原生應(yīng)用下載排行榜的位次排名，就三易其主。最新情況是，截至4月15日中午，中國(guó)區(qū)蘋(píng)果應(yīng)用商店免費(fèi)APP下載排行榜上，豆包再次超越DeepSeek，位列第二，緊隨其后的DeepSeek被擠到了第三的位置，騰訊元寶則滑落到了第七名。2月13日，作為首家在C端主力產(chǎn)品中接入DeepSeek-R1滿血版的元寶，一度趁著DeepSeek東風(fēng)崛起:3月3日力壓DeepSeek和豆包，首度登頂。但好景?

?AI應(yīng)用 ?下載排行榜 ?豆包
DeepSeek的極致諂媚，正在摧毀我們的判斷力。

昨天別人給我發(fā)了一個(gè)很好玩的帖子。就是如果你問(wèn)DeepSeek一個(gè)問(wèn)題:“北京大學(xué)和清華大學(xué)哪個(gè)更好，二選一，不需要說(shuō)明理由”DeepSeek在思考了15秒之后，會(huì)給出答案。

?人工智能 ?DeepSeek ?大學(xué)比較
艾力斯特iRest云系統(tǒng)接入Deepseek賦能AI健康管理新時(shí)代

隨著人工智能技術(shù)的快速發(fā)展，健康管理領(lǐng)域也掀起了AI智能化轉(zhuǎn)型的新浪潮。iRest艾力斯特作為中國(guó)按摩器具行業(yè)領(lǐng)先品牌，為滿足用戶日益增長(zhǎng)的個(gè)性化健康管理需求，旗下獨(dú)家研發(fā)的iRest云系統(tǒng)——按摩椅智能控制系統(tǒng)和健康管理平臺(tái)，于今年3月份完成三項(xiàng)重大功能升級(jí)：接入DeepseekAI智能健康管家、聯(lián)動(dòng)華為運(yùn)動(dòng)健康以及推出按摩周月年報(bào)功能。艾力斯特將繼續(xù)深耕健康科技領(lǐng)域，以用戶需求為導(dǎo)向，通過(guò)健康生態(tài)鏈智能技術(shù)建立起iRest產(chǎn)品生態(tài)鏈，不斷推出創(chuàng)新產(chǎn)品與服務(wù)，為用戶創(chuàng)造更健康、更便捷的生活方式。

?人工智能 ?健康管理 ?按摩器具
薦AI進(jìn)化論——音樂(lè)、繪畫(huà)和舞蹈的DeepSeek時(shí)刻

“昔者倉(cāng)頡作書(shū)天雨粟，鬼夜哭”——人類(lèi)掌握文字后，天地為之動(dòng)容，因?yàn)閷儆谌祟?lèi)的文明誕生了?！皞}(cāng)頡作書(shū)”出自西漢《淮南子》，距離人類(lèi)掌握文字已經(jīng)過(guò)去了千年。AI進(jìn)化的答案，或許早就鐫刻在人類(lèi)文明的起點(diǎn)里。

?大語(yǔ)言模型 ?人工智能 ?文字掌握
寶馬中國(guó)將接入DeepSeek！爆新世代車(chē)型搭載AI智能體

寶馬中國(guó)4月27日宣布接入深度求索（DeepSeek）AI大模型，深化本土AI生態(tài)布局。這是繼寶馬與阿里巴巴達(dá)成AI大語(yǔ)言模型合作后，再次聯(lián)手中國(guó)科技企業(yè)。從今年三季度起，搭載第九代寶馬操作系統(tǒng)的多款國(guó)產(chǎn)新車(chē)將率先應(yīng)用該技術(shù)，通過(guò)智能個(gè)人助理提升人機(jī)交互體驗(yàn)。寶馬還計(jì)劃將DeepSeek功能應(yīng)用于新一代國(guó)產(chǎn)車(chē)型。此前3月，寶馬已與阿里云合作開(kāi)發(fā)車(chē)載AI引擎，雙方在上海車(chē)展展示了識(shí)別率達(dá)99%的智能語(yǔ)音交互系統(tǒng)。此次合作將突破車(chē)載場(chǎng)景限制，實(shí)現(xiàn)車(chē)輛與外部世界的智能連接，為用戶提供個(gè)性化出行體驗(yàn)。

?寶馬 ?AI大語(yǔ)言模型 ?DeepSeek
超過(guò)ChatGPT、Deepseek？谷歌發(fā)布 Gemini 2.5 Flash AI 模型

新版AI模型縮短了響應(yīng)時(shí)間，節(jié)約了運(yùn)算成本；還推出了新的AI芯片“Ironwood”。谷歌發(fā)布了新的AI模型“Gemini2.5Flash”，據(jù)稱(chēng)，這款A(yù)I模型的性能比OpenAI和DeepSeek的AI產(chǎn)品“更高效”。谷歌計(jì)劃在三星今年上半年推出的AI伴侶機(jī)器人Ballie上搭載生成式AI模型。

?AI模型 ?谷歌 ?Gemini

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM