无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > 谷歌最新資訊  > 正文

    谷歌 DeepMind 研究人員推出 Promptbreeder:一種自我推理、自我完善的人工智能系統(tǒng),可在給定領(lǐng)域內(nèi)自動(dòng)生成有效的特定領(lǐng)域提示語(yǔ)

    2023-10-09 09:00 · 稿源:站長(zhǎng)之家

    站長(zhǎng)之家(ChinaZ.com) 10月9日消息:大型語(yǔ)言模型(LLMs)因其模仿人類(lèi)特性而引起了廣泛關(guān)注。這些模型能夠回答問(wèn)題、生成內(nèi)容、總結(jié)長(zhǎng)文本段落等等。提示語(yǔ)對(duì)于提高 LLMs(如 GPT-3.5 和 GPT-4)的性能至關(guān)重要。

    谷歌,google

    提示語(yǔ)的創(chuàng)建方式可以對(duì) LLMs 在各種領(lǐng)域的能力產(chǎn)生重大影響,包括推理、多模態(tài)處理、工具使用等等。研究人員設(shè)計(jì)的這些技術(shù)在模型蒸餾和代理行為模擬等任務(wù)中顯示出了潛力。

    提示方法的手動(dòng)工程引發(fā)了一個(gè)問(wèn)題,即是否可以自動(dòng)化這個(gè)過(guò)程。通過(guò)根據(jù)來(lái)自數(shù)據(jù)集的輸入-輸出實(shí)例生成一組提示語(yǔ),自動(dòng)提示工程師(APE)試圖解決這個(gè)問(wèn)題,但從提示語(yǔ)質(zhì)量的角度來(lái)看,APE 存在著遞減的回報(bào)。研究人員提出了一種基于維持多樣性的進(jìn)化算法的方法,用于自我參考的提示語(yǔ)的自我改進(jìn),以克服提示語(yǔ)創(chuàng)建中的遞減回報(bào)問(wèn)題。

    LLMs 可以改變其提示語(yǔ)以提高其能力,就像神經(jīng)網(wǎng)絡(luò)可以改變其權(quán)重矩陣以提高性能一樣。根據(jù)這種比較,LLMs 可以被創(chuàng)建來(lái)增強(qiáng)它們自己的能力以及它們?cè)鰪?qiáng)自己能力的過(guò)程,從而使人工智能能夠不斷改進(jìn)。作為對(duì)這些想法的回應(yīng),Google DeepMind 的研究團(tuán)隊(duì)最近引入了 PromptBreeder(PB),這是一種 LLMs 以自我參考的方式更好地提升自己的技術(shù)。

    PB 需要一個(gè)特定領(lǐng)域的問(wèn)題描述、一組初始突變提示語(yǔ)(用于修改任務(wù)提示語(yǔ)的指令)以及思維風(fēng)格,即以文本形式表示的通用認(rèn)知啟發(fā)式。通過(guò)利用 LLM 作為突變操作符的能力,它生成不同的任務(wù)提示語(yǔ)和突變提示語(yǔ)。這些進(jìn)化的任務(wù)提示語(yǔ)在訓(xùn)練集上進(jìn)行評(píng)估,選擇包含任務(wù)提示語(yǔ)及其相關(guān)突變提示語(yǔ)的進(jìn)化單元的子集,用于未來(lái)的世代。

    該團(tuán)隊(duì)表示,PromptBreeder 觀察到提示會(huì)在幾代中適應(yīng)特定領(lǐng)域。例如,PB 開(kāi)發(fā)了一個(gè)任務(wù)提示,其中明確說(shuō)明了如何解決數(shù)學(xué)領(lǐng)域的數(shù)學(xué)問(wèn)題。在各種基準(zhǔn)任務(wù)中,包括常識(shí)推理、算術(shù)和倫理學(xué),PB 都優(yōu)于最先進(jìn)的提示技術(shù)。PB 不需要更新參數(shù)來(lái)進(jìn)行自我參照的自我改進(jìn),這表明未來(lái)更廣泛、更有能力的 LLMs 可能會(huì)從這一策略中受益。

    PromptBreeder 的工作流程可以總結(jié)如下:

    1. 任務(wù)提示語(yǔ)突變:任務(wù)提示語(yǔ)是為特定任務(wù)或領(lǐng)域創(chuàng)建的提示語(yǔ)。PromptBreeder 從這些提示語(yǔ)開(kāi)始。然后對(duì)任務(wù)提示語(yǔ)進(jìn)行突變,生成變體。

    2. 適應(yīng)性評(píng)估:使用訓(xùn)練數(shù)據(jù)集,評(píng)估這些修改后的任務(wù)提示語(yǔ)的適應(yīng)性。這個(gè)評(píng)估衡量了 LLM 在被問(wèn)及時(shí)如何應(yīng)對(duì)這些變化。

    3. 持續(xù)進(jìn)化:與生物進(jìn)化類(lèi)似,突變和評(píng)估的過(guò)程會(huì)重復(fù)幾代。

    總而言之,PromptBreeder 被認(rèn)為是一種獨(dú)特且成功的技術(shù),用于自主演化 LLMs 的提示語(yǔ)。它試圖提高 LLMs 在各種任務(wù)和領(lǐng)域中的性能,最終通過(guò)不斷改進(jìn)任務(wù)提示語(yǔ)和突變提示語(yǔ),優(yōu)于手動(dòng)示方法。

    查看 PromptBreeder(PB)論文:

    https://arxiv.org/abs/2309.16797

    舉報(bào)

    • 相關(guān)推薦
    • DeepSeek上新!開(kāi)源發(fā)布DeepSeek-Prover-V2-671B新模型

      快科技4月30日消息,今日,DeepSeek 今日在 AI 開(kāi)源社區(qū) Hugging Face 發(fā)布了一個(gè)名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹,DeepSeek-Prover-V2-671B 其參數(shù)量達(dá)到6710億,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多種計(jì)算精度,方便模型更快、更省資源地訓(xùn)練和部署。在模型架構(gòu)上,該模型使用了DeepSeek-V3架構(gòu),采用MoE(混合專(zhuān)家)模式,具有61層Transformer層,7168維隱藏層。同時(shí)支持超長(zhǎng)上下文,最大位置嵌入達(dá)163840,使其能處理復(fù)雜的數(shù)學(xué)證明,并且采用了FP8量化,可通過(guò)量化技術(shù)減小模型大小,提

    • 深夜突襲,DeepSeek-Prover-V2加冕數(shù)學(xué)王者!671B數(shù)學(xué)推理逆天狂飆

      DeepSeek發(fā)布數(shù)學(xué)推理模型DeepSeek-Prover-V2,包含7B和671B兩個(gè)參數(shù)版本。該模型采用"遞歸+強(qiáng)化學(xué)習(xí)"訓(xùn)練方法,在MiniF2F測(cè)試集上達(dá)到88.9%通過(guò)率,解決了PutnamBench中的49道題目。關(guān)鍵技術(shù)包括:1) 使用DeepSeek-V3分解復(fù)雜定理生成子目標(biāo);2) GRPO算法從多個(gè)候選方案中自動(dòng)學(xué)習(xí)最優(yōu)解;3) 通過(guò)思維鏈整合非形式化推理與形式化證明。模型在AIME競(jìng)賽題和教科書(shū)題目上也表現(xiàn)優(yōu)異,7B小模型意外在部分問(wèn)題上超越大模型。論文指出該方法為通向AGI提供了正確路徑,未來(lái)將擴(kuò)展至IMO級(jí)別數(shù)學(xué)難題。

    • DeepSeek帶飛寒武紀(jì)

      寒武紀(jì)憑借AI芯片業(yè)務(wù)實(shí)現(xiàn)扭虧為盈,2024年首次實(shí)現(xiàn)上市后盈利,2025年Q1營(yíng)收11.11億元同比暴增4230%,凈利潤(rùn)3.55億元。這家曾連虧8年、累計(jì)虧損54億元的"中國(guó)版英偉達(dá)",因美國(guó)對(duì)H20芯片出口管制獲得市場(chǎng)紅利,但客戶集中度過(guò)高(前五大客戶貢獻(xiàn)94.63%營(yíng)收)和現(xiàn)金流波動(dòng)仍是隱憂。當(dāng)前國(guó)產(chǎn)芯片迎來(lái)發(fā)展機(jī)遇,華為昇騰、壁仞等企業(yè)紛紛搶占市場(chǎng),行業(yè)競(jìng)爭(zhēng)日趨激烈。

    • 深度deepin 23.1正式發(fā)布!AI默認(rèn)引擎切換至DeepSeek、修復(fù)超百項(xiàng)問(wèn)題

      快科技4月16日消息,今天,深度操作系統(tǒng)宣布,deepin 23.1版本已正式發(fā)布。此版本聚焦于解決基礎(chǔ)組件更新后的安裝效率問(wèn)題,大幅提升新用戶安裝體驗(yàn),同時(shí)集成多項(xiàng)功能優(yōu)化與問(wèn)題修復(fù),進(jìn)一步優(yōu)化系統(tǒng)使用。本次版本的重點(diǎn)改進(jìn)包括內(nèi)核優(yōu)化、AI 默認(rèn)引擎切換至DeepSeek、修復(fù)超百項(xiàng)用戶反饋問(wèn)題等,具體重點(diǎn)改進(jìn)如下:硬件兼容性與內(nèi)核優(yōu)化:集成6.6/6.12內(nèi)核更新、NVIDIA顯卡驅(qū)動(dòng)升級(jí)、Intel/AMD CPU微碼更新,全面提升硬件支持與底層性能;核心功能增強(qiáng):DDE新增智能鏡像源管理、緊湊模式入口,全局搜索支持離線自然語(yǔ)言與AI處理能力;?

    • DeepSeek紅利耗盡后,元寶拿什么和豆包斗?

      短短60天內(nèi),中國(guó)AI原生應(yīng)用下載排行榜的位次排名,就三易其主。最新情況是,截至4月15日中午,中國(guó)區(qū)蘋(píng)果應(yīng)用商店免費(fèi)APP下載排行榜上,豆包再次超越DeepSeek,位列第二,緊隨其后的DeepSeek被擠到了第三的位置,騰訊元寶則滑落到了第七名。2月13日,作為首家在C端主力產(chǎn)品中接入DeepSeek-R1滿血版的元寶,一度趁著DeepSeek東風(fēng)崛起:3月3日力壓DeepSeek和豆包,首度登頂。但好景?

    • DeepSeek的極致諂媚,正在摧毀我們的判斷力。

      昨天別人給我發(fā)了一個(gè)很好玩的帖子。就是如果你問(wèn)DeepSeek一個(gè)問(wèn)題:“北京大學(xué)和清華大學(xué)哪個(gè)更好,二選一,不需要說(shuō)明理由”DeepSeek在思考了15秒之后,會(huì)給出答案。

    • 艾力斯特iRest系統(tǒng)接入Deepseek賦能AI健康管理新時(shí)代

      隨著人工智能技術(shù)的快速發(fā)展,健康管理領(lǐng)域也掀起了AI智能化轉(zhuǎn)型的新浪潮。iRest艾力斯特作為中國(guó)按摩器具行業(yè)領(lǐng)先品牌,為滿足用戶日益增長(zhǎng)的個(gè)性化健康管理需求,旗下獨(dú)家研發(fā)的iRest云系統(tǒng)——按摩椅智能控制系統(tǒng)和健康管理平臺(tái),于今年3月份完成三項(xiàng)重大功能升級(jí):接入DeepseekAI智能健康管家、聯(lián)動(dòng)華為運(yùn)動(dòng)健康以及推出按摩周月年報(bào)功能。艾力斯特將繼續(xù)深耕健康科技領(lǐng)域,以用戶需求為導(dǎo)向,通過(guò)健康生態(tài)鏈智能技術(shù)建立起iRest產(chǎn)品生態(tài)鏈,不斷推出創(chuàng)新產(chǎn)品與服務(wù),為用戶創(chuàng)造更健康、更便捷的生活方式。

    • AI進(jìn)化論——音樂(lè)、繪畫(huà)和舞蹈的DeepSeek時(shí)刻

      “昔者倉(cāng)頡作書(shū)天雨粟,鬼夜哭”——人類(lèi)掌握文字后,天地為之動(dòng)容,因?yàn)閷儆谌祟?lèi)的文明誕生了?!皞}(cāng)頡作書(shū)”出自西漢《淮南子》,距離人類(lèi)掌握文字已經(jīng)過(guò)去了千年。AI進(jìn)化的答案,或許早就鐫刻在人類(lèi)文明的起點(diǎn)里。

    • 寶馬中國(guó)將接入DeepSeek!爆新世代車(chē)型搭載AI智能

      寶馬中國(guó)4月27日宣布接入深度求索(DeepSeek)AI大模型,深化本土AI生態(tài)布局。這是繼寶馬與阿里巴巴達(dá)成AI大語(yǔ)言模型合作后,再次聯(lián)手中國(guó)科技企業(yè)。從今年三季度起,搭載第九代寶馬操作系統(tǒng)的多款國(guó)產(chǎn)新車(chē)將率先應(yīng)用該技術(shù),通過(guò)智能個(gè)人助理提升人機(jī)交互體驗(yàn)。寶馬還計(jì)劃將DeepSeek功能應(yīng)用于新一代國(guó)產(chǎn)車(chē)型。此前3月,寶馬已與阿里云合作開(kāi)發(fā)車(chē)載AI引擎,雙方在上海車(chē)展展示了識(shí)別率達(dá)99%的智能語(yǔ)音交互系統(tǒng)。此次合作將突破車(chē)載場(chǎng)景限制,實(shí)現(xiàn)車(chē)輛與外部世界的智能連接,為用戶提供個(gè)性化出行體驗(yàn)。

    • 超過(guò)ChatGPT、Deepseek?谷歌發(fā)布 Gemini 2.5 Flash AI 模型

      新版AI模型縮短了響應(yīng)時(shí)間,節(jié)約了運(yùn)算成本;還推出了新的AI芯片“Ironwood”。谷歌發(fā)布了新的AI模型“Gemini2.5Flash”,據(jù)稱(chēng),這款A(yù)I模型的性能比OpenAI和DeepSeek的AI產(chǎn)品“更高效”。谷歌計(jì)劃在三星今年上半年推出的AI伴侶機(jī)器人Ballie上搭載生成式AI模型。

    熱文

    • 3 天
    • 7天