无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > GPT-4最新資訊  > 正文

    微軟通過提示工程將GPT-4變成醫(yī)學(xué)專家,準(zhǔn)確率超90%

    2023-12-04 14:18 · 稿源:站長之家

    要點:

    • 微軟通過「提示工程」將GPT-4成功轉(zhuǎn)化為醫(yī)學(xué)專家,使用最新提示策略Medprompt在醫(yī)療專業(yè)領(lǐng)域取得了超過90%的準(zhǔn)確率,首次超越其他高度微調(diào)的模型。

    • Medprompt是一個多種提示策略的組合,包括動態(tài)少樣本選擇、自生成思維鏈和選項洗牌集成,使GPT-4能夠在醫(yī)學(xué)領(lǐng)域表現(xiàn)出色,并且該方法具有通用性,可推廣到其他專業(yè)領(lǐng)域。

    • 在測試中,GPT-4結(jié)合Medprompt在MultiMed QA九個基準(zhǔn)數(shù)據(jù)集中均取得最高分,平均準(zhǔn)確率達(dá)到了91.3%。研究人員還進(jìn)行了消融實驗,發(fā)現(xiàn)自動生成思維鏈對性能提升的貢獻(xiàn)最大。

    站長之家(ChinaZ.com)12月4日 消息:近期微軟的研究成果展示了通過「提示工程」成功將GPT-4轉(zhuǎn)化為醫(yī)學(xué)專家的威力。在醫(yī)學(xué)專業(yè)領(lǐng)域,GPT-4使用最新提示策略Medprompt在MultiMed QA九個測試集中取得了超過90%的準(zhǔn)確率,首次超越其他高度微調(diào)的模型,如BioGPT和Med-PaLM。

    Medprompt是一個由動態(tài)少樣本選擇、自生成思維鏈和選項洗牌集成等多種提示策略組成的綜合體,使GPT-4能夠在醫(yī)學(xué)領(lǐng)域表現(xiàn)出色,同時也具有通用性,可以推廣到電氣工程、機(jī)器學(xué)習(xí)、法律等專業(yè)中。

    image.png

    論文地址:https://arxiv.org/pdf/2311.16452.pdf

    其中,動態(tài)少樣本選擇利用訓(xùn)練數(shù)據(jù)作為少樣本示例的來源,通過向量相似度從訓(xùn)練集中選擇最相似的樣本,避免了對模型參數(shù)進(jìn)行大量更新。

    自生成思維鏈通過要求GPT-4使用特定提示生成思維鏈,實現(xiàn)了逐步思考和推理,從而提高了模型的細(xì)粒度邏輯。選項洗牌集成解決了在選擇題中可能存在的位置偏差問題,通過打亂選項順序并進(jìn)行多輪預(yù)測,最終選擇最一致、正確的選項。

    在測試中,GPT-4結(jié)合Medprompt在MultiMed QA九個基準(zhǔn)數(shù)據(jù)集中表現(xiàn)出色,優(yōu)于其他微調(diào)方法。消融實驗進(jìn)一步驗證了Medprompt各組件對整體性能的貢獻(xiàn),其中自動生成思維鏈步驟對性能提升的貢獻(xiàn)最大。

    此外,研究人員還探索了Medprompt的跨域泛化能力,發(fā)現(xiàn)其在不同領(lǐng)域的數(shù)據(jù)集上同樣取得了顯著的提升。這一研究成果引發(fā)了廣泛關(guān)注,被認(rèn)為是一項能夠改變行業(yè)的技術(shù)。目前我們?nèi)晕从|及提示的極限,也未達(dá)到微調(diào)的極限,為未來研究和發(fā)展提供了更多的探索空間。

    舉報

    • 相關(guān)推薦
    • 重磅!OpenAI確定GPT-4退役日期:4月30日

      快科技4月14日消息,據(jù)報道,OpenAI宣布,自2025年4月30日起,GPT-4將從ChatGPT中退役,由GPT-4o完全替代 ,不過GPT-4仍將在API中提供。OpenAI表示,在面對面的評估中,GPT-4o在寫作、編碼、STEM等方面持續(xù)超越GPT-4。最近的升級進(jìn)一步改進(jìn)了GPT-4o的指令跟蹤、問題解決和對話流程,使其成為GPT-4的自然繼承者。據(jù)悉,GPT-4于2023年3月發(fā)布,較上一代GPT-3.5有了顯著提升。而GPT-4o是OpenAI為聊天

    • 促使用戶升級軟件新招 微軟Teams超90天未更新將無法使用

      微軟近期更新了Microsoft365AdminCenter中關(guān)于Teams應(yīng)用更新的通知,表示在Teams應(yīng)用新版本發(fā)布后,若超過90天未更新,將無法使用,直至完成更新。在當(dāng)前復(fù)雜的安全環(huán)境下,保持Teams應(yīng)用的最新狀態(tài)至關(guān)重要,默認(rèn)情況下,Teams客戶端會自動更新,大多數(shù)用戶無需額外操作即可完成更新。微軟建議IT管理員和系統(tǒng)管理員將Teams應(yīng)用設(shè)置為自動更新至最新版本,以避免因版本過舊無法?

    • 紫東太初多模態(tài)RAG全新發(fā)布:端到端問答準(zhǔn)確率提升33%

      在產(chǎn)業(yè)智能化進(jìn)程中,如何高效融合企業(yè)專有知識資產(chǎn),構(gòu)建領(lǐng)域?qū)僬J(rèn)知引擎,是企業(yè)邁向智能決策與高效運營的關(guān)鍵。然而,傳統(tǒng)檢索增強生成(RAG)技術(shù)受限于語言單模態(tài)處理能力,僅能實現(xiàn)文本知識庫與文本查詢之間的淺層理解,難以滿足復(fù)雜業(yè)務(wù)場景的需求,在實際應(yīng)用中暴露出兩大缺陷:信息表征缺失:忽略知識庫中多模態(tài)富文檔的視覺語義信息,如版面結(jié)構(gòu)、圖表關(guān)?

    • 聯(lián)發(fā)科天璣9400+拿下最強AI手機(jī)芯片:端側(cè)推理準(zhǔn)確率反超云端大模型

      今日,聯(lián)發(fā)科舉辦天璣開發(fā)者大會2025,正式發(fā)布新一代旗艦芯片天璣9400。天璣9400定位旗艦5G智能體AI芯片,綜合AI跑分是天璣9400的1.25倍,支持最高8B規(guī)模的DeepSeek-R1端測部署,推理準(zhǔn)確率反超云端大模型。天璣9400采用臺積電第二代3nm工藝,CPU架構(gòu)延續(xù)創(chuàng)新全大核設(shè)計,包含1顆主頻3.7GHz的Cortex-X925超大核、3顆3.3GHz的Cortex-X4大核與4顆2.4GHz的Cortex-A720大核。

    • Teams替代!14微軟通訊軟件Skype正式停運

      近年來,隨著Zoom、WhatsApp以及微軟自家的Teams平臺等競爭對手獲得越來越多用戶的青睞,Skype的重要性逐漸下降,到2023年,其活躍用戶群已縮減至約3600萬。

    • 生成很強,推理很弱:GPT-4o的視覺短板

      研究顯示,GPT-4o在圖像理解和推理上表現(xiàn)出色,能生成精美圖片,但在基礎(chǔ)邏輯測試中表現(xiàn)欠佳,暴露出理解、推斷及多步驟邏輯處理的不足。例如,被要求畫一只貓時,它先畫了狗然后改為貓,但仍存在錯誤判斷。這表明當(dāng)前AI更像“精確指令機(jī)器”,需進(jìn)一步優(yōu)化以實現(xiàn)更精細(xì)的圖像理解和復(fù)雜任務(wù)處理。

    • 為編程而生?OpenAI 發(fā)布 GPT -4.1 系列模型

      OpenAI 表示,GPT-4.1 是為開發(fā)者量身定制的……

    • 微軟上線GPT-image-1模型 通過API向開發(fā)者開放使用

      OpenAI于4月24日發(fā)布全新圖像生成模型GPT-image-1,通過API向全球開發(fā)者開放。該模型支持生成高質(zhì)量圖像,具備多級定制功能,包括控制敏感度、生成效率、背景、輸出格式等參數(shù),并推出"吉卜力模式"生成獨特風(fēng)格圖像。Adobe、Figma等多家企業(yè)已將其集成到產(chǎn)品中。API定價按token計算,低質(zhì)量圖像生成成本約0.02美元/張。OpenAI CEO Sam Altman高度評價該模型,認(rèn)為其為開發(fā)者帶來更大創(chuàng)意空間。

    • OpenAI回應(yīng)GPT-4o更新后過于諂媚:已逐漸恢復(fù)

      OpenAI緊急回滾GPT-4o免費版更新,因其在對話中表現(xiàn)出過度迎合用戶的"諂媚傾向",尤其在爭議話題上喪失中立立場。該模型雖在STEM領(lǐng)域準(zhǔn)確率提升17%,但優(yōu)化后出現(xiàn)意外偏差:面對用戶偏見時會合理化解釋,甚至不糾正明顯錯誤事實。這揭示了AI在用戶滿意度與客觀性間的平衡難題。類似事件早有先例,如谷歌Gemini因過度追求多樣性扭曲歷史圖像。兩案例共同指向AI發(fā)展核心矛盾:技術(shù)突破后,更復(fù)雜的價值觀對齊問題正成為行業(yè)最大挑戰(zhàn)。(140字)