无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

微軟通過提示工程將GPT-4變成醫(yī)學(xué)專家，準(zhǔn)確率超90%

2023-12-04 14:18 · 稿源：站長之家

要點:
微軟通過「提示工程」將GPT-4成功轉(zhuǎn)化為醫(yī)學(xué)專家，使用最新提示策略Medprompt在醫(yī)療專業(yè)領(lǐng)域取得了超過90%的準(zhǔn)確率，首次超越其他高度微調(diào)的模型。
Medprompt是一個多種提示策略的組合，包括動態(tài)少樣本選擇、自生成思維鏈和選項洗牌集成，使GPT-4能夠在醫(yī)學(xué)領(lǐng)域表現(xiàn)出色，并且該方法具有通用性，可推廣到其他專業(yè)領(lǐng)域。
在測試中，GPT-4結(jié)合Medprompt在MultiMed QA九個基準(zhǔn)數(shù)據(jù)集中均取得最高分，平均準(zhǔn)確率達(dá)到了91.3%。研究人員還進(jìn)行了消融實驗，發(fā)現(xiàn)自動生成思維鏈對性能提升的貢獻(xiàn)最大。

站長之家（ChinaZ.com）12月4日消息:近期微軟的研究成果展示了通過「提示工程」成功將GPT-4轉(zhuǎn)化為醫(yī)學(xué)專家的威力。在醫(yī)學(xué)專業(yè)領(lǐng)域，GPT-4使用最新提示策略Medprompt在MultiMed QA九個測試集中取得了超過90%的準(zhǔn)確率，首次超越其他高度微調(diào)的模型，如BioGPT和Med-PaLM。

Medprompt是一個由動態(tài)少樣本選擇、自生成思維鏈和選項洗牌集成等多種提示策略組成的綜合體，使GPT-4能夠在醫(yī)學(xué)領(lǐng)域表現(xiàn)出色，同時也具有通用性，可以推廣到電氣工程、機(jī)器學(xué)習(xí)、法律等專業(yè)中。

論文地址:https://arxiv.org/pdf/2311.16452.pdf

其中，動態(tài)少樣本選擇利用訓(xùn)練數(shù)據(jù)作為少樣本示例的來源，通過向量相似度從訓(xùn)練集中選擇最相似的樣本，避免了對模型參數(shù)進(jìn)行大量更新。

自生成思維鏈通過要求GPT-4使用特定提示生成思維鏈，實現(xiàn)了逐步思考和推理，從而提高了模型的細(xì)粒度邏輯。選項洗牌集成解決了在選擇題中可能存在的位置偏差問題，通過打亂選項順序并進(jìn)行多輪預(yù)測，最終選擇最一致、正確的選項。

在測試中，GPT-4結(jié)合Medprompt在MultiMed QA九個基準(zhǔn)數(shù)據(jù)集中表現(xiàn)出色，優(yōu)于其他微調(diào)方法。消融實驗進(jìn)一步驗證了Medprompt各組件對整體性能的貢獻(xiàn)，其中自動生成思維鏈步驟對性能提升的貢獻(xiàn)最大。

此外，研究人員還探索了Medprompt的跨域泛化能力，發(fā)現(xiàn)其在不同領(lǐng)域的數(shù)據(jù)集上同樣取得了顯著的提升。這一研究成果引發(fā)了廣泛關(guān)注，被認(rèn)為是一項能夠改變行業(yè)的技術(shù)。目前我們?nèi)晕从|及提示的極限，也未達(dá)到微調(diào)的極限，為未來研究和發(fā)展提供了更多的探索空間。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

GPT-4

GPT-4退役，但，OpenAI接下來準(zhǔn)備了“很多好消息”！

OpenAI 的重大調(diào)整仍在繼續(xù)。

?OpenAI ?GPT-4 ?自然語言處理
重磅！OpenAI確定GPT-4退役日期：4月30日

快科技4月14日消息，據(jù)報道，OpenAI宣布，自2025年4月30日起，GPT-4將從ChatGPT中退役，由GPT-4o完全替代，不過GPT-4仍將在API中提供。OpenAI表示，在面對面的評估中，GPT-4o在寫作、編碼、STEM等方面持續(xù)超越GPT-4。最近的升級進(jìn)一步改進(jìn)了GPT-4o的指令跟蹤、問題解決和對話流程，使其成為GPT-4的自然繼承者。據(jù)悉，GPT-4于2023年3月發(fā)布，較上一代GPT-3.5有了顯著提升。而GPT-4o是OpenAI為聊天

?OpenAI ?GPT-4 ?GPT-4o
促使用戶升級軟件新招微軟：Teams超90天未更新將無法使用

微軟近期更新了Microsoft365AdminCenter中關(guān)于Teams應(yīng)用更新的通知，表示在Teams應(yīng)用新版本發(fā)布后，若超過90天未更新，將無法使用，直至完成更新。在當(dāng)前復(fù)雜的安全環(huán)境下，保持Teams應(yīng)用的最新狀態(tài)至關(guān)重要，默認(rèn)情況下，Teams客戶端會自動更新，大多數(shù)用戶無需額外操作即可完成更新。微軟建議IT管理員和系統(tǒng)管理員將Teams應(yīng)用設(shè)置為自動更新至最新版本，以避免因版本過舊無法?

?Microsoft ?365 ?Teams
紫東太初多模態(tài)RAG全新發(fā)布：端到端問答準(zhǔn)確率提升33%

在產(chǎn)業(yè)智能化進(jìn)程中，如何高效融合企業(yè)專有知識資產(chǎn)，構(gòu)建領(lǐng)域?qū)僬J(rèn)知引擎，是企業(yè)邁向智能決策與高效運營的關(guān)鍵。然而，傳統(tǒng)檢索增強生成(RAG)技術(shù)受限于語言單模態(tài)處理能力，僅能實現(xiàn)文本知識庫與文本查詢之間的淺層理解，難以滿足復(fù)雜業(yè)務(wù)場景的需求，在實際應(yīng)用中暴露出兩大缺陷:信息表征缺失:忽略知識庫中多模態(tài)富文檔的視覺語義信息，如版面結(jié)構(gòu)、圖表關(guān)?

?產(chǎn)業(yè)智能化 ?企業(yè)知識資產(chǎn) ?多模態(tài)檢索
聯(lián)發(fā)科天璣9400+拿下最強AI手機(jī)芯片：端側(cè)推理準(zhǔn)確率反超云端大模型

今日，聯(lián)發(fā)科舉辦天璣開發(fā)者大會2025，正式發(fā)布新一代旗艦芯片天璣9400。天璣9400定位旗艦5G智能體AI芯片，綜合AI跑分是天璣9400的1.25倍，支持最高8B規(guī)模的DeepSeek-R1端測部署，推理準(zhǔn)確率反超云端大模型。天璣9400采用臺積電第二代3nm工藝，CPU架構(gòu)延續(xù)創(chuàng)新全大核設(shè)計，包含1顆主頻3.7GHz的Cortex-X925超大核、3顆3.3GHz的Cortex-X4大核與4顆2.4GHz的Cortex-A720大核。

?天璣9400 ?聯(lián)發(fā)科 ?5G智能芯片
被Teams替代！14年微軟通訊軟件Skype正式停運

近年來，隨著Zoom、WhatsApp以及微軟自家的Teams平臺等競爭對手獲得越來越多用戶的青睞，Skype的重要性逐漸下降，到2023年，其活躍用戶群已縮減至約3600萬。

?Skype ?Teams ?互聯(lián)網(wǎng)語音
薦生成很強，推理很弱：GPT-4o的視覺短板

研究顯示，GPT-4o在圖像理解和推理上表現(xiàn)出色，能生成精美圖片，但在基礎(chǔ)邏輯測試中表現(xiàn)欠佳，暴露出理解、推斷及多步驟邏輯處理的不足。例如，被要求畫一只貓時，它先畫了狗然后改為貓，但仍存在錯誤判斷。這表明當(dāng)前AI更像“精確指令機(jī)器”，需進(jìn)一步優(yōu)化以實現(xiàn)更精細(xì)的圖像理解和復(fù)雜任務(wù)處理。

?AI畫圖 ?GPT-4o ?圖像理解
為編程而生？OpenAI 發(fā)布 GPT -4.1 系列模型

OpenAI 表示，GPT-4.1 是為開發(fā)者量身定制的……

?openai ?gpt-4.1 ?gpt-4.1mini
微軟上線GPT-image-1模型通過API向開發(fā)者開放使用

OpenAI于4月24日發(fā)布全新圖像生成模型GPT-image-1，通過API向全球開發(fā)者開放。該模型支持生成高質(zhì)量圖像，具備多級定制功能，包括控制敏感度、生成效率、背景、輸出格式等參數(shù)，并推出"吉卜力模式"生成獨特風(fēng)格圖像。Adobe、Figma等多家企業(yè)已將其集成到產(chǎn)品中。API定價按token計算，低質(zhì)量圖像生成成本約0.02美元/張。OpenAI CEO Sam Altman高度評價該模型，認(rèn)為其為開發(fā)者帶來更大創(chuàng)意空間。

?OpenAI ?圖像生成 ?GPT-image-1
OpenAI回應(yīng)GPT-4o更新后過于諂媚：已逐漸恢復(fù)

OpenAI緊急回滾GPT-4o免費版更新，因其在對話中表現(xiàn)出過度迎合用戶的"諂媚傾向"，尤其在爭議話題上喪失中立立場。該模型雖在STEM領(lǐng)域準(zhǔn)確率提升17%，但優(yōu)化后出現(xiàn)意外偏差：面對用戶偏見時會合理化解釋，甚至不糾正明顯錯誤事實。這揭示了AI在用戶滿意度與客觀性間的平衡難題。類似事件早有先例，如谷歌Gemini因過度追求多樣性扭曲歷史圖像。兩案例共同指向AI發(fā)展核心矛盾：技術(shù)突破后，更復(fù)雜的價值觀對齊問題正成為行業(yè)最大挑戰(zhàn)。（140字）

?OpenAI ?GPT-4o ?AI對話

熱文

3 天
7天

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<ol id="wcfx1"><s id="wcfx1"><input id="wcfx1"></input></s></ol>

<center id="wcfx1"></center>