无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > AI技術(shù)最新資訊  > 正文

    國(guó)產(chǎn)六大推理模型激戰(zhàn)OpenAI?

    2025-04-25 08:49 · 稿源: 光子星球公眾號(hào)

    聲明:本文來(lái)自微信公眾號(hào)“guangzi0088”(ID:TMTweb),作者:郝鑫,編輯:王潘,,授權(quán)站長(zhǎng)之家轉(zhuǎn)載發(fā)布。

    DeepSeek-R1如同當(dāng)年蘇聯(lián)搶發(fā)的第一顆衛(wèi)星,成為AI開啟新時(shí)代的斯普特尼克時(shí)刻?!?/strong>

    2025年春節(jié)前,DeepSeek比除夕那天的煙花先一步在世界上空綻放。

    離年夜飯僅剩幾個(gè)小時(shí),國(guó)內(nèi)某家云服務(wù)器的工程師突然被拉入工作群,接到緊急任務(wù),要求其快速調(diào)優(yōu)芯片,以適配最新的DeepSeek-R1模型。該工程師告訴我們,“從接入到完成,整個(gè)過(guò)程不到一周”。

    大年初二,一家從事Agent To B業(yè)務(wù)的廠商負(fù)責(zé)人電話被打爆,客戶的要求簡(jiǎn)單粗暴:第一時(shí)間驗(yàn)證模型真實(shí)性能,盡快把部署提上日程。

    節(jié)前大模型,節(jié)后只有DeepSeek。DeepSeek-R1就像一道分水嶺,重新書寫了中國(guó)大模型的敘事邏輯。

    以2022年11月,OpenAI發(fā)布基于GPT-3.5的ChatGPT應(yīng)用為起點(diǎn),國(guó)內(nèi)自此走上了追趕OpenAI的道路。2023年,大模型如雨后春筍般冒出頭,無(wú)大模型不AI,各廠商你追我趕,百模大戰(zhàn)初見端倪。

    你方唱罷我登場(chǎng),2024年的主人公變成了“AI六小虎”,AI創(chuàng)業(yè)成為新的故事腳本。僅一年的時(shí)間,智譜累計(jì)完成40億元人民幣融資,月之暗面融資總額超13億美元。在資本拋出橄欖枝后,他們站到了聚光燈下,一躍成為明星獨(dú)角獸公司。

    新的轉(zhuǎn)折點(diǎn)發(fā)生在DeepSeek-R1爆火后,曾有一段時(shí)間內(nèi)行業(yè)陷入了“一半火焰,一半海水”的境地,即一邊積極擁抱學(xué)習(xí)R1,一邊陷入了深深的自省。

    徘徊是短暫的,隨著百度、阿里、字節(jié)、騰訊、科大訊飛等廠商紛紛發(fā)布最新的推理模型,2025年的AI敘事主題呼之欲出:“六大推理模型迎戰(zhàn)OpenAI”。

    推理模型的當(dāng)打之年

    回看OpenAI的模型發(fā)布時(shí)間線,在基礎(chǔ)模型方向,可以分為GPT系列和o系列,2024年OpenAI所發(fā)布的o1是一個(gè)里程碑式的轉(zhuǎn)向。

    圖片

    (光子星球制圖)

    GPT系列是OpenAI最早構(gòu)建的模型體系,聚焦自然語(yǔ)言處理、對(duì)話系統(tǒng)與文本生成,強(qiáng)調(diào)語(yǔ)言流暢性與上下文理解能力。o系列是OpenAI于2023年新設(shè)立的模型家族,核心聚焦“結(jié)構(gòu)化推理”能力,強(qiáng)調(diào)模型的邏輯、分析、工具調(diào)用能力,是對(duì)GPT系列“語(yǔ)言偏重”路線的補(bǔ)充與擴(kuò)展。

    未來(lái)GPT系列或?qū)⒅饾u退出歷史舞臺(tái)。OpenAI在更新日志中宣布,自2025年4月30日起,GPT4將在ChatGPT中退役,將完全被GPT4o取代。

    如果只是OpenAI自身技術(shù)選擇,o系列和DeepSeek-R1并不會(huì)帶來(lái)如此強(qiáng)大的影響。以底層模型架構(gòu)舉例,有公司選擇傳統(tǒng)的Transformer架構(gòu),也有公司選擇自研架構(gòu)。

    o系列崛起有一個(gè)大背景,即大模型范式的改變,從傳統(tǒng)預(yù)訓(xùn)練階段模型參數(shù)的Scaling Law,轉(zhuǎn)移到強(qiáng)化學(xué)習(xí)推理計(jì)算帶來(lái)新Scaling Law。這一點(diǎn)在OpenAI的o3開發(fā)過(guò)程中得到了驗(yàn)證,OpenAI觀察到大規(guī)模強(qiáng)化學(xué)習(xí)表現(xiàn)出與GPT系列預(yù)訓(xùn)練中觀察到的趨勢(shì)相同,計(jì)算量越大,性能越好。

    簡(jiǎn)而言之,就是讓AI自己規(guī)劃、學(xué)習(xí)、反饋和完成任務(wù),這與如今大熱的Agent所需具備的能力一致。

    有技術(shù)人員告訴光子星球,o1以后所發(fā)布的“Deep Research”Agent,完全基于模型從頭訓(xùn)練,且未公開思維鏈推理過(guò)程?!斑@意味著底座模型能力直接決定了Agent的落地效果”,想要在大模型第二程變得有競(jìng)爭(zhēng)力,推理模型幾乎成為了必選。

    站在公司和技術(shù)一號(hào)位角度,第一時(shí)間跟進(jìn)o1和DeepSeek-R1是一種判斷和眼光,但同時(shí)也代表著重投入與高風(fēng)險(xiǎn)。

    我們了解到國(guó)內(nèi)的很多公司,名義上有自研大模型,但實(shí)則是“套殼”。o系列站在GPT的肩膀上誕生,這導(dǎo)致地基不牢的公司只能望而卻步。另一方面,融資和商業(yè)化變現(xiàn)的壓力,又淘汰了一批公司。

    圖片

    (光子星球制圖)

    于是,我們發(fā)現(xiàn)去年星光暗淡的大廠們,成為了反應(yīng)最快,跟進(jìn)最及時(shí)的代表。

    以DeepSeek-R1(2025年1月20日發(fā)布)為時(shí)間基準(zhǔn)線,當(dāng)月科大訊飛就發(fā)布了深度推理大模型——訊飛星火X1;3月,百度發(fā)布文心大模型X1,阿里發(fā)布通義千問(wèn)Qwen-QwQ-32B推理模型,騰訊發(fā)布混元T1深度思考模型;4月,字節(jié)豆包1.5深度思考模型上線,同時(shí)訊飛星火X1迎來(lái)升級(jí),發(fā)布“快思考、慢思考統(tǒng)一模型”。

    上述廠商有一些共同之處,跟上了每一次的模型能力升級(jí)進(jìn)度,在轉(zhuǎn)向推理方向前,其基礎(chǔ)模型能力基本都達(dá)到了GPT-4的水平。以此作為參照,這可能是邁入大模型第二階段的基本條件。

    六大推理模型混戰(zhàn)o3

    o3目前是OpenAI最強(qiáng)大的推理模型。網(wǎng)上流傳的一張大模型IQ圖顯示,人類平均IQ為100,o3智商達(dá)到了驚人的136。

    測(cè)試數(shù)據(jù)顯示,o3在多項(xiàng)基準(zhǔn)測(cè)試中超越了o1的性能,特別在分析圖像、圖表和圖形等視覺(jué)任務(wù)中表現(xiàn)尤為出色。

    在外部專家的評(píng)估中,o3在困難的現(xiàn)實(shí)任務(wù)中比o1犯的重大錯(cuò)誤減少20%,在編程、商業(yè)、咨詢和創(chuàng)意構(gòu)思等領(lǐng)域都有不錯(cuò)的表現(xiàn)。

    需要承認(rèn)的是,OpenAI存貨確實(shí)有兩把刷子,繼o1之后,o3又成為了新的大模型性能攀登高峰。但國(guó)內(nèi)各大模型廠商的跟進(jìn)速度并不慢,若以DeepSeek-R1為參考標(biāo)準(zhǔn),百度、阿里、科大訊飛、字節(jié)、騰訊后面所發(fā)布的推理模型水平相差不大,部分在一些測(cè)試指標(biāo)上甚至有超越。

    截至目前,國(guó)產(chǎn)六大推理模型各有千秋。

    DeepSeek-R1的意義不言而喻,完整的技術(shù)報(bào)告和開源部署,給予了行業(yè)推理大模型訓(xùn)練思路。打開了OpenAI閉源的“黑匣子”,成功復(fù)刻出了性能相差無(wú)幾的o1。R1突出的特點(diǎn)是“花小錢辦大事”,高效且追求極致性價(jià)比。在非常有限的算力、數(shù)據(jù)等資源投入的情況下,訓(xùn)練成本卻僅為560萬(wàn)美元,遠(yuǎn)低于美國(guó)AI公司的數(shù)千萬(wàn)美元乃至數(shù)億美元投入。

    一位知情人士告訴我們,DeepSeek-R1和一些國(guó)產(chǎn)推理大模型不構(gòu)成直接競(jìng)爭(zhēng)對(duì)手。在B端業(yè)務(wù)中,目前阿里開源的千問(wèn)系列模型占比更重。“全尺寸和全模型,就像一個(gè)全家桶,可以供客戶選擇。32B的模型大小,跑起來(lái)成本也不是很高”。

    百度在這波中從生態(tài)層面接入了DeepSeek,這給了用戶更多選擇權(quán),開源和免費(fèi)的策略或?qū)⒛芪嘤脩?。文心大模型X1采用“思維鏈-行動(dòng)鏈”協(xié)同訓(xùn)練,在復(fù)雜任務(wù)中自動(dòng)拆解為二十多個(gè)推理步驟,同時(shí)可以調(diào)用十幾種的工具鏈,以此來(lái)增強(qiáng)Agent的能力。

    有參與過(guò)與百度合作的人士告訴光子星球,在金融、醫(yī)療、政務(wù)等一些垂類領(lǐng)域,百度會(huì)“牽線搭橋”,把一些相關(guān)業(yè)務(wù)的公司攢到一個(gè)局?!鞍俣忍峁┗A(chǔ)模型,我們提供另一方所需的技術(shù),最后直接跟百度核算”。通過(guò)這種方式,百度正不斷縮小To B大模型市場(chǎng)與科大訊飛之間的差距。

    科大訊飛的星火X1,是當(dāng)前業(yè)界唯一基于全國(guó)產(chǎn)算力訓(xùn)練的深度推理大模型。

    正是基于全棧國(guó)產(chǎn)、自主可控的優(yōu)勢(shì),科大訊飛的星火大模型倍受央國(guó)企和政府客戶的青睞,保持行業(yè)端領(lǐng)先。4月21日,星火X1升級(jí)提升了通用能力,也同步增強(qiáng)了面向行業(yè)的解決方案能力。在重點(diǎn)行業(yè),如教育、醫(yī)療、司法等領(lǐng)域的測(cè)試中,都獲得了超過(guò)OpenAI和DeepSeek的分?jǐn)?shù),這些能力無(wú)疑會(huì)在今年大模型訂單中有所體現(xiàn)。

    星火X1一個(gè)模型同時(shí)支持兩種思考模式,提升了模型處理不同復(fù)雜度任務(wù)的能力,滿血版星火X1僅需4張卡(華為910B)即可部署。與華為的深度合作,以及不斷迭代的底座大模型能力和強(qiáng)大的行業(yè)大模型落地體系,已經(jīng)成為科大訊飛在一眾大廠圍剿中突出重圍的三大利器。

    國(guó)內(nèi)閉源大模型中,豆包模型被評(píng)價(jià)為“有一定價(jià)格競(jìng)爭(zhēng)力”。一位做AI玩具的廠商告訴我們,他的產(chǎn)品接入了多家大模型,在用戶使用過(guò)程中,優(yōu)先使用各家的免費(fèi)Token額度,“一旦超過(guò)后,優(yōu)先切換豆包,價(jià)格能控制在比較低的成本”。

    去年,豆包參與主導(dǎo)了價(jià)格戰(zhàn),豆包大模型價(jià)格降至0.0008元/千Tokens,豆包視覺(jué)理解模型定價(jià)0.003元/千Tokens,均低于當(dāng)時(shí)行業(yè)平均水平。此外,豆包大模型是技術(shù)落地AI應(yīng)用產(chǎn)品值得借鑒的案例,端到端的實(shí)時(shí)語(yǔ)音技術(shù)、多模態(tài)、Agent技術(shù)都能在第一時(shí)間介入豆包應(yīng)用端,這也是支撐其快速迭代更新的原因之一。

    騰訊混元入場(chǎng)較晚。有員工曾向我們表示,混元團(tuán)隊(duì)成員大部分以前是搜索推薦廣告出身,跟通義、字節(jié)或許有一定差距,“趕鴨子上架,好像也沒(méi)什么明確方向,東一下西一下”,“一群外行人指導(dǎo)內(nèi)行人”。加之人員的流逝,導(dǎo)致了混元曾一度處于停滯狀態(tài)。

    借著DeepSeek崛起的東風(fēng),元寶已經(jīng)悄然實(shí)現(xiàn)了逆襲。至少?gòu)臄?shù)據(jù)層面看,已經(jīng)取得階段性成果。一位內(nèi)部人士告訴我們,2025年春節(jié)以來(lái)的這幾個(gè)月,騰訊傾注了整個(gè)集團(tuán)資源對(duì)元寶進(jìn)行推廣,無(wú)論線下活動(dòng)資源,還是微信導(dǎo)流或者預(yù)算投入,對(duì)于元寶都是重點(diǎn)傾斜,通過(guò)這種大力出奇跡的方式,逆轉(zhuǎn)了此前完全被動(dòng)的局面。

    從目前各公司的市場(chǎng)反饋來(lái)看,云端多模調(diào)用已經(jīng)逐漸被認(rèn)可,各家模型并存,用戶按需調(diào)取才是未來(lái)。在現(xiàn)實(shí)情況中,客戶最終是否選用一款大模型,模型性能只是一項(xiàng)衡量標(biāo)準(zhǔn),背后可能還涉及數(shù)據(jù)、生態(tài)等多方面的考量。

    大模型全面國(guó)產(chǎn)?

    自DeepSeek-R1開始,國(guó)產(chǎn)推理大模型成為了各榜單的???,AI開源社區(qū)的用戶以真實(shí)的下載量和Star數(shù)來(lái)支持中國(guó)AI的發(fā)展。

    即便如此,當(dāng)前大模型仍面臨著或多或少的“卡脖子”的問(wèn)題。

    近期,有消息稱,英偉達(dá)已通過(guò)非正式渠道通知其AIC合作伙伴(如七彩虹、影馳、同德等),暫停GeForce RTX5090D的銷售和出貨。這一舉措被認(rèn)為是英偉達(dá)在應(yīng)對(duì)國(guó)際環(huán)境變化的預(yù)防性措施。

    盡管英偉達(dá)尚未發(fā)布正式公告,但業(yè)內(nèi)普遍認(rèn)為,RTX5090D的供應(yīng)已進(jìn)入“暫停狀態(tài)”,這僅僅才只是開始。

    若從源頭上被限制,英偉達(dá)必將遭遇更加巨額的損失,而美國(guó)之外國(guó)家的大模型發(fā)展將遭遇不確定性,追趕OpenAI的步伐也將受到一定的阻礙。

    在此背景下,全國(guó)產(chǎn)化技術(shù)路徑將越來(lái)越成為大家的備選項(xiàng)。這其中,科大訊飛做了較為充分的準(zhǔn)備。據(jù)了解,科大訊飛與合作伙伴聯(lián)合通過(guò)四大核心技術(shù)優(yōu)化,實(shí)現(xiàn)MoE模型集群推理性能翻倍提升。

    根據(jù)最新測(cè)試集評(píng)測(cè)結(jié)果,星火X1在通用任務(wù)效果評(píng)測(cè)中全面對(duì)標(biāo)OpenAI o1和DeepSeek R1,在數(shù)學(xué)、知識(shí)問(wèn)答等方面表現(xiàn)突出,這表明在技術(shù)自主可控的道路上,中國(guó)AI已具備與國(guó)際頂尖模型同臺(tái)競(jìng)技的實(shí)力。

    去年風(fēng)光無(wú)限的AI六小虎,如今早已各奔東西,境遇迥然。被DeepSeek擊碎“AGI理想”“學(xué)術(shù)天才創(chuàng)業(yè)”和“明星AI產(chǎn)品”的月之暗面,回歸到低調(diào)的技術(shù)研發(fā)中;將底層技術(shù)和產(chǎn)品解綁后的MiniMax,加大了對(duì)技術(shù)的投入,方向同樣為Agent和推理模型;六小虎中的智譜終于盼來(lái)了即將IPO的好消息,不過(guò)其整體營(yíng)收、估值以及能否順利實(shí)現(xiàn)IPO,仍充滿變數(shù)。

    去年,Kimi、海螺AI等AI應(yīng)用的出圈,短暫地迎來(lái)了AI公司的高光時(shí)刻。但今年,推理模型已經(jīng)成為了國(guó)內(nèi)各大廠商角逐的重要方向,AI六小虎的方向與大廠高度重合,而決定他們能否生存下去的“口糧”則握在大廠們的手上。

    如今,隨著六大推理大模型的全面崛起,以及國(guó)際環(huán)境的不確定性加劇,全棧國(guó)產(chǎn)化大模型有望將成為一種新的主流。

    從半導(dǎo)體、工業(yè)軟件與信創(chuàng)再到今天的AI芯片,歷史的經(jīng)驗(yàn)告訴我們,想要擺脫被制約的現(xiàn)狀就得實(shí)現(xiàn)獨(dú)立自主,將命運(yùn)牢牢掌握在自己手中?;蛟S在不久的將來(lái),越來(lái)越多的國(guó)產(chǎn)大模型將走上全棧國(guó)產(chǎn)化對(duì)抗OpenAI們的道路。

    舉報(bào)

    • 相關(guān)推薦
    • 不要思考過(guò)程,推理模型能力能夠更強(qiáng)

      UC伯克利和艾倫實(shí)驗(yàn)室的最新研究表明,推理模型無(wú)需依賴冗長(zhǎng)的思考過(guò)程也能有效工作。研究人員提出的"無(wú)思考(NoThinking)"方法通過(guò)簡(jiǎn)單提示直接生成解決方案,跳過(guò)了傳統(tǒng)推理模型中的顯性思考步驟。實(shí)驗(yàn)證明,在低資源(低token數(shù)量、少模型參數(shù))或低延遲情況下,NoThinking方法的表現(xiàn)優(yōu)于傳統(tǒng)思考方式,能減少token使用量并提高推理速度。該方法在數(shù)學(xué)問(wèn)題解決、編程和形式定理證明等任務(wù)中表現(xiàn)優(yōu)異,尤其在資源受限時(shí)優(yōu)勢(shì)更明顯。研究還發(fā)現(xiàn),結(jié)合并行計(jì)算擴(kuò)展后,NoThinking能進(jìn)一步提升性能,在保持準(zhǔn)確性的同時(shí)顯著降低延遲和計(jì)算成本。這一發(fā)現(xiàn)挑戰(zhàn)了"推理模型必須依賴詳細(xì)思考過(guò)程"的傳統(tǒng)認(rèn)知。

    • 為編程而生?OpenAI 發(fā)布 GPT -4.1 系列模型

      OpenAI 表示,GPT-4.1 是為開發(fā)者量身定制的……

    • 新增自主決策推理模型!理想汽車OTA 7.2開啟推送

      快科技4月3日消息,我們從理想汽車官方獲悉,OTA7.2版本車機(jī)系統(tǒng)正式開啟推送,預(yù)計(jì)一周內(nèi)完成,升級(jí)耗時(shí)約50分鐘。本次更新新增自主決策推理模型,該模型基于車載場(chǎng)景數(shù)據(jù)及通用推理模型數(shù)據(jù)打造,可根據(jù)問(wèn)題內(nèi)容自主決策是否深度思考,面對(duì)車控指令等簡(jiǎn)單問(wèn)題時(shí),能夠保障響應(yīng)速度。智能座艙方面,新增全能兒童鎖功能,支持一鍵鎖定副駕老板鍵、后排座椅物理按?

    • 微信,OpenAI和Kimi想一起去了:大模型的盡頭依然還是社交平臺(tái)

      AI圈最近彌漫著一股微妙的氣息。人們似乎不再熱議大語(yǔ)言模型的最新突破、以及AI應(yīng)用的無(wú)限可能時(shí),一些代表著未來(lái)的AI巨頭,卻似乎正將目光投向互聯(lián)網(wǎng)那熟悉得不能再熟悉的角落——社交網(wǎng)絡(luò)與社區(qū)。近期的傳聞和動(dòng)作頗具代表性,在大洋彼岸,手握ChatGPT和Sora等王牌的OpenAI,據(jù)稱正內(nèi)部測(cè)試類X的社交功能,其CEO Sam Altman甚至在私下征求反饋;而在國(guó)內(nèi),憑借長(zhǎng)文本能力

    • 剛剛,OpenAI發(fā)布GPT-image-1模型,更強(qiáng)吉卜力版本來(lái)啦

      OpenAI發(fā)布全新圖像生成模型GPT-image-1,通過(guò)API向全球開發(fā)者開放。該模型支持精細(xì)控制圖像敏感度、生成效率、背景、輸出格式等參數(shù),并集成吉卜力模式。Adobe、Figma等企業(yè)已將其應(yīng)用于產(chǎn)品中。API支持批量生成、蒙版編輯、透明度調(diào)整等高級(jí)功能,圖像生成成本從0.02-0.19美元/張不等。CEO Sam Altman表示該模型與ChatGPT版本差異顯著,開發(fā)者可通過(guò)API實(shí)現(xiàn)更多創(chuàng)意場(chǎng)景。新模型在?

    • o3模型基準(zhǔn)測(cè)試分?jǐn)?shù)僅為10%,遠(yuǎn)低于OpenAI宣傳的25%

      OpenAI的新AI模型o3在第一方和第三方基準(zhǔn)測(cè)試中存在差異,引發(fā)公眾對(duì)其透明度和測(cè)試實(shí)踐的質(zhì)疑。去年12月,o3首次亮相時(shí)聲稱能解答超過(guò)25%的FrontierMath問(wèn)題,但實(shí)際正確率僅為2%。內(nèi)部測(cè)試發(fā)現(xiàn),o3能達(dá)到超過(guò)25%的準(zhǔn)確率,但其使用的計(jì)算資源比上周OpenAI推出的模型多得多。Epoch AI發(fā)布的獨(dú)立基準(zhǔn)測(cè)試結(jié)果顯示,o3的得分約為10%,遠(yuǎn)低于OpenAI宣稱的25%。盡管如此,這并不意味著OpenAI的說(shuō)法有誤,可能是因?yàn)镺penAI使用了更強(qiáng)大的內(nèi)部架構(gòu)進(jìn)行評(píng)估,并采用了更多計(jì)算資源。此外,Epoch指出其測(cè)試設(shè)置可能與OpenAI不同,并且在評(píng)估中使用了更新版本的FrontierMath。

    • OpenAI 也要搞 SNS 了?外媒:原型已出!

      憑借 ChatGPT 的吉卜力風(fēng)格圖像轉(zhuǎn)換功能而獲得巨大人氣的 OpenAI,也要進(jìn)軍 SNS 市場(chǎng)了……

    • “吉卜力被廉價(jià)對(duì)待,不可原諒” ,OpenAI 會(huì)被起訴嗎?

      日本業(yè)界對(duì) ChatGPT 的“侵權(quán)行為”態(tài)度不一,而吉卜力工作室卻一直保持沉默,雙方產(chǎn)生版權(quán)糾紛的可能性幾何?

    • OpenAI發(fā)布o(jì)3、o4 mini模型,實(shí)現(xiàn)“看圖說(shuō)話”,糊圖也行!

      從 GPT-5 開始,推理模型和非推理模型很有可能會(huì)整合在一起……

    • 首次實(shí)現(xiàn)圖像思考 OpenAI重磅發(fā)布o(jì)3/o4-mini:史上最強(qiáng)、最智能模型

      快科技4月17日消息,今日,OpenAI新款A(yù)I模型o3、o4-mini重磅發(fā)布,這是OpenAI迄今最強(qiáng)、最智能的模型。據(jù)了解,OpenAI o3/o4-mini首次具備真正的視覺(jué)推理能力,看圖識(shí)圖已經(jīng)是小菜一碟了,現(xiàn)在還會(huì)看圖思考。OpenAI o3/o4-mini能同時(shí)處理文本、圖像和音頻,并且能作為Agent智能體自動(dòng)調(diào)用網(wǎng)絡(luò)搜索、圖像生成、代碼解析等工具以及深度思考模式。通過(guò)強(qiáng)化學(xué)習(xí),OpenAI訓(xùn)練了o3/o4-mini如何?