字節(jié)發(fā)布豆包1.5深度思考模型：“實(shí)拍級(jí)”圖像生成

2025-04-17 11:46 · 稿源：快科技

快科技4月17日消息，據(jù)報(bào)道，今日，在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場(chǎng)，字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。

譚待指出，豆包1.5深度思考模型在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中，它能夠精準(zhǔn)高效地處理復(fù)雜問(wèn)題；在創(chuàng)意寫(xiě)作等通用任務(wù)方面，同樣表現(xiàn)出色。

該模型采用MoE架構(gòu)，總參數(shù)為200B，激活參數(shù)是20B ，相較于業(yè)界同類模型，其參數(shù)規(guī)模降低了50%，這使得它在推理成本上具備顯著優(yōu)勢(shì)，能夠以更低的成本實(shí)現(xiàn)更高效的推理運(yùn)算。

豆包1.5深度思考模型進(jìn)一步拓展了功能邊界，將視覺(jué)理解融入其中，解鎖了諸多實(shí)用功能。比如，它能依據(jù)照片精準(zhǔn)分析地貌特征；在人們旅行時(shí)，輔助進(jìn)行點(diǎn)餐決策；在企業(yè)辦公場(chǎng)景中，助力完成項(xiàng)目管理流程圖繪制等，為用戶帶來(lái)了更為多元且便捷的服務(wù)體驗(yàn)。

與此同時(shí)，火山引擎對(duì)豆包文生圖模型也進(jìn)行了重大升級(jí)，推出3.0版本。新版本在文字排版上更加美觀，圖片生成能力更加精細(xì)，還新增了2K圖片直出功能，大幅提升了圖片生成的質(zhì)量與效率，為用戶帶來(lái)更優(yōu)質(zhì)的視覺(jué)內(nèi)容創(chuàng)作體驗(yàn)。

新模型還具備了更強(qiáng)視頻搜索能力，模型能夠根據(jù)用戶搜索問(wèn)題在視頻中尋找相應(yīng)答案。

此外，譚待表示，豆包大模型使用量持續(xù)高速增長(zhǎng)。截至2025年3月，豆包大模型日均tokens使用量超12.7萬(wàn)億，較發(fā)布之初增長(zhǎng)超106倍。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

火山引擎即將發(fā)布深度思考模型

據(jù)悉，字節(jié)跳動(dòng)旗下云服務(wù)平臺(tái)火山引擎即將發(fā)布豆包深度思考模型。有消息稱，豆包APP和桌面端的“深度思考模式”已進(jìn)行了多個(gè)實(shí)驗(yàn)版本的測(cè)試，而此次發(fā)布后，該模型將正式面向企業(yè)提供服務(wù)。目前，豆包大模型家族已覆蓋全模態(tài)、全場(chǎng)景，包括大語(yǔ)言模型、語(yǔ)音大模型，以及圖像、視頻等視覺(jué)大模型，企業(yè)可以通過(guò)火山引擎使用豆包大模型API服務(wù)。IDC最新發(fā)布的《中?

?字節(jié)跳動(dòng) ?火山引擎 ?豆包深度思考模型
薦AI日?qǐng)?bào)：字節(jié)發(fā)布豆包1.5深度思考模型；微信首個(gè)AI助手 “元寶” 上線；OpenAI發(fā)布o4-mini、滿血版o3

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI發(fā)布兩款多模態(tài)推理模型o4-mini、滿血版o3OpenAI在技術(shù)直播中推出了其最新的多模態(tài)模型o4-mini和滿血版o3，這兩款模型具備同時(shí)處理文本、圖像和音頻的能力，并能調(diào)用外部工?

?人工智能 ?多模態(tài)模型 ?OpenAI
薦UniToken：多模態(tài)AI的“全能選手”，一次編碼搞定圖文理解與圖像生成

復(fù)旦大學(xué)與美團(tuán)研究者提出UniToken框架，首次在統(tǒng)一模型中實(shí)現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺(jué)編碼，有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問(wèn)題。通過(guò)三階段訓(xùn)練策略（視覺(jué)語(yǔ)義對(duì)齊、多任務(wù)聯(lián)合訓(xùn)練、指令強(qiáng)化微調(diào)），UniToken在多個(gè)基準(zhǔn)測(cè)試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在：1）統(tǒng)一的雙邊視覺(jué)編碼

?UniToken ?多模態(tài)建模 ?視覺(jué)編碼
首次實(shí)現(xiàn)圖像思考 OpenAI重磅發(fā)布o3/o4-mini：史上最強(qiáng)、最智能模型

快科技4月17日消息，今日，OpenAI新款A(yù)I模型o3、o4-mini重磅發(fā)布，這是OpenAI迄今最強(qiáng)、最智能的模型。據(jù)了解，OpenAI o3/o4-mini首次具備真正的視覺(jué)推理能力，看圖識(shí)圖已經(jīng)是小菜一碟了，現(xiàn)在還會(huì)看圖思考。OpenAI o3/o4-mini能同時(shí)處理文本、圖像和音頻，并且能作為Agent智能體自動(dòng)調(diào)用網(wǎng)絡(luò)搜索、圖像生成、代碼解析等工具以及深度思考模式。通過(guò)強(qiáng)化學(xué)習(xí)，OpenAI訓(xùn)練了o3/o4-mini如何?

?OpenAI ?AI模型 ?視覺(jué)推理
ChatGPT圖像生成爆火！OpenAI CEO在線求助：急需10萬(wàn)塊GPU

OpenAI近期推出的全新圖像生成工具引發(fā)了熱潮，用戶使用ChatGPT即可創(chuàng)作出吉卜力等風(fēng)格的AI藝術(shù)作品。這一功能不僅推動(dòng)了ChatGPT用戶數(shù)的創(chuàng)新高導(dǎo)致服務(wù)器負(fù)擔(dān)過(guò)重，甚至一度限制了該功能的使用。SensorTower的數(shù)據(jù)顯示，ChatGPT應(yīng)用的全球下載量和每周活躍用戶數(shù)分別較上周增長(zhǎng)了11%和5%應(yīng)用內(nèi)購(gòu)買收入則增加了6%。

?OpenAI ?ChatGPT ?圖像生成
AI日?qǐng)?bào)：阿里騰訊全面支持MCP協(xié)議；階躍星辰多模態(tài)推理模型Step-R1-V-Mini；美圖WHEE圖像生成模型Miracle F1

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日，中國(guó)人工智能領(lǐng)域迎來(lái)技術(shù)標(biāo)準(zhǔn)的變革，ModelContextProtocol成為國(guó)內(nèi)AI生態(tài)的事實(shí)標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B，性能?

?人工智能 ?MCP協(xié)議 ?阿里巴巴
AI日?qǐng)?bào)： OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬(wàn)能工具箱;中國(guó)占全球AI專利60%

【AI日?qǐng)?bào)】欄目聚焦人工智能領(lǐng)域最新動(dòng)態(tài)：1) OpenAI推出ChatGPT圖像生成API，開(kāi)發(fā)者可輕松集成AI繪圖功能，已生成超7億張圖片；2) 谷歌Gemini月活用戶突破3.5億，但仍落后于ChatGPT的6億用戶；3) OpenAI預(yù)測(cè)2029年收入將達(dá)1250億美元，AI代理業(yè)務(wù)成主要增長(zhǎng)點(diǎn)；4) Ostris發(fā)布8B參數(shù)擴(kuò)散模型Flex.2-preview，優(yōu)化ComfyUI工作流；5) 英偉達(dá)推出多模態(tài)LLM模型Describe Anything，支持指定區(qū)域生成詳細(xì)描?

?OpenAI ?ChatGPT ?圖像生成
奔馳新款CLA接入豆包大模型

4月22日，奔馳與火山引擎合作的首款國(guó)產(chǎn)純電車型CLA全球首發(fā)亮相。該車搭載奔馳自研MB.OS架構(gòu)，接入火山引擎大模型，支持個(gè)性化智能交互體驗(yàn)。智能系統(tǒng)可識(shí)別4種情緒并給予反饋，交互效率提升50%，喚醒僅需0.2秒。虛擬助手能解答百科問(wèn)題并協(xié)助車輛功能設(shè)置。這是雙方繼2024年8月達(dá)成AI戰(zhàn)略合作后落地的首款量產(chǎn)車型，結(jié)合生成式AI和大數(shù)據(jù)技術(shù)，為中國(guó)用戶打造更智能的用車體驗(yàn)。

?梅賽德斯-奔馳 ?全新純電長(zhǎng)軸距 ?CLA
薦AI日?qǐng)?bào)：阿里通義萬(wàn)相首尾幀生視頻模型；豆包開(kāi)源Seed智能體模型UI-TARS-1.5；OpenAI首發(fā)“智能體實(shí)踐指南”

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里通義萬(wàn)相首尾幀生視頻模型Wan2.1-FLF2V-14B開(kāi)源阿里巴巴的通義實(shí)驗(yàn)室在Hugging Face和GitHub上開(kāi)源了Wan2.1-FLF2V-14B模型，標(biāo)志著AI視頻生成技術(shù)的重大進(jìn)步。該模型支持高清視頻生成

?AI視頻生成 ?開(kāi)源模型 ?阿里巴巴
偉世通×火山引擎：發(fā)布基于豆包大模型的智能座艙解決方案

2025年上海車展期間，火山引擎與偉世通聯(lián)合發(fā)布基于AI大模型的下一代智能座艙解決方案。該方案融合豆包大模型AI能力和偉世通高性能域控平臺(tái)，通過(guò)端云協(xié)同架構(gòu)和多模態(tài)交互技術(shù)，實(shí)現(xiàn)離線功能閉環(huán)運(yùn)行和快速響應(yīng)。方案接入火山豐富的內(nèi)容生態(tài)，支持個(gè)性化推薦和"千人千面"自適應(yīng)設(shè)計(jì)，同時(shí)具備多模態(tài)交互能力，實(shí)現(xiàn)更自然的人機(jī)交互。雙方還將共同探索AI大模型在智能座艙場(chǎng)景的優(yōu)化適配，助力車企打造差異化智能座艙體驗(yàn)。

?智能座艙 ?AI ?大模型

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

字節(jié)發(fā)布豆包1.5深度思考模型：“實(shí)拍級(jí)”圖像生成

火山引擎即將發(fā)布深度思考模型

薦AI日?qǐng)?bào)：字節(jié)發(fā)布豆包1.5深度思考模型；微信首個(gè)AI助手 “元寶” 上線；OpenAI發(fā)布o4-mini、滿血版o3

薦UniToken：多模態(tài)AI的“全能選手”，一次編碼搞定圖文理解與圖像生成

首次實(shí)現(xiàn)圖像思考 OpenAI重磅發(fā)布o3/o4-mini：史上最強(qiáng)、最智能模型

ChatGPT圖像生成爆火！OpenAI CEO在線求助：急需10萬(wàn)塊GPU

AI日?qǐng)?bào)：阿里騰訊全面支持MCP協(xié)議；階躍星辰多模態(tài)推理模型Step-R1-V-Mini；美圖WHEE圖像生成模型Miracle F1

AI日?qǐng)?bào)： OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬(wàn)能工具箱;中國(guó)占全球AI專利60%

奔馳新款CLA接入豆包大模型

薦AI日?qǐng)?bào)：阿里通義萬(wàn)相首尾幀生視頻模型；豆包開(kāi)源Seed智能體模型UI-TARS-1.5；OpenAI首發(fā)“智能體實(shí)踐指南”

偉世通×火山引擎：發(fā)布基于豆包大模型的智能座艙解決方案

熱文

印度將中國(guó)電子投資壓股至 10%，且要求“技術(shù)轉(zhuǎn)讓”

“AI教父”杰弗里·辛頓再次發(fā)出警告：AI可能正在“失控”！

累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

美國(guó)網(wǎng)購(gòu)市場(chǎng)動(dòng)蕩，希音、Temu 率先在美開(kāi)啟“漲價(jià)潮”！

站長(zhǎng)商機(jī)