无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > 豆包1.5深度思考模型最新資訊  > 正文

    字節(jié)發(fā)布豆包1.5深度思考模型:“實(shí)拍級(jí)”圖像生成

    2025-04-17 11:46 · 稿源: 快科技

    快科技4月17日消息,據(jù)報(bào)道,今日,火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場(chǎng),字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。

    譚待指出,豆包1.5深度思考模型在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中,它能夠精準(zhǔn)高效地處理復(fù)雜問(wèn)題;在創(chuàng)意寫(xiě)作等通用任務(wù)方面,同樣表現(xiàn)出色。

    該模型采用MoE架構(gòu),總參數(shù)為200B,激活參數(shù)是20B ,相較于業(yè)界同類模型,其參數(shù)規(guī)模降低了50%,這使得它在推理成本上具備顯著優(yōu)勢(shì),能夠以更低的成本實(shí)現(xiàn)更高效的推理運(yùn)算。

    豆包1.5深度思考模型進(jìn)一步拓展了功能邊界,將視覺(jué)理解融入其中,解鎖了諸多實(shí)用功能。比如,它能依據(jù)照片精準(zhǔn)分析地貌特征;在人們旅行時(shí),輔助進(jìn)行點(diǎn)餐決策;在企業(yè)辦公場(chǎng)景中,助力完成項(xiàng)目管理流程圖繪制等,為用戶帶來(lái)了更為多元且便捷的服務(wù)體驗(yàn)。

    與此同時(shí),火山引擎對(duì)豆包文生圖模型也進(jìn)行了重大升級(jí),推出3.0版本。新版本在文字排版上更加美觀,圖片生成能力更加精細(xì),還新增了2K圖片直出功能,大幅提升了圖片生成的質(zhì)量與效率,為用戶帶來(lái)更優(yōu)質(zhì)的視覺(jué)內(nèi)容創(chuàng)作體驗(yàn)。

    新模型還具備了更強(qiáng)視頻搜索能力,模型能夠根據(jù)用戶搜索問(wèn)題在視頻中尋找相應(yīng)答案。

    此外,譚待表示,豆包大模型使用量持續(xù)高速增長(zhǎng)。截至2025年3月,豆包大模型日均tokens使用量超12.7萬(wàn)億,較發(fā)布之初增長(zhǎng)超106倍。

    舉報(bào)

    • 相關(guān)推薦
    • 火山引擎即將發(fā)布深度思考模型

      據(jù)悉,字節(jié)跳動(dòng)旗下云服務(wù)平臺(tái)火山引擎即將發(fā)布豆包深度思考模型。有消息稱,豆包APP和桌面端的“深度思考模式”已進(jìn)行了多個(gè)實(shí)驗(yàn)版本的測(cè)試,而此次發(fā)布后,該模型將正式面向企業(yè)提供服務(wù)。目前,豆包大模型家族已覆蓋全模態(tài)、全場(chǎng)景,包括大語(yǔ)言模型、語(yǔ)音大模型,以及圖像、視頻等視覺(jué)大模型,企業(yè)可以通過(guò)火山引擎使用豆包大模型API服務(wù)。IDC最新發(fā)布的《中?

    • AI日?qǐng)?bào):字節(jié)發(fā)布豆包1.5深度思考模型;微信首個(gè)AI助手 “元寶” 上線;OpenAI發(fā)布o4-mini、滿血版o3

      歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI發(fā)布兩款多模態(tài)推理模型o4-mini、滿血版o3OpenAI在技術(shù)直播中推出了其最新的多模態(tài)模型o4-mini和滿血版o3,這兩款模型具備同時(shí)處理文本、圖像和音頻的能力,并能調(diào)用外部工?

    • UniToken:多模態(tài)AI的“全能選手”,一次編碼搞定文理解與圖像生成

      復(fù)旦大學(xué)與美團(tuán)研究者提出UniToken框架,首次在統(tǒng)一模型中實(shí)現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺(jué)編碼,有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問(wèn)題。通過(guò)三階段訓(xùn)練策略(視覺(jué)語(yǔ)義對(duì)齊、多任務(wù)聯(lián)合訓(xùn)練、指令強(qiáng)化微調(diào)),UniToken在多個(gè)基準(zhǔn)測(cè)試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在:1)統(tǒng)一的雙邊視覺(jué)編碼

    • 首次實(shí)現(xiàn)圖像思考 OpenAI重磅發(fā)布o3/o4-mini:史上最強(qiáng)、最智能模型

      快科技4月17日消息,今日,OpenAI新款A(yù)I模型o3、o4-mini重磅發(fā)布,這是OpenAI迄今最強(qiáng)、最智能的模型。據(jù)了解,OpenAI o3/o4-mini首次具備真正的視覺(jué)推理能力,看圖識(shí)圖已經(jīng)是小菜一碟了,現(xiàn)在還會(huì)看圖思考。OpenAI o3/o4-mini能同時(shí)處理文本、圖像和音頻,并且能作為Agent智能體自動(dòng)調(diào)用網(wǎng)絡(luò)搜索、圖像生成、代碼解析等工具以及深度思考模式。通過(guò)強(qiáng)化學(xué)習(xí),OpenAI訓(xùn)練了o3/o4-mini如何?

    • ChatGPT圖像生成爆火!OpenAI CEO在線求助:急需10萬(wàn)塊GPU

      OpenAI近期推出的全新圖像生成工具引發(fā)了熱潮,用戶使用ChatGPT即可創(chuàng)作出吉卜力等風(fēng)格的AI藝術(shù)作品。這一功能不僅推動(dòng)了ChatGPT用戶數(shù)的創(chuàng)新高導(dǎo)致服務(wù)器負(fù)擔(dān)過(guò)重,甚至一度限制了該功能的使用。SensorTower的數(shù)據(jù)顯示,ChatGPT應(yīng)用的全球下載量和每周活躍用戶數(shù)分別較上周增長(zhǎng)了11%和5%應(yīng)用內(nèi)購(gòu)買收入則增加了6%。

    • AI日?qǐng)?bào):阿里騰訊全面支持MCP協(xié)議;階躍星辰多模態(tài)推理模型Step-R1-V-Mini;美WHEE圖像生成模型Miracle F1

      歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日,中國(guó)人工智能領(lǐng)域迎來(lái)技術(shù)標(biāo)準(zhǔn)的變革,ModelContextProtocol成為國(guó)內(nèi)AI生態(tài)的事實(shí)標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B,性能?

    • AI日?qǐng)?bào): OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬(wàn)能工具箱;中國(guó)占全球AI專利60%

      【AI日?qǐng)?bào)】欄目聚焦人工智能領(lǐng)域最新動(dòng)態(tài):1) OpenAI推出ChatGPT圖像生成API,開(kāi)發(fā)者可輕松集成AI繪圖功能,已生成超7億張圖片;2) 谷歌Gemini月活用戶突破3.5億,但仍落后于ChatGPT的6億用戶;3) OpenAI預(yù)測(cè)2029年收入將達(dá)1250億美元,AI代理業(yè)務(wù)成主要增長(zhǎng)點(diǎn);4) Ostris發(fā)布8B參數(shù)擴(kuò)散模型Flex.2-preview,優(yōu)化ComfyUI工作流;5) 英偉達(dá)推出多模態(tài)LLM模型Describe Anything,支持指定區(qū)域生成詳細(xì)描?

    • 奔馳新款CLA接入豆包大模型

      4月22日,奔馳與火山引擎合作的首款國(guó)產(chǎn)純電車型CLA全球首發(fā)亮相。該車搭載奔馳自研MB.OS架構(gòu),接入火山引擎大模型,支持個(gè)性化智能交互體驗(yàn)。智能系統(tǒng)可識(shí)別4種情緒并給予反饋,交互效率提升50%,喚醒僅需0.2秒。虛擬助手能解答百科問(wèn)題并協(xié)助車輛功能設(shè)置。這是雙方繼2024年8月達(dá)成AI戰(zhàn)略合作后落地的首款量產(chǎn)車型,結(jié)合生成式AI和大數(shù)據(jù)技術(shù),為中國(guó)用戶打造更智能的用車體驗(yàn)。

    • AI日?qǐng)?bào):阿里通義萬(wàn)相首尾幀生視頻模型;豆包開(kāi)源Seed智能體模型UI-TARS-1.5;OpenAI首發(fā)“智能體實(shí)踐指南”

      歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里通義萬(wàn)相首尾幀生視頻模型Wan2.1-FLF2V-14B開(kāi)源阿里巴巴的通義實(shí)驗(yàn)室在Hugging Face和GitHub上開(kāi)源了Wan2.1-FLF2V-14B模型,標(biāo)志著AI視頻生成技術(shù)的重大進(jìn)步。該模型支持高清視頻生成

    • 偉世通×火山引擎:發(fā)布基于豆包大模型的智能座艙解決方案

      2025年上海車展期間,火山引擎與偉世通聯(lián)合發(fā)布基于AI大模型的下一代智能座艙解決方案。該方案融合豆包大模型AI能力和偉世通高性能域控平臺(tái),通過(guò)端云協(xié)同架構(gòu)和多模態(tài)交互技術(shù),實(shí)現(xiàn)離線功能閉環(huán)運(yùn)行和快速響應(yīng)。方案接入火山豐富的內(nèi)容生態(tài),支持個(gè)性化推薦和"千人千面"自適應(yīng)設(shè)計(jì),同時(shí)具備多模態(tài)交互能力,實(shí)現(xiàn)更自然的人機(jī)交互。雙方還將共同探索AI大模型在智能座艙場(chǎng)景的優(yōu)化適配,助力車企打造差異化智能座艙體驗(yàn)。