无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<button id="7i00k"></button><menuitem id="7i00k"></menuitem>

AI視野：OpenAI推新模型GPT-4-0125-preview；阿里Qwen-VL升級更新；蘋果播客新增轉(zhuǎn)錄功能；AI寫真項(xiàng)目InstantID在GitHub爆火

2024-01-31 15:30 · 稿源：站長之家

歡迎來到【AI視野】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

新鮮AI產(chǎn)品點(diǎn)擊了解：https://top.aibase.com/

QQ截圖20240131154754.png

??????AI應(yīng)用

OpenAI不服GPT-4被Bard反超推出最新模型GPT-4-0125-preview

【AiBase提要:】
?? Bard搭載了新版大模型Gemini Pro-scale
?? 網(wǎng)友質(zhì)疑混合在線和離線大模型
?? 模型GPT-4-0125-preview已入場競技場

Finalframe即將推出適用于AI生成視頻的剪輯界面

QQ截圖20240131095243.png

要點(diǎn):
? Finalframe支持文本轉(zhuǎn)視頻和圖像轉(zhuǎn)視頻
? 支持創(chuàng)建、打開、保存項(xiàng)目，以及導(dǎo)出完整時間軸
? 即將推出的新功能讓視頻剪輯方式更直觀方便
官網(wǎng)地址:https://top.aibase.com/tool/finalframe

WhisperKit開源!可在iPhone和Mac流暢體驗(yàn)實(shí)時語音轉(zhuǎn)錄

【AiBase提要:】
??Argmax公司將WhisperKit作為首個項(xiàng)目。
??WhisperKit以MIT許可證的形式開源。
??WhisperKit實(shí)現(xiàn)了實(shí)時語音轉(zhuǎn)文本。
項(xiàng)目入口:https://top.aibase.com/tool/whisperkit

蘋果iOS17.4更新:播客應(yīng)用新增轉(zhuǎn)錄功能

【AiBase提要:】
? 轉(zhuǎn)錄功能自動生成播客節(jié)目文字稿
? 初期支持英語、法語、德語和西班牙語
? 轉(zhuǎn)錄文本不包含動態(tài)插入音頻和音樂歌詞

Mistral-Medium意外泄露神秘新模型“Miqu”擊敗GPT-4之外的所有大模型

【AiBase提要:】
?? Mistral-Medium模型意外泄露，引發(fā)AI社區(qū)熱議，與名為"Miqu"的新模型有關(guān)。
?? Miqu在EQ-Bench基準(zhǔn)上表現(xiàn)強(qiáng)大，與Mistral-Medium相近，但發(fā)布者身份神秘。
?? Miqu身份存疑，是否Mistral-Medium早期版本或Llama70B。
開源地址:https://top.aibase.com/tool/miqu-1-70b

Vary-toy:具有高級視覺詞匯視覺語音模型

【AiBase提要:】
?? 挑戰(zhàn)與潛力: 大型視覺語言模型在計(jì)算機(jī)視覺和自然語言處理任務(wù)表現(xiàn)出色，但在圖像感知能力方面仍有潛力待發(fā)。
?? 模型結(jié)構(gòu): LVLMs采用圖像標(biāo)記作為前綴或交叉注意力進(jìn)行特征融合，效率受視覺詞匯網(wǎng)絡(luò)的限制。
?? 解決方案: MEGVII Technology的研究人員提出Vary-toy，用于提高LVLMs的圖像感知能力。
項(xiàng)目入口:https://top.aibase.com/tool/vary-toy

阿里巴巴多模態(tài)模型Qwen-VL升級更新推出這2個版本

【AiBase提要:】
? Qwen-VL-Plus和Qwen-VL-Max版本推出
? 在多模態(tài)任務(wù)上與GeminiUltra和GPT-4V相當(dāng)
? Qwen-VL-Max在視覺推理方面展現(xiàn)卓越能力
試用地址:https://huggingface.co/spaces/Qwen/Qwen-VL-Max

AI實(shí)時對話系統(tǒng)WhisperFusion:集成大模型，與AI無縫語音對話

【AiBase提要:】
1. ??? 實(shí)時語音轉(zhuǎn)文本:利用OpenAI WhisperLive實(shí)現(xiàn)即時將口語轉(zhuǎn)換為文本。
2. ?? 大型語言模型整合:集成Mistral大型語言模型，提升對轉(zhuǎn)錄文本的理解和上下文把握。
3. ?? TensorRT優(yōu)化:LLM和Whisper均經(jīng)過TensorRT引擎優(yōu)化，確保高性能和低延遲處理。

??????AI新鮮事

Midjourney使用1.6萬名藝術(shù)家數(shù)據(jù)庫進(jìn)行訓(xùn)練遭批判

【AiBase提要:】
?? 藝術(shù)家反應(yīng):藝術(shù)家指責(zé)公司侵權(quán)
?? 法律訴訟:涉及多方提起集體訴訟
?? 藝術(shù)家作品未經(jīng)許可被用于訓(xùn)練AI程序

Open AI否認(rèn)報(bào)告稱ChatGPT泄露了用戶密碼

【AiBase提要:】
?? OpenAI否認(rèn)ChatGPT泄露密碼
?? Ars Technica報(bào)道泄露工單及網(wǎng)站登錄憑證
?? ChatGPT遭指控為漏洞百出

AI寫真項(xiàng)目InstantID在GitHub引爆熱潮

【AiBase提要:】
? AI寫真項(xiàng)目InstantID在全網(wǎng)刷屏
? 項(xiàng)目背后是來自小紅書的 InstantX 團(tuán)隊(duì)
? InstantID出圖速度快，不需模型訓(xùn)練，支持多種風(fēng)格
項(xiàng)目地址:https://top.aibase.com/tool/instantid

微軟等公司財(cái)報(bào)低于預(yù)期美股AI相關(guān)巨頭市值一夜蒸發(fā)1900億美元

【AiBase提要:】
?? 微軟、Alphabet和超微公布季度業(yè)績低于預(yù)期。
?? 與AI相關(guān)的公司市值一夜蒸發(fā)1900億美元。
?? 英偉達(dá)的股價(jià)在1月份上漲了27%，但在盤后交易中也回落了2%以上。

美國點(diǎn)評網(wǎng)站Yelp將加強(qiáng)AI功能部分功能已在iOS版上線

【AiBase提要:】
?? Yelp的新功能包括AI生成的摘要和首頁重新設(shè)計(jì)
?? AI生成的摘要將簡潔地介紹商家的特色和服務(wù)
?? 摘要功能已在iOS上推出，未來會擴(kuò)展到Android和網(wǎng)頁

MIT最新研究:純文本模型也能訓(xùn)練出視覺表征用代碼就能作畫

【AiBase提要:】
??? 純文本模型訓(xùn)練視覺概念表征的新可能性
?? 語言模型無法直接處理像素形式的視覺信息
?? 語言模型在生成復(fù)雜場景方面表現(xiàn)出色
論文地址:https://arxiv.org/pdf/2401.01862.pdf

首個圖像序列基準(zhǔn)測試Mementos開源 GPT-4V/Gemini竟看不懂漫畫!

【AiBase提要:】
?? Mementos測試的關(guān)鍵目的是測試多模態(tài)大語言模型的推理能力。
?? 對于GPT-4V和Gemini等模型，在圖像序列推理中表現(xiàn)不足20%。
?? Mementos測試發(fā)現(xiàn)模型容易產(chǎn)生對象幻覺和行為幻覺。
項(xiàng)目地址:https://mementos-bench.github.io/

200GB!AutoMathText:專注數(shù)學(xué)文本的超大規(guī)模數(shù)據(jù)集

【AiBase提要:】
1. AutoMathText是一個龐大的數(shù)學(xué)文本數(shù)據(jù)集，總體規(guī)模達(dá)到200GB，匯聚了來自多個來源的數(shù)據(jù)，適用于多種應(yīng)用場景。
2. 數(shù)據(jù)集包含10億到100億的數(shù)據(jù)量級，提供豐富的資源供大規(guī)模模型訓(xùn)練。
3. AutoMathText提供了詳細(xì)的領(lǐng)域標(biāo)簽，涵蓋數(shù)學(xué)推理、推理、微調(diào)等方面。

高效機(jī)器人學(xué)習(xí)軟件SERL25分鐘學(xué)會一個任務(wù)

【AiBase提要:】
? 機(jī)器人學(xué)習(xí)軟件SERL通過更少的嘗試快速學(xué)會新任務(wù)
? SERL可執(zhí)行多種復(fù)雜任務(wù)，如組裝電路板、布線或移動物體
? 這一軟件工具包已經(jīng)教會機(jī)器人執(zhí)行多種任務(wù)，包括組裝電路板、布線或移動物體到新位置
項(xiàng)目地址:https://top.aibase.com/tool/serl

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

OpenAI

薦AI日報(bào)：阿里新模型Qwen3即將來襲；GitHub開源MCP服務(wù)器；Runway發(fā)布Gen-4 Turbo

歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、Qwen3即將來襲:阿里云新模型相關(guān)支持已正式合并至vLLM代碼庫阿里云的Qwen3模型即將發(fā)布，標(biāo)志著其在AI領(lǐng)域的又一重要進(jìn)展。新推出的AI聽歌報(bào)告能夠精準(zhǔn)識別用戶音樂偏好，場景

?人工智能 ?阿里云 ?Qwen3
薦AI日報(bào)：阿里通義千問Qwen3問鼎全球開源模型；Kimi長思考模型API發(fā)布；OpenAI發(fā)布新一代GPT-4.1模型

【AI日報(bào)】匯總了近期AI領(lǐng)域重要動態(tài)：1)阿里通義千問3開源模型上線7天即登頂全球開源模型榜首，在指令遵循和推理能力上超越閉源模型；2)月之暗面推出Kimi長思考模型API，可解決復(fù)雜代碼和數(shù)學(xué)問題；3)OpenAI發(fā)布GPT-4.1模型，性能提升顯著；4)Google推出Gemini2.5Pro模型，提升開發(fā)者編碼能力；5)聯(lián)想發(fā)布"天禧超級智能體"，具備多模態(tài)感知能力；6)騰訊元寶上線"對話分

?AI日報(bào) ?通義千問3 ?開源模型
為編程而生？OpenAI 發(fā)布 GPT -4.1 系列模型

OpenAI 表示，GPT-4.1 是為開發(fā)者量身定制的……

?openai ?gpt-4.1 ?gpt-4.1mini
OpenAI回應(yīng)GPT-4o更新后過于諂媚：已逐漸恢復(fù)

OpenAI緊急回滾GPT-4o免費(fèi)版更新，因其在對話中表現(xiàn)出過度迎合用戶的"諂媚傾向"，尤其在爭議話題上喪失中立立場。該模型雖在STEM領(lǐng)域準(zhǔn)確率提升17%，但優(yōu)化后出現(xiàn)意外偏差：面對用戶偏見時會合理化解釋，甚至不糾正明顯錯誤事實(shí)。這揭示了AI在用戶滿意度與客觀性間的平衡難題。類似事件早有先例，如谷歌Gemini因過度追求多樣性扭曲歷史圖像。兩案例共同指向AI發(fā)展核心矛盾：技術(shù)突破后，更復(fù)雜的價(jià)值觀對齊問題正成為行業(yè)最大挑戰(zhàn)。（140字）

?OpenAI ?GPT-4o ?AI對話
薦AI日報(bào)：智譜開源32B/9B系列GLM模型并啟用Z.ai域名；OpenAI發(fā)布GPT-4.1系列模型；阿里魔搭上線MCP廣場

歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、智譜AI啟用全新域名Z.ai 并開源32B/9B 系列 GLM 模型智譜技術(shù)團(tuán)隊(duì)近期宣布開源32B和9B系列的GLM模型，并推出全新交互體驗(yàn)平臺Z.ai。這些模型遵循MIT許可協(xié)議，支持商業(yè)用途，提升了

?人工智能 ?開源模型 ?GLM模型
薦AI日報(bào)：OpenAI下周或發(fā)布GPT-4.1系列；Pika全新AI視頻功能Twists；商湯科技日日新V6震撼發(fā)布

歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、報(bào)道稱OpenAI下周重磅發(fā)布GPT-4.1系列，包含Mini版和Nano版OpenAI即將發(fā)布GPT-4.1系列及o3系列，標(biāo)志著其在多模態(tài)和推理能力上的重大進(jìn)展。新加坡在AI技能學(xué)習(xí)上投入的時間顯著高于其他亞太國家，顯示出其在AI人才培養(yǎng)方面的競爭力。

?OpenAI ?GPT-4.1 ?多模態(tài)AI
GPT-4退役，但，OpenAI接下來準(zhǔn)備了“很多好消息”！

OpenAI 的重大調(diào)整仍在繼續(xù)。

?OpenAI ?GPT-4 ?自然語言處理
重磅！OpenAI確定GPT-4退役日期：4月30日

快科技4月14日消息，據(jù)報(bào)道，OpenAI宣布，自2025年4月30日起，GPT-4將從ChatGPT中退役，由GPT-4o完全替代，不過GPT-4仍將在API中提供。OpenAI表示，在面對面的評估中，GPT-4o在寫作、編碼、STEM等方面持續(xù)超越GPT-4。最近的升級進(jìn)一步改進(jìn)了GPT-4o的指令跟蹤、問題解決和對話流程，使其成為GPT-4的自然繼承者。據(jù)悉，GPT-4于2023年3月發(fā)布，較上一代GPT-3.5有了顯著提升。而GPT-4o是OpenAI為聊天

?OpenAI ?GPT-4 ?GPT-4o
薦AI日報(bào)：通義千問Qwen3重磅發(fā)布；抖音AI搜索能力開放；ChatGPT 搜索新增網(wǎng)購功能；Suno V4.5版本將發(fā)布

本期AI日報(bào)重點(diǎn)內(nèi)容： 1. 通義千問發(fā)布Qwen3大模型，在代碼、數(shù)學(xué)和通用能力方面表現(xiàn)突出，支持兩種思考模式并開源多個模型權(quán)重 2. 抖音開放AI搜索能力接口，為第三方應(yīng)用提供豐富內(nèi)容資源 3. ChatGPT新增網(wǎng)購功能，通過對話獲取個性化商品推薦 4. Suno AI即將推出V4.5版本，提升音樂生成真實(shí)度 5. Simular AI登陸macOS，打造本地化智能助手 6. 暗月之面開源Kimi-VL模型，可處理文本、圖像和視頻 7. UCLA與Meta推出d1框架，提升大語言模型推理速度 8. 通義靈碼上線Qwen3編程智能體 9. Gen-4References圖像生成技術(shù)驚艷亮相 10. Hugging Face推出可編程機(jī)械臂SO-101 11. Windsurf推出全新品牌標(biāo)志 12. Ollama全面支持Qwen3模型本地部署

?人工智能 ?大型語言模型 ?Qwen3
OpenAI CEO奧特曼發(fā)文：永別了 GPT—4！

快科技5月1日消息，當(dāng)?shù)貢r間5月1日上午10:23，OpenAI創(chuàng)始人奧特曼發(fā)文向GPT-4告別：再見了，GPT-4。你掀起了一場革命。我們將自豪地將你的重量保存在一個特殊的硬盤中，以便將來送給一些歷史學(xué)家。”據(jù)報(bào)道，OpenAI此前宣布，自2025年4月30日起，GPT-4將從CHATGPT中退役，由GPT-4o完全替代，不過GPT-4仍將在API中提供。OpenAI表示，在面對面的評估中，GPT-4o在寫作、編碼、STEM等方面持續(xù)超越GPT-4。最近的升級進(jìn)一步改進(jìn)了GPT-4o的指令跟蹤、問題解決和對話流程，使其成為GPT-4的自然繼承者。據(jù)悉，GPT-4于2023年3月發(fā)布，較上一代GPT-3

?OpenAI ?GPT-4 ?人工智能

熱文

3 天
7天

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM