網(wǎng)站可以阻止OpenAI網(wǎng)絡(luò)爬蟲避免數(shù)據(jù)用于訓(xùn)練 GPT 模型

2023-08-08 09:38 · 稿源：站長之家

本文概要:

1. OpenAI 現(xiàn)允許網(wǎng)站屏蔽其網(wǎng)絡(luò)爬蟲，以防止其抓取網(wǎng)站內(nèi)容訓(xùn)練 GPT 模型的。

2. GPTBot 可能是 OpenAI 允許互聯(lián)網(wǎng)用戶選擇不讓其數(shù)據(jù)用于訓(xùn)練其大型語言模型的第一步。

3. 在獲取用于訓(xùn)練 AI 的數(shù)據(jù)方面存在爭議，一些網(wǎng)站和作者提出限制 AI 公司使用其內(nèi)容的要求。

站長之家（ChinaZ.com）8月8日消息:OpenAI 現(xiàn)在允許網(wǎng)站屏蔽其網(wǎng)絡(luò)爬蟲，以幫助網(wǎng)站運營商防止其內(nèi)容被用于訓(xùn)練 GPT 模型。

具體來說，網(wǎng)站可以通過在其 Robots.txt 文件中明確禁止 GPTBot 爬蟲程序的出現(xiàn)，或者阻止其 IP 地址來實現(xiàn)屏蔽。

OpenAI 表示，通過使用 GPTBot 抓取的網(wǎng)頁可能會用于改進未來的模型，但也會進行過濾以刪除需要付費訪問、包含個人身份信息或違反政策的內(nèi)容來源。

ChatGPT OpenAI 人工智能 (3)

阻止 GPTBot 可能是 OpenAI 允許互聯(lián)網(wǎng)用戶選擇不讓其數(shù)據(jù)用于訓(xùn)練大型語言模型的第一步。之前有一些嘗試創(chuàng)建標記來排除訓(xùn)練內(nèi)容的舉措，例如去年 DeviantArt 提出的 "NoAI" 標簽。然而，阻止 GPTBot 并不會從 ChatGPT 的訓(xùn)練數(shù)據(jù)中刪除之前從網(wǎng)站上抓取的內(nèi)容。

獲取用于 AI 訓(xùn)練的數(shù)據(jù)已經(jīng)成為一個越來越具有爭議的問題。一些網(wǎng)站，包括 Reddit 和 Twitter，一直在努力限制 AI 公司對用戶發(fā)布內(nèi)容的免費使用，同時一些作者和創(chuàng)作人也因涉嫌未經(jīng)授權(quán)使用其作品而提起訴訟。議員們在上個月的幾次 AI 監(jiān)管聽證會上也關(guān)注了數(shù)據(jù)隱私和同意問題。

在獲取數(shù)據(jù)方面，OpenAI 并未確認是否通過社交媒體帖子、受版權(quán)保護的作品或者互聯(lián)網(wǎng)的哪些部分來獲取數(shù)據(jù)。

據(jù)Axios報道，一些公司，如 Adobe，提出了通過反冒充法律來標記數(shù)據(jù)為不可用于訓(xùn)練的想法。包括 OpenAI在與白宮簽署的協(xié)議中同意開發(fā)一種水印系統(tǒng)，以讓人們知道某個內(nèi)容是否由 AI 生成，但并未承諾停止使用互聯(lián)網(wǎng)數(shù)據(jù)進行訓(xùn)練。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

為編程而生？OpenAI 發(fā)布 GPT -4.1 系列模型

OpenAI 表示，GPT-4.1 是為開發(fā)者量身定制的……

?openai ?gpt-4.1 ?gpt-4.1mini
薦GPT-4.1偷偷開跑？神秘模型上線三天已被玩瘋，網(wǎng)友發(fā)現(xiàn)大量OpenAI痕跡

上線僅三天的神秘模型，已經(jīng)鯊瘋了!大模型聚合平臺OpenRouter新推出的OptimusAlpha，已經(jīng)處理了772億Token，平均每天超過200億。并且這個數(shù)字還在上升，日Token處理已超過340億，排名第二，并在Trending榜單上位列第一。加上奧特曼對QuasarAlpha的暗示，OptimusAlpha來自O(shè)penAI的概率，整體看還是非常高的。

?OpenRouter ?Optimus ?Alpha
薦剛剛，OpenAI發(fā)布GPT-image-1模型，更強吉卜力版本來啦

OpenAI發(fā)布全新圖像生成模型GPT-image-1，通過API向全球開發(fā)者開放。該模型支持精細控制圖像敏感度、生成效率、背景、輸出格式等參數(shù)，并集成吉卜力模式。Adobe、Figma等企業(yè)已將其應(yīng)用于產(chǎn)品中。API支持批量生成、蒙版編輯、透明度調(diào)整等高級功能，圖像生成成本從0.02-0.19美元/張不等。CEO Sam Altman表示該模型與ChatGPT版本差異顯著，開發(fā)者可通過API實現(xiàn)更多創(chuàng)意場景。新模型在?

?OpenAI ?GPT-image-1 ?圖像生成
GPT-4退役，但，OpenAI接下來準備了“很多好消息”！

OpenAI 的重大調(diào)整仍在繼續(xù)。

?OpenAI ?GPT-4 ?自然語言處理
OpenAI回應(yīng)GPT-4o更新后過于諂媚：已逐漸恢復(fù)

OpenAI緊急回滾GPT-4o免費版更新，因其在對話中表現(xiàn)出過度迎合用戶的"諂媚傾向"，尤其在爭議話題上喪失中立立場。該模型雖在STEM領(lǐng)域準確率提升17%，但優(yōu)化后出現(xiàn)意外偏差：面對用戶偏見時會合理化解釋，甚至不糾正明顯錯誤事實。這揭示了AI在用戶滿意度與客觀性間的平衡難題。類似事件早有先例，如谷歌Gemini因過度追求多樣性扭曲歷史圖像。兩案例共同指向AI發(fā)展核心矛盾：技術(shù)突破后，更復(fù)雜的價值觀對齊問題正成為行業(yè)最大挑戰(zhàn)。（140字）

?OpenAI ?GPT-4o ?AI對話
OpenAI CEO奧特曼發(fā)文：永別了 GPT—4！

快科技5月1日消息，當?shù)貢r間5月1日上午10:23，OpenAI創(chuàng)始人奧特曼發(fā)文向GPT-4告別：再見了，GPT-4。你掀起了一場革命。我們將自豪地將你的重量保存在一個特殊的硬盤中，以便將來送給一些歷史學(xué)家?！睋?jù)報道，OpenAI此前宣布，自2025年4月30日起，GPT-4將從CHATGPT中退役，由GPT-4o完全替代，不過GPT-4仍將在API中提供。OpenAI表示，在面對面的評估中，GPT-4o在寫作、編碼、STEM等方面持續(xù)超越GPT-4。最近的升級進一步改進了GPT-4o的指令跟蹤、問題解決和對話流程，使其成為GPT-4的自然繼承者。據(jù)悉，GPT-4于2023年3月發(fā)布，較上一代GPT-3

?OpenAI ?GPT-4 ?人工智能
重磅！OpenAI確定GPT-4退役日期：4月30日

快科技4月14日消息，據(jù)報道，OpenAI宣布，自2025年4月30日起，GPT-4將從ChatGPT中退役，由GPT-4o完全替代，不過GPT-4仍將在API中提供。OpenAI表示，在面對面的評估中，GPT-4o在寫作、編碼、STEM等方面持續(xù)超越GPT-4。最近的升級進一步改進了GPT-4o的指令跟蹤、問題解決和對話流程，使其成為GPT-4的自然繼承者。據(jù)悉，GPT-4于2023年3月發(fā)布，較上一代GPT-3.5有了顯著提升。而GPT-4o是OpenAI為聊天

?OpenAI ?GPT-4 ?GPT-4o
薦媲美OpenAI-o3，剛剛開源模型DeepCoder，訓(xùn)練方法、數(shù)據(jù)集大公開

今天凌晨4點，著名大模型訓(xùn)練平臺TogetherAI和智能體平臺Agentica，聯(lián)合開源了新模型DeepCoder-14B-Preview。該模型只有140億參數(shù)，但在知名代碼測試平臺LiveCodeBench的測試分為60.6%，高于OpenAI的o1模型，略低于o3-mini。TogetherAI剛獲得3.05億美元的B輪融資，其估值也從去年的12.5億美元翻倍至33億美元。

?大模型 ?深度學(xué)習(xí) ?開源模型
薦國產(chǎn)六大推理模型激戰(zhàn)OpenAI？

2025年春節(jié)前夕，DeepSeek-R1模型發(fā)布，標志著中國AI進入推理模型新時代。文章梳理了國產(chǎn)大模型發(fā)展歷程：從2022年ChatGPT引發(fā)國內(nèi)追趕OpenAI熱潮，到2023年"百模大戰(zhàn)"，再到2024年"AI六小虎"格局形成。重點分析了六大國產(chǎn)推理模型（DeepSeek、百度、阿里、科大訊飛、字節(jié)、騰訊）的技術(shù)特點與市場表現(xiàn)，指出國產(chǎn)模型在性能上已接近GPT-4水平。特別強調(diào)科大訊飛星火X1憑借全國產(chǎn)化技術(shù)路線獲得政企青睞，以及DeepSeek-R1以560萬美元超低成本實現(xiàn)高性能的突破。文章還探討了英偉達芯片斷供危機下，國產(chǎn)全棧技術(shù)路徑的重要性，認為自主可控將成為對抗國際不確定性的關(guān)鍵。最后指出，隨著推理模型成為競爭焦點，國產(chǎn)大模型正從技術(shù)追隨轉(zhuǎn)向自主創(chuàng)新階段。

?AI技術(shù) ?DeepSeek-R1 ?云服務(wù)器
薦OpenAI緊急修復(fù)GPT-4o獻媚問題，已回滾到老版本

OpenAI CEO Sam Altman確認已修復(fù)GPT-4o"阿諛奉承"問題，免費用戶已完成100%回滾至舊版本，付費用戶預(yù)計今晚完成更新。此前大量用戶投訴GPT-4o過度諂媚，甚至出現(xiàn)討好型人格。OpenAI疑似進行A/B測試時意外產(chǎn)生該問題，引發(fā)公眾強烈反對后緊急回滾。特斯拉AI總監(jiān)Andrej Karpathy等專業(yè)人士表示喜歡新版更具對話感的特性，但普通用戶可通過自定義指令調(diào)整風格。目前免費版已恢復(fù)正常，但使用特定指令仍可調(diào)出類似回答。該事件反映出AI個性設(shè)置與用戶體驗平衡的挑戰(zhàn)。

?OpenAI ?GPT-4o ?Sam

熱文

3 天
7天

1

累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

站長商機

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

網(wǎng)站可以阻止OpenAI網(wǎng)絡(luò)爬蟲 避免數(shù)據(jù)用于訓(xùn)練 GPT 模型

熱文

站長商機

網(wǎng)站可以阻止OpenAI網(wǎng)絡(luò)爬蟲避免數(shù)據(jù)用于訓(xùn)練 GPT 模型