OpenAI、谷歌雙標玩得溜:訓練大模型用他人數據,卻決不允許自身數據外流_快資訊
機器之心編譯
編輯:杜偉、梓文
(資料圖片)
你的就是我的,我的還是我的。
在生成式 AI 盛行的全新時代,大型科技公司在使用在線內容時正在奉行「照我說的做,而不是做我所做的」策略。在一定程度上,這種策略可以說是一種雙標以及話語權的濫用。
同時,隨著大語言模型(LLM)成為 AI 發展的主流趨勢,無論是大型還是初創公司,都在不遺余力地開發自己的大模型。其中訓練數據是大模型能力好壞的重要前提。
近日,根據 Insider 的報道,微軟支持的 OpenAI、谷歌及其支持的 Anthropic 多年來一直在使用其他網站或公司的在線內容來訓練他們的生成式 AI 模型。這些都是在沒有征求具體許可的情況下完成的,并將構成一場醞釀中的法律斗爭的一部分,決定了網絡的未來以及版權法在這一新時代的應用方式。
這些大型科技公司可能會爭辯說他們是合理使用,是否真的如此有待商榷。但是他們卻不會讓自己的內容被用來訓練其他 AI 模型。所以不禁要問,為什么這些大型科技公司卻能在訓練大模型時使用其他公司的在線內容呢?這些公司很聰明,但也非常虛偽
大型科技公司使用他人在線內容卻不允許他人使用自己的,這種說法是否有確切證據,這可以從他們一些產品的服務和使用條款中看出端倪。
首先來看 Claude,它是 Anthropic 推出的類似于 ChatGPT 的 AI 助手。該系統可以完成摘要總結、搜索、協助創作、問答、編碼等任務。前段時間再次升級,將上下文 token 擴展到了 100k,處理速度大大加快。
Claude 的服務條款是這樣的。你不得以下列方式(這里列舉出部分)訪問或使用本服務,如果這些限制的任何一項與可接受使用政策不一致或不明確,則以后者依從為先:開發與我們的服務競爭的任何產品或服務,包括開發或訓練任何 AI 或機器學習算法或模型
未經條款允許,從我們的服務中抓取、爬取或以任何其他方式獲取數據或信息
Claude 服務條款地址:https://vault.pactsafe.io/s/9f502c93-cb5c-4571-b205-1e479da61794/legal.html#terms
同樣地,谷歌的生成式 AI 使用條款也是如此,「你不得使用本服務來開發機器學習模型或相關技術。」
谷歌生成式 AI 使用條款地址:https://policies.google.com/terms/generative-aiOpenAI 的使用條款又怎樣呢?與谷歌類似,「你不得使用本服務的輸出來開發與 OpenAI 競爭的模型。」
OpenAI 使用條款地址:https://openai.com/policies/terms-of-use這些公司很聰明,他們知道高質量的內容對于訓練新的 AI 模型至關重要,所以不允許別人用這樣的方式使用他們的輸出也是合情合理的。但他們卻無所顧忌地利用他人數據來訓練自己的模型,這又該如何解釋呢?
目前,OpenAI、谷歌和 Anthropic 拒絕了 Insider 的置評請求,并且沒有做出任何回應。
Reddit、推特和其他公司:受夠了
實際上,其他公司意識到正在發生的事情時并不高興。今年 4 月,多年來一直被用于 AI 模型訓練的 Reddit 計劃開始對其數據的訪問收費。
Reddit 首席執行官 Steve Huffman 表示,「Reddit 的數據語料庫非常有價值,因此我們不能把這些價值免費提供給世界上最大的公司。」同樣今年 4 月,馬斯克指責 OpenAI 的主要支持者微軟非法使用 Twitter 的數據來訓練 AI 模型。「訴訟時間到」,他在推特上寫道。
不過在回復 Insider 的置評時,微軟表示「這個前提有太多的錯誤,我甚至不知道從何說起。」OpenAI 首席執行官 Sam Altman 試圖通過探索尊重版權的全新 AI 模型來深化這個問題。據 Axios 報道,他于近期表示,「我們正在嘗試開發新的模式,如果 AI 系統使用了你的內容,或者使用了你的風格,你就會因此獲得報酬。」
Sam Altman出版商(包括 Insider)都會是既得利益獲得者。此外,包括美國新聞集團在內的一些出版商已經在推動科技公司付費使用其內容訓練 AI 模型。
目前 AI 模型的訓練方式「打破」了網絡
有前微軟高管表示這一定有問題。微軟老將、著名軟件開發者 Steven Sinofsky 認為,目前 AI 模型的訓練方式「打破」了網絡。
Steven Sinofsky他在推特上寫道,「過去,爬取數據是用來換取點擊率的。但現在只是用來訓練一個模型,沒有給創作者、版權所有者帶來任何價值。」
也許,隨著更多公司的覺醒,生成式 AI 時代這一不均衡的數據使用方式會很快被改變。
原文鏈接:https://www.businessinsider.com/openai-google-anthropic-ai-training-models-content-data-use-2023-6
THE END
轉載請聯系本公眾號獲得授權
投稿或尋求報道:content@jiqizhixin.com
責任編輯:hnmd003
相關閱讀
相關閱讀
-
OpenAI、谷歌雙標玩得溜:訓練大模型用他人數據,卻決不允許自身數據外流_快資訊
機器之心編譯編輯:杜偉、梓文你的就是我的,我的還是我的。在生成式AI
-
OpenAI 員工與友商玩起提示詞決斗!網友:居然能靠大模型的情商增強推理能力 每日信息
大模型天花板GPT-4和最強競品Claude,不光商業上競爭激烈,兩家公司的
-
快資訊丨云南美食頂流,一年只能吃一季
鮮花宴之于云南,大概就像今天的燒烤之于淄博。作者|鄭依妮題圖|《去有
-
谷歌演示文稿應用 Slides 引入 AI 生成圖像功能_快資訊
品玩6月4日訊,據9to5google報道,谷歌近日宣布將為GoogleSlides引入AI
-
美軍無人機在 AI 指示下殺死了自己的人類操作員?假的! 焦點速訊
初始的故事是這樣的:在一個虛擬的任務中,一個給美軍無人機配置的人工
-
今年 618,注定是試劑|天天觀焦點
圖片來源@視覺中國文|孟永輝在化學當中,我們通常會用試劑來檢測一件物
-
開放第三方 App 商店?蘋果 WWDC23 將有哪些驚喜看點 每日熱點
WWDC全球開發者大會作為蘋果年度盛會之一,往往會發布不同設備的操作系
-
世界即時:2023廣東高考考前提醒
?特別提醒?1、廣東省普通高考各考點統一實行二次安檢,分別在考點考
-
環球看熱訊:保險公司賠償人傷有哪些費用?需要哪些材料?
保險公司會承擔您因意外受傷所產生的醫療費用,包括急救費、住院費、手
-
世界最資訊丨車出了事故保險公司怎么賠償?能賠多少錢?
發生交通事故后,應立即向當地公安交通管理部門報案,并在48小時內通知
-
100元學生意外保險賠償標準是什么?怎么申請理賠?_天天快資訊
意外身故或傷殘賠3萬保額。如果投保人在意外情況下不幸身故或者失去了
-
保險公司賠償不滿意如何處理?流程有哪些? 即時焦點
投訴:被保險人可以向保險公司投訴,要求重新核定損失金額并進行理賠。
-
百萬醫療可以隨時停嗎?一年要多少錢? 天天速看
可以,但這樣做可能會造成一定的影響和損失。首先,如果客戶中斷百萬醫
-
世界要聞:首都功能核心區傳統地名保護名錄新增500多處傳統地名
在首都功能核心區傳統地名保護名錄2022年公布的名單基礎上,北京目前已
-
谷歌演示文稿應用 Slides 引入 AI 生成圖像功能_環球快報
品玩6月4日訊,據9to5google報道,谷歌近日宣布將為GoogleSlides引入AI
-
環球熱消息:索尼發布全畫幅可換鏡頭遙控云臺電影機 ILME-FR7 新版固件 Ver.1.10
2023年5月31日,索尼推出全畫幅可換鏡頭遙控云臺電影機ILME-FR7的新固
-
大多數勒索軟件活動源自三條常見的初始攻擊途徑 天天觀察
大多數勒索軟件攻擊者使用三種主要的攻擊途徑之一來攻陷網絡,并獲得訪
-
索尼 CEO 稱云游戲仍面臨巨大障礙,未來或為此部署 AI 今日視點
索尼集團首席執行官吉田健一郎(KenichiroYoshida)在接受采訪時表示,
-
游戲江湖二八分化:前十廠商掙了 810 億,騰訊網易占八成_焦點日報
進入6月,A股、港股、美股市場大部分上市游戲企業已發布一季度報。Q1TO
-
今年以來拉薩市免征新能源汽車車輛購置稅和車船稅1396萬元 全球即時看
據拉薩市稅務局最新數據顯示,今年年初至5月28日,拉薩市共有757輛新能
-
人文之美蘊涵發展之力
新華社杭州6月3日電題:人文之美蘊涵發展之力新華社記者馮源“半小時車
-
社會保險金是五險一金嗎?要交多少錢?_環球觀察
社會保險金和五險一金是兩個不同的概念。簡單來說,五險一金是指中國大
-
百萬醫療多大年齡可以買?要交多少錢?
看保險合同的具體規定。根據相關規定,百萬醫療的購買年齡一般在18歲到
-
投保人和被保險人是一個人嗎?兩者的信息怎么填?|每日簡訊
可以。投保人是買保險的人,被保險人是被保障的人,自己給自己買保險是
-
百萬醫療險咋買?買了百萬醫療多久生效? 環球報道
線上投保:可以通過保險公司官網或移動APP進行在線購買,購買流程簡單
-
買了兩份保險可以一起賠付嗎?有什么影響? 全球最新
在大多數情況下,買了兩份保險不能一起享受賠付。這是因為保險公司通常
-
一款抗癌藥10年賣了百億,貝達藥業遭遇離奇閃崩,三代肺癌靶向藥上市難救急
圖片來源:圖蟲創意“抗癌第一股”貝達藥業(300558 SZ)迎來公司第四
-
安全順利出艙!“感覺良好”×3!現場視頻→|天天即時看
北京時間6月4日6時33分,神舟十五號載人飛船返回艙在東風著陸場成功著
-
開放第三方 App 商店?蘋果 WWDC23 將有哪些驚喜看點
WWDC全球開發者大會作為蘋果年度盛會之一,往往會發布不同設備的操作系
-
概念之外,“元宇宙”的未來在哪里?_當前觀點
本文來源:時代周報作者:王晨婷元宇宙作為近幾年的熱門概念,或將成為
精彩推薦
閱讀排行
精彩推送
- 天天看熱訊:端午機票比五一便宜...
- 刺激預期提升,A 股走強|世界信息
- 環球百事通!防“爛尾樓”!廣西...
- 世界今日訊!車輛全保險多少錢一...
- 全球觀熱點:百萬醫療條款有哪些...
- 【世界新要聞】樂享百萬醫療保險...
- 養老年金險是什么保險?怎么買最...
- 醫療保險和養老保險一個月多少錢...
- 天天視訊!有色冶金技術(關于有...
- 新資訊:中方回應美防長香會發言...
- 環球觀天下!三個月賺 20 億,...
- 焦點熱訊:B 站,艱難的平衡
- 這家大型銀行,要關閉 21 家分...
- 今日快看!首套房利率調整“管熱...
- 每日速訊:年金保險的定義是什么...
- 天安逸享人生年金保險條款是什么...
- 天天熱點評!天安人壽逸享人生年...
- 富德生命鑫福人生年金保險合適嗎...
- 通訊!華實人生終身年金保險幾年...
- 天天速讀:幼兒籃球嘉年華
- 市藝術劇院夏季小劇場系列演出啟...
- 環球熱點評!“輕松備考·12355...
- 我市舉辦新任職縣級領導干部培訓班
- 環球視訊!普法惠民大講堂走進吉...
- “綻放”在大美青海生態安全一線...
- 即將返程!“太空出差”半年 神...
- 世界觀熱點:不斷完善人口服務體...
- 豐田反對電動車:建議別反對_環...
- 14 代桌面酷睿處理器要來了?英...
- 天天快資訊:歸來不是少年,魅族...