看板 Stock 關於我們 聯絡資訊
原文標題: OpenAI內部人士:有證據顯示DeepSeek盜用我們的模型 原文連結: https://reurl.cc/WAgO0e 發布時間: 2025-01-29 15:10 / 作者 陳家齊 原文內容: 中國新創企業的DeepSeek AI引擎,對美國矽谷造成大震撼,因為號稱用幾十分之一的成本 、很少的算力就能達到與業界龍頭OpenAI同等級的成果。《金融時報》報導,OpenAI內部人 士指出,他們有證據顯示DeepSeek使用「蒸餾」(distillation)的技巧,盜用OpenAI的成 果。 「蒸餾」這個技法是AI開發者常用的技術,這是利用其他更大AI模型所計算輸出的結果,訓 練自己開發中的較小AI模型。如果《金融時報》的報導獲得證實,則DeepSeek可以用極低算 力、極低成本達成媲美OpenAI等級的成果,就不再是個謎:DeepSeek等於是寄生在OpenAI身 上,自然不必自己投入大成本建構算力。 OpenAI的服務條款規定,使用者不得「複製」其任何服務,或「使用OpenAI的輸出結果來開 發與OpenAI 競爭的模型」。DeepSeek若利用了OpenAI開發出DeepSeek-R1這個震驚各界、和 OpenAI競爭的模型,就違反了使用條款。 據另一名知情人士透露,OpenAI 及其合作夥伴微軟去年秋天調查了據信屬於DeepSeek的帳 戶,這些帳戶使用了OpenAI的API(應用程式介面),以違反服務條款的方式進行蒸餾,遭 到封鎖。這些調查最早由彭博新聞報導。 DeepSeek表示,其V3 AI模型僅使用2048張輝達H800顯示卡,只花費560萬美元進行訓練,擁 有6710億個參數,成本僅為OpenAI和Google類似規模模型的幾十分之一。 部分專家指出,DeepSeek模型的輸出結果,顯示其可能接受過OpenAI GPT-4輸出的內容訓練 ,這違反OpenAI的服務條款。業界人士指出,在中國和美國的AI實驗室中,使用來自OpenAI 等大型AI企業的輸出進行訓練是常見做法,較小型的企業往往藉此「搭便車」。 對於OpenAI這些最前線的AI模型開發公司而言,他們必須耗費金錢與心力搭建龐大的算力中 心,接受人工輸入的反饋,以訓練出更好的AI模型。這個過程耗時而且非常昂貴。 加州柏克萊大學(UC Berkeley)AI博士生古普塔(Ritwik Gupta)表示:「新創公司和學 術界普遍會使用商業化的大型語言模型(LLM),像是ChatGPT的輸出,來訓練自己的模型。 這樣一來,他們便能免費獲得人類回饋訓練的結果。我不會驚訝DeepSeek採用了相同方法。 如果確實如此,要完全杜絕這種做法可能相當困難。 心得/評論: 幾天之內 一下捧上天 一下又人人攻擊 還好台股過年可以停看聽一下 不然差點 DeepSeek引力抓不住你 ---- Sent from BePTT on my Google Pixel 6 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.215.56.15 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738155800.A.7A9.html
ggian123 : Close Ai輸不起就別玩01/29 21:04
etset : 中又贏 遙遙領先 遙遙領先01/29 21:04
cosmite : 穩了01/29 21:04
loopdiuretic: 抗議 他學我?01/29 21:04
gino0717 : 這又是哪家野雞雜誌01/29 21:05
KISS1979 : 有一群人崩潰精神錯亂了01/29 21:05
s1612316 : 等等 盜用?要不要先定義什麼是盜用01/29 21:05
liscp : 等等這串所有的中國id 通通水桶 01/29 21:07
※ 編輯: ng101281 (49.215.56.15 臺灣), 01/29/2025 21:08:11
alau : 人家有明文規定不能拿API來訓練模型吧? 01/29 21:08
tradeent : 蒸餾不等於盜用 01/29 21:08
tradeent : 然後蒸餾不代表成績就會好 01/29 21:09
tradeent : 最後是蒸餾在現行法律不違法 01/29 21:09
fool5566 :http://i.imgur.com/Wgh1BHF.jpg 01/29 21:09
gbman : google表示以後搜尋引擎自己開發不要用我的CC 01/29 21:09
fool5566 :http://i.imgur.com/3c1frTP.jpg 01/29 21:09
hihi29 : 美國輸不起 好扯== 01/29 21:09
ethan0419 : 只有我覺得結果是如何根本不重要嗎 01/29 21:10
ketter : 兩天就翻車,比黑悟空還快~ 01/29 21:11
bobokeke : 大紀元還是新唐人? 01/29 21:12
amd3dnow : '蒸餾'又是哪個文組發明的詞?? 01/29 21:12
set852064 : 急了.jpg 01/29 21:12
tonyparker18: 牆倒眾人推 01/29 21:13
gsc0478 : 買空賣空 所以只能算是一支介面程式 01/29 21:13
gbman : 這樣玩就能贏!那OPENAI真的爛CC 01/29 21:14
Homeparty : 原本就打算美國1個人可以寫10個人程式,中國再會99 01/29 21:15
Homeparty : 6也贏不了。 01/29 21:15
acake : 蒸溜是專業術語好嗎 01/29 21:17
fashsboy : 把證據拿出來阿= = 01/29 21:18
linzero : 可能也知道也可能告不贏或者告了也不能怎樣,但也算 01/29 21:19
linzero : 一種表態、證明 01/29 21:19
Jeff1989 : 等等支那賤畜韭菜們會出來洗地XD 01/29 21:19
bobogei81123: 我也覺得distill直接翻蒸餾很搞笑 01/29 21:21
paericsson : 中國玩得真溜~~ 01/29 21:21
bighouse : 不意外 01/29 21:22
linzero : 以前好像就有人翻譯用蒸餾了 01/29 21:22
liu1030 : distill學術界很常用阿 01/29 21:22
Leo4891 : 不論有沒有盜用 肯定的是 ds也是得靠前人研究成果 01/29 21:22
Leo4891 : 才能再進步 01/29 21:22
repast : 垃圾支那不意外 還一堆低能兒在吹 01/29 21:23
easonli000 : 聽起來像是稱讚DS的自我監督技巧有效 01/29 21:24
bobogei81123: OpenAI的TOS是真的有說不能用ChatGPT的結果來訓練別 01/29 21:25
bobogei81123: 的AI 但之前有判例完全由AI產的東西沒有Copyright 01/29 21:25
bobogei81123: 應該是告不太成 01/29 21:25
sspider0829 : 笑死 01/29 21:26
set852064 : 所以證據要公佈了嗎?還是苦無? 01/29 21:26
square : 美國輸不起 笑死 01/29 21:26
gbman : 要告google就告拉CC 01/29 21:26
Wand : 「DS是站在巨人的肩膀上」「證據呢」呵呵 01/29 21:26
tonyparker18: 拉回就是跟你買的 很多人搞不清楚 還在泡沫 01/29 21:27
c1951 : 程式碼完全開源 找一下就可以知道哪條程式碼在搞鬼 01/29 21:27
finly1023 : 輸不起翻桌 01/29 21:27
horseorange : 笑死 有人看不懂就說人文組 01/29 21:28
s213092921 : 開始抹黑了,熟悉的套路XDD 01/29 21:28
gbman : DS自己有講有用開源AI訓練!不只OPENAI 01/29 21:28
eric112 : 那如果是這樣頂尖AI公司也沒有技術護城河,隨便都 01/29 21:28
eric112 : 可以被蒸餾也沒辦法禁止這樣誰還要花大錢去訓練, 01/29 21:28
eric112 : 而且在中國根本無法可管 01/29 21:28
basslife : 北七 一堆AI都馬盜用你的東西怎不說 01/29 21:28
brain9453 : 你們的人 要不要打一架 風向很亂 01/29 21:28
firemothra : 蛤?是不是真的怕了? 01/29 21:29
s213092921 :https://i.imgur.com/zu8RQAC.jpg 01/29 21:29
sellgd : 你自己生成式AI沒盜用網路上圖文創作內容? 01/29 21:30
strlen : 其實這一直是有問題的地方 到底AI公司隨便抓資料訓 01/29 21:30
strlen : 練版權問題到底該怎麼算? 01/29 21:31
eric112 : 那openAI乾脆開放給大家既然沒辦法防止 01/29 21:31
KTFGU : 這樣就可以名正言順的 美國封鎖中國軟體了 01/29 21:31
gbman : 管你的!當然爽爽免費用最好阿XD 01/29 21:31
Acce0912 : 急了 01/29 21:33
matlab1106 : 這不就鄉民常用的跟我想的一樣? 01/29 21:33
uniz : DS承認是用Chtgpt的http://i.imgur.com/A0TL3C8.jpg 01/29 21:33
bobogei81123: 可以看這篇https://tinyurl.com/yda2aten 01/29 21:33
linzero : 使用蒸餾的情況跟AI未經授權抓資料來訓練不一樣吧? 01/29 21:33
gbman : 美國就閉源啊!開源還怕人家用!就關門自己玩CC 01/29 21:34
bobogei81123: 作者有提到 distillation 讓先出的 model 頗吃虧 01/29 21:34
strlen : 只要你資料是來自於其它地方 就是會有問題 01/29 21:34
strlen : 除非你有一個一個的去跟資料擁有者拿版權 01/29 21:34
xzcb2008 : 說越多越慘歐 資本已經動搖了 01/29 21:35
strlen : 但這幾乎沒有一間AI公司做到 版權到底怎麼算 01/29 21:35
xzcb2008 : 看今晚就知道了 01/29 21:35
strlen : OpenAI Meta Google xAI一眾都有問題 01/29 21:35
joke3547 : 所以證明是真的但是是抄你們的? 01/29 21:36
eric112 : 所以這種東西就是沒有技術護城河,你砸錢也沒辦法 01/29 21:36
eric112 : 防止被偷,而且那些東西本來就來自普羅大眾 01/29 21:36
bobogei81123: 我猜以後 OpenAI 再出更強的 model 可能就不放出來 01/29 21:36
bobogei81123: 給每個人用了 變成要用的公司分別來簽約了 01/29 21:36
strlen : 拿他們的東西作訓練 也有問題 01/29 21:36
ian01050 : 蒸餾是深度學習的技巧 不懂的文組不要亂叫可以嗎… 01/29 21:36
strlen : 但我看大概也沒人管 沒辦法管吧 01/29 21:36
gm3252 : 中國不意外 01/29 21:36
squelch : 內部人士是誰啊 要放話就公司公開宣告啊 01/29 21:37
linzero : 證明是蒸餾的話,可以說這種模式本就會省時省力,就 01/29 21:37
set852064 : 感覺說愈多愈顯得... 01/29 21:37
jcwang : 理組申請蒸餾專利了? 01/29 21:37
linzero : 可以跟金主跟美國政府表示我們不是在浪費錢砸算力 01/29 21:38
Nighty7222 : 上次騰訊才把別人的程式碼整個copy回來用被抓包。算 01/29 21:38
Nighty7222 : 了吧 01/29 21:38
stanleyplus : 中又贏麻 01/29 21:38
xzcb2008 : 如果他不開放 那怎麼繼續圈資本 這棋很難下了 01/29 21:39
a0913 : 蒸餾不是支語 01/29 21:39
a0808996 : ai公司 網路上一直撈資料 也沒問過人阿~ 01/29 21:39
xzcb2008 : 對岸就是要你為畏縮縮玩不是嗎 01/29 21:41
rayisgreat : 要回噴了!!! 01/29 21:41
ra88872 : 這是做空嗎?盜用還是內賊差很多,盜用的話open ai 01/29 21:41
ra88872 : 麻煩可大了。 01/29 21:41
linzero : 撈資料跟蒸餾雖然都可以說是未經允許,但本質上不同 01/29 21:42
joke3547 : Transformer 開發團隊表示:那我是不是...欸?! 01/29 21:42
qxpbyd : 很難證明吧 這史無前例 01/29 21:42
gbman : 不是有人說次DS是開源的勝利!有點意思CC 01/29 21:42
a0808996 : ds開源 道德上已經占盡優勢了 01/29 21:43
linzero : 有點不洽當比方,撈資料是撈食材,蒸餾是學烹飪技巧 01/29 21:43
a0808996 : 我沒私藏 大家一起成長 01/29 21:43
liscp : Ds 幫openai 開源 潮到出水 01/29 21:44
c00jsw00 : 那個內部人士 不敢具名 87 01/29 21:44
dosiris : OpenAI也挖了不少中國網頁的資料吧 01/29 21:44
a0808996 : 歡迎COPY 01/29 21:44
SYMS : 輸不起,翻桌了 01/29 21:45
ohlong : 急了 01/29 21:45
qxpbyd : https://i.imgur.com/gBzps4A.png DS員工的解釋 看 01/29 21:45
aa00788 : 中吹崩潰了 01/29 21:45
qxpbyd : 你信誰囉 01/29 21:45
laogiby : 白豬又要耍賴了 哭R 01/29 21:47
tw12321 : 呵。那人家成本低是事實也是青出於藍 01/29 21:47
a0808996 : 對岸也沒再管版權的 01/29 21:47
Aliensoul : 這是做新聞給股市看的吧 01/29 21:48
a0808996 : 偷了魔改 你能怎樣 01/29 21:48
joke3547 : 確實也管不到對岸,嘻嘻 01/29 21:48
tim855042 : 支那要人要崩潰了 吹2天的泡泡就破了 01/29 21:49
linzero : 當初鴻蒙不是就replace不夠乾淨嗎? 01/29 21:49
DrowningPool: Jordan表示:first time? 01/29 21:50
jhihheng : 早說了 詐騙垃圾 01/29 21:51
fywei : ds就是垃圾 01/29 21:52
pikaaco : 就算是也沒辦法怎樣吧 中國有在怕的嗎 01/29 21:54
luten : 我比較喜歡翻成「雙修」 01/29 21:54
iamfreefrog : 這應該會是川普決心玩死中國的最後一根稻草 01/29 21:56
kdh : 開源程式直接拿來驗證就知道了 01/29 21:57
Sashaaaa : 中國人不意外 01/29 21:58
lmc66 : 中國哪個東西不是偷來的 學術界本來就特別寬容中國 01/29 21:58
lmc66 : 的盜竊行為 01/29 21:58
s0920151048 : 駐版台吹興奮了 01/29 22:01
low1219 : Open AI 沒有Open ,太陽餅裡面沒有太陽。 01/29 22:01
stanleyplus : 誰玩誰還不知道XDD 01/29 22:02
tcypost : 看人解釋DS,本來裡面就公開說是用蒸餾的啊 01/29 22:04
lmc66 : 蒸餾就是違反OpenAI使用守則啊 就是偷啊 就不是他 01/29 22:07
lmc66 : 們在吹的”從零開始” 01/29 22:07
tonylolz : 等下就告訴你誰崩潰囉 01/29 22:08
phoenixtwo : 不意外 中國那次遙遙領先不是這樣 01/29 22:08
flipflap : 遙遙領先 中或贏 雙贏就是中國贏兩次 01/29 22:12
ev331 : OPENAI的金主爸爸微軟不缺錢吧 01/29 22:12
rex03187 : 蒸餾代表你省去從海量垃圾資料去判斷的過程 01/29 22:16
polaroidd : 又要抽稅了嗎 01/29 22:16
rickyhoney : 還沒上車啊,別那麼快恢複 01/29 22:18
strlen : 呃...DS員工那對話...是在證實他的AI輸出都幻覺嗎 01/29 22:19
strlen : 哪個內鬼截這白癡圖啊?應該是假的 01/29 22:19
mangle : 輿論一條龍來了 可憐啊 01/29 22:20
lovepork : 重新定義盜用? 01/29 22:21
zombiepigman: 滯台支那人急著洗地中 01/29 22:21
qxpbyd : 現在哪個AI沒有幻覺 推薦一下 01/29 22:23
a134 : 1500excel 即時感 01/29 22:24
qxpbyd : OpenAI的轉錄語音的都有Whisper了 01/29 22:24
qxpbyd : whisper模型 幻覺 01/29 22:25
alphish : 中國人用英文寫程式 怎樣都是抄襲英美 01/29 22:25
qxpbyd : 那是TG公開頻道 01/29 22:26
eelse : 用你的連結套個皮就是新的AI了,中國式創新 01/29 22:28
milandi : 中國豬: 輸不起啦 ~~~ 01/29 22:34
FatFatQQ : 美國也開始維穩了嗎 真滑稽 01/29 22:35
FatFatQQ :https://i.imgur.com/wMkV5yP.jpeg 01/29 22:35
Lhmstu : 美國公司怕了XD,不過中國應該不屌才對 01/29 22:35
s10112 : 笑死 那CLOSEAI不就盜用全網民資料 真是畜生一隻 01/29 22:37
NEWinx : 中國不偷才是新聞吧 01/29 22:41
Bachack000 : 中國意外嗎?騙、偷、搶樣樣來 01/29 22:47
pttouch : 不知道要說啥,我是覺得不用一直洗一直洗一直洗一 01/29 22:49
pttouch : 直洗一直洗一直洗一直洗一直洗一直洗一直洗一直洗 01/29 22:49
pttouch : 一直洗一直洗一直洗一直洗一直洗一直洗一直洗一直 01/29 22:49
pttouch : 洗一直洗一直洗一直洗一直洗一直洗 01/29 22:49
copybrown : 哪個內部人士?笑死 01/29 22:49
black205 : 說一直洗的搞笑人士不如趕快把ChatDPP弄回來啊 01/29 22:51
black205 : 不知道要說啥 改說說廢物唐部長拿兩百億做什麼垃圾 01/29 22:51
bitcch : 一堆無腦言論 一堆公開paper都在做 連Google都在玩 01/29 22:54
bitcch : 蒸餾本來就是正常的模型壓縮技術 只是這次ds做的特 01/29 22:55
bitcch : 好 01/29 22:55
pttouch : 看不懂這是在炒股的搞笑人士請不要又泛政治化…這 01/29 23:23
pttouch : 就是在話題炒股,韭菜不要在那邊什麼都要滑坡好嗎 01/29 23:23
pttouch : == 01/29 23:23
Chien996 : 綠蝇精神勝利法 很在意台灣輸慘XD 01/29 23:24
takeda3234 : 如果繼續蒸餾下去 硬體成本是不是會變越低就能達成 01/29 23:26
pttouch : 哇靠我還左轉出去看吧我是不是在股版,奇怪了明明 01/29 23:27
pttouch : 是在討論股票的事情,係咧== 01/29 23:27
jason613 : 那明天劇本是 deepsuck 01/29 23:59
noseng : 這次……兩天?……果然還是無視就好 01/30 00:09
stanleyplus : 多蛙丸子 01/30 00:18
sanos168 : 哈哈哈.果然是畝產萬斤糧的翻版,什麼最節省成本.. 01/30 00:48
logitech2004: 大家都是這樣做的好嗎? 01/30 00:53
solarem : 嘻嘻 就說你是抄的 有美國可以抄襲 中國要懂的感激 01/30 00:54
ljh109 : 中吹又要森七七了 01/30 02:08
Brioni : 現在最燒屁股的是星門專案吧,投資機構一個閃現就變 01/30 03:12
Brioni : 閉門專案 01/30 03:12
mdkn35 : 結果還真的被說對了?柵欄仔又翻了? 01/30 06:53
NexusPrime : 學術研究的paper用蒸餾沒問題啊,但是你DS是商業化 01/30 09:31
NexusPrime : 的app 01/30 09:31
SRNOB : 開源免費的 什麼商業化zz 01/30 10:36
sid3 : 他抄襲我的髮型 01/30 15:32
adamyang2000: 打炮也是抄襲A片學來的 01/30 20:31