[新聞] 新模型 R2 延後主因!DeepSeek 嘗試華為

新模型 R2 延後主因!DeepSeek 嘗試華為晶片失敗,還是得靠 NVIDIA 科技新報 作者 林妤柔 2025年08月14日 15:22 https://tinyurl.com/24gqjw6w 中國人工智慧(AI)公司 DeepSeek 在嘗試使用華為晶片訓練新模型失敗後,延後新一代 模型的發布,這也凸顯北京推動取代美國技術的困難。 知情人士透露,DeepSeek 在 1 月發布 R1 模型後,受到官方鼓勵,改採用華為昇騰( Ascend)處理器,而非 NVIDIA 系統。 然而,在使用昇騰晶片進行 R2 訓練過程中持續遇到技術問題,因此改回 NVIDIA 晶片進 行訓練,僅在推理(Inference)階段使用華為晶片。知情人士透露,這是模型發布從 5 月延後的主要原因,導致 DeepSeek 在競爭中落後。 所謂「訓練」是模型透過大量資料集中學習,「推理」則利用已訓練好的模型進行預測或 產生回應。由此可知,中國晶片在關鍵任務上仍落後美國競爭對手,這也是中國追求半導 體自給自足所面臨的挑戰。 外媒《金融時報》(FT)指出,北京已要求中國科技公司必須為訂購 NVIDIA H20 晶片提 供正當理由,藉此推廣華為、寒武紀(Cambricon)等國產替代方案。 業界人士認為,與 NVIDIA 產品相比,中國晶片存在穩定性問題、晶片間連線速度較慢, 以及軟體水準較差等劣勢。 據悉,華為曾派出一支工程師團隊前往 DeepSeek 辦公室,協助利用其 AI 晶片開發 R2 模型。但即使如此,DeepSeek 仍無法在昇騰晶片上成功完成一次訓練。不過,DeepSeek 與華為合作改為將模型在推理(Inference)階段能相容於昇騰晶片。 知情人士透露,DeepSeek 創辦人梁文峰在內部表達對 R2 進展不滿,並努力投入更多時 間打造更先進模型,以維持公司在 AI 領域的領先地位。R2 發布延後的原因還包括更新 模型所需的資料標註時間比預期更長,根據中媒報導,該模型有望在未來數週內發布。 加州大學柏克萊分校 AI 研究員 Ritwik Gupta 認為,將昇騰用於訓練這方面,華為正在 經歷「成長痛」,但預期它最終會適應,「我們今天還沒看到用華為訓練的領先模型,不 代表未來不會發生。這只是時間問題」。 心得/評論: 今天這個新聞很多 用Google搜尋了一下,一堆 https://ibb.co/Rp38wm4T 中國最近以為自己又長大了,開始抓 Nvidia H20 問題 其實如果你了解中國,大部分都是政治問題,不是H20有問題 H20最多就一個定位系統 主要在抓H20是不是出現在不合理的地方 追蹤買家 說H20有後門 我只能說是天大笑話 真正有後門的產品都是中國的產品 H20不可能有後門,中國的說法是政治說法 以為自己長大了 其實還是幼稚園 現在終於爆出 DeepSeek 用華為昇騰訓練不出來==> 真是笑死 然後前一陣子 我看到一個消息 中國在吹 華為昇騰384超節點 超越 Nvidia了 中國把這個吹上天,你們自己去查,我看了也是大笑 你們有興趣的人自己去搜尋,吹上天了 真可笑 https://tinyurl.com/2bjjcc7n 如果華為這麼行 Nvidia 股價早就崩了 中國這種吹牛的習性 沿至於自卑

推文討論 57

1F s213092921 08/15 00:25
,這些市占跑去哪裡好難猜啊
2F zo6596001 08/15 08:39
a
3F jinkela1 08/15 00:17
Merkel講
4F ariadne 08/15 01:31
一個機櫃,昇騰384要16個機櫃才能媲美,還是常當機
5F zo6596001 08/15 08:22
下一個成功的也不會是華為,AMD還比較有可能。
6F shiki1988 08/15 00:31
中吹的邏輯大概都是
7F CAFEHu 08/15 00:50
亞馬孫核心怪盜:口嫌體正值
8F maniaque 08/15 10:41
令人想不到的事情,也不難理解吧
9F zo6596001 08/15 08:39
以小公司幫忙面試的經驗,研究生訓練AI幾乎都用Cud
10F rahit 08/15 01:03
但排標配還是N家gpu
11F holysong 08/15 00:25
國電動車
12F rahit 08/15 01:04
在AI的世界N卡目前是Windows的地位
13F maniaque 08/15 10:41
怎? 換個國家搞後門定位,就有了大義???
14F newwu 08/15 01:21
應該是對自己的手刻能力很有信心吧
15F zo6596001 08/15 08:40
我們想換成AMD還找不到工程師
16F bloodyiris 08/15 02:29
手刻怎麼可能不行呢
17F eriker 08/15 00:49
援 純手刻的世界
18F zo6596001 08/15 08:21
斷一段時間
19F s213092921 08/15 00:25
晶片市佔率將從 2024 年的 66% 下滑至今年的 55%」
20F mainsa 08/15 00:14
會去用那種東西 說起來也是很愛國了
21F maniaque 08/15 10:37
會買這種次級品....
22F newwu 08/15 01:21
畢竟之前就去改Cuda 更底層的code加速,結果還是太
23F tenka92417 08/15 08:51
知情人士
24F HiuAnOP 08/15 01:10
科技日報不可信!什麼野雞雜誌?
25F qwe78971 08/15 02:00
繞不開cuda 來什麼晶片都一樣
26F maniaque 08/15 10:38
要加定位追蹤,好歹也是 H100 or B200 吧.....
27F maniaque 08/15 10:40
要是明知道只剩下大陸會買,還加上追蹤器也沒告知
28F ep301177 08/15 00:12
讓中國民眾接受買NV了
29F ariadne 08/15 01:31
跑不完自瀆式的媲美。佔地跟耗能明顯遙遙領先的多
30F maniaque 08/15 10:40
那你認為在隱匿的前提之下,背後會做什麼比定位更
31F mp32283228 08/15 00:15
阿哈哈哈 不是說DS很厲害中國晶片很厲害 你看看你
32F newwu 08/15 01:21
難了
33F ep301177 08/15 00:12
有在看中國社群就知道,開始在洗黃仁勳是中國人,
34F jinkela1 08/15 00:17
真正有後門都中國產品?你要不要去對德國Angela
35F maniaque 08/15 10:37
笑死....H20 還要追蹤啥買家? 全世界只剩下大陸
36F rancilio 08/15 08:24
講的好像你有用過H20和華為芯片一樣
37F s213092921 08/15 00:25
「根據聯博投信 (Bernstein) 預測,輝達在中國的 AI
38F PoloHuang 08/15 07:39
DS真的難用
39F gamesame7711 08/15 02:14
SMR跌好慘 發生什麼事惹
40F bella1815 08/15 09:20
中吹不知道預測只是預測嗎?等發生了再來洗地吧
41F jorden 08/15 06:32
中國又贏了
42F lPla 08/15 02:58
中國或成最大贏家
43F holysong 08/15 00:25
中國政府為什麼要封鎖特斯拉?因為他們也這樣要求中
44F hirorei 08/15 00:13
八翻
45F shiki1988 08/15 00:31
吹完這個繼續吹比亞迪 不意外
46F ansinlee 08/15 01:10
彎道超車,彎進海裡了
47F mainsa 08/15 00:13
我還以為華為那個就吹好玩的 沒想到中國真的有公司
48F ntr203 08/15 00:17
所以ds到底是不是用nv的低階晶片?
49F mopa 08/15 06:18
技術壁壘那麼容易突破,就不會有今天的輝達了
50F ezorttc 08/15 07:52
抵制NV 晶片
51F ariadne 08/15 01:31
昇騰384最奇葩是體積超大,號稱媲美NVL72。結果NV
52F rahit 08/15 01:03
有些模型有為昇騰等中國晶片特別調整
53F eriker 08/15 00:49
用華為真的是愛國人士 沒有各種方便的cuda跟torch支
54F nakayamayyt 08/14 23:58
蒜粒只有不夠用買不到
55F holysong 08/15 00:10
遙遙領先~遙遙領先
56F zo6596001 08/15 08:21
除非大學生人手一台華為晶片的電腦,不然NV還會壟
57F g0t24568 08/15 00:45
難怪中國政府要出來喊 不然華為ai晶片整個掛
...