訓練には大量のNVIDIA 100を使っている可能性も
AI業界を揺るがした「DeepSeek R1」、中国製チップを推論ワークロードに使用か
中国のAIスタートアップDeepSeekが公開したAIアシスタント「R1」は、各国のApp Store無料アプリランキングで瞬く間にトップとなった。
OpenAIのChatGPTやGoogleのGeminiなどの先進的なAIモデルと同等以上の性能を560万ドル(約8億円)の低コストで実現したとされ、米国のテクノロジー株は一時急落。特にAIモデルに不可欠なチップを提供するNVIDIA株は17%も下落し、6000億ドル(約91兆円)もの時価総額を失っていた。
そうしたDeepSeekのAIモデルが、中国ファーウェイの最新チップ「Ascend 910C」により推論ワークロード(新たな入力に対する予測や生成)を実行しているとの噂が報じられている。
これはAI技術と文化遺産の分野で活躍する、@Dorialexande氏が述べていることだ。DeepSeekはAIモデルの訓練にNVIDIAのH800チップを約2,000個使っていると主張しているが、推論ワークロードには言及していなかった。ちなみにH800はNVIDIAの最先端チップH100を中国向けに輸出できるよう性能を抑えたものだが、後にこちらも米政府により輸出禁止されている。
そしてAscend 910Cはファーウェイが開発した最新のAIチップであり、H100に匹敵する性能を持つと言われている。その詳細は不明だが、ByteDanceやテンセントなど中国の主要AI企業からの関心を受けて、2025年第1四半期に量産を開始する予定だと報じられていた。
この噂話が正しければ、中国が米政府による高度なチップ輸出規制のなか、米ハイテク大手をしのぐAIインフラを自力で調達できる可能性が高まっていることになる。
もっとも、DeepSeekが主張する「500万ドル」という数字は訓練の総コストではなく、最終モデルの運用費用との指摘もある。また、同社が5万台以上のNVIDIA H100を保有しているとの証言もあり、額面通りには受け取れないようだ。
DeepSeekの衝撃を、米ソ宇宙開発におけるソ連の「スプートニク・ショック」になぞらえる声もあった。だが、すでにNVIDIA株も買い戻されており、今後はDeepSeekの真価を見極めるべく冷静な目線が向けられそうだ。
- Source: @Dorialexande(X)
- via: Wccftech