ファーウェイ製チップにより西側への依存も終了?

中国DeepSeekの次世代モデル「R2」、コスト97%削減で米AI業界に衝撃か

多根清史

Image:Stock all/Shutterstock.com

今年初め、中国のAI企業DeepSeekが開発したAIモデル「R1」は、OpenAIやGoogleの最先端モデルに匹敵する性能を、格段に低いコストで実現したとされ、AI業界に大きな衝撃をもたらした。これを受けて米国のテクノロジー株は一時急落し、「AI版スプートニクショック」と称賛する声も上がった

そんななか、同社の次期モデル「DeepSeek R2」の発表が間近に迫っていると噂され、再び競合他社が戦略の再調整を迫られる可能性が浮上している。

中国の株式投資メディア韭研公社(Jiuyan Gongshe)によれば、DeepSeek R2で最も注目すべきは、GPT-4 Turboと比較してトークンあたりの推論コストが97.3%も削減される点である。これは、競合モデルを凌駕する圧倒的なコスト効率を実現できることを意味しており、具体的には入力トークン100万あたり0.07ドル、出力トークン100万あたり0.27ドルの価格設定を予定しているという。

さらに興味深いのは、同モデルが中国ファーウェイのAscend 910Bチップクラスター上で82%の利用率を達成し、計算能力はFP16精度で512ペタFLOPSに達した点である。同規模のNVIDIA A100クラスターと比較しても91%の効率を実現したとされることだ。

これは米国による対中輸出規制下で、中国国内技術によるAIサプライチェーンの「垂直統合」が実質的に達成され、西側諸国への依存度が大幅に低減されたことを意味している。なお、ファーウェイは新型AIチップ「Ascend 920」を発表したばかりだ

そのほか、DeepSeek R2はR1から次のような技術的進化を遂げるとされる。

  • パラメータ数の増加:R1の2倍となる1.2兆パラメータを搭載し、活性化パラメータ数は78B。
  • 多言語対応の強化:R1は主に英語での推論に優れていたが、R2では英語以外の言語にも流暢に対応できる設計となっている。
  • 強化学習の拡大:より大規模なデータセットを用いた強化学習により、論理的かつ人間らしい推論が可能に。
  • マルチモーダル機能の追加:テキストだけでなく、画像、音声、さらには動画データの処理にも対応。

現時点では、DeepSeek R2の性能はあくまで推測の域を出ておらず、最終的な製品版では仕様が変更される可能性もある。しかし、これらのリーク情報の一部でも事実であれば、米国のハイテク大手に価格戦略の見直しを迫るとともに、米国一強だったAI業界の構造を根本から揺るがすかもしれない。

関連キーワード: