【連載】西田宗千佳のネクストゲート 第31回
マイクロソフト対Google。「大規模言語モデル」で加速するビッグテックの戦い
マイクロソフトとGoogleが、大規模言語モデル(LLM)を使ったAIで火花を散らしている。本連載でもマイクロソフトの動きを何度か解説してきたが、Googleの動きが明確になってきたことで、フェーズが変わってきた印象も受ける。そこで、これまでの動きをまとめてみよう。
「新しいBing」で先手を打ったマイクロソフト
ご存知の通り、「チャット」というインターフェースを使ったAIの活用は、この2ヶ月で大きな進展を見せていた。象徴的だったのは、2月7日にマイクロソフトが、チャット検索を組み込んだ「新しいBing」を発表したことだ。
同社は2019年にOpenAIと提携し、それ以来、OpenAIの技術を使ったサービス開発を続けてきた。そして、昨年11月に公開された「ChatGPT」の勢いを受けて発表されたのが「新しいBing」でのチャット検索である。
新しいBingはまだプレビュー段階であり、一般公開は行われていない。登録者が逐次利用可能になっている状況なのだが、現時点では100万人のうち10万人が日本からの利用者で、一人当たりの検索数でも日本がトップだ、とマイクロソフトは説明している。
新しいBingの基盤となっているのは、前述の通りOpenAIの技術である。それがどのようなものか、マイクロソフトは正確に表現してこなかった。だが、3月14日にブログ上で急遽コメントを発表した。
このコメントは、OpenAIによるGPT-4のリリースを受けてのものだ。そして内容は、「新しいBingは、マイクロソフトが検索用にカスタマイズしたGPT-4で動作している」という1文に集約できる。すなわち、もう1ヶ月近く前から、GPT-4を我々は目にしていたのだ。
ただし、1点注意しなくてはならない点がある。新しいBingはマイクロソフトが開発した「Prometheus」という技術で動作している。そのため初期から「PrometheusはGPT-4のことだ」という噂があり、そう説明している記事も見かけられた。だがこれは間違いで、Prometheusは、マイクロソフトが独自に開発した「LLMを検索エンジンとして使うための技術」と言っていい。
LLMに問いかけると答えを返してくれるが、それは「学習するためにネットから得た大量の情報を使っているため」といえる。そこから文章を生成すれば、「検索して出てきた答えっぽいものになる」だけだ。最新の情報を加味して、作られた文章のどこがどのような情報をもとに生成されたのか明示するという、「検索エンジンに求められる要素」を開発した上で、OpenAIのLLMと組み合わせたのがPrometheusである。
今回、「Prometheusの中でGPT-4が使われていた」ことが明かされたが、Prometheusの中ではGPT-4がカスタマイズされて使われており、それ自体もPrometheusの一部でしかない、ということになる。そのため、GPT-4が使われていたといっても、Bingの解答自体がGPT-4と違う。ある意味必然だ。
「誰もがやりたくない行為」をやってくれるGPT-4
3月14日にOpenAIが発表した「GPT-4」は、同社の最新LLMとなる。大規模「言語」モデルではあるが、入力としてはテキストだけでなく、画像を含む多様な情報を扱えるようになったのが、1つの大きな変化だ。例えば写真から、そこに写っているものの変化について推測してもらうことも可能だ。ただし、現状はプレビュー中のため、テキストのみに対応している。
もちろん、できることの幅は非常に広い。何ができるかについては、英語ではあるが、OpenAIがYouTubeで公開しているビデオを見ることをお勧めしたい(自動翻訳で日本語字幕も付けられ、内容はほぼ問題ない)。
ビデオの後半では、「誰もがやりたくない行為」をAIがやってくれる例として、税法に関する文書を読み込ませた上で、家族構成や収入から税金の控除額を計算させるデモも行われている。これはすごい。
ただ本質は「面倒な控除の計算をしてくれた」ことにあるのではない。税金の計算は、人間が税法からロジックを組み立て、プログラムを作れば処理できる問題だ。重要なのは、GPT-4というLLMが、「税法を読み解き、人間がプログラムを作った時と同じ結果を、より短時間でもたらした」という点である。
すなわち、LLMに与えられるルールをちゃんと用意できれば、そこから短時間で求める結果を得られることになる。短時間で済むということは、「プログラムで自動化する」ことが、より低コスト化するということでもある。マイクロソフトはこのAI技術を、Bingだけでなく、さまざまな製品に組み込むとコメントしている。
マイクロソフトにとっては、Bingのような検索エンジンは例外的な存在。オフィスアプリケーションや営業データ分析ツール、工場などのインフラ構築といった、企業向けアプリケーション基盤こそが主軸だ。前述のように、GPT-4が分析や自動化を高速化・低コスト化してくれるのであれば、それを企業にアピールすることは、非常に大きな意味を持ってくる。
Googleも「AI全面展開」をアピール
一方のGoogleはどうかというと、マイクロソフトの大攻勢に対して多少消極的だった。LLMである「Bard」の存在を明かし、検索などへの利用を示唆したものの、いまだ社内利用に留まっている。
ただ、そうした姿勢をパッと大きく変えるタイミングも用意されていた。それが、3月14日に行われた多数の発表だ。GoogleはLLMである「PaLM」を開発し、同社のクラウド開発基盤である「Google Cloud」で活用可能にするという。マイクロソフトとGoogleはクラウドインフラで競合しているため、マイクロソフトがOpenAIでやろうとしていることを、GoogleはPaLMで行うことになる。
また同時にGoogleは、Gmailなどを含む企業向けスイートである「Google Workspace」へのPaLM導入も発表している。こちらはより、多くの人に直接影響するかもしれない。ジェネレーティブAIを使ってGmailで送るメールの下書きを書いてもらったり、Googleドキュメントで原稿の校正をしてもらったり、スライドを自動生成してもらったりといった用途が考えらえる。
詳しくは以下の動画を見るのが近道なのだが、「日常のワークフロー」に関わる作業を直接AIが手掛ける時代が、思ったよりも早くやってきた。
当然マイクロソフトも、オフィスアプリである「Microsoft 365」へのAI導入は進めている。3月17日にはその件についての発表会も行われた。Googleはここについて、マイクロソフトより発表で一歩先んじた形だ。
ただ、PR戦術で言えば、マイクロソフトの方が一歩上手だったのかもしれない。Googleが発表し、「近日中にテストユーザーへ公開」とするなか、直後に行われたOpenAIの「GPT-4」発表に合わせて、自社でのGPT-4活用をアピールした。Googleの発したリリースが、一部、マイクロソフトとOpenAIの発表にかき消されてしまった印象もある。しかもその後には、Googleと同じような発表を準備していた。
もしかすると、そもそもGoogleはこのタイミングでの発表を予定していなかったのかもしれない。マイクロソフトの動きを察知して、発表だけでも急いで前倒しにした可能性もあるだろう。どちらにしろ、ビッグテック2社がLLMを軸に、かつてないほどの速度で対決する状況にあるのは間違いない。
実のところ、どちらもテスト運用的な性質であり、話題先行な部分はある。多くの消費者が実際に使うには、もう少し時間がかかるだろう。そのタイミングに向け、競合がさらに加速することになりそうだ。