【連載】西田宗千佳のネクストゲート 第26回

AIの力で「打倒Google」なるか。マイクロソフト「新しいBing」検索を試してみた

西田宗千佳

検索サービスで、マイクロソフトがGoogleに強いプレッシャーをかけ始めている。マイクロソフトは2月7日(現地時間)、検索エンジン「Bing」とウェブブラウザー「Edge」の大規模アップデートを発表した。中核となるのは、Open AIの大規模言語モデルを使った「チャット」「要約」などの機能だ。

新しいEdgeで、Open AIの技術を組み込んだ「新しいBing」へアクセス。申し込んだ人に向けて提供を順次公開中

現在マイクロソフトは、この新しいBingについて、ウェイティングリストへの登録後、順次利用者を拡大していく形を採っている。今後数週間で数千万人に、ということなので、それほど待たなくても使えるようになるかもしれない。

筆者も新しいBingが使えるようになったので、早速試してみよう。

悲願の「検索ビジネス」で勝つため、先を走るマイクロソフト

「このテクノロジーは、ほとんどすべてのソフトウェア・カテゴリーを再形成する」。マイクロソフトのサティア・ナデラCEOは、7日の会見でそう述べた。

いま生活の中で、ネット検索は非常に大きな領域を占めている。ネットワーク上で生まれる収益の多くが検索と、そこにひもづく広告から生まれているのも事実だ。

7日・シアトルで開催された会見に登壇した、マイクロソフトのサティア・ナデラCEO

言うまでもなく、現在のネット検索を支配しているのはGoogleであり、マイクロソフトのシェアは低い。だが、今回のBingの改良により、ナデラCEOは「自分たちがフロントランナーへ躍り出る可能性もある」と考えているわけだ。

それほどの可能性があるなら、やはり試してみたいと誰もが思うことだろう。しかし、その前に注意点が2つある。

まず1つ目。新しいBingは「Edge」でしか使えない。ChromeやSafariなどの場合、Edgeをダウンロードするよう促すメッセージが表示される。また現状、モバイル版アプリからも使えない。ただしEdgeであれば良いため、Windows版だけでなくMac版でもアクセスできる。

画像はMac版Safariでアクセスした場合。Edgeからでないと、新しいBingは使えない

2つ目に、今回発表された「新しいEdgeブラウザ」は、まだ開発途上版である点だ。そのため現在は、そのままではインストールされない。

利用するためには、新しいBingへの招待があった上で、さらに「Microsoft Edge Insider」のページへアクセスし、ダウンロードする必要がある。安定した動作が保証されるわけではないので、その点はご理解の上お使いいただきたい。

新しいEdgeは、新しいBingが使えるようになったあと、改めて「Microsoft Edge Insider」版をインストールする必要がある
新しいEdge。右側からチャット検索などへアクセスすることもできる

文章で質問して文章で回答、根拠のリンク付き

では最初はシンプルなところから。「新しいBingはどんな技術を導入した結果、どう改善されたのですか」と聞いてみよう。

まずはチャット専用画面ではなく、普通の検索画面に入れてみる。ここでも最大1000文字まで入力が可能だが、チャットを入力してから、それを解析して文章が出来上がるまではしばらくかかる。いままでのネット検索との違いはその点だ。結果は次のように表示される。

新しいBingでの検索画面。今まで通りの検索結果が左に出て、チャットでの回答は、少し遅れて右に出てくる

検索結果が左に出て、そのあと右側に、チャットによる結果が出てくる。だから先に左側が更新され、その後ゆっくりと、右のチャット欄の中が出てくる……という感じだ。

そして、上にある「チャット」を押すと、チャットでの検索をベースにした機能に切り替わる。

チャット検索専用の画面
先ほど行った文章での検索を「チャット」ボタンを押してチャット検索専用画面に移行したもの

改めて返答を見ると、句点の左側に小さな数字がついていて、さらに下にリンクがまとめられているのがわかる。これはチャットによる回答が、どんなページの情報を元に作られたのかをまとめた「索引」のようなものだ。ここをクリックすると、元になった情報の掲載ページにジャンプする。

ChatGPTと「Bingチャット検索」の違いとは

新しいBingはOpen AIの大規模言語モデルをさらに改良した「Prometheus」というモデルを使っている。Open AIとは、昨年11月に公開され、チャットAIの流れを決定づけた「ChatGPT」で有名。Prometheusも、ChatGPTで使われているGPT-3の先にあるものだ。

ChatGPTでは、チャットの形で人と交わしたコミュニケーションから、質問の答えや旅行プランの作成、詩や小説の作成などが行える。作るのが文章か絵かという違いはあるが、MidjourneyやStable Diffusionと同じ「ジェネレーティブ(生成型)AI」だ。

ただし「生成物」なので、別に事実を述べているわけではない。ネットから収集した情報を元に、「言及が多く、条件にあった」文章が作られているだけだ。言及が少なければまったく正しくない答えを「自然な文章として作る」ことも多い。

そのため、ChatGPTを検索的に使うなら、内容を利用者がしっかり読んで、自分の目的にあった内容かを判断する必要があった。これはなかなか困難なことだ。特に自分がよく知らないことだと、内容の判断はさらに困難になる。

こうした課題に対する対処として、マイクロソフトは、BingへGPT-3.5を実装する際に「索引」的に、文章を作るときに使った情報をリンクするようにしたわけだ。

ChatGPTは、ネットから情報を集めて学習しているものの、2021年までの情報しか使っていない。一方、Bingは検索のために日々情報を集めており、そこからAIの学習も行われているため、もちろん最新の情報が出てくる。

このように「検索として何が求められるのか」を考え、検索エンジンの中にGPT-3系列の技術を組み込んだのが「新しいBing」である。そういう意味では、ChatGPTとはかなり違うもの、ともいえる。

会話をしながら回答の精度を高めることも

もう一つ、チャットベースであることと「検索」の違いは、会話を続けながら内容を確認していける、ということだ。

こんな例がある。「東京から福井県坂井市に、できるだけ楽に、乗り換えを少なくして移動したい」とする。実は筆者の郷里なのだが、福井県坂井市は移動がちょっと面倒な場所だ。

現状、福井県内に旅客機用の空港がないため、東京から直接飛行機で行けない。また電車の場合も、北陸新幹線が延伸されていないので、乗り継ぎが必須になる。さらに、東海道新幹線で行く方法もある。いろんな方法で移動できる割に、一長一短である。

そこで聞いてみると、次のように文章で返ってきた。色々な移動方法を組み合わせた上で、ちゃんと運賃まで出てくる。

乗り換えの少なさも考慮に入れて、と条件をつけて質問すると、旅費を含めたかなり詳細な回答が出てきた

回答では「大阪か名古屋に飛んで、そこから乗り換え」を指定されたので、「小松空港(石川県)経由の方がいいのでは?」と聞いてみた。すると「確かにその方法もあるが、乗り換えの少なさから、 “楽” なのは大阪経由」と回答が返ってきた。これは面白い。

質問を追加して、回答の意図を確認できる。ここがいままでの「検索」とは違う

やっていることは、今までのネット検索と同様に、「キーワードで答えをネットから探す」ことと同じだったりする。だが、それを文章にまとめ上げているのが、チャットベースの特徴である。

さらに「追加の疑問に答えてくれる」のも、従来の検索と違うところだ。キーワード検索の場合、内容に疑問があると、最初から検索キーワードを見直して探す必要がある。しかしチャットベースの場合、疑問に思う部分を追加で聞けばいい。

課題も多数。本当にブレイクするのは「スマホ上」か

もちろんチャットでの検索には課題もあり、1つは信頼性だ。Bingの場合、情報ソースを明示するようになってかなり判断しやすくなったが、それでもまだ危険だ。キーワード検索の場合には、検索上位以外にも大量の情報があることがはっきりわかるが、チャットでは情報が絞られているので、その辺を理解しづらい。

2つ目はスピードで、現在のチャット検索は、文章生成に多少時間がかかる。キーワード検索に比べると即応性に欠ける。ただこれは、将来的に改善していくだろう。

3つ目は「人間が文章を作る」必要があること。正確に質問文を作るのは、意外と簡単なことではない。自分が何を求めているのか、ちゃんと把握した上で文章を作る必要がある。キーワードでさえ、しっかりとヒットしそうなものを挙げるのは割と大変なので、ここをハードルと考える人もいそうだ。

当然だが、現状では検索結果の内容が文章になっている目新しさはあっても、出てくる内容自体がネット検索から乖離しているわけではない。だとするなら、「チャットで聞くことが便利なシーン」がどう定着するかが、検索全体の変化に繋がっていく、ということになるだろう。

チャットAIの検索における本質は「ユーザーインターフェースの違い」だ。もちろん、文章を作ってくれることには価値があるが、検索の仕方や検索結果の見え方が変わることに意味がある。

だとするならば、本当に生きてくるのはPC用ブラウザの上ではないかもしれない。スマホの中で、音声認識・音声合成とともに使われたときが、一番可能性が発揮されるのではないか。そんなことを使いながら考えている。

関連キーワード: