スキップしてメイン コンテンツに移動

注目の新検索エンジン“WolframAlpha”データ版の客観的評価について

  

Last Updated : March 5,2021

 最近わが国のブログで紹介され始めた話題 (筆者注1)で、5月18日にサービス開始する“WolframAlpha”と“Google” はどちらが検索エンジンとして機能面等で優れているか、また“Google”の世界戦略はどのような影響を受けるのかといった問題につき各方面から解説が行われている。

 5月11日に筆者に届いたドイツのメディア“SIEGEL ONLINE”(国際版)(開く前にプライバシーポリシーを承認すること)を読んでみると、ドイツらしいロジカルかつ辛口の記事が目に留まったので紹介する。Google自体話題性の多い企業であること(米国型企業戦略でもある)は言うまでもないが、“SPIGEL”が比較において使用した項目は単にわが国等関係者が従来指摘している以上に重要な視点が含まれているという判断から専門外ではあるが、あえてとりあげるものである。
 なお、“SPIGEL”の記事では10項目に分けて比較等を行っているが、そのうち主要な7項目のみ取り上げる。

1.“WolframAlpha”の開発者の本当の開発目的は何か
 米国の理論物理学者兼実業家Stephen Wolfram  (筆者注2)が開発した検索エンジン“WolframAlpha”は、“ Google の 殺し屋”ではない。また検索エンジン機能だけでもない。「コンピュータ自身による知識エンジン(computational knowledge engine)」すなわち彼自身が自ら主張する「コンピュータの使用とウェブのための新しい理論的枠組み(a new paradigm for the use of computers and the Web)」である。その最終的な目標はコンピュータの先駆者が1950年代に指摘した約束(コンピュータ自身が質問し答えを出させる)の達成である。彼は数学パッケージソフトウェア“Mathematica”を開発した。同ソフトは、統計学者、科学者や数学者が課すあらゆる数学上の普遍的問題解決ツールである。同プログラムは膨大な処理能力を必要とするため、いくつかのコンピュータ雑誌がPCの容量と能力をテストするのに利用するほどである。

Stephen Wolfram 氏

 “WolframAlpha”の「回答マシン」は理論上“Google”と同じかまたはより以上のことをなしうるのか、SPEAGELは①選挙結果、②会社の売上高、③テレビの視聴率、④オリンピックのメダル数等をテストしてどのくらいの事柄を導き出せるか確認を行った。

2.政冶特に選挙に関する検索結果
 “presidential election 2008 results”と質問してみた。答は「あなたの入力内容が理解できません」であった。次に“presidential election”で検索してみたが、失敗であった。さらに“election”で検索した結果、最終的に説明がなされた。なお、“Government”で検索したところ、答は「この話題は調査中です」と言う不可解なメッセージが出た。一方、“Google”で最初の質問をしたとこころCNNの選挙の概要ページにリンクした。またGoogleは全米および州単位の選挙結果も直接リンクできた。
 “WolframAlpha”の残念な検索結果として、次のようなものが見られた。
①”Democratic Party?”・・・まだ記録されていません。
②“CDU”(ドイツの中道右派党のキリスト教民主同盟)・・・Camden Airport in Australiaが答であった(それも地元の現在の天気情報付)(筆者注3)
③“New York crime rate?”・・・結果がありません。
④“Mew York mayor?”・・・・知りません。一方、“Google” は市長Michael Bloombergの公式サイトにリンクする。
ドイツ語での質問に答がないという点を差し引いても米国の州や世界の国々の選挙結果やデータベースへのアクセスは必要であろう。さらに“WolframAlpha”の欠点は詳細な国のプロフィールや誰が現在の政治の指導者等について答えを持たない点である。

3.うかがわし統計データ
 “WolframAlpha”は、個別国について非常に詳しい情報が提供できる。例えば「ドイツ」で検索するとキロで表示される隣国との国境線の距離や10大都市(人口統計も含む)が引き出される。
 他方で疑わし統計の例もある。ドイツ語の文化圏に関する記述で次のような意味不明の記述がある。
①German 96% ②Upper Saxon(筆者注4) 2.6% ③Kölsh 0.31% ④Polish 0.31%
パーセントはなにを意味するのか、相互の関連について説明がない。また、ポーランド語はドイツの方言なのか。
 一方、“Google” で“Germany”を入力すると最初にWikipediaの記事にリンクする。
“WolframAlpha”の特徴的な点は、同時に2,3の異なる国を探せる能力である。「米国対中国」「米国対中国対ドイツ対ロシア」と入力すると独自に複数国間に関連するすべての有効データを独自につくりあげた結果ページを提供する。閲覧者は一目でどの国の失業率が最も高いか、市民の平均寿命が最も低いか等を知ることができる。“Google”にはそれに匹敵するものはない。
 さらに“WolframAlpha”は同様な方法で複数の都市を比較する。ハンブルグとサンフランシスコを入力すると単に人口統計の比較だけでなく、両都市間の飛行時間や現地時間の時差等を説明する。

4.“WolframAlpha”のとりわけ得意分野(経済比較、ただし情報源は疑問)
 明確に定義された変数の比較に関して、“WolframAlpha”は輝いて見える。「ノキアとモトローラ」の入力により収益や従業員数の比較が直接できる。“Google”で同じことを行ってみる。最初の答は2006年のブログで「誰がボスですか」である。
 “WolframAlpha”は様々な米国の新聞の循環統計(circulation statistics)を比較してみることは可能である。米国資本の日刊紙「ニューヨーク・ヨークタイムズ」「ウォールストリートジャーナル」「ワシントンポスト」「ロスアンゼルスタイムズ」等の比較データを見る限り最も低いランクといえる。時間枠のなかでの正確な情報がなくなっており、ジャ―ナリステックや科学的目的から見ると無用な内容である。また個々の刊行物に示された循環統計を表示することができるが、役にたつ時間的要素が放置されている。
 同様の比較に関しテレビチャンネルの視聴率の比較はできない。“CNN VS CBS(TV)”で検索してみた。“CNN”は英国の不動産会社“Caledonian Trust”とされた。
 経済問題についてさらに検索してみた。“Germany import value vs export value”と入力すると実際2つの結果が出て来た。しかし、輸出額は2007年推定値であり輸入の額は添付されていない。ちなみに米国の同様のデータを検索したが同じ結果であった。

5.コンピュータの比較結果(Macsは潤滑油(Lubricans)?)
 インターネットと技術に関する質問で“Google”と “WolframAlpha”の相違点がより明らかになる。
“ WolframAlpha”で“Microsoft”と“Google”と入力すると両社の財務データの詳細を回答するとともに市場業績(market performance)を追跡する。“Google”の検索メカニズムは直接自社のホームページに質問を向ける。
 “Google”のPC市場おけるMacsの割合やアップル・コンピュータの販売台数の検索結果はテレビコマーシャルや顧客調査を含む娯楽面等の圧倒的豊富さを述べた。一方、“WolframAlpha”ではこれらについての確定的な情報が得られないし、さらに“Macs”について技術潤滑油の1タイプである「増殖アルキレート・シクロペタン(multiply alkylated cyclopetemtences)」の略語として、その要素に関する物理的データを提供するのである。この答自身は正しいが、質問に対する答としては誤りである。
 しかしながら、コンピュータ装置に関する”Bits”“Bytes”“Mebibytes”“Gibibytes”について、“WolframAlpha”はトップページにある。“Google”はまずWikipediaの記事をリストあげて各単位の要約にリンクしていく。

6.科学(アスピリンに関するすべて)
 “WolframAlpha”は科学的質問にはあざやかにかつ時間をかけずに答える。水の屈折率(refractive index:光学特性 )について正しい数値(1.333)を選択する。一方、“Google”は同じ用語について78万1,000以上のウェブサイトにリンクする。従って“Google”の場合は屈折率の要素の検索にあたり冒頭でユーザーは「水に関する数値」を求めていることを明確化する必要がある。水の濃度に関する検索について同様の表が表示される。“WolframAlpha”は数値(numerical value)だけでなく他のユニット-人体の水の濃度や相関図(phase diagram)と同様にいくつかの比較を踏まえ-のリストも提供する。この場合、“Google”はWikipediaを当てにしないが、最初の入力により英語の変換表に変わる。
 また、“WolframAlpha”のサイトは水の濃度だけでなくアンシュタインの有名な「質量・エネルギー等価方程式(Theory of mass-energy equivalence)e=mc²」も説明する。(筆者注5)
 しかし、一方で“WolframAlpha”にも問題がある。薬品“aspirin”で検索すると十分な長い説明の後に、分子構造の空間モデル(Spatial model of the molecular structure)について科学的、構造的な公式にもとづきよく説明されている。しかし、唯一の問題はこの説明は一体何のためであろうかと言う疑問である。
 “Google”は、Wikipediaにリンクするだけでなく薬品製品の公式サイトに直接リンクできる。

7.結論(デザインには強いがデータベースとしては弱い)
 デモにおいて“WolframAlpha”は非常に印象的な方法で情報を提供する。検索エンジンは更なる情報を作るためにデータの増殖することができる。例えば複数の国の簡単な入力から統計的な比較データを作ることができるが、これは現在の”Google”やその他の検索エンジンではできないことである。しかし、現行のベータ版はこの点をほとんど生かしきれていない。既存のデータベースに必要とするデータがあるときのみうまく行くのである。例えば、米国のテレビ局の視聴率について検索エンジン自体が正しく意味を理解していないのである。
  他方、“WolframAlp”は科学者に対し他の科学者のためのツールとなることが感じられる。実際、秘術面や科学に関する質問に対しすばらしい詳細な答が返ってくる。他方、前述したとおり政冶、経済や文化面の内容等多くの課題もあるが作成者は別の観点に重点を置いているようにも思える。
  いずれにせよ検索エンジンとして見た場合、“WolframAlp”は例えばドイツ語で入力された場合等なぜとんでもない答えを引き出してくるかについて説明ができないことは多くの点で課題でもある。非常によくできたソフトウェアではあるが、日常的に利用するものとしてはなお改善すべき方策があろう。
*******************************************************************************************

(筆者注1)ビジュアルかつ事業戦略面から紹介しているブログとしては、5月11日付“WIRED VISION”サイト(2011年1月 WIRED VISIONサイトはWIRED.JPに運営が移管された)や“Internet Watch”があげられよう。なお、偶然にも“WIRED VISION”のサイトで紹介されているStephen Wolfram氏が米国ハーバード大学バークマン・センターで行った専門家向け講演「Computational Knowledge Engine」の内容は面白い(YouTube でデモ・質疑応答を含む講演内容(1時間45分)を見ることが可)。筆者は同センターのプロジェクト“The Center for Citizen Media”のディスカッション・メンバーであるが、同氏のスピーチの件は知らなかった。

(筆者注2)Stephen Wolfram氏は、日本語版Wikipedeia等でも紹介されているとおり米国Wolfram Researchの創設者(CEO)でありかつ天才的な理論物理学者である。数学パッケージソフト“Mathematica”の開発を1986年に行っている。

(筆者注3) 筆者も自らGoogleで“CDU”を調べてみた。日本語のWikipediaの説明の少し後に“Christlich-Demokratische Union Deutschlands;CDU”のホームページが出てくる。

(筆者注4)“Upper Saxon”はドイツ語で北ザクセン語のことである。また“Kölsh”はケルン語である。

(筆者注5) SPEGELのサイトが引用しているアンシュタインの「質量・エネルギー保存則(E=mc²)」について関心の有る方はWikipediaで確認してほしい。


〔参照URL〕
http://www.spiegel.de/international/zeitgeist/0,1518,624065,00.html#ref=nlint

**************************************************************************************************
Copyright © 2006-2021 芦田勝(Masaru Ashida).All Rights Reserved.No reduction or republication without permission.

 


コメント

このブログの人気の投稿

米国連邦取引委員会(FTC)が健康製品に関する新しい拡大コンプライアンスガイダンスを発行

   2022年12月20日、米国連邦取引委員会(以下、FTCという)は、以前の 1998年のガイダンスである栄養補助食品:業界向け広告ガイド(全32頁) を改定および置き換える 健康製品等コンプライアンスガイダンス の発行を 発表 した。 Libbie Canter氏 Laura Kim氏  筆者の手元に Covington & Burling LLPの解説記事 が届いた。筆者はLibbie Canter氏、Laura Kim氏他である。日頃、わが国の各種メディア、SNS、 チラシ等健康製品に関する広告があふれている一方で、わが国の広告規制は一体どうなっているかと疑うことが多い。  FTCの対応は、時宜を得たものであり、取り急ぎ補足を加え、 解説記事 を仮訳して紹介するものである。 1.改定健康製品コンプライアンスガイダンスの意義  FTCは、ガイドの基本的な内容はほとんど変更されていないと述べているが、このガイダンスは、以前のガイダンスの範囲につき栄養補助食品を超えて拡大し、食品、市販薬、デバイス、健康アプリ、診断テストなど、すべての健康関連製品に関する主張を広く含めている。今回改定されたガイダンスでは、1998年以降にFTCが提起した多数の法執行措置から引き出された「主要なコンプライアンス・ポイント」を強調し、① 広告側の主張の解釈、②立証 、 その他の広告問題 などのトピックに関連する関連する例について具体的に説明している。 (1) 広告側の主張の特定と広告の意味の解釈  改定されたガイダンスでは、まず、広告主の明示的主張と黙示的主張の違いを含め、主張の識別方法と解釈方法について説明する。改定ガイダンスでは、広告の言い回しとコンテキストが、製品が病気の治療に有益であることを暗示する可能性があることを強調しており、広告に病気への明示的な言及が含まれていない場合でも、広告主は有能で信頼できる科学的証拠で暗黙の主張を立証できる必要がある。  さらに、改定されたガイダンスでは、広告主が適格な情報を開示することが予想される場合の例が示されている(商品が人口のごく一部をターゲットにしている場合や、潜在的に深刻なリスクが含まれている場合など)。  欺瞞やだましを避けるために適格な情報が必要な場合、改定されたガイダンスには、その適格...

ウクライナ共同捜査チームの国家当局が米国司法省との了解覚書(MoU)に署名:このMoU は、JIT 加盟国と米国の間のそれぞれの調査と起訴における調整を正式化、促進させる

  欧州司法協力機構(Eurojust) がウクライナを支援する共同捜査チーム (Ukraine joint investigation team : JIT) に参加している 7 か国の国家当局は、ウクライナで犯された疑いのある中核的な国際犯罪について、米国司法省との間で了解覚書 (以下、MoU) に署名した。この MoU は、ウクライナでの戦争に関連するそれぞれの調査において、JIT パートナー国と米国当局との間の調整を強化する。  このMoU は 3 月 3 日(金)に、7 つの JIT パートナー国の検察当局のハイレベル代表者と米国連邦司法長官メリック B. ガーランド(Merrick B. Garland)によって署名された。  筆者は 2022年9月23日のブログ 「ロシア連邦のウクライナ軍事進攻にかかる各国の制裁の内容、国際機関やEU機関の取組等から見た有効性を検証する!(その3完)」の中で国際刑事裁判所 (ICC)の主任検察官、Karim A.A. Khan QC氏 の声明内容等を紹介した。  以下で Eurojustのリリース文 を補足しながら仮訳する。 President Volodymyr Zelenskiy and ICC Prosecutor Karim A. A. Khan QC(ロイター通信から引用) 1.ウクライナでのJITメンバーと米国が覚書に署名  (ウクライナ)のICC検事総長室内の模様;MoU署名時   中央が米国ガーランド司法長官、右手がICCの主任検察官、Karim A.A. Khan QC氏  MoUの調印について、 Eurojust のラディスラフ・ハムラン(Ladislav Hamran)執行委員会・委員長 は次のように述べている。我々は野心のために団結する一方で、努力においても協調する必要がある。それこそまさに、この覚書が私たちの達成に役立つものである。JIT パートナー国と米国は、協力の恩恵を十分に享受するために、Eurojustの継続的な支援に頼ることができる。  米国司法長官のメリック B. ガーランド(Merrick B. Garland)氏は「米国が 7 つの JIT メンバー国全員と覚書に署名する最初の国になることを嬉しく思う。この歴史的な了解覚書は...

米大統領令(EO: Executive Order 14110)の具体的内容と意義およびそれに基づく責任の履行を支援するためNIST「情報提供依頼文書 」の具体的内容

   筆者は、12月6日の本ブログで2023年10月30日の大統領令(EO: Executive Order 14110)(以下、「EO」という)を受けたNISTの具体的行動につき 「 NISTからこのほど公開された「 NIST SP 800-226 草案」および「差分プライバシー保証を評価するためのガイドライン草案」に対するパブリックコメントの背景と意義」 を取り上げた。  しかし、執筆後もいまいち大統領令(EO)のファクトシートも含め真の目的や商務省の規則案のとりまとめ期限など疑問点が残されていた。その内容を補完する意味で今回のブログで補筆するとともに、後段でNISTが2024年2月2日を期限として発布した「情報提供依頼文書 (Request for Information (RFI) )」の概要について解説を試みる。  また、本ブログでは、わが国では詳しく論じられていない米国「国防生産法(Defense Production Act of 1950 :DPA)」の意義と最新動向にも言及した。  なお、今回のブログの内容は12月6日の筆者ブログと重複する部分が一部あるが、 Kilpatrick Townsend & Stockton LLPの和文解説 と併せ読まれたい。 Ⅰ.大統領令 (EO: 14110) の具体的内容の解析    JD Supra, LLCの 「The highly-anticipated US Executive Order on artificial intelligence: Setting the agenda for responsible AI innovation」 を要約しつつ仮訳する。  このEOは、多くの点で AI に関するこれまでのバイデン政権の行動を超えている。 この広範囲かつ堅牢な大統領令は、AI を規制するために既存の当局を利用することを想定して、米国の行政部門および政府機関 (機関) に、①標準、②フレームワーク、③ガイドライン、④最善実践内容を開発するよう指示した (また、独立機関にも同様に奨励する)。 また政府機関は、AI の責任ある使用に関係するほぼすべての連邦法、規則、政策に対して具体的な措置を講じる必要があるとする。  EOは、AI の使用から得られる利点を認識する一方で、国家...