スキップしてメイン コンテンツに移動

注目の新検索エンジン“WolframAlpha”データ版の客観的評価について

  

Last Updated : March 5,2021

 最近わが国のブログで紹介され始めた話題 (筆者注1)で、5月18日にサービス開始する“WolframAlpha”と“Google” はどちらが検索エンジンとして機能面等で優れているか、また“Google”の世界戦略はどのような影響を受けるのかといった問題につき各方面から解説が行われている。

 5月11日に筆者に届いたドイツのメディア“SIEGEL ONLINE”(国際版)(開く前にプライバシーポリシーを承認すること)を読んでみると、ドイツらしいロジカルかつ辛口の記事が目に留まったので紹介する。Google自体話題性の多い企業であること(米国型企業戦略でもある)は言うまでもないが、“SPIGEL”が比較において使用した項目は単にわが国等関係者が従来指摘している以上に重要な視点が含まれているという判断から専門外ではあるが、あえてとりあげるものである。
 なお、“SPIGEL”の記事では10項目に分けて比較等を行っているが、そのうち主要な7項目のみ取り上げる。

1.“WolframAlpha”の開発者の本当の開発目的は何か
 米国の理論物理学者兼実業家Stephen Wolfram  (筆者注2)が開発した検索エンジン“WolframAlpha”は、“ Google の 殺し屋”ではない。また検索エンジン機能だけでもない。「コンピュータ自身による知識エンジン(computational knowledge engine)」すなわち彼自身が自ら主張する「コンピュータの使用とウェブのための新しい理論的枠組み(a new paradigm for the use of computers and the Web)」である。その最終的な目標はコンピュータの先駆者が1950年代に指摘した約束(コンピュータ自身が質問し答えを出させる)の達成である。彼は数学パッケージソフトウェア“Mathematica”を開発した。同ソフトは、統計学者、科学者や数学者が課すあらゆる数学上の普遍的問題解決ツールである。同プログラムは膨大な処理能力を必要とするため、いくつかのコンピュータ雑誌がPCの容量と能力をテストするのに利用するほどである。

Stephen Wolfram 氏

 “WolframAlpha”の「回答マシン」は理論上“Google”と同じかまたはより以上のことをなしうるのか、SPEAGELは①選挙結果、②会社の売上高、③テレビの視聴率、④オリンピックのメダル数等をテストしてどのくらいの事柄を導き出せるか確認を行った。

2.政冶特に選挙に関する検索結果
 “presidential election 2008 results”と質問してみた。答は「あなたの入力内容が理解できません」であった。次に“presidential election”で検索してみたが、失敗であった。さらに“election”で検索した結果、最終的に説明がなされた。なお、“Government”で検索したところ、答は「この話題は調査中です」と言う不可解なメッセージが出た。一方、“Google”で最初の質問をしたとこころCNNの選挙の概要ページにリンクした。またGoogleは全米および州単位の選挙結果も直接リンクできた。
 “WolframAlpha”の残念な検索結果として、次のようなものが見られた。
①”Democratic Party?”・・・まだ記録されていません。
②“CDU”(ドイツの中道右派党のキリスト教民主同盟)・・・Camden Airport in Australiaが答であった(それも地元の現在の天気情報付)(筆者注3)
③“New York crime rate?”・・・結果がありません。
④“Mew York mayor?”・・・・知りません。一方、“Google” は市長Michael Bloombergの公式サイトにリンクする。
ドイツ語での質問に答がないという点を差し引いても米国の州や世界の国々の選挙結果やデータベースへのアクセスは必要であろう。さらに“WolframAlpha”の欠点は詳細な国のプロフィールや誰が現在の政治の指導者等について答えを持たない点である。

3.うかがわし統計データ
 “WolframAlpha”は、個別国について非常に詳しい情報が提供できる。例えば「ドイツ」で検索するとキロで表示される隣国との国境線の距離や10大都市(人口統計も含む)が引き出される。
 他方で疑わし統計の例もある。ドイツ語の文化圏に関する記述で次のような意味不明の記述がある。
①German 96% ②Upper Saxon(筆者注4) 2.6% ③Kölsh 0.31% ④Polish 0.31%
パーセントはなにを意味するのか、相互の関連について説明がない。また、ポーランド語はドイツの方言なのか。
 一方、“Google” で“Germany”を入力すると最初にWikipediaの記事にリンクする。
“WolframAlpha”の特徴的な点は、同時に2,3の異なる国を探せる能力である。「米国対中国」「米国対中国対ドイツ対ロシア」と入力すると独自に複数国間に関連するすべての有効データを独自につくりあげた結果ページを提供する。閲覧者は一目でどの国の失業率が最も高いか、市民の平均寿命が最も低いか等を知ることができる。“Google”にはそれに匹敵するものはない。
 さらに“WolframAlpha”は同様な方法で複数の都市を比較する。ハンブルグとサンフランシスコを入力すると単に人口統計の比較だけでなく、両都市間の飛行時間や現地時間の時差等を説明する。

4.“WolframAlpha”のとりわけ得意分野(経済比較、ただし情報源は疑問)
 明確に定義された変数の比較に関して、“WolframAlpha”は輝いて見える。「ノキアとモトローラ」の入力により収益や従業員数の比較が直接できる。“Google”で同じことを行ってみる。最初の答は2006年のブログで「誰がボスですか」である。
 “WolframAlpha”は様々な米国の新聞の循環統計(circulation statistics)を比較してみることは可能である。米国資本の日刊紙「ニューヨーク・ヨークタイムズ」「ウォールストリートジャーナル」「ワシントンポスト」「ロスアンゼルスタイムズ」等の比較データを見る限り最も低いランクといえる。時間枠のなかでの正確な情報がなくなっており、ジャ―ナリステックや科学的目的から見ると無用な内容である。また個々の刊行物に示された循環統計を表示することができるが、役にたつ時間的要素が放置されている。
 同様の比較に関しテレビチャンネルの視聴率の比較はできない。“CNN VS CBS(TV)”で検索してみた。“CNN”は英国の不動産会社“Caledonian Trust”とされた。
 経済問題についてさらに検索してみた。“Germany import value vs export value”と入力すると実際2つの結果が出て来た。しかし、輸出額は2007年推定値であり輸入の額は添付されていない。ちなみに米国の同様のデータを検索したが同じ結果であった。

5.コンピュータの比較結果(Macsは潤滑油(Lubricans)?)
 インターネットと技術に関する質問で“Google”と “WolframAlpha”の相違点がより明らかになる。
“ WolframAlpha”で“Microsoft”と“Google”と入力すると両社の財務データの詳細を回答するとともに市場業績(market performance)を追跡する。“Google”の検索メカニズムは直接自社のホームページに質問を向ける。
 “Google”のPC市場おけるMacsの割合やアップル・コンピュータの販売台数の検索結果はテレビコマーシャルや顧客調査を含む娯楽面等の圧倒的豊富さを述べた。一方、“WolframAlpha”ではこれらについての確定的な情報が得られないし、さらに“Macs”について技術潤滑油の1タイプである「増殖アルキレート・シクロペタン(multiply alkylated cyclopetemtences)」の略語として、その要素に関する物理的データを提供するのである。この答自身は正しいが、質問に対する答としては誤りである。
 しかしながら、コンピュータ装置に関する”Bits”“Bytes”“Mebibytes”“Gibibytes”について、“WolframAlpha”はトップページにある。“Google”はまずWikipediaの記事をリストあげて各単位の要約にリンクしていく。

6.科学(アスピリンに関するすべて)
 “WolframAlpha”は科学的質問にはあざやかにかつ時間をかけずに答える。水の屈折率(refractive index:光学特性 )について正しい数値(1.333)を選択する。一方、“Google”は同じ用語について78万1,000以上のウェブサイトにリンクする。従って“Google”の場合は屈折率の要素の検索にあたり冒頭でユーザーは「水に関する数値」を求めていることを明確化する必要がある。水の濃度に関する検索について同様の表が表示される。“WolframAlpha”は数値(numerical value)だけでなく他のユニット-人体の水の濃度や相関図(phase diagram)と同様にいくつかの比較を踏まえ-のリストも提供する。この場合、“Google”はWikipediaを当てにしないが、最初の入力により英語の変換表に変わる。
 また、“WolframAlpha”のサイトは水の濃度だけでなくアンシュタインの有名な「質量・エネルギー等価方程式(Theory of mass-energy equivalence)e=mc²」も説明する。(筆者注5)
 しかし、一方で“WolframAlpha”にも問題がある。薬品“aspirin”で検索すると十分な長い説明の後に、分子構造の空間モデル(Spatial model of the molecular structure)について科学的、構造的な公式にもとづきよく説明されている。しかし、唯一の問題はこの説明は一体何のためであろうかと言う疑問である。
 “Google”は、Wikipediaにリンクするだけでなく薬品製品の公式サイトに直接リンクできる。

7.結論(デザインには強いがデータベースとしては弱い)
 デモにおいて“WolframAlpha”は非常に印象的な方法で情報を提供する。検索エンジンは更なる情報を作るためにデータの増殖することができる。例えば複数の国の簡単な入力から統計的な比較データを作ることができるが、これは現在の”Google”やその他の検索エンジンではできないことである。しかし、現行のベータ版はこの点をほとんど生かしきれていない。既存のデータベースに必要とするデータがあるときのみうまく行くのである。例えば、米国のテレビ局の視聴率について検索エンジン自体が正しく意味を理解していないのである。
  他方、“WolframAlp”は科学者に対し他の科学者のためのツールとなることが感じられる。実際、秘術面や科学に関する質問に対しすばらしい詳細な答が返ってくる。他方、前述したとおり政冶、経済や文化面の内容等多くの課題もあるが作成者は別の観点に重点を置いているようにも思える。
  いずれにせよ検索エンジンとして見た場合、“WolframAlp”は例えばドイツ語で入力された場合等なぜとんでもない答えを引き出してくるかについて説明ができないことは多くの点で課題でもある。非常によくできたソフトウェアではあるが、日常的に利用するものとしてはなお改善すべき方策があろう。
*******************************************************************************************

(筆者注1)ビジュアルかつ事業戦略面から紹介しているブログとしては、5月11日付“WIRED VISION”サイト(2011年1月 WIRED VISIONサイトはWIRED.JPに運営が移管された)や“Internet Watch”があげられよう。なお、偶然にも“WIRED VISION”のサイトで紹介されているStephen Wolfram氏が米国ハーバード大学バークマン・センターで行った専門家向け講演「Computational Knowledge Engine」の内容は面白い(YouTube でデモ・質疑応答を含む講演内容(1時間45分)を見ることが可)。筆者は同センターのプロジェクト“The Center for Citizen Media”のディスカッション・メンバーであるが、同氏のスピーチの件は知らなかった。

(筆者注2)Stephen Wolfram氏は、日本語版Wikipedeia等でも紹介されているとおり米国Wolfram Researchの創設者(CEO)でありかつ天才的な理論物理学者である。数学パッケージソフト“Mathematica”の開発を1986年に行っている。

(筆者注3) 筆者も自らGoogleで“CDU”を調べてみた。日本語のWikipediaの説明の少し後に“Christlich-Demokratische Union Deutschlands;CDU”のホームページが出てくる。

(筆者注4)“Upper Saxon”はドイツ語で北ザクセン語のことである。また“Kölsh”はケルン語である。

(筆者注5) SPEGELのサイトが引用しているアンシュタインの「質量・エネルギー保存則(E=mc²)」について関心の有る方はWikipediaで確認してほしい。


〔参照URL〕
http://www.spiegel.de/international/zeitgeist/0,1518,624065,00.html#ref=nlint

**************************************************************************************************
Copyright © 2006-2021 芦田勝(Masaru Ashida).All Rights Reserved.No reduction or republication without permission.

 


コメント

このブログの人気の投稿

米大統領令(EO: Executive Order 14110)の具体的内容と意義およびそれに基づく責任の履行を支援するためNIST「情報提供依頼文書 」の具体的内容

   筆者は、12月6日の本ブログで2023年10月30日の大統領令(EO: Executive Order 14110)(以下、「EO」という)を受けたNISTの具体的行動につき 「 NISTからこのほど公開された「 NIST SP 800-226 草案」および「差分プライバシー保証を評価するためのガイドライン草案」に対するパブリックコメントの背景と意義」 を取り上げた。  しかし、執筆後もいまいち大統領令(EO)のファクトシートも含め真の目的や商務省の規則案のとりまとめ期限など疑問点が残されていた。その内容を補完する意味で今回のブログで補筆するとともに、後段でNISTが2024年2月2日を期限として発布した「情報提供依頼文書 (Request for Information (RFI) )」の概要について解説を試みる。  また、本ブログでは、わが国では詳しく論じられていない米国「国防生産法(Defense Production Act of 1950 :DPA)」の意義と最新動向にも言及した。  なお、今回のブログの内容は12月6日の筆者ブログと重複する部分が一部あるが、 Kilpatrick Townsend & Stockton LLPの和文解説 と併せ読まれたい。 Ⅰ.大統領令 (EO: 14110) の具体的内容の解析    JD Supra, LLCの 「The highly-anticipated US Executive Order on artificial intelligence: Setting the agenda for responsible AI innovation」 を要約しつつ仮訳する。  このEOは、多くの点で AI に関するこれまでのバイデン政権の行動を超えている。 この広範囲かつ堅牢な大統領令は、AI を規制するために既存の当局を利用することを想定して、米国の行政部門および政府機関 (機関) に、①標準、②フレームワーク、③ガイドライン、④最善実践内容を開発するよう指示した (また、独立機関にも同様に奨励する)。 また政府機関は、AI の責任ある使用に関係するほぼすべての連邦法、規則、政策に対して具体的な措置を講じる必要があるとする。  EOは、AI の使用から得られる利点を認識する一方で、国家...

米国CFTCがオハイオ州の男性とその所有企業をデジタル資産取引スキームにおける1200万ドル(約16億214万円)以上の不正勧誘と不正流用を理由に民事起訴

     米国の 商品先物取引委員会(CFTC) は8月12日、オハイオ州ニューオルバニー市住の ラスナキショア・ギリ(Rathnakishore Giri) と彼が所有するオハイオ州に本拠を置く NBD Eidetic Capital, LLC および SR Private Equity, LLC に対して、オハイオ州南部地区連邦地方裁判所に 民事法執行訴訟 を起こしたと 発表 した。   同訴状 は、ギリと彼の会社が150人以上の顧客から1200万ドル以上と少なくとも10ビットコインを不正に勧誘し、またギリと彼の会社がデジタル資産取引を目的とした顧客資金を不正に流用したと主張している。  さらに訴状は、ギリの両親であるギリ・スブラマニ(Giri Subramani)とロカ・パヴァニ・ギリ(Loka Pavani Giri)を、正当な利害関係のない資金を所有している 救済被告 (注1) として起訴している。  今回のブログは、(1)本起訴の詳細、(2)CFTC/SECの投資家アラート:ビットコイン先物における資金取引の注意喚起の概要について概観する。 1. 起訴の内容  CFTCは、その継続的な訴訟において、詐欺被害にあった顧客への補償(restitution)、不正に得た利益の返還(disgorgement of ill-gotten gains)、民事上の金銭的罰則(civil monetary penalties)、恒久的な取引および登録禁止(permanent trading and registration bans)、および 「商品取引法(Commodity Exchange Act :CEA)」 および 「CFTC規則(CFTC regulations)」 のさらなる違反に対する永久的差止命令(permanent injunction)を求めている。 2.本事件の背景  訴状は、2019年3月頃から現在まで、被告が運営しているとされるさまざまなデジタル資産投資ファンドに投資するために、少なくとも150人の顧客から1200万ドル以上と10ビットコイン以上を勧誘し、受け入れた詐欺的なスキームに関与したと訴えている。同訴状によると、被告は顧客への勧誘において、利益の保証やギリのデジタル資産トレーダーとしての成功話など、多数の虚偽で誤解を招くような声...

英国の Identity Cards Bill(国民ID カード法案)が可決成立、玉虫色の決着

  2005年5月に英国議会に上程され、英国やEU加盟国内の人権保護団体やロンドン大学等において議論を呼んでいた標記法案 (筆者注1) が上院(貴族院)、下院(庶民院) で3月29日に承認され、国王の裁可(Royal Assent)により成立した。  2010年1月以前は国民IDカードの購入は義務化されないものの、英国のパスポートの申込者は自動的に指紋や虹彩など生体認証情報 (筆者注2) を含む国民ID登録が義務化されるという玉虫色の内容で、かつ法律としての明確性を欠く面やロンドン大学等が指摘した開発・運用コストが不明確等という点もあり、今後も多くの論評が寄せられると思われるが、速報的に紹介する。 (筆者注3) 1.IDカード購入の「オプト・アウト権」  上院・下院での修正意見に基づき盛り込まれたものである。上院では5回の修正が行われ、その1つの妥協点がこのオプショナルなカード購入義務である。すなわち、法案第11編にあるとおりIDカードとパスポートの情報の連携を通じた「国民報管理方式」はすでに定められているのであるが、修正案では17歳以上の国民において2010年1月(英国の総選挙で労働党政権の存続確定時)まではパスポートの申込み時のIDカードの同時購入は任意となった。 2.2010年1月以降のカード購入の義務化  約93ポンド (筆者注4) でIDカードの購入が義務化される。また、2008年からは、オプト・アウト権の行使の有無にかかわりなく、パスポートのIC Chip (筆者注5) に格納され生体認証情報は政府の登録情報データベース (筆者注6) にも登録されることになる。 ******************************************************: (筆者注1) 最終法案の内容は、次のURLを参照。 http://www.publications.parliament.uk/pa/ld200506/ldbills/071/2006071.pdf (筆者注2) 生体認証の指紋や虹彩については、法案のスケジュール(scheduleとは,英連邦の国の法律ではごく一般的なもので、法律の一部をなす。法本文の規定を受け,それをさらに細かく規定したものである。付属規定と訳されている例がある。わが国の法案で言う「別表」的なもの)...