...

演習3-4 (1)Google の背景 Google は 1998 年に、スタンフォード大学

by user

on
Category: Documents
9

views

Report

Comments

Transcript

演習3-4 (1)Google の背景 Google は 1998 年に、スタンフォード大学
演習3-4
(1)Google の背景
Google は 1998 年に、スタンフォード大学博士課程の学生、ラリー ペイジと サーゲイ ブ
リンによって創設された。非公開企業である Google は、1999 年 6 月に 2500 万ドルの
資金を確保したことを発表した。 同社の出資パートナーには Kleine Perkins Caufield &
Byers および Sequioa Capital などがいる。
Google の役割は、世界中の情報を整理し、世界中の人々がアクセスできて使えるようにす
ることである。世界最大のサーチ エンジンの開発者である Google は、Web 上の情報を
最も速く簡単に、かつ効率よく検索する方法を提供している。40 億の Web ページにアク
セスすることにより、Google は世界中のユーザーに約 1/2 秒以内に有効な検索結果を届
けている。
これからのグーグルの役割としては、世界1位のシェアをほこるサーチエンジンとして、
今後もっと増えるであろうインターネットにおける情報の整理、ユーザー一人一人に最も
ほしい情報を提供できるようにすることが望ましい
Yahoo
1994 年、スタンフォード大学のジェリー・ヤンとデビッド・ファイロによってウェブディ
レクトリとして始められた。1995 年 4 月、ヤフー・コーポレーションが設立し、Yahoo!サ
ービスを開始した。また、急成長を見せる日本のインターネット利用者に同等のサービス
を提供すべく、1996 年 1 月、ヤフー・コーポレーションは日本のソフトバンク株式会社と
共同でヤフー株式会社を設立した。
ヤフーの役割は世界中の何千もの情報の処理を行い、それをユーザーに提供することであ
る。
(2)ディレクトリサービスとサーチエンジンを比較するために、「感性工学」「ヒューマ
ンインターフェイス」「マルチメディア」「画像処理」という4単語を両者で検索し比較し
た。検索の条件は以下のとおりである。
・検索ボックスに入力したキーワードをすべて含む
・ページの最終更新日は指定なし
・すべてのドメインが対象
・すべてのファイル形式が対象
・表記のゆれを含める
・すべての国が対象
・すべての言語が対象
●ディレクトリサービスの場合●
ディレクトリサービスとして Yahoo! JAPAN を利用した。検索ボックスに「感性工学
ューマンインターフェイス
マルチメディア
ヒ
画像処理」と入力し検索したところ、68
件ヒットし0.63秒かかった。
●サーチエンジンの場合●
サーチエンジンとして Google Japan を利用した。Yahoo と同様に検索ボックスに「感性
工学
ヒューマンインターフェイス
マルチメディア
画像処理」と入力し検索したとこ
ろ、5470件ヒットし0.69秒かかった。
結果から、google はより多くの情報を処理しているという点で yahoo より有利であるとい
える。
演習3-4A
ディレクトリサーチエンジンとは、Web サイトのリンクを大量に集め、分野別に分類
したリスト。分野は階層構造になっており、その分野に属する Web サイトのタイト
ル、URL、概要などの一覧を得ることができる。Web サイトの電話帳のようなもの。
例えば、excite の場合クロスレスティングというディクトリを使っています。クロ
スリスティングとは、複数のディレクトリ型検索エンジンに代理登録を行ってくれ
るサービス、
「クロスレコメンド」を行っているエンジンです。
演習3-5
逆引索引は関連ページや、リンクページを調べることができます。この機能を活用
してインターネット上で自分のほしい情報を検索できる逆引き検索辞書も存在しま
す。
逆引きでは注目しているページを参照しているページを検索できます。これにより
何かを調べているときに、そのページと何かしら関連があるページが検索されるの
で、補足やその情報や論文の参照ページが得られる。
A ということを検索して B という結果が得られたときに、B から A を参照することもあ
るしゅの逆引きであると考えられる。
演習3-6A
現在、サーチエンジン各社は、お互いの性質を競うため、インターネット上を巡回するの
に要する時間を短縮するアルゴリズムの開発、検索したページの順位付けアルゴリズムの
開発などに努力を払っている。特に、「検索したページの順位付けアルゴリズム」で他社と
の違いを追及しているため、利用者側にとっては、思わぬ落とし穴が生じている。
実際にいくつかのキーワードによる検索結果を比較してみると、ある検索結果では上位に
ランキングされているものが、別の検索サービスでは、ずっと下位になるケースが少なく
ない。
今回は、Yahoo!と Google の2社のサーチエンジンを比べ、このことを確かめてみる。
では、実際に「卵かけご飯」というキーワードで検索してみる。すると、2社とも最上位
に Wikipedia の「卵かけご飯」での検索結果のページが現れる。しかし、それ以下のサイ
トはほとんどバラバラであった。この違いはどのようにして現れるのであろうか。
その疑問を確かめるために、上にページに実際にアクセスしてみる。すると、各サイトに
スポンサー(広告主)リンクが平均して1~2社存在していることがわかった。また、上
位のサイトほど、そのリンク数が多い傾向が見られた。
つまり、大量リンクを獲得した企業サイトが検索結果の上位に表示されるのである。この
ようなことでは、例え個人がどんなに使いやすい、優良なサイトを作成したとしても、上
位に表示されることは難しいであろう。
これは、公平性に問題があるのではないだろうか?
演習3-7
日本→南アフリカのヨハネスブルグ行きの飛行機のチケットと
ヨハネスブルグでの安全なホテルと、その価格を知りたい
・google の検索エンジン
を利用
・「ヨハネスブルグ
飛行機」
・「ヨハネスブルグ
ホテル
「ヨハネスブルグ
ホテル
安全」
で検索
安全」である程度の情報が掲載されているページが出てきた
ので、あるページで紹介されている情報から具体的なホテル名などの情報を得て、ホテル
の HP やホテルを比較紹介している HP を探す。ホテルを探す際は「ヨハネスブルグ
ホ
テル」で十分だろう。
もしくは「ヨハネスブルグ
安全なホテル」で検索する。
・「安全」の情報に関するページと「ホテル」の情報に関するページが分かれていて、
なかなか両方の情報を組み込んだページが探しにくかった。
ここでの「ヨハネスブルグ
ホテル
安全」というキーワードで、自分の含意する、
安全なホテルについての情報を上位にもってきてくれるような支援があればよいと思った。
つまり、キーワードの組み合わせで、そのワードを含んでいるだけのページを表示するだ
けでなく、その組み合わせや並びからおおよその考えを読み取ってくれて、その上での有
益な検索情報を上位にもってくるような検索支援が欲しいと感じた。
・およそ10分
JAL の HP へ飛び、運賃検索からヨハネスブルグを選択
成田からヒースロー経由でヨハネスブルグへ、往復60万円
比較的安全なサントン地区にある5つ星Michelangeloの最安料金の部屋で、14061 円
Fly UP