« 「2ちゃんねるの時代は終わった」 | トップページ | 今年のベスト・ウェブログ »

2004.12.30

グーグルの本の全文検索

 10月初めのフランクフルトのブックフェアで、米グーグルは本の全文横断検索「グーグル・プリント」を紹介し、検索対象の本を送ってくれるように出版社に呼びかけた。グーグルはいまのところ正式なプレスリリースは出さず、表向きはあくまでも出版社への呼びかけの段階ということのようだが、以前とは見違えるような検索結果画面になっている。

 昨年10月、米アマゾン・コムが「サーチ・インサイド・ザ・ブック」と名づけた本の全文横断検索を始めたとき、グーグルはその動きに乗り遅れまいとするかのようにテスト版をスタートさせた。たしかに検索表示はされたものの、該当個所前後の文章がとりあえず出てくるといったものでしかなかった。一方のアマゾンのほうは本のレイアウトそのまま該当部分を次々と表示していくことができ、比較にならない出来映えだった。
 米グーグルのサイトの通常の検索ウィンドウで、「books about shakespeare」などと入力すると、ヒットした本のタイトル、著者名、総ページ数が検索結果画面のトップに表示される。そのリンクをクリックすれば、本のページ・レイアウトの形で検索語がハイライト表示されて現れる。カバー写真や書誌情報、目次、索引なども見ることができ、その本内のキーワード検索はもちろん、書評や関連ページの検索などもできる。その本が買えるいくつものオンライン書店へのリンクもあって、各書店の該当の本のページに飛んで購入できる。アマゾン・コムにもリンクされているので同サイトと共存するサービスのようにも見えるが、ほかのオンライン書店にも本の全文横断検索のメリットを提供することになるわけで、アマゾンにはありがたくはないグーグルの検索だろう。
 アマゾン同様、グーグルは出版社が提供した本をスキャンしてデータベースを作成している。著作権保護のため利用者は印刷や画像のコピーはできず、該当個所の前後2ページのみ見ることができる。いずれは日本語も含めた多くの言語の本をあつかうとのことだが、さしあたりは英語の本だけが対象だ。いまのところ日本語のグーグル・サイトからの検索もできない。
 グーグルの全収入の98パーセント以上は広告だが、この検索でも、検索語に応じた広告が検索結果画面に表示される。競合相手のものなどを拒否することはできるが、広告を表示しないようにはできない。広告のリンクがクリックされた場合の広告収入は、比率は明らかにされていないが、出版社にも一定の割合で渡される決まりである。
 グーグルは、ニュースに絞った検索「グーグル・ニュース」をすでに始めており、9月には日本語版もスタートさせている。グーグルは、メディア企業によって提供されている完成度の高い情報に絞った検索の需要を感じているようだ。
「グーグル・プリント」のサイトは、冒頭に次のよう書いている。

「グーグルの使命は、世界の情報を組織化し、広くアクセス・利用できるようにすることだ。世界の多くの情報はまだネット上にはない。われわれはオンライン化の手助けをする。『グーグル・プリント』は本の中身をもっとも簡単に見つけられるところ、つまりグーグルの検索結果に置くことになる」

 グーグルの検索にとって、本とウェブ上のコンテンツはこのようにもはや違いがなくなってきたわけだが、米グーグルは、ウェブ上のデータとシームレスにコンピューター内を検索できる英語版ソフトの無料配布も10月に始めている。これは、マイクロソフトの次期OSの機能と競合するものだが、グーグルは、ネット内外の情報をできるだけ多く一貫した検索システムでアクセス可能にしようとしている。
「グーグル・プリント」もいまは紙の本だけが対象だが、いずれはPDFファイルなどの電子テキストも検索できるようにするという。現在でも通常のグーグルの検索でPDFのサーチはできる。わざわざこう言うのは電子書籍のことを意識しているからだろう。将来的にはウェブ上のコンテンツ、自分のコンピュータ内のデータ、紙の本、電子書籍を横断して検索できるようにするつもりだろう。
 狭い意味での「デジタル出版」とは制作過程などを含めて本を電子化することだが、それに劣らず重要な変化は、本も含めた文書が電子的ネットワークのなかに存在するようになることである。その場合は検索エンジンや人気のあるサイトからのリンクの数が情報の価値そのものを決めることになる。
「グーグル・ニュース」では個別記事に直接リンクが張られる。メディア・サイトが広告料を高く設定していたトップページを飛び越される。そのためメディア企業からの反発もあったが、検索対象になることでアクセス数が増加することがわかり、アメリカではしだいに受け入れられるようになってきた。本についても「ただ見」をされることに対する懸念はあるだろうが、売上げ増が証明されれば受け入れられていくだろう。

(出版ニュース 2004年11月下旬号)

« 「2ちゃんねるの時代は終わった」 | トップページ | 今年のベスト・ウェブログ »

グーグル」カテゴリの記事

デジタルと本」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/56597/2418911

この記事へのトラックバック一覧です: グーグルの本の全文検索:

« 「2ちゃんねるの時代は終わった」 | トップページ | 今年のベスト・ウェブログ »

2014年8月
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31