日本でも図書館の全蔵書のデジタル化は始まるか?
グーグルの新しいプロジェクトについて友人の編集者と議論した。以前書いたように、グーグルは、英米の大きな大学の図書館の蔵書延べ1500万冊以上をスキャンして電子化する。利用者はネットで検索して著作権の切れたものは全文を、著作権のあるものは出版社が認めた本は該当個所の前後2ページ、そうでないものは数行を1冊につき3個所まで表示する。課金して全文アクセスすることもできるようになるだろうから、これで本のデジタル時代が一挙に幕を開けるのではないかと、先月、私はいささか興奮気味で原稿を書いた。しかし、議論をした友人は、本のデジタル化について詳しくまた理解もあるのだが、「これまで何度も失敗してきた電子書籍のプロジェクトと変わらない。少なくとも日本でうまく行かない理由を10や20は上げられる」と言う。そう感じる人も多いと思うので、今回ももう少しこの事業について書いてみたい。
彼の主張は多岐にわたるが、日本語の文字認識の精度は英語よりもかなり落ちるというのが第一点だった。たしかにそうなのだが、どのぐらいのレベルの精度 にするかは一考してみるべきだろう。全蔵書のデジタル化を発表したミシガン大学はこれまでもデジタル化に積極的だったが、1パーセント以下の誤植だと「か なり正確」と感じられるとのことでそのレベルに目標を設定した。文字認識ソフトには作業の正確度を自己判定するものもあり、それを使って、人のチェックが 必要なものをはじきだして効率的に作業をやってきたそうだ。日本語の本についてもこうやって仕分けして作業スピードをあげ、誤植の少ない電子化をすること は可能だろう。
次に彼が言ったのは、「出版社にとってメリットがない」ということだった。これまでにも「絶版本や品切れの本など出版社が死蔵するタイトルを復活させ る」という名目で電子書籍化されてきたが、市場は立ち上がらず、出版社は利益が出なかったし、そのうえネットで検索されて読まれてしまえば本が売れなくな る可能性もあるという。
この意見は、一見もっともだが、利用者からはまったく違ったふうに見えると私は反論した。利用者からすれば、本の全文を横断検索して、著作権のない大量 の本は無料で全文、それ以外は、本の目次やタイトル、探しているテーマに関する抜粋を読むことができる。その場で本を注文し、デジタル・データも購入でき るようになれば読者のメリットは大きい。現在の電子書籍のように、デジタル著作物の長所である検索の機能をさして活かすこともなく、少ない品ぞろえのなか から短い紹介などで判断して購入しなければならない状況とは一変する。
米アマゾン・コムの全文検索機能についてアメリカの著作者団体がすでにクレームをつけたように、辞事典や料理の本などページをまるごと見られてしまった ら打撃を受ける本もあるだろう。そうした本については出版社が検索表示を断わればいい。しかし、総じて言えば「読まれてしまったら売れない」というのは、 「立ち読みさせなければ本がもっと売れる」と言っているのと同じだろう。コミックスなどは実際にラップして立ち読みできないようにしているが、それ以外の ほとんどの本はしていない。それは、本のビジネスにかかわる大多数の人間が、「立ち読みさせなければ本がもっと売れる」とは考えないからだ。本は手にとっ て読ませて売るもの、というのがこれまでの本のビジネスだったし、デジタルの時代になっても(どのように「立ち読み」させるかは考えるとしても)基本的に は同じだろう。中身がわからなくても売れる本は限られている。
「デジタル本はやっぱりいやだ。時間がかかっても紙の本を注文する」と考えるかどうかは利用者がそれぞれ決めればいいし、「この本については見せてしまう と売れなくなるからそうしない」と考えるかどうかも出版社や著者がそれぞれ決めればいい。ただ、グーグルのプロジェクトによって出版社は、電子化するかど うかを尋ねられるのではなくて、すでにある電子データをどう表示するかについて選択を求められることになる。内容がわからない表示のほうがいいと考える出 版社は実際のところかなり少ないのではないか。このようにして本の全面的なデジタル流通が始まる寸前にまで強くプッシュされるところが、グーグルの始めた このプロジェクトの驚くべき点である。
グーグルがほんとうに日本語の本についても始めるのか、始めるとしてそれが何年後のことか現時点ではわからないが、蔵書をデジタル化したい大学の図書館 は日本でも多いはずだし、その作業を無償でやってくれるとなればまたとない機会と考えるところも出てくるだろう。前回書いたように、700万冊の蔵書の電 子化を発表したミシガン大学は6年で終了させる予定と言っている。英語の本について目処がつけば、重視している日本語の市場についてグーグルが放っておく ことは考えられない。日本語の本の電子化作業が始まるのは思いのほか早いかもしれない。
(「出版ニュース」2005年2月号)
| 固定リンク
|
「グーグル」カテゴリの記事
- 「新聞崩壊」を懸念するグーグル(2009.11.01)
- グーグルの未来を握るネットのオープンアクセス(2009.08.23)
- グーグルが電話会社の仕事を奪うとき(2009.08.20)
- グーグルの次の手は無料のネット接続?(2009.08.17)
- グーグルの黒船がやってきて、日本語の壁が壊れ始めた(2009.03.16)
「デジタルと本」カテゴリの記事
- 国会図書館による有料配信決定の記事は誤報のよう(2009.08.07)
- まぼろしの有料配信(2009.08.17)
- グーグルの黒船がやってきて、日本語の壁が壊れ始めた(2009.03.16)
- グーグルの新たなビジネス――グーグルは「広告会社」を脱皮する?(2009.02.02)
- グーグルと米出版社協会、結局勝ったのはどちら?(2009.01.26)








コメント