クローラ作者の逮捕とエンジニアの不安――“librahack事件”まとめ

■ 「岡崎市立中央図書館事件」、通称“librahack事件”の経緯

事の発端となったのは、4月2日~15日にかけて愛知県在住の男性が、自身が作成したプログラムを用いて岡崎市立中央図書館のWebサイトに延べ3万3000回のアクセスを繰り返したこと。これによって、同サイトの一部サービスで閲覧障害が発生。4月15日、利用者からの苦情を憂慮した岡崎市立図書館が愛知県警に被害届を提出します。それを受けて5月25日、愛知県警は偽計業務妨害の疑いで男性を逮捕しました。

しかし、逮捕翌日にマスメディアでの一斉報道が始まってすぐ、ネット上ではWebに詳しいエンジニアを中心に疑問の声が上がります。

asahi.comの記事によれば、男性がこの図書館にアクセスを繰り返していたのは「1秒に1回程度」という決して多くない頻度。この時点では、システム障害を目的とした攻撃とは思えない数字であり、そもそもこの程度のアクセスでダウンする図書館側のサーバーに問題があるのではないかと推測されていました。とはいえ、当時は逮捕された事実を伝える報道以外の情報がほとんどなく、あまり話題にならなくなりました。

この事件が再びネットユーザーの注目を浴びることになったのは、約1ヶ月後、起訴猶予処分を受けて勾留を解かれた男性が、自ら事件の経緯を説明した「Librahack : 岡崎図書館事件まとめ」なるWebサイトを起ち上げてからのことです。

男性の説明によれば、彼が市立図書館Webサイトに連続アクセスを試みた動機は、同サイトの新着図書データが使いづらいことから、プログラムを用いてデータを引き出して、より使いやすい自分専用の新着図書サイトを作ろうとしたためだったとのこと。つまり、男性のプログラムによる連続アクセスは、図書館のサーバーをダウンさせるための「DoS攻撃」ではなく、Webサーバーなどからデータを取得する目的で一般的に利用される技術の「クロール」を使用したに過ぎないということでした。

そうであるとすれば、なぜ男性が逮捕され、20日間も勾留されることになったのか――。このWebサイト登場以後、ネット上ではこの「岡崎市立図書館事件」の議論が再び沸きあがりました。そして、男性が作ったサイトの名称「Librahack」にちなんで、本件は「librahack事件」と呼ばれることになり、愛知県警の捜査とは別に、Web技術に詳しいネットユーザーによって事件の経緯が調査されていくことになったのでした。

現在では逮捕から3ヶ月が経ち、ネットユーザーの熱心な調査や追及もあって、本件についてはかなり多くのことが分かってきているようです。その調査の時系列について知りたいという方には、上の二つのエントリーが参考になるでしょう。


■ 朝日新聞の取材が明らかにした関係者の見解

こうしたネットユーザーによる問題意識の高まりを受けて、8月21日に朝日新聞は本件について関係者へ取材した調査記事を出しました。

上のTwitterまとめは、本件を取材した朝日新聞記者が、取材で情報を得たお礼として、Twitterユーザーの質問に答えたもの。記事の最初の方に、朝日新聞の当該記事へリンクが貼り付けられています。そちらも合わせてご覧ください。朝日新聞は一連の記事中で、三菱電機インフォメーションシステムズ(MDIS)社製のソフトウェアに不具合がないかの検証を複数の個人・法人に依頼し、その全てから「不具合あり」との結果が来たことを報告。さらに、MDISがこうした不具合を修正したソフトウェアを開発していたにもかかわらず、新規契約か大規模増強の案件があった場合にのみしかそれが導入されなかったことを報じています。

それから10日経った9月1日、今度は岡崎市立中央図書館から公式見解が発表されました(参考: http://www.library.okazaki.aichi.jp/tosho/about/files/20100901.html)。それに対するユーザーの反応と関係者へのインタビューを掲載したのが、下のJ-CASTニュースの記事です。

この記事からは、今回の男性への逮捕に関係した「図書館」「警察」「ベンダー」の言い分が見えてきます。図書館は、男性のアクセスが「一般的な利用範囲を超えるものであった」として、システム側の不備については知らなかったと主張。そして警察は、実際に図書館でアクセス障害が起きたという事実を重視して「図書館の業務に支障が出たことは事実で、捜査に問題はない」との見解を示しています。一方、朝日新聞に「不具合」の存在を指摘され、システムの改修作業を行っていると報じられたベンダーは「不具合があったとは認識していない」と主張しています。


■ 男性によるクロールは一般的な範囲の頻度――Webに詳しいユーザーの見解

こうした主張は、この件について追及を続けてきたWebに詳しいネットユーザーにはどのように見えているのでしょうか?

上に挙げたのは、今回の件をユーザーが技術面から検討した記事。ある程度こうした技術の素養が無いと理解しづらいところがありますが、これらの意見は、以下の2点で一致しています。

  • 現在の技術水準からすると、図書館のシステムはかなり性能が低い
  • 男性によるクロールは標準的な頻度であって、問題視されるものではない

また、今回の事件でもう一つ彼らが気にしているのは、こうした技術的なトラブルが起こった際に慣例的に採られてきた、「技術の問題は技術で解決する」という原則が破られてしまっている点です。

上の二つの記事でも指摘されているように、この原則は、インターネット上では国境を越えて情報が行き来するため、各国の法に頼って事案を処理することが多くの場合で困難なことから、慣習として育まれてきたものです。上の日経パソコンオンラインの記事では、それでも解決不可能だった場合として、今度はコミュニティを通じた、当事者、関係者同士の連絡による解決策を取ることを挙げています。法的機関の介入は、あくまでもこうしたプロセスを経ても無理だった場合の最終手段とするのが、ある程度ネットに通じた技術者のやり方であるとのことです。

最後に、今回の事件について図書館のネット利用に詳しい人たちから出てきた意見もいくつか紹介しておきます。

一番目は、今回の男性と同様に、大阪府立図書館にクロールを試みて、何度かサーバーを停止させた経験があるという著者のエントリー。図書館提供のWebサービスが、ユーザーの不満をうまくサービスに反映していくことを求めています。二番目は、図書館問題研究会が今回の事件における図書館側の対応の問題点をまとめたもの。特に「図書館の自由」という観点から、アクセスログなどの開示の必要性を記している点が注目されます。三番目は、図書館蔵書検索サービス「カーリル」が本件に出した公式見解。自身はベンダーや図書館と協力しながら作業を進めているとしながら、図書館側にもAPI提供などネット社会に対応した公共システムの構築を求めています。本件に興味を持たれた方は、これらの記事もぜひご一読ください。


本記事におきまして、当初タイトル・本文中で「ライブラハック」という言葉を用いていましたが、2010年9月10日18時15分に当該部分を「librahack」に修正いたしました。また、19時50分に「拘留」を「勾留」に修正いたしました。お詫びして訂正いたします。

「図書館戦争」に関連する商品 by BECOME