読者です 読者をやめる 読者になる 読者になる

図書館学徒未満

図書館学に関する本を読んだり調べごとをしたりしています。はてなダイアリーから移行しました。

図書館におけるビッグデータ活用がアツかった

id:xiao-2 様のこちらの記事
図書館総合展に行ってきた。〜フォーラム「図書館におけるビッグデータ活用を考える」後篇 - みききしたこと。おもうこと。
でレポートされていた図書館総合展ビッグデータ活用フォーラムですが、この前半のフロア質問者はわたしですw
そんな訳で(?)便乗する形ですが、このフォーラムなかなか面白かったよ〜という話をいたします。
フォーラムを見ていないと全然意味の解らないエントリですので、参加されなかった方はxiao-2様の元記事を先にご覧ください。


本フォーラムでSMOS( Stock Mix Optimization System )として紹介されていた手法ですが、これ理論的にはTOC(Theory Of Constraints)なんですよね。
今回のようなケースにおけるTOCの活用についての詳細は以下の本をご参照いただくとして、

ザ・クリスタルボール

ザ・クリスタルボール

むちゃくちゃざっくり説明しますと、パフォーマンス向上のボトルネックとなっている部分を割り出してそこを統計的に何とかすることで全体のパフォーマンスを上げましょうというマネジメント理論です。


例えばこれを小売店に適用するとすると

  • パフォーマンスの向上==売上の向上
  • ボトルネック==品切れによる機会損失

となり、品切れを起こさないようにするために最適な棚の配置や在庫管理は統計的にどうなんだろうね?という話に繋がっていくわけです。

これを現実に適用すると、あるパン屋さんでチョコクロワッサンが超絶大人気で、午前中には完売してしまうとして、売上をさらに向上させるにはチョコクロワッサンを並べる棚を増やし、まめにクロワッサンを焼いて品切れのないように補充しましょうという流れになる感じです。*1
……あっ、だんだん話が分かってきましたねw


本フォーラムで紹介されていた事例は「パフォーマンスの向上==貸出冊数の向上」と定義した上で、そのボトルネックとなっているのは「借りたい本が書架にないことによる機会損失」であるとされています。そうなると最適な棚の配置はまさしく書架の配置であり、最適な在庫管理とは最適な蔵書構成ということになります。その辺りを統計的に割り出すのがSMOSという技術なんですね。これにより資料費と開架スペースという有限のリソースを更に有効活用できるはずです。


お話を伺っていて個人的にとても感銘を受けたのは「シンガポール公用語は英語なんだけれども、近年は中国人人口が増えているし、図書館に中国語の本をもっと置くべきだ」という予測をこのシステムがはじき出した、というエピソードです。この予測はシンガポールの図書館司書たちの大方の予測を裏切るものでしたが、実際にシステムの予測通りに中国語の本を増やしたところ利用が増加した、という結果が出ました。*2

でもこのエピソード、決して司書による選書を否定するどころか、むしろこういうシステムを利用することで本来の専門性が必要とされるところの選書業務に専念できる可能性を示すものだなと思います。
SMOSによって予測できるのは
「中国語のビジネス書の利用が増えます」
「NDC913分類の利用が増えます」
ということだけで、具体的に「今年は東野圭吾の『プラチナデータ』が大爆発します」などと予想するものではありません。つまり、そのカテゴリ内にごまんとある本の山の中から真に所蔵にたる一冊を選ぶという、専門性を持った人間にしかできない仕事は依然として残るんですね。
それどころか「今年はこの分野の本は15タイトル」という枠が示されることで、そういう人間にしかできない選書はより重要性が高まるし、専念する時間も増えます。

パン屋さんだって「チョコクロワッサンが売れる」と分かっていれば、じゃあもっとチョコクロワッサンの味や見た目をよくするにはどうしたらいいだろう?という研究にリソースが割けます。「どのパンが売れるか分からないからそこそこの品質のパンをまんべんなく作るしかないか……」という状態から解放される訳です。
個人的には、こういった大枠の方針を決める作業は人間がやる必要はなくシステムにでも任せておいて、人間には人間ならではの知識技能やセンスが求められる繊細な仕事に専念した方が効率がいいし幸せになれると思っています。


また、今回のフォーラムでは「パフォーマンスの向上==貸出数の向上」と定義されていたわけですが、これはあくまで最初の定義づけの問題で、他の指標でもいいのです。
パフォーマンスの向上を貸出数ではなく館内閲覧数にしてもいいし、棚から抜き出された回数にしてもいいし、レファレンスサービスでの参照数にしてもいいでしょう。
ここをどう定義づけるかも人間にしかできない仕事です。
「もしSMOSをうちの図書館に入れるとしたら、ここではいったい何が『パフォーマンスの向上』にあたるだろう?」
と考えて話し合うのは、図書館の運営ポリシー固めや意識の共有を行ういい機会になると思います。


なんだかSMOSほめまくりなエントリになってしまいましたがw、個人的にはこういうみんなが幸せになれるデータ活用は大好きなので、ぜひ日本でも実験してくれる館が出てくれればな〜と思う次第です。


更にまったくの余談ですが、今回の発表者のCheng Hwee Sim氏はシンガポールの方ですが、横浜国立大学におられたことがあるそうです。それで日本語が堪能だったのでしょうね:) 本業は物流におけるデータ解析とのことでさもありなんと思いました。ぜひまたお話をお伺いしたいです。

*1:まったくの余談ですが、品切れを故意に誘発して品薄感を煽りブランドイメージを高める効果があるとされる、いわゆる「品薄商法」ですが、これはほとんどの場合機会損失の方が大きく、利益の期待できないマーケティング手法であることが統計的に判明しています。すごいぞ統計学!ありがとうTOC

*2:シンガポールの実験では利用者の属性情報を解析データに取り入れたために日本での実験よりも精度の高い結果が出たようです。我が国では属性情報の利用は難しいでしょうが、それでも当該図書館が存在する地域の人口動態はデータに含めたいところですね。たとえば地域全体では児童の数が増加しているのにと図書館内では児童書の利用が減っているとしたら何らかの問題があると察知できますが、図書館での利用統計データを見ているだけではそれが検出できません。