前回のrec10に引き続き、誰得系プロジェクト第二弾!
Libre10を開発開始しました。
大学に入って資料やテストプリントなどをスキャン&OCRしてたのですが、
せっかくのこのデータ、生かさなきゃもったいない!
文書データを活かす→全文検索っしょということで、最初はデスクトップサーチを使ってたわけです
デスクトップサーチ最強でしょ、spotlight使いやすすぎワロタとか言ってたら、
スマホで使えなかったわけです。
スマホで使えなくて何がWeb2.0(死語)だ!ということで、時代はクラウド、そう、雲の時代なわけです。
蜘蛛の糸から雲へ。
なんとなく日本語的に収まりがよかったりしますが、そんなことどうでもいいです。
自分の持ってるデータ、クラウドで使えなくて何が情強(自称)だよ!ってことです。
御託はこれぐらいにして、
Libre10とは
検索エンジンにApache solrを用いて、検索結果のpdfを1ページごとに切り出して表示する、
pdf統合管理プラットフォームです。(大袈裟
http://sourceforge.jp/projects/libre10/
こちらから最新のソースなどは見られます。一応手元ではひと通り動いています。