OCRエンジン更新

久しぶりの投稿です。

手持ちの自炊後電子教科書を何とかスマホやタブレットで全文検索、観閲できるようにならないかと思い、

pdfから透過テキストを取り出して、眺めていたのですがどうにもミスが多く、手で修正する必要がありました。

もちろんそんなの面倒でやっていられないため、怪しい記号の羅列のまま使っていたわけですが、

新たに電子教科書全文検索エンジンLibre10を開発するに当たり、新たなOCRソフトに切り替えてみました。

これまでは読んde!!ココ Ver.13を使っていたのですが、今回新たに
読取革命Ver.15 製品版へと切り替えてみました。

 

気になる結果ですが、日英混在時の英語の文章が読んでココでは全くといって良いほど認識できていなかったのが

読取革命ではほぼ正しく、全体の合致率もおおよそ80%程度から90%程度まで上がっているという印象を受けました。

発売時期を見てみると2007年と2012年と5年もの間が開いており、さもありなんと言ったところでしょうか

 

思っていたよりもOCRエンジンの精度は上がっているようで、良い買い物をしました。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です