こんにちは。オペ室看護師くらげです。
今日は「自炊シリーズ」第4弾、OCRソフトについてのお話です。
この記事を読めば、”OCRって何?”という疑問が解消するはず!
ついでに、自分が利用しているOCRソフトと実際の使い方も紹介します。
OCRとは
OCR(光学文字認識)とは、画像やスキャンした文書から文字を読み取り、デジタルテキストに変換する技術です。
例えば、紙の書類や本をスキャンしても、画像データのままでは編集や検索ができません。
OCRを使えば、画像内の文字をテキストデータとして取り出し、編集や検索ができるようになります。
最近は手書きの文字でもOCRできますが、実際に利用してみると結構間違いが多いので、基本は活字をデジタルテキストデータにするものという認識が良いと思います。
次は自分が実際に利用している読取革命について語ります。
読取革命とは
読み取り革命はソースネクストが販売しているOCRソフトです。OCRエンジンはPanasonic製というのが売りですね。
読取革命の詳細を知りたい方はこちらをタップ
”OCR”って言葉だけでなんだか難しそうで嫌煙していまいますが、実に機能はシンプルです。
画像として取り込んだものから文章を読み取って、透明な文字で貼り付けしてくれるソフトですね。
OCRソフトで大事なのは文字認識の精度で、
ビジネスで使用するような厳密な文章化を求められるものから個人向けの電子化を対象としたものなど様々あります。
個人向けの自炊程度であれば検索にキーワードが引っかかる程度の精度で良いと思います。
OCRソフトで有名なのはadobeのacrobatがありますが、こちらはサブスクリプション型のサービスになるので毎月課金が必要です。
その点、読取革命は買い切り型のソフトになるので、支払いは一度で済み、長い期間使用することができます。
また、OCRエンジンはPanasonic製のものなので、なんだか安心感がありますよね。
ただ、Windowsしか対応していないです。
MACを持っている方は残念ですが、adobeをオススメします。
逆に、普段から自炊をしない場合は、サブスク型のadobeを自炊するときだけ使うのも一つの手だと思います。
実際のところはいちいちサブスクを登録して、解約してのやりとりがめんどくさいので、
整形の手技書を取り込むことが多いので、買い切り方を利用したほうが良いと思います。
ちなみにスマホのアプリで無料でOCR化できるものもあります。
まずはお試しで…。という方なら使用してみても良いと思いますが、資料が10ページを超えるようなら諦めて有料のソフトを使用することをおすすめします。
精度が低いのと、1ページずつ写真を取っていく作業は永遠に感じます…。
読み取り革命のUIやアイコンは少しダサいですが、それもまたご愛嬌という感じです(笑)。
読取革命を現実的に使うなら…。
次に、自分が試してみて一番効率的な使い方についてお話します。
読取革命は様々な機能がありますが、自分が利用しているのは読取革命ではありません…笑
さんざん読取革命の説明をしておいてなんですが、実際に使用しているのは読取革命のソフトに付属している「フォルダーウォッチャー」というアプリです。
このアプリはかなり有能で、スキャンしたファイルをフォルダに入れるだけで、自動的にOCR処理をしてくれます!
実際には読取革命のソフトを通していると思いますが、とにかく一つ一つに設定がいらないのが優秀すぎ!
初めは自分も精度の高さを求めて、読取革命のアプリを使っていましたが、ひとつひとつ設定していくはめんどくさすぎます…。
一度、OCR化したものをプレビューで文章としてだして、修正を加えていく感じなのですが、はっきり言ってそこまでの精度を求めていない。
目的は検索したときにキーワードが引っかかってくれれば、十分なので時間が短く済ませたい。
ということで、自分は「フォルダーウォッチャー」一択です。
実際の使い方は以下の手順になります。
①フォルダーウォッチャーでOCR化するファイルをいれるフォルダ、OCR化したファイルを保存するフォルダを指定
②指定したフォルダにファイルを投入
③OCR化したファイルを保存フォルダで確認
これで終了です。
自分の場合はさらにいろいろなデバイスで利用できるようにGoogle driveに保存してます!
こんなに便利な「フォルダーウォッチャー」ですが、難点もあります。
第一に一度に自動処理できるのは50~100ページ。
ページ数が多い医療系の本はデータを分割してスキャン→OCR化してから、再度一つのファイルに結合する必要があります。
Windowsの場合は無料のPDF結合ソフト(CubePDF)があるので、自分はそれを利用しています。
めんどくさい場合はわざわざ結合する必要はありませんが、GoodNotesでつかうときにファイルの見た目がダサいのでできれば結合することをおすすめします。
ちなみに、「フォルダーウォッチャー」のアプリのUI(見た目)はダサすぎです。
もうタスクバーに置きたくないぐらいですが、機能性重視でめちゃくちゃ活用させてもらってます。
補足しておくと、読取革命のソフト紹介ページでは999ページまで一度に読み込み可能!とか書いてありますが、実際にやってみたら時間がかかりすぎて待てませんでした。
スピード的にも一度に読取革命でOCR化するよりも分割して、フォルダーウォッチャーで自動で読込させて後で、再結合するほうが簡単で時間がかかりません!
ちなみに、スキャナーに付属のOCRソフトもありますので、そちらを利用してみるのも一つの手だと思います。
実際のところは利用していないので、どのくらいの精度なのかはわかりません。
初めてする人は一度スキャナのOCR精度を確認してから、有料ソフトを検討することをおすすめします。
この方法がベストかどうかはわかりませんが、
自分としては一番手間がかからない方法を模索した結果、このやり方に落ち着きました。
オペ室看護師くらげでした。ありがとうございました。