とうとう地方新聞記事掲載へ・・・ しかしどうやって!?

とうとう、初めての新聞記事が届く。
と言っても、仕上がった新聞がそのまま届くだけ・・・
デジタルデータはないのだろうか?

business-1031754_1280



市役所から各新聞社に連絡してもらったのだが、デジタルデータはないらしい
今でも昔ながらの活版印刷で行っているという。
まぁ 田舎の地方新聞でWebページも持っていないというのだから
活版印刷でも十分なのかもしれないが、毎日活字と戦っているのだろうか?

デジタルデータ化して印刷するとなると印刷機などのコストも大変なもの
そう言う資金もないのかもしれない・・・

出来上がった新聞がそのまま届く理由はわかったが、さて、これをどうするか・・・

一つの方法としては、新聞を見ながら記事を選んで手打ちで入力する、あるいは、スキャナで画像として取り込み、OCRでテキスト化する

OCRでの認識率が高ければその方が楽だし、手間や時間もかからない
とりあえず、OCRでの作業を試みる

新聞は活字とは言えかなり文字が小さい
それだけOCRの認識率は下がってしまう

また、段組をしてあるので文章のつながりが変になる場合もある
そして一番の問題が写真

写真などがあると、そこだけ段組が変化する
この変化にOCRソフトが付いていけない

あまりの認識率の低さに腹立たしくなって手打ちでの入力にするが、あまりにも作業量が多すぎる
困った どうしたものか・・・

とにかくアップすることが目的なので初回は手打ちで・・・
作業は大変でもとにかく新聞記事が掲載されるというのは素晴らしい
これが全部の記事を掲載できるようになればいいのだが・・・

地方新聞記事の掲載はこれからも続くのだから何か方法を探さなくては

そこで、いくつかのOCRソフトを試してみることにした
と言っても、持っているOCRは「読取革命」と「読んde!!ココ」くらいしかない
この二つを試してみたのだが新聞の読み取りでは大差がない

そこで思い出したのが「SmartOCR Lite Edition」だ
これはFreeのソフトながら、以前使っていたのだが、かなり認識率が高かったと記憶している
そこで、このソフトをネットからダウンロードしようと検索する

が、このソフトを出していたスマートリーディングは既に無かった
再配布も出来ないことになっているらしい
結局どこにも見つからない

しかし、このソフトは自分で前に使っていたのだからどこかにあるはずだ
自分のPCのHDDの中を探し回る・・・

と、ようやく見つかった Ver.1.0.5.1
このバージョンが新しいのか古いのか、今では全くわからない
が、このソフトに賭けてみるしかない

すると、新聞記事のような小さな文字でも段組であっても、かなりの確率で認識してくれる
もちろん、画像が横になっていたり斜めになっていたりしても平気だ
ソフトが勝手に直してくれる
これほど便利なOCRソフトがあったのに・・・ なぜつぶれてしまったのか
個人的にはかなり残念でならない

これで、ようやくOCRソフトも決まってそれなりに認識してくれるようになった