OCRソフトが決まっても・・・ 誰がやるの? そんな時間はない!

大手の新聞社なら記事データをデジタルで持っているのが当然、とは言え、地方の小さな新聞社ではそんなことも言えず、結局刷り上がった新聞をスキャナで取り込みOCRでテキスト化
そんな手間暇のかかる作業をしてでも地方新聞の記事というのはやっぱり魅力がある!

man-65049_1280



そんな訳で何とかOCRソフトも決定して実際の作業をこなすが・・・
これが結構な手間。新聞というのは毎日発行されるんですよ~ 当然ですけどw

この記事を全部OCRで取り込んでテキスト化するというのもね~
一応木更津に関連する記事と限定しているので記事を全部読むことになるし、OCRの認識率が高いとは言え100%では無いから確認作業も必要
一日分の記事を確認してアップするとなると半日以上の時間がかかってしまう

こんな事をやっていたのでは他の作業が進まない(^^ゞ

そこで考えたのが「複数の人間で作業をすれば」早く終わるのではないかと、その為にはどうすればいいのか?

ファイルのアップ作業をスクリプト化してWeb認証後ファイルのアップロードが出来てindexも作れるようにすればいいのではないか

思いつきは良かった
が、このスクリプトを作る作業は誰がやるのか?
って、私しかいないではないか~

しばらくは、新聞記事のアップとスクリプトの作成だけに追われる日々
それでも、将来的には楽になるのだから!そう言い聞かせての作業が続く

日中は新聞記事のアップとページの更新
そして、小さなバグ取りと・・・

夜、家に帰ってきてから新聞記事アップのスクリプト作成

本当に寝る時間が無くなってくる
と言うより、早く作り上げないと自分がどんどん苦しくなる

こんな作業が2週間ほど続いたがようやくスクリプトが完成
と思ったのだけど、眠い目をこすりながら作ったスクリプトには、やはりバグが多い(^◇^;)

テストランを重ねること1週間。大まかなバグ取りは終わった

作業に支障のないことだけを確認して公開してしまう

市役所の担当者に伝えて、実際の作業を誰が担当するのか検討してもらう
と、翌日には返事が・・・ 早い!
しかも、新聞記事のアップは市役所で担当してくださるという
願ってもないお言葉 良かった
これで新聞記事のアップとは縁が切れる
と思っていたが・・・

細かなバグが残っていた
でも、かなり楽になっているのでバグの修正も早く終わる
久々に楽な気分になっている

何かをやり遂げた後の爽快感というか・・・ やはり嬉しい