情報処理の魅力・威力(28)
情報処理化に必要な文書のデジタル化(OCR)(1)
(1)OCRとは何ですか?
写真(1)
 写真(1)は、史料集2冊とそれの印刷物と、FD(フロッピーディスク)・MO(Magneto-Optical disk、光磁気ディスク)です。
(1)FDには、史料集1冊がデジタル保存できます。デジタル化すると、様々の用途があります。
(2)MOには、史料集640冊がデジタル保存できます。デジタル化すると、様々の用途があります。
(3)書籍640冊を持参すると大変です。しかし、デジタル化された史料集640冊を保存したMOを持参するのは簡単です。
(4)紙データをデジタル化する場合、強い味方がOCR(Optical Character Reader、光学式文字読取装置) なのです。

(2)「読んde!!ココ」をご存知ですか
写真(1)
 写真(1)は、「読んde!!ココ」というOCRのソフトです。
(1)エプソンのスキャナを買えば、付録で入っているのです。
(2)やはり、付録は付録です。付録からバージョンアップすると、割安です。

熟女のパソコン苦戦記70(OCR編)

熟女のパソコン苦戦記71(OCR編)

写真(2)
 写真(2)は、エプソンのスキャナ「GT─X770」です。定価は約4万円ですが、販売価格は約2万5000円です。解像度は6400dpi
(1)「GT─X970」という高価なスキャナもあります。解像度は6400dpiです。
(2)「GT─S600」という安価(販売価格約1万円)なスキャナもあります。解像度は3200dpiです。
(3)スキャナの性能を決めるのは解像度です。「dpi」とは「(Dots Per Inch」のことで、1インチ(Inch=2.5センチ)に点(Dots)が何個集まっているかを示します。点が多いほうが鮮明な画像になります。

(3)スキャナの性能を決める解像度
写真(3) 写真(4)
 写真(3)は、低解像の写真です。
 写真(4)は、高解像の写真です。
(1)安価で性能がいい方が一番ですが、安くて性能の悪いのと、高くて性能の良いのとでは、高価でも高性能の機会を選ぶべきです。
(2)「GT─X770」と「GT─S600」の販売価格の差は、1万5000円です。5年使えば、1年間に3000円の差です。1カ月250円の差です。仕事がサクサクと効率よく出きるのに、月250円は高いでしょうか。

(4)写真を挿入します
写真(4)
 写真(4)は、私が1996年に購入したメディアドライブ社の「WinReader plus v.2.5」です。
(1)当時は、「MS-DOS」の時代で、CDもありません。FD10枚以上をインストールしました。
(2)購入価格は10万円以上しました。
(3)スキャナも、エプソンの「GTシリーズ」の最高解像度の「7500」を10万円以上で購入しました。
(4)今考えると、価格も性能も夢のようです。でも、それだけの仕事をしてくれたし、当時デジタル化したデータは、ウインドウズのXP時代になっても、不死鳥のようにいき続けています。

(5)無駄で高価な買い物もいけないし、「安物買いの銭失い」も教訓