情報処理の魅力・威力(29)
情報処理化に必要な文書のデジタル化(OCR)(2)
(1)手入力時代
写真(1)
 写真(1)は、私がブラインドタッチで入力した原稿です。
写真(2)
 写真(2)は、私の妻がブラインドタッチ入力より手書の方が速いと挑戦した原稿です。
(1)手書とブラインドタッチ入力とどちらの方が速いと思いますか。
(2)写真(1)は、写真(2)に17秒差で勝った歴史的な史料です。
(3)在職中、様々な高校生がチャレンジしましたが、私のブラインドタッチ入力に勝った生徒はいません。

(2)「OCR」の魅力・威力
写真(3)
 写真(3)は、OCRでデジタル化する原稿です。
(1)スキャナに原稿を載せます。
(2)1分以内で紙データをデジタルデータに変換します。

四 赤穂浪士の筆記
心元ノ段常々御病身ノ御事二侯間、左様ノ御事ト存

被仰聞候御書面ノ内此方ヨリノ書付二相認侯儀ハ尤
御報不申候、左様御心得可被成侯
彼仁今程ハ本所二被居侯由縫二御聞届被成侯由大慶
侯、此方ニテモ寺井方:其通承届侯、尤動キ有
之侯哉無御油断御気ヲ可被附侯
貴様方御登ノ時節ハ兎角岡島罷下侯テノ上ト存侯、
此段モ本書二申入侯
山科ヘノ御状相届可申侯、アノ辺ノ趣ハ本書二申入
侯通二侯故不具
小山氏ヨリ健成申参侯由弥以難心得存侯、此男内
マタ膏薬カト存候、此頃十四日ノ会ニモ十一日ノ会
ニモ岡本ヨリハ不出来ノ了簡ニテ以不届ノ仁ト存
侯、惣右我折々侯キ
弥兵衛殿御連拝見仕侯、今日状数込侯故乍慮外
不能御報侯、宜御執成奉願侯、安丘ハ衛殿ヨリ幸右衛
門方へ御出侯半、辱奉存侯由申侯
叉之丞・勘助山科ニテ神文仕侯由御聞被成侯由私ハ
未不仕侯、承合左様ニモ可仕候、其元ニテ前原事神
文御尤二奉存侯、拙老ハ兎角無ニノ志ノミ込兼侯、
原氏潮田ヘノ御状明朝早遣可申侯御状相達候御返
事迄如此御坐侯、以上
 正月十七日             源吾判
    郡兵衛様
    安兵衛様
    兵左衛門様

  大高源吾へス返報留メ
去ル十七日ノ貴札廿七日ノ為御報御追テ書共御
封印無相同廿七目昼時玄達ヨリ兵左衛門方迄被相届
参考資料(1)
 参考資料(1)は、デジタル化したデータです。

(3)認識率は98.7%です
(40行×23字=920字を1分間でテキスト化
/(誤字数12文字)認識率=98.7%
参考資料(2)
 参考資料(2)は、認識率です。

(4)デジタルデータは多用な使い方ができる
(1)大高源五より堀部安兵衛への書状(サイズ+0)
(1)大高源五より堀部安兵衛への書状(サイズ+2)
(1)大高源五より堀部安兵衛への書状(サイズ+3)