LEADTOOLS OCR

フレームを表示

OCRの画像の事前処理

Document/Medical)スキャンされたドキュメントは、必ずしもまっすぐでありません。スキャナーのフィーダーから給紙されるときに斜めになったり、最初から逆向きに(上下反対に)置かれていることもあります。最良の結果を得るためには、OCRエンジンで処理する前に、このような画像を修正する必要があります。LEADTOOLSは、イメージの向きを修正するのに用いられることができる多数の前処理コマンドクラスを提供します。これらは、ImageProcessing.Core.DeskewCommandImageProcessing.Core.SearchRegistrationMarksCommandDataImageProcessing.Core.PerspectiveDeskewCommandImageProcessing.Core.ManualPerspectiveDeskewCommandクラスを含みます。

前処理2値画像(1ビット)イメージ

前処理2値画像イメージの詳細については、「1ビット画像のクリーンアップ」を参照してください。

前処理カラーイメージ

時々、ドキュメントはカラーでスキャンされます。カラーイメージは、いろいろなLEADTOOLSコマンドを使うことを調節できるか、向上させました。詳細については、「Leadtools.ImageProcessing.Color」を参照してください。

OCRの結果を向上させるためには、前処理として画像を2値(1ビット)画像に変換するのがより実際的です。ただし、1ビット画像は色情報を持たないため、カラー画像を1ビット画像に変換すると重要な特徴が失われる場合があります。ColorResolutionCommandIntensityDetectCommandDynamicBinaryCommandクラスを使用することにより、2値画像イメージにカラーイメージを変換します。ColorResolutionCommandは、白黒にimageを変換するために、128の固定強度しきい値を使います。IntensityDetectCommandは、白黒にimageを変換するために、ユーザー指定された強度範囲を使います。範囲の外の色が黒いカラーにマップされる間、指定された範囲の内側のColorsは白いカラーにマップされます。DynamicBinaryCommandは、白黒にimageを変換するために、ダイナミックに計算されたしきい値を使います。ピクセルの強度が動的なしきい値より高いならば、ピクセルは白に設定されます;それ以外の場合は、黒へのセットです。これらのコマンドは、ユーザーにOCRのために様々な性質のカラーイメージを処理する機能を与えます。

最善カラー変換メソッドの選択は、アプリケーション依存的です。たとえば、パスポートイメージに関して、情報テキストは、ざらざらの背景にかかっている黒いカラーで書き込まれます。テキストカラーは、ざらざらの背景に比較的に非常に暗いです。これらのイメージに関して最善OCR結果を取得するために、背景ピクセルからセグメントテキストピクセルに低輝度しきい値を使うことが推奨されます。このセグメンテーションプロセスは、低い明度値から開始して、例えば、255(100~255)で終わる範囲で、IntensityDetectCommandによって実行されます。低輝度しきい値はこれらのイメージに関してテキストカラーと背景色の配布を調べることによって経験的に推定されます。そして、正規分布の間でその後交差点ポイントを見つけます。

Advantage OCRデモを用いたチュートリアルのために、Advantage OCRを使用したパスポートなど身元確認文書の画像のOCR処理方法を参照します

自動二値化

2値画像イメージにカラーイメージを変換する最も高度な方法は、AutoBinarizeCommandを用いてあります。AutoBinarizeCommandは、カラー画像の主な特長を維持管理するために、いくつかの前処理と閾値演算を使います。スキャナまたはカメラなどの、AutoBinarizeCommandは、使われる特定の入力装置に調節できます。このコマンドは不明瞭なドキュメント画像を読みやすくするのに最適です。

以下のサンプルは、AutoBinarizeCommandがどのように優良結果でテキストを検出するのに用いられることができるかについて示します:

前に

後に

AutoBinarizeCommandクラスは自動的に機能するが、また、アルゴリズムがどのように機能するかのカスタマイズを許可します。オプションは、imageの上で内部処理を実行するべきかどうか含みます。どのしきい値メソッドを使うべきかについて選ぶこともできます。