LEADTOOLS OCR

フレームを表示

LEADTOOLS OMR(光マーク認識)モジュールは、プロパティ、メソッドとイベントを高速で、オートメーション化して、正確な光マーク認識をアプリケーションに簡単に取り込むために提供することによって、LEADTOOLS SDKの機能性を拡張します。光マーク認識は、調査、投票、アカデミックな試験と公式アプリケーションの上で選択を示すために満たされるバブルを認めるのに用いられます。チェックマーク、バツ印、線、レ点、スクラッチなどを認識します。四角、円、楕円などのシェイプ(またはフレーム)をサポートします。

OMR機能は、LEADTOOLS OCRエンジンへのアドオンモジュールとして含まれます。

背景と詳細のために:を参照します

https://www.leadtools.com/sdk/document/document-addon-omr.htm

LEADTOOLS OMRは、OMR能力をロック解除することを特殊キーに要求します。詳細については、「特殊なLEAD機能のアンロック」を参照してください。

OMRは自動化されて、非常に高速で、正確です。それは、様々な種類のアプリケーションのために複数のオプションを持っています。

OMRオプションは、「フレーム検出オプション」と「マーク認識感度」を含みます。詳細については、「IOcrOmrOptionsインターフェース」を参照してください。

印刷されたフレームは、きちんと認められるために、少なくとも50×50のピクセルでなければなりません。また、印刷されたフレームは、目立つ(これはスキャナ明度を設定することによって簡単に達成されます。)必要があります

「マーク認識感度」は、敏感なOMRはマークを塗りつぶすことにどうだろうかについて指定します。(最高で、高くて、低くて最低の)。たとえば:小さなチェックで塗りつぶされるフレームのために、マーク認識感度は、最高の値に設定されなければなりません。印刷されたフレームが空であるならば、最高の値も設定されなければなりません、そして、単純なマークが使われるならば、塗りつぶされると認められなければなりません。しかし、アプリケーションまたは試験が完全に塗りつぶされることをフレームに要求するならば、マーク認識感度は最低の値に設定されなければなりません。

下記の図を参照してください。

最低のマーク認識感度も、印刷されたフレームが文字または数字を格納する、そして、フレームが完全に塗りつぶされなければならないとき、使われなければなりません。下記の図を参照してください。

ハードウェアに特有の紙

若干の種類のOMR紙は、特定の種類のハードウェアで使われるようになっています。通常、そのような紙は、文字または数字でバブルを格納します。文字とバブルは、赤いか軽いグレーで印刷されます。以下の図を参照してください。

文字とバブルの目的は、ハードウェアをこれらの領域のカラーを認識させることです。その結果、新聞がスキャンされるとき、バブルと文字は抜けます。そして、塗りつぶされたマークだけを見えるままにします。

ハードウェアに特有の紙が通常、ソフトウェアソリューションのために推薦されないが、適用されるとき、そのような種類の紙を用いて最も多くの正確な結果を確実にする手順があります。

より明らかにスキャンしている製造バブルと文字に、設定します高さにスキャナ明度。これは、ドロップアウトにバブルと文字のより軽いカラーを引き起こします。以下の図を参照してください。

もう一つの可能性は、スキャナ明度を最低に設定することです。下記の図を参照してください。

注意:そうすることがフレーム(バブル)に損害を与えて、元気がなくならせるので、ハードウェアに特有の紙をスキャンするとき、自動明度設定を使いません。以下の図を参照してください。

LEADTOOLS .NET OCRエンジンの全ては、OMRをサポートします。しかし、Advantage OCRエンジンだけは、OCRページの自動ゾーニングの間、OMRゾーンの自動検出をサポートします。OMR自動検出をサポートしないそれらのエンジンについては、以下をしなければなりません:

  1. ペイジZonesコレクション(IOcrPage.Zones)に、OcrZoneオブジェクトを追加します。ゾーンの以下のプロパティを設定します:
    プロパティ
    OcrZone.ZoneType OcrZoneType.Omrに設定します。
    OcrZone.Bounds ページ座標でゾーンを囲んでいる長方形。
  2. ページの上でOMRごとに繰り返します。
  3. IOcrPage.Recognizeを用いてページの上でOCR認識を実行します。
  4. 認識プロセスが完了したあと、IOcrPage.GetRecognizedCharactersを用いて認識された文字を取得します。ゾーンが追加したOMRごとに、認識された文字は、以下のプロパティで1つの項目(OcrCharacter)を格納します:
    プロパティ
    OcrCharacter.Code IOcrOmrOptions.SetStateRecognitionCharacterによって設定される、「塗りつぶされて」「値の入力されていないない」値のために使われる現在のOMR文字を格納します。以下の値は可能です:
    意味
    0 値の入力されていないない
    1 塗りつぶされます
    OcrCharacter.Confidence このIOcrEngineには状態の正確さである認識の後の信頼を示す0と100(100が最大確実性を表す)の間の数。

LEADTOOLS OCRエンジンがどのようにOMR認識を実行するかについて制御するために、IOcrOmrOptionsインターフェースを使用することもできます。このインターフェースで、以下を実行できます。

注意:すべてのLEADTOOLS OCRエンジンがLEADTOOLS OMRを使うため、エンジンネイティブ形式にOMR結果を保存することは機能しません(何も保存されません)。代わりに、LEADTOOLSドキュメントライタ形式のどれにでも、結果を保存します。

LEADTOOLSでOMRを使うことのサンプルのために、IOcrOmrOptionsを参照します。

参照

参照

概要
ご使用にあたって(サンプルプログラムへのガイド)
LEADTOOLSは、.NETアセンブリのOCR処理を行います
LEADTOOLS .NET OCRによるプログラミング
OCR認識モジュールの概要
OCRエンジンインスタンスの作成
OCRエンジンの開始と終了
LEADTOOLS OCRによるマルチスレッド
OCRスペル言語辞書
OCR言語の操作
OCRページの操作
OCRゾーンの操作
OCRページを認めること
OCR信用度の報告
OCR言語とスペルチェック
エンジンに特有の設定のOCR処理を行います
OCRチュートリアル - ページの操作
OCRチュートリアル - ページの認識
OCRチュートリアル - ゾーンの追加と描画
OCRチュートリアル - 認識結果の操作
OCRチュートリアル - 検索可能PDFのスキャン