LEADTOOLS OCR

フレームを表示

OCR ProfessionalのためのOCR認識モジュールの概要

自動認識モジュール

NativeOcrZoneRecognitionModule.Auto

エンジンが自動的にゾーンのために最も適当な認識モジュールを選択しようとすることを示しています。これは、ゾーンの塗りつぶしメソッドに従って認識の直前に決定されます。必要に応じて、文字セットなども決まります。

MTX OmniFont認識モジュール

NativeOcrZoneRecognitionModule.OmniFontMText

この認識モジュールは、機械で印刷されたテキストを認識します;すなわち印刷された出版物、レーザーまたはインクジェット式のプリンターと電動タイプライターからのテキスト。状態の良い機械タイプライターの出力も許容できます。ドットマトリックスプリンタからLetterまたはNear Letter品質の出力にも使用できます。Draft品質に使用することもできます。

以下の解像度範囲によるイメージだけは、サポートされます:90-110、160-240、280-320、400と600。

このモジュールは、幅または高さが6600ピクセルを超える画像は処理しません。言い換えると、それは300dpiの解像度でA3サイズ(11.69"×16.54")(ポートレイトと景色)イメージを問題なく処理することができます。解像度が大きくなると、サポートされる画像サイズは小さくなります。

モジュールは、imageの上で定義される最高64のゾーンを処理することができます。

MOR多言語OmniFont認識モジュール

NativeOcrZoneRecognitionModule.OmniFontMor

このモジュールは、機械で印刷されたテキストを認識します;すなわち印刷された出版物、レーザーまたはインクジェット式のプリンターと電動タイプライターからのテキスト。状態の良い機械タイプライターの出力も許容できます。ドットマトリックスプリンターによるLetterまたはNear Letter品質(LQ、NLQ)出力にも使用できます。受信する画像を修正して、モジュールによりふさわしいようにする方法は2通りあります。

このモジュールは、300dpiの解像度でA3サイズ(11.69"×16.54")(ポートレイトと景色)イメージを問題なく処理することができます。

モジュールは、imageの上で定義される最高500のゾーンを処理することができます。

DOTマトリックス(DOT 9-ピンドラフトドットマトリックス認識モジュール)

NativeOcrZoneRecognitionModule.DotMatrix

このモジュールは、ONLYドラフト品質9-ピンドットマトリックステキストのために設計されます。NLQやLQ文字の場合、NativeOcrZoneRecognitionModule.OmniFontPlus2WayVoting、NativeOcrZoneRecognitionModule.OmniFontPlus3WayVoting、NativeOcrZoneRecognitionModule.OmniFontMTextまたはNativeOcrZoneRecognitionModule.OmniFontMorモジュールによる出力がきれいになります。

OMR光マーク認識モジュール

NativeOcrZoneRecognitionModule.Omr

LEADTOOLS OMR(光マーク認識)モジュールは、高速、自動で正確な光マーク認識をアプリケーションに組み込むためのプロパティ、メソッドおよびイベントを提供することで、LEADTOOLS SDKの機能を拡張します。光マーク認識は、アンケート、投票、学術試験および公的な応用で、記入された選択肢のマークを認識するために使用されます。チェックマーク、バツ印、線、レ点、スクラッチなどを認識します。四角、円、楕円などのシェイプ(またはフレーム)をサポートします。詳細については、「LEADTOOLS .NET OCRの使っているOMR」を参照してください。

ICR手書き数字認識モジュール

NativeOcrZoneRecognitionModule.IcrNumeral

この認識モジュールは、手書きの数字と4つの追加符号に使用できます。より多くの手書き文字を認識する必要がある場合は、NativeOcrZoneRecognitionModule.IcrCharacter認識モジュールを使用します。

ICR手書き認識モジュール

NativeOcrZoneRecognitionModule.IcrCharacter

この認識モジュールが、手書き文字のために使われることができます。認識する必要があるのが数字のみの場合は、NativeOcrZoneRecognitionModule.IcrNumeral認識モジュールを使用します。

MATマトリックスマッチング認識モジュール

NativeOcrZoneRecognitionModule.MatrixMatching

このモジュールは、特定の固定フォント文字グループを読み取るよう設計されています。特にOCRやイメージングアプリケーション用に設計されており、似たシェイプを持つ文字は2つとありません。各々の文字グループは、それ自身の塗りつぶしメソッドを持っています。銀行業務、小切手、貨物運送状、製品物流および文書確認など、高精度が必須の分野で利用されます。固定されていない印刷スタイルにも対応します。

FRX多言語OmniFont認識モジュール

NativeOcrZoneRecognitionModule.OmniFontFireWorx

このモジュールは、機械で印刷されたテキストを認識します;すなわち印刷された出版物、レーザーまたはインクジェット式のプリンターと電動タイプライターからのテキスト。状態の良い機械タイプライターの出力も許容できます。ドットマトリックスプリンターによるLetterまたはNear Letter品質(LQ、NLQ)出力にも使用できます。

OmniFontを認識モジュールと認めているPLUS2WAYとPLUS3WAY

NativeOcrZoneRecognitionModule.OmniFontPlus2WayVoting

NativeOcrZoneRecognitionModule.OmniFontPlus3WayVoting

これらの認識モジュールは、機械で印刷されたテキストを認識します;すなわち印刷された出版物、レーザーまたはインクジェット式のプリンターと電動タイプライターからのテキスト。状態の良い機械タイプライターの出力も許容できます。

PLUS2WAYとPLUS3WAYモジュールは、認識結果を改善するために、投票技術を使用します。

PLUS2WAY投票モジュールは、MORとMTXモジュールから結果を結合します。

PLUS3WAY投票モジュールは、MOR、MTXとFRXモジュールから結果を結合します。

これらの2台の投票モジュールのどちらででも、正確さはかなりより良好です、しかし、認識に任意の単一のモジュールより大幅に多くの時間がかかるかもしれません。

注意:Professionalエンジンのすべてのモジュールのためにアルゴリズムを処理しているimageは、ほとんど無制限のイメージサイズに対処するように設計されていました:両方の方向の32000のピクセル。

アジアの認識モジュール

NativeOcrZoneRecognitionModule.Asian

このモジュールは、水平または垂直方向のテキスト方向で認識サービスを4つのアジアの言語に提供します;これらの言語には、日本語、韓国語と中国語(繁体字と簡体字)があります。それは、英語で短い埋め込まれたテキストを処理することができます。

アジアの言語処理は、西ヨーロッパ言語のためにいくぶんそれと異なります。スペルチェック、エディタディスプレイと検証は、アジアの言語に利用できません。1つのアジアの言語だけは認識のために設定されなければなりません、そして、西ヨーロッパ言語はアジアの言語と一緒に設定されるべきでありません。しかし、英語が設定される必要がなくて、アジアのOCRエンジンは、アジアのテキストで埋め込まれる短い英語のテキストを認識することができます。埋め込まれたテキストが他のラテンアルファベット言語であるならば、これらは同様に設定される必要はありません;しかし、アクセント文字は正しく必ずしも処理されないかもしれません。



以下のテーブルは、OCRエンジンごとにサポートされた認識モジュールを示します:

認識モジュール Professional Advantage アラビア語
自動 はい はい はい
OmniFontMText はい はい いいえ
OmniFontMor はい はい いいえ
DotMatrix はい はい いいえ
Omr はい はい はい
IcrNumeral はい はい いいえ
IcrCharacter はい はい いいえ
MatrixMatching はい はい いいえ
OmniFontFireWorx はい はい いいえ
OmniFontPlus2WayVoting はい はい いいえ
OmniFontPlus3WayVoting はい はい いいえ
アジア人 はい はい いいえ

以下のテーブルは、OCR Professional/Advantageエンジンで、119の言語の各々のテキスト認識モジュールサポートを示します:

言語 Omr OmniFontMText OmniFontFireWorx OmniFontPlus2WayVoting OmniFontPlus3WayVoting DotMatrix Icr
アフリカーンス語 はい いいえ はい はい はい はい、C はい
アルバニア語 はい いいえ はい はい はい はい、C はい
アイマラ族 はい いいえ はい はい はい はい はい
バスク はい いいえ はい はい はい いいえ はい
ベンバ族 はい はいEN いいえ はい はい はい はい
ブラックフット族 はい はいEN いいえ はい はい はい はい
ブラジルのB はい、B はい はい はい はい はい はい
ブルトン はい いいえ はい はい はい はい、C はい
Bugotu はい はいEN いいえ はい はい はい はい
ブルガリア語 はい いいえ はい はい はい いいえ いいえ
ベラルーシ はい いいえ はい はい はい いいえ いいえ
カタルーニャ語 はい いいえ はい はい はい はい、C はい
チャモロ はい いいえ いいえ はい はい はい はい
チェチェン族 はい いいえ いいえ はい はい いいえ いいえ
コルシカ島民 はい いいえ いいえ はい はい はい はい
クロアチア語 はい いいえ はい はい はい いいえ はい
カラス はい はいEN いいえ はい はい はい はい
チェコ語 はい いいえ はい はい はい いいえ はい
デンマーク語 はい はい はい はい はい はい はい
オランダ語 はい はい はい はい はい はい、C はい
英語 はい はい はい はい はい はい はい
エスキモー(イヌイット) はい いいえ はい はい はい いいえ はい
エスペラント はい いいえ いいえ はい はい いいえ いいえ
エストニア語 はい いいえ はい はい はい はい はい
銀行語 はい いいえ はい はい はい いいえ いいえ
フィジー語 はい いいえ いいえ はい はい いいえ はい
フィンランド語 はい はい はい はい はい はい はい
フランス語 はい はい はい はい はい はい、C はい
フリジア語 はい いいえ はい はい はい はい、C はい
フリウリ語 はい いいえ はい はい はい はい、C はい
ゲール語(アイルランドの) はい いいえ はい はい はい はい はい
ゲール語(スコットランド人の) はい いいえ はい はい はい はい、C はい
ガリシア語 はい はい はい はい はい はい はい
ガンダ語 はい いいえ いいえ はい はい いいえ はい
ドイツ語 はい はい はい はい はい はい はい
ギリシア語 はい いいえ はい はい はい はい いいえ
グアラニー族 はい いいえ いいえ はい はい はい、C はい
ハニ* はい はいEN いいえ はい はい はい はい
ハワイ語 はい はいEN はい はい はい はい はい
ハンガリー語 はい いいえ はい はい はい はい はい
アイスランド語 はい いいえ はい はい はい いいえ いいえ
Ido はい はいEN いいえ はい はい はい はい
インドネシア語 はい はいEN はい はい はい はい はい
インターリンガ はい はいEN いいえ はい はい はい はい
イタリア語 はい はい はい はい はい はい、C はい
カバルド はい いいえ いいえ はい はい いいえ いいえ
Kasub はい いいえ いいえ はい はい いいえ はい
カワ* はい はいEN いいえ はい はい はい はい
キクーユ草原 はい いいえ いいえ はい はい いいえ いいえ
コンゴ族 はい はいEN いいえ はい はい はい はい
クペル語 はい はいEN いいえ はい はい はい はい
クルド族の* はい いいえ はい はい はい いいえ はい
ラテン語L はい はい、L はい はい はい はい、L はい
ラトビア語 はい いいえ はい はい はい いいえ はい
リトアニア語 はい いいえ はい はい はい いいえ はい
リュバ はい いいえ いいえ はい はい いいえ はい
ルクセンブルク語 はい いいえ いいえ はい はい はい、C はい
マケドニア語 はい いいえ はい はい はい いいえ いいえ
マダガスカル人 はい はいEN/M いいえ はい はい はい、C はい
マレー語 はい いいえ はい はい はい いいえ はい
マリンケ語 はい いいえ いいえ はい はい はい、C はい
マルタ人 はい いいえ いいえ はい はい いいえ いいえ
マオリ語 はい はいEN いいえ はい はい はい はい
マヤ語 はい いいえ いいえ はい はい はい はい
ミャオ族* はい はいEN いいえ はい はい はい はい
Minankabaw はい いいえ いいえ はい はい いいえ はい
モホーク族 はい はいEN いいえ はい はい はい はい
モルダビア語 はい いいえ いいえ はい はい いいえ いいえ
ナワ族 はい はいEN いいえ はい はい はい はい
ノルウェー語 はい はい はい はい はい はい はい
ニャンジャ語 はい はいEN いいえ はい はい はい はい
西洋の はい いいえ いいえ はい はい はい はい
Ojibway はい いいえ いいえ はい はい いいえ はい
パピアメント語 はい いいえ いいえ はい はい はい はい
Pigin英語 はい はいEN はい はい はい はい はい
ポーランド語 はい いいえ はい はい はい いいえ はい
ポルトガル語 はい はい はい はい はい はい、C はい
プロバンス語 はい いいえ いいえ はい はい はい、C はい
ケチュア族 はい いいえ いいえ はい はい はい はい
ラエティア語 はい いいえ いいえ はい はい はい、C はい
ルーマニア語 はい いいえ はい はい はい いいえ いいえ
ロマ はい いいえ いいえ はい はい いいえ はい
Ruanda はい はいEN いいえ はい はい はい はい
Rundi はい はいEN いいえ はい はい はい はい
ロシア語 はい いいえ はい はい はい いいえ いいえ
サミ はい いいえ いいえ はい はい いいえ はい
サミ、ルレ はい いいえ いいえ はい はい いいえ はい
サミ、北国の人 はい いいえ いいえ はい はい いいえ はい
サミ、南部地方の はい いいえ いいえ はい はい いいえ はい
サモア語 はい いいえ いいえ はい はい はい、C はい
サルデーニャ語 はい いいえ いいえ はい はい はい、C はい
セルビア語 はい いいえ はい はい はい いいえ いいえ
セルビア語、Latinic はい いいえ はい はい はい いいえ はい
ショーナs はい 賛成S いいえ はい はい 賛成S はい
スー族 はい はいEN いいえ はい はい はい はい
スロバキア語 はい いいえ はい はい はい いいえ はい
スロベニア語 はい いいえ はい はい はい いいえ はい
ソマリ族 はい はいEN いいえ はい はい はい はい
ソルビア人(向けます) はい いいえ はい はい はい いいえ はい
ソト族 はい いいえ いいえ はい はい はい はい
スペイン語 はい はい はい はい はい はい はい
Sundanese SN はい いいえ いいえ はい はい 賛成SN 賛成SN
スワヒリ語 はい はいEN はい はい はい はい はい
スワジ族 はい いいえ いいえ はい はい いいえ はい
スウェーデン語 はい イエ はい はい はい はい はい
タガログ語 はい はいEN いいえ はい はい はい はい
タヒチ語 はい いいえ はい はい はい はい、C はい
Tinpo はい はいEN いいえ はい はい はい はい
トンガ語 はい はいEN いいえ はい はい はい はい
ツワナ族(Chuana) はい いいえ いいえ はい はい はい、C はい
大酒樽* はい はいEN いいえ はい はい はい はい
トルコ語 はい いいえ はい はい はい いいえ はい、T
ウクライナ語 はい いいえ はい はい はい いいえ いいえ
ビサヤ族 はい はいEN いいえ はい はい はい はい
ウェルシュ はい いいえ はい はい はい はい、W はい、W
ウォロフ族 はい いいえ いいえ はい はい はい、C はい
コーサ族 はい はいEN いいえ はい はい はい はい
サポテク族 はい はいEN いいえ はい はい はい はい
ズールー語 はい いいえ はい はい はい いいえ はい

* = それがラテンアルファベットで書き込まれる場合だけ、この言語は処理されることができます。

B =ブラジル人は、OmniFontMTextとOmniFontFireWorxモジュールで、ポルトガル語から別々のディクショナリを持っています。他のモジュールは、ブラジル人をポルトガル語とみなします。ブラジル人は、出力ドキュメントで言語採点に使えます。

L =ラテン語は通常アクセント文字なしで書き込まれます、しかし、時々、短音記号または長音記号は母音の上に置かれます。これらの場合、示されたモジュールは、サポートを提供しません。

M =マダガスカル人のいくらかの方言は、アクセントなしで書き込まれます。これらの場合、OmniFontMTextはサポートを提供します。

S =ショナ族は、アクセントなしで書き込まれるかもしれないが、時々母音の上でacutesと墓を使います。これらの場合、示されたモジュールは、フルサポートを提供しません。

SN = Sundaneseは、1つのアクセント文字だけを使います;時々、これはE短音記号(時々E鋭い)です。示されたモジュールは、E短音記号でなくE鋭角をサポートします。

W =ウェルシュは、2つのめったに使い古していない文字を格納します:W-脱字符号とY-脱字符号。これらのモジュールは、これらの2つの文字を除いてウェルシュを処理することができます。

OmniFontMTextの上の脚注:

12の選択可能な言語は、更なる脚注文字なしで賛成ものによるそれらです。これらの言語については、このモジュールは、それ自身の言語辞書を使用します。

識別されるEN =言語は、アクセント文字を格納しないと考えられます。読むために、英語を選択して、主なディクショナリからスペルチェックを無効にします。

モジュールDotMatrixの上の脚注:

C =すべての大文字でないのは、サポートされます。正確なリストのためのモジュール仕様を参照してください。多くの9-ピンドットマトリックスプリンタがすべてのアクセント記号を付けられた大文字文字を印刷することができるというわけではないため、これは多分重大な規制でないでしょう。

モジュールIcrの上の脚注:

T =モジュールは、小文字で印刷した点のないi.を処理することができません。

参照

参照

概要
ご使用にあたって(サンプルプログラムへのガイド)
LEADTOOLSは、.NETアセンブリのOCR処理を行います
LEADTOOLS .NET OCRによるプログラミング
OCRエンジンインスタンスの作成
OCRエンジンの開始と終了
LEADTOOLS OCRによるマルチスレッド
OCRスペル言語辞書
OCR言語の操作
OCRページの操作
OCRゾーンの操作
OCRページを認めること
OCR信用度の報告
LEADTOOLS .NET OCRのOMRを使用して
OCR言語とスペルチェック
OCRエンジン特殊設定
OCRチュートリアル - ページの操作
OCRチュートリアル - ページの認識
OCRチュートリアル - ゾーンの追加と描画
OCRチュートリアル - 認識結果の操作
OCRチュートリアル - 検索可能PDFのスキャン