LEADTOOLS OCR(Leadtools.Forms.Ocrアセンブリ)

フレームを表示

Recognizeメソッド(IOcrPage)








操作の進捗を示すオプションのコールバック
このIOcrPageの上で見つけられるOCRデータを認めます。
構文
void Recognize( 
   OcrProgressCallback callback
)
'Declaration
 
Sub Recognize( _
   ByVal callback As OcrProgressCallback _
) 
'Usage
 
Dim instance As IOcrPage
Dim callback As OcrProgressCallback
 
instance.Recognize(callback)
void Recognize( 
   OcrProgressCallback callback
)
- (BOOL)recognize:(nullable LTOcrProgressHandler)progressHandler error:(NSError **)error
public void recognize(OcrProgressListener callback)
function Leadtools.Forms.Ocr.IOcrPage.Recognize( 
   callback 
)
void Recognize( 
   OcrProgressCallback^ callback
) 

パラメーター

コールバック
操作の進捗を示すオプションのコールバック
解説

Recognizeを呼び出す前にIOcrPage.AutoPreprocessメソッドを呼び出すことで、画像の前処理を実行します。

Recognizeは、各ゾーンのZonesプロパティにおいて適切な認識モジュールを有効にするためのゾーン情報を活用します。各々の認識モジュールは、ゾーンでそれに割り当てられるページパーツを認識します。

このIOcrPageのゾーンコレクションZonesが空である(すなわち定義されるゾーンがありません)ならば、認識の前に、ページレイアウト分解プロセスはimageのためにゾーン一覧を作成するために自動的にアクティベーションされます。それゆえに、AutoZoneは暗黙的に呼び出されます。

注意:OCRエンジンがAutoZoneメソッドで分解している自動のページを実行して、それの中で任意のゾーンを見つけることができなかったとき、言い換えると、このIOcrPageが空のページであるならば、Recognizeメソッドは例外で失敗します。それは推薦されます。そして、AutoZoneを呼び出します、そして、エンジン(Zones.Countを用いて)で見つけられる少なくとも1つのゾーンがあるならば、チェックします。カウント数が0の場合は、Recognizeを呼び出さないでください

認識モジュールがオブジェクト(すなわち文字またはチェックマークその他)を認識することができないならば、このオブジェクトは拒絶されたものとしてマークされます。それは、最終アウトプットドキュメントに変換の間、除外シンボルによってマークされます。IOcrDocumentManager.RejectionSymbolが最終的なドキュメントで使われる除外シンボルを指定する用意が整っていることがありえることに注意すべきです。

このメソッドはどちらのフラグ信頼性の低い文字またはワードにでもチェックサブシステム(IOcrSpellCheckManager)を使うか、認識プロセスの間に自動訂正を許可します。

ページ上のすべてのゾーンを認識した後、Recognizeは認識された文字に関する必要情報を内部に保管します。テキスト、PDFまたはMicrosoft WordなどのこのIOcrEngineによってサポートされる多くの形式を用いてファイルまたはメモリにデータを保存するためにこのページを所有するIOcrDocumentをいずれ使うことができます。

複数ページのドキュメントを認めるために、IOcrDocumentオブジェクトのページを反復処理することができて、各々のページの上でRecognizeを呼び出すことができます。IOcrPageCollection.Recognizeメソッドを呼び出して、エンジン内に保存されている順序でIOcrPage内のページをループし、各ページにつき1回ずつRecognizeを呼び出すこともできます。ディスクファイルに結果IOcrDocumentを保存するならば、IOcrDocument.Pagesコレクションの項目の数と同じくらい多くのページを格納している文書ファイルを取得します。

操作進捗を示すか、それを中止するために、OcrProgressCallbackを使うことができます。詳細情報とサンプルについては、「OcrProgressCallback」を参照してください。

認められたデータファイルの形式が文書化されないため、データを調べるか、修正するためにGetRecognizedCharactersSetRecognizedCharactersを使うことができます。認識データに行う変更は、IOcrDocumentを保存時に生成される文書内に保存されます。

ページが正常に認められたあと、IsRecognizedプロパティの値はtrueでなければなりません。

ページ内に保存される認識データをクリアするには、Unrecognizeを使用します。

テキスト(言い換えると、ディスクに結果ドキュメントを保存することを計画していません)として認識データに興味を持っているだけであるならば、GetTextメソッドを使うことができて、stringとして結果データを得ることができます。OCRの一般の技術は、必須の「フィールド」のまわりで手動でゾーンを追加して、フィールドの文字列値を取得するためにGetTextを呼び出すことによってフォーム処理を実行することです。

認識アルゴリズムではチェッキングサブシステムを使用する可能性があるため、Recognizeを呼び出す前にIOcrSpellCheckManagerをセットアップしなければなりません。

もっとも直近に成功した認識処理の正確なタイミングデータを取得するには、Recognizeを呼び出した後でGetLastStatisticを使用します。

AutoZone/Recognizeとページ画像に関する注意点:特定の場合、AutoZoneとRecognizeは、操作中のページとなる場合もあるページ上で画像処理を実行します。たとえば、表タイプのゾーンを追加した場合、必要に応じて自動的にページが傾き補正されることがあります。これにより、AutoZoneまたはRecognizeが呼び出された後に画像の画像表現は異なるものになります。自分のアプリケーションでページの画像を表示するという要件がある場合、AutoZoneまたはRecognizeの後にGetRasterImageを呼び出し、変更があった場合に備えてページの画像表現の最新バージョンを取得します。LEADTOOLSメインOCR C#およびVBデモにはこの処理が組み込まれています。

サンプル
サンプルのために、参照しますIOcrPage
必要条件

ターゲットプラットホーム

参照

参照

IOcrPageインターフェース
IOcrPageメンバ
IOcrPageCollectionインターフェース
IOcrZoneCollectionインターフェース
GetTextメソッド
IsRecognizedプロパティ
Unrecognizeメソッド
OcrZone構造体
自動ゾーン
GetRecognizedCharactersメソッド
SetRecognizedCharactersメソッド
OcrCharacter構造体
IOcrPageCharactersインターフェース
IOcrZoneCharactersインターフェース
LEADTOOLS .NET OCRによるプログラミング
OCRページを認めること
OCR信用度の報告

Leadtools.Forms.Ocrは、認識またはDocument Imaging Suiteのライセンスと、解除キーが必要です。詳細は、以下を参照してください。LEADTOOLSツールキット機能