LEADTOOLS OCR(Leadtools.Forms.Ocrアセンブリ)

フレームを表示

Run(String,String,IList<String>,DocumentFormat,OcrProgressCallback)メソッド








imageを格納しているファイルの名前。
結果文書ファイルの名前。
用意されたゾーンのファイル名のオプションのリストは、ページを申し込みます。このパラメーターは、nullVisual BasicではNothing)参照でありえます。
出力文書形式。このパラメーターがDocumentFormat.Userであるならば、使われるエンジンがネイティブ形式をサポートするならば、ドキュメントはIOcrDocumentManager.EngineFormatで設定されるネイティブエンジン形式を用いて保存しました、さもなければ、例外はスローされます。
操作の進捗を示すオプションのコールバック
オプションの複数の単一のゾーンファイルで、指定された文書形式で文書ファイルにディスク上で画像ファイルを変換します。
構文
'Declaration
 
Overloads Sub Run( _
   ByVal imageFileName As String, _
   ByVal documentFileName As String, _
   ByVal zoneFileNames As IList(Of String), _
   ByVal format As DocumentFormat, _
   ByVal callback As OcrProgressCallback _
) 
'Usage
 
Dim instance As IOcrAutoRecognizeManager
Dim imageFileName As String
Dim documentFileName As String
Dim zoneFileNames As IList(Of String)
Dim format As DocumentFormat
Dim callback As OcrProgressCallback
 
instance.Run(imageFileName, documentFileName, zoneFileNames, format, callback)
function Leadtools.Forms.Ocr.IOcrAutoRecognizeManager.Run(String,String,IList{String},DocumentFormat,OcrProgressCallback)( 
   imageFileName ,
   documentFileName ,
   zoneFileNames ,
   format ,
   callback 
)

パラメーター

imageFileName
imageを格納しているファイルの名前。
documentFileName
結果文書ファイルの名前。
zoneFileNames
用意されたゾーンのファイル名のオプションのリストは、ページを申し込みます。このパラメーターは、nullVisual BasicではNothing)参照でありえます。
形式
出力文書形式。このパラメーターがDocumentFormat.Userであるならば、使われるエンジンがネイティブ形式をサポートするならば、ドキュメントはIOcrDocumentManager.EngineFormatで設定されるネイティブエンジン形式を用いて保存しました、さもなければ、例外はスローされます。
コールバック
操作の進捗を示すオプションのコールバック
解説

このメソッドは、以下の操作を実行します:

  1. JobStartedイベントは呼び出されます。

  2. ページを保存する一つ以上のIOcrDocumentオブジェクトを作成します。作成されるOCRドキュメントの数は、MaximumThreadsPerJobに依存しています。この値が0(最大のCPU/コア)であるか、1より大きい、そして、複数のスレッドがこのエンジンでサポートされるならば、1つ以上のドキュメントは認識プロセスに参加するために作成されるかもしれません。ドキュメントは、ディスクベースであるように、作成されます。

  3. imageFileNameに含まれるすべてのページをループ処理し、各ページに対して以下の操作を行います。

    ページは、IOcrEngine.CreatePageを用いて作成されます。

    現在のページに対して有効なゾーンファイル名がzoneFileNamesに含まれている場合は(この配列のインデックスはロードされたページのインデックスに対応します)、IOcrPage.LoadZonesを使用してゾーンがロードされ、ページに適用されます。zoneFileNamesnullVisual BasicではNothing)参照である、または、現在のページのためのそのエントリが無効な参照であるならば、ページの自動分解することはIOcrPage.AutoZoneで代わりに実行されます。

    IOcrPage.Recognizeは、ページのOCRデータを取得するために呼び出されます。

    OCR Advantageエンジンについては、ページはIOcrDocument.Pages.Addを用いてドキュメントに追加されます。

    OCR Advantage以外のエンジンの場合:複数の文書が使用されている場合、または現在認識されているページのページ番号がMaximumPagesBeforeLtdで指定された最大値よりも大きい場合は、現在の認識データが一時LTDファイルに保存され、OCR文書がクリアされます。

  4. すべてのページが処理されたら、documentFileNameで指定された形式を使用して、形式で指定された結果ファイル名に処理結果が保存されます。LTDが使用された場合は、DocumentWriter.Convertと、必要に応じてDocumentWriter.AppendLtd。を使用して、一時ファイルが最終文書に変換されます。

  5. すべてのOCRドキュメントと一時ファイルは、アンインストール済みです。

  6. JobCompletedイベントは呼び出されます。

  7. 操作進捗を示すか、それを中止するために、スレッディングならばJobProgressイベントまたはコールバックを使うことができますは使用しません。詳細情報とサンプルについては、「OcrProgressCallback」を参照してください。

  8. 実行されている現在の操作に関する情報を取得するために、JobOperationイベントを使うことができます。詳細情報とサンプルについては、「JobOperation」を参照してください。

IOcrAutoRecognizeManagerインターフェースは、このメソッドの利用に、以下のオプションも持っています:

オプション 説明
MaximumPagesBeforeLtd

無制限の頁数でドキュメントを変換することのサポートを追加します。大量のページ(10その他)を格納するドキュメントの上のOCR認識操作は、メモリー不足のエラーに終わるかもしれません。

LEADTOOLS OCRエンジンの全ては、当面のLTDファイル(DocumentFormat.LTD)に中間認識結果を保存することをサポートします。以降のページの結果は、この一時ファイルに追加されます。文書のすべてのページの認識が済んだら、この一時ファイルが目的の形式に変換されます。

MaximumPagesBeforeLtdプロパティは、全体として処理される最大頁数を定義します。たとえば、オリジナルドキュメントが20ページを持っている、そして、このプロパティの値が8であるならば、エンジンは最初の8ページを認識して、一時ファイルに結果を保存すると、第2は8ページ認めます、そして、結果を追加します、そして、最後に、最後の4ページを認めて、最終形式に一時的なドキュメントを変換します。

PreprocessPageCommands

認識の前に各々のページドキュメントの上で実行する操作を自動前処理することを制御するために、OcrAutoPreprocessPageCommand項目の配列を保持します。

MaximumThreadsPerJob

1つのジョブあたりに使用する最大スレッド数。ドキュメントを認めるとき、すべての利用できるマシンCPU/コアを使うために、IOcrAutoRecognizeManagerを指示することができます。そうすると、OCR操作に必要な時間が大幅に短縮されます。

LEADTOOLS Advantage OCRエンジンはシステムスレッドプールを使用し、スレッド数を設定する必要はありません。値1によりスレッド処理が無効化され、そのほかの値は「マルチスレッド処理を使用」として扱われます。

JobErrorMode

致命的なエラーなしで再開する機能。たとえば、ソースドキュメントがページを持っているならば、それは認められることができません。そのページはグラフィック画像として最終文書に追加され、次のページに認識処理が進みます。

JobStartedJobProgressJobOperationJobCompletedイベント

同期および非同期ジョブが開始したとき、実行されているとき、および完了したときを追跡するイベント。

AbortAllJobs

すべての実行と保留のジョブを中止します。

EnableTrace

標準.NETトレースリスナーにデバッグメッセージを出力します。

サンプル
Copy Code  
Imports Leadtools
Imports Leadtools.Codecs
Imports Leadtools.Forms.Ocr
Imports Leadtools.Forms.DocumentWriters
Imports Leadtools.Forms
Imports Leadtools.WinForms

<TestMethod>
Public Sub OcrAutoRecognizeManagerRun1Example()
   Dim tifFileName As String = Path.Combine(LEAD_VARS.ImagesDir, "Ocr1.tif")
   Dim pdfFileName As String = Path.Combine(LEAD_VARS.ImagesDir, "Ocr1.pdf")
   ' Create an instance of the engine
   Using ocrEngine As IOcrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage, False)
      ' Start the engine using default parameters
      Console.WriteLine("Starting up the engine...")
      ocrEngine.Startup(Nothing, Nothing, Nothing, LEAD_VARS.OcrAdvantageRuntimeDir)

      Dim ocrAutoRecognizeManager As IOcrAutoRecognizeManager = ocrEngine.AutoRecognizeManager

      ' Recognize the document
      ocrAutoRecognizeManager.Run(tifFileName, pdfFileName, Nothing, DocumentFormat.Pdf, Nothing)
   End Using
End Sub

Public NotInheritable Class LEAD_VARS
Public Const ImagesDir As String = "C:\Users\Public\Documents\LEADTOOLS Images"
Public Const OcrAdvantageRuntimeDir As String = "C:\LEADTOOLS 19\Bin\Common\OcrAdvantageRuntime"
End Class
using Leadtools;
using Leadtools.Codecs;
using Leadtools.Forms.Ocr;
using Leadtools.Forms.DocumentWriters;
using Leadtools.Forms;
using Leadtools.WinForms;

public void OcrAutoRecognizeManagerRun1Example()
{
   string tifFileName = Path.Combine(LEAD_VARS.ImagesDir, "Ocr1.tif");
   string pdfFileName = Path.Combine(LEAD_VARS.ImagesDir, "Ocr1.pdf");
   // Create an instance of the engine
   using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage, false))
   {
      // Start the engine using default parameters
      Console.WriteLine("Starting up the engine...");
      ocrEngine.Startup(null, null, null, LEAD_VARS.OcrAdvantageRuntimeDir);

      IOcrAutoRecognizeManager ocrAutoRecognizeManager = ocrEngine.AutoRecognizeManager;

      // Recognize the document
      ocrAutoRecognizeManager.Run(tifFileName, pdfFileName, null, DocumentFormat.Pdf, null);
   }
}

static class LEAD_VARS
{
public const string ImagesDir = @"C:\Users\Public\Documents\LEADTOOLS Images";
public const string OcrAdvantageRuntimeDir = @"C:\LEADTOOLS 19\Bin\Common\OcrAdvantageRuntime";
}
必要条件

ターゲットプラットホーム

参照

参照

IOcrAutoRecognizeManagerインターフェース
IOcrAutoRecognizeManagerメンバ
オーバーロードリスト
LEADTOOLS .NET OCRによるプログラミング
LEADTOOLS OCRによるマルチスレッド
LEADTOOLSは、thunkサーバのOCR処理を行います

Leadtools.Forms.Ocrは、認識またはDocument Imaging Suiteのライセンスと、解除キーが必要です。詳細は、以下を参照してください。LEADTOOLSツールキット機能