LEADTOOLS OCR

フレームを表示

そのライフタイムの間、OCRエンジンは、入力ラスター画像をロードするRasterCodecsオブジェクトと出力ドキュメントを作成するDocumentWriterオブジェクトの使用を必要とします。

まず最初に、IOcrEngineStartupメソッドにRasterCodecsDocumentWriterインスタンスを渡します。これは、下記のようにいろいろな操作のためにエンジンで作成される任意の以降のRasterCodecsDocumentWriterインスタンスのテンプレートと考えられます。

RasterCodecsIOcrEngineStartupに反対して無効な参照が渡されるならば、OCRエンジンはIOcrEngine.RasterCodecsInstanceを通していずれアクセスできる初期化プロセスの間にRasterCodecsオブジェクトを作成します。OCRエンジンがこのインスタンスを作成するとき、それはデフォルト値から以下を変更します:


            rasterCodecsInstance.Options.RasterizeDocument.Load.XResolution = 300
            rasterCodecsInstance.Options.RasterizeDocument.Load.YResolution = 300
            rasterCodecsInstance.Options.Pdf.Load.DisplayDepth = 0
            

PDF、XP、doc DOCX (2007/2010)、XL、XLSX (2007/2010)と認識にふさわしい解像度で物理サイズを格納しないHTMLなどのドキュメントファイルフォーマットをロードすることを可能にするために、これらの値は、デフォルト値から変更されます。詳細は、CodecsRasterizeDocumentLoadOptions.XResolutionCodecsRasterizeDocumentLoadOptions.YResolutionCodecsPdfLoadOptions.DisplayDepthを参照します。

独自の、RasterCodecsオブジェクトはIOcrEngineStartupに渡されます、アプリケーションがそのような文書形式のロードすることを必要とするならば、上記のように同じパラメータを設定することは最善です。

DocumentWriterIOcrEngineStartupに反対して無効な参照が渡されるならば、OCRエンジンはIOcrEngine.DocumentWriterInstanceを通していずれアクセスできる初期化プロセスの間にDocumentWriterオブジェクトも作成します。RasterCodecsインスタンスとは異なり、この初期オブジェクトは、すべてのオプションをデフォルト値に設定しておきます。

LEADTOOLS OCRエンジンがマルチスレッドのドキュメントをサポートするため、作成される各々のIOcrDocumentはイメージをロードして、文書ファイルを作成することをRasterCodecsDocumentWriterのそれ自身のインスタンスに要求します。これらのオブジェクトは、IOcrDocumentIOcrDocumentManager.CreateDocumentを通して作成されるとき自動的に作成されて、それぞれIOcrDocument.RasterCodecsInstanceIOcrDocument.DocumentWriterInstanceを通してアクセスされます。

IOcrEngineインスタンスの代わりにこれらのインスタンスを使うことは、IOcrDocumentにイメージをロードするか、オプションを変更するか、マルチスレッディング状況で特にLTDファイルを変換するために手動でDocumentWriterインスタンスを使うとき、最善です。

まず最初に、これらのオブジェクトは、IOcrEngine.RasterCodecsInstanceIOcrEngine.DocumentWriterInstanceと同じオプションを格納します。IOcrDocument.UseEngineInstanceOptionsプロパティはドキュメントが使用の前にこれらのオプションを再び取得しなければならないかどうか制御します、そして、そのデフォルト値はすべての現在と将来のIOcrDocumentのもののためにグローバルにRasterCodecsDocumentWriterオプションを簡単に変更することをtrue可能にしています。

例えば、PDF/A(同じIOcrEngineのすべて)に保存するimage/テキストオプションともう一つでPDFに1つのIOcrDocumentオブジェクトを保存することが必要であるとします。単にfalseに各々のドキュメントのためにIOcrDocument.UseEngineInstanceOptionsを設定します、そして、IOcrEngine.DocumentWriterInstanceを使う代わりに、各々のドキュメントのIOcrDocument.DocumentWriterInstanceを通してPDFオプションを変更します。