LEADTOOLS Leadtools.Documents

フレームを表示

Documentクラスは、LEADTOOLS SVGまたはOCR技術を用いて任意のページのテキストを解析することをサポートします。これは、フルテキストの検索などの行動を実行して、ドキュメントの上でテキストをハイライトして、テキストベースのアノテーションレビューオブジェクトを作成するのにアプリケーションを見込みます。LEADTOOLSドキュメントビューワライブラリとドキュメントビューワデモは、そのようなサンプルです。

テキストは、以下の2通りの方法で解析されることができます:

それは100%の精度のためのSVGエンジンを用いてテキストデータと最大限が促進する抽出物よりもましだ。SVGデータが利用できないならば、OCRが使われなければなりません。Documentクラスは、すべての内部の詳細を非表示にしている間自動的に上記を実行することをサポートします。SVGまたはOCRが使われたか否かを問わず、クラスのユーザーは同様にテキストデータを得ます。

テキストは、DocumentPage.GetTextメソッドを用いてページにつき得られることができます。これは、その場所、サイズとcodeを含むページの上で見つけられる各々の文字に関する情報を格納するDocumentPageTextオブジェクトを返します。SVGまたはOCRが使われたか否かを問わず、この情報は統一されます。またクラスにはヘルパーメソッドも含まれ、これらの文字を語句、行またはシンプルな文字列プロジェクトに編成します。詳細については、「DocumentPageText」を参照してください。

キャッシュがドキュメントで使われるならば、DocumentPage.GetTextへの以降の呼び出しはキャッシュからデータを取ってきます、そして、操作の速度を上げることは二度と解析されません。

DocumentPage.GetTextが呼び出されるとき、Documentオブジェクトはテキストがどのように解析されるか決定するためにDocumentTextで設定されるオプションを使います。これらの設定はDocument.Textプロパティで、ドキュメントのすべてのページにグローバルです。これらは以下を含みます:

LEADTOOLS OCRとSVG技術は完全にスレッドセーフです、そして、ユーザーは任意のスレッド数から同じ時間に任意のページ数を解析することができます。

サンプルのために、言及しますDocumentText、そしてDocumentPage.GetText

参照

参照

ドキュメントライブラリ機能
LEADTOOLSドキュメントライブラリを使用したロード
LEADTOOLSドキュメントライブラリを使用したアップロード
ドキュメントライブラリ座標システム
ドキュメントライブラリを使用した暗号化ファイルのロード
ドキュメントライブラリによるバーコード処理
LEADTOOLSドキュメントビューワの使用
LEADTOOLSドキュメントコンバーターの使用