LEADTOOLS Leadtools.Documents(Leadtools.Documentsアセンブリ)

フレームを表示

GetText()メソッド






このページのテキストコンテンツを取得します。
構文
public DocumentPageText GetText()
'Declaration
 
Public Overloads Function GetText() As DocumentPageText
'Usage
 
Dim instance As DocumentPage
Dim value As DocumentPageText
 
value = instance.GetText()
public DocumentPageText getText()
            
public:
DocumentPageText^ GetText(); 

戻り値

DocumentPageTextとしてのこのDocumentPageのテキストコンテンツオブジェクト。
解説

GetTextは、ページのテキストコンテンツを解析するのに用いられます。すべてのドキュメントタイプはこのメソッドをサポートして、内部的にLEADTOOLS SVGを使うか、ドキュメントからテキストを得るエンジンのOCR処理を行います。

SetTextは、ページのテキストコンテンツを置換するのに用いられます。IsTextModifiedは、ユーザーがこのページのテキストを置換したことを示すフラグとして使われます。

このメソッドは以下のように機能します(「項目」は、テキストコンテンツです):

  1. 項目がキャッシュで見つけられるならば、それはすぐに返されます。ドキュメントがキャッシュシステムを用いて作成されるならば、これは利用できます。そして、Document.CacheOptionsDocumentCacheOptions.PageTextを格納します。

  2. DocumentImages.IsSvgSupportedDocumentText.TextExtractionModeの値は、テキストがLEADTOOLS SVGかOCRエンジンを用いてページから解析されるかどうか決定します。

  3. SVGがサポートされるならば、GetSvgは呼び出されます、そして、テキストはOCRを使わずに直接SVGコンテンツから解析されます。

  4. OCRがサポートされるそうでない場合、そして、そうされるならば、そしてGetImageは呼び出されます、そして、テキストはOCRを用いてラスター画像から解析されます。

  5. このドキュメントがキャッシュシステム(Document.HasCachetrueです)を使うならば、それが返される前に、DocumentPageTextオブジェクトはキャッシュに保存されます。次にこのメソッドが呼び出される時に、テキストは再びそれを解析することなく直接キャッシュから返されます。

DocumentText.AutoParseLinksの値がtrueであり、ページのテキストがGetTextを使って最初に取得されるとき、DocumentText.LinkPatterns。に格納される正規表現に基づいてリンクのテキストも解析しようとします。詳細については、「AutoParseLinks」を参照してください。

SetTextが以前にテキストパラメーターのために無効なオブジェクトで呼び出されていた場合、このメソッドもnullを返すのでご注意ください。

全ての場合において、それが返されたあと、返されたDocumentPageTextオブジェクトはこのドキュメントにより用いられません。

LEADTOOLSドキュメントビューワは、そのような操作が見つけるすべてのテキストで使われるテキストを得て、テキストを選択して、レビューアノテーションオブジェクトにメールを送るために、このメソッドを使います。

詳細については、「ドキュメントライブラリによるテキストの解析」を参照してください。

サンプル
Copy Code  
Imports Leadtools
Imports Leadtools.Codecs
Imports Leadtools.Forms.DocumentWriters
Imports Leadtools.Svg
Imports Leadtools.Documents
Imports Leadtools.Caching
Imports Leadtools.Annotations.Core
Imports Leadtools.Barcode
Imports Leadtools.Forms.Ocr

<TestMethod()> _
Public Sub DocumentPageGetTextExample()
   Dim options As New LoadDocumentOptions()
   options.UseCache = False
   Using document As Leadtools.Documents.Document = DocumentFactory.LoadFromFile(Path.Combine(ImagesPath.Path, "Leadtools.tif"), options)
      'for the TIF file we need an OCR engine
      Dim ocrEngine As IOcrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage, False)
      Dim rasterCodecs As New RasterCodecs()
      Dim documentWriter As New DocumentWriter()
      ocrEngine.Startup(rasterCodecs, documentWriter, Nothing, LEAD_VARS.OcrAdvantageRuntimeDir)

      document.Text.OcrEngine = ocrEngine

      ' get text 
      Dim page As Leadtools.Documents.DocumentPage = document.Pages(0)
      Dim pageText As DocumentPageText = page.GetText()
      If Not pageText Is Nothing Then
         pageText.BuildText()
         Dim text As String = pageText.Text

         Console.WriteLine(text)
      Else
         Console.WriteLine("Failed!")
      End If
   End Using
End Sub
using Leadtools;
using Leadtools.Codecs;
using Leadtools.Forms.DocumentWriters;
using Leadtools.Svg;
using Leadtools.Documents;
using Leadtools.Caching;
using Leadtools.Annotations.Core;
using Leadtools.Forms.Ocr;
using Leadtools.Barcode;

[TestMethod]
public void DocumentPageGetTextExample()
{
   var options = new LoadDocumentOptions();
   options.UseCache = false;
   using (var document = DocumentFactory.LoadFromFile(Path.Combine(ImagesPath.Path, "Leadtools.tif"), options))
   {
      //for the TIF file we need an OCR engine
      var ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage, false);
      var rasterCodecs = new RasterCodecs();
      var documentWriter = new DocumentWriter();
      ocrEngine.Startup(rasterCodecs, documentWriter, null, LEAD_VARS.OcrAdvantageRuntimeDir);

      document.Text.OcrEngine = ocrEngine;

      // get text 
      var page = document.Pages[0];
      var pageText = page.GetText();
      if (pageText != null)
      {
         pageText.BuildText();
         var text = pageText.Text;

         Console.WriteLine(text);
      }
      else
      {
         Console.WriteLine("Failed!");
      }
   }
}
必要条件

ターゲットプラットホーム

参照

参照

DocumentPageクラス
DocumentPageメンバ
オーバーロードリスト

   Leadtools.Documentsは、DocumentまたはMedicalツールキットのライセンスと、解除キーが必要です。詳細は、以下を参照してください。LEADTOOLSツールキット機能