LEADTOOLS Leadtools.Documents(Leadtools.Documentsアセンブリ)

フレームを表示

DocumentTextクラス






メンバ 
ドキュメントのテキストオプションを管理します。
オブジェクトモデル
構文
[DataContractAttribute()]
public class DocumentText 
'Declaration
 
<DataContractAttribute()>
Public Class DocumentText 
'Usage
 
Dim instance As DocumentText
public class DocumentText implements Serializable
            
[DataContractAttribute()]
public ref class DocumentText 
解説

DocumentTextはドキュメントのテキストを管理し、ドキュメントのTextプロパティを通してアクセスできます。

ドキュメントページのテキストは、DocumentPage.GetTextメソッドを用いて抽出されることができます。これは、場所とサイズプロパティでページで見つけられるテキストキャラクタを格納するDocumentPageTextインスタンスを返します。さらに、DocumentPageTextは、処理が簡単になるように、語句またはテキストを文字列として構築します。

フレームワークはどちらのSVGでも使うことができるか、テキストデータを抽出するテクノロジーのOCR処理を行うことができます。どのメソッドを使用するかは、TextExtractionModeプロパティを使用して制御します。

詳細については、「ドキュメントライブラリによるテキストの解析」を参照してください。

サンプル
Copy Code  
Imports Leadtools
Imports Leadtools.Codecs
Imports Leadtools.Forms.DocumentWriters
Imports Leadtools.Svg
Imports Leadtools.Documents
Imports Leadtools.Caching
Imports Leadtools.Annotations.Core
Imports Leadtools.Barcode
Imports Leadtools.Forms.Ocr

<TestMethod()> _
Public Sub DocumentTextExample()
   Dim options As New LoadDocumentOptions()
   options.UseCache = False
   Using document As Leadtools.Documents.Document = DocumentFactory.LoadFromFile(Path.Combine(ImagesPath.Path, "Leadtools.tif"), options)
      'for the TIF file we need an OCR engine
      Dim ocrEngine As IOcrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage, False)
      Dim rasterCodecs As New RasterCodecs()
      Dim documentWriter As New DocumentWriter()
      ocrEngine.Startup(rasterCodecs, documentWriter, Nothing, LEAD_VARS.OcrAdvantageRuntimeDir)

      document.Text.OcrEngine = ocrEngine

      ' get text 
      Dim page As Leadtools.Documents.DocumentPage = document.Pages(0)
      Dim pageText As DocumentPageText = page.GetText()
      If Not pageText Is Nothing Then
         pageText.BuildText()
         Dim text As String = pageText.Text

         Console.WriteLine(text)
      Else
         Console.WriteLine("Failed!")
      End If
   End Using
End Sub
using Leadtools;
using Leadtools.Codecs;
using Leadtools.Forms.DocumentWriters;
using Leadtools.Svg;
using Leadtools.Documents;
using Leadtools.Caching;
using Leadtools.Annotations.Core;
using Leadtools.Forms.Ocr;
using Leadtools.Barcode;

[TestMethod]
public void DocumentTextExample()
{
   var options = new LoadDocumentOptions();
   options.UseCache = false;
   using (var document = DocumentFactory.LoadFromFile(Path.Combine(ImagesPath.Path, "Leadtools.tif"), options))
   {
      //for the TIF file we need an OCR engine
      var ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage, false);
      var rasterCodecs = new RasterCodecs();
      var documentWriter = new DocumentWriter();
      ocrEngine.Startup(rasterCodecs, documentWriter, null, LEAD_VARS.OcrAdvantageRuntimeDir);

      document.Text.OcrEngine = ocrEngine;

      // get text 
      var page = document.Pages[0];
      var pageText = page.GetText();
      if (pageText != null)
      {
         pageText.BuildText();
         var text = pageText.Text;

         Console.WriteLine(text);
      }
      else
      {
         Console.WriteLine("Failed!");
      }
   }
}
必要条件

ターゲットプラットホーム

参照

参照

DocumentTextメンバ
Leadtools.Documents名前空間

   Leadtools.Documentsは、DocumentまたはMedicalツールキットのライセンスと、解除キーが必要です。詳細は、以下を参照してください。LEADTOOLSツールキット機能