LEADTOOLS Leadtools.Documents(Leadtools.Documentsアセンブリ)

フレームを表示

DocumentPageTextクラス






メンバ 
ドキュメントページで見つかったテキストキャラクタとワードを格納します。
オブジェクトモデル
構文
[DataContractAttribute()]
[SerializableAttribute()]
public class DocumentPageText 
'Declaration
 
<DataContractAttribute()>
<SerializableAttribute()>
Public Class DocumentPageText 
'Usage
 
Dim instance As DocumentPageText
public class DocumentPageText implements Serializable
            
[DataContractAttribute()]
[SerializableAttribute()]
public ref class DocumentPageText 
解説

ドキュメントページのテキストは、DocumentPage.GetTextメソッドを使用して読むことができます。ページで見つかったテキストキャラクタは、返されたDocumentPageTextオブジェクトの文字プロパティで設定されます。

テキストのワードは、ドキュメント解析エンジンで返されるIsEndOfWordに基づくドキュメントで見つけられる文字から作成されます。「言葉の最後」が見つかると、最後の文字セットがグループ化されワードリストに1つの項目として保存されます。これは自動的に実行されません、代わりに、文字からワードリストを値を入力するためにBuildWordsを呼び出さなければなりません。

ドキュメントページテキストは、Textプロパティを通しての単純なstringオブジェクトとして得られることもできます。これは自動的に実行されません、そして、文字からテキスト値でこのプロパティを値を入力するためにBuildTextを呼び出さなければなりません。BuildTextは、ユーザーが最初に実行していなければ最初にBuildWordsを呼び出すことで言葉も組み立てます。

DocumentWordオブジェクトのFirstCharacterIndexLastCharacterIndexは、文字リストでオリジナルの文字へワードをマップするのに用いられることができます。同様に、よく文字リストでのその役割へずっとテキスト文字列をマップするのに用いられることができるTextMapリストの通りのテキストを値を入力するために、BuildTextWithMapを使うことができます。

いつでも、文字リストを更新することができて、ワードテキストTextMapを再生させるために、上のメソッドのどれでも呼び出すことができます。生成される値をクリアするために、ClearBuildDataを使います。

テキストはどちらのSVGまたはOCR技術を用いてでもオリジナルドキュメントから解析されます、詳細は、ドキュメントライブラリによるテキストの解析を参照します。

サンプル
Copy Code  
Imports Leadtools
Imports Leadtools.Codecs
Imports Leadtools.Forms.DocumentWriters
Imports Leadtools.Svg
Imports Leadtools.Documents
Imports Leadtools.Caching
Imports Leadtools.Annotations.Core
Imports Leadtools.Barcode
Imports Leadtools.Forms.Ocr

Public Sub DocumentPageTextExample()
   Dim options As New LoadDocumentOptions()
   options.UseCache = False
   Using document As Document = DocumentFactory.LoadFromFile(Path.Combine(ImagesPath.Path, "Leadtools.doc"), options)
      ' get text 
      Dim page As Leadtools.Documents.DocumentPage = document.Pages(0)
      Dim pageText As DocumentPageText = page.GetText()
      If Not IsNothing(pageText) Then
         pageText.BuildText()
         Dim text As String = pageText.Text

         Console.WriteLine(text)
      Else
         Console.WriteLine("Failed!")
      End If
   End Using
End Sub
using Leadtools;
using Leadtools.Codecs;
using Leadtools.Forms.DocumentWriters;
using Leadtools.Svg;
using Leadtools.Documents;
using Leadtools.Caching;
using Leadtools.Annotations.Core;
using Leadtools.Forms.Ocr;
using Leadtools.Barcode;

[TestMethod]
public void DocumentPageTextExample()
{
   var options = new LoadDocumentOptions();
   options.UseCache = false;
   using (var document = DocumentFactory.LoadFromFile(Path.Combine(ImagesPath.Path, "Leadtools.doc"), options))
   {
      // get text 
      var page = document.Pages[0];
      var pageText = page.GetText();
      if (pageText != null)
      {
         pageText.BuildText();
         var text = pageText.Text;

         Console.WriteLine(text);
      }
      else
      {
         Console.WriteLine("Failed!");
      }
   }
}
必要条件

ターゲットプラットホーム

参照

参照

DocumentPageTextメンバ
Leadtools.Documents名前空間

   Leadtools.Documentsは、DocumentまたはMedicalツールキットのライセンスと、解除キーが必要です。詳細は、以下を参照してください。LEADTOOLSツールキット機能