LEADTOOLS Leadtools.Documents(Leadtools.Documentsアセンブリ)

フレームを表示

BuildWordsメソッド






ドキュメントページで見つけられるワードのリストを構築します。
構文
public void BuildWords()
'Declaration
 
Public Sub BuildWords() 
'Usage
 
Dim instance As DocumentPageText
 
instance.BuildWords()
public void buildWords()
            
public:
void BuildWords(); 
解説

テキストのワードは、ドキュメント解析エンジンで返されるIsEndOfWordに基づくドキュメントで見つけられる文字から作成されます。「言葉の最後」が見つかると、最後の文字セットがグループ化されワードリストに1つの項目として保存されます。これは自動的に実行されません、代わりに、文字からワードリストを値を入力するためにBuildWordsを呼び出さなければなりません。

以下は、このメソッドがどのように機能するかについて説明します。ページテキストが以下のstringHello Worldから構成されるならば、テキストパーサエンジンは以下のように文字を値を入力します(境界を無視する):

インデックス Code IsEndOfWord IsEndOfLine
0 H false false 1 e false false 2 l false false 3 l false false 4 o true false 5 W false false 6 o false false 7 r false false 8 l false false 9 d true true

BuildWordsは、IsEndOfWordの項目がtrueになるまで各文字をループ処理します。 次に、それまでに見つかった文字から言葉を作成します。この場合はインデックス0から4です。文字はDocumentWord.Value(stringHello)に結合されます、そして、これらの文字positionの合併と場所(DocumentCharacter.Bounds)はDocumentWord.Boundsに設定されます。最初のインデックス(0)と最後のインデックス(4)は、DocumentWord.FirstCharacterIndexDocumentWord.LastCharacterIndexに設定されます。

メソッドは次の文字(インデックス5)にその後続行します、そして、操作、この時間を使っているインデックス5と9を繰り返します、そして、結果はDocumentWord.Valueを設定するDocumentWordWorld、5に設定されるFirstCharacterIndexと9に設定されるLastCharacterIndexです。

詳細については、「ドキュメントライブラリによるテキストの解析」を参照してください。

サンプル

サンプルのために、参照しますDocumentPageText

必要条件

ターゲットプラットホーム

参照

参照

DocumentPageTextクラス
DocumentPageTextメンバ

   Leadtools.Documentsは、DocumentまたはMedicalツールキットのライセンスと、解除キーが必要です。詳細は、以下を参照してください。LEADTOOLSツールキット機能