テキストレプリゼンテーションの取得
テキストレプリゼンテーションの取得
テキストレプリゼンテーションでは、ドキュメントからプレーンテキストを抽出できます。
テキストは、プレーンテキストを含むさまざまな種類のドキュメントファイルやBoxでサポートされているコードファイルに対して生成されます。テキストレイヤがないため、画像ファイルは含まれません。
テキストレプリゼンテーションは、PDFやサムネイルと同様に、ファイルのアップロード時に生成されます。ただし、500 MBを超えるファイルに対しては生成されません。
手順
テキストレプリゼンテーションを取得するには、以下の手順に従います。
- すべてのレプリゼンテーションのリストを取得する
- 値
[extracted_text]
を指定したx-rep-hints
ヘッダーを渡して、テキストレプリゼンテーションをリクエストする url_template
を呼び出してテキストをダウンロードする。その際、{+asset_path}
を空の文字列に置き換えます。