ファイルからメタデータを抽出する (構造化)
ファイルからメタデータを抽出する (構造化)
Box AI APIを使用すると、指定したファイルからメタデータを抽出し、結果をキー/値ペアの形式で取得することができます。入力には、fieldsパラメータを使用して構造を作成するか 、すでに定義済みのメタデータテンプレートを使用できます。テンプレートの作成の詳細については、メタデータテンプレートのカスタマイズを参照するか、メタデータテンプレートAPIを使用してください。
サポートされているファイル形式
このエンドポイントでは、以下のファイル形式がサポートされています。
- TIFF
- PNG
- JPEG
Box AIは、画像ファイル (TIFF、PNG、JPEG) やスキャンしたドキュメントを処理する際、自動的に光学式文字認識 (OCR) を適用します。これにより、抽出前に画像をPDFに変換する必要がなくなるため、時間の節約と統合の簡略化が実現します。
サポートされている言語
Box AIは、以下の言語のドキュメントからメタデータを抽出できます。
-
英語
-
日本語
-
中国語
-
韓国語
-
キリル文字ベースの言語 (ロシア語、ウクライナ語、ブルガリア語、セルビア語など)
異なる言語や画像形式を使用するために追加の構成は必要ありません。Box AIは、自動的に言語を検出し、必要に応じてOCRを適用します。