BoxWorks 2024でコンテンツとAIの可能性について紹介します。

詳細を表示

通常の検索との比較

通常の検索との比較

一見、メタデータクエリAPIコンテンツの検索APIとよく似ていますが、動作には重要な違いがいくつかあります。大まかに言うと、メタデータクエリAPIは正確さとスループットの向上のために最適化されているのに対し、通常の検索は、人間のユーザーとの関連度のために最適化されています。

詳細な比較

メタデータクエリAPI検索API
インデックスの作成対象このAPIでは、検索対象のメタデータテンプレートの値に基づいてファイル/フォルダのみが返されます。このAPIでは、項目名、説明、コンテンツ (最初の10,000バイトまで) の値のほか、関連付けられたメタデータテンプレートインスタンスに基づいてファイル、フォルダ、ウェブリンクが返されます。
インデックス作成時間このAPIでは、ファイルまたはフォルダのメタデータが追加、削除、更新されるとすぐに正確な結果が返されます。このAPIは、検索インデックスの作成が遅延すると、その影響を受けます。この遅延は通常10分ですが、場合によっては長くなることがあります。つまり、メタデータが更新されてから10分を経過しても項目が返されない場合があります。
一致このAPIでは、SQLの規則に基づいて完全一致が使用されます。結果は、指定した並べ替え順を基に返されます。このAPIでは、あいまい一致が使用されるため、文字列のトークン化、特殊文字の削除、その他の検索コンセプトに基づいて異なる結果が返される場合があります。結果の順序は、項目の関連度または更新日に基づいています。
条件付きロジックこのAPIは、比較演算子を使用するマルチパートブール式をサポートします。このAPIでは、メタデータによるクエリのサポートが限定的です。サポートされるのは、一度に1つのメタデータテンプレートに対するクエリのみで、単純なクエリ操作のみが可能です。
レスポンスタイプこのAPIでは、一致したファイル/フォルダと、クエリによって一致した関連するメタデータの両方が返されます。このAPIで返されるのは、一致した項目のみです。各項目のメタデータを返すには、後続のAPIコールが必要です。
スループット (Throughput)このAPIには現在、ユーザーごとのレート制限のほか、企業あたりのリクエスト数が10件/秒という制限があります。このAPIでは、1ユーザーあたりの検索数は6件/秒、企業あたりの検索数は最大60件/分および12件/秒がサポートされています。
規模このAPIでは、指定したメタデータテンプレートを使用して返される項目数に制限はありません。一致する結果が2,000件以下になるクエリのみを送信することをお勧めします。このAPIには、指定したメタデータテンプレートを使用して返される項目数に制限はありません。ただし、検索に一致する項目数が増えるにつれ、レスポンス時間が大幅に増大します。このAPIでは、1つのクエリに対する結果は1,000万件までという制限があります。一致する結果が50,000件以下になるクエリのみを送信することをお勧めします。
スコープこのAPIは常に、ユーザーがアクセスできるコンテンツに制限されています。このAPIは、ユーザーがアクセスできるコンテンツ (​user_content​) または社内のすべてのコンテンツ (​enterprise_content​) のいずれかに制限される場合があります。

一致する結果が10,000件を超える検索APIコールにより、関連度が多少変化することがあります。そのため、結果が重複する場合や結果が返されない場合があります。大規模なデータセットでは、検索を完全一致のソリューションと考えないでください。

シナリオ

使用するAPIを決定する際に役立つシナリオの例を以下に示します。

企業全体を対象にして用語を検索する

キーワードGuaranteeに一致するコンテンツまたはメタデータを持つすべてのコンテンツを社内で検索します。

この場合は、検索APIをお勧めします。このAPIでは、コンテンツとメタデータの両方で用語を照合し、対象範囲を企業全体のすべてのコンテンツに設定できます。

複数のメタデータ値を検索する

メタデータテンプレート​Contract​を使用して、金額が100,000ドルを超過し、更新日が2019年で、アカウント番号​1234に関連付けられていないすべてのドキュメントを検索します。

この場合は、メタデータクエリAPIをお勧めします。メタデータクエリを使用すると、数値、日付、文字列など、メタデータテンプレート内の複数のフィールドを評価するブール式を作成できます。

メタデータ検索とコンテンツ検索を組み合わせる

メタデータテンプレート​Contract​を使用して、金額が100,000ドルを超過し、更新日が2019年で、タイトルや本文に「Sale」という用語が含まれておらず、アカウント番号​1234に関連付けられていないすべてのドキュメントを検索します。

このシナリオは、現在サポートされていません。現時点では、どちらのAPIも、あいまい検索 (「Sale」の検索) と、メタデータフィールドに一致するブール式の組み合わせをサポートしていません。