検索インデックス作成
検索インデックス作成
Boxは、Boxに格納されているファイルまたはフォルダの検索インデックスを保持します。ファイルまたはフォルダが変更されるたびに、これらの単語がインデックスに追加されます。検索が実行されると、APIは、検索インデックスで、クエリに一致するファイルやフォルダを探します。Box内でコンテンツが追加、更新、または削除されると、それに応じて検索インデックスが更新されます。
検索可能になるまでの時間
ファイルのアップロードまたは変更後、そのファイルにインデックスが完全に作成され、検索できるようになるまで時間がかかる場合があります。ほとんどの場合、新しく追加または変更されたファイルは、10分以内にBoxの検索で検索可能になります。ただし、場合によ っては、インデックス作成時間はその時点のサービスの負荷によって決まるため、10分を超えることもあります。
検索アクセス
検索結果では、認証済みユーザーがアクセスできるコンテンツ (プレビュー/表示できる項目) のみが返されます。
つまり、検索結果に表示されるためには、ユーザーが所有する項目かコラボレーションしている項目である必要があります。ユーザーが項目にアクセスできない場合や共有リンクを介して項目が共有されている場合は、その項目も検索結果に表示されません。
ただし、例外として、共有リンクを介して最近アクセスされた項目は、include_recent_shared_links
クエリパラメータをtrue
に設定することで、検索結果に含めるようリクエストすることができます。
プレフィックス検索とワイルドカード検索
末尾のワイルドカード (プレフィックス検索とも呼ばれます) が検索結果に暗黙的に適用されているのは、テキストのインデックス作成方法が原因です。Bo
を検索すると、タイトルにBox
、Boat
、またはBoxer
が含まれる項目が返されます。これは従来の検索エンジンでBo*
またはBo%
を検索した結果と同じになります。Boxでは、%ox%
のような従来のワイルドカードの表記法がサポートされていません。Boxは、タイトルのプレフィックス検索に対応していますが、本文コンテンツのプレフィックス検索、タイトルまたは本文コンテンツのサフィックス検索、タイトルまたは本文コンテンツのインフィックス (部分) 検索には対応していません。たとえば、cal
を検索すると、California
というファイル名が一致しますが、decal
またはrecall
は一致しません。この場合、California
、recall
、decal
を含め、ファイル本文のコンテンツでのプレフィックス、インフィックス、またはサフィックスとは一致しません。
ステミング
Boxの検索では、ステミングを使用して、クエリの単語をインデックスの単語と照合します。このため、同じ語幹を含む単語は、クエリ内と完全に同じ形式でなくても、結果セットに含まれる場合があります。たとえば、run
とrunning
は同じ語幹に対応するため、running
で検索すると、タイトルにrun
を含むドキュメントが返されます。