[salesforce]salesforceコンテンツの全文検索機能
Salesforceコンテンツでは、アップロードされているファイルの内容を全文検索できるという便利機能があります。検索対象は以下のファイルです。
- リッチテキスト形式 (RTF)
- UTF-8 エンコード TXT
- HTML
- XML
- Adobe® PDF
- Microsoft® Office 97 から Microsoft Office 2007 までの Word、Excel、および PowerPoint ファイル
これは便利機能だと思いきや日本語だとうまく検索がされないようです。確認をしたところ、この全文検索機能における1単語の判別は、文字と数字を分けた上で、スペースや記号で区切られた範囲を索引としているようです。
要するに、英単語のようにスペースで区切られた場合だけ単語として検索対象となり、日本語のような文章を形態素解析して単語単位で検索する機能が無いようです。
例えば、SalesforceコンテンツにアップロードしているExcelファイル内に「株式会社ウフル」という単語があり、全文検索で「会社」や「ウフル」という単語で検索してもヒットせず、「株式会社ウフル」と完全一致する文字列で検索する必要があるようです。これはちょっと微妙。。