非索引字是指要从索引中排除,因此也会从搜索中排除的词。典型的非索引字列表包含类似于 of、the 和 by 的词。非索引字列表取决于数据的内容和类型。
您想要从索引中排除的任何高频词都是非索引字列表包含的候选值。非索引字列表可以缩短执行搜索所花费的时间、减小索引大小并有助于避免错误命中。
EXECUTE PROCEDURE etx_CreateStopWlst ('stopwlist', '/local0/excal/stopwlist');
该语句从操作系统文件 /local0/excal/stopwlist 中创建非索引字列表 stopwlist。第三个可选参数可用于指定列表将存储在的智能大对象空间。如果不指定特定的智能大对象空间来存储该列表,那么会将该列表存储在缺省的智能大对象空间中。缺省的智能大对象空间由 onconfig 文件中的 SBSPACENAME 参数指定。
$GBASEDBTDIR/extend/ETX.version/wordlist/etx_stopwords.txt其中,version 是指您计算机上安装的 DataBlade 模块的当前版本。
您最多可以将一个非索引字列表与 etx 索引关联。非索引字列表是在最初创建索引时使用索引参数 STOPWORD_LIST 指定的。创建 etx 索引时必须存在非索引字列表。
SELECT id, description FROM videos WHERE etx_contains(description, Row('to be or not to be', 'SEARCH_TYPE = PHRASE_EXACT & CONSIDER_STOPWORDS'));