STOPWORD_LIST 参数

使用 STOPWORD_LIST 参数可指定不希望对其建立索引的词的列表。

这些非索引字是文本搜索中不相关的词,例如 andbythe。该列表中的所有词都自动从文本搜索中排除,从而极大地提高性能。

如果在创建 etx 索引时没有指定非索引字列表,那么会对文档中的所有词建立索引。在这种情况下,诸如 thean 的词与如 video multimedia 一样成为搜索中要考虑的词,并且搜索返回的行更多,其中很多行可能毫无用处。etx 索引需要变得更大以包含文档中的每个词,因此搜索变得更慢。

非索引字列表必须存在,才能将其指定为索引参数。要创建非索引字列表,请使用例程 etx_CreateStopWlst(),并将包含非索引字列表的操作系统文件的名称传递给此例程。

创建非索引字列表时,可以使用您自己的非索引字列表,也可以使用 GBase 8s Excalibur Text Search DataBlade 模块提供的非索引字列表:
$GBASEDBTDIR/extend/ETX.version/wordlist/etx_stopwords.txt
其中,version 是指您计算机上安装的 DataBlade 模块的当前版本。