当您创建 etx 索引时,请通过设置 CHAR_SET 索引参数来指定搜索引擎使用的字符集。您指定的值确定了对文本数据中的哪些字符建立索引以及将哪些字符视为空格。
GBase 8s 提供了三种内置字符集:ASCII、ISO 和 OVERLAP_ISO。 如果这些字符集对于您的特定文本而言还不够,您也可以定义自己的字符集。
创建索引后,就无法更改 CHAR_SET 参数的设置,除非先删除该索引,然后重新创建该索引。 如果没有为 CHAR_SET 指定设置,那么缺省情况下文本搜索引擎将使用 ASCII 字符集。
本部分的最后一部分包含 ISO 8859-1 字符集内所有字符的 16 x 16 映射。 当定义您自己的字符集时,您可能要将该映射用作引用。