字符集

etx 索引构建在包含文本文档的列上时,字符集定义要建立索引的字符。文本文档中任何在指定字符集中未找到的字符在索引中被视作空格。但字符在文本文档本身中并未变化。

使用 CREATE INDEX 语句创建 etx 索引时,通过将 CHAR_SET 索引参数设置为字符集名称来指定字符集。

GBase 8s Excalibur Text Search DataBlade 模块提供了三种内置字符集:ASCII、ISO 和 OVERLAP_ISO。如果提供的字符集不适合您的文本文档,那么您也可以定义自己的字符集。
重要: 在索引中不同字符集支持不同数量的字符。字符集支持的字符越多,在线索词中被搜索的字符就越少,反之亦然。

以下部分介绍了内置字符集,并解释创建您自己的字符集的时机和方式。