模糊搜索的词分数

如果已使用 WORD_SUPPORT = PATTERN 索引参数创建索引,那么搜索引擎将考虑与线索近似匹配和精确匹配的词。搜索引擎使用模糊逻辑来确定是否将模式匹配视为命中。它根据其内部规则为候选匹配项分配分数。

缺省情况下,只有与搜索线索相对匹配度为 70%(词分数为 70 或更高)的词才考虑为命中。 通过为 WORD_SCORE 调整参数指定您自己的值,可以更改该缺省值。

例如,假设您想要文本搜索引擎只计算与线索匹配不低于 85% 的命中词。通过在 etx_contains() 运算符中设置 WORD_SCORE = 85,可以指定该条件,如以下示例中所示:
SELECT id, description FROM videos
    WHERE etx_contains ( description,
    Row('multimedia document editor' , 
        'PATTERN_TRANS & PATTERN_SUBS & WORD_SCORE = 85'));

以下部分显示了如何执行由 GBase 8s Excalibur Text Search DataBlade 模块启用的模糊搜索类型。