标准分析器

标准分析器会除去非索引字和索引词语、数字以及一些特殊字符。标准分析器是缺省分析器。

标准分析器通过以下方式处理文本字符：

示例

在这些示例中，输入字符串显示在第一行，生成的标记显示在第二行，每个标记均以方括号括住。

在以下示例中，将除去非索引字并将词语转换为小写格式：

The Quick Brown Fox Jumped Over The Lazy Dog
[quick] [brown] [fox] [jumped] [over] [lazy] [dog]

在以下示例中，将忽略位于词语开始处的撇号以及后跟 s 的撇号，但对位于词语中间的撇号建立索引：

Prequ'ile Mark's 'cause 
[prequ'ile] [mark] [cause]

在以下示例中，将忽略冒号和反斜杠：

c:/gbasedbt 
[c] [gbasedbt]

在以下示例中，& 符号将作为公司名称的一部分建立索引：

XY&Z Corporation 
[xy&z] [corporation]

在以下示例中，将对电子邮件地址原样建立索引：

xyz@example.com
[xyz@example.com]

在以下示例中，位于词语开头处的数字将分隔到不同的标记中，而位于词语结尾处的数字将包含在单个标记中：

1abc 12abc abc1 abc12
[1] [abc] [12] [abc] [abc1] [abc12]