标准分析器会除去非索引字和索引词语、数字以及一些特殊字符。标准分析器是缺省分析器。
标准分析器通过以下方式处理文本字符:
在这些示例中,输入字符串显示在第一行,生成的标记显示在第二行,每个标记均以方括号括住。
在以下示例中,将除去非索引字并将词语转换为小写格式:
The Quick Brown Fox Jumped Over The Lazy Dog [quick] [brown] [fox] [jumped] [over] [lazy] [dog]
在以下示例中,将忽略位于词语开始处的撇号以及后跟 s 的撇号,但对位于词语中间的撇号建立索引:
Prequ'ile Mark's 'cause [prequ'ile] [mark] [cause]
在以下示例中,将忽略冒号和反斜杠:
c:/gbasedbt [c] [gbasedbt]
在以下示例中,& 符号将作为公司名称的一部分建立索引:
XY&Z Corporation [xy&z] [corporation]
在以下示例中,将对电子邮件地址原样建立索引:
xyz@example.com [xyz@example.com]
在以下示例中,位于词语开头处的数字将分隔到不同的标记中,而位于词语结尾处的数字将包含在单个标记中:
1abc 12abc abc1 abc12 [1] [abc] [12] [abc] [abc1] [abc12]