更新统计信息操作期间的数据采样

如果您具有超过 100 K 叶子页的大型 B 型树索引,那么可以在 LOW 方式下运行 UPDATE STATISTICS 语句时根据采样生成索引统计信息。通过采样收集统计信息可以提高更新统计信息操作的速度。

缺省情况下,当 UPDATE STATISTICS 语句运行时,数据库服务器会按顺序读取所有索引叶子页以收集统计信息,例如叶子页数、唯一前导键值数和集群信息。对于大型索引,这可能会花费很长时间。使用采样功能时,数据库服务器会读取一小部分的索引叶子页(样本),然后根据从样本收集的统计信息推断出索引统计信息。

收集统计信息的时间变短的代价可能是所收集的统计信息的准确性。如果前导索引键的数据分发中存在重大偏差,那么采样方法可能会导致所收集的统计信息存在较大的误差范围,而这可能会影响优化器在生成查询计划时所做的决策。

您不能控制样本中的数据量。

要启用或禁用采样功能,请使用 USTLOW_SAMPLE 配置参数或 SET ENVIRONMENT 语句的 USTLOW_SAMPLE 环境选项。