对于计算列分发统计信息,在 MEDIUM 模式下,您可可选地使用 SAMPLING SIZE 关键字来指定采样的行的最小数。如果 Resolution 子句省略 RESOLUTION
关键字且未指定
confidence 级别,也未指定
percent 值,则
GBase 8s
采样的行数将会是下列两个值中的较大者:
- 您紧跟在 SAMPLING SIZE 关键字之后指定的 min 值
- 在每一 bin 中行的缺省 percent(2.5%)以及最小的 confidence 级别(0.80)所需要的采样大小。
如果在 Resolution 子句中指定采样大小,包括为每 bin 的采样的行的平均
percent 以及为
confidence 级别的显式的值,则采样的行的数目将会是这两个值中的较大者:
- 您紧跟在 SAMPLING SIZE 之后指定的 min 值
- 指定的行的 percent 和指定的 confidence 级别所需要的采样大小。
如果在 Resolution 子句中指定采样大小,包括平均的 percentage 值,但未设置 confidence 级别,则使用最小的 confidence 值 0.80 来计算
GBase 8s
要使用的实际采样大小,如果指定的 size 较小的话。
例如,下列语句计算
customer 表的两列的统计信息,而不更新索引信息。将至少采样 200 行,但样例的实际大小可能大于 200,
如果对于使用大约 50 equivalence categories 的样例分发,以每一 bin 中采样值的平均百分率 2%,需要更多的行来提供缺省的 0.80 信任级别的话。
UPDATE STATISTICS MEDIUM FOR TABLE customer (city, state)
SAMPLING SIZE 200 RESOLUTION 2 DISTRIBUTIONS ONLY;
不管您是否在 Resolution 子句中包括显式的 SAMPLING SIZE 规范,在 MEDIUM 模式 UPDATE STATISTICS 创建的时刻,
GBase 8s
都在系统目录中记录实际的采样大小(作为该表中行的总数的百分率)。