指定 SAMPLING SIZE

对于计算列分发统计信息,在 MEDIUM 模式下,您可可选地使用 SAMPLING SIZE 关键字来指定采样的行的最小数。如果 Resolution 子句省略 RESOLUTION 关键字且未指定 confidence 级别,也未指定 percent 值,则 GBase 8s 采样的行数将会是下列两个值中的较大者:
如果在 Resolution 子句中指定采样大小,包括为每 bin 的采样的行的平均 percent 以及为 confidence 级别的显式的值,则采样的行的数目将会是这两个值中的较大者:

如果在 Resolution 子句中指定采样大小,包括平均的 percentage 值,但未设置 confidence 级别,则使用最小的 confidence 值 0.80 来计算 GBase 8s 要使用的实际采样大小,如果指定的 size 较小的话。

例如,下列语句计算 customer 表的两列的统计信息,而不更新索引信息。将至少采样 200 行,但样例的实际大小可能大于 200, 如果对于使用大约 50 equivalence categories 的样例分发,以每一 bin 中采样值的平均百分率 2%,需要更多的行来提供缺省的 0.80 信任级别的话。
UPDATE STATISTICS MEDIUM FOR TABLE customer (city, state) 
        SAMPLING SIZE 200 RESOLUTION 2 DISTRIBUTIONS ONLY;

不管您是否在 Resolution 子句中包括显式的 SAMPLING SIZE 规范,在 MEDIUM 模式 UPDATE STATISTICS 创建的时刻, GBase 8s 都在系统目录中记录实际的采样大小(作为该表中行的总数的百分率)。