举例:
假设在制程采取改进措施前统计了某生产线上连续10个班的产品合格率分别为:89.7%,81.4%,84.5%,84.8%,87.3%,79.7%,85.1%,81.7%,83.7%,84.5%。制程采取改进措施后连续统计的10个班的产品合格率分别为:84.7%,86.1%,83.2%,91.9%,86.3%,79.3%,82.6%,89.1%,83.7%,88.%。初看起来,采取改进措施后平均产品合格率为85.54%,比采取改进措施前提高了1.3%(采取改进措施前平均产品合格率为84.24%)。那么到底采取改进措施之后是否有比较显著的改善效果呢?我们运用Tukey检验方法来做验证:
第一步:我们把制程采取改进措施前的合格率用A标记,采取改进措施后的合格率用B标记
第二步:将这20个数据按从小到大的顺序排序,得到如下结果:
第三步:计算终结计数。按Tukey理论,采取改进措施前后产品合格率若发生显著变化,则A,B两系列的数据就不会完全重叠,未重叠的数据个数即为终结计数。分别从顶端和底端计数未重叠的数据个数,称之为顶端终结计数和底端终结计数,两端终结计数之和即为总终结计数。若某一系列的数据区间被另一比对系列的数据区间全部包含,则总终结计数计为零(如本例所示);若两系列的数据区间不存在一个系列完全包含另一个系列的状况,则计数方法为:从已合并排序的整个数据列的顶端第一个数据开始数起,一直数到序列标记变更为止,连续的同系列数据的个数为顶端终结计数;若在数据系列变更时,对应的两个数据相等,则变更时的那个数据按1/2计数。同理,从底端第一个数据开始数起,一直到序列标记变更为止,可得底端终结计数值。示例如下:
第四步:将所得的终结计数值与Tukey检验的某置信水平下终结计数的临界值比较,如果所得的终结计数值大于该临界值,则表明采取改进措施后,在该置信水平下可以认为产品合格率发生了变化。(下图中的显著水平针对的双边计数(Two-Sided),若单边计数(One-Sided)则对应的显著水平为图示的一半,即双边计数时显著水平5%对应的终结计数临界值与单边计数时显著水平为2.5%对应的终结计数临界值是一样的)
第五步:结论。终结计数EC=0,而根据上表可以看出,在95%的置信水平(也就是5%的显著水平)下,终结计数的临界值为7。所以在95%的置信水平下,不能认为采取措施后,产品合格率发生了显著变化。如果终结计数EC=8,则表明在95%的置信水平下,可以认为采取措施后,产品合格率发生了显著变化(改进有效果)。
现在我们用Minitab中的2样本t检验方法来做检验。示例中的第一种情形终结计数EC=0时,对应的t检验结果如下:
该检验的零假设是“采取改进措施前后产品合格率没有显著变化”。t检验的p值为39%,表明如果拒绝零假设,犯第一类错误的概率高达39%,因此不能拒绝零假设。也就是说,不能认为采取改进措施后,产品合格率发生了显著变化。从95%的置信区间包括0值来看,我们可以认为“产品合格率未发生显著变化”的结论其置信水平可达95%。
示例中的第二种情形下,t检验的结果如下:
此时,t检验的p值为1.7%,表明如果拒绝零假设,犯第一类错误的概率只有1.7%,因此能够拒绝零假设。也就是说,可以认为采取改进措施后,产品合格率发生了显著变化。从95%的置信区间不包括0值来看,我们可以认为“产品合格率发生显著变化”的结论其置信水平可达95%。
由此可见,t检验的结果与Tukey检验的结果是等效的,但Tukey检验不需要借助专门的统计软件就可以由一线操作工来完成。