本篇我们介绍直方图(Histogram)。
一、适用数据类型: 连续型(Continuous)、离散性(Discrete)(但一般不建议用)。
二、图表的MINITAB做法:到Graph(图表)->Histogram(直方图)
-
选“Simple(简单)”-只有一组,比如“长度”直方图;
-
选“with Fit (一组且包含拟合概率密度曲线)”-一组且拟合出概率密度曲线,比如“长度”的直方图和拟合概率密度曲线图;
-
选“with Groups(含组)-一个指标有好几个数据标签,比如不同班组的长度直方图;
-
选“With Group and Fit(含组且包含拟合概率密度曲线)”-一个指标有好几个数据标签,比如不同班组的长度的直方图和拟合概率密度曲线图。
三、图表理解:直方图(Histogram)和点图(Dot Plot)比较类似,X轴代表变量的值,Y轴是每个取值的出现的频次,不同的是:直方图(Histogram)是在点图(Dot Plot)的基础上把X轴划分成15个左右的区间(bin),每个柱子(bar)代表一个区间(bin),柱子越高代表落入相应区间数据越多。反之,则落入相应区间数据越少。
四、图表作用:可以非常直观地看出数据的中心-柱子高并集中的区间?数据的散度-柱子最大和最小区间跨度、数据的对称性-两边柱子是否围绕中间某个比较高的柱子对称分布?
五、举例:
-
厚度(thickness)的直方图(如下),可以看出厚度中心-均值为22.03左右,厚度的散度-标准差为2.843。
-
厚度(thickness)和班组(shift)(如下),可以看出三个班厚度的中心位置-均值分布为:21.66, 22.26, 22.17、散度情况-标准差分布是2.881, 2.722, 2.943。