计量型数据简要分析三步法

2016-07-25 01:22:40陈向荣
环球市场 2016年22期
关键词:极差标准差方差

陈向荣

河北白沙烟草有限责任公司保定卷烟厂

计量型数据简要分析三步法

陈向荣

河北白沙烟草有限责任公司保定卷烟厂

当今世界设备先进,机械自动化程度越来越高,生产线数据每时每刻成千上万条累计叠加,要将数据转化为反映事物变化或特征的信息,则必须采取数据处理、加工、解释等统计分析手段,进而依据“数据信息”解决难题或质量改进。本论文针对生产中数据量较大的计量型数据类型,通过均值、极差、标准差及过程能力指数等统计量的案例讲解,由浅入深得阐述数据分析的三种常用方法,通过统计方法将数字转化为有价值的准确结论。

计量型数据;均值;标准差;过程能力指数

二十一世纪是科技飞速发展的世纪,企业的自动化、机械化、信息化程度迅猛提升,面对“大量化”、“多样化”和“快速化”的生产检测数据,必须采取数据分析、数据处理及数据显示等方法,将其转化为较高价值的能明确表述生产状况或变化的信息,进而指导生产达到精益求精的目的。

下面我们以表1中的4组计量型检测数据为例,由浅入深,由易到难,简要讲解计量型数据的三种常用分析方法。(见表1)

一、数据中心趋势

中心趋势是数据最基本的定位点,表现计量型数据中心趋势的统计量有均值、中值和众数。中值不受极大、极小数值的影响,众数有时不唯一或不存在,而生产过程中现场采集或样品检测连续数据一般符合数据正态,考虑到受每个检测数据的影响,我们一般采用“均值”作为中心趋势统计量。

计算1-4组数据均值,分别为24.26mm、24.26mm、24.19mm、24.23mm。假设此产品圆周标准要求为(24.25±0.20)mm,计算均值与规格中心值24.25mm的偏差,分别为0.01mm、0.01mm、-0.06mm、-0.02mm,可以初步判定第1组、2组数据优于第4组、3组数据,证据充分吗?我们只是定位了检测数据的一个均值点,在不清楚各个数据总体分布状态的情况下,其实无法判定数据的优劣,需进一步深入分析。

二、数据离散程度

数据离散程度是数据分布情况的一种度量,表现计量型数据离散的统计量有全距、标准差和方差。全距又称为极差(R),是指一组测量数据中最大值与最小值之差,是检测值变动的最大范围。由于它忽略了最大值与最小值之间的其他数据,一般只适用于样本容量较小情况。标准差(S)是方差(S2)的算数平均根,是每个测量值与均值之差的平方和除以(n-1)后再开方,计算公式如下:

由计算公式可知,每个检测值对标准差(方差)均有影响。统计分析中方差是能直接进行加减运算的,而标准差不能,但实践应用中,我们一般将标准差做为衡量每个数据围绕平均值上下波动的量尺。

表1 某产品圆周检测数据汇总表(单位mm)

表2 检测数据离散程度统计量汇总表(单位:mm)

计算案例中数据组的极差(见表2),能明显看出检测数据分布范围的宽窄,第3组0.13最小,第2组0.38最大。有时我们也使用最大值(MAX)与最小值(MIN)两个统计量,将其与产品规格上下限直接比较,如第2组最大值达到24.45,等同于规格上限,存在检测数据超出标准上限的风险,因此必须进行调整。计算案例每组数据的标准差,将它与极差数值分别排序,大小趋势大致接近,但也不尽相同。如第2组、第4组极差与标准差优劣判断存在矛盾。考虑到计算标准差时要兼顾到每一个检测数值,我们一般将它作为衡量数据离散程度的标尺。因此,第3组、第1组数据要优于第2组、第4组数据。

综合考虑中心趋势与离散程度的判定结论,判定结果明显存在差异性,我们无法准确断定那组数据状态最佳,数据不好是均值跑偏影响大还是离散变异影响大,数据不好又将如何进行调整改进呢?因此我们需进一步深入分析,将技术标准规格纳为衡量依据。

三、过程能力指数

过程能力指数是依据“小概率事件”原理,将过程的自然波动范围定义为6ó(ó为总体标准差,一般用样本标准差s替代),计算过程输出能力与要求容差(即标准规格范围)的比值,它是一个能量比的概念。由于实际生产过程中均值与规格中心值多数情况不重合,因此过程能力分析时,我们多使用PPK指标进行衡量。在生产过程稳定或统计受控前提下,过程能力指数PPK能将数据均值偏移、数据离散与标准规格要求三者之间的关系表达出来,其计算公式如下:

其中Usl、Lsl分别为规格上限与规格下限,由公式可知,数据均值越接近规格中心值,且标准差S越小,则PPK值越大。

计算1-4组检测数据的PPK值,分别为1.66、0.73、1.29、0.68,经比较,第1组、第3组数据明显优于第2组、第4组数据,对比第一步、第二步分析结论,各组数据受离散程度的影响较大一些,而数据离散较大的真正原因则需结合实际对各影响因素进一步分析验证。

此外,由于现场数据采集或产品检测后,数据均值与标准差均容易直接得到,而过程能力指数则需进一步计算推导。为了实现依据数据快速指导生产的目的,我们可以建立一个均值偏移量与标准差的对应查找表(穷举法)。首先明确PPK标准下限值,一般是PPK≥1,然后通过查找列表,找到均值偏移量或标准差对应的统计量的下限值,由检测统计量判定产品检测数据是否合格,不合格则依据两个统计量的所处水平指导现场进行原因排查或设备调整,以确保产品质量的合格受控状态。

猜你喜欢
极差标准差方差
方差怎么算
概率与统计(2)——离散型随机变量的期望与方差
用Pro-Kin Line平衡反馈训练仪对早期帕金森病患者进行治疗对其动态平衡功能的影响
计算方差用哪个公式
二次函数极差的规律与应用
方差生活秀
在分位数回归中结构突变的经验极差检验
对于平均差与标准差的数学关系和应用价值比较研究
方差中亟待澄清的两个错误观点
医学科技论文中有效数字的确定