描述统计量
拿到一组样本数据后,先描述其统计量以便对这组数据有一个大致的了解。
统计量描述
均值样本数据的均值是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置
标准差样本标准差描述了样本观测数据变异程度的大小,它有两种定义:最大值和最小值样本中的最大值和最小值,有时候需要剔除材料样本数据中的一些异常数据,所以需要分析其中的最大值和最小值
极差极差可以作为样本数据变异程度大小的一个简单度量
中位数将样本观测值从小到大依次排列,位于中间的那个观测值称为样本中位数,它描述了样本观测数据的中间位置
众数众数描述了样本观测数据中出现次数最多的数
变异系数变异系数是衡量数据资料中各变量观测值变异程度的一个统计量。当进行两个或多个变量变异程度的比较时,如果单位与平均值相同,可以直接利用标准差来比较。如果单位和平均值不同时,比较其变异程度需要采用标准差和平均数的比值来比较。标准差与平均数的比值称为变异系数
偏度样本偏度反映了总体分布密度曲线的对称性信息,偏度越接近于0说明分布越对称,否则分布越偏斜。若偏度为负,说明样本服从左偏分布;若偏度为正,样本服从右偏分布
峰度样本峰度反映了总体分布密度曲线在其峰值附近的陡峭程度。正态分布的峰值为3,若样本峰度大于3,说明总体分布密度曲线在其峰值附近比正态分布来的陡;若样本峰度小于3,说明总体分布密度曲线在其峰值附近比正态分布来的平缓。
材料性能参数一般为连续型随机变量,要描述它的概率密度函数,通常考虑四个方面:
1. 集中趋势,表示数据的几种程度。可用众数、中位数和平均值度量;
如果概率密度图像是对称的,那么众数中位数和平均值在是同一个点。分布的平均值可以用表示。平均值也称为位置参数。
2. 散度,表示相对于集中趋势的变异程度,可以用标准差度量;
标准差也称为尺度系数。它的平方为方差
可以看出,方差是相对于平均值的二阶矩。
3. 偏度,相对于集中趋势的对称性;
4. 峰度,概率密度的峰值。
偏度和峰度是相对于平均值的三四阶矩,具体公式就不写了。
置信度
我们使用某牌号材料的样本数据估计此材料的性能参数时,样本数量的大小会对实际材料性能参数估计有很大影响,样本数量越多估计越准确。样本对母体的估计值与母体实际值间的差异就用置信度来表示。置信度反映的是用子样试验结果去估计母体性质的可信度,是子样的试验结果在母体的某个概率分布参数的某个区间内出现概率。
连续型分布函数
机械可靠性设计中常用的连续型概率分布有:正态分布、指数分布、对数正态分布、伽玛分布、威布尔分布等。这些分布亦可用于拟合材料样本数据。各分布参数一般由位置参数、比例参数和形状参数构成。位置参数确定分布函数取值范围的横坐标;比例参数确定分布函数在其取值范围内取值的比例尺,起到压缩或者扩张分布函数的作用;形状参数确定分布函数的形状,从而可以改变分布函数的性质。
1. 正态分布
自然界和工程中许多物理量服从正态分布,可靠性分析中,强度极限、尺寸公差、硬度等被证明服从正态分布。
其中包含了位置参数,比例参数,并没有形状参数。
Matlab调用函数normpdf可以画出,命令为Y=normpdf(x,mu,sigma ).从上的图可以看出mu和sigma分别决定正态分布概率密度函数的位置和比例。正态分布累积分布函数命令为p=normcdf(x,mu,sigma)
2. 指数分布
Matlab命令为y=exppdf(x,lamda)从上的图可以看出lamda决定指数分布概率密度函数的形状。指数分布累积分布函数命令为y=expcdf(x,lamda)。
3. 对数正态分布
未完待续…