Python笔记-置信区间含义及运算
阿里云国内75折 回扣 微信号:monov8 |
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6 |
基本概念
这里先要知道几个概念
均值平均值一组数据的平均值比如学生时代最喜欢的平均分
方差一组数据与平均值的偏离程度
标准差标准误差方差开根号反应数据的离散程度
置信区间统计的数据误差范围所以有个上下值比如农产品上写的5kg±5%。
置信水平让人相信的概率比如置信水平是95%如100个数据有95个数据在上面的置信区间上。
计算置信区间
①求均值
②求标准误差
③查表的z值如下表
置信水平 | |z|值 |
90% | 1.64 |
95% | 1.96 |
99% | 2.58 |
④计算置信区间
a = 样本均值 - |z| * 标准差
b = 样本均值 +|z| * 标准差
Python实例
如下代码
import numpy as np
from scipy import stats
valueList = [95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 200]
if __name__ == '__main__':
averageValue = np.mean(valueList)
print("样本均值为", averageValue)
standardError = stats.sem(valueList)
print("样本标准误差为", standardError)
a = averageValue - 1.96 * standardError
b = averageValue + 1.96 * standardError
print("区间估计值[", a, "," ,b, "]")
pass
运行截图如下
可以得到的信息
①样本的平均值是108.33
②样本的离散程度为8.38
③这里的置信水平是95%对应的|z|值为1.96
④有95%的概率总体的样本会落到91.90~124.76这个范围中。