正态分布和置信区间
正态分布(Normal Distribution)又叫高斯分布,是一种非常重要的概率分布。其概率密度函数的数学表达如下:
置信区间是对该区间能包含未知参数的可置信的程度的描述。
使用SciPy求解置信区间
import numpy as np import matplotlib.pyplot as plt from scipy import stats N = 10000 x = np.random.normal(0, 1, N) # ddof取值为1是因为在统计学中样本的标准偏差除的是(N-1)而不是N,统计学中的标准偏差除的是N # SciPy中的std计算默认是采用统计学中标准差的计算方式 mean, std = x.mean(), x.std(ddof=1) print(mean, std) # 计算置信区间 # 这里的0.9是置信水平 conf_intveral = stats.norm.interval(0.9, loc=mean, scale=std) print(conf_intveral)
输出如下:
0.0033541207210673997 0.9986647964318905 (-1.639303291798682, 1.6460115332408163)
这里的-1.639303291798682是置信上界,1.6460115332408163是置信下界,两个数值构成的区间就是置信区间
使用Matplotlib绘制正态分布密度曲线
# 绘制概率密度分布图 x = np.arange(-5, 5, 0.001) # PDF是概率密度函数 y = stats.norm.pdf(x, loc=mean, scale=std) plt.plot(x, y) plt.show()
这里的pdf()函数是Probability density function,就是本文最开始的那个公式
最后的输出图像如下,可以看到结果跟理论上的正太分布还是比较像的:
正态分布置信区间规律
函数曲线下68.268949%的面积在平均数左右的一个标准差范围内
函数曲线下95.449974%的面积在平均数左右两个标准差的范围内
函数曲线下99.730020%的面积在平均数左右三个标准差的范围内
函数曲线下99.993666%的面积在平均数左右四个标准差的范围内
以上这篇Python求解正态分布置信区间教程就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
暂无评论...
更新日志
2024年11月25日
2024年11月25日
- 凤飞飞《我们的主题曲》飞跃制作[正版原抓WAV+CUE]
- 刘嘉亮《亮情歌2》[WAV+CUE][1G]
- 红馆40·谭咏麟《歌者恋歌浓情30年演唱会》3CD[低速原抓WAV+CUE][1.8G]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[320K/MP3][193.25MB]
- 【轻音乐】曼托凡尼乐团《精选辑》2CD.1998[FLAC+CUE整轨]
- 邝美云《心中有爱》1989年香港DMIJP版1MTO东芝首版[WAV+CUE]
- 群星《情叹-发烧女声DSD》天籁女声发烧碟[WAV+CUE]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[FLAC/分轨][748.03MB]
- 理想混蛋《Origin Sessions》[320K/MP3][37.47MB]
- 公馆青少年《我其实一点都不酷》[320K/MP3][78.78MB]
- 群星《情叹-发烧男声DSD》最值得珍藏的完美男声[WAV+CUE]
- 群星《国韵飘香·贵妃醉酒HQCD黑胶王》2CD[WAV]
- 卫兰《DAUGHTER》【低速原抓WAV+CUE】
- 公馆青少年《我其实一点都不酷》[FLAC/分轨][398.22MB]
- ZWEI《迟暮的花 (Explicit)》[320K/MP3][57.16MB]