使用 Python 验证数据集中的体温是否符合正态分布

zgq25302111 2019-08-11 原文

数据集地址：http://jse.amstat.org/datasets/normtemp.dat.txt

数据集描述：总共只有三列：体温、性别、心率

#代码

from scipy import stats as st
import matplotlib.pyplot as plt
import pandas as pd

#防止乱码
mpl.rcParams[‘font.sans-serif’] = [u’SimHei’]
mpl.rcParams[‘axes.unicode_minus’] = False

#读入数据

data = pd.read_csv(‘http://jse.amstat.org/datasets/normtemp.dat.txt’,sep=’\s+’,header=None,names=’temperature;Gender;Heart rate’.split(‘;’))

#数据描述

data[‘temperature’].describe()

count    130.000000
mean      98.249231
std        0.733183
min       96.300000
25%       97.800000
50%       98.300000
75%       98.700000
max      100.800000

#四种方法验证

#1 shapiro方法来检验体温是否符合正态分布

print(st.shapiro(data[‘temperature’]))

#(0.9865769743919373, 0.2331680953502655) 第二个数为P值,大于0.05

#2 normaltest方法验证体温是否符合正态分布

print(st.normaltest(data[‘temperature’], axis=None))

#NormaltestResult(statistic=2.703801433319236, pvalue=0.2587479863488212) 第二个数为P值,大于0.05

#3 kstest方法来检验体温是否符合正态分布

u = data[‘temperature’].mean()
std = data[‘temperature’].std()
print(st.kstest(data[‘temperature’], ‘norm’,(u,std)))

#KstestResult(statistic=0.06472685044046644, pvalue=0.645030731743997) 第二个数为P值,大于0.05

#4 anderson方法来检验体温是否符合正态分布

print(st.anderson(data[‘temperature’]))

#AndersonResult(statistic=0.5201038826714353, critical_values=array([0.56 , 0.637, 0.765, 0.892, 1.061]), significance_level=array([15. , 10. , 5. , 2.5, 1. ]))

#显著性水平为[15. , 10. , 5. , 2.5, 1. ]，statistic小于critical_values，该检验不能拒绝为正态分布，即该检验未正态分布。

normal/exponenential
15%, 10%, 5%, 2.5%, 1%

logistic
25%, 10%, 5%, 2.5%, 1%, 0.5%

Gumbel
25%, 10%, 5%, 2.5%, 1%

If the returned statistic is larger than these critical values then for the corresponding significance level, 
the null hypothesis that the data come from the chosen distribution can be rejected.

#绘图

x = data['temperature']
x = x.sort_values()
loc,scale = st.norm.fit(x)
plt.plot(x, st.norm.pdf(x,loc,scale),'b-',label = 'norm')
plt.show()

本文链接：https://www.cnblogs.com/zgq25302111/p/11334044.html

使用 Python 验证数据集中的体温是否符合正态分布的更多相关文章

iOS – CocoaPods安装 (Homebrew安装)、使用

注意网络一定要好，不然安装会失败。好多人都是死在网速上。实在不行就用手机4g分享网络. CocoaPods官网 […]...

Scrapy学习笔记

1.Scrapy是什么 Scrapy是基于twisted的爬虫框架，用户定制开发几个模块就可以实现爬虫 2.S […]...

python 爬取图片

使用python的requests库爬取网页时，获取文本一般使用text方法，如果要获取图片并保存要用cont […]...

python 正则表达式详解

python 正则表达式详解 1. 正则表达式模式模式描述 ^ 匹配字符串的开头 $ 匹配字符串的末尾。 […]...

Python 中的内存管理

Python 中一切皆对象，这些对象的内存都是在运行时动态地在堆中进行分配的，就连 Python 虚拟机使用的栈也是在堆上模拟的。既然一切皆对象，那么在 Python 程序运行过程中对象的创建和释放就很频繁了，而每次都用 malloc()...

小白学 Python 爬虫（1）：开篇

人生苦短，我用 Python 引言各位同学大家好，好久不见（可能只有一两天没见：囧）~~~ 先讲一件事情，昨 […]...

python中的subprocess.Popen()、PIPE使用详解

今天小编就为大家分享一篇python中的subprocess.Popen()使用详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧从python2.4版本开始,可以用subprocess这个模块来产生子进程,并连接到子进...

Python+ Selenium自动化登录腾讯QQ邮箱实例

学习了Python语言一段时间后，在公司的项目里也使用到了python来写测试脚本，一些重复的操 […]...

随机推荐

windows下使用jenkins持续集成.net项目

windows下使用 jenkins 持续集成.net项目前言随着微服务的兴起，原先一个庞大的项目，被切分 […]...

一步步构建.NET Core Web应用程序—仓储层，业务层的实现

前言上一篇文章介绍了整个项目的结构，接下来向大家介绍一下我的仓储及业务层具体的实现思路，如果有更好的 […]...

基于saltstack自动化部署高可用kubernetes集群

SaltStack自动化部署HA-Kubernetes 本项目在GitHub上，会不定期更新，大家也可以提交I […]...

VScode中python环境配置

VScode中学习python语言，前期准备 vscode中python环境配置想要在vscode中运行py […]...

JS判断移动设备最佳方法并实现跳转至手机版网页 – STATS

JS判断移动设备最佳方法并实现跳转至手机版网页方法一：纯JS判断使用这方法既简单，又实用，不需要引入jQ […]...

Docker容器发布spring boot项目

一、安装Docker环境 yum install docker 安装完成后，使用下面的命令来启动 do […]...

前端读者 | Javascript设计模式理论与实战：状态模式

本文来自 @狼狼的蓝胖子；链接：http://luopq.com/2015/11/25/design-patt […]...

JDBC

连接将数据库配置文件写到config.properties中然后使用以下代码连接数据库。 import j […]...

使用 Python 验证数据集中的体温是否符合正态分布

使用 Python 验证数据集中的体温是否符合正态分布的更多相关文章

随机推荐

热门专题

目录导航