统计学基础之概率分布
统计学基础之概率分布
一、基本概念
1、随机变量
在同一组条件下,如果每次实验可能出现这样那样的结果,并且所有的结果都能列举出来,即X的所有的可能值x1,x2,….,xn都能列举出来,而且X 的可能值x1,x2,….,xn具有确定概率P(x1),P(x2),….,P(xn),其中P(xi)=P(X = xi),称为概率函数,则X称为P(X)的随机变量,P(X)称为随机变量X的概率函数。
(1)离散型随机变量:如果随机变量的所有取值都可以逐个列举出来,则称为离散型随机变量。
(2)连续型随机变量:如果随机变量的所有取值都无法逐个列举出来,而是取数轴上某一区间内的任一点。
2、古典概率
3、条件概率
条件概率是指事件A在事件B发生的条件下发生的概率。条件概率表示为:P(A|B),读作“A在B发生的条件下发生的概率”。若只有两个事件A,B,那么,
。
4、离散变量
可取值能一个个列出来的变量称为离散变量。设离散变量。事件 的概率称X的概率函数,即
5、连续变量
可取值能充满一个区间的变量称为连续变量。其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。
6、期望值
即平均值。
7、【大数定律】
一种描述当试验次数很大时所呈现的概率性质的定律。
1、切比雪夫大数定理
设 ,….是一列相互独立的随机变量(或者两两不相关),他们分别存在期望和方差 。若存在常数C使得:则对任意小的正数 ε,满足:
二、离散变量概率分布
属性:
每个试验都是独立的。
在试验中只有两个可能的结果:成功或失败。
总共进行了n次相同的试验。
所有试验成功和失败的概率是相同的。
泊松分布在满足以下条件的情况下是二项式分布的极限情况:
• 试验次数无限大或n → ∞。
• 每个试验成功的概率是相同的,无限小的,或p → 0。
• np = λ,是有限的。
随机变量X服从参数为p的伯努利分布,则X的概率函数:
均值与方差:
伯努利与二项分布之间的关系:
• 伯努利分布是具有单项试验的二项式分布的特殊情况。
• 伯努利分布和二项式分布只有两种可能的结果,即成功与失败。
• 伯努利分布和二项式分布都具有独立的轨迹。
。
是Γ函数。随机变量X服从参数为
的Β分布通常写作
三、分布的形状
1、正态分布
正态分布(Normal distribution),也称“常态分布”,又名高斯分布。正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形。
定义:若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。
(1)如果 且a与b是实数,那么 。
(2)如果 与 是统计独立的正态随机变量,那么:它们的和也满足正态分布
是独立常态随机变量,那么:它们的积XY服从概率密度函数为p的分布
其中
是修正贝塞尔函数。它们的比符合柯西分布,满足
服从自由度为n的卡方分布。
2、均匀分布
均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。 均匀分布由两个参数a和b定义,它们是数轴上的最小值和最大值,通常缩写为U(a,b)。
。 在傅里叶分析的概念中,可以将f(a)或f(b)的值取为
,因为这种均匀函数的许多积分变换的逆变换都是函数本身。
具有指数分布参数 。
3、卡方分布
若n个相互独立的随机变量ξ₁,ξ₂,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布。
若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和 构成一新的随机变量,其卡方分布分布规律称 分布(chi-square distribution),其中参数 称为自由度,正如正态分布中均数或方差不同就是另一个正态分布一样,自由度不同就是另一个 分布。记为 或者
为限制条件数)。
的卡方分布是一个随机变量X的机率分布。
纯粹笔记。。。。