概率统计：数学期望、方差、协方差、相关系数、矩

justcxtoworld 2021-11-04 原文

摘要：最近在学习机器学习/数据挖掘的算法,在看一些paper的时候经常会遇到以前学过的数学公式或者名词,又是总是想不起来,所以在此记录下自己的数学复习过程,方便后面查阅。

1：数学期望

数学期望是随机变量的重要特征之一,随机变量X的数学期望记为E(X),E(X)是X的算术平均的近似值,数学期望表示了X的平均值大小。

当X为离散型随机变量时,并且其分布律为 P(X=x_k) ＝ pk ,其中k=1,2,…,n；则数学期望（要求绝对收敛）.
当X为连续型随机变量时,设其概率密度为f(x),则数学期望为（要求绝对收敛）.

2: 方差

数学期望给出了随机变量的平均大小,现实生活中我们还经常关心随机变量的取值在均值周围的散布程度,而方差就是这样的一个数字特征。

设X是随机变量,并且E{[X-E(X)²]}存在,则称它为X的方差,记为D(X)。

当X为离散型时,D(x) = .
当X为连续型时,D(x) = .

方差的算术平方根为X的标准差。

另外,D(X) = E{[X-E(X)²]} 经过化解可得 D(X) = E(X²) – [E(X)]² .我们一般计算的时候常用这个式子。

3：协方差

对于二维的随机变量(X,Y)，我们还要讨论它们的相互关系,协方差就是一个这样的数字特征。

因为E{[X-E(X)][Y-E[Y]]} = E(XY) – E(X)E(Y).

又当X,Y相互独立的时候E(XY) = E(X)E(Y).这意味着若E{[X-E(X)][Y-E[Y]]} ≠ 0 ,则X与Y是存在一定关系的。

我们把E{[X-E(X)][Y-E[Y]]} 称为随机变量X与Y的协方差。记为Cov(X,Y).

即：Cov(X,Y) = E{[X-E(X)][Y-E[Y]]}

4：相关系数

协方差在某种意义上是表示了两个随机变量间的关系,但是Cov(X,Y)的取值大小与X,Y的量纲有关,不方便分析,所以为了避免这一点,我们用X,Y的标准化随机变量来讨论。

我们称为随机变量X与Y的相关系数,记为(无量纲)。

其中为X,Y的协方差即Cov(X,Y),D(X),D(Y)分别是X,Y的方差且D(X)>0，D(Y)>0。

关于相关系数，我们有下面的性质：

|| ≤ 1
|| = 1 的充要条件是X 与 Y 以概率 1 存在线性关系，即 P{Y = a +bX} = 1, a,b是常数。
若 = 0,则说明X,Y不相关并且X与Y不存在线性关系。
若随机变量X,Y相互独立，则 = 0，即X,Y不相关。

注意：两个不相关的随机变量，不一定相互独立,有一特殊情况是,当随机变量X,Y服从二维正态分布的时候,独立与不相关等价。

不相关只能说明X与Y不存在线性关系。
独立说明X与Y既不存在线性关系,也不存在非线性关系。

5：矩

矩(moment)是最广泛的一种数字特征,常用的矩有两种：原点矩和中心矩。

原点矩：

对于正整数k，称随机变量X的k次幂的数学期望为X的k阶原点矩：即 E(X^k) ,k=1,2,…n.

数学期望就是一阶原点矩。

中心矩：

对于正整数k，称随机变量X与E（X）差的k次幂的数学期望为X的k阶中心矩：即 E{X-E[X^K]},K=1,2,…n.

方差就是二阶中心矩。

本文链接：https://www.cnblogs.com/justcxtoworld/p/3459959.html

概率统计：数学期望、方差、协方差、相关系数、矩的更多相关文章

均值、方差、标准差及协方差、协方差矩阵详解

一、统计学基本概念：均值、方差、标准差统计学里最基本的概念就是样本的均值、方差、标准差。首先，我们给定一个含 […]...

Spearman Rank Order 相关系数

Spearman Rank Order 相关系数是变量排序后的简单相关系数。举例如下： x=(0.8, […]...

多元统计分析-概率,期望,方差,正态分布

概率,期望，方差　　只有一个变量时　　　　F(x<=a) = ∫-∞af(x)dx 　　　　当 […]...

期望、方差、协方差及相关系数的基本运算

这篇文章总结了概率统计中期望、方差、协方差和相关系数的定义、性质和基本运算规则。一、期望定义：设 […]...

协方差、样本协方差和协方差矩阵

协方差用于衡量两个变量的总体误差或协同程度。两个总体 $X,Y$ 之间的协方差定义为 $$Cov(X,Y) = […]...

卡方检验、相关系数、协方差系数和数据标准化

概述获取第三章的思维导图文件, jupyter代码文件和数据集可以在我们的公众号”数据臭 […]...

可汗学院公开课统计学笔记第11到16集样本总体方差标准差诸方差公式

第11课统计：集中趋势 Average or Central Tendency 集中趋势在统计学中是指一组数 […]...

方差、协方差和相关系数

学过概率统计的孩子都知道，统计里最基本的概念就是样本的均值，方差，或者再加个标准差。首先我们给你一个含有n个样 […]...

随机推荐

JavaScript如何实现上拉加载，下拉刷新？

转载地址: 面试官：JavaScript如何实现上拉加载，下拉刷新？一、前言下拉刷新和上拉加载这两种交互方 […]...

从2021年起35项关键招聘统计数据，这些你都知道吗？

想找到一份DevOps的工作-还是雇一个？根据DevOps研究所的年度调查，在2020年招聘DevOps专业人 […]...

SSE图像算法优化系列十八：三次卷积插值的进一步SSE优化。

在学习housisong大神关于三次卷积插值一文的基础上，对算法进行重新整理和分析，使用SIMD指令再次提高算 […]...

前端实现下拉框联动，数组封装成树形结构实现下拉框联动

一、数组结构的数据，前端处理成叶子节点数据比如说项目中遇到的一级类目，二级类目，三级类目只有选择一级类目之 […]...

BES2300方案设计开发阶段总结

前记从事BES芯片的方案设计已经快三年了，这三年，伴随着和BES的一起共同成长，我们做了不少业内大的客 […]...

通达OA 指纹考勤机接口源代码

通达oa2011已经支持指纹考勤机但只限中控iclock660 这款2000大洋的型号通过本文的开 […]...

HTML代码简单教程

HTML代码简单教程,绝对精简 IT资源网 http://www.cit.cc/ TML代码简单教程 […]...

golang开发:select多路选择

select 是 Golang 中的一个控制结构，语法上类似于switch 语句，只不过select是用于 g […]...

概率统计：数学期望、方差、协方差、相关系数、矩

1：数学期望

2: 方差

3：协方差

4：相关系数

5：矩