概率论杂记
1.本福特定律
2.商品推荐的惊喜度
3.贝叶斯学派和频率学派
4.指数分布族
5.期望
6.方差
7.协方差
8.皮尔逊相关系数
摘要:
1.本福特定律
2.商品推荐的惊喜度
3.贝叶斯学派和频率学派
4.指数分布族
5.期望
6.方差
7.协方差
8.皮尔逊相关系数
9.概率(联合概率,条件概率,后验概率,贝叶斯公式,全概率公式,独立,条件独立。。。)待续。。。
内容:
1.本福特定律
2.商品推荐的惊喜度:
商品推荐场景中过于聚集的商品推荐往往会损害用户体验,在有些场景中,系统会通过一定程度的随机性给用户带来发现的惊喜度。假设A,B商品与当前用户的匹配度分别为0.8,0.2,系统将随机为A生成一个均匀分布于0到0.8的最终得分,为B生成一个0到0.2的得分,问终B的得分大于A的得分的概率?
3.贝叶斯学派和频率学派(参数空间,统计推断):
贝叶斯学派:假定参数本身是变化的,服从某个分布。求在这个分布约束下使得某目标函数极大/极小(贝叶斯模型)
频率学派:假定参数是某个/某些未知的定值,求这些参数如何取值,能够使得某目标函数取极大/极小(矩估计,似然估计,最大熵,期望最大化等)
扩展:知乎问答
4.指数分布族:
注:验证高斯分布属于指数分布族
5.期望(expectation)
概率加权下的平均值
X的函数的期望:
(1) X是离散型随机变量,它的分布律为,k=1,2,…。若绝对收敛,则有
(2) X是连续型随机变量,它的概率密度为,若绝对收敛,则有
阿里试题1:从1,2,3,…,98,99,1024这100个数中任意选择若干个数求异或,则异或的期望值是什么?
解:若干个数异或,只有当某位取奇数个1时第i位才为1,故此题只要考虑各个位数取1的概率即可
1024的二进制表示为100,0000,0000,明显这里第7,8,9位不为1,,而其余99个数也取不到这3位,则有
而对于其余位,有如下计算:
阿里试题2:
由二项分布的期望,有np=1,得S的元素个数是1024
6.方差:
7.协方差:
协方差矩阵式对称阵
8.相关系数