矩阵分解模型（1）：ALS学习算法

匿名 2021-08-16 原文

一、矩阵分解模型。

用户对物品的打分行为可以表示成一个评分矩阵A(m*n)，表示m个用户对n各物品的打分情况。如下图所示：

其中，A(i,j)表示用户user i对物品item j的打分。但是，用户不会对所以物品打分，图中？表示用户没有打分的情况，所以这个矩阵A很多元素都是空的，我们称其为“缺失值（missing
value）”。在推荐系统中，我们希望得到用户对所有物品的打分情况，如果用户没有对一个物品打分，那么就需要预测用户是否会对该物品打分，以及会打多少分。这就是所谓的“矩阵补全（填空）”。

ALS 的核心就是下面这个假设：打分矩阵A是近似低秩的。换句话说，一个的打分矩阵
A 可以用

两个小矩阵和的乘积来近似：。

这样我们就把整个系统的自由度从一下降到了。我们接下来就聊聊为什么
ALS 的低秩假设是合理的。

世上万千事物，人们的喜好各不相同。但描述一个人的喜好经常是在一个抽象的低维空间上进行的，并不需要把其喜欢的事物一一列出。

举个例子，我喜欢看略带黑色幽默的警匪电影，那么大家根据这个描述就知道我大概会喜欢昆汀的《低俗小说》、《落水狗》和

韦家辉的《一个字头的诞生》。这些电影都符合我对自己喜好的描述，也就是说他们在这个抽象的低维空间的投影和我的喜好相似。

再抽象一些，把人们的喜好和电影的特征都投到这个低维空间，一个人的喜好映射到了一个低维向量，

一个电影的特征变成了纬度相同的向量，那么这个人和这个电影的相似度就可以表述成这两个向量之间的内积。

我们把打分理解成相似度，那么“打分矩阵A(m*n)”就可以由“用户喜好特征矩阵U(m*k)”和“产品特征矩阵V(n*k)”的乘积来近似了。

矩阵U、矩阵V如下图所示：

U
V

二、交替最小二乘法（ALS）。

矩阵分解模型的损失函数为：

有了损失函数之后，下面就开始谈优化方法了，通常的优化方法分为两种：交叉最小二乘法（alternative
least squares）

和随机梯度下降法（stochastic
gradient descent）。本文使用交叉最小二乘法（ALS）来最优化损失函数。

算法的思想就是：我们先随机生成然后固定它求解，再固定求解，

这样交替进行下去，直到取得最优解min(C)。因为每步迭代都会降低误差，并且误差是有下界的，所以
ALS 一定会收敛。

但由于问题是非凸的，ALS
并不保证会收敛到全局最优解。但在实际应用中，ALS 对初始点不是很敏感，是不是全局最优解造成的影响并不大。

算法的执行步骤：

1、先随机生成一个。一般可以取0值或者全局均值。

2、固定（即：认为是已知的常量），来求解。

此时，损失函数为：

由于C中只有Vj一个未知变量，因此C的最优化问题转化为最小二乘问题，用最小二乘法求解Vj的最优解：

固定j（j=1,2,……,n），则：C的导数

令，得到：

即：

令，，则：

按照上式依次计算v1，v2，……，vn，从而得到。

3、固定（即：认为是已知的量），来求解。

此时，损失函数为：

同理，用步骤2中类似的方法，可以计算ui的值：

令，得到：

即：

令，，则：

依照上式依次计算u1，u2，……，um，从而得到。

4、循环执行步骤2、3，直到损失函数C的值收敛（或者设置一个迭代次数N，迭代执行步骤2、3
N次后停止）。这样，

就得到了C最优解对应的矩阵U、V。

版权声明：本文为匿名原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：

矩阵分解模型（1）：ALS学习算法的更多相关文章

随机推荐

【线性代数公开课MIT Linear Algebra】实际应用——python中的线性代数(1)
目前已经看完了公开课的三分之一，线性代数中的常见概念也已经差不多全部介绍了一遍，那么在实际应用中会借助于计算机 […]...
浅谈java线程池实现
再进入主题之前，我们先了解几个概念，对读源码有所帮助，对于线程池的运行状态，有4个级别，分别是RUNNING， […]...
django User.objects.get()报错 raise self.model.DoesNotExist手动处理解决办法
def get(self,request,*args,**kwargs): if kwargs.get(\'i […]...
30个值得推荐的数据可视化工具，赶紧收藏！
最新30个数据可视化工具，赶紧收藏，记得点赞！！目录 1、零编程工具图表（9个）信息图（2个）地图（1 […]...
kafka参数 – 闪亮由我
kafka参数转载地址http://debugo.com/kafka-params/ ########### […]...
浏览器URL编码
jsp页面中通过请求另一个页面并通过url传递了带有中文的参数，结果在接收端获取参数时乱码了经检查乱码现象指 […]...
联想Y50-70 拆后盖详细
联想Y50-70 拆后盖详细自己的笔记本更换了固态没有记录，现在添加内存，记录下。网上找的参考。摘 […]...
写给园友们的一封求助信
大家好，想了很久，终于做了这个决定，写了这封求助信。带着愧疚，努力建设园子这么多年，依然如此糟糕；带着希望，有 […]...

展开目录

目录导航