核主成分分析方法（KPCA）怎么理解？

learninglife 2021-11-30 原文

核主成分分析方法（KPCA）

先回顾下主成分分析方法。PCA的最大方差推导的结论是，把数据投影到特征向量的方向后，方差具有极大值的。假如先把数据映射到一个新的特征空间，再做PCA会怎样？对于一些数据，方差会更好地保留下来。而核方法就是提供了一些映射到新的特征空间的选择。

假设这个映射为$\phi(x_{i})$, 数据从新的特征空间投影到向量w的方差，由前一节主成分分析方法可以得到

$D = w^{T}*(\frac{1}{n}\sum X^{T}*X)*w$，其中$X^{T} = [\phi(x_{1}), \phi(x_{2}), … , \phi(x_{n})]$. 这里$X^{T}*X$矩阵是不可知的，更加无法求出它的特征向量。

但是我们知道$X*X^{T}$是一个核矩阵，每个元素可以由核函数计算出来，可以对核矩阵进行特征值分解 $X X^{T} u = \lambda u$, 等式两边乘以 $X^{T}$

得到$X^{T} X (X^{T} u) = \lambda (X^{T} u) $ ，原来两个矩阵的特征值是一样的！

而特征向量$X^{T} u $是不可知的，但是没关系，我们只需要知道从新的特征空间投影回来的坐标就可以了。

先把$X^{T} u $单位化为v，很容易推导出它的长度为$\sqrt{\lambda}$, 那么投影后的坐标为

$v^{T}*\phi(x^{\’}) = \frac{1}{\sqrt{\lambda}} uX\phi(x^{\’})$, 是可以用核函数求出来的,于是用核方法降维后的点就算出来的。

随机推荐

R语言-用户细分

案例:通过使用R语言的聚类算法将用户进行合理的划分,找出对超市贡献度,光临度最高的优质客户,对后期的推广有更深 […]...

[转]method initializationerror not found:JUnit4单元测试报错问题 […]...

Amoeba基本配置

Amoeba安装及读写分离配置一.amoeba简介官网:http://docs.hexnova.com/am […]...

前端的UI框架 iView 框架使用场景 iView 主要适合大中型中后台产品，比如某产品的运营平台、数据监 […]...

nginx平滑升级

升级目的让现有服务平滑过渡到高版本,减少服务漏洞,提高服务性能让其支持nginx最新特性 nginx th […]...

任务队列与 Celery概述

任务队列与 Celery概述一、任务队列（Task Queues） 1.1 什么是任务队列？任务队列用于 […]...

有段时间没有用虚拟机了，这几天翻出了以前的虚拟机，写几个demo，但遇到了一个让人难受的问题。使用xshell […]...

1、认识Eclipse

一 Eclipse简介 Eclipse 是一个开放源代码的、基于 Java 的可扩展开发 […]...

核主成分分析方法（KPCA）怎么理解？的更多相关文章