主成分分析 PCA 应用实例鸢尾花数据集

carlber 2021-08-16 原文

对鸢尾花数据集采用主成分分析方法，使数据降维。

如下图所示为数据集的格式：

　　数据集中前4列数据分别代表花萼长度，花萼宽度，花瓣长度，花瓣宽度，最后一列为标签。共有150条数据。

　　我们对此数据集利用主成分分析方法，取出数据集的前4列特征组成矩阵X, 矩阵X的维度为150*4，对其进行转置后变为4*150.

　　第二步用X.T*X得到4*4维度的对称矩阵，我们就可以求这个对称矩阵的特征值lambda1,lambda2,lambda3,lambda4和对应的特征向量u1,u2,u3,u4。特征值一定是实数，特征向量之间是相互正交的。每个特征向量都是4*1的向量。

　　第三步把特征值做一个从大到小的排列，取出前两个最大的特征值和对应的特征向量。如果说lambda1最大，也就是说u1是最主要的方向，是最主要的主成分。次大的特征值对应的特征向量是第二主成分，依次往下排列。

　　假如说u1,u2是排列前2的主成分，那么就把样本数据都投影到u1和u2这个方向上，这是只有两维的数据了，并且u1，u2还是垂直的。可以把他看成新的特征选择或组合。效果如下：

由上图可知，投影后的数据可以很容易的对其进行分类。如下图所示：

本文链接：https://www.cnblogs.com/carlber/p/10846725.html

主成分分析 PCA 应用实例鸢尾花数据集的更多相关文章

PCA(主成分分析)算法

设有\(m\)个指标，\(n\)个样本的原始数据将原始数据按列组成矩阵 \(X _ { n \times m […]...

线性模型之LDA和PCA推导

线性模型之LDA和PCA推导线性模型之LDA和PCA 线性判别分析LDA LDA是一种无监督学习的降维技术。 […]...

主成分分析 matlab手把手教操作、SPSS、python实例分析

更新：　　这次决定用matlab手把手一步一步实现一遍。令是一个的观测矩阵，观测向量的样本均值M，由下式给 […]...

主成分分析 PCA算法原理 – Loull

主成分分析 PCA算法原理 2013-11-11 12:30 Loull 阅读(1723) 评论(0) […]...

PCA 主成分分析法

目录求解高维数据的主成分代码封装主成分分析 Principal Component Analysis […]...

nginx常见应用实例

1、nginx 中 location 应用实例 location 是 nginx 的精华，nginx 就是通过 […]...

【机器学习】主成分分析法 PCA （II） – KID_XiaoYuan

【机器学习】主成分分析法 PCA （II）主成分分析法（PAC）的优化——选择主成分的数量根据上一讲，我们 […]...

Docker 应用实例

Docker安装Nginx 方法一、通过 Dockerfile构建创建Dockerfile 首先，创建目录n […]...

随机推荐

VBA窗体之ListView分页显示

实现功能如下： 1、指定每页显示记录：CmbRecNum_Change 代码如下： Option E […]...

项目实战（连载）：基于Angular2+Mongodb+Node技术实现的多用户博客系统教程（4）

本章主要讲什么（一句话）？《项目实战：基于Angular2+Mongodb+Node技术实现的多用户博客系统 […]...

U盘制作成启动盘后容量变小如何快速恢复

转载u盘制作成启动盘后容量变小如何快速恢复？大家用u盘装系统第一件要做的事就是制作u盘启动盘了，本来是件很简 […]...

复现-ms17010

...

buuctf-pwn刷题-axb_2019_heap

VMware手动添加centos7硬盘图文操作及分区超详细

先设置虚拟机启动的虚拟机，新关机再设置 1.选择指定虚拟机，点击硬盘 2.虚拟机设置，点击左下角“添加” 3 […]...

MyEclipse 环境配置总结 – 时间朋友

MyEclipse 环境配置总结优化启动速度：去掉不需要加载的模块：windows–>perfere […]...

Sitemap和网站地图在线生成工具 – it小白

Sitemap和网站地图在线生成工具找了几个在线生成网站地图的网站试了下，各有千秋,但共同的缺点是都是英文 […]...

主成分分析 PCA 应用实例鸢尾花数据集