吴恩达《机器学习》课程总结（13）聚类

ys99 2018-07-03 原文

13.1无监督学习：简介

将没有标签的样本分成不同的集合（簇），这种算法叫做聚类。常用的领域有市场分割、社交网络分析、计算机集群管理、了解星系等。

13.2K-均值算法

（1）K-均值是最普及的聚类算法，是一种迭代算法，假设需要将数据聚类成n个组，这时候首先随机选择K个点，称为聚类中心。

将每个样本归属到最近的聚类中心，然后重新计算每个类的中心变成新的聚类中心，重复以上步骤，直到聚类中心不变。

伪代码如下：

13.3优化目标

k-均值的最小化问题，就是每个样本点到对应聚类中心的距离之和：

与其他算法不同的是，k-均值每一次迭代都会是代价函数变小。

13.4随机初始化

（1）K应该小于样本数m;

（2）从样本中随机选取K个实例作为初始聚类中心。

K-均值可能会出现局部最小的情况，如下所示：

解决方案：多次运行该算法，最后在比较K-均值代价函数最小的结果，这种方法适用于K取较小的时候（2-10），K太大没有明显效果。

13.5选择聚类数

绘制聚类数与代价函数的图，然后选取出现斜率突然变小的地方的值（“肘部法则”）。

本文链接：https://www.cnblogs.com/ys99/p/9261020.html

吴恩达《机器学习》课程总结（13）聚类的更多相关文章

初识机器学习——吴恩达《Machine Learning》学习笔记（十三）

无监督学习（Unsupervised learning) 无监督学习介绍(Unsupervised learn […]...

机器学习实战（笔记）————KNN算法

1.KNN算法 KNN算法即K-临近算法，采用测量不同特征值之间的距离的方法进行分类。以二维情况举例： […]...

机器学习，了解一下？

1. 为什么要学？老师上课时候就说过：传统算法解决确定性问题，而机器学习解决非确定性问题。好吧，确实激起了 […]...

吴恩达《机器学习》课程笔记——第一章：绪论初识机器学习

【重要提示】：本人机器学习课程的主要学习资料包括：吴恩达教授的机器学习课程和黄广海博士的中文学习笔记。感谢吴恩 […]...

sklearn学习第一篇：knn分类

K临近分类是一种监督式的分类方法，首先根据已标记的数据对模型进行训练，然后根据模型对新的数据点进行预测，预测新 […]...

逻辑回归实战

逻辑回归案例小细节逻辑回归（logistic regression）虽然被称之为逻辑回归，但是它本质上其实 […]...

ng机器学习视频笔记（一）——线性回归、代价函数、梯度下降基础

ng机器学习视频笔记（一） ——线性回归、代价函数、梯度下降基础（转载请附上本文链接——linhxx） […]...

机器学习——决策树

1、介绍决策树是一种依托决策而建立起来的一种树。在机器学习中，决策树是一种预测模型，代表的是一种对象属性与对 […]...

随机推荐

华为云FusionInsight MRS：助力企业构建“一企一湖，一城一湖”

摘要：华为云FusionInsight MRS新一代的数据湖，让大数据越用越快、越用越易、越用越稳、越用越省！ […]...

Swoole 网络通信协议，固定包头。

网络通信过程中，可能会出现分包和合包的情况。具体情况如https://wiki.swoole.com/wiki […]...

Spring入门编程问题集锦Top10

我写的一篇文章，希望对spring初学者有所帮助： 1、如何学习Spring？你可以通过下列途径学习spri […]...

移动端工程架构与后端工程架构的思想摩擦之旅（1）

此文已由作者黎星授权网易云社区发布。欢迎访问网易云社区，了解更多网易技术产品运营经验记资源投放后端工程 […]...

深度学习基础系列（九）| Dropout VS Batch Normalization? 是时候放弃Dropout了

　　Dropout是过去几年非常流行的正则化技术，可有效防止过拟合的发生。但从深度学习的发展趋势看，Batch […]...

《算法：第四版》课后练习 1.1 答案

以下答案纯属个人愚见，作为IT新手，算法代码中难免有逻辑漏洞和其他不足之处，欢迎朋友你点评拍砖，交流争辩能极大 […]...

加密通讯协议SSL编程周立发 – -见

加密通讯协议SSL编程周立发 Linux网络编程:加密通讯协议SSL编程<?xml:namespace […]...

SpringMVC之声明式校验

1、在http://www.cnblogs.com/wtzl/p/8830678.html编程式校验基础上 2 […]...