【原】Andrew Ng斯坦福机器学习（1）——Lecture 1

【原】Andrew Ng斯坦福机器学习（1）——Lecture 1_Introduction and Basic Concepts

maxiaodoubao 2018-10-26 原文

Lecture 1 Introduction and Basic Concepts

　　Lecture1 分4个视频，主要讲了

视频1 – 2 – What is Machine Learning_ (7 min)

0、机器学习定义

• Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed. 机器学习：在进行特定编程的情况下，给予计算机学习能力的领域。

• Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from
experience E with respect to some task T and some performance measure
P, if its performance on T, as measured by P, improves with experience
E. 卡内基梅隆大学Tom 定义：一个程序被认为能从经验 E 中学习，解决任务 T，达到性能度量值P，当且仅当，有了经验 E 后，经过 P 评判，程序在处理 T 时的性能有所提升。

1、以垃圾邮件监测为例，解释Tom 定义中字母的对应

　　　　例题：

2、机器学习算法

常用：

　　- Supervised learning 监督学习
　　- Unsupervised learning 无监督学习

其他：

　　　　Reinforcement learning, recommender systems 强化学习和推荐系统

3、课程目的

　　If you actually tried to develop a machine learning system, how to make those best practices type decisions about the way in which you build your system。

如何在构建机器学习系统的时候选择最好的实践类型决策，节省时间。

1 – 3 – Supervised Learning (12 min)

1、Regression回归问题

　　　　回归问题：预测连续的输出值

　　Housing price prediction

　　在历史房价数据的基础上，预测房屋价格。可以使用直线拟合（粉色），也可以使用二次曲线拟合（蓝色）。

　　　　监督学习：基于已有的正确结果。回归问题：预测连续的输出值

2、Classification分类问题

　　分类问题的预测结果是离散的多个值

　　肿瘤良性预测

下图是基于两个特征（两个维度）进行预测的例子，右边是可能的其他维度（维度可能有无穷多个）

3、区分“分类问题”和“回归问题”

　　　　例题：

1 – 4 – Unsupervised Learning (14 min)

1、区分“监督学习”和“无监督学习”

Supervised Learning：学习数据带有标签

Unsupervised Learning：没有任何的标签，或者有相同的标签。已知数据集，不知如何处理，也未告知每个数据点是什么。（右侧的例子，无监督学习将数据划分为两个集合，也就是聚类clustering algorithm）

2、聚类算法的例子

　　　　Google News 每天将爬来的网址分为一个个的新闻专题。基因信息分组。组织大型计算机集群。社交网络的分析。市场分割。天文数据分析

　　　　鸡尾酒party问题，将混在一起的多个音频源拆开。

在Octave里只需要一行代码

[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

本文链接：https://www.cnblogs.com/maxiaodoubao/p/9856694.html

【原】Andrew Ng斯坦福机器学习（1）——Lecture 1_Introduction and Basic Concepts的更多相关文章

Name Disambiguation in AMiner-Clustering, Maintenance, and Human in the Loop

Name Disambiguation in AMiner: Clustering, Maintenance, […]...

线程的基本解析

线程对象是可以产生线程的对象。比如在Java平台中Thread对象，Runnable对象。线程，是指正在执行的 […]...

535 Encode and Decode TinyURL 编码和解码精简URL地址 – lina2014

535 Encode and Decode TinyURL 编码和解码精简URL地址详见：https://l […]...

mysql5.7报错： Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated…

今天，公司新购买了云服务器，要部署测试环境，测试时发现开发环境没问题，但测试环境却报错了，打开日志分析错误原因 […]...

Flat

听音乐是一种放松心情、舒缓压力的好方法，那么你有没有想过创造一首属于自己的音乐呢？Flat – M […]...

I love max and multiply 题解(二进制dp)

题目链接题目思路这个不知道叫啥感觉算是个二进制dp把设\(n\)为化简为\(2\)进制的最高位数我最开 […]...

方差分析 | ANOVA | 原理 | R代码 | 进阶 | one way and two way | Analysis of Variance

问题：为什么组间方差加组内方差一定等于总方差？如何从数学上理解。PPT里有证明，引入一个中间项就行。方差分 […]...

Karaf 依赖equinox and felix，karaf 本Apache的很多项目作为基础框架

6月17日是Apache Karaf作为Apache顶级项目。Karaf是个运行时包，包含了一个OSGi框架（ […]...

随机推荐

【华为云技术分享】华为云DevCloud深色模式开发解读

引言近期，华为云DevCloud推出了开发者友好的深色模式，深受开发者们的喜爱和关注。大家都知道，深色模式（ […]...

Java中二维数组的长度

Java中二维数组的长度 eg： int a[2][2];int len1=a.length; //表 […]...

Mac 安装Linux虚拟机

1 官网下载VMware fusion安装包； 2 官网下载Centos系统镜像文件； 3 VMware fu […]...

VC++中MessageBox的常见用法详解

VC++中MessageBox的常见用法详解消息框是个很常用的控件，属性比较多，本文列出了它的一些常用方法， […]...

安装篇-安装Idea2019.3.3

目录 windows安装Idea2019.3.3 下载IDEA2019.3 下载补丁安装IDEA 破解修改 […]...

Java多线程的三种实现方式

今天简单说一下Java三种多线程实现方式和区别，主要有实现Runnable、Callable和继承Thread […]...

论文阅读之Joint cell segmentation and tracking using cell proposals

一篇IEEE2016论文，发表于ISBI，属于生物医学领域。论文主要思路是：首先产生大量的cell prop […]...

5、cad如何快速选中图纸上所有文字

右键——>快速选择——>对象类型（文字，颜色）——>运算符（全部选择） ...