【原】Andrew Ng斯坦福机器学习(1)——Lecture 1_Introduction and Basic Concepts
Lecture 1 Introduction and Basic Concepts
Lecture1 分4个视频,主要讲了
- 视频1 – 2 – What is Machine Learning_ (7 min)
0、机器学习定义
• Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed. 机器学习:在进行特定编程的情况下,给予计算机学习能力的领域。
• Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from
experience E with respect to some task T and some performance measure
P, if its performance on T, as measured by P, improves with experience
E. 卡内基梅隆大学Tom 定义:一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值P, 当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。
1、以垃圾邮件监测为例,解释Tom 定义中字母的对应
例题:
2、机器学习算法
常用:
- Supervised learning 监督学习
- Unsupervised learning 无监督学习
其他:
Reinforcement learning, recommender systems 强化学习和推荐系统
3、课程目的
If you actually tried to develop a machine learning system, how to make those best practices type decisions about the way in which you build your system。
如何在构建机器学习系统的时候选择最好的实践类型决策,节省时间。
- 1 – 3 – Supervised Learning (12 min)
1、Regression回归问题
回归问题:预测连续的输出值
Housing price prediction
在历史房价数据的基础上,预测房屋价格。可以使用直线拟合(粉色),也可以使用二次曲线拟合(蓝色)。
监督学习:基于已有的正确结果。 回归问题:预测连续的输出值
2、Classification分类问题
分类问题的预测结果是离散的多个值
肿瘤良性预测
下图是基于两个特征(两个维度)进行预测的例子, 右边是可能的其他维度(维度可能有无穷多个)
3、区分“分类问题”和“回归问题”
例题:
- 1 – 4 – Unsupervised Learning (14 min)
1、区分“监督学习”和“无监督学习”
Supervised Learning:学习数据带有标签
Unsupervised Learning:没有任何的标签,或者有相同的标签。已知数据集,不知如何处理,也未告知每个数据点是什么。(右侧的例子,无监督学习将数据划分为两个集合,也就是聚类clustering algorithm)
2、聚类算法的例子
Google News 每天将爬来的网址分为一个个的新闻专题。 基因信息分组。组织大型计算机集群。 社交网络的分析。市场分割。天文数据分析
鸡尾酒party问题,将混在一起的多个音频源拆开。
在Octave里只需要一行代码
[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');