机器学习基石-笔记4

z-g-f 2020-04-14 原文

Feasibility of Learning 机器学习的可行性

1. 看起来似乎是不可学习的~

1）不同的g会得到不同的答案

a. 对称得到的结果是+1 b. 左上角为黑色得到的结果是-1

2）数据集内表现很好，数据集外表现不好

g ≈ f inside D: sure!

g ≈ f outside D: No! (but that’s really what we want!)

3. 根据上述分析，算法对于未知的数据不能满意的结果。但是在某些情况下，我们可以根据已知的数据集，对未知的数据进行分析。

一个瓶子里有一些绿色小球和橙色小球，我们从瓶子里取一部分小球（称为样本），然后计算绿色小球和橙色小球的比例。我们可以根据样本中绿色小球和橙色小球的比例来推断瓶子里绿色小球和橙色小球的比例吗？

我们能够利用小球样本对瓶子里的小球比例进行分析，前提是小球的独立同分布且总数足够大。

larger sample size N or looser gap =⇒ higher probability for ‘ν ≈ µ’

接下来，我们讨论上述分析和学习算法的联系。橙色球类比学习结果和目标函数结果不一致，即学习错误，绿色球类比学习结果和目标函数一致，即学习正确。

Hoeffding不等式，建立Ein和Eout的联系，证明对于某个h，当N足够大的时候，Ein和Eout是PAC的。最后，对于h个数很多的情况，只要有h个数M是有限的，且N足够大，就能保证Ein≈Eout，证明机器学习是可行的

随机推荐

declare命令

还是围绕以下几个问题进行学习; 1.declare是什么？ 2.问什么要用declare？ 3.怎样使用dec […]...

ThinkPHP – 模板使用函数

模板使用函数 1、模板引擎自带函数：仅仅是输出变量并不能满足模板输出的需要，内置模板引擎支持对模板变量使用调节 […]...

权限认证 cookie VS token

权限认证 cookie VS token 我前公司的应用都是 token 授权的，现公司都是维护一个 sess […]...

第四步：网络验证的逻辑开发 1.将model注册到adminx.py中 1.在apps/yanzheng目录下 […]...

Javascript及Jquery获取元素节点以及添加和删除操作用了javascript和jquery很久， […]...

Linux–shell编程原理–03

一、编程原理： 1、编程介绍：　　计算机只能识别二进制指令　　程序=指令+数据　　根据服务的重心不同， […]...

作者：松软科技（www.sysoft.net.cn）发布时间:2019/3/17 9:34:51 CREAT […]...

Redis缓存能够有效地加速应用的读写速度，就DB来说，Redis成绩已经很惊人了，且不说memcachedb […]...

机器学习基石-笔记4的更多相关文章