Stanford机器学习笔记-2.Logistic Regression

llhthinker 2021-09-02 原文

Content:

2 Logistic Regression.

　　2.1 Classification.

　　2.2 Hypothesis representation.

　　　　2.2.1 Interpreting hypothesis output.

　　2.3 Decision boundary.

　　　　2.3.1 Non-linear decision boundaries.

　　2.4 Cost function for logistic regression.

　　　　2.4.1 A convex logistic regression cost function.

　　2.5 Simplified cost function and gradient descent.

　　　　2.5.1 Probabilistic interpretation for cost function.

　　　　2.5.2 Gradient Descent for logistic regression.

　　2.6 Multiclass classification problem

key words: logistic regression, classification, decision boundary, convex function, One-vs-all

2.6 Multiclass classification problem

现实中也常遇到多分类问题(multiclass classification problem)，如判断手写的数字是0~9中的哪一个就是一个有10类的问题。多分类学习的基本思路是“拆解法”，即将多分类任务拆为若干个二分类任务求解。具体来说，先对问题进行拆分，然后为拆分出的每个二分类任务训练一个分类器（也就是h(x)）；在预测时，对这些分类器的预测结果进行集成。

下面介绍一个常用的拆分策略-“One-vs-all”.

One-vs-all每次将一个类的样例作为正例(“1”)，所有其他类作为反例(“0”)来训练n个分类器。在预测时，有两种情况看

情况1：若仅有一个分类器预测为正例，则对应的类别标记作为最终分类结果；
情况2：若有多个分类器预测为正例，则选择分类器的预测置信度最大的类别标记为分类结果，也就是。

例如对于图2-10所示的多分类问题，我们先将三角形，正方形，叉分别标记为类别1，2，3，然后做如下划分：

先将三角形看作正例“1”，正方形和叉看作反例“0”，训练出h_θ¹(x)
再将正方形看作正例“1”，三角形和叉看作反例“0”，训练出h_θ²(x)
最后将叉看作正例“1”，三角形和正方形看作反例“0”，训练出h_θ³(x)

预测时每一个预测值都是一个形如[h_θ¹(x), h_θ²(x), h_θ³(x)]的向量。选出最大的h(x)，它的上标就是对应的类别标记。例如若预测值为[0.13, 0.24, 0.79]，对应的就是上文所说的情况1，即只有h_θ³(x) > 0.5表现为正例，所以应该认为是属于3标记类，即为叉。若预测值为[0.12, 0.83, 0.56], 对应的就是上文所说的情况2，h_θ²(x) 和h_θ³(x)都大于0.5，都预测为正例，但h_θ²(x)> h_θ³(x)，所以应该预测是属于2标记类，即为正方形。

图2-10

版权声明：本文为llhthinker原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/llhthinker/p/5330257.html

Stanford机器学习笔记-2.Logistic Regression的更多相关文章

Python机器学习笔记：Logistic Regression
完整代码及其数据，请移步小编的GitHub 　　传送门：请点击我　　如果点击有误：https://githu […]...
Logistic Regression（逻辑回归）模型实现二分类和多分类
一、逻辑回归二、判定边界当将训练集的样本以其各个特征为坐标轴在图中进行绘制时，通常可以找到某一个判定边界 […]...
TensorFlow实战之Softmax Regression识别手写数字
关于本文说明，本人原博客地址位于http://blog.csdn.net/qq_37608890，本 […]...
3(3).线性分类之logistic regression（基于经验风险最小化）
线性回归不仅可以用于回归任务，还可以用于分类任务。一、逻辑回归 1.二分类模型（1）给定数据集$D […]...
Kaggle比赛（二）House Prices: Advanced Regression Techniques
房价预测是我入门Kaggle的第二个比赛，参考学习了他人的一篇优秀教程：https://www.kaggle. […]...
Python 线性回归（Linear Regression) 基本理解 – 不忘初心mao
Python 线性回归（Linear Regression) 基本理解背景学习 Linear Regres […]...
线性回归、梯度下降（Linear Regression、Gradient Descent） – BYRans
线性回归、梯度下降（Linear Regression、Gradient Descent）转载请注明出自BY […]...
[机器学习]回归–Polinomial Regression 多项式回归
首先我们需要明确一个概念，我们讨论的线性或者非线性针对的是自变量的系数，而非自变量本身，所以这样的话不管自变量 […]...

随机推荐

使用websocketpp进行websocket通信
websocketpp介绍 websocketpp是一个只有头文件的支持websocket协议的C++开源库， […]...
解决idea中启动tomcat出现控制台乱码问题
尝试了很多方法，最后终于解决了，现在提供给大家一个我认为最简单也最有效的方案。 1.修改配置文件找到idea […]...
SpringBoot启动原理
背景 1> 大家都知道SpringBoot是通过main函数启动的，这里面跟踪代码到处都没有找到whil […]...
快速加密视频文件
严格来说只是破坏格式，播放器不能识别而已，用于一般需求，但是超快，几百 GB文件只要秒级。重要文件请使用其他正 […]...
上海交通大学软件学院课程表格
上海交通大学工程硕士教学安排和上课时间表 2004~2005学年第2学期 […]...
CentOS7.0小随笔——运行级别
一、Linux运行级别（通用） 0：关机（halt） 1：单用户模式（无需用户名和密码的登录，用于紧急维护系统 […]...
Oracle连接Db2
因为有个业务场景需要访问客户DB2数据库的数据，我们使用的Oracle，百度一下是有方法的，本来以为很简单，没 […]...
SQL中CONVERT()转化函数的用法字符串转日期
SELECT CONVERT(varchar(100), GETDATE(), 0): 05 16 2006 […]...

展开目录

目录导航