3种深度学习算法
如果您认为机器学习是您无聊的暗恋,深度学习是您暗恋的父亲!由于硬件的空前发展以及研究人员对更好和更大模型的需求,深度学习正日益变得令人生畏和难以捉摸。每天进行的研究越多,对您应该具备的基本知识的掌握程度就越高。因此,对于所有犹豫不决直接进入深度学习的晦涩糊涂的人们来说,我希望本文能够增强您的信心。本文将不讨论这些模型的任何数学原理,而是为您提供概念上的强化,以使您的旅程在进行数学建模时变得更强大。
全连接网络(FCN)
您将找到的最简单形式的深度网络。它通常在中间有一个输入层,一个输出层以及可选的多个隐藏层。让下面的类比做解释。
比喻:科学怪人的实验室
想象您是科学怪人设备齐全的科学怪人实验室的助手。科学怪人刚刚请您使用以下仪器,并使用蓝色,红色,黑色和黄色的油漆制作紫色,深橙色和绿色。当您将颜色倒在顶部时,取决于管子开口的宽度,涂料将流到下面的一系列球中。有一种机制可以改变管子的尺寸。
这类似于FCN的工作方式。您为其输入,即特征向量(例如花朵的各种属性)(示例中的油漆桶),然后预测结果(例如花朵的种类)(示例中的混合色)。预测结果是一系列数学计算(涉及矩阵乘法,加法等)。您可能已经意识到该设备已经配置为最佳配置。达到最佳设置被称为训练/优化一个模型,其中包括输入特征向量,预测标签和真实标签(在示例中调整了管的宽度)。它也不必仅仅是输入层和输出层。您也可以具有中间(即隐藏)层。这是FCN真正的样子。(了解更多:这里)
应用领域
来自结构化数据的简单分类任务,例如根据房屋属性预测房屋价格
自动编码器
自动编码器是一种完全连接的网络,仅在使用的乳清方面有所不同。它们从像FCN一样的输入开始,将其映射到较小的隐藏表示形式(称为编码),最后重建原始输入(称为解码)。
打个比方:回到科学怪人的实验室
假设您和您的好友拥有上述两个小工具,然后决定与他们一起玩。您将它们组合在一起,以便它们共享输出。现在看起来像下面。请注意,底部的管配置是顶部的镜像。
您可以从顶部倒入颜色,然后在中间混合它们。然后,可以分离不同颜色的“魔术粒子分离器”将使颜色分离为其原始颜色。您甚至可以将随机颜色倒在顶部,然后让此歧管在底部找出随机颜色。
这就是自动编码器中发生的情况。它需要一个输入(示例中的绘画),计算较小的潜在表示形式(示例中的混合颜色),最后得出原始输入(示例中底部的颜色)。这是真实的自动编码器中的外观。
应用领域
恢复损坏的图像—您可以训练自动编码器,方法是输入损坏的图像并要求模型预测原始图像(类似于识别顶部的随机颜色)。
图像/数据聚类-您可以将学习到的较小的潜在表示形式用作数据的特征表示代理,从而可以对数据进行聚类
卷积神经网络
啊! 计算机视觉的征服者。CNN非常擅长处理图像。CNN由卷积层,完全连接的层和可选的合并层组成。CNN接收具有高度,宽度和通道的图像(例如RGB-红绿蓝)。
打个比方:在博物馆抢劫!
有一个令人讨厌的罪犯,试图闯入博物馆偷钻石。他走进博物馆,策划抢劫案。他将地板分成5×5的网格。然后他从一个单元格走到另一个单元格,每行从左到右。然后,他将查看四个相邻的单元格(即,他所在的单元格,右单元格,上方单元格和右上方单元格)。如果他在该视野中看到一些障碍物/伪影,则可以在其正上方的天花板上拍摄绿色的夜光标记,如果钻石在这四个单元之一中,则可以拍摄红色发光的深色标记。如果他站在地板上的每个牢房里,他都会有下面的计划。有了这个,他甚至可以在晚上潜入,甚至在漆黑的黑暗中也知道该去哪里!
这就是CNN的卷积层所做的。它在图像上移动一个内核(强盗想要映射的内核),该内核一次看到一幅图像的一小部分(就像强盗进入所有单元格一样)。并且在每个位置,它将输出一些值(例如,是否存在障碍物)。此过程导致开发功能图,该功能图提供了所分析内容的有用的宏级别信息。最后,将FCN连接到最后一个卷积层,因为任何分类/回归任务都需要FCN 。这是典型的CNN的样子。(了解更多:卷积神经网络)。
应用领域
图像分类-确定图像中存在的对象的类别
对象检测-识别图像中的所有对象及其位置
结论
我们研究了三种算法;全连接网络(FCN),自动编码器和卷积神经网络(CNN)。这是主要的要点。
FCN接受输入特征向量并预测正确的输出类别
自动编码器接收输入,将其转换为较小的表示形式并重建原始输出
CNN接收图像,然后通过一系列卷积/合并层将其发送,最后通过FCN发送,该FCN可以预测图像中存在的正确对象类别。
发布于 09-01