普通人如何站在时代风口学好AI?这是我看过最好的答案
摘要:当前,数据、算法、算力的发展突破正推动AI应用的逐步落地。
AI是什么?
根据维基百科的定义,人工智能是一种新的通用目的技术(GPT, General Purpose Technology),它横跨整个人类经济的多种用途,具有巨大技术性互补和溢出效应。
简而言之,AI是21世纪的一种基础技术,它会应用在我们日常生活的方方面面。
AI的历史、现在和未来
早期,受到20世纪数学哲学的影响,诞生出两种流派的人工智能。
基于形式主义(认为所有数学分支都可以公理化的)和逻辑主义(一切数学都是建立在数理逻辑的基础之上)的符号主义的人工智能,以及基于构造主义的连接主义和行为主义人工智能。
早期的流派都认为自己提出的理论有很大的潜力,可以解决很多问题。但在经过一系列探索后,科学爱家发现AI并没有想象中的简单。
之后,AI经历了起起落落的发展阶段。直到2006年,深度学习之父Geoffrey Hinton 和他的学生Ruslan Salakhutdinov在《科学》上发表了一篇文章,提出了深层网络训练中梯度消失问题的解决方案,至此开启了深度学习在学术界和工业界的浪潮。
2012年,Geoffry Hinton又带着团队参加了ImageNet ILSVRC挑战赛,以惊人的优势获胜(错误率比第二名低了足足 10%),这次的比赛结果以及相应的论文拉开了深度学习的热潮。
而深度学习之所以会从2006年后大放异彩,很大一部分的原因是数据、算力的发展,当时的数据集ImageNet的数据量很大,再加上使用GPU训练深度学习网络,这两个突破奠定了深度学习的崛起。
如今,GPU的算力也越来越强,现在的AI发展又是如何呢?
AI应用落地的三驾马车
当前,数据、算法、算力的发展突破正推动AI应用的逐步落地。
1、数据资源丰富
随着物联网基础设施及智能手机、可穿戴设备的普及,我们每个人时刻都在产生大量数据。据IDC发布《数据时代2025》的报告显示,全球每年产生的数据将从2018年的33ZB增长到175ZB,相当于每天产生491EB的数据。
另一方面,大数据等技术,降低了数据处理和存储的成本,数据作为人工智能时代的“石油”,驱动着AI的发展。
2、算法持续突破
在传统深度学习CNN/RNN系列模型之后,强化学习、对抗网络算法模型不断涌现。AI算法逐步逼近人类水平。
自然语言处理(NLP)方面,2018年Google推出的BERT开启了NLP的元年,如今BERT在数据集上的两个指标(GLUE基准:80.4%,MultiNLI准确度:86.7%)全面超越人类。
计算机视觉方面,图像分类的算法很早之前就已超越了人类;动作识别目前精读相对较低,停留在52.5%;人脸识别的某些数据集也已经超越了人类。
语音语义识别方面,中文语音识别准确率达到新高度,中文语音识别字错率(CER)达到3.71%,与人类专业的速记员水平相当。
3、AI芯片释放巨大算力
AI芯片市场细化,推理与训练、云侧与端侧分离,性能持续提升,突破摩尔定律瓶颈,释放ZB级数据分析算力。
NVIDIA的Tesla V100,作为AI训练通用芯片,性能远超上一代P100的10+倍;
Google的TUP3.0是2.0性能的8倍左右;
华为也推出了适用于推理场景的昇腾310以及适用于模型训练的昇腾910。
从早期的CPU、GPU到现在的TPU、ASIC,进入到细分领域后,各种AI专用芯片会层出不穷,性能不断提升,功耗不断降低。
未来,AI是否会超越人类?
当前,一些算法在某些数据集上的准确率已经高于人类,很多人会问:AI是否会超越人类?
如图,首先并不是人类社会的所有问题都是数学问题,有很多问题是不能用数学来描述,黄色圈子内是可以用数学解决的问题。
由此引出了第一个问题:世界上是否所有数学问题都有明确的答案?
答案是有些数学问题是无解的。
第二个问题:如果有明确的答案,是否可以通过有限步骤的计算得到答案?
这就是数学的可计算问题,经过验证,并不是所有数学问题都是可以计算。
接下来是第三个问题:对于那些有可能在有限步骤计算出来的数学问题,能否有一种假想的机械(图灵机),让它不断运动,最后当机器停下来的时候,那个数学问题就解决了?
结果是只有部分问题是图灵机能够解决的。
回答完上面三个问题后,再回看上面那张图,蓝色圈子里面的一个小圆是AI可以解决的问题,最后的小点才是AI已经找到解决方法的问题,只占据非常小的一部分。
所以,我们可以说,在AI已经找到解决方法的问题上,它可能超越了人类,但是在更多的问题上,它是没办法超越的。
那么在某些领域里,AI的准确率既然高于人类,比如图像识别,它可以完全替代人类吗?
如上图所示,左边是正常的原图,中间是干扰数据,让AI预测的是加了干扰数据的右图。我们可以很清楚的辨别左右两组图完全没有区别,但是AI算法做不到,它会把右边的三张图片都判断为鸵鸟。
再来看另一组AI犯错的案例,上面是一些噪点和花纹的数据,但AI有99.6%的概率会将这些图片识别成某种类别的物体。在我们普通人来看,AI有时候会犯一些非常愚蠢的错误。
这时候再回答“未来,AI是否会超越人类?”的问题,答案就是:AI能解决的只是人类社会中很小的一部分问题,即使它能解决,并在统计意义上得到一个还不错的准确率,但它有时还是会犯很愚蠢的错误,AI的预测结果并不是完全可信的,AI不会超越人类,它应该成为人类的工具,使人类社会的生产效率进一步提高。
人工智能入门的三大难点
最后谈谈高校学生,或者是普通开发者学习AI可能会碰到的一些问题,主要有以下三个难点:
一是要学习的基础知识太多,做AI开发涉及到Python编程知识、Linux知识,视觉方面要学图像处理、OpenCV等,同时还要有一定的数学基础。
二是没有GPU机器,自己买GPU做AI训练,成本非常高。
三是碰到问题找不到人进行交流,尤其是非计算机专业的同学学AI会比较难,因为做AI开发不像传统的软件开发那样有非常多的书籍资料和社区可以交流,很多人只能在GitHub上找一些资料来解决学AI过程中的一些问题,能交流的人和圈子都会更少一点。
结语:
幸运的是,华为云提供了一站式AI开发平台ModelArts,可以低门槛、低成本的上手AI,并且提供ModelArts社区、《ModelArts人工智能应用开发指南》等书籍,解决学习AI过程的以上三个难点。而且在1024程序员节这样喜大普奔的日子里,华为云也推出了以“向云而生”为主题的一系列趣味活动和直播,学AI的同时可以集卡牌、抽盲盒,看直播更有超豪华锦鲤大礼包。
备注:本文整理自华为云EI图像算法专家零一老师的直播《开发者如何抓住时代机遇学好AI》,点击可以回看。