人工智能的定义与探讨
零 序
0-1 自学进度
数学 | 计算机基础 | ML算法 | 工程实践 |
微积分 | Python基础 | K-NN | 基于K-NN的鸢尾花分类(201809) |
线性代数 | Java SE / Java EE | SVM | 基于TF-IDF与SVM的电子邮件作者识别方法(201712小美赛-数模B题) |
概率论与数理统计 | 数据库 | Naive Bayes | 基于朴素贝叶斯的法律咨询文本分类方法(201708) |
数据结构 | Word2Vec | 基于余弦相似度原理的人脸相似度识别(201704认证杯-数模-C题) | |
操作系统 / Linux | TextRank |
|
人与AI的能力层次
0-2 目录(本博文)
一 定义 | 二 数学 | 三 CS基础 | 四 ML算法 | 五 应用场景 | 六 推荐文献 | 七 精品书单 |
人工智能 研究方法 研究领域 涉及学科 |
微积分 | 语言(Python/Java) |
典型算法 分类 K-NN C4.5 CART Naive Bayes(朴素贝叶斯) 聚类 K-Means 统计学习 SVM EM 关联学习 Apriori 链接挖掘 PageRank 集装与推进 Adaboost |
实际应用 |
全局导览 学习路径 网络资源 API |
|
机器学习 | 线性代数 | 数据结构 | ||||
学科与学科间关系 | 概率论与数理统计 | 计算机算法思想 | ||||
计算机典型算法 | ||||||
一 定义
资料来源于维基百科、西瓜书(周志华教授 《机器学习》)、百度百科与网络
人工智能
“智能主体(intelligent agent)的研究与设计”,智能主体是指一个可以观察周遭环境并作出行动以达致目标的系统。约翰·麦卡锡于1955年的定义是“制造智能机器的科学与工程。AI的核心问题包括建构能够跟人类似甚至超越的推理、知识、规划、学习、交流、感知、移动和操作物体的能力等。强人工智能目前仍然是该领域的长远目标。目前有大量的工具应用了人工智能,其中包括搜索和数学优化、逻辑推演。而基于仿生学、认知心理学,以及基于概率论和经济学的算法等等也在逐步探索当中 —-维基百科
计算机科学的一个分支。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 —-百度百科
人工智能的定义可以分为两部分,即“人工”和“智能”。“人工”比较好理解,争议性也不大。有时我们会要考虑什么是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步,等等。但总的来说,“人工系统”就是通常意义下的人工系统。
如今没有统一的原理或范式指导人工智能研究。
来源:百度云智学院
研究方法
-
-
控制论/大脑模拟
- 控制论 / 计算神经科学
- 20世纪40年代到50年代,许多研究者探索神经病学,信息理论及控制论之间的联系。这些研究者还经常在普林斯顿大学和英国的RATIO CLUB举行技术协会会议.直到1960, 大部分人已经放弃这个方法,尽管在80年代再次提出这些原理。
- 控制论 / 计算神经科学
-
符号处理
-
GOFAI
- 当20世纪50年代,数字计算机研制成功,研究者开始探索人类智能是否能简化成符号处理。研究主要集中在卡内基梅隆大学, 斯坦福大学和麻省理工学院,而各自有独立的研究风格。基于知识大约在1970年出现大容量内存计算机,研究者分别以三个方法开始把知识构造成应用软件。这场“知识革命”促成专家系统的开发与计划,这是第一个成功的人工智能软件形式。“知识革命”同时让人们意识到许多简单的人工智能软件可能需要大量的知识。
- GOFAI 泛指用最原始的人工智能的逻辑方法解决小领域的问题, 例如棋类游戏的算法。
- 人工智能是否可以使用高级符号表达,如词和想法?还是需要“子符号”的处理?JOHN HAUGELAND提出了GOFAI(出色的老式人工智能)的概念,也提议人工智能应归类为SYNTHETIC INTELLIGENCE,[29]这个概念后来被某些非GOFAI研究者采纳。
-
GOFAI
-
子符号法
- 计算智能学科
- 80年代符号人工智能停滞不前,很多人认为符号系统永远不可能模仿人类所有的认知过程,特别是感知,机器人,机器学习和模式识别。很多研究者开始关注子符号方法解决特定的人工智能问题。
- 自下而上, 接口AGENT,嵌入环境(机器人),行为主义,新式AI机器人领域相关的研究者,如RODNEY BROOKS,否定符号人工智能而专注于机器人移动和求生等基本的工程问题。
- 计算智能学科
-
统计学法
- 90年代,人工智能研究发展出复杂的数学工具来解决特定的分支问题。这些工具是真正的科学方法,即这些方法的结果是可测量的和可验证的,同时也是人工智能成功的原因。
- 共用的数学语言也允许已有学科的合作(如数学,经济或运筹学)。
- 有人批评这些技术太专注于特定的问题,而没有考虑长远的强人工智能目标。
-
集成方法
- 90年代智能AGENT范式被广泛接受。
- 智能AGENT范式智能AGENT是一个会感知环境并作出行动以达致目标的系统。
- 最简单的智能AGENT是那些可以解决特定问题的程序。
- 更复杂的AGENT包括人类和人类组织(如公司)。这些范式可以让研究者研究单独的问题和找出有用且可验证的方案,而不需考虑单一的方法。一个解决特定问题的AGENT可以使用任何可行的方法-一些AGENT用符号方法和逻辑方法,一些则是子符号神经网络或其他新的方法。范式同时也给研究者提供一个与其他领域沟通的共同语言–如决策论和经济学(也使用ABSTRACT AGENTS的概念)。
-
控制论/大脑模拟
研究领域
-
- 演绎、推理和解决问题
- 知识表示法
- 知识表示 / 常识知识库
- 规划
- 学习
- 机器学习
-
- 运动和控制
- 机器人
- 知觉
- 机器感知
- 语言识别
- 图像识别
- 自然语言处理:自然语言处理探讨如何处理及运用自然语言,自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。
-
- 社交
- 情感计算
- 创造力
- 计算机创造力
- 相关领域研究的包括了人工直觉和人工想像。
- 伦理管理
-
- 经济冲击
涉及学科
-
- 哲学和认知科学
- 数学
- 神经生理学
- 心理学
- 计算机科学
- 信息论
- 控制论
- 不定性论
机器学习
机器学习的主要目的是为了让机器从用户和输入数据等处获得知识,从而让机器自动地去判断和输出相应的结果。
这一方法可以帮助解决更多问题、减少错误,提高解决问题的效率。
对于人工智能来说,机器学习从一开始就很重要。1956年,在最初的达特茅斯夏季会议上,雷蒙德索洛莫诺夫写了一篇关于不监视的概率性机器学习:一个归纳推理的机器。
机器学习的方法各种各样,主要分为监督学习和非监督学习两大类。
监督学习指事先给定机器一些训练样本并且告诉样本的类别,然后根据这些样本的类别进行训练,提取出这些样本的共同属性或者训练一个分类器,等新来一个样本,则通过训练得到的共同属性或者分类器进行判断该样本的类别。
监督学习根据输出结果的离散性和连续性,分为分类和回归两类。
非监督学习是不给定训练样本,直接给定一些样本和一些规则,让机器自动根据一些规则进行分类。无论哪种学习方法都会进行误差分析,从而知道所提的方法在理论上是否误差有上限。
未显式地编程,并赋予计算机智能。——-西瓜书(周志华教授)
学科与学科间关系
二 数学
微积分
线性代数
概率论
三 计算机基础
语言[Python/Java/]
Python
Java
数据结构
计算机算法思想
分治
减治
计算机典型算法
四 机器学习算法
典型算法
分类
K-NN
C4.5
CART
Naive Bayes(朴素贝叶斯)
聚类
K-Means
统计学习
SVM
EM
关联学习
Apriori
链接挖掘
PageRank
集装与推进
Adaboost
机器学习常见十大经典算法
五 应用场景
机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人等领域。
实际应用
-
- 机器视觉
- 指纹识别
- 人脸识别
- 视网膜识别
- 虹膜识别
- 掌纹识别
- 专家系统
- 自动规划
- 智能搜索
- 定理证明/推理
- 博弈
- 自动程序设计
- 智能控制
- 机器人学
- 语言和图像理解
- 遗传编程
- …
自然语言处理与机器视觉的应用场景小结
2018百度-AI 开发者大会现场
自然语言处理与法律领域的结合
六 顶会/顶刊
本部分内容完全摘抄自如下两份知乎回答,非常感谢。
[1] 计算机科学各个方向有哪些顶刊和顶会? – 李昕 – 知乎
[2] 计算机科学各个方向有哪些顶刊和顶会? – 硕鼠酱 – 知乎
6.0 人工智能
1 AAAI
2 IJCAI
6.1 自然语言处理
【会议】
1 ACL (Annual Meeting of the Association for Computational Linguistics)
> AACL(亚洲分会)
2 NAACL (Annual Conference of the North American Chapter of Association for Computational Linguistics)
3 EMNLP (Empirical Methods in Natural Language Processing)
4 EACL (Annual Conference of the European Chapter of Association for Computational Linguistics)
5 COLING (International Conference on Computational Linguistics)
6 SIGKDD (ACM SIGKDD Conference on Knowledge Discovery and Data Mining)
7 SIGIR (ACM SIGIR Conference on Research and Development in Information Retrieval)
8 WWW (International World Wide Web Conference)
【期刊】
1 CL (Computational Linguistics)
2 TACL (Transactions of the Association for Computational Linguistics)
【数据集】
6.2 机器学习与数据挖掘 / Machine learning & data mining
1 ICML
2 KDD
3 NIPS
6.3 WEB 信息检索
1 SIGIR
2 WWW
6.4 计算机视觉
1 CVPR
2 ECCV
3 ICCV
6.5 计算机体系结构
1 ASPLOS
2 ISCA
3 MICRO
七 推荐资源
其它科普性文章
全局导览
[1] 机器学习算法
[3] 机器学习
学习路径
博主评注:每个人的专业背景(数理统计、计算机、非数理统计非计算机等)、学历背景、自学能力、学习动机(升学科研、就业、仅仅兴趣等)均不同,每个人的学习路径不一定是一致的,应当自寻一条适合自己的道路。仅仅个人之见。
网络学院(系统性学)
[1] 吴恩达/斯坦福大学-机器学习
[2] Google-机器学习速成课程
[3] Google-Tesorflow
[4] Tensorflow中文社区-MNIST机器学习入门
[5] 数据挖掘十大算法详解
[6] 吴恩达:深度学习与神经网络 – 网易云课程(免费/2019最新/优质课程)
API
[1] 百度
八 精品书单
[1]《统计学习方法》李航
[2] 《机器学习》周志华
[3]《Machine Learning》Tom M. Mitchell
Deep Learning 实战之 word2vec – Deep Learning 圈