在过去的几个月里,我一直在专注于整理归纳AI的各类小要点。在被越来越多的朋友同事问及时,我决定将这些总结和心得的完整版分享给大家。为了增加内容的趣味性和可读性,我也在每个主题下面加了些注解,希望对你们有用

 

机器学习

Scikit-learn 算法

这张图可以帮助你找到正确的估计器,这应该是机器学习汇总最难的部分。下面的流程图可以帮助快速查找文档,并对每种估计器做了大致的介绍,有助你更快了解问题并找到解决方案。

 

Scikit-learn(学名scikits.learn)是一个免费的机器学习Python编程语言库。包括了各类分类、回归与聚类算法,并支持向量机、随机森林、梯度提升、 K-means和DBSCAN。它还可以与Python NumPy和SciPy进行交互。

 

Microsoft Azure 算法

这个微软Azure的机器学习表可以帮助你为预测分析方案选择合适的机器学习算法。首先根据数据的性质,匹配最佳算法。

 

用于数据科学的Python

 

TensorFlow

今年5月,Google宣布在第二代TPU和Google计算引擎中加入对TPU的支持。第二代TPU拥有高达180 teraflops的性能。当 64个TPU组合在一起时,可以提供高达11.5千万亿次的浮点运算性能。

 

Keras

今年,Google也在TensorFlow的核心库中支持Keras。Chollet认为比起端到端的机器学习框架,Keras更应作为一个接口。它提供的是更高级别、更直观的抽象集,使得无论后端科学计算库是什么,都可以轻松地配置神经网络。

 

Numpy

NumPy 是针对Python中的一个非优化的字节码解释器——CPython的参考实现。针对这一版本的Python编写数学算法的运行速度相对较慢的问题,Numpy 使用的是多维数组和函数与运算符来改写部分代码,从而提高运行的效率。

 

Pandas

“Pandas”的名字源于“Panel Data”,是多维结构化数据集的计量经济学术语。

 

数据预处理

数据预处理(data wrangler)一词已经开始渗透进了流行文化中。今年的电影“金刚·”中,演员Marc Evan Jackson饰演的角色Steve Woodward正是被介绍为——我们的数据处理者。

用 Dplyr 与 Tidyr 进行数据预处理

 

SciPy

SciPy 是基于NumPy数组对象构建的,是NumPy堆栈的一部分,包括 Matplotlib,pandas和SymPy 等工具,以及扩展的科学计算库集。该NumPy 堆栈与其他应用程序(比如MATLAB,GNU Octave 和 Scilab)用户差不多。NumPy堆栈有时也被称为SciPy堆栈。

 

Matplotlib

Matplotlib是Python编程语言及其数学数学扩展NumPy的绘图库,提供了面向对象的API,用于使用 Tkinter、wxPython、Qt或GTK +等通用GUI工具包将图形嵌入到应用程序中。还有一个基于状态机(如OpenGL)的程序 “pylab”接口,很像MATLAB,但不鼓励使用。

Pyplot 是matplotlib的一个模块,提供了一个类似MATLAB的界面。Pyplot 跟MATLAB一样容易上手,兼容Pyhton还是免费的~

 

数据可视化

版权声明:本文为dashuju原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/dashuju/p/7659563.html