一.概述 

       承网上的前辈所言:机器学习不是一个一个孤立的算法堆砌起来的,想要像看《算法导论》这样看机器学习是个不可取的方法.机器学习里面有几个东西一直贯穿始终,比如说数据的分布、最大似然,偏差、方差的权衡,特征选择,模型选择,混合模型等等,这些知识像砖头、水泥一样构成了机器学习里面的一个个的算法。想要真正学好这些算法,一定要静下心来将这些基础知识弄清楚,才能够真正理解、实现好各种机器学习算法

        

  二.学习资料

  1.在线课程

  台大林轩田老师在coursera上的<机器学习基石>是对学习理论的一个很好的介绍,他在<机器学习技法>中也会在介绍多个常用算法的同时辅以从理论方面的解释,本来这两堂课在台大就是一体的.如果学习机器学习,以此入门,个人认为是首选.
  备选的在线课程有吴恩达的课程,较前者更易.

 

 

  2.教材书籍

  书籍方面不建议直接啃周志华教授的<机器学习>(俗称西瓜书,因为大部分篇幅以西瓜分类等问题为背景,因而得名),里面数学挺多,新人的话觉得比较容易迷失在细节里.<机器学习实战>用来入门,个人觉得不错,可在短时间对机器学习这门学问的整体轮廓有大致了解.西瓜书和李航教授的<统计学习方法>建议备在案头,常读常新.国外的经典教材有很多,个人没有读过,不便评价.另外,<集体智慧编程><数据分析实战><人工智能:一种现代方法>是拓宽视野不可多得的几部好书,不要错过.

  3.工具软件

  边学习边验证,效率更高.有些成熟的机器学习框架,可以让我们在学习中更方便的获得感性的认知.这方面,首推Python系的scikit-learn,易用性不说,文档也感人到不行.备选有Spark中的MLlib以及Mahout,各自优缺点不赘述,一查便明.

       

  4.数学功底

  统计/概率/最优化(凸优化),这里面个个学问深似海,又实在缺不得.奈何人精力有限,对入门者可暂时放缓,集中火力攻一点,先对机器学习的整个知识体系有大概了解,同时持续补强数学知识.机器学习扎根于数学,没有相关储备是走不远的.

  此处推荐July的七月在线公开课视频,里面对于机器学习相关的数学部分有免费视频放出。

  5.实战检验

      Kaggle和阿里的天池都可以尝试玩一下.找些简单的玩具题目入手,不求成绩,能够熟悉整个的分析流程,应用上所学就好,想成大牛,慢慢来,比较快.

  如果已经工作,尝试在工作中发现应用场景也是不错的,定能让你工作更出彩!

 

       三.最重要的一点:

  多动手,少学习。这里所谓的“少学习”指的是,不要因为你要用到的工具包需要使用你从未接触过的python语言,就抱着一本python编程指南啃三星期。这种“学习”基本上是浪费时间,关于matlab、python、hadoop、opencv、nltk……这些耳熟能详工具的使用,请活用官方文档、百度以及google,按照你的需求,边做边学即可。 

    

版权声明:本文为kaggle原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/kaggle/archive/2004/01/13/5666156.html