数据挖掘工程师面试指南
转载自:http://www.d1net.com/bigdata/news/326089.html, 2014-12-31 11:12:54 本文摘自:36大数据
数据挖掘领域是一个独特的行业,通常的招聘方法可能不大适用于本行业的特点。在招聘一个合格的数据挖掘工程师时,公司一般关注以下三个方面:
1、他聪明吗?
聪明意味着能够透过复杂的信息建构问题并以正确的方式加以解决。聪明人还能从失败中获取经验。
2、他是否专注于项目?
专注意味着在各种困难的环境中,仍能独立或合作完成项目。
3、他能否与团队一起工作?
团队合作需要很好的沟通能力。工作中涉及到的概念、问题、模型和结论等都需要成员之间正确的沟通方能加以明确。
为了解候选人是否具有数据挖掘工程师的潜质,需要一个小时以上的面试,类似于以下五个环节:
1、简介
交谈寒暄,使候选人放松下来,互相介绍和问答。
2、关于数据挖掘项目
这是一个重要和耗时的环节,主要是询问候选人最近进行的数据挖掘项目的情况和处理方式。一般包括以下方面:候选人如何描述这个项目?候选人在项目中处于什么角色和有什么贡献?项目持续了多长时间?这个项目的关键问题是什么?问题如何解决?数据挖掘中最困难的阶段是什么?最有趣的经历或阶段是什么?在候选人眼里,客户是什么样的?在他眼里,团队其他成员是如何表现的?候选人从中获得了什么样的经验?……
在这个环节,不仅要向候选人提问”What“的问题,还要多沟通关于”Why“的问题。因为优秀的数据挖掘工程师要能够面对客户压力和要求,清晰地支持回应他们的要求,并有理有据地论证他们提出的观点。
3、关于数据挖掘的流程
考察候选人对于工作流程的认识是必要的,如果他谈到了跨行业数据挖掘流程规范(CRISP-DM)意味着好兆头。有很多时候,候选人对这些规范不以为然。虽然说从不同的角度来看待问题是一种创新,但是创新也需要建立在坚实的流程标准之上,以保证人为决策不会出现大纰漏。必要时,可以让候选人在白板上画出工作流程图,并让他评价这些工作中最为重要或者最需要反思的地方。因为建模工作不可能一次完成,需要反复地提炼问题和重建模型的情况是经常遇到的。
另外,面试中也可能会集中在某个挖掘流程进行深入考察,例如询问如何避免过度拟合、如何从大量的候选变量中进行筛选、如何评价比较模型的效果等。
4、解决问题
软件公司的面试一般会包括”编码测试“,考察数据挖掘工程师也应该如此。一种通用的做法是提供一份存在缺陷的分析报告,让候选人对报告进行研究,阐述报告中结论的意义,提出其中所存在的问题或不足,以及改进或补救的方法。
5、收尾
在面试的最后阶段,面试方需要回答候选人提出的问题,并使之相信公司在本行业的优势地位或者光明前景,以及从事这个岗位在职业生涯中的作用。在完成面试后,面试人通常会立即将面试记录整理存档。
对于面试人和候选人来说,面试都是繁重的,但也是一个交流学习的好机会。通过面试,双方可以了解到其他人遇到的问题,以及他们是如何解决问题的。