(本科生怎样通过努力拿到较好的机器学习/数据挖掘相关的offer?)
对机器学习/数据挖掘有很大的兴趣,想从事机器学习/数据挖掘相关的工作,我想知道通过2017这大约一年的努力,拿到比较满意的左边offer右边。
背景:国内某不知名211学校软件工程专业,大三下学期,成绩大约专业前20%,保不上研,也不太想在国内上研究生,想先工作几年,攒钱然后出国去读研,可能有人会说为什么不直接就出国,原因是家境一般,不想让父母的压力太大,所以才想自己赚钱出国。
目前的学习情况:在coursea上完成了Ng的machinelearning,这应该算是入门了,现在正在学习台大林轩田老师的机器学习基石和技法,本人也知道机器学习的基础也很重要,还看了李航老师的统计学习方法,目前正在看程序员的数学线性代数和概率统计,不知道这两本书怎么样,还有Ng随堂录制的机器学习也看了一些。这些东西应该都还停留在理论上面,本人项目经验为零,接下来准备找老师参加一下kaggle,想在实际的方面也学习一些。其他的书籍还有机器学习实战,还有一些python相关的书。
计划:想参加2018年的校招,希望有经验的过来人给一些建议,毕竟这个专业基本都是研究生,本科生应该不太容易,目前比较心仪图森互联的算法实习生,因为还有写论文的机会,这样应该对以后申请学校时会有帮助,不知道这个公司要达到什么水平才能进去,希望得到各位有经验的人给一些建议。PS:不知道这类公司面试时是怎样的流程,对算法的要求是怎样的,有时间尽量去刷leetcode吧。
目标导向,不谈其他的方向,只谈如何快速拿到数据挖掘的左边offer右边
我选择了公司的校招中比较严格的(top5%)一个jd要求,我们看下如何拿下这个左边offer右边。
1.计算机或者数学等相关专业学历
无论你是什么专业的,大学有个选修课的东西,很多人都是用来混学分的,你可以去选择比如“数理统计选修”、“概率论选修”、“算法基础”这些课,挂了不影响绩点,但是你考的好可以给之后找工作带来很高左边加分右边,你的老板会认为你是一个热爱数据挖掘并且有长远计划的人
2.在机器学习,数据挖掘,统计学理论,最优化理论等领域有着深厚积累
“全栈工程师”在我心中一直是伟大的存在,但是对于本科毕业,选择专精很重要。推荐几个方向:用户研究(征信、消费者研究),图像音频分析(讯飞之流),异常分析(风控、物流),订单预测等等,你在一方面研究的比较深,就算是应届生,但是比起像我这种三四年的老油条,老板更喜欢培养这样带有“天赋专精”的白纸
3.熟悉机器学习和数据挖掘领域前沿技术
前沿技术是一个比较宽泛的词,相信我,面试你的人每天从早上10点加班到晚上10点,周末还要打游戏,他自己都不知道啥叫前沿技术,平时打好基础,老板基础问不倒的时候,你就已经在候选人名单里面了
4.在国际顶级会议和期刊以第一作者发表过高水平论文者优先
这点我也做不到,我就不bb了
5.有机器学习、数据挖掘等相关项目实际经验者,或者知名数据挖掘比赛(例如KDDCup等)中取得领先名次者优先
这个是非常重要的。
在应届生面前,成绩是没有区分能力的,老板在乎的是你入职后给公司带来的利益而不是你是不是学生会主席这些毫无意义的事情。我走的是前面这条路,分享一下我的套路。我大三的时候参加了百度的某个不知名比赛,拿了区的入围奖,然后拿着这个入围奖参加中国电信实习生招聘,大四凭借一年电信实习经验去了惠普的数据挖掘实验室继续实习,完整的做了2个项目后正式入职现公司。
分析下来就是,刚开始是弱鸡,所以采取了一些简单的途径拿到一些听起来很厉害但是很弱鸡的奖,再借这个奖混进一些容易被唬住的公司(没有黑电信的意思),之后在凭借工作经验进入一些能够给你机会的地方(就是让你自己带一些项目),好好做几个优秀的项目(这个比较难,看命),然后达成你的目标。想一下子第一很难,但是我们可以做一个长远的规划,先前100,再前50,再前10,再第一。
6.编程基础扎实,熟悉算法数据结构,有多年Scala或Python开发经验
我大学的时候学校教了spss,但是我当时考虑的是外面企业都是抠x。应该不会买,果然毕业之后,R语言、Python火的不行,建议选择一门你喜欢的开源语言,去写code练吧,网上很多撕逼的问题比如“php是不是最好的编程语言”,其实,选择一个你最适应的就行,别在乎别人怎么bb,因为最后要用的人是你自己。
7.有大数据相关系统,拥有map-reduce、spark、实时计算等经验
这个需要回到第5条,我在大学里面的时候,老师就忽悠我,说什么mysql足够了,而且一般学校不会搭建Hadoop这些平台,搭建成本高,维护成本高。建议混入一些“高端的”公司,请里面的老油条两三顿夜宵,给你开个查询权限,相信我,从菜鸟到乳鸽,你只需要1个月的时间。
8.踏实勤奋,自我驱动,善于沟通
个人感觉数据挖掘岗位需要强迫自己拥有三个技能。
1)快速学习能力,永远不知道下一个火起来的算法是啥
2)数据敏感力,数据挖掘的下限取决于勤奋,上限取决于数据敏感程度
3)沟通能力,你要让你的boss相信你做的Randomforest结果,你需要先说服他,我做的是靠谱的。
最后,祝你找到理想的工作,如果目标在上海工作,你可以找我帮你内推,加油,少年。
扫描上面二维码,微信咨询
落户咨询热线:13671738356
咨询热线
13671738356