怎样自学成为一名数据科学家?
神译局是36氪旗下编译团队,关注科技、贸易、职场、生存等范畴,重点先容国外的新技能、新观点、新风向。编者按:数据科学家被以为是21世纪最性感的职业。但是假如你没有大学学位,对数据和编程险些没有相识该怎么办?又大概你原先干的不是这一行想要转行又怎么办?不停致力于为学习数据科学提供引导的Dario Radei给出了他的发起和参考册本。原文发表在Medium上,标题是:Becoming a Self-Taught Data Scientist
http://pics0.baidu.com/feed/94cad1c8a786c917ef46e54d68ba78c93ac7578e.png?token=d1fcd1891a1025e1f0e07a7f05ec4c02&s=7BD780449C4100DC11AE6210030090DD
数据科学被以为是21世纪最性感的工作。这是一项大胆的声明,重要是由于我们现在才是2019年,谁知道50年后的就业市场会是什么样子的呢。
但是,假如只看已往15至20年的职位的话,那就完满是另一回事了。在本文中我将为各人找出一些最精彩的资源,让你可以一举打进数据科学的范畴。而且你是否拥有其他范畴的学位一点都没有关系。
在本文中,我将深进探究自学数据科学的门路,同时还将为你提供一些精彩的资源来开始学习。
本文实用于谁?
没有任何学位的人在一段时间前完成大学学习并想转向数据科学的人好来,我们就不要再花时间在先容上了——如今,我们将深进探究真正的内容。
自学是什么意思?
好题目。简而言之,这意味着你没有在本身感爱好的范畴(好比说数据科学)修完任何的大学文凭,但是你又在从事着本身感爱好的这个范畴的工作(好比数据科学),那么就可以以为在该范畴你是自学成才。
你还可以到网上往修在线课程,往看看书,但是并没有花几年在大学课桌背面担当正规教诲。
那么我们就来看看自学成为数据科学家的第一种办法是什么吧。
从零开始的门路
假如符合以下环境的话你属于这一类:
你没有大学学位你对数据和编程的相识很少或一点都不相识那该怎么办?这是一个很难答复的题目。起首,你必要把握一些底子知识,重要是数学和统计技能。而且,你也的学习怎样编码,最好是用Python。
之前我写过一篇文章,内里列出了进进该范畴所需先决条件的相干资源:
数据科学预修终极清单
我知道,要学的太多了,但是没有人说这件事变很轻易。花一些时间来学习一下底子知识。你不必要手工往做大量盘算,踏实的可视化明白应该就绰绰有余了。
我不发起手工举行大量盘算有一个缘故原由——由于那种事变盘算机很轻易做到。对于盘算机来说困难的是怎样框定题目,以及知道在哪种环境下要做什么(我说的不是条件语句)。这就是数学和统计方法的可视化是一座金矿的缘故原由。
假如你乐意花时间深进学习一下数学、统计学以及步伐计划的话,那你的出发点就跟那些几年前在大学听这些课学习数据科学的人一样了(大学学数学的人除外)——至少在数据科学方面,那些完成学业的人尽对不会比你领先。
这就是从0开始的门路。接下来让我们探索另一条门路,然后再深进往研究一下相干资源。
转换职业的门路
转行大概会很艰巨。你大概已经从事某个范畴已经好几年,然后确定这一行不得当你。这没什么。大概你以为很无聊,大概是工作动力不敷……缘故原由穷举不尽,我不想过多讨论。
你想要尽快做的一件事是要诚实地评估本身的数学和统计技能。我是说要老实面临本身。认可本身把10年前学到的东西全都还给了老师并不是什么可耻的事变。
假如您对以放学科的明白不是100%自大的话:
线性代数微积分概率论统计步伐计划请参考本文并选择得当你需求的资源——无论是册本照旧在线课程都可以。
OK,该说的都说了吗?你可以继承看看我个人选择的资源。
为自学成才的数据科学家预备的资源
不管出于什么缘故原由读大学都不应该是个选项,但是你可以天天花一两个小时往探索一下数据科学的天下。紧随着的下一步因人而异,这很大水平上取决于你喜好看书照旧看视频。我更喜好看视频——由于我不想上完8小时的班后还要看书。
我会从我个人的最爱开始——这是我跟数据科学的第一次打仗:
实用数据科学和呆板学习的Python练习营
Jose是一位了不得的讲师。他先是简朴回首一下根本的Python库,然后很快你就可以开始用Pandas和Numpy 举行数据分析,并用Matplotlib 和Seaborn举行一些数据可视化。是的,你还会训练呆板学习。东西未几,也不敷深进,但足以带你进门。
假如你更喜好读书,那么我发起你看看这本书:
书名叫做《Python数据科学手册》,大概有550页,涵括的内容跟前面的视频课程一样—— numpy、Pandas、Matplotlib以及Scikit –Learn——都是些对搞数据科学至关紧张的东西。
一旦把握了底子知识,就该开始深进研究呆板学习了。我有两本值得保举的好书,此中一本是免费的。让我们细致讲一下。
对于想要进一步学习呆板学习的人来说,《统计学习进门》是一本非常精彩的书,照旧免费的。书内里偶然会有些数学性的内容,但是读起来照旧比力轻易的。对于呆板学习这么一个话题广泛的范畴来说,此书可以或许把篇幅控制住400页左右,阐明简便性做的相称好。唯一的缺点是这本书的代码是用R语言而不是Python编写的。但是,你可以试着把R 代码“翻译” 成Python 代码,这肯定会是一个很好的训练。
我要保举的下一本书叫《Scikit-Learn与TensorFlow呆板学习实用指南》。假如我没记错的话,这本书大概有700页,厚是厚了点,但简直是一本好书。你还将学习到一些深度学习的概念,而且还会学习一些呆板学习算法。
这两本书你选哪一本都不错,都是很好的进门读物(最好两本都看)。
至于在线课程,我得保举一下Coursera的呆板学习课程,由于这是呆板学习的大牛吴恩达的课程学完这门课程必要10多周的时间,而且假如你底子不是很牢的话很快就会感觉到学习的困难。但是,在统共约莫12万的用户内里这门拿到了4.9(满分为5)的高分,这已经说明白统统。
实行不是用Python写的,乃至也不是用R语言编写的,而是用Matlab 的免费版本Octave 写的,这一点必要思量一下。
后续筹划
你已经看过书大概课程(大概这两样都做了)了,如今你想知道下一步该怎么做。后续该怎么做实在要因人而异,但抱负环境下,你应该往设立一个GitHub档案。
找到5个好一点的数据集,然后尽本身最大积极往做。往举行大量的分析,用Markdown格式写下结论和想法,制作自述文件,满身心地投进进往。
如许做很紧张,缘故原由有两个:
这是在训练新习得的技能向潜伏员工展示你写出高质量代码以及得出结论的本领至于在职业发展方面,让潜伏雇主看到你的最好作品非常紧张。你没有大学学位,大概至少没有相干学位的话,你得以某种方式向他们展示本身的本领,让他们知道你知道怎么往完成工作。而GitHub是个不错的选择。
花一两个月的时间,做点让本身感到自满的事变吧。
译者:boxi。
http://www.fyguaji.com
页:
[1]