首页 首页 大数据 查看内容

数据科学技能中,哪些是核心技能,哪些是热门 / 新兴技能?

木马童年 2019-10-12 11:30 65 0

作者:Gregory Piatetsky 译者:刘志勇 原文: KDnuggets,译文来源: InfoQ 我们确定了两类主要的数据科学技能:一类是大多数受访者所拥有的稳定技能,这一类有 13 项核心技能;另一类是大多数受访者尚未拥有但想掌 ...

作者:Gregory Piatetsky 译者:刘志勇

原文: KDnuggets,译文来源: InfoQ

我们确定了两类主要的数据科学技能:一类是大多数受访者所拥有的稳定技能,这一类有 13 项核心技能;另一类是大多数受访者尚未拥有但想掌握的热门 / 新兴技能。请参阅我们详细的分析。

最新的 KDnuggets 投票调查问了如下两个问题:

你目前拥有哪些技能 / 知识领域(在工作或研究中可以使用的水平)?

你想增加或提高哪些技能?

我们根据 KDnuggets 之前的一些文章和投票调查,选出了 30 项技能。

这次投票调查总共收到了超过 1500 张投票,这是一个足够大的样本,可以做出有意义的推论。平均每个投票者报告声称其拥有 10 项技能,并希望增加或者提高 6~7 项技能。

下面的图 1 显示了关键的调查结果,x 轴表示 % 已拥有技能,显示的是第一个投票问题的答案;y 轴表示的是 % 想拥有的技能,显示的是第二个投票问题的答案。每个圆形的大小与已拥有该技能的投票者的百分比成正比,而颜色取决于“想拥有 / 已有用”的比率(>1,比率越高颜色越红;<1,比率越低颜色越蓝)。

数据科学技能中,哪些是核心技能,哪些是热门 / 新兴技能?

图 1. 与数据科学相关的技能,已拥有技能 vs 想增加 / 提高技能

在这种图表中,我们注意到有两个主要的集合。

图表右侧蓝色虚线矩形为第一个集合,该集合包含超过 40% 投票者所拥有的技能,以及“想要拥有 / 已经拥有”的比率小于 1。我们称之为核心数据科学技能。它们将在表 1 中列出。

表 1:核心数据科学技能,按 % 已拥有技能降序排列。

数据科学技能中,哪些是核心技能,哪些是热门 / 新兴技能?

其中,最希望添加或提升的技能是机器学习(41%)和 Python(37%)。增长最少的是 Excel——只有 7% 的人想增加或提高他们的 Excel 技能。

图 1 左侧用红色边框标记的第二个集合,包括目前不太流行(% 已拥有技能 <30%)但正在增长的技能,“想拥有 / 已有用”的比率大于 1,请见表 2。我们将其称为热门 / 新兴数据科学技能。

表 2:热门 / 新兴数据科学技能,按“想拥有 / 已拥有”降序排列。

数据科学技能中,哪些是核心技能,哪些是热门 / 新兴技能?

有趣的是,尽管有人认为 Hadoop 正在走下坡路,但在这次投票调查中,想学习 Hadoop 的人比已经知道它的人还多,所以 Hadoop 有可能仍然会越来越受欢迎。尽管 Julia 的“想拥有 / 已拥有”的比率为 3.4,但我们仍然没有将它包括在热门 / 新兴技能中,因为只有 2% 的投票者选择了它,因此它并不具备足够的支持。

其余的技能,如 XGBoost、软件工程、Java、MATLAB、SAS 只被 10%~30% 的投票者拥有,但没有增长:“想拥有 / 已拥有”的比率小于 1。

表 3:其他数据科学技能,按 % 已拥有的百分比递减

数据科学技能中,哪些是核心技能,哪些是热门 / 新兴技能?

小假面是关于投票调查的更多细节。图 2 按 % 已拥有进行降序排列。

数据科学技能中,哪些是核心技能,哪些是热门 / 新兴技能?

图 2:KDnuggets 读者拥有的数据科学技能

图 3 显示了读者想要增加或提高的技能,以及他们所拥有的技能。

数据科学技能中,哪些是核心技能,哪些是热门 / 新兴技能?

图 3:KDnuggets 读者想要增加或提高的数据科学技能(红色)和已拥有的数据科学技能(蓝色)。

我们看到,现有的和有意向的数据科学家想要添加的顶级技能是深度学习、TensorFlow、机器学习和 Python。

投票调查还询问了就业类型:

行业 / 自雇:64.4%

政府 / 非营利组织:7.2%

学术界 / 大学:7.0%

学者:14.3%

其他 /NA:7.1%

区域分布为:

美国 / 加拿大:37.9%

欧洲:28.3%

亚洲:19.3%

拉丁美洲:6.1%

非洲 / 中东:4.8%

其他:3.5%

作者介绍:Gregory Piatetsky-Shapiro 博士是 KDnuggets 的总裁,也是大数据、数据挖掘和数据科学领域的领军人物。他是数据挖掘和数据科学领先研究会议 KDD 的共同创始人,也是 ACM SIGKDD 的共同创始人和前任主席。他还是两家初创公司的首席科学家。

原文链接:Which Data Science Skills are core and which are hot/emerging ones?

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

数据科学
0
为您推荐
大数据技术改变城市的运作方式,智慧城市呼之欲出

大数据技术改变城市的运作方式,智慧城市呼

纽奥良虽像大多数城市一样有火灾侦测器安装计划,但直到最近还是要由市民主动申装。纽…...

大数据分析面临生死边缘,未来之路怎么走?

大数据分析面临生死边缘,未来之路怎么走?

大数据分析开始朝着营销落地,尤其像数果智能这类服务于企业的大数据分析供应商,不仅…...

什么是工业大数据,要通过3B和3C来理解?

什么是工业大数据,要通过3B和3C来理解?

核心提示:工业视角的转变如果说前三次工业革命分别从机械化、规模化、标准化、和自动…...

大数据普及为什么说肥了芯片厂商?

大数据普及为什么说肥了芯片厂商?

科技界默默无闻的存在,芯片行业年规模增长到了3520亿美元。半导体给无人驾驶汽车带来…...

大数据技术有哪些,为什么说云计算能力是大数据的根本!

大数据技术有哪些,为什么说云计算能力是大

历史规律告诉我们,任何一次大型技术革命,早期人们总是高估它的影响,会有一轮一轮的…...

个人征信牌照推迟落地,大数据 重新定义个人信用!!

个人征信牌照推迟落地,大数据 重新定义个

为金融学的基础正日益坚实。通过互联网大数据精准记录海量个人行为,进而形成分析结论…...