首页 首页 大数据 查看内容

资源总结:七步学习数据挖掘与数据科学

木马童年 2019-4-30 02:05 34 0

本文概述了学习数据挖掘和数据科学的七个步骤,每一步都给出了详细的学习资源,便于初学者按照指南开展数据挖掘与数据科学的学习。 想知道如何学习数据挖掘和数据科学吗?本文概述了七个步骤,指出的资源能让你成 ...

本文概述了学习数据挖掘和数据科学的七个步骤,每一步都给出了详细的学习资源,便于初学者按照指南开展数据挖掘与数据科学的学习。

想知道如何学习数据挖掘和数据科学吗?本文概述了七个步骤,指出的资源能让你成为一名数据科学家。

作者为Gregory Piatetsky,是一名数据挖掘与数据科学方面的专家。

资源总结:七步学习数据挖掘与数据科学

以下为7个步骤用于学习数据挖掘和数据科学。虽然有编号顺序,你也可以并行或以不同的顺序学习:

1 语音:学习R、Python以及SQL语音;

2 工具:了解如何使用数据挖掘和可视化工具;

3 教材:阅读介绍性的教科书,了解基础知识;

4 教育:观看网络研讨会,参加课程,考虑获得数据科学中的证书或学位;

5 数据:检查可用的数据资源并在那里找到东西;

6 竞赛:参加数据挖掘竞赛;

7 通过社交网络,团体和会议与其他数据科学家交流;

另外,不要忘记订阅KDnuggets新闻邮件,并跟随@kdnuggets了解关于分析、大数据、数据挖掘和数据科学的最新消息。

交互使用数据挖掘与数据科学——见我的分析行业概览报告,报告中有关于相关术语的演变和普及,比如统计、知识发现、数据挖掘、预测分析、数据科学以及大数据。

1 学习语言

民意调查表明,数据挖掘最流行的语言是R,Python和SQL语言。

这里有很多的资源,比如:

免费电子书资源关于R语音的数据科学

Python数据科学入门

Python数据分析:现实世界数据的灵活工具;

不可或缺的Python:数据源到数据科学

W3学校学习SQL

2 工具:数据挖掘,数据科学和可视化软件

许多的数据挖掘工具应用于不同的任务,但最好是使用支持数据分析的整个过程的数据挖掘套件。

你可以使用开源(免费)的工具,如启动KNIMERapidMinerWeka

然而,对于许多分析工作还需要知道SAS,它是全球领先的商业工具并得到广泛应用。

其他受欢迎的分析和数据挖掘软件包括MATLAB、StatSoft推出STATISTICA,Microsoft SQL Server、IBM SPSS Modeler以及Rattle。

可视化是任何数据分析的重要组成部分——学习如何使用Microsoft Excel,R graphics,以及Tableau 。其它好的可视化工具包括TIBCO Spotfire和Miner3D。

3教材

网络上有很多的数据挖掘和数据科学教材,但你可以参考以下这些:

数据挖掘与分析:基本概念与算法

数据挖掘:机器学习工具实践与方法

统计学习、数据挖掘以及预测的要素

LION书籍:学习与智能优化

大数据集挖掘

StatSoft推出的电子统计教材

4 教育:网络研讨会、课程、证书以及学位

可以通过观看一些许多免费的关于数据分析、大数据,数据挖掘和数据科学的网络研讨会和网络直播开始学习。

也有许多短期和长期的在线课程,其中许多是免费的-见KDnuggets在线教育目录

特别参考以下课程:

机器学习

从数据中学习

开放式在线学习应用数据科学

使用Weka进行数据挖掘

本文作者的数据挖掘课程

最后,考虑获得关于数据挖掘和数据科学的证书或高级学位,如MS-见KDnuggets关于分析、数据挖掘和数据科学教育的目录

5 数据

你需要数据进行分析-见KDnuggets关于数据挖掘的目录,包含:

政府、联邦、州、城市、本地和公共数据站点和门户

数据API、集线器、商场、平台、门户和搜索引擎

免费公共数据集

6 竞争

再一次强调,最好是边学边做,所以在学习的同时也可以参加Kaggle竞赛 -从初学者竞赛开始,比如使用机器学习预测泰坦尼克号生存

7 交流:会议、团体和社交网络

你可以加入许多同类团体-见关于分析、大数据,数据挖掘以及数据科学前30的 LinkedIn组织

AnalyticBridge是一个分析和数据科学活跃的社区。

你也可以参加一些关于分析、大数据、数据挖掘、数据科学与知识发现的会议和研讨会

此外,考虑加入ACM SIGKDD,它会举办一年一度的KDD大会——该领域领先的研究会议。

更多……

还可以参考其它的回答:

如何开始学习数据科学

关于数据科学的使用简介

通过Metromap课程成为一名数据科学家

获取免费数据科学教育

文章原标题《7 Steps for Learning Data Mining and Data Science》,作者:Gregory Piatetsky,译者:海棠

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

数据挖掘 数据科学 数据科学家 语音 数据资源 大数据
0
为您推荐
大数据技术改变城市的运作方式,智慧城市呼之欲出

大数据技术改变城市的运作方式,智慧城市呼

纽奥良虽像大多数城市一样有火灾侦测器安装计划,但直到最近还是要由市民主动申装。纽…...

大数据分析面临生死边缘,未来之路怎么走?

大数据分析面临生死边缘,未来之路怎么走?

大数据分析开始朝着营销落地,尤其像数果智能这类服务于企业的大数据分析供应商,不仅…...

什么是工业大数据,要通过3B和3C来理解?

什么是工业大数据,要通过3B和3C来理解?

核心提示:工业视角的转变如果说前三次工业革命分别从机械化、规模化、标准化、和自动…...

大数据普及为什么说肥了芯片厂商?

大数据普及为什么说肥了芯片厂商?

科技界默默无闻的存在,芯片行业年规模增长到了3520亿美元。半导体给无人驾驶汽车带来…...

大数据技术有哪些,为什么说云计算能力是大数据的根本!

大数据技术有哪些,为什么说云计算能力是大

历史规律告诉我们,任何一次大型技术革命,早期人们总是高估它的影响,会有一轮一轮的…...

个人征信牌照推迟落地,大数据 重新定义个人信用!!

个人征信牌照推迟落地,大数据 重新定义个

为金融学的基础正日益坚实。通过互联网大数据精准记录海量个人行为,进而形成分析结论…...