首页 首页 大数据 查看内容

24个终极数据科学项目 提高数据技能 (免费访问)

木马童年 2019-10-11 16:00 83 0

介绍 数据科学项目为您在该领域开启职业生涯提供了一个有前途的方法。你不仅可以通过应用它来学习数据科学,还可以在你的简历上展示你的项目!如今,招聘人员通过应聘者的工作来评估他/她的潜力,而不太重视证书。如 ...

介绍

数据科学项目为您在该领域开启职业生涯提供了一个有前途的方法。你不仅可以通过应用它来学习数据科学,还可以在你的简历上展示你的项目!如今,招聘人员通过应聘者的工作来评估他/她的潜力,而不太重视证书。如果你没有任何东西可以展示给他们,你就告诉他们你知道多少也没有关系!这是大多数人挣扎和错过的地方。

你以前可能已经解决了几个问题,但如果你不能让它看起来像样并易于解释,别人怎么会知道你的能力呢?这些项目可以帮助你。想想你将花在这些项目上的时间,比如你的培训课程。你花越多的时间练习,你会变得越好!

24个终极数据科学项目 提高数据技能 (免费访问)

有用的信息

为了帮助你决定从哪里开始,我们将这个列表分为三个层次,即:

初级水平:这个水平由数据集组成,使用起来相当容易,不需要复杂的数据科学技术。您可以使用基本的回归或分类算法来解决它们。而且,这些数据集有足够的开放教程,可以帮助您入门。在这个列表中,我们还提供了一些教程来帮助您入门。你也可以查看AV的“数据科学入门”课程。

中级水平:这一水平包含了更具挑战性的数据集。它由中、大型数据集组成,这些数据集需要一定的模式识别技能。另外,特性工程将在这里发挥作用。ML技术的使用没有限制;天下万物都可以利用。

高级水平:这个水平是最适合的人谁了解先进的主题,如神经网络,深度学习,推荐系统等。高维数据集也在这里。同时,这也是一个富有创造力的时期。看看最好的数据科学家把创造力带到他们的工作和代码。

Beginner Level

1.Iris数据集

问题:根据可用属性预测花的类。

获取数据:https://archive.ics.uci.edu/ml/datasets/Iris

教程:http://www.slideshare.net/thoi_gian/iris-data-analysis-with-r

2. Loan Prediction Dataset

贷款的预测数据集

问题:预测贷款是否会被批准。

获取数据:https://datahack.analyticsvidhya.com/contest/practice-problem-loan-prediction-iii/

教程:https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/

3.Bigmart销售数据集

问题:预测商店的销售额。

获取数据:https://datahack.analyticsvidhya.com/contest/practice-problem-big-mart-sales-iii/

教程:https://www.analyticsvidhya.com/blog/2016/02/bigmart-sales-solution-top-20/

4. 波士顿住房数据集

预测业主自有住房的中位数。

获取数据:https://www.cs.toronto.edu/~delve/data/boston/bostonDetail.html

教程:https://www.analyticsvidhya.com/blog/2015/11/started-machine-learning-ms-excel-xl-miner/

5. 时间序列分析数据集

预测一种新的交通方式的交通流量。

获取数据:https://datahack.analyticsvidhya.com/contest/practice-problem-time-series-2/

教程:https://trainings.analyticsvidhya.com/courses/course-v1:AnalyticsVidhya+TS_101+TS_term1/about

6. 葡萄酒质量数据集

预测葡萄酒的质量。

获取数据:https://archive.ics.uci.edu/ml/datasets/Wine+Quality

教程:https://web.stanford.edu/~ilker/doc/wine_Stats315A.pdf

7.Turkiye 学生评价数据集

使用分类和聚类技术来处理数据

获取数据:https://archive.ics.uci.edu/ml/datasets/Wine+Qualityhttps://archive.ics.uci.edu/ml/datasets/Turkiye+Student+Evaluation

教程:https://sanghosuh.github.io/research/LA_EdMining_SanghoSuh.pdf

8.身高和体重数据集

预测一个人的身高或体重。

获取数据:http://wiki.stat.ucla.edu/socr/index.php/SOCR_Data_Dinov_020108_HeightsWeights

教程:https://www3.nd.edu/~steve/computing_with_data/2_Motivation/motivate_ht_wt.html

Intermediate Level

1. 黑色星期五的数据集

预测营业额

获取数据:https://datahack.analyticsvidhya.com/contest/black-friday/

教程:https://discuss.analyticsvidhya.com/t/black-friday-data-hack-reveal-your-approach/5986

2. 活动识别数据集

预测一个人的活动类别。

获取数据:http://archive.ics.uci.edu/ml/datasets/Human+Activity+Recognition+Using+Smartphones

教程:https://rstudio-pubs-static.s3.amazonaws.com/291850_859937539fb14c37b0a311db344a6016.html

3.文本挖掘数据集

根据文档的标签对文档进行分类。

获取数据:http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multilabel.html#siam-competition2007

教程:https://wtlab.um.ac.ir/images/e-library/text_mining/Survey%20of%20Text%20Mining%202%20.pdf

4. 访问历史数据集

预测用户的类别,来自美国的一个自行车共享服务。

获取数据:http://archive.ics.uci.edu/ml/machine-learning-databases/census-income-mld/

教程:https://www.analyticsvidhya.com/blog/2015/06/solution-kaggle-competition-bike-sharing-demand/

5. 歌曲数据集

预测歌曲的发行年份。

获取数据:http://archive.ics.uci.edu/ml/datasets/YearPredictionMSD

教程:http://www-personal.umich.edu/~yjli/content/projectreport.pdf

6. 人口普查和收入数据集

预测美国人口和收入。

获取数据:http://archive.ics.uci.edu/ml/machine-learning-databases/census-income-mld/

教程:https://cseweb.ucsd.edu/~jmcauley/cse190/reports/sp15/048.pdf

7. 电影镜头数据集

向用户推荐新电影。

获取数据:http://grouplens.org/datasets/movielens/1m/

教程:https://www.analyticsvidhya.com/blog/2016/06/quick-guide-build-recommendation-engine-python/

8. Twitter分类数据集

识别哪些是仇恨推文,哪些不是。

获取数据:https://datahack.analyticsvidhya.com/contest/practice-problem-twitter-sentiment-analysis/

教程:https://github.com/abdulfatir/twitter-sentiment-analysis

Advanced Level

1、图像识别数据集

从图像中识别数字。

获取数据:https://datahack.analyticsvidhya.com/contest/practice-problem-identify-the-digits/

教程:https://www.analyticsvidhya.com/blog/2016/10/an-introduction-to-implementing-neural-networks-using-tensorflow/

2. 城市合理的分类

获取数据:https://datahack.analyticsvidhya.com/contest/practice-problem-urban-sound-classification/

教程:https://www.analyticsvidhya.com/blog/2017/08/audio-voice-processing-deep-learning/

3.Vox名人数据集

从音频中分类声音的类型。

获取数据:http://www.robots.ox.ac.uk/~vgg/data/voxceleb/

教程:https://www.robots.ox.ac.uk/~vgg/publications/2017/Nagrani17/nagrani17.pdf

4. ImageNet数据集

要解决的问题取决于您下载的图像类型。

获取数据:http://image-net.org/download-imageurls

教程:http://image-net.org/download-imageurls

5. 芝加哥犯罪数据集

预测犯罪类型。

获取数据:https://data.cityofchicago.org/Public-Safety/Crimes-2001-to-present/ijzp-q8t2

教程:http://nathanwayneholt.com/mathematicalmodeling/ChicagoCrimesReport.pdf

6. 印度演员年龄数据集

检测演员的年龄。

获取数据:http://image-net.org/download-imageurls

教程:http://image-net.org/download-imageurls

7. 推荐引擎的数据集

根据用户的当前状态预测解决问题所需的时间。

获取数据:https://data.cityofchicago.org/Public-Safety/Crimes-2001-to-present/ijzp-q8t2

教程:http://nathanwayneholt.com/mathematicalmodeling/ChicagoCrimesReport.pdf

8. VisualQA数据集

使用深度学习技术来回答关于图像的开放式问题。

获取数据:http://www.visualqa.org/

教程:https://www.analyticsvidhya.com/blog/2017/06/hands-on-with-deep-learning-solution-for-age-detection-practice-problem/

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

数据科学 数据集 模式识别 深度学习 数据科学家 文本挖掘
0
为您推荐
大数据技术改变城市的运作方式,智慧城市呼之欲出

大数据技术改变城市的运作方式,智慧城市呼

纽奥良虽像大多数城市一样有火灾侦测器安装计划,但直到最近还是要由市民主动申装。纽…...

大数据分析面临生死边缘,未来之路怎么走?

大数据分析面临生死边缘,未来之路怎么走?

大数据分析开始朝着营销落地,尤其像数果智能这类服务于企业的大数据分析供应商,不仅…...

什么是工业大数据,要通过3B和3C来理解?

什么是工业大数据,要通过3B和3C来理解?

核心提示:工业视角的转变如果说前三次工业革命分别从机械化、规模化、标准化、和自动…...

大数据普及为什么说肥了芯片厂商?

大数据普及为什么说肥了芯片厂商?

科技界默默无闻的存在,芯片行业年规模增长到了3520亿美元。半导体给无人驾驶汽车带来…...

大数据技术有哪些,为什么说云计算能力是大数据的根本!

大数据技术有哪些,为什么说云计算能力是大

历史规律告诉我们,任何一次大型技术革命,早期人们总是高估它的影响,会有一轮一轮的…...

个人征信牌照推迟落地,大数据 重新定义个人信用!!

个人征信牌照推迟落地,大数据 重新定义个

为金融学的基础正日益坚实。通过互联网大数据精准记录海量个人行为,进而形成分析结论…...