首页 首页 大数据 大数据分析 查看内容

Kaggle放大招:简单几步实现海量数据分析及可视化

木马童年 2018-10-10 21:15 18 0

近期,Kaggle发布了新的数据分析及可视化工具——Kaggle Kerneler bot,用户只需上传数据集,便可用Python为用户自动获取相关的深度数据分析结果。本文将带领读者体验一下这款便捷而又高效的工具。 Kaggle Kernel ...

近期,Kaggle发布了新的数据分析及可视化工具——Kaggle Kerneler bot,用户只需上传数据集,便可用Python为用户自动获取相关的深度数据分析结果。本文将带领读者体验一下这款便捷而又高效的工具。

Kaggle Kerneler bot是一个自动生成的kernel,其中包含了演示如何读取数据以及分析工作的starter代码。用户可以进入任意一个已经发布的项目,点击顶部的“Fork Notebook”来编辑自己的副本。接下来,小编将以最热门的两个项目作为例子,带领读者了解该如何使用这款便捷的工具。

好的开始是成功的一半!

要开始这个探索性分析(exploratory analysis),首先需要导入一些库并定义使用matplotlib绘制数据的函数。但要注意的是,并不是所有的数据分析结果图像都能够呈现出来,这很大程度上取决于数据本身(Kaggle Kerneler bot只是一个工具,不可能做到Jeff Dean或者Kaggle比赛选手们那么完美的结果)。

In [1]:

在本例中,一共输入了12个数据集。

In [2]:

接下里,用户在编辑界面中会看到四个已经编好的代码块,它们定义了绘制数据的函数。而在发布后的页面,这些代码块会被隐藏,如下图所示,只需单击已发布界面中的“code”按钮就可以显示隐藏的代码。

准备就绪!读取数据!

首先,让我们先看一下输入中的第一个数据集:

In [7]:

那么数据长什么样子呢?

In [8]:

Out [8]:

数据可视化:仅需简单几行!

样本的柱状图:

In [9]:

二维和三维的PCA图:

In [10]:

同理,更换数据集文件的路径,也可以得到其它数据对应的结果。

当然,除了上述几种可视化的结果外,根据输入数据以及需求的不同,也可以得到其它数据分析可视化结果,例如:

相关矩阵:

In [11]:

散射和密度图:

In [12]:

针对数据分析、数据可视化工作,Kaggle kerneler bot应当说是相当的便捷和高效了。那么你是否也想尝试一下呢?

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

数据分析 数据集 数据可视化
0
为您推荐
Tableau:当互联网医疗遇上大数据分析

Tableau:当互联网医疗遇上大数据分析

早在18世纪,南丁格尔便开始用可视化的数据来证明英国士兵之所以在克里米亚战争中的死…...

为大家分享七款最佳免费数据分析工具,供大家免费使用

为大家分享七款最佳免费数据分析工具,供大

  对于做数据分析行业的小伙伴来说,数据分析工具是必不可少的,今天为大家分享七款…...

数据分析领域中最为人称道的七种降维方法

数据分析领域中最为人称道的七种降维方法

近来由于数据记录和属性规模的急剧增长,大数据处理平台和并行数据分析算法也随之出现…...

如何建立数据分析的思维框架?

如何建立数据分析的思维框架?

本文是如何七周成为数据分析师的第八篇教程,如果想要了解写作初衷,可以先行阅读七周…...

零售银行丨互联网时代的客户数据分析与精准营销

零售银行丨互联网时代的客户数据分析与精准

中国银行业的零售业务经过多年的发展,在银行发展战略中的重要位置已经越来越突显。然…...

爱立信数据分析解决方案抓住物联网发展机遇

爱立信数据分析解决方案抓住物联网发展机遇

爱立信在2016年国际消费电子展(CES)上发布三大物联网解决方案,其中“用户和物联网…...