首页 首页 大数据 大数据入门 查看内容

TF Learn : 基于Scikit-learn和TensorFlow的深度学习利器

木马童年 2018-10-10 21:15 39 0

了解国外数据科学市场的人都知道,2017年海外数据科学最常用的三项技术是 Spark ,Python 和 MongoDB 。说到 Python ,做大数据的人都不会对 Scikit-learn 和 Pandas 感到陌生。 Scikit-learn 是最常用的 Python 机 ...

TF Learn : 基于Scikit-learn和TensorFlow的深度学习利器了解国外数据科学市场的人都知道,2017年海外数据科学最常用的三项技术是 Spark ,Python 和 MongoDB 。说到 Python ,做大数据的人都不会对 Scikit-learn 和 Pandas 感到陌生。

Scikit-learn 是最常用的 Python 机器学习框架,在各大互联网公司做算法的工程师在实现单机版本的算法的时候或多或少都会用到 Scikit-learn 。TensorFlow 就更是大名鼎鼎,做深度学习的人都不可能不知道 TensorFlow。

下面我们先来看一段样例,这段样例是传统的机器学习算法逻辑回归的实现:

TF Learn : 基于Scikit-learn和TensorFlow的深度学习利器

可以看到,样例中仅仅使用了 3 行代码就完成了逻辑回归的主要功能。下面我们来看一下如果用 TensorFlow 来实现同样的代码,需要多少行?下面的代码来自 GitHub :

一个相对来说比较简单的机器学习算法,用 Tensorflow 来实现却花费了大量的篇幅。然而 Scikit-learn 本身没有 Tensorflow 那样丰富的深度学习的功能。有没有什么办法,能够在保证 Scikit-learn 的简单易用性的前提下,能够让 Scikit-learn 像 Tensorflow 那样支持深度学习呢?答案是有的,那就是 Scikit-Flow 开源项目。该项目后来被集成到了 Tensorflow 项目里,变成了现在的 TF Learn 模块。

我们来看一个 TF Learn 实现线性回归的样例:

我们可以看到,TF Learn 继承了 Scikit-Learn 的简洁编程风格,在处理传统的机器学习方法的时候非常的方便。下面我们看一段 TF Learn 实现 CNN (MNIST数据集)的样例:

可以看到,基于 TF Learn 的深度学习代码也是非常的简洁。

TF Learn 是 TensorFlow 的高层次类 Scikit-Learn 封装,提供了原生版 TensorFlow 和 Scikit-Learn 之外的又一种选择。对于熟悉了 Scikit-Learn 和厌倦了 TensorFlow 冗长代码的用户来说,不啻为一种福音,也值得机器学习和数据挖掘的从业者认真学习和掌握。

作者:汪昊,恒昌利通大数据部负责人/资深架构师,美国犹他大学本科/硕士,对外经贸大学在职MBA。

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

数据科学 大数据 机器学习 互联网 工程师 深度学习
0
为您推荐
大数据应用案例——狙击高科技犯罪

大数据应用案例——狙击高科技犯罪

户口、身份证管理,案件侦破、治安事故……这一系列的问题处理,护国佑民的公安部都是…...

浅析:12306与云计算的技术相容性

浅析:12306与云计算的技术相容性

尝试从技术的角度对12306做一些抽象的归纳,包括12306与云计算的技术相容性,对项目谈…...

大数据分析《猩球崛起2》网络不热影院热的原因

大数据分析《猩球崛起2》网络不热影院热的

据EBOT数据显示,9月17日,在《猩球崛起2:黎明之战》上映20天后,全国日票房以618万…...

你的QQ暴露了你的心——QQ大数据及其应用介绍PPT

你的QQ暴露了你的心——QQ大数据及其应用介

PPT概述: QQ月活跃用户数超过 8.4亿 QQ最高同时在线超过 2.0亿 QQ空间月活跃用户数超…...

大数据能为我们的物流运输车队管理做什么?

大数据能为我们的物流运输车队管理做什么?

大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软…...

台湾王永庆的大数据

台湾王永庆的大数据

说王永庆之前,先说油烟机方太和老板,以及格力和万达。 中央电视台广告,方太吹嘘说…...