首页 首页 大数据 查看内容

趣谈大数据应用

木马童年 2020-2-12 20:05 19 0

大数据不难,难的是会用 “大数据”是当下人们最热衷讨论的“概念,很多人也确实只停留在“概念”层面上。实际上,对于大数据的应用,已经有很多先进案例可供借鉴。我们先来看一个林彪的例子。 没错,林彪。 刘湘明 ...

趣谈大数据应用

大数据不难,难的是会用

“大数据”是当下人们最热衷讨论的“概念,很多人也确实只停留在“概念”层面上。实际上,对于大数据的应用,已经有很多先进案例可供借鉴。我们先来看一个林彪的例子。

没错,林彪。

刘湘明先生在《商业价值》上介绍了1948年林彪在战场上利用大数据的故事:

话说林彪从带兵开始,身边就有个本子,每次打完仗,他就把战果记在上面,不厌其烦。不了解的人,还以为他以此为乐。

辽沈战役打响后,无论战情如何紧急,多么疲惫,林彪依然每天坚持听军情汇报,而且要求很细:俘虏要分清军官和士兵;缴获的枪支要统计出机枪、长枪、短枪;击毁的和还能使用的汽车要分出大小和类别,每份战报几乎都是千篇一律的枯燥数据。

一天深夜,值班参谋正读着一份遭遇战的战报,林彪突然叫‘停’。他问周围的人:"刚才念的那个战斗的缴获你们听到了吗?"周围的人满脸都是睡意和茫然,因为像这样的战斗每天都有几十起,只是枯燥的数字稍有不同。

林彪见无人回答,便接连提出3个问题:为什么那儿缴获的短枪与长枪的比例比其他的战斗略高?为什么那儿缴获和击毁的小车与大车的比例比其他的战场略高?为什么那儿俘获和击毙的军官与士兵的比例比一般歼敌略高?

人们还没来得及思索,林彪已指着军用地图说:“我猜想……不,我断定!敌人的野战指挥所就在这儿!”随后林彪命令全力追击从该处逃走的敌人。敌军首领廖耀湘刚刚还在庆幸自己在意外的遭遇战中幸免于难,很快就发现被漫山遍野的解放军团团围住……辽沈战役就此尘埃落地。

讲完故事后,刘湘明总结道:

第一,大数据并不神秘,古已有之;

第二,数据的收集最重要,但是一件长期且困难的事情;

第三,利用好大数据,依然需要敏锐的洞察和创新的思维。

趣谈大数据应用

你幸福吗?我信大数据

利用大数据这回事,是不怕做不到,就怕想不到,我们再来看看国外几个关于大数据的例子。

“你幸福吗?”问莫言、易中天、还是问普京?其实,不如问问网络上的“大数据”,它真有答案。

美国佛蒙特大学的数学家和MITRE公司的科学家们,从推特、《纽约时报》和谷歌趋势中,搜集上万个展示情绪的词,如“大笑”、“幸福”、“爱”和“孤独”、“糟糕”、“通货膨胀”以及咒骂,并将它们分成9个等级,建立了反映情绪高低变化的数据库,以此算出每天“幸福指数”。

通过目测可以发现,自从2008以来,全球幸福指数一直下滑(或许是因为金融危机)。而且研究发现,人们通常会感觉星期六比星期二幸福,而圣诞节是一年中最幸福的日子。波士顿爆炸案发生的4月5日,是有记录以来最难过的日子。

有趣的发现是,推特用户离家越远,他们会感到越幸福。

大数据预测大事件,比专家更靠谱

“幸福指数”是预测,微软研究院和色列理工大学的研究者着通过挖掘《纽约时报》过去22年的内容、维基百科和其他90家网站资源,来预测未来的疾病和霍乱等大事件。在这个领域,一般只能通过经常回顾来做分析。

趣谈大数据应用

相比人类倾向于轻易得到现成的知识,数据挖掘软件更具优势,因为软件可以不带偏见的在海量信息中无休止的研究,从而挖掘出一些人类也许永远不可能发现的信息。而且软件可以学习新的联想方法,因此研发人员让软件“学会”去扩展视野,或者忽略一些信息。

大数据应用比赛:IBM搞出了两条公交车线路

IBM的案例也非常有意思:他们利用手机的数据,为城市规划了两条新公交车线路。

近期,法国电信运营商Orange提供了非洲象牙海岸500万手机用户的25亿条匿名通话记录,以此举办了“数据推动发展”比赛。

IBM公司的研究人员发现,通话数据可以根据附近的天线塔来定位人们打电话时的位置,虽然没GPS那么精确,但也足够了。研究人员根据数据发现了这个城市的公交需求:新增两条、延长一条公交路线,并让人们在这个城市的出行时间减少了10%。

然而研究人员称,相对这些数据的所有潜能来说,这些应用还只是皮毛。

大数据,不乐观

回到讲林彪利用大数据的那篇文章,它的标题是《大数据,不乐观》,其结尾这样写道:

因为从文化来讲,中国历史上就不是习惯于用数字管理的国家,而美国人连飞机漆成什么颜色更容易被击落都会进行统计。这种意识上的差异,就造成了我们骨子里对于数据的重视程度远远不够,这会在数据的采集、利用和分析上,带来很多问题。

最直接的一个例子,在公开的美国政府网站Data.gov上,大约有超过40万各种原始数据文件,涵盖农业、金融、就业等近50个分类。美国官方称这么做的目的是‘方便公众更便捷地获得联邦政府数据,并通过鼓励创新突破政府的围墙而创造性地使用这些数据’。

这个差距就足够追赶了。

大数据,别作恶

要运用大数据,首先得充分占用数据。不过有些占有方式,听起来让人心里毛毛的。

曾经有人说,谁掌握了浏览器,谁就掌握了互联网,而在移动互联网时代,互联网入口变得更加多元。相应的,用户被保留下“数字足迹”的途径也更多了。

Mashable.com的文章指出,Google、Yahoo、Bing这些搜索引擎,一般会把你的搜索内容——包括那些令人尴尬的搜索内容——存储在他们的服务器上长达18个月。类似的,苹果的语音助手Siri的记忆力也很厉害:它会把你询问的问题发送到苹果的服务器,然后保存两年。

网络服务提供商(ISP)们也在记录你的“一举一动”,他们记录IP地址的时长从72小时到18个月不等。

趣谈大数据应用

最霸道的还要数手机网络运营商,无论你拨打的号码还是发送的短信,都会被他们记录,有的短信内容甚至会被保留7年之久。

最关键的是,数据如何保留,全由公司自己决定,目前还没有法律来管束。

商业巨头们用你我贡献出的大数据来获利,这无可厚非,我们所希望的只能是,掌握大数据的人,不要做恶。

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

大数据 纽约时报 数据库 预测未来 数据挖掘 海量信息
0
为您推荐
大数据技术改变城市的运作方式,智慧城市呼之欲出

大数据技术改变城市的运作方式,智慧城市呼

纽奥良虽像大多数城市一样有火灾侦测器安装计划,但直到最近还是要由市民主动申装。纽…...

大数据分析面临生死边缘,未来之路怎么走?

大数据分析面临生死边缘,未来之路怎么走?

大数据分析开始朝着营销落地,尤其像数果智能这类服务于企业的大数据分析供应商,不仅…...

什么是工业大数据,要通过3B和3C来理解?

什么是工业大数据,要通过3B和3C来理解?

核心提示:工业视角的转变如果说前三次工业革命分别从机械化、规模化、标准化、和自动…...

大数据普及为什么说肥了芯片厂商?

大数据普及为什么说肥了芯片厂商?

科技界默默无闻的存在,芯片行业年规模增长到了3520亿美元。半导体给无人驾驶汽车带来…...

大数据技术有哪些,为什么说云计算能力是大数据的根本!

大数据技术有哪些,为什么说云计算能力是大

历史规律告诉我们,任何一次大型技术革命,早期人们总是高估它的影响,会有一轮一轮的…...

个人征信牌照推迟落地,大数据 重新定义个人信用!!

个人征信牌照推迟落地,大数据 重新定义个

为金融学的基础正日益坚实。通过互联网大数据精准记录海量个人行为,进而形成分析结论…...