数智资源网
首页 首页 大数据 查看内容

大数据之于政治,水与舟?

木马童年 2019-4-13 21:30 148 0

美国总统利用大数据来帮助竞选早就不是什么新鲜事,奥巴马2012年就利用说服模型会开启政治竞选中的全新篇章。 (上接B02版) 但大部分人所不知道的是,总统竞选活动要把针对范围进一步缩小,美国总统竞选确实是把微 ...

大数据之于政治,水与舟?

美国总统利用大数据来帮助竞选早就不是什么新鲜事,奥巴马2012年就利用说服模型会开启政治竞选中的全新篇章。

(上接B02版)

但大部分人所不知道的是,总统竞选活动要把针对范围进一步缩小,美国总统竞选确实是把微观定位提到了全新的高度。奥巴马的竞选团队押对了宝,他们通过上提模型设计了数百万份针对个体选民的竞选决策,由此也打破了竞选周期的常规,收到了十分积极的说服效果。

但2012年的风潮还不止于此。现在,人们的关注点已经超越了竞选活动定位,而是开始关注竞选背后的数理分析。

普通预测是等到美国各州结果出来之后进行总结判断,但预测分析却可提供旨在指导行动的知识:对每个选民进行预测。

说服建模的成功运用

总统选举的标准一定要超过那些普通的商业营销。在这种精益求精的无情竞争中,可支配的资源显得尤为宝贵。

“我们的建模团队对每个政治意向不明确的州都建立了说服模型,”2012年美国总统选举中奥巴马阵营的首席数据科学家拉伊德·加尼表示,“然后再用模型去预测,在这些州里,数百万摇摆选民中每个选民的具体情况如何。模型会告诉我们,我们能为奥巴马赢得哪些选民,以及我们应该避免接触哪些选民。”

对模型所预测的每个可说服的选民,竞选团队都配备了大量的资源,志愿者会站在街上宣传鼓劲,也会拨打电话到家里,劝说他们为奥巴马投票。当志愿者开始家访时,他们并不是挨家挨户敲门,而是针对那些被预测系统定位为可影响的选民敲门。类似地,传单也主要用来针对那些可说服的选民。

说服建模取得了效果。相比其他传统竞选定位方法,这种方式让更多的选民选择了奥巴马。而且,说服模型也引导了奥巴马竞选团队的广告投放。电视节目的广告时段会按收视人群的多寡和分布来售卖广告位。奥巴马竞选团队会用说服模型来梳理这些收视人群数据,然后确定在哪里投放广告。

这是先进技术,也是分析学的前沿应用,但这并不神秘,说服模型会开启政治竞选中的全新篇章,即便脸书被曝光了,特朗普寻求连任的路上,也离不开大数据的应用。

贩卖个人信息

地下数据黑产业链十分活跃

多年来,以贩卖个人信息为主的地下数据黑产业链十分活跃,这在一定程度上制约了合法大数据交易产业的发展。

据了解,正规交易的数据需要经过采集、清洗、脱敏、脱密、融合等流程,保障了数据的合法性、真实性和安全性,成本也相应提高。但黑市交易的大部分数据多由内鬼或黑客窃取得来,几乎是无本万利。比如,正规渠道的人脸识别数据价格为每条0.1元,而黑市上只需花1分钱就能获取同样的数据。

几年前,全球最大的电子邮件营销公司艾司隆(Epsilon)发生了史上最严重的黑客入侵事件,主要的企业客户名单以及电子邮件地址因此外泄,受害企业包括摩根大通、第一资本集团、万豪酒店、美国银行、花旗银行及电视购物网络等。而就在不到一个月时间的同年4月底,索尼公司遭到黑客攻击,泄露了一亿份账户资料,其Play Station网络和Qriocity流媒体服务不得不关闭将近一个月。索尼公司因此花费了约1.71亿美元来弥补这个损失。

业内专家表示,随着云计算物联网和移动互联网等新一代信息技术的飞速发展,大数据应用规模日趋扩大,在数据采集、存储、开放共享等方面均存在安全隐患。由于数据隐私管理法规不健全,数据产权立法滞后,缺乏推动各个部门数据交换和共享的制度、规范和标准,公民隐私得不到合法保护,与此同时,社交网站的隐私数据也可能被不法商家利用,这些都给数据安全带来了巨大的挑战。

关于隐私保护

欧盟推《通用数据保护条例》

如今,在互联网时代各类媒体掌握着大量用户数据,数据采集分析技术也日新月异。在日常生活中,搜索诸如疾病或者地点类词条后,网站就跳出相关产品和服务广告已不是新鲜事;打开打车或者运动手机软件,生活轨迹一目了然;在社交媒体上订阅新闻推送,为某个群体和活动点赞,可能已经暴露了你的兴趣爱好乃至价值取向……

而大部分人对自己什么时候被采集了哪些信息、信息会被如何利用、能否选择性删除数据、软件公司通过何种方式保障隐私安全等问题,都一头雾水。

需要法律规范

没有健全的法律规范,仅靠企业自律来保护用户个人隐私,可能引发民众对大数据技术的恐惧。对此,欧洲正以立法等形式清理个人“数字足迹”、保障信息安全,让网络使用者拥有“被遗忘权”。

英国政府在2017年8月宣布将修改相关法律条文,让个人对自己的数据拥有更大掌控权,比如可要求脸书等社交媒体平台删除一些自己以前发布的个人信息,且机构收集个人数据的过程也会被更严格地监管。

拥有“被遗忘权”

被看作数据保护里程碑式法律的欧盟《通用数据保护条例》也将于今年5月25日正式生效。此外,欧盟还在致力于建立一套适用于全欧盟范围的、有关网络安全“产品、服务和程序”的统一安全认证体系。

《通用数据保护条例》第17条“被遗忘权”特别指出,当个人数据与收集处理的目的无关、数据主体不希望其数据被处理或数据控制者已没有正当理由保存该数据时,数据主体可随时要求收集其数据的企业或个人删除其个人数据。

如何更好地保障数据隐私,各国仍在摸索中。不少人认为,此次脸书数据泄露事件可能会促使美国通过立法手段,加强对网络社交媒体和数据安全的监管。一些专家提出,要切实保护用户数据隐私,严格的立法与执法必不可少。例如,欧盟《通用数据保护条例》中,违规企业面临高达全球营业额2%至4%的罚款,强有力的处罚可直接促使企业加强自我规范。

大数据 预测分析 数据科学家 产业链 安全性 人脸识别
0
为您推荐
HIVE数据仓库完美实战课程,资源教程下载

HIVE数据仓库完美实战课程,资源教程下载

课程名称【快速掌握HIVE视频教程】HIVE数据仓库完美实战课程课程目录├第一周:hive基…...

尚硅谷大数据Flink技术与实战,资源教程下载

尚硅谷大数据Flink技术与实战,资源教程下载

课程名称尚硅谷大数据Flink技术与实战课程目录理论_Flink基础 001__Flink理论_Flink…...

廖雪峰-2019大数据分析精品资料价值1980元,资源教程下载

廖雪峰-2019大数据分析精品资料价值1980元,资源教程

课程介绍:廖雪峰大神历时3个月打磨出来的《数据分析必备技能》的视频学习资料,由浅…...

尚硅谷-大数据项目之电商数仓教程下载

尚硅谷-大数据项目之电商数仓教程下载

课程介绍:本课程以国内电商巨头实际业务应用场景为依托,对电商数仓的常见实战指标以…...