数智资源网
首页 首页 大数据 查看内容

Oracle vs Snowflake

木马童年 2020-10-23 09:02 102 0

Snowflake 在2018年成为福布斯的云服务100 排行榜,成为全领域发展最快的云解决方案之一。Snowflake是“作为软件即服务(SaaS)提供的数据分析仓库。”让Snowflake爆炸性增长的一些功能是并发性无限,快速且具弹性, ...

Snowflake 在2018年成为福布斯的云服务100 排行榜,成为全领域发展最快的云解决方案之一。Snowflake是“作为软件即服务(SaaS)提供的数据分析仓库。”让Snowflake爆炸性增长的一些功能是并发性无限,快速且具弹性,高可用性和非常全面的安全性。

Oracle vs Snowflake

为什么我30年后放弃了Oracle 

1987年,我第一次开始用Oracle,在当时Oracle 的版本 5上工作。当时在PL / SQL和行级锁定还没有,云甚至互联网也还没有发明。

那时候,Oracle 确实是一个了不起的产品。它的竞争对手是 IBM大型机上的层次和网状数据库或顺序索引(ISAM)文件  。在DEC VAX上使用Oracle就像从T-Ford车型到保时捷911一样,成本降低了一半。

快进30年,Oracle几乎一进占据数据库排名表的头把交椅 。但现在的排行榜数据显示,Oracle仅比MySQL数据库高出5%,而MongoDB和PostgreSQL在过去一年中增长了60%以上。

Oracle vs Snowflake

图1 数据库排行榜

究其原因,一是因为激进的销售策略,  或者是自私和傲慢的态度 ,Oracle在把客户总是被放在最后。

Hadoop和包括MySQL和PostgreSQL在内的开源数据库,做为替代品大量增长已经进入Oracle的市场,包括MongoDB,Elasticsearch和Redis在内的NoSQL的小众数据库替代品的出现,伴随着企业处理网络规模数据量而变得越来越受欢迎,这些产品能够提供需要毫秒级的性能。

所以,正如我们之前所说的,Oracle不再是一个抢手的工具。在2019年,它没有成为更受欢迎的十大数据库系统。请看下图所示:

Oracle vs Snowflake

像Oracle这样的企业级产品并不仅仅为了时尚。他们要么不创新,要么喜欢恐龙,因为他们拒绝接受改变,更不用说适应快速变化的世界了。而世界已经被云已经占据了IT领域的主导地位。

一切都是谁搞错了?

早在2005年,  图灵奖获得者、麻省理工学院的Michael Stonebraker教授就在他的开创性论文“One Size Fits All”中预测Oracle,微软和IBM的主导地位会渐趋消亡。这个想法已经到来甚至已经成了过去时。在这篇论文中,他准确地预测数据库市场将会崩溃,并且随着面向列的数据库解决方案的出现,数据仓库市场将由新的参与者主导。

三年后,他透过媒体发布了  OLTP,它展示了H-Store数据库,这是一个带有纯OLTP焦点的剥离式开源数据库。这是一项惊人的成就,因为TCP-C世界纪录是每CPU核心每秒大约1,000笔交易,但他在英特尔2.8GHz桌面上管理超过35,000。

总的来说,数据库原型每秒交付令人难以置信的70,000笔交易,他创建了一个非常成功的商业企业  VoltDB,其最近的基准测试显示了 一位数毫秒的延迟,同时保持了可序列化的隔离级别和完全的事务一致性,这在Oracle根本不可能。

“大多数DBMS的架构基本上与System R的架构相同”。 - Michael Stonebraker博士。麻省理工学院。

麻省理工学院团队能够取得如此惊人结论的根本原因如下图所示,该团队强调了Oracle体系结构基于20世纪70年代为“System R”数据库构思的设计。

Oracle vs Snowflake

总而言之,该团队发现每个商业数据库产品(包括Oracle,SQL Server和DB2)在任务的开销上花费了大约93%的时间,只有7%的时间去做有用的工作,数据库大部分时间都在协调内存缓冲区缓存,写入日志文件以及内存中的锁存和锁定。

实际上,这个架构在一个时间内和内存交互达到十几万次,直到今,这个架构仍然是历史上最昂贵的资源消耗大户,需要精心的管理才能不出错。

随着Oracle内存数据库的发布,证明性能提高了  27倍,但这仍然是问题的难点,人们需要付出CPU的大量许可成本,无法为客户部署它。

替代数据仓库?

首先,任何现代的数据仓库都需要基于云,这样达到高敏捷性,可扩展性,弹性和端到端安全性的等优势。

Snowflake  是专门为云设计的数据仓库。那么它与Oracle内部部署相比如何?

Oracle 与 Snowflake的主要差异如下表:

Oracle vs Snowflake

技术差异:

Oracle vs Snowflake

总体差异

在讨论Snowflake和Oracle之间的差异时,我们并不能总要批评Oracle,让我们总结一下Snowflake 不需要的东西如下  :

安装: 无需安装硬件,也无需部署操作系统或数据库软件。没有要应用的补丁或要安排的数据库升级。实际上,切换到Snowflake可能是开发者需要做的最后一次升级,并且可以在零停机时间内运行。

被锁定:  Snowflake目前在亚马逊AWS和Microsoft Azure平台上运行,最近在Google云平台上发布。  

数据库管理: 没有需要管理的索引,不需要物理数据分区,没有统计信息可以捕获或者如果没有正确捕获,则会担心查询性能悬崖边缘。实际上,Snowflake表现出接近于零的  数据库管理 工作。

拔河比赛:  Snowflake已经废除了用工作负载隔离的机器资源的 拉锯战。可以部署无限数量完全独立的虚拟仓库,而不是单个大型多核数据库服务器 。

这代表可以在一个仓库中加载数TB的数据,同时将数据转换为另一个仓库,并在另一个仓库中分析结果。

磁盘升级: 永远不会再耗尽磁盘空间。Snowflake在Amazon AWS,Microsoft Azure和Google Cloud Platform上支持无限数据容量。在Snowflake上,一些客户在一张数据表上就可以容纳多达一PB的容量。

数据压缩: 无需支付OLTP的许可证成本,也无需使用Oracle上的insert append,小心地加载数据以较大化数据压缩。使用Snowflake,你的所有数据都会使用柱状压缩自动压缩,通常压缩比为普通数据库的3到6倍。

迁移到更大的服务器: 如下图所示,Snowflake可逐步扩展,具有一组简单的T-Shirt大小,可在几毫秒内从超小型服务器增加到4X大型服务器。该图表演示了随着服务器大小的增加,256Gb表连接已用时间的减少。  

Oracle vs Snowflake

部署实现高可用性: 无需部署昂贵的热备用数据中心,通过数据复制和故障转移实现高可用性。Snowflake透明地将数据写入区域内的三个可用区域,并且可以在丢失任何两个区域时自动生存。实际上,Snowflake最近又宣布推出跨区域和跨云复制以及自动故障转移的功能,这意味着美国西海岸的客户将能够为东海岸提供自动故障转移,甚至可以从Amazon AWS到Microsoft Azure或Google Cloud进行故障转移。

花费数小时生成备份:Snowflake提供长达90天的时间旅行, 包括在几秒钟内撤销表、架构甚至整个数据库的能力。这意味着你可以在查询90天前的数据,并且使用零拷贝克隆,在5秒内对数TB的数据进行事务一致性备份,同样快速进行恢复。

不必担心安全问题:  Snowflake包括端到端加密,自动密钥轮换,多重身份验证,甚至可选择带有虚拟私人Snow选项的专用云硬件。

云计算的影响

“什么云计算?......我不知道每个人都在谈论什么。”  ——拉里.埃里森(Oracle CEO)

当然,尽管拉里·埃里森在2008年宣称云计算是“ 完全的胡言乱语”,  但现在看来Oracle已经完全接受了云计算和它的未来。根据  RightScale调查,云服务是目前的增长率较高,高达每年50%。

Oracle vs Snowflake

如上图所示,Oracle在云计算方面落伍了。该图引自企业对受访者的云计划的调查,其中83-86%使用或计划使用AWS或Microsoft Azure,而Oracle排名第五,仅为37%的份额。

结论

总而言之,在世界各个地方包括中国,都在期待Hadoop解决“大数据”的挑战时 ,Snowflake悄然重新定义更多的可能性。

Snowflake解决方案可以在几分钟内完成更多任务,运行一小时的超小型服务器的成本低于一杯咖啡。作为一个平台,它具有非常灵活的扩展性能,能够执行大量TB级查询,将需要的时间从5.5小时减少到仅仅两分钟。正如英国的食品配送服务公司  Deliveroo所发现的那样,它的自动扩展功能能应对大量并发用户,然后在不需要时静默缩减。

与Oracle不同,Snowflake的管理非常简单,无需捕获统计信息,无需管理索引,数据分区,压缩和加密,这些都是自动并对用户完全透明的。

如果想亲自尝试Snowflake,可以免费试用,没有特殊配置的硬件或要安装的软件,它的在线文档同样易用,并提供有大量的入门视频。


云服务 解决方案 数据分析 安全性 互联网 数据库
0
为您推荐
HIVE数据仓库完美实战课程,资源教程下载

HIVE数据仓库完美实战课程,资源教程下载

课程名称【快速掌握HIVE视频教程】HIVE数据仓库完美实战课程课程目录├第一周:hive基…...

尚硅谷大数据Flink技术与实战,资源教程下载

尚硅谷大数据Flink技术与实战,资源教程下载

课程名称尚硅谷大数据Flink技术与实战课程目录理论_Flink基础 001__Flink理论_Flink…...

廖雪峰-2019大数据分析精品资料价值1980元,资源教程下载

廖雪峰-2019大数据分析精品资料价值1980元,资源教程

课程介绍:廖雪峰大神历时3个月打磨出来的《数据分析必备技能》的视频学习资料,由浅…...

尚硅谷-大数据项目之电商数仓教程下载

尚硅谷-大数据项目之电商数仓教程下载

课程介绍:本课程以国内电商巨头实际业务应用场景为依托,对电商数仓的常见实战指标以…...

小码哥李明杰Java版《恋上数据结构与算法》 ,资源教程下载

小码哥李明杰Java版《恋上数据结构与算法》 ,资源教

课程目录01-学前须知01-为什么要学习数据结构与算法02-编程语言的选择03-课程大纲04-…...

阿里云大数据分析师ACP认证视频教程下载

阿里云大数据分析师ACP认证视频教程下载

课程介绍阿里云大数据行业认证-大数据分析师认证(ACP-Alibaba Cloud Certified Prof…...

恋上数据结构与算法(第二季),视频教程下载

恋上数据结构与算法(第二季),视频教程下载

课程介绍:课程由MJ老师和名企算法大咖共同研发,在保证易懂的同时确保课程的系统全面…...

社交网络分析与挖掘,视频教程下载

社交网络分析与挖掘,视频教程下载

课程介绍:社交网络和数据挖掘是计算机学科相关研究中的热点,其具体研究涵盖理论、关…...