首页 首页 大数据 查看内容

最佳解决方案:大型数据仓库的成本和效率

木马童年 2019-5-16 22:11 3 0

大多数人都知道,在IT词汇中,更大意味着更昂贵。随着系统的增大,成本也会显着提高。这可能会使组织不愿意创建大型系统。虽然这种看法有一定的道理,但是在计算系统的总成本时,还需要考虑一些抵消因素。 建立一个 ...

大多数人都知道,在IT词汇中,更大意味着更昂贵。随着系统的增大,成本也会显着提高。这可能会使组织不愿意创建大型系统。虽然这种看法有一定的道理,但是在计算系统的总成本时,还需要考虑一些抵消因素。

建立一个单一内聚平台

许多大型组织会创建多个(通常是相互矛盾的)。他们经常采用不同的平台,使用不同的软件。这对于整个的造价会产生重大影响。

我曾经接触过许多企业,他们部署了多个小型独立的数据集市,而不采用一个大型中央数据仓库。这些数据集市通常包含与其他数据集市相重复的数据。一个数据集市一般不会将另一个数据集市作为数据源。这样就会消耗额外的磁盘存储,增加重复数据迁移所需要的网络带宽,也会因从多个数据存储获取相同数据的需要而额外增加ETL处理的负荷。

如果公司拥有多个数据集市,那么他们通常会将它们部署在不同的平台上,针对不同的硬件平台采用不同的维护方法。需要维护不同品牌和模型的服务器数量越多,成本就越高。如果是关键任务服务器,那么提供冗余性的重复硬件会加剧问题。不同的硬件通常需要运行不同的操作系统(OS)和不同的数据库管理系统。这样一来,购买的授权数量减少,平均授权费用增多。

虽然单个大型数据仓库系统的初始成本高于一般数据集市,但是对于长期运营而言,更加划算。单个系统可以根据当前需求调整规模,在有需要时增加容量。

运营效率

如果在多个服务器上运行多个数据库系统,那么有一些运营成本需要考虑:

培训多个系统的人员

监控多个系统

修复多个平台的故障

修补和更新多个系统

在统一的操作系统和硬件平台上运行一个系统会更简单一些,成本也更低。另外,监控和故障修复也更加简单。

在一些情况中,数据规模直接决定了系统规模。大容量数据需要组织起来,进行处理,才会产生价值。另外一些情况可以有多种选择。比如,可以选择使用多个数据集市或小型分段的。如果将整个企业的信息整合为一个统一且安全的整体,那么许多企业都将获益更多。

如果创建、运行和管理大型的花费可得到缩减,那么一般来讲,企业内外数据的存储和分析也就获得了最佳解决方案。

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

数据集市 数据仓库 数据源 数据迁移 数据存储 操作系统
0
为您推荐
大数据技术改变城市的运作方式,智慧城市呼之欲出

大数据技术改变城市的运作方式,智慧城市呼

纽奥良虽像大多数城市一样有火灾侦测器安装计划,但直到最近还是要由市民主动申装。纽…...

大数据分析面临生死边缘,未来之路怎么走?

大数据分析面临生死边缘,未来之路怎么走?

大数据分析开始朝着营销落地,尤其像数果智能这类服务于企业的大数据分析供应商,不仅…...

什么是工业大数据,要通过3B和3C来理解?

什么是工业大数据,要通过3B和3C来理解?

核心提示:工业视角的转变如果说前三次工业革命分别从机械化、规模化、标准化、和自动…...

大数据普及为什么说肥了芯片厂商?

大数据普及为什么说肥了芯片厂商?

科技界默默无闻的存在,芯片行业年规模增长到了3520亿美元。半导体给无人驾驶汽车带来…...

大数据技术有哪些,为什么说云计算能力是大数据的根本!

大数据技术有哪些,为什么说云计算能力是大

历史规律告诉我们,任何一次大型技术革命,早期人们总是高估它的影响,会有一轮一轮的…...

个人征信牌照推迟落地,大数据 重新定义个人信用!!

个人征信牌照推迟落地,大数据 重新定义个

为金融学的基础正日益坚实。通过互联网大数据精准记录海量个人行为,进而形成分析结论…...