数智资源网
首页 首页 大数据 查看内容

公司如何组建数据部门?三种数据部门架构优与劣

木马童年 2021-5-10 13:30 137 0

问题:为什么传统的没有达到今天互联网数据应用的高度呢? 在之前的传统BI可能因为这些因素,所以没有达到今天的数据在高度,可能是互联网本身发展的因素,数据对于互联网企业价值。但其中有一个很大的因素,可能是传 ...

公司如何组建数据部门?三种数据部门架构优与劣

问题:为什么传统的没有达到今天互联网数据应用的高度呢?

在之前的传统BI可能因为这些因素,所以没有达到今天的数据在高度,可能是互联网本身发展的因素,数据对于互联网企业价值。但其中有一个很大的因素,可能是传统的BI,更多是偏重数据仓库的架构,根据需求来帮报表。在数据部门没有一批主动去思考业务,思考业务与数据关系的人。这种人很可能都是在业务方,他们更多把业务问题转为要看的报表,然后与数据部门沟通报表开发,数据部门收集需求沟通后,进行排期,进入比较慢长的等待期。

公司如何组建数据部门?三种数据部门架构优与劣

在一个企业中,可能数据部门在一个公司中组织架构中的位置,决定了部门的定位和一些做的事情,所以个人认为数据部门所处的组织架构对数据价值实现是一个很重要因素。这也是今天我也来谈一谈的主题。

我先把数据部门分成二个部门:一个我们就叫前端,例如:数据分析,数据挖掘,数据产品等;一个我们叫后端:数据仓库,大数据平台等;

公司如何组建数据部门?三种数据部门架构优与劣

第一种形式,分散式

数据平台由技术部建设,技术没有数据分析/业务分析人员;这部分人员都分到各个业务块中。

技术部负责搭建大数据平台(在传统主要叫数据仓库)

目前大数据平台,如果比较大型的公司基本上会包括几块内容:

1、分布式:hadoop 平台;

2、实时计算: storm平台

3、内存计算:Spark 平台

4、传统关系数据库

业务分析人员怎么得到数据:

方式一:向数据平台接口人提需求,在传统的BI部门中一定会有一种叫:需求分析/数据PD这种角度;这种角度就是把业务方的进行转化,转为PRD文档,让ETL开发工程师,报表开发工程师实现 。【业务人员是没有访问数据仓库的权限的】

方式二:当一些业务方比较强势,或者对响应速度比较有意见的时候,可能会开放所有或者部分给业务人员进行去访问,业务可以自己去写SQL去取数据。

这种在一些业务变化不快,或者业务相对不那么复杂的公司可能比较好。但是如果是一些业务复杂,业务变化非常快的可能就不适合。为什么?

1、数据平台/仓库建议跟不上业务变化。造成数据仓库效率低,数据口径混乱。因为数据仓库架构离业务比较远,对业务理解不深。

2、业务数据分析师很多人的知识不能很有效沉淀下来。

这会导致业务要求为各个业务建议自己 “数据集市”,当这种数据集市我的时候,又会造成数据仓库负担中,各个业务方的数据“各大自为政”。

最终公司数据混乱,后面大家对数据都摇头。

公司如何组建数据部门?三种数据部门架构优与劣

第二种形式,集权式

就是公司所有的数据相关都归到一个部门中。业务方任何有需要都会向数据部门提出,数据部门会在内部对这些需求和报表进行沟通,避免重复开发,也便于对需求进行总结。

这种架构的好处是,所有的数据都是一个部门出,相对来说数据的口径会比较统一;

这个架构的坏处,如果部门组织的不好。会造成数据部门离业务比较远 ;有时候对于数据的思考不够深入,造成与业务部门的沟通成本上升。

同时会存在技术部的对于数据最底层平台建设的分工,造成与技术部存在一定沟通成本。

公司如何组建数据部门?三种数据部门架构优与劣

第三种:混合式

大数据平台建设由技术负责,他们核心是把数据平台建设的足够强大。

有一个比较大的数据部门,负责数据分析,挖掘,数据统一工作。一般来说这个部门会直接像管理层汇报,主要服务公司管理层;同时也会和业务方的数据分析师合作一起解决某个具体问题。

在业务方也会有自己的小数据分析团队。这个数据团队主要服务由自己这个业务团队,同时也会和公司的数据部门有沟通和合作。【有的公司会向业务团队开放数据访问权限,有的可能还是需要他们通过前端的报表获取数据】

在这种情况下,可能存在主要问题是会”抢”活干。

每个方式都有各自的优点与缺点,没有对与错之分;还是要结合公司具体的业务情况,公司规模等来决定,如果一个公司的数据部门从小公司发展到大公司过程中组织架构都没有什么变化,可能这不是一个适合有想法的数据人去的公司。哈哈

公司如何组建数据部门?三种数据部门架构优与劣

我个人观点是:小公司适合分散式;公司发展中间阶段:合适集权式;公司大的时候合适:混合式;

互联网 数据应用 传统BI 数据仓库 数据关系 数据价值
0
为您推荐
HIVE数据仓库完美实战课程,资源教程下载

HIVE数据仓库完美实战课程,资源教程下载

课程名称【快速掌握HIVE视频教程】HIVE数据仓库完美实战课程课程目录├第一周:hive基…...

尚硅谷大数据Flink技术与实战,资源教程下载

尚硅谷大数据Flink技术与实战,资源教程下载

课程名称尚硅谷大数据Flink技术与实战课程目录理论_Flink基础 001__Flink理论_Flink…...

小码哥李明杰Java版《恋上数据结构与算法》 ,资源教程下载

小码哥李明杰Java版《恋上数据结构与算法》 ,资源教

课程目录01-学前须知01-为什么要学习数据结构与算法02-编程语言的选择03-课程大纲04-…...

廖雪峰-2019大数据分析精品资料价值1980元,资源教程下载

廖雪峰-2019大数据分析精品资料价值1980元,资源教程

课程介绍:廖雪峰大神历时3个月打磨出来的《数据分析必备技能》的视频学习资料,由浅…...

尚硅谷-大数据项目之电商数仓教程下载

尚硅谷-大数据项目之电商数仓教程下载

课程介绍:本课程以国内电商巨头实际业务应用场景为依托,对电商数仓的常见实战指标以…...

阿里云大数据分析师ACP认证视频教程下载

阿里云大数据分析师ACP认证视频教程下载

课程介绍阿里云大数据行业认证-大数据分析师认证(ACP-Alibaba Cloud Certified Prof…...

恋上数据结构与算法(第二季),视频教程下载

恋上数据结构与算法(第二季),视频教程下载

课程介绍:课程由MJ老师和名企算法大咖共同研发,在保证易懂的同时确保课程的系统全面…...

社交网络分析与挖掘,视频教程下载

社交网络分析与挖掘,视频教程下载

课程介绍:社交网络和数据挖掘是计算机学科相关研究中的热点,其具体研究涵盖理论、关…...

数智资源网