首页 首页 大数据 查看内容

跟小S学统计:描述统计学

木马童年 2019-9-17 20:11 101 0

今天是小S入门的第二天了,经过一天的工作洗礼后,终于屁颠屁颠的下班了,拥抱那美好的统计学梦想去了。言归正常,话说昨天介绍了统计学的入门基础和基本概念后,小S私下反馈进度太慢太慢了,我要一下子学会降龙十八 ...

今天是小S入门的第二天了,经过一天的工作洗礼后,终于屁颠屁颠的下班了,拥抱那美好的统计学梦想去了。

言归正常,话说昨天介绍了统计学的入门基础和基本概念后,小S私下反馈进度太慢太慢了,我要一下子学会降龙十八掌,作为为师,十分佩服小S的雄心,只好回了一大耳括子….咳…..咳 废话太多了,调整电影镜头中….

前边我们讲过,由于工作中统计的方便,所以数据分为:

分类型是用标记来识别项目的类型。比如彩球的颜色分类。

数量型就类似平时的表达多少或者大小的数值,比如几个红色的球几个蓝色的等。

小S平时喜欢思考,比如说在超市中购物,有时候会特别好奇在这些卖软饮料这些品牌当中,哪种是最受欢迎的呢?这个问题咱可以用”频数分布”这个角度来分析,所谓频数分布,是指一种数据的表格汇总,表示在几个互不重叠的组别中的每一组的项目个数(即频数)。比如卖软饮料的,可以采用个简单的方法,如果不怕苦的话可以采用人海战术,盯在旁边,每次客户拿什么品牌的就记录下来,样本可以采用50次,假设结果出现19个可口可乐,百事可乐18次,汇源果汁10次,康师傅3次,整理表格如下

跟小S学统计:描述统计学

此图专业好听的话叫频数分布,可以从分布上能看出每个个体的分布形状,就像生物学上经常见到的某种介绍,狮子活跃在哪里,黑卷尾生活在哪里等若干若干,有助于大体认识,比如你想捕捉黑卷尾,通过分布就能提高遇到的概率哈哈。

频数分布:能表明在几个互不重叠的组别中每一组的项目个数(即频数)。但是通过上图也看到,通过绝对数的介绍人是没有感觉的,或者数大了感觉差不离,没啥影响似的,所以要换算成比例或者百分比更有趣。接下来2个概念,

相对频数分布:各组相对频数数据的表格汇总。公式是:组的相对频数=组频数/n ?百分比频数=组的相对频数*100%

跟小S学统计:描述统计学

在生活中有时候我们得到了好几个样本数据,全是数据值的,对于这种数据型数据确定频数分布的步骤如下:

  1. 确定互不重叠的组数。(一般来讲都是采用经验的多些,比如你平时注意电话一定会发现大多5 10等多些整数类的,根据数据项来定)

  2. 确定每组的组宽,可以采用经验公式 ?近似组宽=(最大数据值-最小数据值)/组数

  3. 确定组限

累计频数:表示小于或等于每一个组上组限的数据项个数

价值总结:一个频数分布的价值就在于它提供了对数据的深刻理解,而直接观察原始的数据,是看不出什么来的,这就是价值所在。

接下来简单介绍描述统计学的其它图表法(求放过,这种的知识咱百度好么)

  1. 条形图

  2. 饼图

  3. 直方图

  4. 打点图

  5. 茎叶图

  6. 散点图:说说这个,生活中作用大的很,一般是关于2个变量之间的关系的图形表述,比如说一个男的与一个女的关系是怎样的呢,要是正常来讲,大家都会说关系挺好 关系不一般,这种都是文字上的总会有那么缺憾,如果把它量化,那就简单了,比如一天的互动次数,按时间来分解,如果很明显的直线关系,那可以判断这2人关系不一般哼哼(这里不严谨)。我们举个商业类的,比如销售额与广告的关系,这种就发挥作用了,到底有没有效果可以一定程度上来通过散点图分析。注意,这里散点图是判断的是相关关系而不是因果关系。通过一个例子来看(x轴是广告次数,Y轴是销售额(100美元)

跟小S学统计:描述统计学

像本图描述的就是正相关关系,表明了广告次数和销售额直接存在正相关关系。但是所有的点并没有在一条线上,所以这种关系是不完全的。然而,这些带你的分布模式和趋势线表明,整体关系是正相关的。

反过来:

跟小S学统计:描述统计学

像本图表明:广告次数和销售额之间存在负相关次数。较高的销售额和较高的广告次数没有产生联系,反而加速了销售额下滑,(这里不讲广告和实际产品出现某种意外,比如不匹配或者引发了质量事件等,再者实际这种情况 很少,这里只是为举例负相关),这种图就是负相关,即随的X增加,Y趋向减少。

不思不觉45分钟过去了,这节课收获满满,瞧了瞧QQ信息等,小S深深的感受到了充分利用时间不闲玩,专注学习的魅力,他相信,随的时间的演化,他会加速实现想要的生活。接下来看了看明日统计学的预告

  1. 位置的度量

  2. 变异的度量

  3. 两关系间的度量

话说讲到这里,摆擂台,抛绣球,小S累个半死,预知小S累成啥样了,静待明日分解。


在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

统计学 智能
0
为您推荐
大数据技术改变城市的运作方式,智慧城市呼之欲出

大数据技术改变城市的运作方式,智慧城市呼

纽奥良虽像大多数城市一样有火灾侦测器安装计划,但直到最近还是要由市民主动申装。纽…...

大数据分析面临生死边缘,未来之路怎么走?

大数据分析面临生死边缘,未来之路怎么走?

大数据分析开始朝着营销落地,尤其像数果智能这类服务于企业的大数据分析供应商,不仅…...

什么是工业大数据,要通过3B和3C来理解?

什么是工业大数据,要通过3B和3C来理解?

核心提示:工业视角的转变如果说前三次工业革命分别从机械化、规模化、标准化、和自动…...

大数据普及为什么说肥了芯片厂商?

大数据普及为什么说肥了芯片厂商?

科技界默默无闻的存在,芯片行业年规模增长到了3520亿美元。半导体给无人驾驶汽车带来…...

大数据技术有哪些,为什么说云计算能力是大数据的根本!

大数据技术有哪些,为什么说云计算能力是大

历史规律告诉我们,任何一次大型技术革命,早期人们总是高估它的影响,会有一轮一轮的…...

个人征信牌照推迟落地,大数据 重新定义个人信用!!

个人征信牌照推迟落地,大数据 重新定义个

为金融学的基础正日益坚实。通过互联网大数据精准记录海量个人行为,进而形成分析结论…...