坑爹的平均数--学习管理统计的一点收获
2015级张雷生
犹记得结课之后,柏满迎老师对我们说了一句语重心长的话:“我知道统计学起来很吃力,但等你们学完了,你就会发现它真的很有用。”我想对老师说:我们已经发现了。它不但很有用,而且很有趣。这确实是我学完这门课的真实感悟。作为柏老师的课代表,我斗胆撷取统计学里的一个最基础的知识点,通过自编的一个小故事,以通俗化的形式呈现其本质,既以此来表示自己在学习上的一点收获,同时也表示对柏老师把我们带到这门实用性与趣味性完美结合的课程里来的感谢。
我们学的统计,分为两大部分:描述统计和推断统计。前者比例小,后者比例大。前者容易,后者难。前者稍微具备数学基础的人都能学,学完了以后,做出来的统计结果,稍微有点文化的人都能看明白。后者对学的人有要求,对看的人也有要求。数学基础差的,不容易学,文化低的,不容易看。如果说前者是下里巴人,那后者无疑是阳春白雪。
描述统计和推断统计的最本质的区别,就在于它们是分析已知的数据还是未知的数据。何为已知?就是已经得到的、实实在在摆在那里的数据。那为什么要分析呢?因为数据虽然已经有了,但杂乱无章,直接拿给别人看,别人会觉得很费劲。于是需要你去描述它们,描述得清楚些、明白些,让别人看了一目了然,这就叫描述统计。你可以有很多种方法来做这件事,这就是我们学的描述统计的各种方法。比如,最最简单也是最最常见的方法,就是平均数。
为什么要用平均数呢?打个比方,你向老板汇报去年的销售数字,你手上一共有去年12月的数字,那你是不是可以把这12个数字都念一遍给老板听呢?当然可以啦,假如你希望被老板赶出来的话。为什么被赶出来?因为老板需要的是一目了然的汇报,而你没做到。怎么做到?很简单,你只需要告诉他3个数:去年一年的总销量,去年每个月的平均销量,以及和前年相比的增长幅度。这就叫一目了然。平均数的作用,就是隐去了12个数字,而代之以一个新的数字,或者说,用1个数来代表或者叫概括12个数。
但平均数有没有缺陷呢?当然有。下面这个故事就叫“坑爹的平均数”。
有两个老板,各开了一家商城,同一天剪彩。为了博眼球,两个老板都想找5个美女来做模特。他们叫自己的儿子找模特公司签合同雇人。老板甲的儿子比较靠谱,在合同里写清楚了,5个女模身高都要求1.75米,最后人家忠实履行合同,人找来了,完全符合要求。但老板乙那出问题了。他儿子签的合同写的是5个女模平均身高都要求1.75米。结果人家给找了5个女孩,但老板一看,鼻子差点气歪了。因为这5个人身高分别是155、160、180、185、195厘米,站在一块,高的太高,矮的太矮,实在是不忍直视。老板一生气,拒付费用。可模特公司说了:你儿子跟我们签的合同上只说平均身高是175厘米,我找的这5个人平均身高就是1.75米,完全符合你的要求,该付的钱一分都不能少!老板没辙,含着泪把钱付了。平均数坑爹啊!
有人说那我如果把所有数字都念给老板听不就可以避免这个问题了吗?可以是可以。但问题是你念5个数可以,要是500、5000、50000个数怎么念?不还是得用平均数?可平均数又有问题。那问题到底在哪呢?就在于总体的数据很可能是参差不齐的。也就是说,当你用平均数描述了一组数据,还不够,因为平均数不能反映出所有数据是否参差不齐,以及参差不齐的程度有多大。我们用专业的术语把这种参差不齐叫做数据的变异程度,或者离散程度。除了平均数,我们还需要把离散程度描述出来。我们用来描述离散程度的数有两个,分别叫方差和标准差。
方差,就是把每个数都和平均数做个减法,得到的结果,代表每个数和平均数的距离。假设全部数字一共有500个,那我们就可以得到500个距离。我们当然不能把这500个距离又罗列一遍。我们需要把这500个距离分别平方,加起来,再算一个平均数出来。这个数就叫方差,我们就用它来描述那500个数的离散程度。于是,假设有两组数,每一组都包含了500个数,平均数都一样,我们就可以看方差一样不一样。方差大的那组数,说明它的离散程度大。方差小的,离散程度小。比如前面那两组女模,平均数一样,但甲组方差为0,乙组方差是230,如果不让你看到真人,光凭方差,你就完全可以判断出哪一组是高矮悬殊了。
标准差,就是方差的算数平方根。为什么要开方呢?因为方差的单位是平方,开方后单位就变得和数据一样了,那这样就可以用来衡量平均数的变异程度了。比如230开方是15.2厘米,那这个数有什么用呢?用处可大了。这个数的意思是,这组女模特的身高,虽然平均是175厘米,但就总体而言,每个人的身高分布在平均身高上下15厘米左右,也就是大致在160厘米到190厘米的范围内波动。我们再来看看那5个数:155、160、180、185、195,其中有4个数,即80%的数确实在上述范围内。所以,有了标准差,你就可以很方便地判断出大部分乃至绝大部分的数据大致在以平均数为中心的多少个标准差的范围内。
现在,如果你理解了方差和标准差这两个数的内涵,那你就已经具备区间估计和假设检验的基础啦!
(本文转载自 ,如有侵权请电话联系13810995524)
* 文章为作者独立观点,不代表MBAChina立场。采编部邮箱:news@mbachina.com,欢迎交流与合作。
备考交流
最新动态
推荐项目
活动日历
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 11/03 上海线下活动 | 港中大MBA课程2025级招生宣讲暨校友分享会
- 11/03 上海站 | 港中大MBA宣讲会暨校友分享会
- 11/03 学长学姐校区见面会 | 香港大学在职MBA(大湾区模式) 十一月线下咨询会报名
- 11/03 下週日見!2025年入學交大安泰MBA第一場港澳台申請者沙龍重磅來襲!
- 11/06 讲座报名 | 房地产市场的破局与重构
- 11/12 统考倒计时45天 | 清华科技创新MBA学姐备考分享&答疑等你来!
- 11/13 线上活动|备考经验高密度输出,招生动态前瞻解析,11月13日交大安泰MBA考情解析+笔试技巧分享会开启报名!
- 11/14 公开课抢位|人工智能、数据和人才@北京
- 11/14 申请冲刺 | 港中大(深圳)MBM2025级第四批次招生启动!
- 11/14 活动日程 | 11月14日港中大(深圳)MBM2025级招生说明会