lz隔离在家,人都要无聊散架了。最近看到bxj里很多相亲贴,“身高”是绕不过去的话题。但是我看好多相亲者,对身高的数值分布似乎没有什么概念,所以就自己找了些数据,很简单的做了个分析,大家也就当看一乐了。
方法:正态分布。人群的身高符合正态分布,这没什么新鲜的,老概念了。我是想通过带入具体数值,帮助各位更直观的看待这个问题。我也不是专业学统计的,找到的数据都是网上搜索的,不敢保证可靠,只能说参考一下。
简单介绍下正态分布的概念。上面这幅图,基本囊括了我要用到的正态分布的最重要的信息(图片来源:https://blogs.sas.com/content/iml/2019/07/22/extreme-value-normal-data.html)。概括起来是两点:1.平均值处,概率最高,然后向左右两端快速递减;2.在平均值左右一个标准差(σ)内,样本出现的概率是68%,两个σ内概率是95%,三个σ内是99.7%
数据:正态分布有两个主要参数,1.平均值,2.标准差σ。对中国成年人身高的平均值,我在网上搜索了一圈,男性的平均值基本在168-174(单位cm,之后省略)这个区间,女性在158-162内。我综合搜集到的数据,自己擅作主张,取男性平均身高172,女性161。对于标准差,很少有国内的数据,欧美人的数据普遍是7-9,东亚人可能要低一点。最后我取了男性σ=6.5,女性σ=5.8
结果:我采用表格的形式,把某一身高对应的累积分布函数(CDF)值列举出来,可以理解为,具有这个身高的人,已经高于了全国XX%的同性人口。这是前两个表格对应的含义。第三个表格是某一CDF值对应的身高,可以理解为,要想高于全国某一比例的同性人口,需要YY cm的身高。
简单分析一下。可以看出,对于男性来说,170已经比四成人要高了,如果再增加6cm到176,这个比例将快速增加,已经比四分之三的人要高了。如果到了180,那么恭喜你,已经是全国前10%了。
对女性来说,全国大约60%的女性身高在155-165内。达到160已经要高出全国一半的人了,可以说很不容易了。
单看第三个表格,可以看出,女性的160大概相当于男性的170,165相当于175。也就是说,对于大部分人,统计学上的最匹配身高差,大约是10-11cm。
如果要定一个“普通人”的范围,我会选30%-70%这个区间,那对男性差不多是168-176,女性差不多是158-165.
再稍微解释下,这个正态分布的结果,可能会稍微有点反常识。因为生活里,我们习惯用线性思维来思考,而生活本身则更多服从于指数分布。我们常说,175比170高了5cm,那再高5cm不是更好吗(98都这样了,那298不得起飞咯?妹子,不是你不优秀,是哥...不好意思走错片场了)。实际上,再高这5cm,可比之前那5cm难多了,指数级别的难多了。100个人中,你可能找到30个170-175的人,22个175-180的人,但是只有10个比180高的人,2个比185高的人。
理性分析说完了,再说两句我的个人想法。我一直以为身高这个东西是父母给的,个人努力能改变的不多,所以不是一个很好的评价人的标准。因为它反应不出个人的努力、价值观等等,这些我更看中的东西。某些自媒体上的言论,觉得男生低好像就违法了。我不清楚这些人自己的身高是多少,或者别的条件有多好,才让你一定要找身高占全国前10%的人。我不是学经济的,如果有jr有数据可以告诉我们一下,全国前10%的月收入数值应该是多少。更别说全国前10%好看的脸蛋了。平时韬光养晦,随大流,咋一到这个问题上,就富贵险中求了呢?手动狗头