财新传媒
位置:博客 > 卓勇良 > 人口普查琐记与数据误差

人口普查琐记与数据误差

38884603,我随手敲下的这串数字,是1982第三次全国人口普查浙江的常住人口数。38年前无意记下的数字,仍能脱口而出。

我当时跟随的领导,协助分管副省长翟翕武,协调处理人口普查的一些事情。我所在单位跟人口普查没什么关系,所以人口普查没我什么事。但因跟随领导的缘由,使得我对那次人口普查,居然也有一些了解。其中的一些巧遇和花絮,在这次第七次全国人口普查中被激活。

1982年春,我随领导去绍兴。那天是翟翕武副省长去绍兴检查工作,现场解决问题。中午阳光灿烂,春意融融,翟翕武和我们一起,在绍兴宾馆餐厅大堂,围着一张大圆桌吃饭。

我当时不到30岁,因工作缘由偶尔会遇上省领导,所以也并不拘束。因为没有当地领导作陪,翟翕武和我们边吃边聊,欢声笑语不断。一起吃饭的浙江日报一位记者,突然指着边上一张方桌说,那不是谢晋和某著名编剧吗。

当时大堂里吃饭的人不多。我们靠里边,谢晋与著名编剧在窗边,方桌上有一把锡酒壶,四五个菜,他们俩对饮聊天,似乎很尽兴。记者大概是出于职业习惯,上去与谢晋招呼,我只是在边上看着,觉得运气真好,遇上了大导演。后来在杭州现已拆除的人民大会堂,听过谢晋的演讲。

多年后编写浙江省党志,我找到了浙麻厂志。看到翟翕武是浙麻第一任厂长,觉得比较亲切。

那次人口普查,我按通知要求是去街道登记的。登记的地方是在松木场沿山河村的一间住宅里,他们问我哪里出生,我说上海。那时好像还没有出生地概念,反正户口簿上我成了上海人,我太太调侃我,明明是宁波人,偏偏要说成上海人!比较不好意思。

那次人口普查是改革开放后的首次。前一次是1964年的第二次全国人口普查,已18年了。此后,逢十的年份进行一次人口普查成为惯例,听说1982年三普是做得最好的一次人口普查。我那时经常出差,有两次半夜警察敲门,说是人口普查。这后来的几次普查,我再没自己去登记过,也没在出差时遇上警察敲门。

我当时承担了1990年第四次人口普查的课题研究,得了一等奖。结题会上一位素不相识的杭大教师高兴地跟我说,他的论文用了我发在《中国工业经济研究》上的一个公式,顺利拿到副教授,我虚荣心瞬间爆棚。

七普的全国公报发表后,网上出现了一些质疑帖子。其实普查数据与平常年份的抽样数据具有不可比性,不过如抽样数据与普查数据出入太大,确也表明数据质量的问题。统计局朋友对此解释说,这是由于各方面对抽样调查不重视,基层力量薄弱,缺乏质量控制手段,没有实行下管一级等造成的。

其实我倒是认为,以我搜阅政府网站的体会,国家统计局的工作在政府部门中算是比较不错的,数据处理和公布都还算贴心。浙江统计局的统计信息公布效率这几年大大提高,例行的定期公布比以前大大提前,是我们混数字的人的福音。这次七普,浙江数据是在国家统计局511日公布后的第3天公布的,当天另有海南和重庆公布。

不过一些特定年龄段的全国人口数据,确有较大误差。只要把两次普查的年龄段数据,移动10岁对照比较,就能得到结论。

比照结果是,五普011岁、1927岁;亦即六普的1021岁、2937岁的人口数,有较大误差。比较明显的如六普11岁人口数,比五普1岁人口数多21.2%;六普31岁人口数比五普21岁人口数多5.0%

加总计算,这两个年龄段的人口数,前者误差9.0%,后者1.9%。实际误差如扣除正常误差因素,或稍小一些。

人口因为有死亡因素,在接纳境外移民可以忽略不计情况下,只会减少,不会增加。因此,如本次普查的特定年龄段人口比上次普查增加,一定是数据存在问题。

 

五普、六普误差分析
五普年龄(岁) 五普人数(个) 六普年龄(岁) 六普人数(个) 六普为五普的倍数 差错率(%)
0 13793799 10 14454357 1.04789 4.8
1 11495247 11 13935714 1.21230 21.2
2 14010711 12 15399559 1.09913 9.9
3 14454335 13 15225032 1.05332 5.3
4 15224282 14 15893800 1.04398 4.4
5 16933559 15 18024484 1.06442 6.4
6 16470140 16 18790521 1.14088 14.1
7 17914756 17 20775369 1.15968 16.0
8 18752106 18 20755274 1.10682 10.7
9 20082026 19 21543466 1.07277 7.3
10 26210044 20 28026954 1.06932 6.9
11 25137678 21 26556649 1.05645 5.6
12 24576191 22 24474192 0.99585 -0.4
13 26282644 23 25695955 0.97768 -2.2
14 23190076 24 22658768 0.97709 -2.3
15 20429326 25 19933683 0.97574 -2.4
16 20313426 26 19709177 0.97025 -3.0
17 20065048 27 19480836 0.97088 -2.9
18 23100427 28 22322147 0.96631 -3.4
19 19122938 29 19568009 1.02327 2.3
20 18393809 30 18928369 1.02906 2.9
21 18924822 31 19866458 1.04976 5.0
22 18831591 32 19474874 1.03416 3.4
23 17931155 33 18179478 1.01385 1.4
24 20491797 34 20689024 1.00962 1.0
25 21136635 35 21186516 1.00236 0.2
26 22874423 36 22906980 1.00142 0.1
27 23630435 37 23990208 1.01522 1.5
28 24800391 38 24730460 0.99718 -0.3
29 25160381 39 25211795 1.00204 0.2
30 28012344 40 27397219 0.97804 -2.2
31 25018386 41 24956297 0.99752 -0.2
32 27718516 42 27032542 0.97525 -2.5
33 21736582 43 21355748 0.98248 -1.8
34 24828470 44 24012158 0.96712 -3.3
35 24799129 45 23962574 0.96627 -3.4
36 24144848 46 23355778 0.96732 -3.3
37 27866189 47 26972157 0.96792 -3.2
38 20923112 48 20075084 0.95947 -4.1
39 11414017 49 11228960 0.98379 -1.6
40 14684726 50 14097008 0.95998 -4.0

图片数据来源:国家统计局

不过纯凭这些数据,仍不能确切判断到底是哪次普查出现较大误差。因为前后两次普查,理论上都同时存在着多报或少报的可能性。且必须强调,尽管这些误差对数据总体准确性影响很小,但也不能认为无关紧要。

人口普查数据具有自我校核机制。各省的户籍人口数和常住人口数并不相等,但全国总计的户籍人口数和常住人口数,理论上恒等。实际工作中,要使这两个数据相等恐怕并不容易。

第七次人口普查的全国数据511日公布时,我就筹划着作些分析。因为这是一件大事,日本称之为国势调查

人口是国民经济的基础变量。根据五普和六普的年龄表,全国劳动年龄人口从2013年开始减少,20132026年合计将减少近5000万人左右,宏观经济结构随之开始发生根本性变化。劳动和资本的博弈关系发生变化,收入和消费占GDP的比重开始逐渐上升,出口和投资在国民经济中的地位作用逐渐下降,这也正是提出双循环的宏观经济背景。

七普数据揭示浙江人口的一个重要情况,就是外来流动人口大大优化了浙江人口结构。1990年以来,浙江外来流动人口从当年103.6万,增加到20201618.6万人,已占浙江人口的25.1%。好玩的是,外来流动人口这10年的增量,刚好稍高于同期劳动年龄人口增量,这在逻辑上表明,外来劳动力正在全面替代浙江的新增就业。

如果没有外来流动人口又将如何?分析表明如果没有外来流动人口,浙江人口结构将大大恶化。干活的人更少,老人更多。孩子占比仅提高0.91个百分点,劳动年龄人口占比降低6.11个百分点,老龄化提高5.18个百分点。

流动人口是一条大河,载着希望,载着活力。杭州常住人口1990583.2万人,20201193.6万人,翻了一番多,其中80%多是外来人口。杭州以其自身活力吸引众多外来人口,外来人口又以自己的努力,进一步创造了杭州的新的繁荣。

当然,这也是一个跷跷板。流入人口对浙江人口结构的优化,也就是对人口流出省份人口结构的恶化。浙江务请好自为之,努力报答大家的厚爱。



推荐 2