范文一:人口普查覆盖率的评价及修正方法
人口普查覆盖率的评价及修正方法
摘 要
人口数据是政府政策制定的基础依据,也是企事业单位工作的必要资料; 人口普查是获取人口数据昀直接、重要的渠道,同时人口普查获取的人口结 构、分布数据也往往为众多其它调查提供基础抽样框,其重要性是不言而喻 的。我国2002年正式加入国际货币基金组织(IMF)指定的“通用数据公布系 统”(GDDS),对于人口普查数据的质量评析和修正更有了进一步的要求。 作为全面调查,人口普查昀主要的 误差来源为覆盖误差,即由于覆盖 不全或重复、错误覆盖带来的误差。国外对于普查覆盖率有较多研究和应 用实例,人口统计学分析方法和事后调查法被广泛运用于人口普查覆盖状 况的评价和修正,而我国人口普查数据评价方法多为人口年龄结构指数。 本文即从人口普查覆盖率出发,对其评价和修正方法进行讨论。 本文第一章为背景和基础知识,对我国目前统计数据质量要求进行简 单介绍,并对人口普查及其主要误差来源进行介绍;第二章对我国常见的 人口数据评价方法??人口年龄结构指数、国外常用方法??人口统计学 分析方法进行介绍和讨论;第三章对事后调查法的理论、模型和估计方法 进行讨论,并总结国外多次人口普查事后调查,对其创新和改革点进行提 炼和评析,以从中吸取经验;第四章结合可得数据,对人口年龄结构指数、 人口统计学分析方法、事后调查方法在我国的应用进行比较分析,并对我 国人口普查事后调查方法提出改进意见。
关键词:人口普查;覆盖率;普查遗漏;事后调查2Abstract Population is
one of the basic situations of a country, which has great
impact on the decision making for government, companies and people. Census
is the most important source of national population data, it also provides
sampling frame for all other surveys. The significance of census data speaks for
itself In the beginning of the new century, China joined in the General Data
Dissemination System established by IMF. So the discussion and requirements
of government statistics came to a new and even rigor stageAs a general survey method, the main source of error for census is coverage
error, which includes under-coverage, over-coverage and wrong-coverage. There
are plenty research and practical experiences about coverage mistake
identification and modification aboard, especially for demographic analysis and
afterward survey. The main idea related to census data is age-sex structure index
in China, which is not so accurate. So in this thesis, introduction
and discussion
about demographic analysis and afterward survey in China will be made,
focused on census coverageThe first chapter of this thesis is the background knowledge and brief
introduction about census, its steps and also the source of census error; the
Second Chapter is a discussion about the common method: age-sex ratio,
demography analysis; the third chapter focused on the theory and practical
experience concluded from foreign experience. In Chapter 4, methods is
compared and suggestion for the government
Keywords: census, coverage rate, under-coverage, after-census survey
3目 录
19
引言. 1
20
第1章 人口普查数据误差H2
1.1 政府统计数据?来源及要求21H2
22
1.2 人口普查及其误差. H4
23
1.2.1人口普查的特点及流程H4 1.2.2人口普查的误差来源. 24H6 25
1.3 影响覆盖率的普查环节H7
26
第2章 人口普查数据的质量检验. H12 2.1 年龄结构指数与普查覆盖 27H12 28
2.1.1 需逐岁人口数量的指数. H13 29
2.1.2 需连续五个年龄人口数的指数. H14 2.1.3 需五年为一组人口数据的指数. 30H15 31
2.1.4 年龄结构指数与覆盖率. H16 32
2.2 人口统计变量分析H17
2.2.1 要素法 33H18
34
2.2.2 数学法 H25
35
第3章 人口普查的事后调查H28 3.1事后调查的模型36H28
37
3.1.1 捕获再捕获模型. H29
38
3.1.2 模型假设. H30
3.1.3 捕获再捕获模型在普查事后修正中的应用 39H30 40
3.2捕获再捕获模型的估计量 H32
41
3.2.1 Peterson 估计量 H32
3.2.2 Chapman 估计量. 42H34
43
3.2.3 Sen 估计量H34
44
3.3国外人口普查事后调查H36
13.3.1 美国政治制度与人口普查45H36
3.3.2 1950年美国人口普查的事后调查. 46H37 3.3.3 当期人口调查(Current Population Survey). 47H39
3.3.4全国空置调查(National Vacancy Check). 48H40
3.3.5 准确性与普查数据评估(Accuracy and Coverage Evaluation).
49H41
3.3.6英国的事后调查. 50H42
第4 章 我国人口普查质量评估研究51H44
4.1 我国人口普查概况 52H44
4.2 我国人口普查数据质量分析. 53H45 4.2.1 我国普查数据的年龄结构指数分析 54H45 4.2.2人口统计学分析. 55H49
4.3 我国的人口普查事后调查现状及改进建议. 56H57 4.3.1我国现行事后调查57H58
4.3.2对事后调查修正的改进意见 58H60 参考文献 59H63
附录 60H66
后记 61H682图标索引
0 62
H图 1 我国1990、1995及2000年年龄偏好指数 H47 1990
F1
10 a
1 63
H图 2分性别及年龄的1990年至2000年存活率 H53 2H图 3 各省人口居住情况64H56
3 65
H表 1 美国历次人口普查遗漏率(%). H7 4 66
H表 2 美国1990年人口普查的要素法分析H24
5H表 3 捕获再捕获模型. 67H29
6 68
H表 4普查与事后抽样调查的覆盖差异(%) H37 7 69
H表 5 简单核查结果示例(%) H38
8H表 6进一步调查结果(人). 70H39
9 71
H表 7 我国人口数据的惠普尔及迈耶斯指数. H45 10 72
H表 8 我国人口数据年龄准确指数及联合国年龄-性别指数 H46 11H表 9 1990、1995及2000年年龄偏好指数序列相关性 73H48 12 74
H表 10 历年人口公布值与推算值(万人)H49 13
H表 11四普、1995年抽样及五普数据的出生队列移算和存活率分析(万人)
75H51
14 76
H表 12 2000 年户籍数据与普查数据对比(万人) H53 15 77
H表 13 2000年人口普查值与模型预测H57
16H表 14历次普查总人口和漏登率. 78H58 17 79
H表 15 2000年人口普查各省遗漏调整H59
3人口普查覆盖率的评价及修正方法
引 言
一个国家的政治、经济、文化、社会、军事发展都是建立在人的基础 上的,所谓“以人为本”说明任何社会经济等方方面面的政策、方针、措 施都需要从人的角度出发,因此,认识一国人口的数量、质量、结构、分 布和变化规律是任何工作所不能或缺的。人口数据是政府政策制定的基础 依据,也是企事业单位工作的必要资料。人口普查是获取人口数据昀直接、 重要的渠道,同时人口普查获取的人口结构、分布数据也往往为众多其它 调查提供基础抽样框。我国作为世界第一人口大国,1953 年第一次进行人 口普查就使得世界范围的人口普查覆盖率提高了近两成,故中国的人口普 查对于整个世界的重要性是不言而喻。
然而,由于人口普查覆盖面广、历时长、调查强度大、环节多,数据 质量控制难度较大,加之随着社会发展,人口流动、迁移越来越频繁,为 人口普查工作带来了更多的困难和挑战,建立系统的评估与修正方案是十 分必要的。在人口普查的评估与修正中更可以敏锐的触觉发现潜在的人口 和社会变化趋势,审时度势,做出积极有效的应对。
目前来看,我国政府宏观统计数据质量的现状不容乐观,与计划经济体 制相配套的政府统计制度在经济转型过程中突显弊端。整体看来,公布的宏 观总量数据的准确性较差,及时性、适用性也无法保证。2002年我国正式加 入了由国际货币基金组织(IMF)制定的“通用数据公布系统”(GDDS),对 于统计数据的质量关注更到了前所未有的高度。因此,对于人口普查数据的
评价和修正是具有重大意义的。
1人口普查覆盖率的评价及修正方法
第1章 人口普查数据误差
信息化大潮下的今天,政府、企业、个人的决策都越来越基于信息, 统计数据也成为各国政治、经济、社会行为的直观体现,随着市场经济主 体日趋多元化和人民生活水平不断提高,社会各界对统计信息的需求日益 广泛。其中,宏观经济数据的收集由于其意义重大、覆盖面广、涉及内容 多,必须并且只能由国家完成。我国于2002年4月加入国际货币基金组织 制定的数据公布通用系统(General Data Dissemination System, 简称 GDDS)以来,对政府统计数据的关注和要求已到前所未有的高度,本文即 在此背景下,从政府统计数据中的重要组成部分??人口普查数据出发, 对人口普查的质量评价和修正方法进行讨论。
人口数据有狭义和广义之分,其中狭义数据仅指未经任何处理的人或 事件的量,如人口数、出生数等,一般以绝对数出现;广义数据不仅包括 这些,还包括由狭义数据推导出的人口学指标,如常用的出生率、死亡率、 节育率等统计量。本文讨论的范围为狭义人口数据。
1.1 政府统计数据?来源及要求
政府作为一国昀大的机构,担负宏观层面统计数据收集和公布的重任。 我国《统计法》第二章第十条“关于统计调查计划和统计制度”中明文规 定“统计调查应以周期性普查数据为基础,经常性的抽样调查为主体,以 必要的统计报表、重点调查、综合分析为补充,搜集、整理基本统计资料”。 普查即全面调查,一般执行的是国家统计指标体系,主要包括反映社
会生产、交换、分配和消费过程的经济统计指标体系和反映人口、文化、 教育、卫生、科技等方面的社会统计指标体系,它通过逐个调查一定时点 上或一定时期内的社会经济现象的情况,收集整理和提供反映国情国力情 况的统计数据。普查资料具有全面、系统、准确可靠的特点,是制定国民 经济和社会发展计划、实施科学决策和开展抽样调查的基础。由于普查需2
人口普查覆盖率的评价及修正方法
要投入大量的人力、物力和财力,不可能年年事事进行,故周期性普查制 度在世界上已有数百年的历史,并被大多数国家所运用。我国的周期性普 查制度建于1994年,经国务院批准的周期性普查项目有:人口、工业、农 业、第三产业和基本单位普查等。其中,人口、第三产业、工业和农业普 查每隔10年、分别逢0、3、5、7年份进行,基本单位普查每隔5年,逢1、 6年份进行。
抽样调查是按一定程序从所研究对象的全体总体中抽取一部分(样 本)进行调查或观察,获取数据,并以此对总体的一定目标量(参数)做 出推断。抽样调查大部分执行的是省级以下统计指标体系,其中专题调查 尤为常见。根据样本抽取样本方法的不同,抽样调查可分为非概率抽样和 概率抽样。抽样调查相对于普查具有省时省力实效性强的优点,但不能替 代全面调查。抽样调查也有局限性,如仅能对总体目标量进行估计,不能 提供各子总体的详细资料;同时,抽样调查所需的抽样框往往也需由普查 提供,如人口普查所得全国人口分布资料。可见,普查与抽样调查是一种 互为补充、缺一不可。
由于统计数据是各级政府和单位以及个人制定政策和计划的依据,数
据若存在问题,会给社会各界带来误导,一方面,它使政府决策有可能在 总体上判断失误,导致政府宏观调控政策的失灵,延误改革的时机,影响 政府的形象和权威;另一方面,也会使得企业、厂商或个人从错误的参考 资料出发,导致决策的错误。因此,统计数据的质量好坏对社会各界均有 深远的影响。
目前国际上存在着两个统计数据公布的标准,即国际货币基金组织制 定的数据公布通用系统(General Data Dissemination System, 简称GDDS) 和数据公布特殊标准(Special Data Dissemination System, 简称SDDS) 主要涉及国民帐户、财政、金融、对外和社会人口五大统计部门,具体内 容包括数据的范围、频率和及时性,公布数据的质量,公布数据的完整性 和公众获取四个部分。GDDS和SDDS都是从数据特征、质量、诚信度和公开 性等四个方面来对数据的生产和公布制定标准,但强调的重点和要求不同, GDDS 强调的是数据的准确性和完整性,而 SDDS 则对一些有良好的统计基 础和完备的统计体系国家提出时效性等进一步要求。
3人口普查覆盖率的评价及修正方法
我国统计基础薄弱,2002 年加入 GDDS,目前来看,准确性是我国统计 数据的首要要求,而不同数据(如人口数据、农业数据、金融数据)的准 确性要求不尽相同。
人口现象是一种昀基本的社会现象 ,人口的数量和质量是一国政治、 经济、文化、军事和民族繁衍至关重要的问题,故准确翔实的数据是认识 社会、改造社会的有力工具。基于以下几个原因,本文将讨论范围缩小至 提供宏观人口数量和质量数据的人口普查:
1.“以人为本”,人口数量和质量对一国政治、经济、文化都有深远 影响,是政府统计数据中不可或缺的部分;
2.人口数据涉及范围广、地域宽,是大规模统计工作的典型; 3.人口普查在世界各国都定期举行,国外对其评价和修正方法均有较 多研究。
1.2 人口普查及其误差
人口数据主要从两种来源获得:
一、直接来源。指专门以收集人口数据为目的建立的来源,主要手段 包括人口普查、人口调查(抽样调查、典型调查)和经常性的人口统计。 人口普查和抽样调查从实施目的、步骤上看均不同于日常的人口统计,并 且在统计学上有不同理论体系和应用范围。
二、间接来源,不是以专门提供人口数据为目的,但包括有关人口信 息的来源,如国民经济、社会各部门的统计报表、调查报告、劳动人事部 门劳动力统计资料、民政部门对老年人、残疾人保障金的统计、教育部门 就学、毕业的统计等等。间接人口来源是直接来源的重要补充和参考对照, 但由于这些部门昀主要的职责不在于数据 收集,无法从数据角度开展工作 策划和实施,故不作为本文讨论的内容。
1.2.1人口普查的特点及流程
人口普查又称国情普查或国势调查,是现在世界各国所广泛采用的搜4人口
普查覆盖率的评价及修正方法
集人口资料的一种科学方法,是全国基本人口数据的主要来源。现代人口 普查迄今已有 200年的历史。一般认为,现代意义上的人口普查是从1790
年美国人口普查开始的。美国是世界上昀 早定期进行人口普查、公布普查 结果并把人口普查作为一项条款写进宪法的国家,英国和法国紧接美国于 1801年进行了人口普查,也是每隔10年或5年举行一次人口普查。人口普 查提供的资料具有法律效力,被用于分配人民代表或议员名额,进行行政 管理,制定政策和拟定建设计划;用于商业网点的铺设和劳动力的分配; 以及用于广泛的人口研究工作。人口普查具有如下特点: 集中性:人口普查由国家中央政府集中指导,以官方名义进行。许多 国家都将普查列入法律内,定期进行并对居民回答的问题绝对保密。 统一性:人口普查由中央政府或普查机关规定普查时间、制定统一调 查表格、确定统一的对象和统一项目,用统一方法进行调查登记。 个别性:严格的人口普查必须针对每个人个别进行点查登记,分别记 录每个人的特征资料。普查登记以个人为单位,不是作为一个单位登记一 个家庭或一个家庭活动的全体成员,也就是要逐户逐人,个别访问登记。 定期性:人口是一个动态变化的群体,研究人口规律、制定人口规划 和人口政策需要有连续的、及时的人口数据资料,故许多国家都是定期举 行人口普查。
一般来说,人口普查包括如下的基本工作流程。
1. 机构建立,人员调配安排
2. 制定普查规划和方法
3. 普查试点
4. 编制地址代码,进行户口整顿
5. 普查员选调培训
6. 调查实施
7. 编码、录入
8. 数据处理
9. 数据公布
10. 分析
5人口普查覆盖率的评价及修正方法
1.2.2人口普查的误差来源
“人口普查昀基本的任务是点清标 准时点的现存人数,既不能重,又 1
不能漏。”0F ,与GDDS的准确性要求相对应。政府统计数据误差来源主要有 抽样误差和非抽样误差两类,抽样误差是指由于抽取样本的随机性带来的 偏差,非抽样误差则包括如下几类:
1.覆盖误差,用遗漏率、过度覆盖率等指标衡量;
2.测量误差;
3.过程误差,包括编辑错误率、替代估计错误率等;
4.无回答误差。
人口普查不存在抽样误差。而四类非抽样误差中,测量误差由于调查 内容多为基础的个人资料故相对较小;科技的发展简化了数据汇总、编辑 过程并极大减小过程错误;无回答误差在人口普查中也多由覆盖误差引起; 故覆盖误差成为人口普查中昀主要的误差 来源。随人口流动增大、社会经 济发展,完整覆盖的难度日益加大。因此,人口普查数据准确性的首要表 现在于其覆盖率:是否能够如实对每一个在标准时点上存在的人进行普查
登记,做到不重不漏。
2
美国普查局采用的是完全覆盖普查模型(Complete 1F Coverage Model),
对覆盖不全的人口投入了相当大的财力和研究,如1980年美国普查局投入 了超过2亿美元,达到1970年近两倍,采取各种途径以减少未覆盖,,但 美国该年普查覆盖率提高却未有两倍提高。普查覆盖率越接近 100%,提高 覆盖率的单位成本就越高(Keyfitz,1979)。在普查过程中过于强调完全 登记也可能会导致错误登记或重复登记,尽管覆盖人数增大,却只是通过 错报、重报填补漏报,反而造成与真实总体的更大偏误。
有人认为,较小比例的遗漏对总体的比例数据不会造成太大影响。他 们认为:少数人口遗漏不会对整体调查结果造成很大影响,而且人口普查 结果中以百分比显示的指标,如 65岁以上人口所占比例,生育率等,不会 因少数人遗漏而产生重大变化。如果被忽略的群体结构、性质与总体一致, 1
查瑞传,对 2000年中国人口普查的若干建议,《人口研究》,1995年第 2 期。 2
Eugene P. Ericksen; Joseph B. Kadane, “Estimating the Population in
a Census Year: 1980 and Beyond”,
Journal of the American Statistical Association, Vol. 80, No. 389.
Mar., 1985, pp. 98-109
6人口普查覆盖率的评价及修正方法
那么遗漏带来的仅是总体个数的低估,对于整体结构的认识不会因之发生
变化,然而普查数据的遗漏的人群通常是具有某种特殊属性的少数人群,
如某些特定区域居住者、少数民族、外来移民等,无法用调查到的其他人
群代替,此时,遗漏是不能断然忽略的。从美国 1980年人口普查的覆盖情
况看,男性黑人遗漏率明显高于其他人群,如西班牙裔、亚裔人群也可能
存在覆盖率较低情况,但由于调查涉及该类人群过少而无法计算其遗漏率。
因此,普查的人口遗漏是不能忽略的。
表 1 美国历次人口普查遗漏率(%)
种族/性别 1990 1980 1970 1960 1950 1940
总计 1.8 1.2 2.7 3.1 4.1 5.4 男性 2.8 2.1 3.4 3.6 4.5 5.9 女性 0.9 0.3 2.0 2.6 3.8 5.0黑人 5.7 4.5 6.5 6.6 7.5 8.4 男性 8.0 6.7 18.6 8.3 9.1 10.3 女性 3.6 2.4 4.6 4.9 5.9 6.5白人及其他 1.3 0.8 2.2 2.7 3.8
5.0 男性 2.0 1.7 2.8 3.0 4.0 5.2 女性 0.5 0.0 1.7 2.4 3.6 4.8对少数人群的普查遗漏后果比遗漏相同个数的一般人群要严重,这将
对政治、经济等造成显著的影响。由 2001 年 1%人口抽样调查,我国 2000
年的总体普查遗漏率为 1.8%,不同子总体的遗漏率虽未公布(或未得出),
但对于某些子总体,如某少数民族、民工,遗漏率高于总体遗漏率是很可
能的,故对我国人口普查的总体及子总体覆盖情况进行研究,得出可靠覆
盖率估计情况是很有必要的。
1.3 影响覆盖率的普查环节
人口普查过程复杂,环节众多,其中于覆盖情况有较大影响的有如下
环节:
1.人口范畴与普查对象确定及细分
人口的,出生、死亡、迁移、临时外出都会带来人口的空间变动,故 人口研究必须建立在一定的人口范畴定义之上。人口范畴通常有三种定义: 7人口普查覆盖率的评价及修正方法
常住人口:实际上经常居住在一个地方的人口。
现有人口:普查时间里在普查现场的人口,人口普查需要普查每一个 人,不管其在某地是否登记注册、有无户口。
注册人口:按一国法律规定在某地区登记户口的人口,又称为法定人 口,不论外出时间长短,只要在某地有户口,都为该地注册人口。 大多数国家人口普查的对象是常住人口,也有少数着重以现有人口为 普查对象,如英国、意大利等。七十年代后,一些国家普查同时登记常住 人口和现有人口,即在调查时登记常住人口、暂时居住人口和临时外出人 口,然后在全国范围内互相核对,分别计算出各地的常住人口和现有人口。 常住人口常住地居住人口+常住地临时外出人口
现有人口常住地居住人口+其他常住地外来人口
同时登记常住人口和现有人口从数据完整性来看较好,但普查工作量 大、统计技术水平要求高、组织工作复杂,尤其全国范围的相互核对是较 大挑战,对大多数国家而言不易实现。
若人口范畴和普查对象未达到一一对应,普查过程中的处理错误是无 法避免的,结果也难以令人信服。较好的做法是在普查前对人口范畴和普 查对象按照“人以群分”的方法,将具有不同居住习惯、不同社会属性的 人群细分,实现人口范畴与计数对象的吻合。
美国人口普查的计数范围是普查标准时间居住在美国本土的所有男
女,具体分为公民、永久性居民、临时性居住者、季节性工人、非法移民、 老年人、年轻人、违法者、有色人种、少数民族、非少数民族、各种族等, 标准时间之前死亡、迁出,以及之后出生、迁入的人不属于计数范围。显 然,不同群体具有不同的生活居住习惯,有些人虽然属于计数范围,但却 经常被遗漏,如无家可归的人、出差和旅游的人、单身家庭、儿童、老年 人、不相信政府的人、非法移民等。
我国人口普查采用按常住人口登记的原则,每个人必须在常住地进行 登记。一个人只能在一个地方登记。普查过程中对调查对象的确定容易出 现不一致或产生错误,倘若在群细分的基础上,对不同群遗漏可能、居住 习惯有更深入的影响,则可以在调查中对不同类型人群采取灵活多变的方 法以得到更好的结果,极大程度减少错报漏报和重报。
8人口普查覆盖率的评价及修正方法
2.普查时间与访问次数
人们的住所、职业是不断变化的,出生、死亡、结婚离婚、迁入迁出 也是每时每刻都在发生的。因此,准确计算人口必须且只能在一个特定时 刻进行,即人口普查标准时刻。除了日期,还需精确到某一时点,如 2000 年11月1日零时。标准时间一般都选在人口变动昀少的时候,尽量避免人 口流动较大的节假日和农忙季节,一般在春季或冬季进行,如美国是四月 一日,印度三月一日,加拿大六月一日;瑞典十一月一日,瑞士十二月一 日,比利时、西班牙、芬兰是十二月三十一日。
确定了人口普查的标准时间之后,就需统一以这个时间进行调查登记。 如果人口登记发生在标准时刻之前,就需要对其加以校正,把自登记之日
至标准时刻之间死亡的人口加以注销、出生的人口补加登记;登记日期在 标准时刻后则反之。为确保普查间的可比性,一国普查两次昀好定于各普 查年的相同时刻。
昀为理想的人口普查是全国在同一 时间,如一天内完成全部登记,但 一则不可能在普查日使全国人民停下一切工作,专门进行普查登记;二来 集中于一天的庞大登记工作需要投入难以计数的普查员、资金,组织工作 必将非常复杂艰巨。大多数国家规定在一定时间内完成普查登记工作,一 般是七至十天。
我国前四次人口普查都选在 7 月1日0时进行,“五普”把时间改在 11月1日0时,是有其科学原因的:每年6、7月份全国不仅天气炎热,而 且常伴有特大暴雨洪灾,各级政府和群众大多忙于防洪、抢险、救灾,给 普查带来一定困难;冬季北方地区太冷,也不利于普查,所以选在11月上 旬。此外,“常住人口”的时间标准定为半年,按以往把普查的时间选在7 月 1 日,许多外出打工的农民过完春节回到城里都不到半年,他们仍按住 在农村被登记,无法反映当前人口流动的现状,11 月进行人口普查可以避 免这个矛盾,使普查数据的可用性大大增加。
即便如此,时间带来的误差仍旧是难以避免的。有的家庭或个人可能 在居住地,但错过几次调查;临时外出的个人更由于无固定可查地址容易 被遗漏。美国人口普查中,为减小时间带来的遗漏,对普查对象昀多进行69
人口普查覆盖率的评价及修正方法
次访问。调查采用自填与入户访问结合的方式,先在普查标准时刻之前发 放普查登记表,普查时刻之后由工作人员挨家挨户收取。对于因故未按时
返回普查表的住户,普查局接收住户自行与普查员电话联系,通过电话填 写问卷留下普查员的姓名、电话号码、昀佳联系时间;对未按时返回普 查表并未主动联系普查机构的住户,普查员要做 6 次访问,其中 3 次可通 过电话如已知对方的电话号码,3次必须是上门。6次之后仍未找到此人, 方可以通过询问邻居了解情况,得到全部和部分普查信息。我国对于每户 人家的调查次数没有明文规定,对未登记入户籍的人口和流动人口而言, 时间是关乎遗漏多少的环节。
3.人口普查的调查目录不全
无论采取哪种调查方式,都需要包含地址、人名的调查目录,依照此 目录展开普查登记,普查调查目录与其覆盖情况息息相关,在目录中就被 遗漏的人口在调查过程中很难被发现。
美国由普查局负责编制地址清单 普查委员会称为 ACF,address control file。地址清单大多来自商业用途,如邮寄宣传品推销的资料。比
较
富裕的街区邮寄地址往往更详细准确,尽管美国政府尝试用各种方法更新 地址清单,仍然有一些街区很难得到完整准确资料,如:被分割为数间公 寓的房屋,从外面很难看出来;居住在车库、后院小棚、帐篷的人也很难 为普查员发现,尤其是在贫困街区或高犯罪率的街区,不在地址清单上出 现的人很难被找到。根据可靠数字,地址缺失的人中,40%到 70%在普查 被遗漏。
我国人口普查的调查目录是基于户籍登记资料得来的。2000 年我国人 口普查将全国划分为省级、地级、县级、乡级、普查区、调查小区 6 级区
域,在人口普查前由各级普查和公安机关按照《18H中华人民共和国户口登
记
条例》及国家有关户口管理的规定共同进行户口整顿,对常住人口、流动 人口和暂住人口情况进行清查。然后,普查员根据户籍资料对调查小区人 口情况进行摸底,以熟悉各小区和周边的环境,掌握调查小区人口情况, 编制小区各户户主底册。
户籍数据的缺漏必然带来人口普查的遗漏,尤其是在我国,超生瞒报、10人
口普查覆盖率的评价及修正方法
死亡瞒报漏报等现象是不可忽视的。普查实施过程时间短、任务重、人员 有限,只能以户籍制度基础上编制的户主底册作为调查目录,无力对底册 以外的人或地域进行搜索,故难以避免普查因此遗漏。
11人口普查覆盖率的评价及修正方法
第2章 人口普查数据的质量检验
虽然各国的人口普查都是在中央政府统一要求、专门机构研究组织、 各级政府监督下完成的,但一些主观或客观的原因还是可能对如此宏大的 工程造成影响,普查资料存在一定的误差是不可避免的。因而,在利用普 查资料进行分析之前,需资料的可靠性和准确性进行判断。评价人口普查 数据质量的方法主要有三种:
1.通过年龄结构指数,评判普查数据质量
2.人口统计学分析方法,包括要素法和数学法;3. 事后调查法 由于覆盖误差是人口普查的主要误差来源,覆盖不全或错误的普查数 据其及时性、有效性更无从谈起,故普查覆盖率是其数据质量昀基础直接
的反映,下文对于普查数据质量的评价和修正均围绕普查覆盖展开。 2.1 年龄结构指数与普查覆盖
人口的年龄性别构成是许多人口研究分析的必要环节,采用年龄结构 指数检验普查资料质量是国际上常用的人口数据质量评估方法之一,我国 人口普查数据质量检验研究中多数采用此方法。除了判断年龄误报程度外, 年龄性别结构指数也可反映不同年龄(性别)普查登记水平的异常情况, 可能的异常产生原因包括:
1.数字偏好。在各国普查中都存在不同程度的年龄误报,被调查人出 于文化、教育或其它原因,可能对某一数字、年龄有偏爱(忌讳)而误报 自己为这一年龄(其它年龄)例如:西方许多国家将“13” 视为不祥的数 字,在年龄报告时可能会绕开;我国文化也对本命年和“4”有所忌讳,而 对“6”,“8”等数字存在偏好;
2.年龄计算方法不一或被调查人概念不清。我国有的地方采用阴历计 算年龄,对于在农历新年前出生的婴儿,出生即有一岁,过了农历新年又 长一岁的说法;在一些边远地区,经济文化较为落后,可能存在不记得自12
人口普查覆盖率的评价及修正方法
己年龄的状况。
3.普查的覆盖不全。例如:我国传统文化中重男轻女思想较严重,实 行计划生育以来一些封建思想浓厚、盼子心切的家庭违反计划生育政策, 超生以期得子。出于政策限制或逃避惩罚的心理,不给孩子上户口,造成 低年龄或女童的人口漏报,在年龄性别指数中也能有所反映。 国际上常用的人口年龄结构检验指数有惠普尔指数(Whipple’s Index),
迈耶斯指数(Myers Index),年龄准确性指数(Age-accuracy Index)和联 合国年龄性别准确指数(United Nation Age-Sex Accuracy)。常用的人口 年龄结构指数,按其所需数据可以划分为三类:
2.1.1 需逐岁人口数量的指数
惠普尔指数及迈耶斯指数是昀常见 的人口年龄结构指数,其计算需要 细至所有年龄的人口数量数据。
惠普尔指数假定在某个年龄组(如5岁组或10岁组)中各个年龄的人 口是相等的。如果把全部人口(或某个年龄组)中以“0”为年龄结尾的人 口总数与全部(或某个年龄段)人口数总和的十分之一相比,计算得一个 指数,这个指数就可以用来检验人口年龄资料中是否有年龄尾数为“0”的 年龄堆积现象。
P + P + P + P
30 40 50 60
WI ×100
1
P + P + ? ? + P + P + P
23 24 60 61 62
10
以同样方法还可以计算以“1”、“2”、??、“8”、“9”为人口 年龄尾数的惠普尔指数。若同时检验对于 “0”和“5”结尾的年龄特定偏 好程度,可将上式改为:
P + P + P + P + P + P + P + P
25 30 35 40 45 50 55 60
WI ×100
1
P + P + ? ? + P + P + P
23 24 60 61 62
5
一般来说,惠普尔指数只用于检验23-62岁之间的人口年龄堆积情况, 可对总体进行检验,也可分男性、女性进行。惠普尔指数的值域为 100 至 500。不同研究对于惠普尔指数的评判标准不完全一致,但均认为越接近13
人口普查覆盖率的评价及修正方法
100,年龄堆积程度越低或越不存在堆积;反之,数值越高则表示堆积越明 显,一般认为:惠普尔指数大于130时,年龄偏好较严重。
惠普尔指数是昀常见的人口年龄结构指数,但其只能用于检验 23-62 岁人群的年龄偏好,而迈耶斯方法则是惠普尔指数的改进,可用于检验 10-89岁人群的年龄偏好 Myers Index,1940。对于一个正常国家或区域, 如果其人口偏向某一结尾年龄或某几个结尾年龄的话,在这些年龄上必然 出现人口堆积,在其他年龄上也会出现人口减少的现象,这就会导致年龄 结构分布不均匀,对于这种不均匀程度的判断正是迈耶斯指数的构造思想, 其计算公式如下:
8 8
B i +1 P + 9i P , i 0,1, ? ?, 9)
i ? ki ? ki
k 1 k 2
1 B
i
MI | ×100 ?10 |
?
2 B
? i
其中: P 表示年龄为10 × k + i的人群人数, B 为 P 的加权和, MI为 ki i ki
迈耶斯指数。迈耶斯指数取值范围为 0-90,值越接近 0,说明资料质量越好。 当 MI在 0-5之间时,说明资料质量比较好;在 5-10之间说明存在一定年龄 堆积,大于 10则表明资料质量比较不好,须谨慎对待。
2.1.2 需连续五个年龄人口数的指数
惠普尔和迈耶斯指数是针对年龄尾数进行检验,而年龄偏好指数则是 检验在某五年间是否有哪年具有年龄偏好,需要数据为待检验年龄和其上 下两岁的人口数据,计算公式如下:
P
a
IAP ×100
a
1
[] P + P + P + P + P
a-2 a-1 a a +1 a +2
5
其中,a 为年龄,P 为 a 岁的人口数,IAP 为 a 岁的年龄偏好指数。年 a a
龄偏好指数的值域为 0-500。100-110 之间认为在此年龄上不存在堆积, 110-130 间说明存在堆积现象,但不严重;大于 130说明堆积严重。 14人口普查覆盖率的评价及修正方法
若要检验十年间是否存在某年偏好,只需将年龄偏好指数的分母换为 十个年龄段数据,并将分母的 1/5改为 1/10。
2.1.3 需五年为一组人口数据的指数
前三个指数都是对按一岁分组的年龄进行检验,而许多国家的人口年 龄结构统计数据是以五岁为一组公布的,上述三种指数无法计算,可采用 年龄准确性指数(AAI, Age Accuracy Index)和考虑性别年龄分布差异的联 合国年龄-性别指数UNI。
年龄准确指数的计算方法如下,先计算:
P
5 a
R ×100, a ? 5,10,15, ? ?, 70
5 a
1
P + P + P
5 a-5 5 a 5 a +5
3
其中 P 表示年龄为 a 至 a+5 岁的人口数量,由于 75 岁以上人口波动
5 a
较大,故只计算 0到 74岁的 R 。
5 a
| R ?100 |
5 a
年龄准确指数 AAI
?
13
a
一般认为:AAI在 0-3之间时,认为数据质量较好;3-7之间可以接受,
大于 7则不可接受。
联合国年龄-性别指数也采用五岁组人口数据,在年龄准确指数的基础
上考虑对于男女性别差异带来的年龄结构影响。 1.分年龄段计算 0-74 岁男女性别比
男
P
a
R ×100 , a ? 0,5,10,15, ? ?, 70 a
女
P
a
2.将每个性别比减去相继的上一年龄段的性别比,得性别比差的绝对
值
D | RR |,
a a a-5
由于第一个年龄段 0-5 岁不存在于上一年龄段的男女比例之差,故15人口
普查覆盖率的评价及修正方法
a ? 5,10,15, ? ?, 70 3.将所有性别比差求均值的绝对值 | D |
? a
M
14
4.分别计算男女年龄比
P
5 a
× 100
, a ? 5,10,15, ? ?, 65; 1
P + P
5 a -5 5 a + 5
2
并计算年龄比与 100 的差的绝对值,求差的均值
男
1 P
男 5 a
A ×100 -100 , a ? 5,10,15, ? ?, 65
?
1
13 男 男
a
P + P
5 a-5 5 a +5 2
女
1 P
女 5 a
A ×100 -100 , a ? 5,10,15, ? ?, 65
?
1
13 女 女
a
P + P
5 a-5 5 a +5
2
5联合国年龄-性别指数。
男 女
UNI 3 × M + A + A
联合国年龄-性别指数不但检验年龄结构的准确性,也同时检验性别的 准确性。一般标准为: UNI在 0-20 之间说明资料是准确的,20-40 表示不 够准确,尚能接受,40 以上说明数据质量有较大缺陷。
2.1.4 年龄结构指数与覆盖率
从各种年龄结构指数的构成看,主要反映数据是否存在年龄堆积或偏 爱,不能直接反映普查覆盖率。本文之所以对其进行讨论是因为: 第一,在我国许多研究将年龄结构指数作为衡量普查数据质量的唯一16人
口普查覆盖率的评价及修正方法
标准,将落入可接受范围内的普查数据判断为:“数据质量较好”,应当 说,这是不够严谨准确的。
首先,普尔指数和年龄偏好指数均假设标准年龄结构是均匀分布的, 如迈耶斯则假定标准年龄结构是一个静止的状态,年龄准确指数和联合国 年龄-性别指数则是假定按 5 岁分组的年龄结构是均匀分布的。我国 20 世 纪经历了两次世界大战和内战,历经清政府、民国政府和新中国三个政权, 社会动荡较大;建国以来经历鼓励生育的大生产、**时代,也曾经历 艰苦的三年自然灾害,后又实行人口计划生育政策,应该说均匀的年龄和 性别分配在中国是不存在的。而上述指数均假定真实的年龄结构是均匀的,
调查所得数据的年龄结构与这一假定均匀年龄结构相差越多,指数的有效 性越差,由此可见,在我国上述年龄结构指数的应用不能完全依照常规标 准一概而论。
其次,从全国来看,“四普”在惠普尔指数、迈耶尔指数、年龄准确 指数和联合国年龄-性别指数项上,按常用判断标准均优于“五普”,而“五 3
普”与“三普”的非常接近(王广州 2F)。但这不能说明“四普”质量优于 “五普”和“三普”,必须同时考虑各指数假设条件和评估的有效性是否 适合中国人口数据质量评估。在中国,人口年龄分布结构存在波动,各种 指数的应用不应完全套用国际通用判断标准。惠普尔指数和迈耶斯指数在 一定程度上受客观年龄结构波动的影响;而年龄偏好指数、年龄准确指数 和联合国年龄-性别指数则仅能用于年龄堆积比较严重或者人口年龄分布 4
比较均匀的特定地区(乔晓春 3F)。
第二,年龄结构指数难以直接反映普查覆盖率,但其反映出的人口结 构中的异常,可能是覆盖问题的有利诊断工具,对此,本文将在第四章结 合实际数据和背景进行讨论。
2.2 人口统计变量分析
我国对人口普查数据质量的研究大都围绕年龄性别结构指数进行,而 如上文所示,年龄结构指数在我国的受限于客观特殊人口结构,并且不能 3
王广州,“对第五次人口普查年龄结构数据的评估与调整”,《人口与经
济》,2004年第 5期。
4
乔晓春, “试论年龄结构检验指数对普查资料检验的有效性问题”, 《人口
与经济》,1993年第 6期。
17人口普查覆盖率的评价及修正方法
为人口数据修正提供依据。如果掌握人口登记、选举等得到全体人口的完 整的管理或登记数据,直接比对就可衡量普查的覆盖率,这就是人口统计 学分析方法Demographic Analysis, 简称 DA。人口统计学分析方法被广 泛应用于估计普查时期总人口数,与普查结果对比以衡量人口普查的覆盖 率(遗漏率)以及遗漏校正。这就是人口统计学在普查覆盖率中的应用, 从其方法的性质来看,可分为两类:数学法和要素法。
2.2.1 要素法
人口统计指标间多存在内部的逻辑关系和一致性,要素法就是利用人 口统计学变量间的内在联系,检验普查数据的合理性。要素法分析普查覆 盖率,首先要先根据人口统计指标的性质(如:年龄、性别、种族等), 将总体分为不同子总体,分析每个子总体的构成要素和寻找相应指标;将 要素与指标对比,判断是否存在遗漏,并对遗漏进行修正;将修正后的子 总体相加得到总体的修正值;视修正值为真值,与普查值对比即可得出覆 盖率估计。早在1940年美国就开始人口统计学的要素法分析,并在每十年 一度实际运用中的逐步发展完善(Siegel and Zelnik,1966),成为普查 覆盖率研究的基准方法(在美国相关文献中多称为 Demographic Analysis)。
一、 子总体划分及其构成要素
子总体大多按年龄、性别、种族划分,从各国研究来看年龄、性别、 种族是构成不同生活和居住习惯的主要因素,也是社会人口研究经常的对 比项目。每个子总体都由一定要素构成,如何划分子总体由可得数据决定, 一般说来越细越好,如20岁女性白人就同时采用了年龄、性别和人种三个 5
指标。以美国 1990 年人口普查的人口统计分析为例 4F,全部人口按年龄分 为55岁以下,55-64岁人群和65岁以上三个子总体,各子总体采用不同的 要素进行估计。
5
J. Gregory Robinson; Bashir Ahmed; Prithwis Das Gupta; Ka
范文二:人口普查的意义
人口普查的意义
人口普查具有普遍性。作为全国人口普查来说,这个地域范围指的是一个国家的范围。例如,国务院发布的《第五次全国人口普查办法》中规定的地域范围是指“中华人民共和国境内”,一般在这个地域范围内常住的人,每个人都应被调查到。
人口普查登记具有个别直接性。从调查方法上来看,原则上个人的数据应当由当事人直接申报。但在实际调查中并不是每个人都能自行申报,比如婴幼儿或正值到外地出差、旅游、当时不在家的人就不能自行申报,应由每户指定一位熟悉情况的人如实代为申报。
由于出生、死亡、迁移等原因,人口数是在随时变化的,所以人口普查必须以一个特定时点为标准,全国同时进行调查。不论普查员实际入户登记时间在哪一天,都应该以标准时间为准,好比用照相机把当时的人口状况拍摄下来一样,以免重登或漏登。
此外,人口普查组织还具有一些其他特点,如具有高度集中性,人口普查必须由国家统一组织进行;具有严格统一性,全国有统一的普查方案,统一的工作步骤和进度等;具有定期性,当今世界上许多国家已规定,每隔五年或十年举行一次人口普查。
人口普查是一项重要的国情调查,对国家管理、制定各项方针政策具有重要的意义。从新中国建立后,截止到2009年,我国在1953年、 1964年、 1982年、1990年、2000年共进行了五次全国人口普查,2010年下半年开始正在进行着第六次人口普查。 编辑本段
人口普查
据有关资料记载,我国是世界上最早统计人口的国家之一。但由于历代政府调查人口都是为了征税、抽丁,因而不重视保存统计资料,直到1949年以后,我国才开展了现代含义的科学的人口普查。 历史上的户籍与人口据文献记载,公元前22世纪,大禹曾经“平水土,分九州,数万民”。所谓“数万民”就是统计人口。当时统计的数字约1355万﹔
进入封建社会以后,人口数字统计更加完整。汉朝有“算赋法”﹔隋朝有“输籍法”﹔唐代有“户籍法”﹔宋朝采用“三保法”﹔元世祖忽必烈于至元八年颁布《户口条画》,将强制为奴的人口按籍追出,编为国家民户,使人口不断增加,元顺帝初年,全国人口达到八千万左右。明朝有“户贴制度”,现存明初洪武年间的户口统计,其总数均已达到1000余万户,近6000万人口。
具有近代意义的人口普查只有两次。第一次是在1909年清朝政府为了应付资产阶级民主革命,筹备立宪事宜,下令开展全国人口普查,当时推算我国人口约3.7亿。第二次是国民党内政部举行的人口普查。
当时由于军阀混战,只调查了13个省份的人口,1931年发表的全国为47480万人口的数字,是后来估算出来的。
新中国三次人口普查为查清人口状况,新中国成立后先后于1953年、1964年和1982年进行过三次全国人口普查。三次人口普查的时间都确定为7月1日零时。
前两次人口普查,是在我国计算技术比较落后的条件下进行的,1953年的人口普查全国人口总数为58260万余人,100岁以上的有3384人,最高年龄为155岁。1964年的人口普查增加了本人成份、文化程度和职业三项。全国人口为69122万人。其中大学文化程度者287万人,高中文化程度的912万人﹔初中文化程度的3235万人,小学文化程度的19582万人。
1982年的第三次全国人口普查,调查项目共19项,增加了常住人口的户口登记状况,在业人口的行业、职业和不在业人口状况,婚姻状况以及生育子女总数、存活子女总数和生育胎次等,并首次使用电子计算机处理大量数据。截止1982年6月30日24时,全国大陆地区人口为100391万人,加上香港、澳门、台湾共计1031882501人。
随着新中国成立,人口的死亡率大幅下降,人口的生育率维持在高水平,1949年-1958年出现“第一次生育高峰”,人口净增加近1.2亿。1962-1970年,9年净增人口1.57亿,1971-1980年,全国总人口由8.52亿增加到1980年的9.87亿,净增人口1.35亿,实行计划生育政策已迫在眉睫。 同国际接轨的第四次普查1990年我国进行了第四次人口普查,这次普查与联合国关于1990年人口普查的建议相一致。
与第三次全国人口普查相比,这次人口普查的登记项目增加了“1985年7月1日常住地状况”和
“迁来本地的原因”两项,旨在查清我国人口迁移的流向和原因。同时增加了死亡人口的民族、文化程度、死亡时的婚姻状况和死者生前从事的主要职业等。
到1990年7月1日,全国总人口113051万人,9年净增人口1.27亿。
1982至1990年我国人口的文化素质发生了明显变化,1990年具有大专文化程度的人从1982年的604万人上升为1576万人,其增长率为160%﹔高中文化程度者的增长率为9%﹔初中文化程度增长率为48%﹔小学文化程度增长率为18%。文盲半文盲人口占总人口的5.88%。
据第四次全国人口普查数据显示,1985-1990年的5年间,中国人口迁移总量达3413万人,年均迁移率约为6.15﹪,其迁移规模在不同地区之间极不平衡。在迁入人口中,迁入城市的有2088.4万,迁入镇的有679.5万,迁入农村的有616.1万。大规模的农村人口向城市迁移,是经济发展的必然规律。
2000年第五次全国人口普查的对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人,包括原住本乡、镇、街道,普查时在国外工作或者学习,暂无常住户口的人。
第六次全国人口普查将于2010年11月1日零时进行。此次普查的主要目的是查清十年来我国人口在数量、结构、分布和居住环境等方面的变化情况,为实施可持续发展战略,构建社会主义和谐社会,提供科学准确的统计信息支持。 编辑本段
第五次全国人口普查公报(第1号)
地区别 人口数(万人)
北京市 1382 天津市 1001 河北省 6744 山西省 3297
内蒙古自治区 2376 辽宁省 4238 吉林省 2728 黑龙江省 3689
上海市 1674 江苏省 7438 浙江省 4677 安徽省 5986
福建省(不含金门、马祖等岛屿) 3471 江西省 4140
山东省 9079 河南省 9256 湖北省 6028 湖南省 6440
广东省 8642 广西壮族自治区 4489 海南省 787
重庆市 3090 四川省 8329 贵州省 3525 云南省 4288
西藏自治区 262 陕西省 3605 甘肃省 2562 青海省 518
宁夏回族自治区 562 新疆维吾尔自治区 1925
香港特别行政区 678 澳门特别行政区 44
台湾省和福建省的金门、马祖等岛屿 2228
中国人民解放军现役军人 250
注:
1、祖国大陆31个省、自治区、直辖市的人口,是普查登记的2000年11月1日0时的数据(包括外来人口,不包括外出人口)。
2、各省、自治区、直辖市和中国人民解放军现役军人的人口合计与祖国大陆总人口之差,为常住地待定的人口。
3、香港特别行政区的人口数为香港特别行政区政府提供的2000年6月30日的数据。
4、澳门特别行政区的人口数为澳门特别行政区政府提供的2000年9月30日的数据。
5、台湾省和福建省的金门、马祖等岛屿的人口数是由台湾当局公布的2000年12月的数据。 第五次全国人口普查公报(第2号)
根据国务院的决定,我国于2000年11月1 日进行了第五次全国人口普查的登记工作。在国务院和地方各级人民政府的统一领导和全国各族人民的支持配合下,通过近千万普查工作人员艰苦努力,又经过事后质量抽查,圆满完成了人口普查的现场登记和复查任务。目前,普查的全部资料正在用电子计算机进行数据处理。主要数据的快速汇总工作已经结束,现公布如下:
总人口
全国总人口为129533万人。其中:
祖国大陆31个省、自治区、直辖市(不包括福建省的金门、马祖等岛屿,下同)和现役军人的人口共126583万人。
香港特别行政区人口为678万人。
澳门特别行政区人口为44万人。
台湾省和福建省的金门、马祖等岛屿人口为2228万人。
人口增长
祖国大陆31个省、自治区、直辖市和现役军人的人口,同第四次全国人口普查1990年7月1日0时的113368万人相比,十年零四个月共增加了13215万人,增长11.66%。平均每年增加1279万人,年平均增长率为1.07%。
家庭户人口
祖国大陆31个省、自治区、直辖市共有家庭户34837万户,家庭户人口为119839万人,平均每个家庭户的人口为3.44人,比1990年第四次全国人口普查的3.96人减少了0.52人。
总人口性别构成
祖国大陆31个省、自治区、直辖市和现役军人的人口中,男性为65355万人,占总人口的51.63%;女性为61228万人,占总人口的48.37%。性别比(以女性为100,男性对女性的比例)为106.74。 年龄构成
祖国大陆31个省、自治区、直辖市和现役军人的人口中,0-14岁的人口为28979万人,占总人口的22.89%;15-64岁的人口为88793万人,占总人口的70.15%;65岁及以上的人口为8811万人,占总人口的6.96%。同1990年第四次全国人口普查相比,0-14岁人口的比重下降了4.80个百分点,65岁及以上人口的比重上升了1.39 个百分点。
民族构成
祖国大陆31个省、自治区、直辖市和现役军人的人口中,汉族人口为115940万人,占总人口的91.59%;各少数民族人口为10643万人,占总人口的8.41%。同1990年第四次全国人口普查相比,汉族人口增加了11692万人,增长了11.22%;各少数民族人口增加了1523万人,增长了16.70%。 各种受教育程度人口
祖国大陆31个省、自治区、直辖市和现役军人的人口中,接受大学(指大专以上)教育的4571万人;接受高中(含中专)教育的14109万人;接受初中教育的42989万人;接受小学教育的45191万人(以上各种受教育程度的人包括各类学校的毕业生、肄业生和在校生)。
人口普查,利国利民
同1990年第四次全国人口普查相比,每10万人中拥有各种受教育程度的人数有如下变化:具有大学程度的由1422人上升为 3611人;具有高中程度的由8039人上升为11146人;具有初中程度的由23344人上升为33961人;具有小学程度的由37057人下降为35701人。
祖国大陆31个省、自治区、直辖市和现役军人的人口中,文盲人口(15岁及15岁以上不识字或识字很少的人)为8507万人,同1990年第四次全国人口普查相比,文盲率由15.88%下降为6.72%,下降了9.16个百分点。
城乡人口
祖国大陆31个省、自治区、直辖市的人口中,居住在城镇的人口45594万人,占总人口的36.09%;居住在乡村的人口80739万人,占总人口的63.91%。同1990年第四次全国人口普查相比,城镇人口占总人口的比重上升了9.86个百分点。
注:1、本公报为初步汇总数。
2、普查登记以2000年11月1日0时(北京时间)为标准时间,普查登记的对象是具有中华人民共和国国籍并在中华人民共和国境内大陆上常住的人。
3、普查登记结束后,全国统一抽取602个调查小区进行了登记质量的抽样调查。抽查结果,人口漏登率为1.81%。祖国大陆31个省、自治区、直辖市的总人口中已包括据此计算的漏登人口。
4、香港特别行政区的人口数为香港特别行政区政府提供的2000年6月30日的数据。
5、澳门特别行政区的人口数为澳门特别行政区政府提供的2000年9月30日的数据。
6、台湾省和福建省的金门、马祖等岛屿的人口数是由台湾当局公布的2000年12月的数据。
7、家庭户人口不包括现役军人,也不包括相互之间没有家庭成员关系、集体居住的人。
8、城乡人口是按国家统计局1999年发布的《关于统计上划分城乡的规定(试行)》计算的。 编辑本段
第六次全国人口普查
简介
经国务院批准,第六次全国人口普查将于2010年11月1日零时进行。此次普查的主要目的是查清十年来我国人口在数量、结构、分布和居住环境等方面的变化情况,为实施可持续发展战略,构建社会主义和谐社会,提供科学准确的统计信息支持。人口普查主要调查人口和住户的基本情况,内容包括:性别、年龄、民族、受教育程度、行业、职业、迁移流动、社会保障、婚姻生育、死亡、住房情况等。
在市人口普查办召开的中外记者新闻发布会上,北京市第六次人口普查领导小组办公室副主任顾兖州介绍,人口普查就是“画地图、查房子、数人头”。画地图就是把北京市行政区域划分8万多块后,把调查员分到各块,分块负责。查房子,就是要查清8万多块内的所有建筑物。最后一项就是根据房子入户调查。
与以往不太相同的是,今年人口普查之前,将先查清北京280万到300万栋房屋的详细情况,包括房屋的建造年代,建筑结构是钢混、钢架还是砖木的。普查结果将报市住建委,住建委依据这些指标为房屋定级,然后根据相关级别,分批进行抗震加固。
此次人口普查还首次将我国境内的境外人员作为普查对象。将居住在本国的外国人纳入人口普查,这是各国人口普查的通常做法,也是联合国的建议。增加外籍人口为普查对象,也是为了更加合理地安排有外籍人口居住地区的教育、住房、医疗以及公共设施的建设。
顾兖州介绍,在以往的人口普查中,最难的就是过去一年的出生人数和死亡人数。因为,很多出生的婴儿不上户口,很多死亡的人也不销户口。新出生婴儿不上户口的主要原因是二胎、三胎,怕上户口会被罚。统计部门从计生单位获得的数据显示,2009年北京市不上户口的新生儿大约有四五千人,但实际的数据可能会达到七八千人。而死亡人口不销户也多与利益相关,有的是为了领取相关的补贴,有的是因为财产没有分清。
而根据以往的经验,入户调查将遇到三大难点。一是高档小区难入户,二是外来人口居住区,三是大机关单位集中区。顾兖州说,市统计局将拟定一份保密协议书,所有调查员人手一份,将与住户居民签订保密协议,对被调查对象的信息严格保密。[1]
普查方案
2010年06月24日,国家统计局、国务院第六次全国人口普查领导小组办公室颁布了《第六次全国人口普查方案》。
普查原则
人口普查采用按现住地登记的原则,每个人必须在现住地进行登记;普查对象不在户口登记地居住的,户口登记地要登记相应信息。登记的主要内容包括:姓名、性别、年龄、民族、国籍、受教育程度、行业、职业、迁移流动、社会保障、婚姻、生育、死亡、住房情况等。
方案要求
人口普查的登记工作从2010年11月1日开始到11月10日结束,采用普查员入户查点询问、当场填报的方式进行。申报人应如实回答普查员的询问,不得谎报、瞒报、拒报。人口普查对象提供的资料,应当依法予以保密。
根据方案,登记结束后,应当组织全面复查,复查工作应于2010年11月15日前完成。复查工作完成后,统一组织事后质量抽查,抽查工作应于2010年11月底前完成。
于2011年12月31日前完成人口普查全部数据的汇总工作。人口普查数据处理工作结束后,原始普查表按规定销毁。各级人口普查机构应做好人口普查资料的开发和应用,为社会公众提供查询、咨询等服务。
中国的人口普查每十年进行一次,第六次全国人口普查的标准时点是2010年11月1日零时,目的是查清2000年以来中国人口数量、结构、分布和居住环境等方面的变化情况。[3]
2000年进行的第五次人口普查,经测算,中央财政投入了5.5亿元,加上地方政府的投入,总量超过50亿元。
据悉,今年进行的第六次人口普查,中央财政为此投入近7亿元,如果依照第五次人口普查中央财政投入占比全国各级政府投入的1/10计算,今年全国各地投入或将达到70亿元,再加上中央投入的近7亿元,全国财政投入或将达到80亿元。
除巨额的财政投入外,据了解,本次人口普查从2007年底进行“人户分离”试点开始历时3年,有600多万名普查指导员和普查员。
第六次全国人口普查首次明确,将我国境内的境外人员也作为普查对象。据冯乃林介绍,目前,在境内长期居住的境外人员包括港澳台人士比较多,及时了解这部分人的情况,为其提供相应服务并进行管理,很有必要。
此外,联合国希望所有国家都在2005年到2014年进行一次人口普查。据联合国公布的信息,世界上大概有一百二三十个国家,集中在2010、2011年进行人口普查。“我们也是响应联合国的建议。其实绝大多数发达国家,一直都把境外人员作为普查对象。”
人口普查 人口普查作为各国政府各个时期获取人口资料、掌握国情国力的一种最基本的调查方法,已经有几千年的历史,而真正现代意义的人口普查只有两百来年的历史。从世界范围来看,早在公元前4500年,巴比伦王国就举办了全国性调查,按族登记人口。美国1790年进行了第一次人口普查,这是世界上第一次现代人口普查,当时的调查项目只有4个。到20世纪下半叶开始,人口普查基本上覆盖了全世界人口,各国的人口普查在时间、内容、方法上也逐渐趋向一致,使人口普查更具有可比性。 从历史上来看,中国是世界上最早进行人口统计的国家之一,同时也是在世界历史悠久的各国中唯一有长期不间断人口资料记录的国家。中国最早的人口调查目前国现存的最早的人口统计数字是记载在西晋皇甫谧《帝王世纪》书中,数字引自《禹贡》所记载的公元前2200年左右的夏禹时代,“禹平水土,还为九州”,九州之地的人口为13553923人。由于历史久远,大禹时代不可能有统一的、全国性的人口调查,所载数据也不可能是全面调查数据。所以也只能属于对部分人口的调查。 能够发现的中国首次人口调查则始于周宣王39年,即公元前789年,是当时的太原(现在的甘肃镇原、固原和环县一带)进行的规模较大的人口调查。《周礼》一书记载了周代的人口调查制度和体制。整个制度极为缜密:天官冢宰、地官司徒,秋官司寇、夏官司马。潘光旦先生曾对此进行分析整理,绘制出周礼中人口调查制度表。在周代不仅人口调查制度比较完善,人口调查的内容也是相当完整和丰富的,在很多具体项目上与现代人口普查极为相似。
据《后汉书》记载,早在公元前2200年,大禹曾经“平水土,分九州,数万民”。所谓“数万民”就是统计人口。中国历史上第一次完整地记载中国各州、郡的户数和人口,是在公元2年(西汉平帝元始2年),据《汉书〃地理志》记载,当时有1223.3万户,5959.4万人。以后各朝代都建立登记每户人口的表册,当然当时的人口统计与近代的人口普查是有很大距离的。辛亥革命推翻了清王朝的封建统治,建立了中华民国,在少数省的某些县份先后进行过试验性的人口普查。 现代人口普查
现代人口普查迄今已有200年的历史。一般认为,现代意义上的人口普查是从美国1790年人口普查开始的。美国是世界上最早定期进行人口普查、公布普查结果并把人口普查作为一项条款写进宪法的。紧接着美国之后,英国和法国于1801年进行了人口普查,它们同美国一样,也是每隔10年或5年举行一次人口普查,除个别战争年代外,一直坚持定期人口普查的制度。
现代人口普查的历史大体可分为3个时期:①1790~1870年,正值资本主义进一步发展,资产阶级出于制定法律或掠夺殖民地的需要,一些资本主义国家力图确定本国及其殖民地的潜在资源包括劳动力资源。这个时期,先后有美、英、法等国进行了人口普查,普查范围占世界人口的20%。②1871~1950年,帝国主义重新划分殖民地和势力范围的斗争,引起了考察新领土劳动潜力的兴趣,如埃及、印度作为英国殖民地在此期间进行了人口普查。十月革命后,苏联于1920年进行了人口普查,使全世界人口普查的范围增加到占总人口的76%。③从1950年到现在,通称战后人口普查。这一时期,由于许多国家摆脱了殖民统治,获得独立,纷纷进行新的人口普查,为国家建设提供人口资料。最引人瞩目的是中国1953年举行的第一次人口普查,使全世界进行过普查的人口增加为占世界人口的98%。战后人口普查的显著特点,一是普查项目普遍增多;二是使用电子计算机汇总人口普查资料日益普遍,有利于人口普查资料的开发和利用。
新中国成立后,相继进行过四次中国性的人口普查。1953年以7月1日零时为人口调查的标准时间进行了第一次人口普查,调查项目包括本户地址、姓名、性别、年龄、民族、与户主关系等6项,在新中国历史上第一次查清了中国人口底数。第二次人口普查以1964年7月1日零时为人口调查标准时间,增加了本人成分、文化程度、职业3个调查项目。1982年以7月1日零时为标准时间进行了第三次人口普查,调查项目增加到19项,还第一次使用电子计算机进行数据处理。最近的第四次人口普查以1990年7月1日零时为标准时间进行,登记的项目共21项,是以往历次人口普查调查项目最多的一次。与前三次人口普查采取的设立普查登记站的办法相比,这次人口普查改为主要采取普查员入户点查询问、当场填报的方式进行。国务院决定2000年11月1日进行第五次中国人口普查,普查项目增加到49项,并首次采用光电录入技术,将为中国经济社会进一步发展提供重要的人口依据。
范文三:人口普查的意义
人口普查的意义
人口普查登记自然特征比如说年龄、性别、民族、家庭、生育、死亡等等,另外还有社会特征,比如人的迁移、分布、文化特征、教育特征、宗教等等。另外就是经济特征,包括就业状况、职业、行业。这次人口普查是进入新世纪的第一次,与十年前相比,我国流动人口激增,人户分离现象比较严重,这给庞杂的人口普查工作带来重重困难。
进行人口普查是制定政策的需要。人口普查是国家科学决策的重要基础工作,人口普查资料是制定人口政策的依据和前提。通过人口普查,了解我国各种文化程度人口的比重,就可以制定教育政策;了解各行业人口的分布,可以制定人口的就业政策;摸清就业人口的行业分布,可以为产业政策的制定和调整提供科学基础。此外,社会保障和福利政策、民族政策、老年人口政策等等,都需要根据人口资料进行研究。可见,人口普查是国家制定社会、经济、科教等各项发展政策所必需的。没有准确的人口数据,我们很多方针、政策及发展战略的制定,就缺乏足够的科学依据。
人口普查是国家的一项重要的政治活动,每个人都有责任配合普查员搞好人口普查登记工作
范文四:美国的人口普查
美国宪法规定,每隔10年对美国人口进行一次全面统计,以确保国人在国会中得到公平代表。2010年4月至7月,美国迎来了建国以来的第23次人口普查。从3月份起,美国国内每一住户都陆续收到了一份由美国商务部人口普查局寄出的简短人口普查表。 美国人口普查表上只有10个问题,主要涉及4月1日当天有多少人居住在表格所述地址的房中,他们的姓名、性别、出生年月、电话及族裔等问题。 人口普查对美国民众而言具有重要意义:联邦政府将根据普查数据确定每年逾4000亿美元的公共经费将如何分配;州政府、地方政府则根据人口普查信息为众多项目作规划并划拨资金,确定警察和消防部门的地点;社区机构则依据人口普查信息来制定社会服务计划、社区活动项目等。此外,人口普查也会对美国的政治版图产生较大影响。正因为如此,美国商务部人口普查局进行了大量细致入微的准备工作,以期获得尽可能详细、准确的美国人口数据。 准备充分 美国人口普查局自2008年秋季就开始招聘人口普查初期的工作人员。2009年春季,普查工作人员开始更新全国范围内的地址列表。2009年秋季开始招聘人口普查工作量高峰期所需的普查员。人口普查员一般是居民所在社区的人员,大部分为临时雇用,这在短期也提高了美国的非农就业人口数量。 为增加民众对普查的认识,在正式普查开始前及持续期间,美国人口普查局耗资14亿多美元,在报纸、广播、电视以及网络上投放了大量广告,并制作了手册传单、纪念品手提袋等,还派员工到各种集会上去摆摊宣传。据报道,此次普查成为美国历史上最昂贵的一次普查,仅是针对一些历来对普查不够重视的少数族裔地区展开宣传就花费两到三亿美元。 此外,今年1月至4月,美国人口普查局还出动了13辆人口普查宣传车,分头在全美进行旅行宣传活动,让更多人了解参与普查给自己和社区带来的益处。其中的“全国车”(National Vehicle)旅行全国各地,另外12辆车重点覆盖人口普查局划分的12个地区,深入当地社区。各辆车的命名各有意义,例如“全国车”命名为“请寄回”,提醒民众把填好的普查问卷及时寄回;洛杉矶地区普查车命名为“保密”,强调参加普查的安全性;亚特兰大地区普查车命名为“代表”,表示参加普查是支持民主、保证每人都能被代表的重要途径;达拉斯地区普查车命名为“十”,意指此次普查问卷是历来最简单的,只有10个问题,约需十分钟便可完成。 覆盖全面 美国宪法规定,人口普查统计的是“居民人口”,而不只是美国公民。只要是住在美国的居民,不管身份如何,哪怕是来美国访亲探友的,只要超过半年,都被要求完成表格并放入邮资已付的信封寄回。唯一例外是外国驻美大使及使馆内的工作人员。 人口普查局负责普查项目的助理局长丹尼尔?温伯格说,所有居民,无论其身份如何,都包括在人口统计中,“每个人都必须被计算在内”。从4月下旬开始,人口普查局派出大约70万名人口普查员到未交普查表的人家登门拜访,以确保这些人被统计在内。 人口普查局会采取特殊措施来统计没有固定地址或居住在郊外住宅区、疗养院、监狱、收容所、拖车场、临时房屋以及其他聚居地或非标准住宅内的人员。有些工作人员会在晚间工作,前往无家可归者可能聚集的地方进行统计。 为确保偏远地区居民的人口普查信息准确无误,人口普查局还特别制定了一些调查程序。例如,在遥远的阿拉斯加,人口普查必须在春天冰雪消融之前完成。冰雪消融之后,很多居民都会离家狩猎或开展其他春日活动。届时,统计人员也就无法与其取得联系了。此外,人口普查局还与美国国防部及美国海岸警卫队进行合作,对军事基地和舰艇上的生活区进行调查。所有的远洋船只、近海船只和五大湖船只都要参与被称为“人口普查海员点查”的活动。人口普查局的计划还涵盖了驻扎在海外的军事人员、联邦政府雇员及其随从人员。 细致入微 为了提高应答率,美国人口普查局采取了多种体贴入微的便民措施。首先,普查表设计的问题非常少,只有10个问题,有媒体称之为“史上最简短的人口普查表”。 普查表使用6种语言,另外还提供60种语言的协助。温伯格表示,“与英语不是第一语言的人取得联系是一个挑战。但不论多困难,我们都要努力去联系所有人。” 此外,人口普查局表示将尽全力保护调查问卷应答者的身份,搜集和整理信息的普查局工作人员“庄严宣誓为这些信息保密”,“即使是美国《爱国者法》也不能推翻这些保护”。 不过,尽管如此,许多没有合法证件而居住在美国的移民还是害怕同联邦当局打交道。为解决这类问题,美国人口普查局一方面努力通过广告,与社会活动人士、少数族裔教会领袖以及其他得到移民信任的各方合作,与不愿意接受普查的人取得联系;另一方面派出数十万普查员深入社区逐门逐户访问,以查漏补缺。 这些普查员由人口普查局各地的办公室临时雇用。由于美国失业率居高不下,此类临时岗位颇为吃香,申请者众多。美国人口普查局依据申请者能否在社区工作及每周能工作多长时间、测试分数、语言技巧、是否有相关经验等因素确定雇佣哪些人。此外,普查员还需要通过美国联邦调查局的背景审查,包括针对犯罪纪录的指纹审查。其中,指纹识别是2010年人口普查员录用的新要求。 不过,普查员登门拜访有时也会吃闭门羹。许多单门独户的美国家庭都在院门口插着“非请莫入”的牌子。美国法律虽然授予人口普查员访问权利,但仍有不少住户表示不解甚至电话报警。遇到这种情况,普查员恐怕也只能望屋兴叹。 目前,美国今年的人口普查活动已进入对数据进行汇总分析阶段,人口普查局将在12月31日前将人口数据递交给美国总统。2011年3月,人口普查局将向各州提供更详细的数据,用于美国及各州立法区的重新划分。(摘自2010年第16期《环球》)?□
范文五:人口普查的论文
人口普查事后质量抽查的有关问题:国外经验及借鉴 时间:2010-04-21 作者:zzq8050 年级班别:09服装设计与工程(2)班 摘 要:事后质量抽查是对人口普查登记质量进行检验和评估的调查方法。文章通过对美国、英国和印度等国家的事后质量抽查经验进行总结,对我国今后人口普查事后质量抽查提出了建议。
关键词:人口普查;事后质量抽查;数据质量
Abstract:Post enumeration survey is one of the effective approaches to examine and evaluate the quality ofcensus registration.Based on the experience ofpostenumeration survey from theU. S., U.K. and India, this paperproposes some suggestions forChina2010 census.
Key words:census; post enumeration survey; data quality
我国政府统计数据质量已成为近年来国内外社会各界关注的问题之一。今年我国将进行第六次人口普查,人口普查的数据质量再次受到人们普遍的关注。目前,评价人口普查数据质量常用的方法之一是事后质量抽查。我国于1982年在人口普查中首次采用抽样调查的方法来评价人口普查的登记质量,在历年的人口变动情况抽样调查中仍采取事后质量抽样调查作为评价全国人口抽样调查数据质量的方法之一[1]。
美国、英国等发达国家几十年来对事后质量抽查进行了长期的讨论,积累了丰富的理论和实践经验。对这些国家人口普查事后质量抽查进行经验总结,将有助于我国人口普查及事后质量抽查工作的改进与完善,有助于改善我国政府统计数据质量,为日后普查方案的修订提供依据。
美国和英国在人口普查事后质量抽查方面起步较早,而印度作为世界上的人口大国之一,与我国国情具有诸多相似之处,因此,本文选取这三个国家与中国进行比较分析。 一、抽样设计比较
(一) 美国抽样设计
美国在每十年一次的人口普查中估计人口覆盖率历史较长,正式测算始于1940年的人口普查。1980年开始结合双系统估计方法采用事后质量抽查测算人口普查的覆盖率。2000年美国的人口普查事后质量抽查称为“准确性与覆盖度评估”(Accuracy and Coverage Evaluation,以下简称为ACE),采用三阶段分层整群抽样设计。
2000年人口普查中,美国共划分了3767000个街区群,美国联邦人口普查局根据估计精度和事后抽查目的确定全国样本量。第一阶段,ACE调查首先将所有街区群按居住单位数量和是否美国印第安人居住分为小型街区层(每个街区群0-2个居住单位),中型街区层(每个街区
群3-79个居住单位),大型街区层(每个街区群80个以上居住单位)和美国印第安人居住层[2]。再按人口比例分配各街区样本量,在各层内等距抽取街区群样本。
该阶段样本抽取出来以后,还需进行居住单元比较和目标延伸搜索,以弥补调查目录的不足。对每一个街区群样本进行现场调查,编制每个街区群内的居住单位地址目录,称为ACE独立(居住单位)地址目录。对每个入选的街区群样本,将该街区群的ACE独立(居住单位)地址目录与该街区群的“最新普查(居住单位)地址目录”进行对比,确定是否需要进行目标延伸搜索,完善调查目录。如果这两份目录的居住单元一致,则无需进行目标延伸搜索。而如果两份目录不一致,则按照不一致单元的数量进行排序,等距抽取其中一部分进行目标延伸搜索,即对划分区域内除调查目录外的其他建筑和场所进行居住单元地搜索与登记,对登记错误的居住单元进行改正,对遗漏的进行补充。
第二阶段对抽取的第一阶段样本街区群分子层基础上,采用第一阶段抽取街区群的相同方法从这些划分子层中分别抽取调查小区样本,目的是为了缩小最终抽取调查小区样本的数量,提高样本的代表性。
第三阶段抽取住户单位,对第二阶段抽出的包含79个住户单位以下的调查小区内的住户全部进行调查,而包含80个住户单位以上的调查小区则被再分成街区片(由若干住户单位组成),采用系统抽样抽取一定比例的街区片住户单位。
对抽取的样本住户内的个人采用年龄、性别、种族、房屋所有权期限、地区、城市类别、邮寄回答率等进行事后分层[3]。在每个事后层内构造双系统估计量估计该层的人口数,再通过汇总得到全国人口数。最终计算得到人口普查净遗漏率为1. 16%。
2010年美国将进行第23次人口普查,并制定了事后质量抽查初始方案,称为普查覆盖度测量(CensusCoverageMeasuremen,t简称CCM),其抽样设计与2000年相同。
(二)英国抽样设计
英国自1961年开始在人口普查后进行普查日外出人口10%调查、事后调查估计覆盖和回答误差等。
2001年人口普查事后抽查称为普查覆盖度调查(CensusCoverage Survey,以下简称CCS),采用两阶段分层不等概率抽样设计。
为选择有效样本,能对所有地方行政区按年龄和性别估计普查日人口数,调查首先将英国相邻的地方行政区重新归类,形成112个“设计区”。每个设计区包含大约500000人,由若干邮政编码区域组成。由于各区域的漏报率水平不一致,为提高估计精度,根据1991年普查中影响漏报率的相关变量构造“普查难度指数(Had to Count Index)”[4],将每个设计区划分为简单、中等、困难三类调查区,再从每一类调查区内抽取调查区,即为第一阶段样本。
第二阶段采用简单随机抽样从每一调查区内抽取一定数量的邮政编码(每个邮政编码对应多个住户),这些邮政编码对应的住户构成最终样本单元。最后将CCS最终样本按年龄性别
交叉分为37组,经过CCS与普查记录进行匹配,构造双系统估计量来推断总人口数。推估得到2001年人口普查净遗漏率为6.1%。
为准备2011年的人口普查事后质量抽查,英国于2009年11月23日至12月17日进行了预调查。2011年的CCS在1991年的基础上做了一些改进,如划分设计区时不仅考虑地理位置因素,还综合考虑区域类型等其它因素;对重复率和漏登率分别进行估计等。
(三)印度抽样设计
印度于1872年首次进行人口普查,从1951年人口普查起开展事后质量抽查。2001年人口普查事后质量抽查(PostEnumeration Survey,以下简称PES),主要目的是计算覆盖误差(Coverage Error),采取两阶段分层系统抽样设计。
调查首先根据1991年的遗漏率和相对百分误差确定2001年PES的样本量。再考虑区域的离散性,数据分析的可靠性及非抽样误差的控制等因素,在国家的层面上抽取3000个街区。同时由1991年的调查发现,在区域范围内更能精确合理地估计相对标准百分比误差。因此,将全国所有的邦分成六个区:南区、东区、东北区、北区、西区、中区,分别在全国和区域的层面上进行估计。
根据1991年人口普查结果预先推算2001年各邦人口数,再按与这个人口规模数成比例分配街区到各个邦。在每个邦内,先将该邦所有的街区按照位置代码排序,采取系统抽样抽取街区,最终抽取的3000个街区用来估计覆盖误差。再从这3000个街区中按照系统抽样抽出600个街区,用来估计普查登记内容误差。对被选中街区的所有住户都进行调查。
对最终抽取的样本按年龄、性别、城乡和区域进行事后分层,构造双系统估计量估计特定属性人口的普查覆盖率和人口数。2001年印度PES显示全国范围内总的净遗漏率为2. 3%,其中:城市比农村遗漏的更多,前者净遗漏率为4%,后者净遗漏率为1. 7%。
2011年印度将进行第十五次全国人口普查,这次普查的准备工作已经于2010年4月1日正式启动。
(四)中国抽样设计
2000年我国人口普查事后质量抽查采取分层随机等距整群抽样设计,采用人口普查地址码库作为调查目录。事后质量抽样调查目的是只评价全国人口普查登记的质量,并不评价省级及省级以下各级的登记质量,也不评价抽中调查小区的登记质量。
首先根据1999年年末人口数据将我国31个省市按总人口规模划分为四层,各省再按城乡分层,在层内随机等距整群抽取调查小区(根据《第五次全国人口普查办法》,人口普查登记和资料汇总按照划分的普查区域进行。农村以村民委员会所辖地域为基础,城镇以居民委员会所辖地域为基础划分普查区。每个普查区,按照一个普查员所能承担的工作量,划分成若干个调查小区,涵盖调查小区的
所有住户,不重不漏。)。5000万人以上的省份抽取30个调查小区, 2600—5000万人的省份
抽取20个调查小区, 2600万人以下的省份抽取10个调查小区,西藏由于地广人疏的特殊地理条件单独划分为一层,抽取2个调查小区。对居住在入选调查小区的人全部进行调查。全国共抽取602个调查小区,调查了162940人,抽样比为0. 13‰。
事后质量抽查的对象包括普查时应在该调查小区登记的常住人口和普查登记时不属于本调查小区的常住人口(即暂住人口)。对常住人口,先与该小区原普查表结果进行逐项比对得到两次调查不一致的地方;对接受过调查的暂住人口,汇总至省级普查机构与其原登记地进行联系比较,得到暂住人口在普查登记中的重登和漏登情况。通过两类人的比对,计算普查的遗漏率、重登率、性别差异率和年龄差错率。采用双系统估计方法估计调查遗漏人口,最终计算得出2000年人口普查净遗漏率为1. 81%。
二、抽样设计特点比较通过上述四个国家人口普查事后质量抽查抽样设计的比较
可以发现:1.从净遗漏率的角度看,这四个国家中美国人口普查登记的误差最小,而英国误差最大。国际上人口统计的基本共识是,普查登记的误差在2%以下是正常的, 2% ~5%是可以接受的,如果超过5%,则资料的使用价值就要大大降低[1]。即是说,美国和中国人口普查净遗漏率均低于2%,人口普查数字的质量是较好的,印度人口普查数字的质量可以接受,而英国人口普查资料的使用价值则要低。
2.从样本量的确定方式来看,美国、英国和印度均采用基于全国的设计来确定抽取的样本量,其中美国根据抽样估计的精度确定事后抽查的样本量,印度根据上次普查的遗漏率和相对百分误差确定样本量。
根据人口规模分配调查区样本时,美国根据各州的上次普查的人口数确定样本量分配,印度根据上次普查预测本次普查的人口规模确定各邦的样本分配。
3.从调查方式看,各国都采用多阶段分层抽样设计以提高抽样的代表性。美国和英国都在第一阶抽样基础上,通过相关特征标志对第一阶段样本进行分层,再抽取第二阶段样本,目的是为了进一步提高抽查样本对不同特征层人群普查遗漏率的代表性。而印度则是根据地理位置来进行分层,以更精确地在国家和区域层面上估计相对标准百分比误差。中国则是根据自身国情选择城乡作为分层依据来确定各省应调查的普查小区数。此外,在最终入选的街区内对全部住户都进行事后质量抽查。
4.从推估人口普查净遗漏率的方法来看,四个国家都使用双系统技术进行估计。即通过全国普查人口数与事后质量抽查得到的全国人口数进行比较,构建双系统估计来最终估计全国的真实人口数。而事后质量抽查由P样本和E样本组成,P样本由抽中样本街区群在事后调查中和普查中同时被登记的人组成,E样本由P样本对应街区群在人口普查中所有被登记的那些人构成,通过两个样本的匹配,在每一事后层内构造双系统估计量。
三、对中国人口普查事后质量抽查的建议人口普查事后质量抽查对于提高我国普查和人口变动抽样调查数据质量具有重要的意义
根据上述美、英、印和中四个国家2000年的经验做法,对我国今后人口普查事后质量抽查提出以下建议:(一)进一步细化事后质量抽查目标,计算不同子总体遗漏率目前我国事后质量抽查方案主要是从全国层面上估计和调整数据,而在省一级的层面上调查值与调整值之间的差值难以解释,某些地域、民族等子总体的普查遗漏率可能会高于其他子总体。同时普查覆盖率越接近100%,提高每个百分点的精度所需调查费用就越高,而如某些子总体在普查中遗漏率较高,其在事后调查中的入样概率仍会比其他子总体要低。因此,如果将事后调查目标进一步细化至子总体,即将事后调查估计目标细化到估计各省的登记质量,不仅可以提高投入的人、财、物的使用效率,还可以提高事后质量抽查的估计精度,为以后的人口普查和人口变动抽样调查提供原始珍贵的资料。
(二)选取合适的分层指标提高样本代表性及估计精度2000年我国人口普查事后质量抽查样本时在各省按城乡标志将调查小区分为城市层和乡村层,再在每层等距抽取调查小区样本。分层过于简单,抽取的样本代表性不足。英国借助1991年普查信息构造普查难度指数来进行分层提高设计效率,印度则是由1991年的普查将全国所有的邦根据地理区域分层来提高估计效率。借鉴上述国家经验并结合我国国情,可综合考虑以下分层指标: (1)人口流动程度。近年来随着我国经济社会的发展,人口流动越来越频繁,人户分离现象比较普遍,势必会给人口普查带来相当大的困难,如难以入户登记,多次上门找不见人等,导致普查遗漏率上升。一些省份人口流入较多,如广东省和福建省,而另一些省份则流出人口较多,如四川省和贵州省,人口流动程度相近的省份会呈现出相似的特征。
因此,有必要将人口流动程度作为一个分层指标,按照人口净流出、净流入程度将全国划分为不同层。(2)地域特征。可按照我国大陆划分的地理区域(东北、华北、华东、华南、华中、西南和西北)划分为七层,或按照国家统计局根据我国经济特征划分的东部、中部、西部和东北地区四层。
(三)根据我国人口特点选择相应标志对抽取的样本人口进行事后分层,使得层内个体被登记概率相同使用双系统估计需要满足的前提假设之一是每个人有相同的概率进入普查样本和事后抽查样本,对调查样本进行事后分层则能较好解决这个问题。美国、英国和印度都对最终样本分别按年龄、性别等标志进行了事后分层,而我国在未对抽取的调查小区样本进行事后分层就直接使用双系统估计方法,有悖于该假设条件。因此,对照我国事后质量抽查表与人口普查表,结合我国人口自身特点,可以选择性别、年龄、民族、城乡、城市化程度和省份区域等作为事后分层标志,进行事后交叉分层,并分别在事后层内构造双系统估计量,从而满足不同属性人口的估计要求。
(四)确定恰当的事后质量抽查时间并选择合适的调查人员,以保证事后质量抽查与人口普查之间的独立性使用双系统估计需要满足的另外一个前提假设是事后质量抽查与普查之间相互独立,要实现这一目的可以从时间和调查人员上分别考虑。(1)调查时间上,目前我国事后质量抽查在人口普查结束后的半个月后进行,既能保证调查员及被调查者对普查内容记忆的
流畅性,又能减轻人口流动对普查质量造成的影响。而英国和印度事后质量抽查则是在普查后的1-2个月内进行,来保证事后质量抽查不受前期普查的影响。但这个时间点对于我国这样一个人口大国且人口流动性较强的国家并不适用,因此,我国事后质量抽查的时间上仍可以保持不变。(2)调查人员上,事后质量抽查人员与普查人员独立。从人员、经费等角度考虑,结合我国具体实践操作经验,可选取人口普查中的优秀普查员去不同于其普查期间所在的调查小区参加事后质量抽查。对于部分特殊地区如少数民族聚居地,还可以根据当地文化、语言条件另外选择合适的调查人员。
参考文献:
[1]武洁.人口普查中的事后质量抽样调查[J].南方人口, 2002(3): 18-24.
[2]胡桂华.美国2010年人口普查的事后质量检查介绍[J].中国统计, 2009(8): 47-49.
[3]胡桂华.使用双记录系统技术估计全国真实人口数[J].统计与决策, 2008(9): 31-34.
[4]OWEN ABBOTT. 2011 Census CoverageAssessment and AdjustmentStrategy[J]. Population Trends, 2007(127): 7-13.
转载请注明出处范文大全网 » 人口普查覆盖率的评价及修正方