1、中国微观数据库目 录目录(一)UHS (Urban Household Survey) (暂未收录数据)1(二)CHIP (Chinese Household Income Project Survey)(查看数据)1(三)Census (暂未收录数据)1(四)CHNS (China Health and Nutrition Survey)(查看数据)3(五)RHS (Rural Household Survey)(暂未收录数据)1(六)中国老年健康调查项目(查看数据)4(七)CHARLS(China Health and Retirement Longitudinal Study)(查看数据
2、)4(八)其它的数据(查看数据)(查看数据)5(一)UHS (Urban Household Survey) (查看数据)简介:中国城镇住户调查数据。它是国家统计局城调总队负责调查的。现在可以拿到1986年至2006年的数据。如果可能的话,我们可以拿到全部省份的数据,但现在大家使用的是六个省份的数据(北京、广东、浙江、辽宁、陕西、四川)。每年大约有3500-4000户的数据。(内附1992年调查问卷)包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、文化程度、行业、职业、就业状况、工资、总收入、工作小时数、参加工作年份、退休金、财产性收入。(2)家庭层次上的变量。家庭总收入、家庭人口数
3、、居住面积、房间个数、家庭财产、现金支出、现金流入、储蓄、借款、家庭消费。可做的研究:(1)教育回报率问题。(2)收入不平等问题。(3)劳动力供给问题。家庭财产、孩子(老人)、退休金。(4)行业的分布及变化。(5)职业的分布及变化。人力资源管理。(6)就业问题。失业率和劳动参与率。(7)教育决定因素及教育不平等问题。(8)社会保障方面的研究(退休金)。(9)财产性收入研究。(10)房地产需求问题。它与人口结构的关系。(11)非正规金融问题(借款)。(12)家庭消费的决定因素及模式变化。(二)CHIP (Chinese Household Income Project Survey)(查看数据)
4、简介:中国家庭收入项目调查。它是由国家统计局农调总队和中国社会科学院经济研究所共同开展此项专门调查。调查内容主要包括:收入、消费、就业、生产等有关方面的情况。现在做了三轮,分别是1988,1995,2002,可能2006的也正在进行中。这个数据是全部省份。这个数据的好处是,农村及城镇的数据都有。城镇每年家庭的数据大约有6800户,人数大约为20000人。农村每年家庭的数据大约有9200户,人数大约有38000人。(内附2002年调查问卷)包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、受教育年限、行业、所有制、职业、就业状况、工资、总收入、工作小时数、参加工作年份、是否中共党员、是否
5、当过兵、是否当过干部、吸烟花多少钱、喝酒花多少钱、是否残疾、医药支出额多少、生病的时间、从事家务劳动的时间、照顾家里其它病人的时间、工资收入总额、退休金、股票红利、工作天数、工作小时数、找工作的渠道、居住条件、开始非农就业的年份。(2)家庭层次上的变量。家庭总收入、家庭人口数、居住面积、房屋所有权、贷款的数量、借钱的途径、自己及配偶父母的家庭成分、家庭收入、老人补助金、现金支出、家庭消费、家庭财产。可做的研究:(1)教育回报率问题。(2)收入不平等问题。(3)劳动力供给问题。家庭财产、孩子(老人)、退休金、家务劳动时间。(4)找工作的方式问题。(5)行业的分布及变化。(6)职业的分布及变化。人
6、力资源管理。(7)就业问题。失业率和劳动参与率。(8)教育决定因素及教育不平等问题。(9)社会保障方面的研究(退休金)。(10)财产性收入研究(股票)。(11)房地产需求问题。它与人口结构的关系。(12)住房解决方式问题。(13)农村非正规金融问题(借款)。(14)家庭消费的决定因素及模式变化。(15)党员、当兵、当干部、父母家庭成分对收入和就业的影响(16)吸烟、喝酒等支出的决定因素及变化趋势(17)农村老人补助金问题。(18)老人养老安排问题。(19)老年人劳动供给问题(退休年龄的提高)。 (三)Census (查看数据)简介:中国人口普查数据。现在经常用到的人口普查数据是1982年、19
7、90年、2000年的人口普查数据。一般的研究机构拿的数据是0.1%抽样的,但有的研究部门能够拿到1%抽样的。对做宏观变量的趋势(如性别比例的变化,离婚率的变化等),这种大样本的数据非常合适,非常有说服力。要想使用这种大型的数据库,对硬件的设备要求很高。要想使用1%抽样的数据,我们的电脑一般都不能承担。人口普查的一个缺陷是没有收入方面的数据,但是2005的中期普查,是有收入方面的数据的。内附1990年,2000年调查问卷)包含的变量:在不同的年份,包含的变量不一样。这里说的是比较全的。个人层次上的变量:年龄、性别、民族、婚姻状态、初婚年龄、行业、职业、工作单位的性质、不参加工作的原因、与户主的关
8、系、户口、居住地、出生地、文化程度、何时迁入本地、迁来本地的原因、从何地迁来、迁出地的类型、五年前常住地、为什么现在住在本地、工作时间。家庭层次上的变量:家庭人口数、调查期内死亡人数、住房面积、住房用途、住房间数、住房来源、购入住房的成本,购入住房的时间、租房的成本、自来水与厕所的情况。如果是女性,还有总共生育了几个孩子,存活了几个孩子的信息。可做的研究:(1)人口预测、人口构成问题。(2)性别比例问题。(3)计划生育效果问题。(4)人口老龄化问题。(5)劳动力迁移问题。(6)孩子的质量数量权衡问题。(4)农村留守老人和孩子问题。(5)房地产价格决定因素及变化趋势。(6)老人居住问题(跟儿子还
9、是跟女儿)。(7)少数民族问题。 (四)CHNS (China Health and Nutrition Survey)(查看数据)简介:中国健康与营养调查。由美国北卡罗莱纳大学教堂山校区的罗莱纳州人口中心(the Carolina Population Center at the University of North Carolina at Chapel Hill)和中国疾病控制和预防中心的国家营养和食品安全所(the National Institute of Nutrition and Food Safety, and the Chinese Center for Disease Co
10、ntrol and Prevention)合作建立的一个数据。这个数据最大的好处是,它是一个面板数据。而且,农村和城镇的数据都有。现有的数据有:1989, 1991, 1993, 1997, 2000, 2004,2006等年份。包括的省份:辽宁、黑龙江、江苏、山东、河南、湖北、湖北、湖南、广西、贵州。这些数据可以在网上下载。现在,国际一些好的刊物很多文章也是用这个数据做的。这个数据库涉及的变量较多,处理起来比较困难。以后年份的数据缺失可能比较严重。(内附2000年调查问卷)包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、出生日期、民族、身高、体重、血压、病史、吸烟史、受教育年限(水
11、平)、户口、是否干部、行业、职业、第二职业、工作单位的性质及人数、就业状况、工作时间(非常细致)工资、总收入、参加农业生产的情况。(2)家庭层次上的变量。农业生产、农作物价值、家庭总收入、家庭人口数、家庭支出(较详细)、家庭收入(较详细)、居住情况(详细)、交通工具、家庭消费、家庭财产、医疗费用(详细)、家庭成员生病(较详细)、食物消费(详细)。(3)社区层次变量。村人数、村户数、是否实行医疗保险、医院情况、消费结构、学校情况、计划生育情况、食品价格。可做的研究:(1)身高体重与食物结构的关系。(2)劳动力市场上是否在身高等存在歧视。(3)吸烟对健康的影响。(4)健康对劳动力供给的影响。(5)
12、就业问题。(6)劳动力供给时间问题。(7)医疗保险对健康的影响。(8)社区医疗结构(医院的多少)对健康的影响(9)某些疾病的发病趋势。(10)收入不平等问题。(11)社会保障方面的研究。(12)家庭消费的决定因素及模式变化。数据来源:公开。 (五)RHS (Rural Household Survey)(查看数据)简介:中国农村住户调查数据。它是国家统计局农调总队负责调查的。它是与城镇调查相对应的一个数据,也是每年做一次,但因为涉及到的问题比较敏感,这一套数据比较难拿。(内附2004年调查问卷)包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、文化程度、当年在家居住的时间、是否在校学生
13、、是否接受过技能培训、是否丧失劳动能力、从事、行业、从事农业生产的时间、从事非农行业的时间、是否乡镇企业职工、在乡镇企业工作的时间、外出方式、外出地区、在外务工时间、在外务工总收入生活消费总支出。(2)家庭层次上的变量。家庭总收入、家庭人口数、家庭财产、现金支出、现金流入、家庭消费、缴纳的税费。可做的研究:(1)农村税费问题。(2)农民工迁移问题,包括地区、迁移方式。(3)农民工收入对家庭总收入的影响。(4)研究乡镇企业问题。(5)农村基础设施问题,电话、公路等等。(6)农村地区财产性收入问题。(7)农产品价格及农民收入问题。(8)农业机械与农业产量。(9)各种农作物种植面积的变化趋势。(10
14、)农村家庭消费的决定因素及模式变化。数据来源:国家统计局。(六)中国老年健康调查项目(查看数据)简介:全国老年人口健康状况调查项目(又名中国老人健康长寿影响因素研究)的项目主持人为北京大学中国经济研究中心教授与杜克大学教授及北大老龄健康与家庭研究中心主任曾毅。这一数据库主要是为有关老年人的研究服务。现有的数据包括:1998 2000 2002 2005年。(内附2005年的调查问卷)包含变量:性别、年龄、属相、出生日期、出生地、婚姻、受教育程度、以前所从事行业、生活能力、疾病、看病花费等信息可做的研究:(1)老年人的居住安排(跟儿子住,还是跟女儿住)(2)老年人的疾病状况。(3)老年人医疗支出
15、结构分析。(4)所从事行业对以后健康的影响。(七)CHARLS(China Health and Retirement Longitudinal Study)(查看数据)简介:中国健康退休跟踪调查。这个数据库是由北京大学中国经济研究中心赵耀辉教授负责的一个项目。这个项目实际是跟美国的HRS数据库并行的,主要是为了研究健康和退休行为。这个数据选取的样本是,年龄大于等于45岁。这个数据库的质量非常好,为了得到血样的数据,专门对相关的数据采集员做了培训。这个数据库最快明年春天就能用,并且它是对所有的研究者公开的。这个数据另外的一个好处是,它是一个面板数据。(内附调查问卷)包含的变量:包含的变量非常丰
16、富。基本在劳动经济学研究中,能用到的变量都考虑到了。举几个例子。教育水平,细分到了硕士和博士;英语水平细分到了过了国家几级;大学是同等学历还是正规毕业;村干部细分到了村书记还是村会计。可做的研究: (1)社会保障方面的研究;(2)老龄化问题方面的研究;(3)其它劳动经济学方面的研究;(4)人口经济学方面的研究;(5)卫生经济学方面的研究;(八)其它的数据(查看数据)(查看数据)(1)第一次经济普查:数据工业普、查农业普查(2)第一次、第二次妇女社会地位调查数据(3)CSMAR (China Stock Market & Accouting Reseach)。这是一个关于上市公司的数据。(4)关于全世界股票指数的数据库。(5)中国社会科学院劳动与人口研究所五个城市(上海、福州、沈阳、武汉和西安)的劳动力市场数据。