面板数据模型dxg.pdf
文本预览下载声明
中级计量经济学 436
第 11章 面板数据模型
11.1 面板数据模型概述
11.1.1 面板数据的含义
面板数据 (panel data )也称平行数据,或时间序列截面数据(time series and cross section
data )或混合数据(pool data ),是指在时间序列上取多个截面,在这些截面上同时选取样本
观测值所构成的样本数据。面板数据从横截面上看,是由若干个体在某一时刻构成的截面观
测值,从纵剖面上看是一个时间序列。
面板数据用双下标变量表示。例如
y i t, i = 1, 2, …, N ; t = 1, 2, …, T
表示在横截面 i 时间 t 上取值。N 表示面板数据中含有 N 个个体。T 表示时间序列的最大长度。
若固定 t 不变,y i . ( i = 1, 2, …, N)是横截面上的N 个个体截面数据序列;若固定 i 不变,y . t (t
= 1, 2, …, T)是纵剖面上的一个时间序列(个体),如图 11.1.1 所示。
图 11.1.1 面板数据示意图
例如 1990-2000 年 30 个省份的农业总产值数据。固定在某一年份上,它是由 30 个农业
总产值数字组成的截面数据;固定在某一省份上,它是由 11 年农业总产值数据组成的一个时
间序列。面板数据由 30 个个体组成。共有 330 个观测值。
对于面板数据y i t, i = 1, 2, …, N ; t = 1, 2, …, T 来说,如果从横截面上看,每个变量都有观
第 11 章 面板数据模型 437
测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel
data )。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced
panel data )。
例 11.1.1 1996-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均消费(不
变价格)和人均收入数据见表 11.1.1 和表 11.1.2。数据是7 年的,每一年都有 15 个数据,共
105 组观测值。
表 11.1.1 1999-2002 年中国东北、华北、华东 15 个省级地区的居民家庭人均消费数据(不变价格)
地区人均消费 1996 1997 1998 1999 2000 2001 2002
CP-AH (安徽) 3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364
CP-BJ (北京) 5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12
CP-FJ (福建) 4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005
CP-HB (河北) 3197.339 3868.319 3896.778 4104.281 4361.555 4457.463 5120.485
CP-HLJ (黑龙江) 2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535
CP-JL (吉林) 2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874
CP-JS (江苏) 3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331
显示全部