2.1. Giới thiệu
2.1.1. Khái niệm về hồi quy
Phân tích hồi quy là tìm quan hệ phụ thuộc của
một biến, được gọi là biến phụ thuộc vào một hoặc
nhiều biến khác, được gọi là biến độc lập nhằm mục
đích ước lượng hoặc tiên đoán giá trị kỳ vọng của
biến phụ thuộc khi biết trước giá trị của biến độc lập
              
                                            
                                
            
 
            
                 49 trang
49 trang | 
Chia sẻ: hongha80 | Lượt xem: 785 | Lượt tải: 0 
              
            Bạn đang xem trước 20 trang nội dung tài liệu Kinh tế lượng - Chương ii: hồi quy 2 biến, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1KINH TẾ LƯỢNG
CHƯƠNG II HỒI QUY 2 BIẾN
22.1. Giới thiệu
2.1.1. Khái niệm về hồi quy
Phân tích hồi quy là tìm quan hệ phụ thuộc của
một biến, được gọi là biến phụ thuộc vào một hoặc
nhiều biến khác, được gọi là biến độc lập nhằm mục
đích ước lượng hoặc tiên đoán giá trị kỳ vọng của
biến phụ thuộc khi biết trước giá trị của biến độc lập.
32.1.2. Sự khác nhau giữa các dạng quan hệ
• Quan hệ tất định và quan hệ thống kê :
Shcn = dài x rộng
Cùng diện tích và kỹ thuật nuôi tôm => năng suất 
khác nhau 
• Hồi quy và quan hệ nhân quả
Có thể hồi quy số vụ trộm theo số nhân viên cảnh sát 
hoặc ngược lại
Quan hệ nhân quả chỉ ra rằng số cảnh sát tăng do số vụ 
trộm tăng.
•Hồi quy và tương quan
Phân tích tương quan chỉ cho thấy độ mạnh yếu của 
mối quan hệ tuyến tính giữa hai biến số
42.2.Mô hình hồi quy tổng thể và hồi quy mẫu
2.2.1. Mô hình hồi quy tổng thể (PRF)
Ví dụ 2.1. Hồi quy tiêu dùng Y theo thu nhập X. Xét 
sự phụ thuộc chi tiêu của một gia đình vào thu nhập ở 
một địa phương có tổng cộng 40 hộ gia đình. Ta được 
số liệu cho ở bảng sau:
580 100 120 140 160 180 200
Y 55 65 79 80 102 110 120
60 70 84 93 107 115 136
65 74 90 95 110 120 140
70 80 94 103 116 130 144
75 85 98 108 118 135 145
88 113 125 140
115
 325 462 445 707 678 750 685
E(Y/Xi) 65 77 89 101 113 115 137
X
Bảng 2.1. Chi tiêu và thu nhập của hộ gia đình:
6Mô hình hồi quy tổng thể: 
E(Y/Xi) = f(Xi) =   Xi
 : là hệ số chặn – tung độ gốc
2 : hệ số góc - hệ số đo độ dốc đường hồi quy 
Ví dụ ở hộ gia đình có mức chi tiêu 130 ta có:
130 = 1 + 2.180 + 15
115
Mô hình hồi quy tổng thể ngẫu nhiên: 
Yi = 1 + 2Xi + ui
ui:sai số ngẫu nhiên của tổng thể ứng với quan sát thứ i
ui: đại diện những nhân tố còn lại ảnh hưởng đến chi tiêu
7Sai số ngẫu nhiên hình thành từ nhiều nguyên 
nhân:
- Bỏ sót biến giải thích.
- Sai số khi đo lường biến phụ thuộc.
- Các tác động không tiên đoán được. 
- Dạng mô hình hồi quy không phù hợp. 
8 
0 
40 
60 
80 
100 
120 
140 
160
0 
0 80 100 120
0 
140 160 180 200 220 
Tiêu 
dùng 
Y 
Xi 
E(Y/Xi)=  1 +  2 Xi 
Yi = 1 + 2Xi + ui 
 ui
? 
Y = E(Y/Xi) 
Yi 
  
  
Yi = 1 + 2Xi + ui 
Haøm hoài quy toång theå 
Hình 2.1. Mô hình hồi quy tổng thể tuyến tính
92.2.2. Mô hình hồi quy mẫu (SRF)
Mô hình hồi quy mẫu:
Trong đó 
: ước lượng cho 1.
: Ước lượng cho 2.
: Ước lượng cho E(Y/Xi)
Mô hình hồi quy mẫu ngẫu nhiên
ii XY 21
ˆˆˆ  
1ˆ
2ˆ
iYˆ
iii eXY  21
ˆˆ 
10
0
40
60
80
100
120
140
0 80 100 120 140 1600 180 200 210 220
T
iê
u
 d
ù
n
g
, 
Y
 (
X
D
)
(PRF)
(SRF)
Xi
Yi
E(Y/Xi)
Yi
ei
ui
1
1
2
2 
Thu nhập khả dụng, X (XD)
Hình 2.1. Mô hình hồi quy tổng thể và mẫu tuyến tính
11
2.2.3. Mô hình hồi quy tuyến tính (LRF)
Hồi quy tuyến tính chỉ yêu cầu tuyến tính trong 
các tham số, không yêu cầu tuyến tính trong biến số.
* Mô hình 
là mô hình tuyến tính trong các tham số nhưng phi 
tuyến theo biến số.
* Mô hình 
là mô hình phi tuyến trong các tham số nhưng tuyến 
tính trong biến số. 
Hồi quy tuyến tính theo OLS chỉ chấp nhận dạng mô 
hình tuyến tính trong tham số.
iu
X
Y 
1
21 
iuXY 
2
21 )1( 
12
2.3. Ước lượng các hệ số của mô hình hồi quy theo 
phương pháp bình phương tối thiểu-OLS
2.3.1.Các giả định của mô hình hồi quy tuyến tính 
cổ điển
Giả thiết 1:Các biến giải thích là phi ngẫu nhiên tức là 
các giá trị của chúng được cho trước hoặc được xác 
định. 
Giả thiết 2: Kỳ vọng của yếu tố ngẫu nhiên ui bằng 0, 
tức là: 
Giả thiết 3: Các ui có phương sai bằng nhau (phương 
sai thuần nhất)
  0ii XuE
    2varvar  ijii XuXu i
13
Giả thiết 4: Không có tự tương quan giữa các ui: 
Giả thiết 5: Không tự tương quan giữa ui với Xi: 
Cov (ui,Xi) = 0
Định lý Gauss-Markov
Với các giả định của mô hình hồi quy tuyến tính
cổ điển, mô hình hồi quy tuyến tính theo phương pháp
bình phương tối thiểu là ước lượng tuyến tính không
thiên lệch tốt nhất
    0,,cov  jijijiji XXuuEXXuu
14
Giả thiết bổ sung (Gujarati, 1995):
Giả thiết 7: Mô hình là tuyến tính theo tham số.
Giả thiết 8: Số quan sát n lớn hơn số tham số của mô 
hình.
Giả thiết 9: Giá trị của X không được đồng nhất (bằng 
nhau) ở tất cả các quan sát.
Giả thiết 10: Mô hình được xác định đúng.
Giả thiết 11: Không tồn tại đa cộng tuyến hoàn hảo 
giữa các biến giải thích.
15
2.3.2. Nội dung của phương pháp
Cho n quan sát của 2 đại lượng (Yi, Xi) 
Mô hình hồi quy mẫu ngẫu nhiên
ni ,1
iii eXY  21
ˆˆ 
iii YYe
ˆ
0min).ˆˆ(ˆ 1211111  XYYYe 
0).ˆˆ(ˆ 2212222  XYYYe 
0).ˆˆ(ˆ 3213333  XYYYe 
16
2.3.2. Nội dung của phương pháp
Tại sao chúng ta không tìm ∑e => 0?
=> tìm ∑ei
2 => 0: Phương pháp bình phương bé nhất
Điều kiện để phương trình trên đạt cực trị là: 
 
2
1
21
1
2 ˆˆ
n
i
ii
n
i
i XYe 
  0e2XˆˆY2
ˆ
e
n
1i
i
n
1i
i21i
1
n
1i
2
i
  0Xe2XXˆˆY2
ˆ
e
n
1i
iii
n
1i
i21i
2
n
1i
2
i
17
2.3.2. Nội dung của phương pháp
Giải hệ phương trình trên, chúng ta thu được:
đặt 
XY 21
ˆˆ  
n
i
i
n
i
ii
XnX
YXnXY
1
22
1
2
).(
..
ˆ
XXx ii 
YYy ii  
n
1i
2
i
n
1i
ii
2
x
xy
ˆ
18
Ví dụ 2.2: quan sát sự biến động của nhu cầu gạo Y 
(tấn/tháng) vào đơn giá X (ngàn đồng/kg) ta được các 
số liệu cho ở bảng. Hãy lập mô hình hôi quy mẫu biễu 
diễn mối phụ thuộc về nhu cầu vào đơn giá gạo 
Stt Xi Yi XiYi X^ 2
1 1 10 10 1
2 4 6 24 16
3 2 9 18 4
4 5 5 25 25
5 5 4 20 25
6 7 2 14 49
sum 24 36 111 120
19
Giả sử mô hình hồi quy mẫu là: ii XY 21
ˆˆˆ  
4
6
24
X 6
6
36
Y
375,1
)4.(6120
6.4.6111
).(
..
ˆ
2
1
22
1
2 
n
i
i
n
i
ii
XnX
YXnXY
5.114).375,1(6ˆˆ 21  XY 
20
Như vậy, mô hình hồi quy mẫu 
=> X và Y có quan hệ nghịch biến
* = 11,5: nhu cầu tối đa là 11,5 tấn/tháng
* = -1,375: khi giá tăng 1000 đồng/kg thì nhu cầu
trung bình sẽ giảm 1,375 tấn/tháng với các yếu tố khác
trên thị trường không đổi.
ii XY .375,15,11
ˆ 
1ˆ
2ˆ
21
2.4. Phương sai, sai số chuẩn của các ước lượng, hệ 
số xác định R2, hệ số tương quan r
2.4.1. Phương sai và sai số chuẩn của các ước lượng
Ước lượng 
Sai số chuẩn
1ˆ 2ˆ
  2
1
2
1
2
1
ˆvar 
n
i
i
n
i
i
xn
X
 
n
i
ix
1
2
2
2
ˆvar
n
i
i
n
i
i
xn
X
SE
1
2
1
2
1)
ˆ(
22
)ˆ(
ix
SE
Phương sai
22
Var(ei) được dùng để ước lượng cho 
2 và dùng ước 
lượng không chệch là: 
2
ˆ 1
2
2
n
e
n
i
i
23
2.4.2. Hệ số xác định R2 và hệ số tương quan r
Thước đo độ phù hợp của mô hình đối với dữ liệu 
là R2
Y
Yi
Yi
Xi X
Y
SRF 
ii yYY ˆ
ˆ 
iii eYY 
ˆ
ii yYY 
24
TSS (Total Sum of Squares): Tổng bình phương tất cả
các sai lệch giữa giá trị thực tế của Y với giá trị trung
bình của nó.
ESS (Explained Sum of Squares): Tổng bình phương
tất cả các sai lệch giữa giá trị của Y được tính theo mô
hình với giá trị trung bình của nó.
RSS (Residual Sum of Squares): Tổng bình phương
tất cả các sai lệch giữa giá trị thực tế với giá trị lý
thuyết theo mô hình của Y.
n
i
i
n
i
i
y
e
TSS
RSS
TSS
ESS
R
1
2
1
2
2 11
25
Trong mô hình 2 biến, người ta chứng minh được rằng
=> Có thể nói R2 phản ánh tỷ lệ mô hình lý thuyết 
phản ánh thực tế.
* Tính chất của R2
- 0≤ R2 ≤1. Với R2=0 thể hiện X và Y độc lập thống 
kê. R2 =1 thể hiện X và Y phụ thuộc tuyến tính hoàn 
hảo. 
- R2 không xét đến quan hệ nhân quả.
n
i
i
n
i
i
y
x
R
1
2
1
22
2
2
ˆ
26
Hệ số tương quan r: Hệ số tương quan r đo lường 
mức độ phụ thuộc tuyến tính giữa 2 đại lượng X và Y.
n
i
i
n
i
i
n
i
ii
xy
xy
r
1
2
1
2
1
27
Tính chất của r:
- r > 0: giữa X và Y có quan hệ đồng biến
r-> ± 1: X và Y có quan hệ tuyến tính chặt chẽ
r-> 0: X và Y có quan hệ tuyến tính không chặt chẽ
r < 0: X và Y có quan hệ nghịch biến
- Hệ số tương quan có tính chất đối xứng: rXY = rYX
- r độc lập với gốc toạ độ và các tỷ lệ. Nghĩa là: với a, 
c > 0, b, d là hằng số, và: 
Thì : rXY = rX*Y*
dcYY
baXX
ii
ii
*
*
28
- Nếu X, Y độc lập theo quan điểm thống kê thì hệ số 
tương quan giữa chúng bằng 0.
- r chỉ là đại lượng đo sự kết hợp tuyến tính hay phụ 
thuộc tuyến tính. r không có ý nghĩa để mô tả quan 
hệ phi tuyến.
2
Y,Xn
1i
2
i
n
1i
2
i
2n
1i
ii
2 r
yx
yx
R 
ii XY 75,025,6
ˆ 
rXY = ± R
VD: 
Với R2 = 0,81 => r = ± 0,9 = 0,9
29
2.5. Phân bố xác suất của các ước lượng
Giả thiết 6: ui có phân phối N(0, 
2)
Với các giả thiết nêu trên, các ước lượng có 
các tính chất sau:
- Chúng là các ước lượng không chệch
- Có phương sai cực tiểu
- Khi số quan sát đủ lớn thì các ước lượng này xấp xỉ 
với giá trị thực của phân phối
2
21
ˆ,ˆ,ˆ 
),(~ˆ 2
1ˆ11 
 N
),(~ˆ 2
2ˆ22 
 N
30
2.6. Khoảng tin cậy của các tham số
Ước lượng khoảng cho hệ số hồi quy với mức ý nghĩa 
 (độ tin cậy 1-) như sau 
)ˆ;ˆ( iiiii   )
ˆ()2/1,2( ini SEt  
31
2.7. Kiểm định giả thiết về hệ số hồi quy
Có 3 cách để kiểm định giả thiết:
Cách 1: Kiểm định t
Quy tắc quyết định
Nếu thì bác bỏ H0.
Nếu thì ta không thể bác bỏ H0.
*
21
*
20
2
2
:
:
H
H
)ˆ(
ˆ
2
*
22
SE
t
)2/,2(  ntt
)2/,2(  ntt
32
-4 -3 -2 -1 0 1 2 3 4
t
f(t)
//
-t
/
t
/
33
Cách 2: Phương pháp khoảng tin cậy
Giả sử ta tìm được khoảng tin cậy của i là:
với mức ý nghĩa  trùng với mức ý nghĩa của gt H0
Quy tắc quyết định
- Nếu chấp nhận H0
- Nếu bác bỏ H0
)ˆ;ˆ( iiiii   )
ˆ()2/1,2( ini SEt  
)ˆ;ˆ(* iiiii  
)ˆ;ˆ(* iiiii  
34
Cách 3: Phương pháp P-value
Tính 
Quy tắc quyết định
- Nếu p ≤  : Bác bỏ H0
- Nếu p > : Chấp nhận H0
(Phương pháp này thường dùng khi tiến hành trên máy vi tính)
)ˆ(
ˆ *
i
ii
i
SE
t
 
ptTP i  )(
35
Quy tắc thực hành-Trị thống kê t trong các phần 
mềm kinh tế lượng
Mức ý nghĩa hay được dùng trong phân tích hồi quy là 
=5%.
Giả thiết:
trị thống kê trở thành:
Quy tắc quyết định
Nếu thì bác bỏ H0.
Nếu thì ta không thể bác bỏ H0.
)ˆ(
ˆ
2
2
SE
t 
2t
2t
0:H
0:H
21
20
36
2.8. Kiểm định sự phù hợp của mô hình – Dự báo
2.8.1. Kiểm định sự phù hợp của mô hình
Kiểm định giả thiết H0: R
2 = 0 với mức ý nghĩa  hay 
độ tin cậy 1 - 
Xét thống kê 
Quy tắc quyết định
- Nếu F > F(1,n-2): Bác bỏ H0
- Nếu F ≤ F(1,n-2): Chấp nhận H0
2
2
1
)2(
R
nR
F
37
Miền bác bỏ
Miền chấp nhận
F =0,05
F(1,n-2)
Thống kê F
38
2.8.2. Dự báo
Cho trước giá trị X = X0, hãy dự báo giá trị trung bình
và giá trị cá biệt của Y với mức ý nghĩa  hay độ tin
cậy 1 - .
* Dự báo điểm
ii XY 21
ˆˆˆ  
0210
ˆˆˆ XY  
39
* Dự báo giá trị trung bình của Y
)ˆ;ˆ()/( 00000   YYXYE
)2/1,2(00 )
ˆ(   ntYSE
)ˆ()ˆ( 00 YVarYSE 
)
)(1
(ˆ)ˆ(
2
2
02
0
ìx
XX
n
YVar 
Với:
40
* Dự báo giá trị cá biệt của Y
Với:
)ˆ;ˆ( '00
'
000   YYY
)2/1,2(00
'
0 )
ˆ(   ntYYSE
)ˆ()ˆ( 0000 YYVarYYSE 
)
)(1
1(ˆ)ˆ(
2
2
02
00
ìx
XX
n
YYVar 
41
Ví dụ 2.3: Với số liệu và kết quả ở ví dụ 2.2
a. Tìm khoảng tin cậy của 1, 2 với =0,05
b. Hãy xét xem nhu cầu của loại hàng trên có phụ 
thuộc vào đơn giá của nó không với =0,05.
c. Hãy dự báo nhu cầu trung bình và nhu cầu cá biệt 
của loại hàng trên khi đơn giá ở mức 6.000 đồng/kg 
với độ tin cậy 95%.
42
Stt Xi Yi xi yi xi^2 yi^2
1 1 10 -3 4 9 16
2 4 6 0 0 0 0
3 2 9 -2 3 4 9
4 5 5 1 -1 1 1
5 5 4 1 -2 1 4
6 7 2 3 -4 9 16
Sum 24 36 0 0 24 46
Average 4 6
ii XY .375,15,11
ˆ Mô hình hồi quy mẫu:
43
Bài giải:
)ˆ(ˆ)ˆ(ˆ 1)2/1,2(111)2/1,2(1   SEtSEt nn  
)ˆ(ˆ)ˆ(ˆ 2)2/1,2(222)2/1,2(2   SEtSEt nn  
a. Ta có
9864,0
46
24.)375,1(
ˆ
2
1
2
1
22
2
2 
n
i
i
n
i
i
y
x
R
Mà:
15625,0
26
46).9864,01(
2
)1(
ˆ 1
22
2 
n
yR
n
i
i
=>
44
3609,0)ˆ()ˆ(
1303,015625,0
24.6
120ˆ)ˆ(
11
2
2
2
1
VarSE
xn
X
Var
i
i
0806,0)ˆ()ˆ(
0065,0
24
15625,0ˆ
)ˆ(
22
2
2
2
VarSE
x
Var
i
45
0019,13609,0776,2)ˆ( 1)2/1,2(1   xSEt n  
2237,00806,0776,2)ˆ( 2)2/1,2(2   xSEt n  
5019,124981,10 1  
1513,15987,1 2  
46
b. Kiểm định giả thiết 2 = 0 H0: 2 = 0
C1: Sử dụng kết quả ở câu a, với  = 0,05, 2 không 
thuộc khoảng tin cậy => bác bỏ H0
C2: 
=> 
=> Bác bỏ H0, hay nhu cầu trung bình có phụ thuộc 
vào đơn giá
0379,17
0806,0
0375,1
)ˆ(
ˆ
2
*
22 
SE
t
776,20379,17 025,0,4  tt
47
12,290
)9864,01(
9864,0)26(
)1(
)2(
2
2
R
Rn
F
C3: sử dụng kiểm định F đối với mô hình hai biến
Mà F0,05(1,4) = 7,71 < Ftt
=> Bác bỏ H0, hay nhu cầu trung bình có phụ thuộc
vào đơn giá
48
)ˆ(.ˆ)6/( 0)2/,2(0 YSEtYXYE n 
052,0)
24
)46(
6
1
(1562,0)
)(1
(ˆ)ˆ(
2
2
2
02
0 
 ix
XX
n
YVar 
2283,0)ˆ()ˆ( 00  YVarYSE
)8838,3;6162,2()6/( XYE
c. Dự báo
-Dự báo điểm: (tấn/tháng)
- Dự báo giá trị trung bình của Y
25,36375,15,11ˆ0  xY
49
- Dự báo giá trị cá biệt của Y 
)ˆ(.ˆ 00)2/,2(00 YYSEtYY n   
20835,0ˆ)ˆ()ˆ( 2000  YVarYYVar
4565,0)ˆ()ˆ( 0000  YYVarYYSE
)5172,4;9828,1(0 Y
Vậy, khi đơn giá là 6.000 đồng/kg ở một tháng nào
đó thì nhu cầu sẽ dao động từ 2-4,5 tấn.
            Các file đính kèm theo tài liệu này:
 kinh_te_luo_ng_chapter_2_hoi_quy_2_bien_7478.pdf kinh_te_luo_ng_chapter_2_hoi_quy_2_bien_7478.pdf