Phân tích chuỗi thời gian với sự hỗ trợ của package analyzets

Chuỗi thời gian là một chủ đề khá rộng và có ứng dụng rất nhiều trong thực tế,

đặc biệt là chuỗi thời gian mờ. Trong R có không ít package hỗ trợ phân tích chuỗi

thời gian. Tuy nhiên còn 2 vấn đề (theo tìm hiểu của chúng tôi) mà các package ấy

chưa hỗ trợ là tìm một mô hình tối ưu từ rất nhiều mô hình dự tuyển thuộc lớp mô

hình “ARIMA”, “ARIMAX” và “GARCH”, thứ hai là các mô hình chuỗi thời gian

mờ. Package AnalyzeTS được nhóm chúng tôi xây dựng trong quá trình thực hiện đề

tài luận văn tốt nghiệp của mình. Công dụng chính của package là giải quyết 2 vấn

đề nêu trên.

62 trang | Chia sẻ: Mr Hưng | Lượt xem: 1229 | Lượt tải: 0

Bạn đang xem trước 20 trang nội dung tài liệu Phân tích chuỗi thời gian với sự hỗ trợ của package analyzets, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

ndex da ta 0 10 20 30 40 10 0 15 0 20 0 ts forecast Chen-Hsu 10 fuzzy set index da ta 0 10 20 30 40 10 0 15 0 20 0 ts forecast Chen-Hsu 12 fuzzy set index da ta 0 10 20 30 40 10 0 15 0 20 0 ts forecast Chen-Hsu 15 fuzzy set index da ta 0 10 20 30 40 10 0 15 0 20 0 ts forecast Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 44 > goc<-data.frame(ban) > chen.hsu.density<-data.frame(chen.hsu8.density, +chen.hsu10.density,chen.hsu12.density,chen.hsu15.density) > av.res(Y=goc,F=chen.hsu.density) chen.hsu8.density chen.hsu10.density chen.hsu12.density ME 1.431 0.065 0.586 MAE 5.09 3.635 3.75 MPE 0.9 -0.109 0.478 MAPE 3.989 2.761 2.941 MSE 42.539 21.814 20.911 RMSE 6.522 4.671 4.573 U 0.093 0.066 0.065 chen.hsu15.density min.model ME 0.227 chen.hsu10.density MAE 3.069 chen.hsu15.density MPE 0.062 chen.hsu10.density MAPE 2.389 chen.hsu15.density MSE 13.764 chen.hsu15.density RMSE 3.71 chen.hsu15.density U 0.053 chen.hsu15.density Theo tiêu chuẩn MAPE mô hình Chen-Hsu với 15 tập mờ (chen.hsu15.density) là tốt nhất. Mô hình Chen-Hsu với bin != NULL Nếu bin = NULL thì số tập mờ sẽ được R chia lại lần hai theo giá trị của tham số‘divide’. Khi đó, số lượng phần tử có trong các tập mờ iA , ni ,1 có thể không như ý muốn. Để R chia lại số tập mờ theo ý muốn, ta dùng tham số ‘bin’ của hàm. Cho ‘bin’ một vector số mà các phần tử của vector là các điểm chia của các tập mờ (không có giá trị của điểm đầu và điểm cuối) khi đó R sẽ chia số tập mờ theo tham số ‘bin’. Trong lần phân tập mờ đầu tiên, chúng tôi cho số tập mờ là 8 và được kết quả của 8 tập mờ. > fuzzy.ts1(ban,n=8,type="Chen-Hsu",trace=1)$table1 set dow up mid num 1 A1 61.94 84.30625 73.12313 5 2 A2 84.30625 106.6725 95.48937 5 3 A3 106.6725 129.0388 117.8556 7 4 A4 129.0388 151.405 140.2219 8 5 A5 151.405 173.7713 162.5881 9 6 A6 173.7713 196.1375 184.9544 5 7 A7 196.1375 218.5038 207.3206 5 8 A8 218.5038 240.87 229.6869 3 Từ bảng kết quả ta thấy, các phần tử trong tập mờ thứ 4 và 5 nhiều hơn số Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 45 phần tử của các tập mờ còn lại rất nhiều. Do đó, ta sẽ chia như sau > chen.hsu.bin<-fuzzy.ts1(ban,type="Chen-Hsu",bin=c(84.30625,106.6725,129.0388, + 140.2219,151.405,162.5882,173.7713,196.1375,218.5038),plot=TRUE) Chen-Hsu 5 fuzzy set index d a ta 0 10 20 30 40 1 0 0 1 5 0 2 0 0 ts forecast Đoạn Số phần tử trong đoạn A1 = [61.94; 84.30625] 5 A2 = [84.30625; 106.6725] 5 A3 = [106.6725; 129.0388] 7 A4.1 = [129.0388;140.2219] 3 A4.2 = [140.2219;151.405] 5 A5.1 = [151.405; 162.5882] 5 A5.2 = [162.5882; 173.7713] 4 A6 = [173.7713; 196.1375] 5 A7 = [196.1375; 218.5038] 5 A8 = [218.5038; 240.87] 3 Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 46 e) Tìm mô hình mờ tốt nhất và xây dựng mô hình ARIMA > goc<-data.frame(ban) > mo<-data.frame(chen15,singh15,heuristic15,chen.hsu15.dt, + chen.hsu15.density,chen.hsu.bin) > av.res(Y=goc,F=mo) chen15 singh15 heuristic15 chen.hsu15.dt ME 1.54 -0.126 0.235 0.235 MAE 27.27 3.033 23.24 3.04 MPE -6.067 -0.206 -5.049 0.068 MAPE 22.048 2.365 18.091 2.37 MSE 1193.914 13.928 943.975 13.661 RMSE 34.553 3.732 30.724 3.696 U 0.491 0.053 0.437 0.053 chen.hsu15.density chen.hsu.bin min.model ME 0.227 1.831 singh15 MAE 3.069 4.868 singh15 MPE 0.062 1.191 chen15 MAPE 2.389 3.829 singh15 MSE 13.764 37.641 chen.hsu15.dt RMSE 3.71 6.135 chen.hsu15.dt U 0.053 0.087 chen.hsu15.dt Theo tiêu chuẩn MAPE mô hình Singh với 15 tập mờ (singh15) là tốt nhất trong tất cả các mô hình mờ. Chúng ta chọn chuỗi này để đi xây dựng mô hình ARIMA. Các bước xây dựng mô hình ARIMA tương tự mục 2.3.3 sau khi đã tìm được chuỗi làm trơn tốt nhất. Sau khi thực hiện qua các bước 1 và 2 ta tìm được mô hình tối ưu là SARIMA(1,1,0)x(0,0,1)[5]. Tuy nhiên khi thực hiện bước 3 để kiểm định, ta lại thấy chuỗi phần dư không là ngẫu nhiên trắng. Do đó mô hình này không thích hợp để dự báo cho tương lai. 2.4. Mô hình chuỗi thời gian mờ Abbasov-Mamedova > ban<-ts(dat$sales) > w2<-fuzzy.ts2(ban,n=5,r=7,w=2,C=0.00001,trace=TRUE,forecast=15,plot=TRUE) Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 47 > w2 $type [1] "Abbasov-Manedova" $table1 U low up Bw 1 u1 -140.76 -81.026 -110.893 2 u2 -81.026 -21.292 -51.159 3 u3 -21.292 38.442 8.575 4 u4 38.442 98.176 68.309 5 u5 98.176 157.91 128.043 $table2 point ts diff.ts 1 1 199.95 NA 2 2 195.74 -4.21 Abbasov-Mamedova, C = 1e-05 w = 2 n = 5 index d a ta 0 10 20 30 40 1 0 0 1 5 0 2 0 0 ts forecast Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 48 3 3 102.68 -93.06 45 45 82.96 8.83 46 46 240.87 157.91 47 47 151.52 -89.35 $table3 [1] NA [2] "A[2]={(0.9999989/u1),(0.9999998/u2),(1/u3),(0.9999995/u4),(0.9999983/u5)}" [3] "A[3]={(1/u1),(0.9999998/u2),(0.999999/u3),(0.9999974/u4),(0.9999951/u5)}" [45] "A[45]={(0.9999986/u1),(0.9999996/u2),(1/u3),(0.9999996/u4),(0.9999986/u5)}" [46] "A[46]={(0.9999928/u1),(0.9999956/u2),(0.9999978/u3),(0.9999992/u4),(0.9999999/u5)}" [47] "A[47]={(1/u1),(0.9999999/u2),(0.999999/u3),(0.9999975/u4),(0.9999953/u5)}" $table4 point interpolate diff.interpolate 1 4 111.25488 8.574882 2 5 171.45494 8.574937 3 6 110.33498 8.574979 42 45 82.7049 8.5749 43 46 91.53489 8.574894 44 47 249.44518 8.575181 $table5 point forecast diff.forecast 1 48 258.0203 8.575082 2 49 266.5952 8.574896 3 50 275.1702 8.575 4 51 283.7452 8.575 5 52 292.3202 8.575 $table6 [1] "A[48]={(0.9999986/u1),(0.9999996/u2),(1/u3),(0.9999996/u4),(0.9999986/u5)}" [2] "A[49]={(0.9999986/u1),(0.9999996/u2),(1/u3),(0.9999996/u4),(0.9999986/u5)}" [3] "A[50]={(0.9999986/u1),(0.9999996/u2),(1/u3),(0.9999996/u4),(0.9999986/u5)}" [4] "A[51]={(0.9999986/u1),(0.9999996/u2),(1/u3),(0.9999996/u4),(0.9999986/u5)}" [5] "A[52]={(0.9999986/u1),(0.9999996/u2),(1/u3),(0.9999996/u4),(0.9999986/u5)}" $accuracy ME MAE MPE MAPE MSE RMSE U Abbasov.Mamedova -7.465 59.492 -19.668 48.1 5031.496 70.933 1.005 > w3<-fuzzy.ts2(ban,n=5,r=7,w=3,C=0.00001,trace=TRUE,forecast=5) > w4<-fuzzy.ts2(ban,n=5,r=7,w=4,C=0.00001,trace=TRUE,forecast=5) Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 49 > w5<-fuzzy.ts2(ban,n=5,r=7,w=5,C=0.00001,trace=TRUE,forecast=5) > w6<-fuzzy.ts2(ban,n=5,r=7,w=6,C=0.00001,trace=TRUE,forecast=5) > sosanh<-rbind(w2$accuracy,w3$accuracy,w4$accuracy,w5$accuracy, + w6$accuracy) > dimnames(sosanh)[[1]]<-c("w2","w3","w4","w5","w6") > sosanh ME MAE MPE MAPE MSE RMSE U w2 -7.465 59.492 -19.668 48.1 5031.496 70.933 1.005 w3 -8.839 59.675 -20.862 48.482 5086.53 71.32 1.008 w4 -7.39 59.437 -19.728 48.005 5091.986 71.358 1.005 w5 -9.439 59.018 -21.209 48.177 5073.051 71.225 1.009 w6 -7.791 58.61 -20.172 47.814 5057.993 71.12 1.006 Theo tiêu chuẩn MAPE chúng ta thấy mô hình w6 (mô hình với tham số w = 6) có giá trị nhỏ nhất, ta nói mô hình Abbasov-Mamedova với tham số w=6 là đáng tin cậy nhất. Truy xuất giá trị dự báo và vẽ đồ thị dự báo của mô hình như sau: > dubao.abbasov<- w6$table5 point forecast diff.forecast 1 48 258.0201 8.57486 2 49 266.5951 8.575 3 50 275.1701 8.575 4 51 283.7451 8.575 5 52 292.3201 8.575 > plot(dubao.abbasov [,2],type="o",pch=18,col=2,xlab="point",ylab="sales", + main="Đồ thị dự báo bằng mô hình Abbasov-Mamedova") > grid.on(v=FALSE) 1 2 3 4 5 2 6 0 2 7 5 2 9 0 Ðồ thị dự báo bằng mô hình Abbasov-Mamedova point s a le s Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 50 2.5. Tổng hợp và so sánh các mô hình dự báo Sau khi phân tích qua các mô hình, ta có được 3 mô hình có thể dự báo được là mô hình với biến giả nhiệt độ, mô hình với số liệu làm trơn và mô hình Abbasov- Mamedova. Ta có kết quả dự báo từ 3 mô hình này lại thành một data frame để tiện quan sát. > kqth<-data.frame(bien.gia=dubao.bgia$pred,tron=dubao.tron$pred, + chuoi.mo=dubao.abbasov$forecast) > kqth bien.gia tron chuoi.mo 1 120.6013 150.7967 258.0201 2 146.9638 132.7841 266.5951 3 138.5314 122.5042 275.1701 4 143.7891 138.9585 283.7451 5 139.8764 156.1941 292.3201 Nhìn chung ngoài mô hình Abbasov-Mamedova có giá trị dự báo tăng liên tục, thì 2 mô hình còn lại đều có giá trị tăng giảm không đều trong 5 ngày tiếp theo. > bien.gia<-fitted(fit.bgia) > lam.tron<-c(NA,NA,fitted(fit.tron)) > abbasov<-c(rep(NA,7),w6$table4$interpolate) > noisuy<-data.frame(bien.gia,lam.tron,abbasov) > goc<-data.frame(ban) > av.res(Y=goc,F=noisuy) bien.gia lam.tron abbasov min.model ME -3.628 -1.087 -7.791 abbasov MAE 33.414 37.92 58.61 bien.gia MPE -12.893 -11.267 -20.172 abbasov MAPE 28.259 30.344 47.814 bien.gia MSE 1771.301 2061.165 5057.993 bien.gia RMSE 42.087 45.4 71.12 bien.gia U 0.605 0.638 1.006 bien.gia Theo tiêu chuẩn MAPE thì mô hình bien.gia (mô hình ARIMA với biến giả nhiệt độ) là đáng tin cậy nhất. Các lệnh bên dưới giúp vẽ một đồ thị tổng hợp cho kết quả dự báo. > plot(kqth$bien.gia,type="o",pch=16,col="blue",xlab="point",ylab="sales", + main="Kết quả dự báo từ các mô hình",ylim=c(min(kqth),max(kqth))) > lines(kqth$tron~c(48:52),pch=17,type="o",col="green") > lines(kqth$chuoi.mo~c(48:52),pch=18,type="o",col="red") > legend(51,250,c("biến giả","làm trơn","chuỗi mờ"),lty=c(1,1,1), + pch=c(16,17,18),col=c("blue","green","red")) > grid.on() Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 51 3. Bài toán tỷ xuất sinh lợi giá cổ phiếu 3.1. Nguồn số liệu Trong phân tích tài chính, nếu kí hiệu một loại giá cả thay đổi hàng ngày là ,tGia để thuận tiện cho việc phân tích các yếu tố ngẫu nhiên của các chỉ số, người ta hay xét các đại lượng 1 1 t t t t Gia Gia SST Gia     Hay 1ln lnt t tSSL Gia Gia   được xem là tỷ suất sinh lợi (lợi nhuận) hay lợi nhuận logarit (t 1) , tGia là giá tại thời điểm t. Giả thiết thường được ưa chuộng nhất là giả thiết cho rằng 1,..., tSSL SSL tuân theo luật phân phối chuẩn. Thế nhưng, theo sự phân tích các chuỗi thời gian tài chính, giả thiết đó rất nhiều khi không phù hợp với thực tế diễn biến của giá cả tài chính. Ta có thể phân tích chuỗi giá chứng khoán thông qua việc phân tích chuỗi .tSSL Dữ liệu phân tích cho bài toán này là giá cổ phiếu ACB – mã cổ phiếu của Ngân hàng Á Châu. Nguồn dữ liệu được lấy từ thời điểm 21/11/2006 đến 29/09/2015 tại địa chỉ www.Cophieu68.com/export/excel.php?id=ACB Kết quả dự báo từ các mô hình point sa le s 48 49 50 51 52 1 5 0 2 0 0 2 5 0 biến giả làm tron chuỗi mờ Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 52 Giá cổ phiếu được tính lúc đóng cửa (đơn vị ngàn đồng). 3.1. Mô hình ARMA–GARCH Bước 1: Thiết lập suất sinh lợi và xác định mô hình dự báo Ta tạo ra chuỗi dữ liệu suất sinh lợi với 2199 quan sát, trong đó suất sinh lợi của chỉ số giá chứng khoán ACB được tính theo công thức SSL(t)=ln(Gia(t)/Gia(t-1)). > data<-read.csv(file.choose(),header=TRUE) > names(data) [1] "X.Ticker." "X.DTYYYYMMDD." "X.OpenFixed." "X.HighFixed." [5] "X.LowFixed." "X.CloseFixed." "X.Volume." "X.Open." [9] "X.High." "X.Low." "X.Close." "X.VolumeDeal." [13] "X.VolumeFB." "X.VolumeFS." "date" "month" > head(data1) X.DTYYYYMMDD. X.CloseFixed. date month 1 20150929 19.4 29 9 2 20150928 19.3 28 9 3 20150925 19.7 25 9 4 20150924 19.5 24 9 5 20150923 19.3 23 9 6 20150922 19.2 22 9 Đây là file số liệu gốc, nên bộ số liệu có khá nhiều cột và thứ tự các ngày không đúng với thứ tự chuỗi thời gian. Nên ta cần đảo lại thứ tự của dữ liệu và trích lọc chuỗi giá đóng cửa (cột X.CloseFixed) để phân tích. Đoạn code phía sau làm 2 công việc này. > temp<-data1 > data2<-temp > for(i in 1:dim(data2)[1]) data2[i,]<-temp[length(data[,6])-i+1,] > head(data2) X.DTYYYYMMDD. X.CloseFixed. date month 1 20061121 26.3 21 11 2 20061122 27.2 22 11 3 20061123 27.9 23 11 4 20061124 29.6 24 11 5 20061127 29.6 27 11 6 20061128 28.9 28 11 > close<-ts(data2[,2],start=1,frequency=5) Chuỗi giá đóng của đã được lưu trữ trong đối tượng close dưới dạng chuỗi thời gian, ta có thể dùng nó để phân tích. > #Suất sinh lợi > ln.close<-log(close) > SSL<-diff(ln.close) > Descriptives(SSL,plot="TRUE",r=0,answer=2) Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 53 N: NaN: Min: 1sq QU: Median: Mean: 3rd QU: Max: VAR: SD: SE: x 2198 0 0 0 0 0 0 0 0 0 0 > library(urca) > summary(ur.df(SSL,type="none",lags=5,selectlag="BIC")) Tóm tắt kết quả kiểm định ADF. Test value Giá trị tới hạn tau 1% 5% 10% -32.0015 -2.58 -1.95 -1.62 Chuỗi SSL dao động quanh giá trị 0, kiểm định ADF cho giá trị thống kê |tau| = |-32.0015| > |-1.95| (giá trị tới hạn tau 5%). Ta có đủ bằng chứng để kết luận chuỗi SSL là chuỗi dừng. Từ biểu đồ ACF và PACF chúng ta xác định được mô hình cần tìm là SARIMA với các bậc là p = 2, d = 0, q = 1, P = 1, D = 0, Q = 1. Time x 0 100 200 300 400 -0 .1 0 0 .0 0 0 .1 0 Histogram of x x D e n s it y -0.10 0.00 0.10 0 1 0 2 0 3 0 4 0 5 0 Skewness: 0 Kurtosis: 4 0 1 2 3 4 5 6 0 .0 0 0 .0 5 0 .1 0 0 .1 5 Series x Lag A C F 0 1 2 3 4 5 6 -0 .0 5 0 .0 5 0 .1 5 Lag P a rt ia l A C F Series x Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 54 Bước 2: Tìm mô hình tối ưu > PrintAIC(SSL,order=c(2,0,1),seas=list(order=c(1,0,1),frequency=5),type="SARIMA") $mohinh Mo hinh Gia tri AIC Xep loai mo hinh 1 SARIMA(0,0,1)*(0,0,1),s=5 ...AIC = -10306.5 .......... 1 mo hinh 2 SARIMA(0,0,1)*(1,0,0),s=5 ...AIC = -10305.59 .......... 4 mo hinh 3 SARIMA(0,0,1)*(1,0,1),s=5 ...AIC = -10306.31 .......... 2 mo hinh 4 SARIMA(1,0,0)*(0,0,1),s=5 ...AIC = -10304.28 .......... 9 mo hinh 5 SARIMA(1,0,0)*(1,0,0),s=5 ...AIC = -10303.32 ......... 15 mo hinh 6 SARIMA(1,0,0)*(1,0,1),s=5 ...AIC = -10304.18 ......... 11 mo hinh 7 SARIMA(1,0,1)*(0,0,1),s=5 ...AIC = -10304.54 .......... 7 mo hinh 8 SARIMA(1,0,1)*(1,0,0),s=5 ...AIC = -10303.64 ......... 13 mo hinh 9 SARIMA(1,0,1)*(1,0,1),s=5 ...AIC = -10304.35 .......... 8 mo hinh 10 SARIMA(2,0,0)*(0,0,1),s=5 ...AIC = -10305.6 .......... 3 mo hinh 11 SARIMA(2,0,0)*(1,0,0),s=5 ...AIC = -10304.74 .......... 6 mo hinh 12 SARIMA(2,0,0)*(1,0,1),s=5 ...AIC = -10305.35 .......... 5 mo hinh 13 SARIMA(2,0,1)*(0,0,1),s=5 ...AIC = -10304.18 ......... 10 mo hinh 14 SARIMA(2,0,1)*(1,0,0),s=5 ...AIC = -10303.34 ......... 14 mo hinh 15 SARIMA(2,0,1)*(1,0,1),s=5 ...AIC = -10303.89 ......... 12 $best Mo hinh toi uu SARIMA(0,0,1)*(0,0,1),s=5 ...AIC = -10306.5 Mô hình tối ưu là SARIMA(0,0,1)*(0,0,1)[5]. Ước lượng hệ số cho mô hìnhtối ưu. > fit1<-arima(SSL,order=c(0,0,1),seas=list(order=c(0,0,1),5)) > fit1 Call: arima(x = SSL, order = c(0, 0, 1), seasonal = list(order = c(0, 0, 1), 5)) Coefficients: ma1 sma1 intercept 0.1514 0.0903 -1.00E-04 s.e. 0.0211 0.0219 6.00E-04 sigma^2 estimated as 0.0005364: log likelihood = 5157.25, aic = -10308.5 Bước 3: Kiểm tra hiệu ứng ARCH > Descriptives(res,answer=2,plot=TRUE) N: NaN: Min: 1sq QU: Median: Mean: 3rd QU: Max: VAR: SD: SE: x 2198 0 -0.12 -0.01 0 0 0.01 0.13 0 0.02 0 Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 55 > Box.test(res,lag=32,type="Ljung") Box-Ljung test data: res X-squared = 47.459, df = 32, p-value = 0.03855 Chuỗi phần dư có các giá trị dao động quanh giá trị 0, nhưng có phương sai không bằng nhau. Trên biểu đồ ACF có nhiều độ trễ lớn hơn 0, kiểm định Ljung – Box cho giá trị p–value = 1.00e-04< 0.05, cho thấy có hiện tượng tương quan chuỗi trong chuỗi phần dư. Ta thực hiện kiểm định nhân tử Lagrange để xem có ảnh hưởng ARCH/GARCH hay không. Time x 0 100 200 300 400 -0 .1 0 0 .0 0 0 .1 0 Histogram of x x D e n s it y -0.10 0.00 0.10 0 1 0 2 0 3 0 4 0 Skewness: 0.15 Kurtosis: 3.74 0 1 2 3 4 5 6 -0 .0 4 0 .0 0 0 .0 4 Series x Lag A C F 0 1 2 3 4 5 6 -0 .0 4 0 .0 0 0 .0 4 Lag P a rt ia l A C F Series x Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 56 > library(FinTS) > ArchTest(res,30) ARCH LM-test; Null hypothesis: no ARCH effects data: res Chi-squared = 418.5, df = 30, p-value < 2.2e-16 Giá trị p-value < 2.2e-16 (rất nhỏ hơn so với mức ý nghĩa 5%) chúng ta bác bỏ giả thuyết, tức là chuỗi phần dư có ảnh hưởng ARCH/GARCH. Bước 4: Xác định bậc của ARCH > tsnew<-res^2 > par(mfrow=c(2,1)) > acf(tsnew,lag=100) > pacf(tsnew,lag=100) 0 5 10 15 20 -0 .0 5 0 .1 5 0 .3 0 Series tsnew Lag A C F 0 5 10 15 20 -0 .0 5 0 .1 0 0 .2 5 Lag P a rt ia l A C F Series tsnew Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 57 Từ biểu đồ trên ta thấy, biểu đồ ACF tắt dần về 0 nên ta khẳng định chuỗi phần dư có ảnh hưởng ARCH. Chọn bậc q = 9, ta tìm mô hình tối ưu từ các mô hình dự tuyển. > PrintAIC(res,order=9,type="ARCH") $mohinh Mo hinh Gia tri AIC Xep loai mo hinh 1 ARCH(1) ...AIC = -10845.84 .......... 9 mo hinh 2 ARCH(2) ...AIC = -11186.86 .......... 8 mo hinh 3 ARCH(3) ...AIC = -11230.91 .......... 7 mo hinh 4 ARCH(4) ...AIC = -11345.73 .......... 6 mo hinh 5 ARCH(5) ...AIC = -11386.54 .......... 5 mo hinh 6 ARCH(6) ...AIC = -11402.35 .......... 4 mo hinh 7 ARCH(7) ...AIC = -11406.84 .......... 3 mo hinh 8 ARCH(8) ...AIC = -11451.1 .......... 2 mo hinh 9 ARCH(9) ...AIC = -11451.65 .......... 1 $best Mo hinh toi uu ARCH(9) ...AIC = -11451.65 Warning messages: 1: In sqrt(pred$e) : NaNs produced 2: In sqrt(pred$e) : NaNs produced 3: In sqrt(pred$e) : NaNs produced 4: In sqrt(pred$e) : NaNs produced 5: In sqrt(pred$e) : NaNs produced 6: In sqrt(pred$e) : NaNs produced 7: In sqrt(pred$e) : NaNs produced 8: In sqrt(pred$e) : NaNs produced Mô hình tối ưu là ARCH(8). Tuy nhiên bậc 8 là khá lớn nên ta xét thêm mô hình của GARCH(1,1) để xem chỉ số AIC của mô hình có tốt hơn không. > PrintAIC(res,order=c(1,1),type="GARCH") $mohinh Mo hinh Gia tri AIC Xep loai mo hinh 1 GARCH(1,0) ...AIC = -10306.93 .......... 2 mo hinh 2 GARCH(1,1) ...AIC = -11478.51 .......... 1 $best Mo hinh toi uu GARCH(1,1) ...AIC = -11478.51 Warning messages: Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 58 1: In garch(DataTimeSeries, order = c(i1, i2), trace = FALSE) : singular information 2: In sqrt(pred$e) : NaNs produced Chỉ số AIC của GARCH(1,1) nhở hơn só với mô hình ARCH(8). Ta chọn mô hình GARCH(1,1) để dự báo cho phương sai. Bước 5: Ước lượng mô hình Ta có bảng kết quả ước lượng của mô hình như sau: > fit2<-garch(res,order=c(1,1),trace=0) Warning message: In sqrt(pred$e) : NaNs produced > summary(fit2) Call: garch(x = res, order = c(1, 1), trace = 0) Model: GARCH(1,1) Residuals: Min 1Q Median 3Q Max -9.67232 -0.55306 -0.00464 0.538362 6.086255 Coefficient(s): Estimate Std. Error t value Pr(>|t|) a0 1.32E-05 6.76E-07 19.55 <2e-16 *** a1 2.69E-01 2.00E-02 13.46 <2e-16 *** b1 7.43E-01 1.28E-02 58.01 <2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Diagnostic Tests: Jarque Bera Test data: Residuals X-squared = 7449.6, df = 2, p-value < 2.2e-16 Box-Ljung test data: Squared.Residuals X-squared = 0.093516, df = 1, p-value = 0.7598 Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 59 Tất cả các hệ số của mô hình đều có ý nghĩa thống kê. Giá trị p-value của kiểm định Ljung-Box là 0.7598 > 0.05 ta nói chuỗi sai số của mô hình là nhiễu trắng. Mô hình là đầy đủ và có thể dùng để dự báo. Bước 6: Dự báo > forecastGARCH(fitGARCH=fit2,fitARMA=fit1,trace=TRUE,r=7) $ARCH a0 a1 b1 1.32e-05 2.69e-01 7.43e-01 $ARMA ma1 sma1 intercept 0.151356 0.090348 -0.00014 $forecast Point res res^2 SSL.forecast VAR.forecast 1 (440,4) 0.00892 7.96E-05 0.0002482 2 (440,5) 0.0017134 0.0002189 > sqrt( 0.0002189) [1] 0.01479527 Theo kết quả dự báo vào ngày 30/09/2015 (ngày tiếp theo của chuỗi) suất sinh lợi kỳ vọng của chỉ số chứng khoáng ACB sẽ tăng khoảng 0.17% với độ lệch chuẩn dự kiến sẽ là 1.48%. 3.2. Mô hình ARMAX–GARCH Sử dụng nguồn số liệu chỉ số chứng khoán ACB để phân tích mô hình, xem các ngày lễ có ảnh hưởng như thế nào đến biến động của thị trường chứng khoáng ta tiến hành kiểm định mô hình ARMAX – GARCH như sau: Ta tạo ra chuỗi dữ liệu suất sinh lợi với 2199 quan sát và biến giả dummy được hiểu là các ngày lễ lớn trong năm. Theo các dòng lệnh bên dưới để tính chuỗi tỷ suất sinh lợi và chuỗi biến giả dummy. > #Load dữ liệu > event<-read.csv(file.choose(),header=TRUE) > data<-read.csv(file.choose(),header=TRUE) > temp<-data[,c(2,6,15,16)] > close<-temp > for(i in 1:dim(close)[1]) close[i,]<-temp[length(data[,6])-i+1,] > #Tạo biến giả > dummy<-rep(0,dim(close)[1]) > for(i in 1:length(dummy)){ Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 60 + for(j in 1:dim(event)[1]){ + if(close[i,3]==event[j,1] & close[i,4]==event[j,2]) + dummy[i]<-1 + }} > dummy<-dummy[-1] > dt<-ts(close[,2],start=c(1,1),frequency=5) > ln.dt<-log(dt) > SSL<-diff(ln.dt) Sau khi thực hiện các dòng lệnh trên, chuỗi tỷ suất sinh lợi được gán trong đối tượng SSL và chuỗi biến giả được gán trong đối tượng dummy. Ta tìm một mô hình ARMAX cho chuỗi SSL với biến giả là dummy. Thực hiện các bước phân tích tương tự như mục 2.3.2 ta tìm được mô hình tối ưu là SARIMAX(0,0,1)x(0,0,1),s=5. > fit1<-arimax(SSL,order=c(0,0,1),sea=list(order=c(0,0,1),5),xreg=dummy) > res<-resid(fit1) > tsnew<-res^2 Thực hiện tương tự mục 3.1 ta thấy chuỗi có hiệu ứng ARCH và tìm được mô hình tối ưu là ARCH(8). > fit2<-garch(res,order=c(0,8),trace=0) Warning message: In sqrt(pred$e) : NaNs produced Dự báo Ngày tiếp theo của chuỗi là ngày 30/09/2015 không trùng vào ngày lễ nào trong năm nên giá trị biến giả sẽ là 0. > forecastGARCH(fitGARCH=fit2,fitARMA=fit1,trace=TRUE,r=7,newxreg=0) $ARCH a0 a1 a2 a3 a4 a5 5.57e-05 3.59e-01 2.64e-01 7.51e-02 6.82e-02 7.64e-02 a6 a7 a8 5.56e-02 1.70e-02 1.65e-01 $ARMA ma1 sma1 intercept xreg 0.151617 0.091441 -0.00031 0.001522 $forecast Point res res^2 SSL.forecast VAR.forecast 1 (439,2) 0.008095 8.21E-05 2 (439,3) -0.00038 0.000464 3 (439,4) -0.00347 6.84E-05 4 (439,5) 0.004703 6.11E-05 5 (440,1) 0.007817 2.21E-05 6 (440,2) 0.008268 1.20E-05 Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 61 7 (440,3) -0.02154 1.00E-07 8 (440,4) 0.009061 6.55E-05 9 (440,5) 0.0014507 0.00023 > sd<-sqrt( 0.0012795) > sd [1] 0.0357701 Theo kết quả mô hình ARCH(8), vào ngày 30/09/2015 không trùng vào ngày lễ nào trong năm nên ta có suất sinh lợi kỳ vọng của chỉ số chứng khoán ACB thay đổi không đáng kể (giảm khoảng 0.33%) với độ lệch chuẩn dự kiến sẽ là 3.58%. Phân tích chuỗi thời gian với sự hỗ trợ của package AnalyzeTS 62 TÀI LIỆU THAM KHẢO [1] Hồng Việt Minh, Luận văn tốt nghiệp Đại học: Phân tích số liệu thống kê với ngôn ngữ R. [2] Mai Thị Hồng Diễm, Luận văn tốt nghiệp Đại học: Phân tích chuỗi tài chính bằng mô hình chuỗi thời gian.

Các file đính kèm theo tài liệu này:

phan_tich_chuoi_thoi_gian_voi_su_ho_tro_cua_package_analyzets_5969.pdf