Luận văn Thạc sĩ Khoa học máy tính: Nghiên cứu một số kỹ thuật ngoại suy và ứng dụng
lượt xem 3
download
Nội dung chính của luận văn được trình bày trong 3 chương: Chương 1 - Giới thiệu chung về dữ liệu chuỗi thời gian; Chương 2 - Một số kỹ thuật ngoại suy; Chương 3 - Áp dụng kỹ thuật ngoại suy vào bài toán dự báo. Mời các bạn cùng tham khảo!
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Luận văn Thạc sĩ Khoa học máy tính: Nghiên cứu một số kỹ thuật ngoại suy và ứng dụng
- I ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG --------------------------------------- NGUYỄN THỊ NGỌC TÚ NGHIÊN CỨU MỘT SỐ KỸ THUẬT NGOẠI SUY VÀ ỨNG DỤNG Chuyên ngành: Khoa học máy tính Thái Nguyên - 2015 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- II LỜI CAM ĐOAN Tôi xin cam đoan Luận văn " Nghiên cứu một số kỹ thuật ngoại suy và ứng dụng " đã đƣợc thực hiện theo đúng mục tiêu đề ra dƣới sự hƣớng dẫn của TS. Nguyễn Văn Huân. Kết quả đạt đƣợc trong luận văn là sản phẩm của cá nhân tôi. Trong toàn bộ luận văn, những điều đƣợc trình bày là của cá nhân và đƣợc tổng hợp từ nhiều nguồn tài liệu. Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và đƣợc trích dẫn hợp pháp. Tôi xin chịu hoàn toàn trách nhiệm và chịu mọi hình thức kỷ luật theo quy định cho lời cam đoan của mình. Thái Nguyên, ngày tháng năm 2015 Người cam đoan Nguyễn Thị Ngọc Tú Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- III LỜI CẢM ƠN Tôi xin bày tỏ lời cảm ơn chân thành tới tập thể các thầy cô giáo Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam, các thầy cô giáo trƣờng Đại học Công nghệ thông tin và Truyền thông - Đại học Thái Nguyên đã tận tình giảng dạy cũng nhƣ tạo mọi điều kiện để tôi học tập và nghiên cứu trong 2 năm học cao học. Tôi xin chân thành cảm ơn sâu sắc tới thầy giáo TS. Nguyễn Văn Huân đã cho tôi nhiều sự chỉ bảo quý báu, đã tận tình hƣớng dẫn và tạo điều kiện cho tôi hoàn thành tốt luận văn tốt nghiệp này. Quá trình thực hiện đề tài không tránh khỏi các thiếu sót, tôi rất mong tiếp tục nhận đƣợc sự đóng góp ý kiến của các thầy giáo, cô giáo, các bạn đồng nghiệp đối với đề tài nghiên cứu của tôi để đề tài đƣợc hoàn thiện hơn. Tôi xin chân thành cảm ơn! Thái Nguyên, ngày tháng năm 201 Người cam đoan Nguyễn Thị Ngọc Tú Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- IV MỤC LỤC LỜI CAM ĐOAN ..........................................................................................................I LỜI CẢM ƠN ............................................................................................................. III DANH MỤC HÌNH VẼ ............................................................................................IV DANH MỤC BẢNG BIỂU ...................................................................................VIII MỤC LỤC ...................................................................................................................IV MỞ ĐẦU........................................................................................................................ 1 Chƣơng 1 GIỚI THIỆU CHUNG VỀ DỮ LIỆU CHUỖI THỜI GIAN ............ 5 1.1. Khái niệm Dữ liệu ............................................................................................ 5 1.1.1. Dữ liệu định tính và dữ liệu định lƣợng .............................................. 5 1.1.2. Dữ liệu sơ cấp và dữ liệu thứ cấp........................................................ 5 1.2. Chuỗi thời gian và Dữ liệu chuỗi thời gian ................................................... 7 1.2.1. Chuỗi thời gian .................................................................................... 7 1.2.2. Dữ liệu chuỗi thời gian...................................................................... 12 1.3. Tổng quan về dự báo ...................................................................................... 16 1.3.1. Đặc điểm của dự báo ......................................................................... 16 1.3.2. Các loại dự báo.................................................................................. 17 1.3.3. Các phƣơng pháp dự báo .................................................................. 21 Chƣơng 2 MỘT SỐ KỸ THUẬT NGOẠI SUY ..................................................22 2.1. Khái niệm ngoại suy ...................................................................................... 22 2.1.1. Khái niệm ngoại suy.......................................................................... 22 2.1.2. Khi nào nên sử dụng phƣơng pháp ngoại suy để dự báo. ................. 22 2.1.3. Ƣu nhƣợc điểm của phƣơng pháp ngoại suy .................................... 23 2.1.4. Tính chính xác của dự báo ................................................................ 23 2.1.5. Ứng dụng của kỹ thuật ngoại suy vào bài toán dự báo ..................... 25 2.2. Ngoại suy dựa dựa vào mô hình hồi quy tuyến tính .................................. 26 2.2.1. Bài toán hồi quy ................................................................................ 26 2.2.2. Các phƣơng pháp đƣa về dạng tuyến tính ......................................... 29 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- V 2.2.3. Hồi quy nhiều chiều (Hồi quy bội) ................................................... 30 2.3. Ngoại suy bằng phƣơng pháp trung bình động giản đơn (moving average forecast) ................................................................................................................... 31 2.4. Ngoại suy bằng phƣơng pháp san bằng mũ (Exponential Smoothing Methods) .................................................................................................................. 33 2.5. Ngoại suy dựa vào mô hình san mũ Holt- Winters. ................................... 36 2.5.1. San mũ Holt....................................................................................... 36 2.5.2. San mũ Holt- Winters ....................................................................... 37 2.6. Ngoại suy dựa vào mô hình ARIMA (AutoRegressive Integrated Moving Average) .................................................................................................................. 39 2.6.1. Các công cụ áp dụng trong mô hình ................................................. 40 2.6.2. Mô hình AR(p) (Auto Regression) ................................................... 44 2.6.3. Mô hình MA(q) (Moving Average) .................................................. 45 2.6.4. Sai phân I(d) ...................................................................................... 46 2.6.5. Mô hình ARIMA ............................................................................... 47 2.6.6. Các bƣớc phát triển mô hình ARIMA. ............................................. 48 2.7. Các bƣớc tiến hành ngoại suy ....................................................................... 49 Chƣơng 3 ÁP DỤNG KỸ THUẬT NGOẠI SUY VÀO BÀI TOÁN DỰ BÁO .52 3.1. Mô hình ARIMA cho dự báo tài chính, chứng khoán ............................... 52 3.1.1. Dữ liệu tài chính ................................................................................ 52 3.1.2. Mô hình ARIMA cho bài toán dự báo tài chính ............................... 52 3.1.3. Thiết kế mô hình ARIMA cho dữ liệu .............................................. 53 3.2. Áp dụng ........................................................................................................... 55 3.2.1. Môi trƣờng thực nghiệm ................................................................... 55 3.2.2. Dữ liệu ............................................................................................... 55 3.2.3. Kiểm tra tính dừng của chuỗi chứng khoán VNM ........................... 57 3.2.4. Nhận dạng mô hình ........................................................................... 57 3.2.5. Ƣớc lƣợng và kiểm định với mô hình ARIMA ................................ 60 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- VI 3.2.6 Thực hiện dự báo................................................................................ 62 KẾT LUẬN .................................................................................................................64 TÀI LIỆU THAM KHẢO ........................................................................................65 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- VII DANH MỤC HÌNH VẼ Hình 1.1. Xu hƣớng giảm theo thời gian ........................................................ 13 Hình 1.2. Thành phần mùa .............................................................................. 14 Hình 1.3. Thành phần chu kỳ .......................................................................... 15 Hình 3.1: chọn giadongcua làm mục tiêu dự báo ........................................... 56 Hình 3.2: Xác định d = 0,1,2 ? ........................................................................ 57 Hình 3.3: Biểu đồ của SAC và SPAC của chuỗi giadongcua ........................ 58 Hình 3.4: Biểu đồ của SPAC và SAC ứng với d=1 ........................................ 59 Hình 3.5: Ƣớc lƣợng mô hình ARIMA(2,1,1) ................................................ 60 Hình 3.6: Kết quả mô hình ARIMA(2,1,1) ..................................................... 60 Hình 3.7: Kiểm tra phần dƣ có nhiễu trắng..................................................... 61 Hình 3.8: Dự báo ............................................................................................. 62 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- VIII DANH MỤC BẢNG BIỂU Bảng 3.1: Dữ liệu đầu vào............................................................................... 56 Bảng 3.2: Tiêu chuẩn đánh giá các mô hình ARIMA..................................... 62 Bảng 3.3: Đánh giá dự báo .............................................................................. 63 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- 1 MỞ ĐẦU Sự phát triển mạnh mẽ của Công nghệ thông tin và Truyền thông đã kéo theo nhiều lĩnh vực khác phát triển nhƣ khoa học máy tính, đồ họa máy tính, khí tƣợng thủy văn, tự động hóa, thiết kế - xây dựng, kinh tế, tài chính, giáo dục và đào tạo, y tế,… Điều này đã góp phần vào sự nghiệp công nghiệp hóa – hiện đại hóa đất nƣớc. Trong thực tế, đối với mỗi quốc gia, trong đó có Việt Nam muốn phát triển và trở thành các nƣớc công nghiệp thì một trong những vấn đề không thể thiếu là phải nghiên cứu, khảo sát, phân tích tình hình phát triển của đất nƣớc trong lịch sử và hiện tại để làm cơ sở cho việc ngoại suy hay suy luận, xây dựng các kế hoạch phát triển trong tƣơng lai với tất cả các lĩnh vực, ngành nghề,… Vì ngoại suy hay suy luận là một khoa học và nghệ thuật tiên đoán những sự việc sẽ xảy ra trong tƣơng lai, trên cơ sở phân tích khoa học về các dữ liệu đã thu thập đƣợc. Khi tiến hành ngoại suy cần căn cứ vào việc thu thập, xử lý số liệu trong quá khứ và hiện tại để xác định xu hƣớng vận động của các hiện tƣợng trong tƣơng lai nhờ vào một số mô hình toán học (Định lƣợng). Tuy nhiên, ngoại suy cũng có thể là một ngoại suy chủ quan hoặc trực giác về tƣơng lai (Định tính) và để ngoại suy định tính đƣợc chính xác hơn, ngƣời ta cố loại trừ những tính chủ quan của đối tƣợng ngoại suy. Ngoại suy trƣớc hết là một thuộc tính không thể thiếu của tƣ duy của con ngƣời, con ngƣời luôn luôn nghĩ đến ngày mai, hƣớng về tƣơng lai. Trong thời đại công nghệ thông tin và toàn cầu hóa, ngoại suy lại đóng vai trò quan trọng hơn khi nhu cầu về thông tin thị trƣờng, tình hình phát triển tại thời điểm nào đó trong tƣơng lai càng cao. Ngoại suy đƣợc sử dụng trong nhiều lĩnh vực khác nhau, mỗi lĩnh vực có một yêu cầu về ngoại suy riêng nên phƣơng pháp ngoại suy đƣợc sử dụng cũng khác nhau. Trong ngoại suy, các đại lƣợng khảo sát thƣờng không đƣợc cho dƣới dạng hàm liên tục. Trong khi đó, các phƣơng pháp giải tích toán học thƣờng Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- 2 tính toán với các hàm cho bởi các công thức, do đó chúng ta không thể áp dụng trực tiếp các hàm cho dƣới dạng rời rạc nhƣ thế này. Cũng có khi ta biết rằng đại lƣợng y là một hàm của đại lƣợng x , tức là y = f (x ), nhƣng ta không biết biểu thức hàm f (x )mà chỉ biết một số giá trị y i ứng với các giá trị của x tại các điểm x i . Thông thƣờng x 0 < x 1 < x 2 < ... < x n và các điểm này có thể phân bố cách đều hoặc không cách đều nhau. Mặc dù ta chỉ biết giá trị của y tại các điểm mốc x i nhƣng trong nhiều trƣờng hợp ta cần tính toán với các giá trị y tại các vị trí khác của x . Một vấn đề đƣợc đặt ra là cho một điểm x không thuộc các điểm x i thì làm thế nào ta có thể tính đƣợc giá trị y tƣơng ứng với nó, sao cho chúng ta tận dụng tối đa các thông tin đã có. Nếu giả định giá trị cần tìm gần đúng của y tại các điểm x nằm trong khoảng éx , x ù thì chúng ta êë 0 n ú û áp dụng các bài toán nội suy. Nhƣng trong thực tế, các bài toán không phải lúc nào các điểm x cũng nằm trong khoảng éêëx 0, x n ù û, chẳng hạn nhƣ một số các bài toán về ngoại suy: ú (1). Trong tƣơng lai các tình huống sẽ tiếp tục diễn ra nhƣ đã xảy ra trong quá khứ; (2). Đối tƣợng ngoại suy quá bi quan hoặc ngƣợc lại quá lạc quan về tình huống cần ngoại suy khi đó kết quả ngoại suy có thể bị ảnh hƣởng sai lệch; (3). Đối tƣợng ngoại suy không biết nhiều lắm về tình huống ngoại suy. Khi đó chúng ta cần giả định rằng diễn biến trong tƣơng lai cũng sẽ tƣơng tự nhƣ trong quá khứ. Với các bài toán trên thì x chắc chắn sẽ nằm ngoài khoảng éx , x ù, và nhƣ vậy thì để tìm giá trị gần đúng của y , chúng ta không thể áp êë 0 n ú û dụng đƣợc phƣơng pháp nội suy [1]. Nhằm tìm ra giá trị gần đúng của y , một trong những phƣơng pháp đƣợc sử dụng phổ biến hiện này là áp dụng phƣơng pháp ngoại suy. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- 3 Ngoại suy (Extrapolation) là dựa trên những số liệu đã có về một đối tƣợng đƣợc quan tâm để đƣa ra suy đoán về hành vi của đối tƣợng đó trong tƣơng lai. Ngoại suy có 2 dạng chính là ngoại suy theo số liệu lát cắt và ngoại suy theo chuỗi số liệu lịch sử. [12] Ngoại suy theo số liệu lát cắt (Extrapolation for cross-sectional data) là dựa trên hành vi của một số thành phần tại một thời điểm nào đó để ngoại suy về hành vi của các thành phần khác cũng tại thời điểm đó. Ngoại suy theo chuỗi số liệu (Time-series extrapolation) là dựa trên chuỗi số liệu lịch sử và sử dụng mô hình toán học để đƣa ra kết quả ngoại suy đối với biến quan tâm. Giả thiết cơ bản là hành vi của biến đƣợc ngoại suy sẽ tiếp tục trong tƣơng lai nhƣ đã diễn ra trong quá khứ. Xuất phát từ vai trò của bài toán ngoại suy trong thực tế, đề tài luận văn đƣợc lựa chọn “Nghiên cứu một số kỹ thuật ngoại suy và ứng dụng”. Trên cơ sở nghiên cứu một số kỹ thuật ngoại suy, ý nghĩa và tính chất ứng dụng của chúng và đề xuất việc áp dụng kỹ thuật ngoại suy vào bài toán trong tƣơng lai cho một số bài toán cụ thể. Nội dung chính của luận văn đƣợc trình bày trong 3 chƣơng: Chương 1: Giới thiệu chung về dữ liệu chuỗi thời gian. Chương 2: Một số kỹ thuật ngoại suy. Chương 3: Áp dụng kỹ thuật ngoại suy vào bài toán dự báo. Luận văn này đƣợc hoàn thành dƣới sự hƣớng dẫn tận tình của TS Nguyễn Văn Huân, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối với thầy. Tuy nhiên vì điều kiện thời gian và khả năng có hạn nên luận văn không thể tránh khỏi những thiếu sót. Tác giả rất mong các thầy giáo và bạn đóng góp ý kiến để đề tài đƣợc hoàn thiện hơn. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- 5 Chƣơng 1 GIỚI THIỆU CHUNG VỀ DỮ LIỆU CHUỖI THỜI GIAN 1.1. Khái niệm Dữ liệu 1.1.1. Dữ liệu định tính và dữ liệu định lượng a) Dữ liệu định tính: Nghiên cứu định tính điển hình là liên quan đến phỏng vấn mặt đối mặt với ngƣời trả lời để hiểu rõ hơn những suy nghĩ và cảm giác của họ. Có 2 loại nghiên cứu định tính phổ biến là thảo luận bàn tròn và phỏng vấn cá nhân. b) Dữ liệu định lượng Nghiên cứu định lƣợng liên quan đến các qui trình có tính hệ thống cao hơn nhằm có đƣợc và phân tích các dữ liệu dƣới dạng các con số. 1.1.2. Dữ liệu sơ cấp và dữ liệu thứ cấp a) Dữ liệu sơ cấp Là những dữ liệu mà nhà nghiên cứu thu thập trực tiếp tại nguồn dữ liệu và xử lý nó để phục vụ cho việc nghiên cứu đặt ra. Hay nói cách khác, dữ liệu sơ cấp là dữ liệu do chính ngƣời nghiên cứu thu thập. b) Dữ liệu thứ cấp Dữ liệu thứ cấp là dữ liệu do ngƣời khác thu thập, sử dụng cho các mục đích có thể là khác với mục đích nghiên cứu của chúng ta. Dữ liệu thứ cấp có thể là dữ liệu chƣa xử lý (còn gọi là dữ liệu thô) hoặc dữ liệu đã xử lý. Nhƣ vậy, dữ liệu thứ cấp không phải do ngƣời nghiên cứu trực tiếp thu thập. Có nhiều nhà nghiên cứu, sinh viên đánh giá thấp nguồn dữ liệu thứ cấp có sẵn. Vì vậy chúng ta bắt đầu xem xét sự hợp lý của nguồn dữ liệu thứ cấp đối với vấn đề nghiên cứu của chúng ta trƣớc khi tiến hành thu thập dữ liệu của chính mình. Các cuộc điều tra về dân số, nhà ở, điều tra doanh nghiệp, điều tra mức sống dân cƣ, điều tra kinh tế xã hội gia đình (đa mục tiêu)... do chính phủ yêu cầu là những nguồn dữ liệu rất quan trọng cho các nghiên cứu kinh tế xã hội. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- 6 Ngoài ra một số nguồn dữ liệu dƣới đây có thể là quan trọng cho các nghiên cứu của chúng ta bao gồm: Các báo cáo của chính phủ, bộ ngành, số liệu của các cơ quan thống kê về tình hình kinh tế xã hội, ngân sách quốc gia, xuất nhập khẩu, đầu tƣ nƣớc ngoài, dữ liệu của các công ty về báo cáo kết quả tình hình hoạt động kinh doanh, nghiên cứu thị trƣờng... Các báo cáo nghiên cứu của cơ quan, viện, trƣờng đại học. Các bài viết đăng trên báo hoặc các tạp chí khoa học chuyên ngành và tạp chí mang tính hàn lâm có liên quan. Tài liệu giáo trình hoặc các xuất bản khoa học liên quan đến vấn đề nghiên cứu. Cuối cùng nhƣng không kém phần quan trọng là các bài báo cáo hay luận văn của các sinh viên khác (khóa trƣớc) trong trƣờng hoặc ở các trƣờng khác. Dữ liệu thứ cấp có ƣu điểm là giúp tiết kiệm tiền bạc, thời gian. Nhƣng cần chú ý đến nhƣợc điểm trong sử dụng là: Số liệu thứ cấp này đã đƣợc thu thập cho các nghiên cứu với các mục đích khác và có thể hoàn toàn không hợp với vấn đề của chúng ta; khó phân loại dữ liệu; các biến số, đơn vị đo lƣờng có thể khác nhau... Dữ liệu thứ cấp thƣờng đã qua xử lý nên khó đánh giá đƣợc mức độ chính xác, mức độ tin cậy của nguồn dữ liệu. Vì vậy trách nhiệm của ngƣời nghiên cứu là phải đảm bảo tính chính xác của dữ liệu, phải kiểm tra xem các kết quả nghiên cứu của ngƣời khác là dựa vào dữ liệu thứ cấp hay sơ cấp. Vì vậy điều quan trọng là phải kiểm tra dữ liệu gốc. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- 7 1.2. Chuỗi thời gian và Dữ liệu chuỗi thời gian 1.2.1. Chuỗi thời gian 1.2.1.1. Khái niệm chuỗi thời gian. Khái niệm chuỗi thời gian: Chuỗi các quan sát đƣợc thu thập trên cùng một đối tƣợng tại các mốc thời gian cách đều nhau đƣợc gọi là chuỗi thời gian. Các quan sát này có thể đo đƣợc một cách liên tục theo thời gian hoặc là có thể đƣợc lấy theo một tập rời rạc các thời điểm khác nhau. Một chuỗi thời gian là một dãy các giá trị quan sát X := {x 1, x 2,..., x n }đƣợc xếp thứ tự diễn biến thời gian với x 1 là các giá trị quan sát tại thời điểm đầu tiên, x 2 là quan sát tại thời điểm thứ hai và x n là quan sát tại thời điểm thứ n . Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tăng cƣờng hay chỉ số tiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian. Bƣớc đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán học phù hợp với tập dữ liệu cho trƣớc X := {x 1, x 2,..., x n } nào đó. Để có thể nói về bản chất của những quan sát chƣa diễn ra, ta giả thiết mỗi quan sát x n là một giá trị thể hiện của biến ngẫu nhiên X t với t Î T . Ở đây T đƣợc gọi là tập chỉ số. Khi đó ta có thể coi tập dữ liệu X := {x 1, x 2,..., x n }là thể hiện của quá trình ngẫu nhiên {X t , t Î T }. Và vì vậy, ta có thể định nghĩa một quá trình ngẫu nhiên nhƣ sau: Định nghĩa 1.1 (Quá trình ngẫu nhiên) Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên {X t , t Î T } đƣợc định nghĩa trên một không gian xác suất (W, A, P ). Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- 8 Chú ý: Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm, ví dụ nhƣ là tập {1, 2,...}hay tập (- ¥ , + ¥ ). Tất nhiên cũng có những quá trình ngẫu nhiên có T không phải là một tập con của R nhƣng trong giới hạn của luận văn này ta chỉ xét cho trƣờng hợp T Î R . Và thƣờng thì ta xem T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z thay vì T ở trên. Một điểm chú ý nữa là trong luận văn này chúng ta sẽ dùng thuật ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng nhƣ quá trình có dữ liệu đó là một thể hiện. Trong các dạng dữ liệu đƣợc phân tích thì dữ liệu chuỗi thời gian luôn thuộc tốp đầu về tính phổ biến 1.2.1.2. Quá trình ngẫu nhiên dừng Định nghĩa 1.2 (Hàm tự hiệp phƣơng sai) Giả sử {X t , t Î Z }là một quá trình ngẫu nhiên có V ar (X t ) < ¥ với mỗi t Î Z . Khi đó hàm tự hiệp phương sai của X t được định nghĩa theo công thức sau: gx (r , s ) := cov(X r , X s ) = E [(X r - E X r )(X s - EX s )], với r , s Î Z . Định nghĩa 1.3 (Quá trình dừng) Chuỗi thời gian {X t , t Î Z } được gọi là dừng nếu nó thoả mãn 3 điều kiện sau: 2 - E Xt < ¥ , " t Î Z - EX t = m , " t Î Z - gx (r , s ) = gx (r + t , s + t ), " t , r , s Î Z Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- 9 Định lý 1.1 Nếu {X t , t Î Z }là một quá trình dừng, và nếu như at Î R , i Î Z thoả ¥ ¥ mãn điều kiện å i= - ¥ ai < ¥ thì hệ thức Y t := å i= - ¥ ai X t -i, t Î Z sẽ định nghĩa một quá dừng. Chú ý: Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu, dừng theo nghĩa rộng hay dừng bậc hai. Tuy nhiên trong giới hạn luận văn chỉ xem xét tính dừng theo định nghĩa ở trên. Khi chuỗi thời gian {X t , t Î Z }là dừng thì yx = (r , s ) º gx (r - s, 0), " r , s Î Z , Và vì vậy, với một quá trình dừng thì có thể định nghĩa lại hàm tự hiệp phƣơng sai bằng cách chỉ thông qua hàm một biến. Khi đó, với quá trình dừng {X , t Î Z }ta có: t yx (h ) º gx (h, 0) = Cov(X t + h , X t ), " t , h Î Z Hàm số y x (.) = đƣợc gọi là hàm tự hiệp phƣơng sai của X t , còn gx (h )là giá trị của nó tại “trễ” h . Đối với một quá trình dừng thì ta thƣờng ký hiệu hàm tự hiệp phƣơng sai bởi g () . thay vì g x () . . Với một quá trình dừng thì hàm hiệp phƣơng sai có các tính chất g (0) ³ 0 , g (h ) £ g (0), " h Î Z Và nó còn là một hàm chẵn nghĩa là: g (h ) = g (- h ), " h Î Z 1.2.1.3. Hàm tự tương quan Định nghĩa 1.4 Hàm tự tương quan của quá trình ngẫu nhiên {X t , t Î Z } được định nghĩa tại trễ h như sau: Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- 10 r (h ) := g(h ) / g(0) = Corr (X t + h , X t ), " t , h Î Z Chú ý: Trong thực tế, ta chỉ quan sát đƣợc một thể hiện hữu hạn X := {x t , t = 1, 2,..., n } của một chuỗi thời gian dừng nên về nguyên tắc ta không thể biết chính xác đƣợc các hàm tự hiệp phƣơng sai của chuỗi thời gian đó, muốn ƣớc lƣợng nó ta đƣa vào khái niệm hàm tự hiệp phƣơng sai mẫu của thể hiện X . Hàm tự hiệp phƣơng sai mẫu của một thể hiện X đƣợc định nghĩa bởi công thức: n- h c(h ) := n - 1n - 1 å (x j - x )(x j + h - x ), 0 £ h < n j= 1 n Và c(h ) := c(- h ), n < h £ 0, trong đó x = n - 1 å j=1 x j là trung bình mẫu. Khi đó thì hàm tƣơng tự tƣơng quan mẫu cũng định nghĩa thông qua hàm tự hiệp phƣơng sai mẫu nhƣ sau: r (h ) := c(h ) / c(0), h < n . 1.2.1.4. Tính chất của chuỗi thời gian Các tính chất đặc trƣng của chuỗi thời gian là: Tính dừng và tính mùa vụ. Dù một chuỗi thời gian có thể biểu hiện một hoặc nhiều tính chất nhƣng khi trình bày, phân tích và dự báo giá trị của chuỗi thời gian thì mỗi tính chất đƣợc xử lý tách rời. a) Tính dừng Một dãy số liệu theo thời gian có giá trị trung bình và phƣơng sai không đổi theo thời gian thì dãy số đƣợc xem nhƣ có tính dừng hay còn gọi là ổn định. Trong trƣờng hợp ngƣợc lại, ta nói dãy số liệu đó không có tính dừng. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- 11 Xét dãy số Y t , về mặt toán học, một dãy số liệu có tính dừng phải thỏa mãn các điều kiện sau: E (Y t ) = V ar (Y t ) = C ovar (Y t ,Y t - k ) Trung bình: E (Y t ) = Const Phƣơng sai: V ar (Y t ) = Const Đồng phƣơng sai: Covar (Y t ,Y t - k ) = gk Chuỗi Y t đƣợc gọi là không dừng nếu vi phạm điều kiện trên. Nếu chuỗi Y t không dừng, ta có thể lấy sai phân bậc 1. Khi đó chuỗi sai phân bậc 1 ( Wt ) sẽ có thể dừng. Sai phân bậc 1: Wt = Y t - Y t - 1 Nếu chuỗi sai phân bậc 1 ( Wt ) không dừng, ta có thể lấy sai phân bậc 2. Khi đó chuỗi sai phân bậc 2 có thể dừng. Sai phân bậc 2: V t = Wt - Wt - 1 . Chuỗi dừng có xu hƣớng trở về giá trị trung bình và những dao động quanh giá trị trung bình sẽ là nhƣ nhau. Nói cách khác, một chuỗi thời gian không dừng sẽ có giá trị trung bình thay đổi theo thời gian, hoặc giá trị phƣơng sai thay đổi theo thời gian hoặc cả hai. b) Tính mùa vụ Nếu sai phân bậc 2 mà chƣa dừng, có thể chuỗi Y t có yếu tố mùa vụ. (Nếu có yếu tố mùa vụ, tức là chuỗi vẫn chƣa dừng). Nếu cứ sau m thời đoạn, SAC lại có giá trị cao. Khi đó Y t có tính mùa vụ với chu kỳ m thời đoạn. Phƣơng pháp đơn giản nhất để khử tính mùa vụ là lấy sai phân thứ m Zt = Y t - Y t- m Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- 12 1.2.2. Dữ liệu chuỗi thời gian. 1.2.2.1. Khái niệm Dữ liệu chuỗi thời gian. Mặt lƣợng của hiện tƣợng thƣờng xuyên biến động qua thời gian. Trong thống kê để nghiên cứu sự biến động này ta thƣờng dựa vào dữ liệu chuỗi thời gian. Dữ liệu chuỗi thời gian là dãy số các trị số của chỉ tiêu thống kê đƣợc sắp xếp theo thứ tự thời gian. Dữ liệu chuỗi thời gian còn đƣợc phân biệt theo tần suất xuất hiện: số liệu theo năm, số liệu theo quý, số liệu theo tháng… Ví dụ: - Số lƣợng hàng bán đƣợc trong 12 tháng của một công ty. - Các gía trị của chuỗi thời gian của đại lƣợng X đƣợc ký hiệu X 1, X 2,...X t ,...X n , với X t là gía trị quan sát của X ở thời điểm t . Dữ liệu chuỗi thời gian có hai thành phần: - Thời gian: có thể là ngày, tuần, tháng, quí, năm,.... Độ dài giữa hai thời gian liền nhau đƣợc gọi là khoảng cách thời gian. - Chỉ tiêu về hiện tƣợng nghiên cứu: chỉ tiêu này có thể là số tuyệt đối, số tƣơng đối, số bình quân. Trị số của chỉ tiêu còn gọi là mức độ của dãy số. * Phân loại dãy số thời gian: Căn cứ vào tính chất thời gian của dữ liệu, có thể phân biệt thành 2 loại: 1. Dữ liệu thời kỳ: là dãy số biểu hiện mặt lƣợng của hiện tƣợng qua từng thời kỳ nhất định. 2. Dữ liệu thời điểm: là loại dãy số biểu hiện mặt lƣợng của hiện tƣợng qua các thời điểm nhất định. Dãy số này còn đƣợc phân biệt thành 2 loại: - Dữ liệu thời điểm có khoảng cách thời gian đều nhau. 1.2.2.2. Các thành phần của dữ liệu chuỗi thời gian Các nhà thống kê thƣờng chia chuỗi theo thời gian thành 4 thành phần: - Thành phần xu hƣớng dài hạn (long –term trend component) Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- 13 - Thành phần mùa (seasional component) - Thành phần chu kỳ (cyclical component) - Thành phần bất thƣờng (irregular component) a) Thành phần xu hướng dài hạn Xu hƣớng dài hạn thể hiện sự tăng trƣởng hoặc giảm sút của một biến số theo thời gian với khoảng thời gian đủ dài. Một số biến số kinh tế có xu hƣớng tăng giảm dài hạn nhƣ - Tốc độ tăng dân số của Việt Nam có xu hƣớng giảm. - Tỷ trọng nông nghiệp trong GDP của Việt Nam có xu hƣớng giảm. - Mức giá có xu hƣớng tăng. Thành phần xu hƣớng dài hạn dùng để chỉ xu hƣớng tăng hay giảm của đại lƣợng X trong thời gian dài. Về mặt đồ thị thành phần này có thể biểu diễn bởi một đƣờng thẳng hay một đƣờng cong trơn. Hình 1.1. Xu hướng giảm theo thời gian Đƣợc sử dụng khi: - Tăng năng suất hay công nghệ mới làm thay đổi lối sống - Dân số tăng làm tăng nhu cầu hàng hóa/dịch vụ - Các biến bị ảnh hƣởng bởi lạm phát nhƣ lƣơng, chi phí sản xuất, sinh hoạt - Mức độ chấp nhận của thị trƣờng gia tăng Phƣơng pháp áp dụng: Phƣơng pháp trung bình trƣợt, san mũ (Holt), hồi quy đơn, đƣờng tăng trƣởng, mô hình mũ. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Tóm tắt luận văn thạc sĩ khoa học xã hội và nhân văn: Ảnh hưởng của văn học dân gian đối với thơ Tản Đà, Trần Tuấn Khải
26 p | 788 | 100
-
Tóm tắt luận văn thạc sĩ khoa học: Bài toán tô màu đồ thị và ứng dụng
24 p | 491 | 83
-
Luận văn thạc sĩ khoa học: Hệ thống Mimo-Ofdm và khả năng ứng dụng trong thông tin di động
152 p | 328 | 82
-
Tóm tắt luận văn thạc sĩ khoa học: Bài toán màu và ứng dụng giải toán sơ cấp
25 p | 370 | 74
-
Tóm tắt luận văn thạc sĩ khoa học: Bài toán đếm nâng cao trong tổ hợp và ứng dụng
26 p | 413 | 72
-
Tóm tắt luận văn thạc sĩ khoa học: Nghiên cứu thành phần hóa học của lá cây sống đời ở Quãng Ngãi
12 p | 542 | 61
-
Tóm tắt luận văn Thạc sĩ Khoa học: Nghiên cứu vấn đề an ninh mạng máy tính không dây
26 p | 517 | 60
-
Luận văn thạc sĩ khoa học Giáo dục: Biện pháp rèn luyện kỹ năng sử dụng câu hỏi trong dạy học cho sinh viên khoa sư phạm trường ĐH Tây Nguyên
206 p | 299 | 60
-
Tóm tắt luận văn thạc sĩ khoa học: Bài toán tìm đường ngắn nhất và ứng dụng
24 p | 343 | 55
-
Tóm tắt luận văn thạc sĩ khoa học: Bất đẳng thức lượng giác dạng không đối xứng trong tam giác
26 p | 311 | 46
-
Tóm tắt luận văn Thạc sĩ Khoa học xã hội và nhân văn: Đặc trưng ngôn ngữ và văn hóa của ngôn ngữ “chat” trong giới trẻ hiện nay
26 p | 319 | 40
-
Tóm tắt luận văn thạc sĩ khoa học: Bài toán ghép căp và ứng dụng
24 p | 263 | 33
-
Tóm tắt luận văn thạc sĩ khoa học xã hội và nhân văn: Phật giáo tại Đà Nẵng - quá khứ hiện tại và xu hướng vận động
26 p | 235 | 22
-
Tóm tắt luận văn Thạc sĩ Khoa học: Nghiên cứu ảnh hưởng của quản trị vốn luân chuyển đến tỷ suất lợi nhuận của các Công ty cổ phần ngành vận tải niêm yết trên sàn chứng khoán Việt Nam
26 p | 286 | 14
-
Tóm tắt luận văn Thạc sĩ Khoa học xã hội và nhân văn: Thế giới biểu tượng trong văn xuôi Nguyễn Ngọc Tư
26 p | 246 | 13
-
Tóm tắt luận văn Thạc sĩ Khoa học xã hội và nhân văn: Đặc điểm ngôn ngữ của báo Hoa Học Trò
26 p | 214 | 13
-
Tóm tắt luận văn Thạc sĩ Khoa học xã hội và nhân văn: Ngôn ngữ Trường thơ loạn Bình Định
26 p | 191 | 5
-
Luận văn Thạc sĩ Khoa học giáo dục: Tích hợp nội dung giáo dục biến đổi khí hậu trong dạy học môn Hóa học lớp 10 trường trung học phổ thông
119 p | 5 | 3
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn