intTypePromotion=3

Giáo trình Tin học ứng dụng: Phần 2

Chia sẻ: Minh Vũ | Ngày: | Loại File: PDF | Số trang:143

0
146
lượt xem
57
download

Giáo trình Tin học ứng dụng: Phần 2

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nối tiếp nội dung của phần 1 cuốn giáo trình "Tin học ứng dụng", phần 2 cung cấp cho người học các kiến thức: Phân tích hồi quy, tương quan và dự báo kinh tế; phân tích dữ liệu thống kê, phân tích độ nhạy và phân tích rủi ro. Đây là một tài liệu hữu ích dành cho các bạn sinh viên thuộc các ngành Quản trị kinh doanh, Kinh tế, Kế toán dùng làm tài liệu học tập và nghiên cứu.

Chủ đề:
Lưu

Nội dung Text: Giáo trình Tin học ứng dụng: Phần 2

  1. Chương bốn P H Â N T Í C H H Ò I Q U Y T Ư Ơ N G Q U A N V Ả D ự B Ả O K I N H T É 1. H Ỏ I Q U Y V À T Ư Ơ N G Q U A N C ă n cứ v à o m ứ c đ ộ chặt c h ẽ của quan h ệ giữa c á c b i ế n n g h i ê n cứu c ó t h ể p h â n chia quan h ệ của c h ú n g t h à n h quan h ệ h à m v à quan h ệ thống k ê . Q u a n h ệ h à m : hai b i ế n n g ẫ u n h i ê n X v à Y đ ư ợ c g ọ i là p h ụ thuộc h à m sô n ê u t ô n t ạ i f sao cho Y = f ( X ) tức là k h i đ ạ i l ư ợ n g X b i ế n đ ổ i thì theo m ộ t quy tắc n à o đ ó c ó t h ể x á c đ ị n h được g i á trị t ư ơ n g ứ n g đại lượng Y . Q u a n h ệ t h ố n g k ê : hai b i ế n n g ẫ u n h i ê n X v à Y đ ư ợ c g ọ i là p h ụ thuộc thống k ê n ế u m ỗ i g i á trị của X c ó t h ể x á c định đ ư ợ c quy luật p h â n p h ố i x á c suất c ó đ i ề u k i ệ n của Y : F(y/X = x) = P(Y>y/X = x) (4.1) Đây là sự phụ thuộc không hoàn toàn chặt chẽ tức là khi một h i ệ n t ư ợ n g b i ế n đ ổ i thì l à m cho h i ệ n t ư ợ n g liên quan b i ế n đ ổ i n h ư n g n ó k h ô n g c ó ảnh h ư ở n g h o à n t o à n q u y ế t đ ị n h đ ế n sự b i ế n đ ổ i n à y . P h â n t í c h t ư ơ n g q u a n đ o m ứ c đ ộ k ế t hợp t u y ế n t í n h giữa hai b i ế n . T r o n g đ ó , k h ô n g c ó sự p h â n b i ệ t giữa c á c b i ế n . C á c b i ế n c ó t í n h chất đ ố i x ứ n g . 149 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  2. P h â n t í c h h ồ i q u y n g h i ê n c ứ u m ố i liên h ệ p h ụ t h u ộ c của m ộ t b i ê n ( g ọ i là b i ế n p h ụ thuộc hay b i ế n đ ư ợ c g i ả i t h í c h ) v ớ i m ộ t hay n h i ê u b i ê n k h á c (được g ọ i l à b i ế n đ ộ c l ậ p hay b i ế n g i ả i t h í c h ) . 1.1. Phân tích tương quan M ụ c đ í c h của p h ư ơ n g p h á p p h â n t í c h t ư ơ n g quan là ư ớ c lượng m ứ c đ ộ ả n h h ư ở n g của c á c b i ế n đ ộ c l ậ p v ớ i nhau ( c á c y ế u t ố n g u y ê n n h â n ) . P h ư ơ n g p h á p n à y đ ư ợ c ứ n g dụng trong k i n h doanh v à k i n h tế đ ê p h â n t í c h m ố i liên h ệ giữa hai hay n h i ề u b i ế n n g ẫ u n h i ê n . H ệ sổ t ư ơ n g q u a n t ổ n g t h ể H ệ số t ư ơ n g quan đ o l ư ờ n g m ứ c đ ộ quan h ệ t u y ế n t í n h giữa hai b i ế n ; c h í n h x á c h o n là quan h ệ t u y ế n t í n h giữa hai b i ế n , k h ô n g p h â n b i ệ t b i ế n n à y p h ụ thuộc v à o b i ế n kia. H ệ số t ư ơ n g quan n à y c ó t ê n gọi là t ư ơ n g quan Pearson. G i ả sử X v à Y là hai b i ể n n g ẫ u n h i ê n c ó V ( X ) > 0 v à V ( Y ) > 0, thì h ệ số t ư ơ n g quan của hai b i ế n X v à Y đ ư ợ c x á c đ ị n h n h ư sau: E\ự-Eự))(Y-Eự))} J ĩ ự ỹ ự ) H ệ số t ư ơ n g quan c ó c á c t í n h chất sau: h ệ số t ư ơ n g quan k h ô n g c ó đ ơ n vị v à c ó t í n h h o á n đ ổ i ( p = Pyx). H ệ số t ư ơ n g quan l u ô n b i ế n đ ộ n g trong k h o ả n g t ừ - Ì đ ế n Ì ( I p | < 1 ) . H ệ số t ư ơ n g quan d ư ơ n g cho b i ế t X v à Y c ó quan h ệ c ù n g c h i ề u v à h ệ số t ư ơ n g quan â m thì n g ư ợ c l ạ i ) . H ệ số t ư ơ n g quan p = ± 1 k h i v à chỉ k h i X v à Y c ó m ố i quan h ệ p h ụ thuộc t u y ế n t í n h . N h ư v ậ y , c ó t h ể d ù n g p đ ể đ o lường sự p h ụ thuộc t u y ế n t í n h của hai b i ế n n g ẫ u n h i ê n , trị số của h ệ số t ư ơ n g quan c à n g l ớ n thì m ố i quan h ệ t u y ế n t í n h c à n g r õ r à n g . N g ư ợ c l ạ i , k h i p = 0 tức là X , Y đ ộ c l ậ p nhau hoặc giữa X v à Y c ó quan h ệ phi tuyến. H ệ sổ t ư ơ n g q u a n m ẫ u G ọ i ( X i , y i ) , ( x , y ) , . - , (x„, y„) là n cặp quan sát của hai b i ế n 2 2 150 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  3. ngẫu n h i ê n X v à Y. H ệ số t ư ơ n g quan m ẫ u ( r ) của n cặp g i á trị quan sát của hai b i ế n X v à Y t h ể h i ệ n bằng c ô n g thức sau: k k k x v 2 > , Ị > ửnn 2 r .ry = (4.3) ự 2\ í ( 2\ ( k ^ Ả Ị t * . t y . /=1 Ì =1 2> , / » - 2 n 2 n i=1 i- 1 V V ) ) V ) ì T r ư ờ n g h ợ p m ô i cặp g i á trị (Xj, yì) x u â t h i ệ n v ớ i t â n suât rtij sao k cho = w thì c ô n g thức t r ê n t r ở t h à n h : ;=1 2 n (4.4) r *y = k f k \ 2\ 2\ .2 ĩ 1=1 i=l /=1 n A7 V Bảng 4.1. T r ì n h b à y ý nghĩa của c á c h ệ s ô t ư ơ n g quan. Bảng 4.1. Y nghĩa của hệ sô tương quan T r i sô r Quan h ệ giữa biến X và Y r = 0 X v à Y đ ộ c l ậ p hoặc c ó quan h ệ p h i t u y ế n |r|=l X v à Y c ó quan h ệ t u y ế n t í n h 0,0< |r| < 0,3 X v à Y c ó quan h ệ y ế u 0,3< |r| < 0,5 X v à Y c ó quan h ệ trung b ì n h 151 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  4. 0,5 < |r| < 0,7 X v à Y c ó quan h ệ t ư ơ n g đ ố i chặt 0,7 < |r| < 0,9 X v à Y c ó quan h ệ chặt 0,9 < |r| < 1,0 X v à Y c ó quan h ệ rất chặt H ệ số t ư ơ n g q u a n b ộ i v à h ệ số t ư ơ n g q u a n r i ê n g p h ầ n Hệ số tương quan bội H ệ s ô t ư ơ n g quan b ộ i đ á n h g i á m ứ c đ ộ chặt c h ẽ của m ô i liên hệ giữa m ộ t t i ê u thức ( t h ư ờ n g là tiêu thức k ế t q u ả ) v ớ i c á c t i ê u thức còn l ạ i ( t h ư ờ n g là tiêu thức n g u y ê n n h â n ) . C ô n g thức t í n h t ư ơ n g quan b ộ i giữa b i ế n Y v à c á c b i ế n X i , x , . . , x 2 n như sau Hệ số tương quan riêng phần (4.5) yX|jr..jr„ 2 ị ' n y - ỹ ) V à t ư ơ n g quan r i ê n g p h ầ n giữa Y v à X2 ( l o ạ i t r ừ ảnh h ư ở n g của X i ) t í n h theo c ô n g thức r —rr yx, 'yx x,x (4.6) yx (Jt|) 2 2 2 T í n h t o á n h ệ sổ t ư ơ n g q u a n m ẫ u t r o n g E x c e l T r ư ờ n g h ợ p m ẫ u quan s á t c ó t ầ n suất m t h ì c ó t h ể t í n h t o á n t h ủ c ô n g theo c ô n g t h ứ c h o ặ c c h u y ể n t h à n h m ỗ i d ò n g ( c ộ t ) chỉ c h ứ a m ộ t q u a n s á t ( m = 1). D ữ l i ệ u c ó t h ể b ố trí theo h à n g hoặc theo c ộ t . N ế u t í n h t o á n t h ủ c ô n g sử d ụ n g c ô n g thức hoặc c ó t h ể k ế t hợp c á c h à m S Q R T , S U M P R O D U C T đ ể t í n h t o á n h ệ số t ư ơ n g quan r. C ũ n g c ó t h ể sử d ụ n g c á c h à m thống k ê của Excel đ ể t í n h t o á n . C h ú ý c á c h à m t h ố n g k ê của Excel k h ô n g t h ể t í n h t o á n v ớ i c á c m ẫ u quan sát \ r ì I r t t CÓ tân s ô m Ỷ Ì n ê n đ ê sử dụng c ô n g thức c â n p h ả i b i ê n đ ô i d ữ l i ệ u đ ê m ỗ i quan sát n ằ m t r ê n m ộ t h à n g (cột) trong Excel. 152 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  5. H à m RSQ H à m RSQ tính t o á n p h ư ơ n g sai m ẫ u ( r ) theo c ú p h á p : 2 = RSQ (known_y's; known_x's) Trong đó: K n o w n _ y ' s : c á c g i á trị của m ẫ u quan sát y của b i ế n Y . K n o w n _ x ' s : c á c g i á trị của m ẫ u quan sát X của b i ế n X . Hàm CORREL H à m C O R R E L t í n h t o á n t ư ơ n g quan m ẫ u (r) theo c ú p h á p : = CORREL ịarrayl; array2) Trong đ ó : A ư a y l , array2: c á c g i á trị của m ẫ u quan sát X, y của hai b i ế n X v à Y . T h ứ t ự của c á c t h a m số trong h à m RSQ v à h à m C O R R E L k h ô n g quan trọng. Sử dụng trình cài thêm Correlatỉon trong gói Analysis Toolpak-VBA T r ì n h cài t h ê m C o r r e l a t i o n trong g ó i A n a l y s i s T o o l p a k - V B A cho p h é p sử d ụ n g c ô n g c ụ p h â n t í c h t ư ơ n g quan v ớ i giao d i ệ n đ ồ h ọ a trực quan d ễ thực h i ệ n . T r u y cập t r ì n h c à i t h ê m t ừ menu ToolsỊData Analysis chọn C o r r e l a t i o n n h ư H ì n h 4. Ì Hi Anaỉysts Tools input Anova: Two-Factor Wíthout Rẹplicatiori 3 ỉnput Ranọe; 1 Grouped By:
  6. K h i c h ọ n Correlation v à nhấn O K , h ộ p t h o ạ i C o ư e l a t i o n xuất h i ệ n đ ể nhập d ữ l i ệ u n h ư h ì n h 4.2. C á c l ự a c h ọ n của h ộ p thoại C o r r e l a t i o n n h ư sau: + Input Range: khai b á o v ù n g d ữ l i ệ u p h â n t í c h . + Grouped by : t ổ chức d ữ l i ệ u theo h ư ớ n g : + Columns: theo cột. + Rows: theo h à n g . + Labels i n First Row: d ò n g đ ầ u tiên của v ù n g d ữ l i ệ u là t ê n biến. + Output Range: g ó c trên b ê n trái của v ù n g chứa k ế t q u ả . V ù n g n à y n ằ m t r ê n c ù n g m ộ t sheet v ớ i v ù n g d ữ l i ệ u . + N e w Worksheet Ply: trả k ế t q u ả ra m ộ t trang b ả n g t í n h khác trong c ù n g m ộ t fíle v ớ i file chứa d ữ l i ệ u . + N e w W o r k b o o k : trả k ế t q u ả ra m ộ t f i l e r i ê n g . V í d ụ 4.1 Đ ể n g h i ê n c ứ u quan h ệ giữa t u ổ i n g h ề ( y ) v à số sản p h ẩ m sai h ỏ n g ( x ) của c ô n g n h â n trong p h â n x ư ở n g n g ư ờ i ta thống k ê ngẫu n h i ê n 18 c ô n g n h â n , số l i ệ u thu đ ư ợ c n h ư trong b ả n g . T ì m t ư ơ n g quan giữa t u ổ i n g h ề v à số sản p h ẩ m sai h ỏ n g . H ì n h 4.3 t r ì n h b à y c á c h b ố trí d ữ l i ệ u k h i t í n h h ệ số t ư ơ n g quan r sử d ụ n g c ô n g thức. Đ ộ c g i ả c ó t h ể sử d ụ n g h à m S U M P R O D U C T để t í n h t o á n c á c g i á trị t r o n g c á c ô v ù n g E9:I9. N h ư c ó t h ể t h ấ y t ừ H ì n h 4.3, h ệ số t ư ơ n g quan r = - 0,708 cho thấy k h i t u ổ i n g h ề t ă n g cao thì sai sót trong lao đ ộ n g g i ả m đi v à giữa t u ổ i n g h ề v à sai sót c ó m ố i quan h ệ k h á chặt v ớ i nhau. H ì n h 4.4 t r ì n h b à y c á c h sử dụng h à m C O R R E L của Excel để t í n h t o á n h ệ số t ư ơ n g quan sử d ụ n g số l i ệ u của ví d ụ . T r ì n h b à y hộp t h o ạ i C o r r e l a t i o n k h i nhập d ữ l i ệ u v à k ế t q u ả t í n h t o á n h ệ số t ư ơ n g quan sau k h i nhấp O K t r ê n h ộ p thoại C o r r e l a t i o n sử d ụ n g d ừ l i ệ u trong H ì n h 4. Ì . 154 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  7. A B c D E I f ầ G I H I I J 1 2 ... . Ky X m m*x m*Y mVy m*x"2 _3_ 13 7 3 21 ị 39 273| 147 507 4 8 6 5 30 40 240! 180 320 A 9 10 4 40: 36 3601 40Õ 324 B 25 Ị 2 8 50 2Ò0Ì 32 1250 7 36 2 1 2 36 72 À 1296 _8_ 19 2 3 6 57 1141 12 1083 .? tong 18 107 258 1259 775 4780 lõ tử SỐ -15 26 CT= G9/D9-E9"F9/D92 A VỊ. Mâu BÓ 21 541 CT= SQRT|H9/D9-(E9©9)»2)*SQRT(I9C9-(F9/D9)2) A 12 Ị ì .ỉ 13 r -0 708 14 ị H ì n h 4.3. Tính hệ số tương quan sử dụng các hàm cua Exceì. J_ iS .-Ạ. i .ạ . .. . 1 L m c ị. 2 y 13 X 7 r- I -0 708 3 13 7 cõng thúc 4 13 7 L s_ 8 6 E2=CORREL(A2 A19.B2 B19) 6 8 6 7 8 6 B 8 6 9 8 6 lũ 9 10 11 9 10 12 9 13 9 10 14 25 4 15 25 4 16 36 2 17 19 2 18 19 2l _Ị9 19 2 20 H ì n h 4.4. 77«/? /?ệ sớ tương quan sử dụng hàm CORREL khi dữ liệu có tần suất. 1 A 1 B i c ũ E 1 F 1 GI H 1 Hy X 2 13 7 m 13 7 13 7 13 8 6 V X õ 8 Bi i ì á 8 6 X -0 70639 1 o ' - "— I^BHB B 0 D 1•ỉhput— — 1
  8. 1.2. K i ể m đ ị n h g i ả t h u y ế t v ề s ự t ồ n t ạ i của t ư ơ n g q u a n t ổ n g thể É M Í * H ệ s ô t ư ơ n g quan của m ẫ u rát h ữ u ích k h i d ù n g đ ê m ô t ả tính chặt c h ẽ của m ố i quan h ệ t u y ế n t í n h trong m ộ t m ẫ u . Vì v ậ y , n ó c ó thể d ù n g l à m c ơ sở cho k i ể m định g i ả thuyết của t ổ hợp k h ô n g t u y ế n tính ( k h ô n g t ư ơ n g quan) trong tổng t h ể . Đ e k i ể m định v ề sự t ồ n t ạ i của h ệ số t ư ơ n g quan của t ổ n g thể c â n k i ê m định cặp g i ả thuyết sau: G i ả thuyết Ho: p=0 Đ ố i thuyết H i : p ^ O G i á trị k i ể m định t đ ư ợ c t í n h theo c ô n g thức n h ư sau: / = - = = (4.7) Trong đó: r: h ệ số t ư ơ n g quan m ẫ u . n : số quan sát trong m ẫ u . M i ề n b á c b ỏ g i ả t h u y ế t Ho là hay |t| > t(n-2 OI li) • T r o n g đ ó (X là m ứ c ý nghĩa của k i ê m định; t(n-2 a li) là p h â n p h ô i student v ớ i x á c suât a/2 v à bậc t ự do n-2. T r o n g Excel sử d ụ n g h à m t h ô n g k ê T I N V đ ê t í n h t o á n p h â n p h ô i student v ớ i c ú p h á p sau: = TlNVịprobability; deg_freedom) Trong đó: Probability: x á c suất của p h â n p h ố i student. D e g _ f r e e d o m : bậc t ự do của p h â n p h ố i student. C h ủ ý : H à m T I N V t r o n g Excel đ ư ợ c t h i ế t k ế cho k i ể m đ ị n h hai p h í a ( T w o - t a i l e d test). N ó i c á c h k h á c h à m T I N V trả v ề g i á trị t sao cho P ( | X | > t ) = probability. V ì v ậ y k h i sử d ụ n g T I N V đ ể k i ể m đ ị n h hai 156 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  9. phía, nhập t h a m số Probability bằng mức ý nghĩa a. K h i sử d ụ n g k i ể m định m ộ t p h í a (One-tailed test) nhập Probability b ằ n g hai l ầ n m ứ c ý nghĩa a. V í d ụ 4.2 Sử d ụ n g d ữ l i ệ u của V í d ụ 4 . 1 . Ở m ứ c ý nghĩa 5% h ã y k i ể m định g i ả thuyết r ằ n g t ổ n g t h ể c ó m ố i quan h ệ giữa t u ổ i n g h ề v à p h ế phẩm? C ó t t í n h t o á n theo c ô n g thức là -4.015. Tra b ả n g p h â n p h ố i student v ớ i m ứ c ý nghĩa (X = 0.05 v à bậc t ự do n-2 = 16 đ ư ợ c 2.1199. V ậ y |t| > t tra b ả n g n ê n b á c b ỏ Ho. N ó i c á c h k h á c k ế t l u ậ n v ề d ữ l i ệ u đ i ề u tra m ẫ u c ó t h ể á p d ụ n g cho tổng t h ể v ớ i x á c suất m ắ c sai l ầ m 5%. r -0.70839 = -4.015 V(l-r )/(«-2) 2 yjạ-0J0$39 )/l6 2 H ì n h 4.6 t r ì n h b à y c ô n g thức t í n h t o á n k i ể m đ ị n h g i ả thuyết v ề Á• t y 9 m ô i t ư ơ n g quan g i ữ a t u ồ i n g h ê v à sai h ỏ n g k h i gia c ô n g sản p h à m v ớ i mức ý nghĩa 5%. 1 ỉ A bĩ- y X l i ' 13 7 V X 13 7 1 1 13 7 X -Ũ.7D839 1 8 6 8 6t -4.01454 côngthức 8 6 t tra bảng 2.119905 E7= E4/SQRT((1 -E4»2)/(COUNT(B2: B19)-2)) 8 6 E8= TINV(ũũ5,COUNT(B2:B19)-2) ' ệ 8 6 9 10 HO: r=0 9 10 HI: r ó c 9 10 có hi > t tra báng _bác bò HO 9 10 25 4 25 4 36 2 19 2 19 2 19 2 H ì n h 4.6. Kiểm định giả thuyết về sự tồn tại hệ sổ tương quan. 157 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  10. 2. H Ồ I Q U Y T U Y Ê N T Í N H Đ Ơ N 2.1. C ơ b ả n về h ồ i quy tuyến tính đ ơ n D ạ n g đ ơ n g i ả n nhất của m ộ t m ô hình h ồ i quy chứa m ộ t biến phụ thuộc ( c ò n g ọ i là " b i ế n được giải t h í c h " , " b i ế n n ộ i sinh", hay " b i ế n - Y " ) và m ộ t b i ế n độc lập đ ơ n (còn g ọ i là " b i ế n g i ả i t h í c h " , "biến ngoại sinh" hay " b i ế n - X " ) . P h ư ơ n g trình h ồ i quy t u y ế n tính đ ơ n c ó thể b i ể u d i ễ n theo dạng: Y=p +Ị$ x ũ x (4.8) Trong thực tế không chỉ có biến X ảnh hưởng đến Y mà còn có c á c y ế u t ố n g ẫ u n h i ê n k h á c ảnh h ư ở n g đ ế n Y n ê n p h ư ơ n g trình 4.8 được v i ế t t h à n h : Y =p ữ + p,x + e (4.9) Trong đó e là các sai số. T r o n g thống k ê v à trong k i n h tế lượng, n g ư ờ i ta sử dụng p h ư ơ n g p h á p b ì n h p h ư ơ n g cực t i ể u đ ể ước lượng c á c h ệ số Po v à p Ì theo công thức sau: i=\ i=\ (4.10) Ã =• Ý ( " I X - ĩ * . 1=] V'=I ) H ệ số chặn Po đ ư ợ c ước lượng theo c ô n g thức: p =Ỹ-p,X ữ (4.11) T r o n g đ ó /? 0 v à /?, đ ư ợ c g ọ i là c á c ước lượng đ i ể m của po v à P|. TSS (Total Sum of Square) là tổng bình phương của tất các sai lệch giữa giá trị quan sát Y j v à giá trị trung bình của c h ú n g . TSS=£(Y,-ỹ) 2 158 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  11. ESS (Explained Sum o f Square) là tổng bình p h ư ơ n g của tất cả các sai lệch giữa g i á trị của b i ế n phụ thuộc Y nhận được t ừ h à m h ồ i quy m â u v ớ i g i á trị trung b ì n h của c h ú n g . Phần n à y đ o đ ộ c h í n h xác của h à m h ồ i quy. ESS=£(Ỹ-F) 2 RSS (Residual Sum of Square) là tổng bình phương của tất cả các sai lệch giữa giá trị quan sát Y v à giá trị nhận được t ừ h à m h ồ i quy. Rss=ỵe;=ỵự -Ỹ y- l l l=\ i=l Khi đó: T S S = ESS+ RSS Nên / = -ì ~?l trong đó s và Sy là phương sai mẫu của X và Y. x 2 2 «?(/?,) H ệ sô r đ o đ ộ p h ù hợp của m ô h ì n h hôi quy. i(Ỹ>-ỹ) 2 2_ t t ự > = ESS = RSS Ỳ ( r , - Ỹ ) 2 T S S ~ T S S 1=1 2 đ o tỉ l ệ của t o à n b ộ sai lệch của Y v ớ i g i á trị trung b ì n h của c h ú n ^ đ ư ợ c g i ả i t h í c h b ằ n g m ô hình. Do v ậ y r đ ư ợ c sử dụng đ ể đ o đ ộ 2 thích hợp của h à m h ồ i quy. 2.2. Khoảng tin cậy và kiểm định giả thuyết trong hồi quy tuyến tính đ ơ n Theo các giả thiết của phương pháp bình phương cực tiểu thì Ã ~ (0o> ị); N ơ Ằ ~ (fì> ị)• N ơ D o c h ư a biết ơị và ơị nên sử dụng ước lượng không chệch của ơ 2 là ở . K h i đó các thống kê: 2 , Ã-go. t ằz£± = = có phân bố T (n-2). Do đó khoảng tin cậy của các hệ số hồi quy như sau: 159 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  12. K h o ả n g t i n c ậ y c ủ a Po V ớ i h ệ số t i n c ậ y ( Ì - oe) t ì m được t a 12 (n-2) t h ỏ a m ã n k h o ả n g tin cậy ( Ì - a ) của Po là: [(Ã-t n(n-2)se(ịyj a 0 + / B / 2 (#I-2)«?(Ã))] K i ể m đ ị n h g i ả t h u y ế t đ ố i v ớ i Po Giả thuyết Giả thuyết Loại giả thuyết Miền bác bỏ gốc Ho thay t h ế H i Hai phía Po = Po* PoỶ 3o* ít 1 > t«12 (n-2) Phía phải P o < Po* Po>í3o* t>ta(n-2) P h í a trái Po>Po* PoPi* t>t (n-2) a P h í a trái Pi>3i* 3i
  13. T r o n g đ ó Po là h ệ số t ự do ( h ệ số chặn), pi ( i = Ì ,..,k) là c á c h ệ số h ồ i quy r i ê n g . H à m h ồ i quy m ẫ u c ó dạng: Y =fi +fi X +fi X +... + ĩ X +e, (4.13) l Q Ị íl i ĩt ki ki Mô hình này nói lên mức độ phụ thuộc tuyến tính của biến phụ thuộc Y ( đ ạ i l ư ợ n g cần n g h i ê n cứu) v ớ i c á c b i ế n độc l ậ p ( X j j ) , ej là sai sô n g ẫ u n h i ê n g â y ra v ớ i sai l ệ c h của y v ớ i giá trị trung b ì n h của n ó . Đ ố i v ớ i m ô h ì n h n à y n g ư ờ i ta chấp n h ậ n g i ả định c á c b i ế n đ ộ c l ậ p k h ô n g c ó m ố i t ư ơ n g quan v ớ i nhau v à p h ư ơ n g sai k h ô n g đ ổ i . M ô h ì n h h ồ i quy t u y ế n tính b ộ i đi qua g i á trị trung b ì n h của n ó . C á c ư ớ c l ư ợ n g • p, ước l ư ợ n g được là c á c ư ớ c l ư ợ n g k h ô n g chệch c ó p h ư ơ n g sai n h ỏ nhất trong c á c l ó p ước l ư ợ n g k h ô n g chệch của Pi. T r o n g c á c t r ư ờ n g hợp n g h i ê n cứu cụ t h ể n g ư ờ i ta t h ư ờ n g t i ế n h à n h p h â n tích p h ư ơ n g sai v à p h â n t í c h t ư ơ n g quan trước đ ể t h ă m d ò dạng của quan h ệ p h ụ thuộc v à k i ể m tra xem c ó x ả y ra h i ệ n t ư ợ n g t ự t ư ơ n g quan, đ a c ộ n g t u y ế n hay p h ư ơ n g sai thay đ ổ i hay k h ô n g . Đ ể k i ể m tra, t h ư ờ n g sử d ụ n g t h ủ tục k i ê m định D o l b i n W a t s e m . V i ệ c t í n h t o á n c á c h ệ số h ồ i quy của h ồ i quy b ộ i k h á phức tạp. Ví d ụ , v ớ i m ô h ì n h h ồ i quy 2 b i ế n đ ộ c l ậ p ( X i , x ) . C á c h ệ số p , Pi 2 2 Po đ ư ợ c ư ớ c l ư ợ n g theo c á c c ô n g thức sau: í n \ í" ì Ẻ 4 Ỵ y, 2, J x V/=I ỉ V /=1 ; V, '=1 ) V '=1 ) í " 2 í " 2 4 t 4 t * . Xu ( ỉ ) Ị V 1=1 í » / í » \ Ỹ,y, 2, x ỉ Ì í 2i u x x V /=1 ) 1 ) VV i=l V I=\ ) (" \ (» \2 i*ỉ, ị ± 4 V
  14. Trong đ ó : y =Y -Ỹ; x, =X i i i l i -X ;x I 2 j =X 2 i -X 2 3.2. K i ể m đ ị n h s ự p h ù h ọ p c ủ a m ô h ì n h h ồ i q u y b ộ i T r o n g m ô h ì n h h ồ i quy b ộ i , h ệ số x á c đ ị n h b ộ i R đ ư ợ c x á c định 2 theo c ô n g thức: R =^- (4.15) 2 TSS ' Do k h ô n g t h ể d ù n g R l à m tiêu chuẩn đ ể xem xét việc đ u a t h ê m hay 2 k h ô n g đ ư a thêm biến v à o m ô hình, n ê n n g ư ờ i ta đ ư a ra m ộ t h ệ số x á c định bội đ ã điều chinh (Ạịusted R Square) k ý hiệu R v à tính theo công thức: 1 ĩ 1 I (4 ,6) '- -( -*Vhĩ - Khi R 2 c ò n t ă n g t h ì c ò n p h ả i đ ư a t h ê m b i ế n m ớ i v à o m ô hình h ồ i quy. K i ể m đ ị n h g i ả t h u y ế t v ề sự p h ù h ợ p của m ô h ì n h b à n g tiêu chuẩn F đ ư ợ c t í n h theo c ô n g thức: R {k-2) 2 (l-R )(n-k-l) 2 ( 1 7 ) V ớ i g i ả thuyết: 2 H :R 0 = 0. 2 H,:R >0. M i ề n b á c b ỏ Ho la F > F« ( k , n-k-1) v ớ i k là số b i ể n đ ộ c l ậ p . 3.3. K h o ả n g t i n c ậ y v à k i ể m đ ị n h g i ả t h u y ế t c ủ a m ô h ì n h h ồ i quy b ộ i V i ệ c k i ể m đ ị n h g i ả thuyết v à khoảng t i n c ậ y của m ô h ì n h h ồ i quy b ộ i t i ế n h à n h t ư ơ n g t ự n h ư m ô h ì n h h ồ i quy đ ơ n . T i ê u c h u ẩ n k i ể m Ổ, - ổ' . định là / = — — Ọ - v ớ i m i ê n b á c bỏ sau: SeiP) 162 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  15. Loại giả thuyết Ho Hi M i ề n bác bỏ Hai p h í a 0i = 3i* Di * 3i* | t | > t a | 2 (n-k-1) B ê n trái Pi > 3i* ft t (n-k-l) a 4. H Ồ I Q U Y P H I T U Y Ê N H ồ i quy phi t u y ế n sử d ụ n g p h ư ơ n g p h á p b ì n h p h ư ơ n g cực t i ể u phi t u y ế n . T u y n h i ê n v i ệ c ước l ư ợ n g c á c h ệ số n à y k h á phức tạp. * r i r t Trong n h i ê u t r ư ờ n g hợp, n ê u c ó t h ê đ ư ợ c n g ư ờ i ta t ì m c á c h b i ế n đ ổ i các p h ư ơ n g t r ì n h phi t u y ế n t h à n h p h ư ơ n g t r ì n h t u y ế n t í n h đ ể d ễ d à n g h ồ i quy. V ớ i p h ư ơ n g t r ì n h hyperbol dạng y = a/x, đặt 1/x = z đ ể đ ư a v ề p h ư ơ n g trình y = az v à t i ế n h à n h h ồ i quy t u y ế n t í n h đ ơ n . V ớ i p h ư ơ n g t r ì n h parabol dạng y = a x 2 + b x + c đặt Zi = X , 2 Z2 = X đ ể đ ư a v ề p h ư ơ n g t r ì n h h ồ i quy b ộ i y = azi + ỒZ2 + c. V ớ i h à m sản x u ấ t C o b b Douglas c ó dạng: Y=AX, ...Xib , b 2 ...X n b n Trong đó: Y là k ế t q u ả sản x u ấ t . Xi,..., Xi,..., x n là m ứ c đ ầ u t ư c á c y ế u t ố sản xuất (đất đ a i , lao động,...). t r i I*' :. "ị CÓ t h ê b i ê n đ ô i t h à n h h à m t u y ê n t í n h b ă n g c á c h logarit h ó a hai vế và đưa về dạng: In Y = In A + b | l n X , +....+ bn In x „ . K h i đ ó sử d ụ n g c á c c ô n g thức ước l ư ợ n g c á c tham số của h ồ i quy b ộ i đ ể h ồ i quy. 163 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  16. 5. Q U Y T R Ì N H P H Â N T Í C H H Ồ I Q U Y T R O N G EXCEL 5.1. P h â n tích hồi quy đ ơ n trong Excel Sử dụng h à m SLOPE và I N T E R C E P T để ước lượng các t h a m số c ủ a h à m h ồ i q u y đ ơ n H à m S L O P E d ù n g đ ể ư ớ c l ư ợ n g h ệ số g ó c ( p i ) của p h ư ơ n g t r ì n h y = Po + p i x . C ú p h á p của h à m S L O P E n h ư sau: =SLOPE(Known_y's; known_x's) Trong đó: K n o w n _ y ' s : giá trị quan sát của b i ế n p h ụ thuộc y. K n o w n _ x ' s : giá trị quan sát của b i ế n đ ộ c l ậ p X. H à m I N T E R C E P T d ù n g đ ể ư ớ c l ư ợ n g h ệ số t ự do Po của p h ư ơ n g t r ì n h h ồ i quy bậc nhất theo c ú p h á p : =INTERCEPT(Known_y'; known_x's). V í d ụ 4.3 T h ố n g k ê g i á trị sản x u ấ t v à t i ê u t h ụ đ i ệ n n ă n g trong 12 t h á n g n g ư ờ i ta thu đ ư ợ c c á c số l i ệ u sau Tháng 1 2 3 4 5 6 7 8 9 10 li 12 Giá trị 4,51 3,58 4,3] 5,06 5,64 4,99 5,29 5,83 4,71 5,61 4,91 4,19 sản xuất (triệu ÙSD) Điện 4,28 2,26 2,47 2,77 2,99 3,05 3,18 3,46 3,03 3,26 2,67 2,53 năng tiêu thụ (triệu KWh) B i ế t g i á trị sản xuất ( y ) c ó quan h ệ v ớ i đ i ệ n n ă n g t i ê u t h ụ ( x ) theo d ạ n g y = Po + P i * . H ã y ước l ư ợ n g c á c tham số Po v à P|. 164 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  17. H ì n h 4.7 trình b à y c á c h nhập số l i ệ u v à o Excel v à sử dụng h à m S L O P E , I N T E R C E P T đ ể ước lượng các tham số của h à m h ồ i quy đ ơ n . A I B I c 1 D mm ịì F I G H _L 2 V X Giả trị Điện Tháng sản xuất nâng 3 (triệu tiêu thụ 4 1 451 248 betaũ 0 3037 5 2 3 58 2.26 beta 1 1,6101 6 3 4.31 2.47 ĩ 4 5.06 2.77 Cônq thúC' B 5 5.64 2.99 9 6 4.99 305 F4=INTERCEPTỊI34:B15,C4:C15) 10 7 529 3.18 |F5=SLO E(B4:B 15.C4:C15) D 11 8 5.83 3.46 12 9 471 3.03 Hâm hôi quy mẩu 13 10 561 3.26 y=0.3037+1.6101< 14 11 4.91 2 67 15 12 4.19 253 16 Ị—:_| "'" Ị H ì n h 4.7. Sử dụng hàm của Excel để ước lượng các tham số của hàm hồi quy đơn. S ử d ụ n g t r ì n h c à i t h ê m Regression đ ề p h â n t í c h h ồ i q u y đ ơ n T r ì n h cài t h ê m Regression n ằ m trong gói phần m ề m A n a l y s i s T o o l p a k - V B A v à đ ư ợ c truy cập t ừ menu T o o l s I D a t a A n a l y s ỉ s I Regression n h ư h ì n h 4.8. Ý nghĩa t ù y c h ọ n v à c á c n ú t l ệ n h của h ộ p thoại Regression t r ì n h b à y trong b ả n g 4 . 1 . Regression không chỉ cho các ước lượng điểm của các tham số h ồ i q u ỵ m à c ò n cho c á c tham số thống k ê đ ể k i ể m định m ô h ì n h h ồ i quy, đ ê p h â n tích p h ư ơ n g sai ư ớ c l ư ợ n g k h o ả n g của c á c tham số trong m ô h ì n h h ồ i q u ỵ . Sử d ụ n g t r ì n h Regression cho p h é p h ồ i quy t u y ế n tính b ộ v ớ i số b i ế n t ố i đ a là 16. V í d ụ 4.4 Sử d ụ n g c á c số l i ệ u của ví d ụ 4.3 T h ố n g k ê g i á trị sản x u ấ t v à tiêu t h ụ đ i ệ n n ă n g trong 12 t h á n g n g ư ờ i ta thu đ ư ợ c c á c sô l i ệ u n h ư bảng 4. B i ế t giá trị sản x u ấ t ( y ) co quan h ệ v ớ i đ i ệ n n ă n g tiêu t h ụ ( x ) theo dạng y = po + p|X. H ã y ước l ư ợ n g c á c tham s ô của h à m h ồ i quy, k i ể m định sự p h ù hợp cua m ô h ì n h h ồ i quy v à k i ể m đ ị n h c á c tham số của m ô h ì n h . 165 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  18. Tháng 1 2 3 4 5 6 7 8 9 10 li 12 Giá tri 4,51 3,58 4,31 5,06 5,64 4,99 5,29 5,83 4,71 5,61 4,91 4,19 sản xuất (triệu USD) Điện 4,28 2,26 2,47 2,77 2,99 3,05 3,18 3,46 3,03 3,26 2,67 2,53 năng tiêu thụ (triệu KWh) Input IrputltRange: Cancd Ị Hét J r t«òets r Constart 6 2«o r* CoítldenceLevel: p % ouput options í~ ôutput R**75: í*" NewWorìuheet0y: í" NewWortxx* r standardxed Resduab r R«sduaể Ptots Nạmal ProbaMty r l|r«FlPtats r iloniulProtaMtrMots H ì n h 4.8. //ộ/? thoại Regression. B ả n g 4.2. Ỷ nghĩa các tùy chọn của hộp thoại Regressỉon Tên nút Ý nghĩa Input Y Range: 1 V V ù n g chứa b i ế n p h ụ thuộc Y . Input X Range: V ù n g chứa b i ế n 1 4 c á c b i ế n d ó c láp X. lư" Labels Chọn tùy chọn này nếu dòng đẩu tiên của 166 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  19. Tên nút Ý nghĩa vùng d ừ liệu có chứa t ê n b i ế n . C h ọ n t ù y chọn r~ Constant is Zero n à y n ế u b ỏ qua Í3O(Í3O = 0 ) . r~ ConẠdence Level: ị % Chọn mức đ ộ t i n cậy của h à m h ồ i quy ( m ặ c định 95%). ứ OutputRange: ! Ô đ ầ u tiên b ê n trái v ù n g k ế t q u ả k h i k ế t q u ả trên c ù n g m ộ t sheet với vùng dữ liệu.
  20. SUMMARY OUTPUT Tóm tắt các kết quả Regression Statistics Thống kê hồi quy Multiple R 0.89582697 Hệ số tương quan r R Square 0.80250596 Hệ số xác định r2 Ađjusted R Square 0.78275655 Hệ số xác định điều Chĩnh Standard Error 0.31053857 Sai số chuẩn Observations 12 Số quan sát H ì n h 4.9. Tóm tắt cóc tham số thống kê do regressỉon trả về. ANOVA di ss MS F Siqniíicance F Regression 1 3918549641 3918549641 40.63444 8.09269E-05 Residual lũ 0.964342025 0 096434203 ì Tót ai 11 4882891667 H ì n h 4.10. Phân tích phương sai do Regression trả về. Trong Hình 4.10, bậc tự do của hồi quy (dòng Regression cột d í ) là Ì , bậc t ự do của sai số ( d ò n g Residual c ộ t d í ) l à l o . T ổ n g bình p h ư ơ n g c á c sai l ệ c h do h ồ i quy ( d ò n g Regression c ộ t s s - ESS) là 3,918. T ổ n g b ì n h p h ư ơ n g c á c sai l ệ c h do n g ẫ u n h i ê n ( d ò n g Residual cột s s - RSS) là 0.96. P h ư ơ n g sai t ư ơ n g ứ n g của c á c chỉ tiêu đ ó cho trong c ộ t M S . C ộ t F cho p h â n p h ố i F đ ể k i ể m định sự p h ù h ợ p của m ô h ì n h h ồ i quy. G i á trị S i g n i í ĩ c a n c e F cho b i ế t x á c suất đ ể F n h ỏ h ơ n f«(k,n-k-l).. ế * r r ì H ì n h 4.11 t r ì n h b à y k é t q u ả h ô i quy v à c á c tham s ô t h ô n g k ê đê k i ể m đ ị n h c á c tham số của m ô h ì n h h ồ i quy. Coetíiàents Standard Error tSlat P-value Lower95ftí Upper 95% Intercept 0.303683778 0 724391526 0419226023 0.683914 -1.310361117 ì 917728674 ìx Variable 1 1 610125759 0.252587973 B 374514741 8.09E-05 1 0473246842 172926833 H ì n h 4.11. Kết quả hồi quy do Regression cung cấp. Từ Hình 4.11 thấy ràng hệ số tự do (Intercept) Po = 0. 3036, Se( po) = 0,724. T h ố n g k ê t (t Stat) là 0,419. G i á trị P-value cho biết x á c suất đ ể t < t Ji ( n - k - 1 ) . C á c c ộ t L o w e r 9 5 % v à U p p e r 9 5 % cho b i ế t k h o ả n g t i n cậy của h ệ số h ồ i quy. H ì n h 4.12 h i ể n t h ị k ế t q u ả k h i c h ọ n R e s i d u a l trong h ộ p t h o ạ i Regression. 168 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn

CÓ THỂ BẠN MUỐN DOWNLOAD

Đồng bộ tài khoản