12/13/2012

KINH TẾ HỌC QUẢN LÝ (Managerial Economics)

12/13/2012 1 GVC: PHAN THẾ CÔNG

Chương 7

LÝ THUYẾT TRÒ CHƠI VÀ TƯ DUY CHIẾN LƯỢC

1

12/13/2012 GVC: PHAN THẾ CÔNG 2

12/13/2012

John Nash (1928--)

 Received his Ph.D. from

Princeton University with a 28-page thesis on his 22-nd birthday.  Invented the notion of Nash

equilibrium.

 Wrote a seminal paper on

bargain theory.

 Xem phim “A beautiful

Mind” nói về cuộc đời của John Nash.

12/13/2012 3 GVC: PHAN THẾ CÔNG

Applications of game theory

 Economic theory  Political science  Psychological study  Evolutionary biology (1970..)  Computer science

 Yao’s Lemma (1977)

12/13/2012 GVC: PHAN THẾ CÔNG

4

2

12/13/2012

Nobel Prize in Economic Sciences 1994

John C. Harsanyi

John F. Nash Jr.

Reinhard Selten

"for their pioneering analysis of equilibria in the theory of non-cooperative games"

12/13/2012 GVC: PHAN THẾ CÔNG

5

Nobel Prize in Economic Sciences 2005

Robert J. Aumann

Thomas C. Schelling

"for having enhanced our understanding of conflict and cooperation through game-theory analysis"

12/13/2012 GVC: PHAN THẾ CÔNG

6

3

12/13/2012

Lý thuyết trò chơi

 Lý thuyết trò chơi là một nhánh của toán học ứng dụng thường được sử dụng trong phân tích kinh tế.  Nó sử dụng các mô hình để nghiên cứu các tình

huống chiến thuật, trong đó những người tham gia (người chơi) cố gắng để tối đa kết quả thu được của mình có tính đến hành động và phản ứng của các đối thủ khác

7

12/13/2012 GVC: PHAN THẾ CÔNG

Một số khái niệm cơ bản

 Trò chơi: một tình huống mà trong đó người chơi (người tham gia) đưa ra quyết định chiến lược có tính đến hành động và phản ứng của các đối thủ  Nếu tôi tin rằng các đối thủ cạnh tranh của tôi là

người có lý trí và hành động để tối đa hóa lợi nhuận của họ thì tôi phải tính đến hành vi của họ như thế nào khi ra quyết định tối đa hóa lợi nhuận của mình

8

4

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Một số khái niệm cơ bản

 Người chơi:

 Những người tham gia và hành động của họ có tác

động đến kết quả của của bạn.

 Chiến lược:

 Nguyên tắc hoặc kế hoạch hành động trong khi tiến

hành trò chơi

 Kết cục:

 Giá trị tương ứng với một kết quả có thể xảy ra.  Phản ánh lợi ích thu được của mỗi người chơi

9

12/13/2012 GVC: PHAN THẾ CÔNG

Một số khái niệm cơ bản

 Trò chơi đồng thời:

 Các đối thủ ra quyết định khi không biết đến quyết

định của đối phương

 Trò chơi tuần tự:

 Một người chơi ra quyết định trước, người chơi tiếp theo ra quyết định căn cứ vào quyết định của người đi trước.

10

5

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Một số khái niệm cơ bản

 Trò chơi hợp tác:

 là trò chơi mà trong đó những người chơi có thể đàm phán những cam kết ràng buộc lẫn nhau cho phép họ cùng lập các kế hoạch chiến lược chung

 Trò chơi bất hợp tác:

 Các bên tham gia không thể đàm phán và thực thi có

hiệu lực các cam kết ràng buộc

11

12/13/2012 GVC: PHAN THẾ CÔNG

Các giả định để nghiên cứu

 Những người chơi là những người có lý trí

 Mục đích của những người chơi đều là tối đa hóa kết cục

của bản thân họ

 Những người chơi đều là những người biết tính toán hoàn

hảo

 Hiểu biết chung:

 Mỗi người chơi đều biết nguyên tắc của trò chơi  Mỗi người chơi đều biết rằng người khác cũng biết nguyên

tắc của trò chơi

 Mỗi người chơi đều biết người chơi khác cũng là người có

lý trí

12

6

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Trò chơi đồng thời

 Trong khi tôi đưa ra quyết định của mình thì bạn

cũng vậy  Tôi và bạn đều đưa ra quyết định mà không biết đến

quyết định của người khác

 Cái mà tôi quyết định có ảnh hưởng đến kết cục

của bạn và cái mà bạn quyết định cũng ảnh hưởng đến kết cục của tôi.

 Cần phải đưa ra quyết định như thế nào?

13

12/13/2012 GVC: PHAN THẾ CÔNG

Trò chơi đồng thời

 Xác định ma trận lợi ích (ma trận kết cục): chỉ ra tất cả các kết cục của mỗi người chơi tương ứng với tất cả các hành động của mỗi người.

 Xác định hành động có kết quả tốt nhất cho cả

mình và đối thủ  Tìm ra cân bằng Nash

14

7

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Cân bằng Nash

 Cân bằng Nash là một tập hợp các chiến lược

(hoặc hành động) mà mỗi người chơi có thể làm điều tốt nhất cho mình, khi cho trước hành động của các đối thủ.  Mỗi người chơi không có động cơ xa rời chiến lược Nash của mình nên đây là các chiến lược ổn định

15

12/13/2012 GVC: PHAN THẾ CÔNG

Cân bằng Nash

 Nhắc lại:

 Cân bằng Cournot chính là cân bằng Nash:  Hai hãng ra quyết định sản lượng đồng thời.  Mỗi hãng sản xuất ở mức sản lượng làm hãng tối đa hóa lợi nhuận khi biết các hãng đối thủ sản xuất bao nhiêu.

 Cân bằng Stackelberg cũng là cân bằng Nash:

 Một hãng ra quyết định sản lượng trước, một hãng hành

động theo sau

 Mỗi hãng làm điều tốt nhất cho mình khi cho trước quyết

định của đối thủ

16

8

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Thể hiện một trò chơi

Người chơi

Hãng B

Không Q/cáo

Q/cáo

Ko Q/cáo

50 , 50

20 , 60

Hãng A

Q/cáo

60 , 20

30 , 30

Chiến lược

Kết cục

17

12/13/2012 GVC: PHAN THẾ CÔNG

Giải quyết trò chơi

Hãng B

Ko Q/cáo

Q/cáo

50 , 50

20 , 60

Ko Q/cáo

Hãng A

Q/cáo

60 , 20

30 , 30

 Phản ứng tốt nhất của hãng A

 Nếu Hãng B không quảng cáo: Quảng cáo  Nếu Hãng B quảng cáo: Quảng cáo  Hãng A sẽ quảng cáo bất kể hãng B có quảng cáo hay

không

18

9

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Chiến lược ưu thế

 Chiến lược ưu thế là một chiến lược hoặc hành

động mang lại kết cục tốt nhất dù cho các đối thủ có quyết định làm gì đi chăng nữa  Nếu một trò chơi có chiến lược ưu thế:

 các đối thủ sẽ lựa chọn chiến lược ưu thế của mình

19

12/13/2012 GVC: PHAN THẾ CÔNG

Chiến lược ưu thế và cân bằng Nash  Chiến lược ưu thế: Tôi đang làm điều tốt nhất có thể được cho tôi, bất kể bạn có làm điều gì đi nữa. Bạn đang làm điều tốt nhất có thể cho bạn, bất kể tôi làm gì đi nữa.

 Cân bằng Nash: Tôi đang làm điều tốt nhất có thể

được, cho trước cái bạn đang làm. Bạn đang làm điều tốt nhất có thể được, cho trước cái tôi đang làm  Cân bằng chiến lược ưu thế là trường hợp đặc biệt

của cân bằng Nash

20

10

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Chiến lược ưu thế

 Nguyên tắc:

 Nếu bạn có chiến lược ưu thế, hãy sử dụng nó  Dự đoán rằng đối thủ của bạn cũng sử dụng chiến

lược ưu thế của họ nếu như họ cũng có chiến lược ưu thế

21

12/13/2012 GVC: PHAN THẾ CÔNG

Tình thế lưỡng nan của những người tù

Người B

Thú tội

Không thú tội

8 , 8

0 , 20

Thú tội

Người A

20 , 0

1 , 1

Không thú tội

- Chiến lược ưu thế của người A: Thú tội - Chiến lược ưu thế của người B: Thú tội - Cân bằng xảy ra khi cả hai người cùng thú tội

22

11

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Trò chơi quảng cáo

Hãng B

Lớn

Trung bình

Lớn

70 , 50

140 , 25

Hãng A

25 , 140

120 , 90

Trung bình

- Cả hai hãng đều có chiến lược ưu thế - Ở trạng thái cân bằng, kết cục của hai hãng đều bị giảm đi so với trường hợp hai hãng hợp tác với nhau

23

Ra quyết định như thế nào khi chỉ có một người chơi có chiến lược ưu thế?

12/13/2012 GVC: PHAN THẾ CÔNG

Giả định rằng người chơi kia sử dụng chiến lược ưu thế của họ, khi đó sẽ chọn chiến lược phù hợp nhất khi đã biết chiến lược họ sử dụng

12

12/13/2012 24 GVC: PHAN THẾ CÔNG

12/13/2012

Khi chỉ một người chơi có chiến lược ưu thế

Hãng B

Q/cáo

Ko Q/cáo

Q/cáo

10 , 5

15 , 0

Hãng A

Ko Q/cáo

6 , 8

20 , 2

- Hãng A không có chiến lược ưu thế - Hãng B có chiến lược ưu thế: Quảng cáo - Hãng A cho rằng B sẽ quảng cáo  khi đó lựa chọn tốt nhất của hãng A là Quảng cáo

25

12/13/2012 GVC: PHAN THẾ CÔNG

Nếu không người chơi nào có chiến lược ưu thế?

13

12/13/2012 26 GVC: PHAN THẾ CÔNG

12/13/2012

Quyết định giá khi không có chiến lược ưu thế

$2

Bar 2 $4

$5

Bar 1

$2 10 , 10 14 , 12 14 , 15 $4 12 , 14 20 , 20 28 , 15 $5 15 , 14 15 , 28 25 , 25

27

12/13/2012 GVC: PHAN THẾ CÔNG

Loại trừ liên tiếp những chiến lược bị lấn át

 Xác định xem có người chơi nào có chiến lược bị

lấn át không?  Chiến lược bị lấn át là một chiến lược luôn có chiến

lược khác tốt hơn nó

 Nếu có chiến lược bị lấn át:  Loại bỏ chiến lược bị lấn át  Làm giảm kích thước của ma trận lợi ích  Lặp lại bước trên cho đến khi không còn chiến lược bị

lấn át

 Xác định điểm cân bằng

28

14

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Loại trừ liên tiếp những chiến lược bị lấn át

$2

Bar 2 $4

$5

Bar 1

$2 10 , 10 14 , 12 14 , 15 $4 12 , 14 20 , 20 28 , 15 $5 15 , 14 15 , 28 25 , 25

Cân bằng Nash ($4,$4)

29

12/13/2012 GVC: PHAN THẾ CÔNG

Loại trừ liên tiếp những chiến lược bị lấn át

 Giả sử có hai hãng Alpha và Beta  Hai hãng có 3 sự lựa chọn:

 Không mở rộng khả năng sản xuất: giữ nguyên quy

 Mở rộng khả năng sản xuất với quy mô nhỏ  Mở rộng khả năng sản xuất với quy mô lớn

30

15

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Loại trừ liên tiếp những chiến lược bị lấn át

Hãng Beta

Giữ nguyên

Nhỏ

Lớn

Giữ nguyên $18, $18

$15, $20

$9, $18

Nhỏ $20, $15

$16, $16

$8, $12

Hãng Alpha

Lớn

$18, $9

$12, $8

$0, $0

31

12/13/2012 GVC: PHAN THẾ CÔNG

Loại trừ liên tiếp những chiến lược bị lấn át

Thứ tự loại trừ chiến lược bị lấn át không tác động đến kết quả

Hãng Beta

Giữ nguyên

Nhỏ

Lớn

Giữ nguyên $18, $18

$15, $20

$9, $18

Nhỏ $20, $15

$16, $16

$8, $12

Hãng Alpha

Lớn

$18, $9

$12, $8

$0, $0

32

16

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Phân tích phản ứng tốt nhất

 Không phải mọi trò chơi đều có chiến lược ưu thế

và chiến lược bị lấn át

 Cần phân tích phản ứng tốt nhất để tìm ra cân

bằng Nash

33

12/13/2012 GVC: PHAN THẾ CÔNG

Phân tích phản ứng tốt nhất

 Ứng với mỗi chiến lược của đối thủ, tìm phản ứng tốt

nhất của người chơi  Ứng với mỗi chiến lược của người chơi 2, tìm phản ứng tốt nhất của người chơi 1: Trong mỗi cột, tìm kết cục cao nhất của người chơi 1

 Ứng với mỗi chiến lược của người chơi 1, tìm phản ứng tốt nhất của người chơi 2: Trong mỗi dòng, tìm kết cục cao nhất của người chơi 2

 Cân bằng Nash xảy ra tại ô xảy ra kết cục cao nhất của cả

hai người chơi

 Khi phân tích phản ứng tốt nhất không tìm ra cân bằng Nash không có cân bằng Nash đối với các chiến lược thuần túy

34

17

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Phân tích phản ứng tốt nhất

 Ví dụ

 Có hai hãng cạnh tranh nhau, mỗi hãng kiếm được

$45.000

 Cả hai hãng có thể đầu tư vào nghiên cứu triển khai

với chi phí là $45.000

 Nghiên cứu triển khai chỉ thành công khi cả hai hãng

đều tham gia

 Nếu nghiên cứu triển khai thành công, mỗi hãng sẽ

kiếm được $95.000

35

12/13/2012 GVC: PHAN THẾ CÔNG

Phân tích phản ứng tốt nhất

Hãng 2

Đầu tư

Không

Hãng 1

Đầu tư Không

50 , 50 0 , 45 45 , 0 45 , 45

 Có hai cân bằng Nash: cả hai cùng đầu tư, hoặc cả

hai cùng không đầu tư

 Các ô khác không phải là cân bằng Nash:

 Nếu hãng 1 đầu tư và hãng 2 không đầu tư: cả hai hãng đều có động cơ thay đổi chiến lược của mình

36

18

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Chiến lược maximin

Người chơi 2

Trái

Phải

Người chơi 1 Trên

1, 0

1, 1

Dưới

-1000, 0

2, 1

37

12/13/2012 GVC: PHAN THẾ CÔNG

Chiến lược maximin

 Trong trò chơi này, chơi “bên phải” là một chiến lược ưu thế đối với người chơi 2 vì bằng việc sử dụng chiến lược này, người chơi 2 sẽ được lợi hơn (thu được 1 chứ không phải là 0), bất kể người chơi 1 có làm gì đi nữa. Như vậy, người chơi 1 sẽ dự kiến rằng người chơi 2 sẽ chơi chiến lược “bên phải”. Trong trường hợp này, người chơi 1 sẽ được lợi hơn bằng việc chơi “bên dưới” (và thu được 2) chứ không phải là chơi “bên trên” (và thu được 1). Rõ ràng, kết cục (dưới, phải) là cân bằng Nash của trò chơi này. Nhưng lưu ý rằng, người chơi 1 phải biết rằng người chơi 2 hiểu trò chơi này và là người có lí trí. Nếu người chơi 2 tình cờ bị lỗi và chơi “bên trái” thì sẽ cực kỳ thiệt hại cho người chơi 1.

38

19

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Chiến lược maximin

 Nếu là người chơi 1, bạn sẽ làm gì? Nếu bạn là người thận trọng, và lo ngai rằng việc người chơi 2 có thể không được thông tin đầy đủ hoặc không có lí trí, bạn có thể chọn chơi “bên trên”. Trong trường hợp đó, bạn chắc chắn sẽ được 1, và bạn không có cơ hội mất 1000. Chiến lược như thế được gọi là chiến lược cực đại tối thiểu (maximin) vì nó cực đại hoá cái lợi tổi thiểu có thể thu được. Nếu cả hai người chơi cùng sử dụng chiến lược cực đại tối thiểu thì kết cục sẽ là (trên, phải). Chiến lược cực đại tối thiểu là chiến lược thận trọng, nhưng không phải là chiến lược tối đa hoá lợi nhuận (vì người chơi 1 thu được lợi nhuận bằng 1 chứ không phải bằng 2).

 Lưu ý rằng, nếu người chơi 1 biết chắc rằng người chơi 2 sử dụng chiến lược cực đại tối thiểu thì người này sẽ thích chơi “bên dưới” (và thu được 2), thay vì theo chiến lược cực đại tối thiểu là chơi “bên trên”.

39

12/13/2012 GVC: PHAN THẾ CÔNG

Chiến lược maximin

 Nhưng thú tội là một chiến lược ưu thế đối với

mỗi người tù – nó đem lại kết cục tốt hơn cho họ, không cần biết đến chiên lược của người tù kia.  Các chiến lược ưu thế cũng là các chiến lược cực

đại tối thiểu.

 Kết cục trong đó cả hai người tù cùng thú tội vừa là cân bằng Nash vừa là giải pháp cực đại tối thiểu. Như vậy, theo cách suy luật logic nhất thì thú tội là hợp lý nhất đối với mỗi người tù.

40

20

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Chiến lược maximin

 Chiến lược maximin (cực đại hóa tối thiểu)

 Đối với mỗi chiến lược, xác định kết cục thấp nhất  Trong các kết cục thấp nhất này, lựa chọn kết cục có

giá trị cao nhất

 Chiến lược maximin là chiến lược thận trọng,

nhưng không tối đa hóa lợi nhuận  Nó có thể là cân bằng Nash, có thể không.

41

12/13/2012 GVC: PHAN THẾ CÔNG

Chiến lược maximin

Hãng 2

Không

Đầu tư

Hãng 1

Không Đầu tư

0 , 0 -100,0

-10, 10 20, 10

 Nếu hãng 1 không đầu tư  mất lớn nhất là -10  Nếu hãng 1 đầu tư  mất lớn nhất là -100  Nếu hãng 1 lựa chọn theo nguyên tắc maximin 

chọn không đầu tư

42

21

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Trò chơi tuần tự

Hãng 2

Đầu tư

Không

Hãng 1

Đầu tư Không

50 , 50 0 , 45 45 , 0 45 , 45

 Nếu hai hãng quyết định đồng thời  có 2 cân bằng Nash  không biết chắc các hãng sẽ lựa chọn như thế nào

 Nếu hãng 1 là hãng quyết định trước:

 Hãng 1 sẽ quyết định đầu tư và hãng 2 cũng quyết

định đầu tư

43

12/13/2012 GVC: PHAN THẾ CÔNG

Trò chơi tuần tự

 Hãng A là hãng độc quyền, hãng B muốn xâm

nhập vào thị trường

 Hãng A có hai sự lựa chọn là: không phản ứng gì

hoặc đe dọa bằng cách giảm giá

 Hãng B có hai sự lựa chọn là gia nhập thị trường

hoặc không

44

22

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Trò chơi tuần tự

Hãng A

Không p/ứng

Đe dọa

50 , 50

-50 , -50

Gia nhập

B g n ã H

Không

0 , 100

0 , 100

Sử dụng phương pháp phản ứng tốt nhất, tìm được hai cân bằng Nash

45

12/13/2012 GVC: PHAN THẾ CÔNG

Trò chơi dạng mở rộng

0 , 100

B

-50 , -50

A

50 , 50

46

23

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Nhìn xa hơn…

 Hãng B quyết định trước: có gia nhập thị trường

hay không  Để quyết định hãng B cần phải xem phản ứng của

hãng A như thế nào  Nếu hãng B gia nhập:

 Hành động tốt nhất của hãng A là không phản ứng

47

12/13/2012 GVC: PHAN THẾ CÔNG

…và suy luận ngược

 Xem xét quyết định của hãng B

0 , 100

B

A

Không phản ứng

50 , 50

 Quyết định tốt nhất là hãng B gia nhập và hãng A

không phản ứng

48

24

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Nguyên tắc

 Nhìn xa hơn và suy luận ngược

 Dự đoán rằng đối thủ của bạn có hành động gì vào

ngày mai, để bạn đưa ra được phản ứng tốt nhất ngày hôm nay

49

12/13/2012 GVC: PHAN THẾ CÔNG

Giải quyết trò chơi tuần tự

 Bắt đầu bằng quyết định cuối cùng trong trò chơi  Xác định chiến lược mà người chơi sẽ chọn  Cắt bớt cây trò chơi:

 Loại bỏ chiến lược bị lấn át

 Lặp lại quá trình trên cho đến khi xác định được

quyết định của người chơi đầu tiên

50

25

12/13/2012 GVC: PHAN THẾ CÔNG

12/13/2012

Hai hãng quyết định sản lượng

 Hai hãng độc quyền cạnh tranh nhau về sản lượng  Hàm cầu thị trường là P = 30 – Q

 Trong đó Q = Q1 + Q2

 Giả định cả hai hãng có chi phí biên bằng 0  Cân bằng Cournot xảy ra khi hai hãng đều quyết định sản

lượng Q1 = Q2 = 10 và lợi nhuận mỗi hãng là 100

 Nếu hãng 1 quyết định trước Q1 = 15 và Q2 = 7,5, lợi nhuận

tương ứng là 112,5 và 56,25

51

12/13/2012 GVC: PHAN THẾ CÔNG

Hai hãng quyết định sản lượng

7,5

15

Hãng 2 10

Hãng 1

7,5 112,5; 112,5 10 125; 93,75 15 112,5; 56,25

93,75; 125 100; 100 75; 50

56,25; 112,5 50; 75 0; 0

52

26

12/13/2012 GVC: PHAN THẾ CÔNG