12/13/2012
KINH TẾ HỌC QUẢN LÝ (Managerial Economics)
12/13/2012 1 GVC: PHAN THẾ CÔNG
Chương 7
LÝ THUYẾT TRÒ CHƠI VÀ TƯ DUY CHIẾN LƯỢC
1
12/13/2012 GVC: PHAN THẾ CÔNG 2
12/13/2012
John Nash (1928--)
Received his Ph.D. from
Princeton University with a 28-page thesis on his 22-nd birthday. Invented the notion of Nash
equilibrium.
Wrote a seminal paper on
bargain theory.
Xem phim “A beautiful
Mind” nói về cuộc đời của John Nash.
12/13/2012 3 GVC: PHAN THẾ CÔNG
Applications of game theory
Economic theory Political science Psychological study Evolutionary biology (1970..) Computer science
Yao’s Lemma (1977)
12/13/2012 GVC: PHAN THẾ CÔNG
4
2
12/13/2012
Nobel Prize in Economic Sciences 1994
John C. Harsanyi
John F. Nash Jr.
Reinhard Selten
"for their pioneering analysis of equilibria in the theory of non-cooperative games"
12/13/2012 GVC: PHAN THẾ CÔNG
5
Nobel Prize in Economic Sciences 2005
Robert J. Aumann
Thomas C. Schelling
"for having enhanced our understanding of conflict and cooperation through game-theory analysis"
12/13/2012 GVC: PHAN THẾ CÔNG
6
3
12/13/2012
Lý thuyết trò chơi
Lý thuyết trò chơi là một nhánh của toán học ứng dụng thường được sử dụng trong phân tích kinh tế. Nó sử dụng các mô hình để nghiên cứu các tình
huống chiến thuật, trong đó những người tham gia (người chơi) cố gắng để tối đa kết quả thu được của mình có tính đến hành động và phản ứng của các đối thủ khác
7
12/13/2012 GVC: PHAN THẾ CÔNG
Một số khái niệm cơ bản
Trò chơi: một tình huống mà trong đó người chơi (người tham gia) đưa ra quyết định chiến lược có tính đến hành động và phản ứng của các đối thủ Nếu tôi tin rằng các đối thủ cạnh tranh của tôi là
người có lý trí và hành động để tối đa hóa lợi nhuận của họ thì tôi phải tính đến hành vi của họ như thế nào khi ra quyết định tối đa hóa lợi nhuận của mình
8
4
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Một số khái niệm cơ bản
Người chơi:
Những người tham gia và hành động của họ có tác
động đến kết quả của của bạn.
Chiến lược:
Nguyên tắc hoặc kế hoạch hành động trong khi tiến
hành trò chơi
Kết cục:
Giá trị tương ứng với một kết quả có thể xảy ra. Phản ánh lợi ích thu được của mỗi người chơi
9
12/13/2012 GVC: PHAN THẾ CÔNG
Một số khái niệm cơ bản
Trò chơi đồng thời:
Các đối thủ ra quyết định khi không biết đến quyết
định của đối phương
Trò chơi tuần tự:
Một người chơi ra quyết định trước, người chơi tiếp theo ra quyết định căn cứ vào quyết định của người đi trước.
10
5
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Một số khái niệm cơ bản
Trò chơi hợp tác:
là trò chơi mà trong đó những người chơi có thể đàm phán những cam kết ràng buộc lẫn nhau cho phép họ cùng lập các kế hoạch chiến lược chung
Trò chơi bất hợp tác:
Các bên tham gia không thể đàm phán và thực thi có
hiệu lực các cam kết ràng buộc
11
12/13/2012 GVC: PHAN THẾ CÔNG
Các giả định để nghiên cứu
Những người chơi là những người có lý trí
Mục đích của những người chơi đều là tối đa hóa kết cục
của bản thân họ
Những người chơi đều là những người biết tính toán hoàn
hảo
Hiểu biết chung:
Mỗi người chơi đều biết nguyên tắc của trò chơi Mỗi người chơi đều biết rằng người khác cũng biết nguyên
tắc của trò chơi
Mỗi người chơi đều biết người chơi khác cũng là người có
lý trí
12
6
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Trò chơi đồng thời
Trong khi tôi đưa ra quyết định của mình thì bạn
cũng vậy Tôi và bạn đều đưa ra quyết định mà không biết đến
quyết định của người khác
Cái mà tôi quyết định có ảnh hưởng đến kết cục
của bạn và cái mà bạn quyết định cũng ảnh hưởng đến kết cục của tôi.
Cần phải đưa ra quyết định như thế nào?
13
12/13/2012 GVC: PHAN THẾ CÔNG
Trò chơi đồng thời
Xác định ma trận lợi ích (ma trận kết cục): chỉ ra tất cả các kết cục của mỗi người chơi tương ứng với tất cả các hành động của mỗi người.
Xác định hành động có kết quả tốt nhất cho cả
mình và đối thủ Tìm ra cân bằng Nash
14
7
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Cân bằng Nash
Cân bằng Nash là một tập hợp các chiến lược
(hoặc hành động) mà mỗi người chơi có thể làm điều tốt nhất cho mình, khi cho trước hành động của các đối thủ. Mỗi người chơi không có động cơ xa rời chiến lược Nash của mình nên đây là các chiến lược ổn định
15
12/13/2012 GVC: PHAN THẾ CÔNG
Cân bằng Nash
Nhắc lại:
Cân bằng Cournot chính là cân bằng Nash: Hai hãng ra quyết định sản lượng đồng thời. Mỗi hãng sản xuất ở mức sản lượng làm hãng tối đa hóa lợi nhuận khi biết các hãng đối thủ sản xuất bao nhiêu.
Cân bằng Stackelberg cũng là cân bằng Nash:
Một hãng ra quyết định sản lượng trước, một hãng hành
động theo sau
Mỗi hãng làm điều tốt nhất cho mình khi cho trước quyết
định của đối thủ
16
8
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Thể hiện một trò chơi
Người chơi
Hãng B
Không Q/cáo
Q/cáo
Ko Q/cáo
50 , 50
20 , 60
Hãng A
Q/cáo
60 , 20
30 , 30
Chiến lược
Kết cục
17
12/13/2012 GVC: PHAN THẾ CÔNG
Giải quyết trò chơi
Hãng B
Ko Q/cáo
Q/cáo
50 , 50
20 , 60
Ko Q/cáo
Hãng A
Q/cáo
60 , 20
30 , 30
Phản ứng tốt nhất của hãng A
Nếu Hãng B không quảng cáo: Quảng cáo Nếu Hãng B quảng cáo: Quảng cáo Hãng A sẽ quảng cáo bất kể hãng B có quảng cáo hay
không
18
9
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Chiến lược ưu thế
Chiến lược ưu thế là một chiến lược hoặc hành
động mang lại kết cục tốt nhất dù cho các đối thủ có quyết định làm gì đi chăng nữa Nếu một trò chơi có chiến lược ưu thế:
các đối thủ sẽ lựa chọn chiến lược ưu thế của mình
19
12/13/2012 GVC: PHAN THẾ CÔNG
Chiến lược ưu thế và cân bằng Nash Chiến lược ưu thế: Tôi đang làm điều tốt nhất có thể được cho tôi, bất kể bạn có làm điều gì đi nữa. Bạn đang làm điều tốt nhất có thể cho bạn, bất kể tôi làm gì đi nữa.
Cân bằng Nash: Tôi đang làm điều tốt nhất có thể
được, cho trước cái bạn đang làm. Bạn đang làm điều tốt nhất có thể được, cho trước cái tôi đang làm Cân bằng chiến lược ưu thế là trường hợp đặc biệt
của cân bằng Nash
20
10
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Chiến lược ưu thế
Nguyên tắc:
Nếu bạn có chiến lược ưu thế, hãy sử dụng nó Dự đoán rằng đối thủ của bạn cũng sử dụng chiến
lược ưu thế của họ nếu như họ cũng có chiến lược ưu thế
21
12/13/2012 GVC: PHAN THẾ CÔNG
Tình thế lưỡng nan của những người tù
Người B
Thú tội
Không thú tội
8 , 8
0 , 20
Thú tội
Người A
20 , 0
1 , 1
Không thú tội
- Chiến lược ưu thế của người A: Thú tội - Chiến lược ưu thế của người B: Thú tội - Cân bằng xảy ra khi cả hai người cùng thú tội
22
11
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Trò chơi quảng cáo
Hãng B
Lớn
Trung bình
Lớn
70 , 50
140 , 25
Hãng A
25 , 140
120 , 90
Trung bình
- Cả hai hãng đều có chiến lược ưu thế - Ở trạng thái cân bằng, kết cục của hai hãng đều bị giảm đi so với trường hợp hai hãng hợp tác với nhau
23
Ra quyết định như thế nào khi chỉ có một người chơi có chiến lược ưu thế?
12/13/2012 GVC: PHAN THẾ CÔNG
Giả định rằng người chơi kia sử dụng chiến lược ưu thế của họ, khi đó sẽ chọn chiến lược phù hợp nhất khi đã biết chiến lược họ sử dụng
12
12/13/2012 24 GVC: PHAN THẾ CÔNG
12/13/2012
Khi chỉ một người chơi có chiến lược ưu thế
Hãng B
Q/cáo
Ko Q/cáo
Q/cáo
10 , 5
15 , 0
Hãng A
Ko Q/cáo
6 , 8
20 , 2
- Hãng A không có chiến lược ưu thế - Hãng B có chiến lược ưu thế: Quảng cáo - Hãng A cho rằng B sẽ quảng cáo khi đó lựa chọn tốt nhất của hãng A là Quảng cáo
25
12/13/2012 GVC: PHAN THẾ CÔNG
Nếu không người chơi nào có chiến lược ưu thế?
13
12/13/2012 26 GVC: PHAN THẾ CÔNG
12/13/2012
Quyết định giá khi không có chiến lược ưu thế
$2
Bar 2 $4
$5
Bar 1
$2 10 , 10 14 , 12 14 , 15 $4 12 , 14 20 , 20 28 , 15 $5 15 , 14 15 , 28 25 , 25
27
12/13/2012 GVC: PHAN THẾ CÔNG
Loại trừ liên tiếp những chiến lược bị lấn át
Xác định xem có người chơi nào có chiến lược bị
lấn át không? Chiến lược bị lấn át là một chiến lược luôn có chiến
lược khác tốt hơn nó
Nếu có chiến lược bị lấn át: Loại bỏ chiến lược bị lấn át Làm giảm kích thước của ma trận lợi ích Lặp lại bước trên cho đến khi không còn chiến lược bị
lấn át
Xác định điểm cân bằng
28
14
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Loại trừ liên tiếp những chiến lược bị lấn át
$2
Bar 2 $4
$5
Bar 1
$2 10 , 10 14 , 12 14 , 15 $4 12 , 14 20 , 20 28 , 15 $5 15 , 14 15 , 28 25 , 25
Cân bằng Nash ($4,$4)
29
12/13/2012 GVC: PHAN THẾ CÔNG
Loại trừ liên tiếp những chiến lược bị lấn át
Giả sử có hai hãng Alpha và Beta Hai hãng có 3 sự lựa chọn:
Không mở rộng khả năng sản xuất: giữ nguyên quy
mô
Mở rộng khả năng sản xuất với quy mô nhỏ Mở rộng khả năng sản xuất với quy mô lớn
30
15
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Loại trừ liên tiếp những chiến lược bị lấn át
Hãng Beta
Giữ nguyên
Nhỏ
Lớn
Giữ nguyên $18, $18
$15, $20
$9, $18
Nhỏ $20, $15
$16, $16
$8, $12
Hãng Alpha
Lớn
$18, $9
$12, $8
$0, $0
31
12/13/2012 GVC: PHAN THẾ CÔNG
Loại trừ liên tiếp những chiến lược bị lấn át
Thứ tự loại trừ chiến lược bị lấn át không tác động đến kết quả
Hãng Beta
Giữ nguyên
Nhỏ
Lớn
Giữ nguyên $18, $18
$15, $20
$9, $18
Nhỏ $20, $15
$16, $16
$8, $12
Hãng Alpha
Lớn
$18, $9
$12, $8
$0, $0
32
16
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Phân tích phản ứng tốt nhất
Không phải mọi trò chơi đều có chiến lược ưu thế
và chiến lược bị lấn át
Cần phân tích phản ứng tốt nhất để tìm ra cân
bằng Nash
33
12/13/2012 GVC: PHAN THẾ CÔNG
Phân tích phản ứng tốt nhất
Ứng với mỗi chiến lược của đối thủ, tìm phản ứng tốt
nhất của người chơi Ứng với mỗi chiến lược của người chơi 2, tìm phản ứng tốt nhất của người chơi 1: Trong mỗi cột, tìm kết cục cao nhất của người chơi 1
Ứng với mỗi chiến lược của người chơi 1, tìm phản ứng tốt nhất của người chơi 2: Trong mỗi dòng, tìm kết cục cao nhất của người chơi 2
Cân bằng Nash xảy ra tại ô xảy ra kết cục cao nhất của cả
hai người chơi
Khi phân tích phản ứng tốt nhất không tìm ra cân bằng Nash không có cân bằng Nash đối với các chiến lược thuần túy
34
17
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Phân tích phản ứng tốt nhất
Ví dụ
Có hai hãng cạnh tranh nhau, mỗi hãng kiếm được
$45.000
Cả hai hãng có thể đầu tư vào nghiên cứu triển khai
với chi phí là $45.000
Nghiên cứu triển khai chỉ thành công khi cả hai hãng
đều tham gia
Nếu nghiên cứu triển khai thành công, mỗi hãng sẽ
kiếm được $95.000
35
12/13/2012 GVC: PHAN THẾ CÔNG
Phân tích phản ứng tốt nhất
Hãng 2
Đầu tư
Không
Hãng 1
Đầu tư Không
50 , 50 0 , 45 45 , 0 45 , 45
Có hai cân bằng Nash: cả hai cùng đầu tư, hoặc cả
hai cùng không đầu tư
Các ô khác không phải là cân bằng Nash:
Nếu hãng 1 đầu tư và hãng 2 không đầu tư: cả hai hãng đều có động cơ thay đổi chiến lược của mình
36
18
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Chiến lược maximin
Người chơi 2
Trái
Phải
Người chơi 1 Trên
1, 0
1, 1
Dưới
-1000, 0
2, 1
37
12/13/2012 GVC: PHAN THẾ CÔNG
Chiến lược maximin
Trong trò chơi này, chơi “bên phải” là một chiến lược ưu thế đối với người chơi 2 vì bằng việc sử dụng chiến lược này, người chơi 2 sẽ được lợi hơn (thu được 1 chứ không phải là 0), bất kể người chơi 1 có làm gì đi nữa. Như vậy, người chơi 1 sẽ dự kiến rằng người chơi 2 sẽ chơi chiến lược “bên phải”. Trong trường hợp này, người chơi 1 sẽ được lợi hơn bằng việc chơi “bên dưới” (và thu được 2) chứ không phải là chơi “bên trên” (và thu được 1). Rõ ràng, kết cục (dưới, phải) là cân bằng Nash của trò chơi này. Nhưng lưu ý rằng, người chơi 1 phải biết rằng người chơi 2 hiểu trò chơi này và là người có lí trí. Nếu người chơi 2 tình cờ bị lỗi và chơi “bên trái” thì sẽ cực kỳ thiệt hại cho người chơi 1.
38
19
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Chiến lược maximin
Nếu là người chơi 1, bạn sẽ làm gì? Nếu bạn là người thận trọng, và lo ngai rằng việc người chơi 2 có thể không được thông tin đầy đủ hoặc không có lí trí, bạn có thể chọn chơi “bên trên”. Trong trường hợp đó, bạn chắc chắn sẽ được 1, và bạn không có cơ hội mất 1000. Chiến lược như thế được gọi là chiến lược cực đại tối thiểu (maximin) vì nó cực đại hoá cái lợi tổi thiểu có thể thu được. Nếu cả hai người chơi cùng sử dụng chiến lược cực đại tối thiểu thì kết cục sẽ là (trên, phải). Chiến lược cực đại tối thiểu là chiến lược thận trọng, nhưng không phải là chiến lược tối đa hoá lợi nhuận (vì người chơi 1 thu được lợi nhuận bằng 1 chứ không phải bằng 2).
Lưu ý rằng, nếu người chơi 1 biết chắc rằng người chơi 2 sử dụng chiến lược cực đại tối thiểu thì người này sẽ thích chơi “bên dưới” (và thu được 2), thay vì theo chiến lược cực đại tối thiểu là chơi “bên trên”.
39
12/13/2012 GVC: PHAN THẾ CÔNG
Chiến lược maximin
Nhưng thú tội là một chiến lược ưu thế đối với
mỗi người tù – nó đem lại kết cục tốt hơn cho họ, không cần biết đến chiên lược của người tù kia. Các chiến lược ưu thế cũng là các chiến lược cực
đại tối thiểu.
Kết cục trong đó cả hai người tù cùng thú tội vừa là cân bằng Nash vừa là giải pháp cực đại tối thiểu. Như vậy, theo cách suy luật logic nhất thì thú tội là hợp lý nhất đối với mỗi người tù.
40
20
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Chiến lược maximin
Chiến lược maximin (cực đại hóa tối thiểu)
Đối với mỗi chiến lược, xác định kết cục thấp nhất Trong các kết cục thấp nhất này, lựa chọn kết cục có
giá trị cao nhất
Chiến lược maximin là chiến lược thận trọng,
nhưng không tối đa hóa lợi nhuận Nó có thể là cân bằng Nash, có thể không.
41
12/13/2012 GVC: PHAN THẾ CÔNG
Chiến lược maximin
Hãng 2
Không
Đầu tư
Hãng 1
Không Đầu tư
0 , 0 -100,0
-10, 10 20, 10
Nếu hãng 1 không đầu tư mất lớn nhất là -10 Nếu hãng 1 đầu tư mất lớn nhất là -100 Nếu hãng 1 lựa chọn theo nguyên tắc maximin
chọn không đầu tư
42
21
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Trò chơi tuần tự
Hãng 2
Đầu tư
Không
Hãng 1
Đầu tư Không
50 , 50 0 , 45 45 , 0 45 , 45
Nếu hai hãng quyết định đồng thời có 2 cân bằng Nash không biết chắc các hãng sẽ lựa chọn như thế nào
Nếu hãng 1 là hãng quyết định trước:
Hãng 1 sẽ quyết định đầu tư và hãng 2 cũng quyết
định đầu tư
43
12/13/2012 GVC: PHAN THẾ CÔNG
Trò chơi tuần tự
Hãng A là hãng độc quyền, hãng B muốn xâm
nhập vào thị trường
Hãng A có hai sự lựa chọn là: không phản ứng gì
hoặc đe dọa bằng cách giảm giá
Hãng B có hai sự lựa chọn là gia nhập thị trường
hoặc không
44
22
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Trò chơi tuần tự
Hãng A
Không p/ứng
Đe dọa
50 , 50
-50 , -50
Gia nhập
B g n ã H
Không
0 , 100
0 , 100
Sử dụng phương pháp phản ứng tốt nhất, tìm được hai cân bằng Nash
45
12/13/2012 GVC: PHAN THẾ CÔNG
Trò chơi dạng mở rộng
0 , 100
B
-50 , -50
A
50 , 50
46
23
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Nhìn xa hơn…
Hãng B quyết định trước: có gia nhập thị trường
hay không Để quyết định hãng B cần phải xem phản ứng của
hãng A như thế nào Nếu hãng B gia nhập:
Hành động tốt nhất của hãng A là không phản ứng
47
12/13/2012 GVC: PHAN THẾ CÔNG
…và suy luận ngược
Xem xét quyết định của hãng B
0 , 100
B
A
Không phản ứng
50 , 50
Quyết định tốt nhất là hãng B gia nhập và hãng A
không phản ứng
48
24
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Nguyên tắc
Nhìn xa hơn và suy luận ngược
Dự đoán rằng đối thủ của bạn có hành động gì vào
ngày mai, để bạn đưa ra được phản ứng tốt nhất ngày hôm nay
49
12/13/2012 GVC: PHAN THẾ CÔNG
Giải quyết trò chơi tuần tự
Bắt đầu bằng quyết định cuối cùng trong trò chơi Xác định chiến lược mà người chơi sẽ chọn Cắt bớt cây trò chơi:
Loại bỏ chiến lược bị lấn át
Lặp lại quá trình trên cho đến khi xác định được
quyết định của người chơi đầu tiên
50
25
12/13/2012 GVC: PHAN THẾ CÔNG
12/13/2012
Hai hãng quyết định sản lượng
Hai hãng độc quyền cạnh tranh nhau về sản lượng Hàm cầu thị trường là P = 30 – Q
Trong đó Q = Q1 + Q2
Giả định cả hai hãng có chi phí biên bằng 0 Cân bằng Cournot xảy ra khi hai hãng đều quyết định sản
lượng Q1 = Q2 = 10 và lợi nhuận mỗi hãng là 100
Nếu hãng 1 quyết định trước Q1 = 15 và Q2 = 7,5, lợi nhuận
tương ứng là 112,5 và 56,25
51
12/13/2012 GVC: PHAN THẾ CÔNG
Hai hãng quyết định sản lượng
7,5
15
Hãng 2 10
Hãng 1
7,5 112,5; 112,5 10 125; 93,75 15 112,5; 56,25
93,75; 125 100; 100 75; 50
56,25; 112,5 50; 75 0; 0
52
26
12/13/2012 GVC: PHAN THẾ CÔNG