Chương 7. Lý thuyết trò chơi và tư duy chiến lược
Lý thuyết trò chơi và tư duy chiến lược
Giới thiệu Khái niệm Ý nghĩa của lý thuyết trò chơi trong hoạt động kinh
doanh
Trò chơi dưới dạng chiến lược
Chiến lược trội Cân bằng Nash Chiến lược thuần túy và chiến lược hỗn hợp Trò chơi lặp đi lặp lại Chiến lược maximin
Trò chơi dưới dạng phạm vi mở rộng
Trò chơi tiếp diễn theo thứ tự
Lý thuyết trò chơi
Sự phụ thuộc lẫn nhau chiến lược thể hiện những tình
huống mà trong đó kết quả của một hãng (lợi nhuận hay lợi ích) phụ thuộc cốt yếu vào những quyết định của những hãng khác.
Lý thuyết trò chơi là cách phân tích về những sự phụ
thuộc lẫn nhau chiến lược.
Lý thuyết trò chơi cung cấp một phương pháp logic và bài bản trong việc nghiên cứu những tình huống kinh doanh, hay "trò chơi“.
Lý thuyết trò chơi có thể mô hình hiện thực hóa những tình huống kinh doanh, nó giúp những hãng kinh doanh đưa ra những quyết định tối ưu và chọn những hành động tối ưu.
Lý thuyết trò chơi
Trò chơi là tình huống trong đó các người chơi đưa ra những quyết định chiến lược; những quyết định có tính đến hành động và phản ứng của đối thủ.
Những quyết định chiến lược sẽ dẫn đến những
kết quả cho những người chơi.
Chiến lược là một qui tắc hay kế hoặch hành
động trong trò chơi khi mà các đối thủ tích cực nghiên cứu những tác động qua lại với nhau khi đưa ra những quyết định.
Lý thuyết trò chơi là một tập hợp các ý tưởng và
nguyên lý để dẫn dắt tư duy chiến lược.
Lý thuyết trò chơi
Mỗi trò chơi có ba yếu tố cần thiết:
Những người chơi Những chiến lược và hành động Những kết quả
Lý thuyết trò chơi
Có hai thể loại trò chơi:
Trò chơi dưới dạng chiến lược (game in
strategic form): được sử dụng trong tình huống khi những người chơi phải đưa ra quyết định cùng lúc.
Trò chơi dưới dạng phạm vi mở rộng (game in
extensive form): được sử dụng trong tình huống khi những người chơi đưa ra quyết định theo thứ tự.
Trò chơi dưới dạng chiến lược
Trò chơi dưới dạng chiến lược là một sự trình bày dưới
dạng bảng về một tình huống chiến lược, thể hiện những hành động của người chơi theo hàng và cột, và các kết quả cho những người chơi trong các ô tương ứng.
Những kết quả và hành động sẵn có cho những người
chơi là kiến thức chung.
Mỗi người chơi không biết trước được sự lựa chọn
chính thức của đối thủ.
Những người chơi phải đưa ra quyết định cùng lúc và khi đưa ra sự lựa chọn hành động cho mình những người chơi phải dự đoán hành động nào đối thủ của họ sẽ chọn.
Trò chơi dưới dạng phạm vi mở rộng
Trò chơi dưới dạng phạm vi mở rộng là một sự trình bày dưới dạng biểu đồ về một tình huống chiến lược thể hiện trật tự các sự lựa chọn và các kết quả tương ứng.
Những người chơi không đưa ra quyết định
đồng thời mà các quyết định có thể được đưa ra theo thứ tự. Một người chơi có thể biết được sự lựa chọn của đối thủ trước khi anh ta phải đưa ra sự lựa chọn của mình.
Trò chơi dưới dạng chiến lược
Trạng thái nan giải của người tù
Người tù thứ hai
Nhận tội
Không nhận tội
Nhận tội
-5, -5
-1, -10
Người tù thứ nhất
-10, -1
-2, -2
Không nhận tội
Trò chơi dưới dạng chiến lược
Chiến lược trội: Chiến lược tối ưu bất kể
đối thủ hành động ra sao.
Trò chơi dưới dạng chiến lược
Cân bằng Nash: trạng thái trong đó mỗi
người chơi chọn chiến lược tối đa hóa kết quả của mình, cho trước chiến lược của đối thủ. Tôi chọn cách tốt nhất khi cho trước hành động
của anh
Anh chọn cách tốt nhất khi cho trước hành
động của tôi
Chiến lược thuần túy và chiến lược hỗn hợp
Chiến lược thuần túy: chiến lược mà nó được
đưa ra với một sự chắc chắn (xác suất bằng 1).
Chiến lược hỗn hợp (chiến lược ngẫu nhiên):
chiến lược mà nó được lựa chọn một cách ngẫu nhiên với một xác suất nhất định nào đó. Chiến lược hỗn hợp là chiến lược lựa chọn trong số những chiến lược thuần túy theo xác suất được ấn định.
Cân bằng Nash trong chiến lược thuần túy
Cuộc chiến giữa các đài phát thanh
Merkur
Nhạc nhẹ Không thay đ iổ
M: 60, J: 40 M: 60, J: 40 Nhạc rock
Jupiter
M: 70, J: 30 M: 50, J: 50 Không thay đ iổ
Cân bằng Nash trong chiến lược thuần túy
Tình trạng nan giải của cartel
Sharon Corp.
ả ượ ả ượ ng S n l ng cao
S n l th pấ
ả ượ ng H: 15, S: 10 H: 10, S: 13 S n l th pấ
Hilda Inc.
ả ượ ng H: 19, S: 5 H: 12, S: 8 S n l cao
Cân bằng Nash trong chiến lược hỗn hợp
Định giá bán lẻ
Joe
Giá cao
Giá thấp
Giá cao
M: 6000, J: 4000
M: 4000, J: 5000
Mick
Giá thấp
M: 5000, J: 4000
M: 5000, J: 3000
Cân bằng Nash trong chiến lược hỗn hợp
Định giá bán lẻ
Joe
Giá cao p
Giá thấp 1- p
M: 6000, J: 4000
M: 4000, J: 5000
Giá cao q
Mick
q
M: 5000, J: 4000
M: 5000, J: 3000
Giá thấp 1- q
Chiến lược maximin
Chiến lược maximin: người chơi nghiên
cứu kết quả xấu nhất của mỗi hành động và chọn hành động có kết quả khả dĩ nhất trong số những kết quả xấu nhất đó. Mục đích của chiến lược này là tránh
được kết quả xấu nhất.
Chiến lược maximin có tên gọi là chiến
lược bi quan hay bảo thủ.
Chiến lược maximin
Hãng B
Không đầu tư Đầu tư
A: 0, B: 0 A: -10, B: 10 Không đầu tư
Hãng A
Đầu tư A: -100, B: 0 A: 20, B: 10
Trò chơi dưới dạng phạm vi mở rộng
Trò chơi tiếp diễn theo thứ tự:
Trò chơi trong đó những người chơi đưa ra quyết định
tại những thời điểm khác nhau hay là theo thứ tự. Những người đưa ra quyết định sau có thêm thông tin
về hành động của những người chơi khác.
Những người đưa ra quyết định trước có thể thường
ảnh hưởng đến trò chơi.
Chiến lược của mỗi người chơi là đưa ra những hành động được chọn phụ thuộc vào thông tin nhận thêm được trong suốt trò chơi.
Trò chơi tiếp diễn theo thứ tự
Trận chiến cho thời sự buổi tối: Hai kênh phát thời sự buổi tối là Channel Alpha và Channel Beta và hai thời gian phát sóng là 6.30pm và 7pm. Channel Alpha được chọn sếp lịch phát sóng chương trình thời sự của mình trước Channel Beta. Một khi Channel Alpha chọn thời gian thì Channel Beta sẽ chọn thời gian của mình. Nếu Channel Alpha chọn phát sóng 6.30 pm thì: (1) nếu
Channel Beta chọn phát sóng 6.30 pm thì lợi nhuận của Alpha là $1 triệu và Beta là $1 triệu; (2) nếu Channel Beta chọn phát sóng 7 pm thì lợi nhuận của Alpha là $3 triệu và Beta là $4 triệu.
Nếu Channel Alpha chọn phát sóng 7 pm thì: (1) nếu Channel
Beta chọn phát sóng 6.30 pm thì lợi nhuận của Alpha là $4 triệu và Beta là $3 triệu; (2) nếu Channel Beta chọn phát sóng 7 pm thì lợi nhuận của Alpha là $2,5 triệu và Beta là $2,5 triệu.
Trò chơi tiếp diễn theo thứ tự
Trận chiến cho thời sự buổi tối