Tình trạng lưỡng nan của người tù

Một "trò chơi" đặc biệt quan trọng là tình trạng lưỡng nan của người tù. Trò chơi này đem lại cho chúng ta những hiểu biết sâu sắc về việc tại sao lại khó duy trì được sự hợp tác. Rất nhiều lần trong đời, người ta đã không hợp tác với nhau ngay cả khi sự hợp tác làm lợi cho tất cả các bên. Độc quyền nhóm chỉ là một ví dụ trong số đó. Câu chuyện về tình trạng lưỡng nan của người tù hàm chứa bài học phổ biến có thể áp dụng cho bất cứ nhóm người nào mà trong đó các thành viên đang tìm cách hợp tác với nhau.

Tình trạng lưỡng nan của người tù là câu chuyện về hai phạm nhân vừa bị cảnh sát bắt. Hãy gọi họ là Bonnie và Clyde. Cảnh sát có đủ chứng cứ để kết tội Bonnie và Clyde đã phạm phải một tội nhỏ là mang súng nhưng không đăng ký. Vì tội này, mỗi người sẽ bị kết án một năm tù. Ngoài ra, cảnh sát còn nghi ngờ rằng họ đã cùng nhau thực hiện một vụ cướp nhà băng, nhưng thiếu chứng cớ rõ ràng để quy kết tội lớn này cho họ. Cảnh sát hỏi cung Bonnie và Clyde trong các phòng riêng biệt và thỏa thuận với từng người như sau:

"Hiện nay chúng tôi có thể giam giữ anh trong một năm. Tuy nhiên, nếu anh nhận tội cướp nhà băng và tố cáo đồng phạm, thì anh sẽ được miễn tội và tha bổng. Đồng phạm của anh sẽ lãnh án 20 năm tù. Nhưng nếu cả hai người cùng nhận tội, thì chúng tôi không cần chứng cớ và không mất chi phí xét xử và vì vậy mỗi anh sẽ nhận một bản án 8 năm tù."

Nếu Bonnie và Clyde - hai tên cướp nhà băng vô lương tâm - chỉ quan tâm đến bản án của mình, thì theo bạn họ sẽ hành động như thế nào? Họ sẽ thú tội hay im lặng? Mỗi người tù có hai chiến lược: thú nhận hoặc im lặng. Bản án mà mỗi người tù nhận được phụ thuộc vào chiến lược anh ta chọn và chiến lược mà đồng phạm của anh ta chọn.

Hãy xem quyết định đầu tiên của Bonnie. Anh ta lập luận rằng: "Ta không biết Clyde sẽ làm gì. Nếu anh ta im lặng, thì chiến lược tốt nhất của ta là thú nhận, vì ta sẽ được thả thay vì phải ngồi tù một năm. Nếu anh ta thú nhận, chiến lược tốt nhất của ta vẫn là thú nhận, vì ta chỉ phải ngồi tù 8 năm, tốt hơn là phải ngồi tù 20 năm. Do vậy, không cần biết Clyde sẽ làm gì, tốt nhất là ta nên thú tội."

Theo ngôn ngữ lý thuyết trò chơi, một chiến lược được gọi là chiến lược trội nếu đó là chiến lược tốt nhất cho mọi đấu thủ, cho dù chiến lược của đấu thủ kia là gì. Trong trường hợp của chúng ta, thú nhận là chiến lược tốt nhất đối với Bonnie. Anh ta sẽ phải ngồi tù ít hơn nếu thú nhận, cho dù Clyde sẽ thú nhận hay im lặng.

Bây giờ chúng ta hãy xem xét quyết định của Clyde. Anh ta cũng có sự lựa chọn giống như của Bonnie và lập luận hoàn toàn tương tự. Cho dù Bonnie làm gì, Clyde vẫn có thể giảm được thời gian ngồi tù bằng cách thú nhận. Nói cách khác, thú nhận cũng là chiến lược trội đối với Clyde.

Cuối cùng, cả Bonnie và Clyde đều thú nhận, do vậy cả hai đều phải ngồi tù 8 năm. Song đây là kết cục bất lợi đối với họ. Nếu cả hai cùng im lặng, họ có thể được lợi vì mỗi người chỉ phải ngồi tù 1 năm do mang súng bất hợp pháp. Do mỗi người theo đuổi lợi ích riêng của mình, nên cả hai người tù đã gây ra một kết cục bất lợi cho mỗi người.

Để thấy việc duy trì sự hợp tác này khó khăn đến mức nào, chúng ta hãy tượng tượng rằng trước khi cảnh sát bắt giữ Bonnie và Clyde, hai người đã thỏa thuận với nhau là sẽ không khai báo. Rõ ràng thỏa thuận này làm lợi cho cả hai người nếu họ trung thành với nó, vì mỗi người chỉ phải ngồi tù 1 năm. Nhưng họ có thực sự im lặng không khi đã nhất trí không cung khai? Một khi họ bị hỏi cung riêng biệt, logic của lợi ích cá nhân sẽ chiếm ưu thế và họ sẽ thú nhận. Sự hợp tác giữa những người tù khó có thể duy trì, bởi vì sự hợp tác là vô lý nếu đứng trên quan điểm cá nhân.

ĐỘC QUYỀN NHÓM VỚI TƯ CÁCH TÌNH TRẠNG LƯỠNG NAN CỦA NGƯỜI TÙ

Tình trạng lưỡng nan của người tù có quan hệ gì với thị trường và cạnh tranh không hoàn hảo? Hóa ra là, trò chơi mà các nhà độc quyền nhóm chơi trong quá trình đạt được kết cục độc quyền giống như trò chơi mà hai người tù đã chơi trong tình trạng lưỡng nan của họ.

Chúng ta hãy xem xét một thị trường độc quyền nhóm có hai thành viên là Iran và Iraq. Cả hai nước đều bán dầu thô. Sau thời gian thương lượng kéo dài, hai nước thỏa thuận là sẽ giữ sản lượng ở mức thấp để giữ cho giá dầu thế giới ở mức cao. Sau khi thỏa thuận về sản lượng, mỗi nước phải quyết định xem sẽ hợp tác và tuân thủ thỏa thuận, hay phớt lờ nó và tăng sản lượng.

Giả sử bạn là tổng thống Iraq. Bạn có thể lập luận như sau: "Ta có thể giữ sản lượng thấp ở mức như đã thỏa thuận, hoặc ta có thể tăng sản lượng và bán nhiều dầu hơn ra thị trường thế giới. Nếu Iran trung thành với thỏa thuận và giữ sản lượng ở mức thấp, thì nước ta sẽ thu được 60 tỷ đôla với sản lượng cao và 50 tỷ đôla với sản lượng thấp. Trong trường hợp này, Iraq có lợi hơn với mức sản lượng cao. Nếu Iran không trung thành với thỏa thuận và sản xuất nhiều hơn, thì nước ta thu được 40 tỷ đôla với sản lượng cao và 30 tỷ đôla với sản lượng thấp. Một lần nữa, Iraq có lợi hơn với sản lượng ở mức cao. Do vậy, cho dù Iran làm gì, nước ta cũng có lợi hơn nếu phản bội thỏa ước và sản xuất ở mức cao hơn."

Sản xuất ở mức cao là chiến lược trội đối với Iraq. Tất nhiên, Iran cũng lập luận tương tự như vậy và do vậy cả hai nước cùng sản xuất ở mức cao. Kết quả là kết cục bất lợi (từ lập luận của Iran và Iraq) với lợi nhuận thấp hơn cho mỗi nước.

Ví dụ này lý giải tại sao các nhà độc quyền nhóm gặp khó khăn trong việc duy trì lợi nhuận độc quyền. Kết cục độc quyền là hợp lý cho cả thị trường độc quyền nhóm, nhưng mỗi nhà độc quyền nhóm lại có động cơ để gian lận. Cũng giống như lợi ích cá nhân đã thúc đẩy phạm nhân thú tội trong tình trạng lưỡng nan, lợi ích cá nhân cũng làm cho nhà độc quyền nhóm gặp khó khăn trong việc duy trì kết cục hợp tác với sản lượng thấp, giá cao và lợi nhuận độc quyền.

CHẠY ĐUA VŨ TRANG

Chúng ta vừa thấy tình trạng lưỡng nan của người tù có thể được dùng để tìm hiểu vấn đề của độc quyền nhóm. Logic này cũng được áp dụng cho rất nhiều trường hợp khác. Ở đây, chúng ta xem xét ví dụ Chạy đua vũ trang mà trong đó lợi ích cá nhân ngăn cản sự hợp tác và dẫn đến kết cục bất lợi đối với các bên tham gia.

Chạy đua vũ trang có nhiều điểm giống như tình trạng lưỡng nan của người tù. Để thấy được điều này, chúng ta hãy xem xét quyết định của hai nước - Mỹ và Liên Xô về việc nên chế tạo vũ khí mới hay giải trừ quân bị. Mỗi nước đều muốn có nhiều vũ khí hơn, bởi vì kho vũ khí lớn hơn cho phép gây ảnh hưởng nhiều hơn đối với các vấn đề của thế giới. Nhưng mỗi nước cũng muốn được sống trong hòa bình, không bị vũ khí của nước kia đe dọa.

Một cuộc chơi chết người! Nếu Liên Xô tăng cường kho vũ khí, nước Mỹ sẽ có lợi hơn nếu làm theo và tránh bị mất quyền lực. Nếu Liên Xô chọn cách giải trừ quân bị, nước Mỹ có lợi hơn nếu tăng cường kho vũ khí, vì như vậy Mỹ sẽ mạnh hơn. Đối với mỗi nước, tăng cường kho vũ khí và chiến lược trội. Do vậy, mỗi nước đều chọn cách tiếp tục cuộc chạy đua vũ trang, đưa đến kết cục bất lợi mà trong đó cả hai đều gặp phải rủi ro.

Trong suốt thời kỳ Chiến tranh lạnh, Mỹ và Liên Xô đã tìm cách giải quyết vấn đề này thông qua các cuộc thương lượng và thỏa thuận về kiểm soát vũ khí. Các vấn đề mà hai nước gặp phải giống như những vấn đề của nhà độc quyền nhóm trong quá trình duy trì các-ten. Giống như nhà độc quyền nhóm lập luận về sản lượng, Mỹ và Liên Xô lập luận về số lượng vũ khí mà mỗi nước được phép có. Và giống như các-ten gặp khó khăn trong việc thực thi mức sản lượng, cả Mỹ và Liên Xô đều sợ rằng nước kia sẽ gian lận đối với mỗi thỏa thuận. Trong cả hai tình huống - chạy đua vũ trang và độc quyền nhóm - cái logic bất di bất dịch của lợi ích cá nhân đã thúc đẩy các bên tham gia hướng tới một kết cục không mang tính hợp tác và không có lợi cho mỗi bên.

CUỘC THI ĐẤU TRONG SỰ LƯỠNG NAN CỦA NGƯỜI TÙ

Giả sử bạn đang chơi trò tiến thoái lưỡng nan của người tù với mỗi người bị thẩm vấn trong một phòng riêng. Ngoài ra, hãy tưởng tượng ra rằng bạn chơi nhiều lần, chứ không phải một lần. Số điểm của bạn khi kết thúc cuộc chơi bằng tổng số năm tù. Bạn muốn số điểm này càng nhỏ càng tốt. Bạn sẽ chơi theo chiến thuật nào? Bạn bắt đầu bằng việc thú tội hay im lặng? Hành động của người kia ảnh hưởng thế nào đến các quyết định tiếp sau của bạn về việc thú tội?

Tình trạng lưỡng nan của người tù lặp lại nhiều lần là một trò chơi khác phức tạp. Để khuyến khích sự hợp tác, các đấu thủ phải trừng phạt nhau nếu không hợp tác.

Để biết chiến lược nào tốt nhất, nhà khoa học chính trị Robert Axelrod đã tổ chức một cuộc thi đấu. Đối thủ muốn tham gia trò chơi phải gửi đến một chương trình máy tính được thiết kế để chơi trò chơi tình trạng lưỡng nan lặp lại của người tù. Sau đó, mỗi chương trình sẽ chơi trò chơi với các chương trình khác. Người "chiến thắng" là chương trình nhận số năm tù ít nhất.

Người chiến thắng hóa ra lại là người đi theo chiến lược đơn giản gọi là ăn miếng trả miếng. Theo chiến lược ăn miếng trả miếng, đấu thủ nên bắt đầu bằng sự hợp tác, sau đó làm điều mà đấu thủ kia làm trong lần trước. Như vậy, đấu thủ ăn miếng trả miếng hợp tác cho đến khi đấu thủ kia bội ước; anh ta bội ước cho đến khi đấu thủ kia hợp tác trở lại. Nói theo cách khác, chiến lược này bắt đầu bằng thái độ thân thiện, trừng phạt đối thủ không hợp tác và tha thứ cho anh ta khi điều kiện cho phép. Trước sự ngạc nhiên của Axelrod, chiến lược đơn giản này có hiệu quả tố hơn tất cả các chiến lược phức tạp khác mà mọi người đã gửi đến.

Chiến lược ăn miếng trả miếng có một lịch sử lâu dài. Đây thực chất là chiến lược trong kinh thánh "đổi một con mắt lấy một con mắt, đổi một chiếc răng lấy một chiếc răng". Cuộc thi đấu trong tình trạng lưỡng nan của người tù gợi ý rằng đây có thể là quy luật đơn giản, có hiệu quả để tham gia một số trò chơi trong cuộc sống.
Tags: economics

1 Comments

Tin liên quan

    Tài chính

    Trung Quốc