Tổng quan về Nash equilibrium trong game bài Poker

Thảo luận trong 'Kiến Thức Cơ Bản' bắt đầu bởi maileeabc, 9/1/18.

  1. maileeabc

    maileeabc Cơ thủ

    Khi tìm hiểu về game bài Poker, chắc hẳn không ít lần bạn đã nghe đến cụm từ Nash equilibrium. Vậy ý nghĩa thật sự của Nash equilibrium là gì? Nó có ứng dụng như thế nào trong Poker? Hãy cùng chúng tôi tìm hiểu nhé!

    1. Tổng quan về Nash equilibrium trong Poker

    Nash equilibrium (cân bằng Nash) là một định lý trong lý thuyết trò chơi - một nhánh của toán học ứng dụng. Định lý này được đặt tên theo John Forbes Nash, do ông là người đã đề xướng ra. Nó được dùng để nghiên cứu các chiến thuật sao cho sự lựa chọn là tối ưu.

    Ông Nash (tiếng Việt đọc là Nát) bị bệnh tâm thần đa nhân cách (như trong phim A Beautiful Mind- Một tâm hồn đẹp) nên lý thuyết của ông cũng hơi “tâm thần” chút, và ông đoạt giải Nobel. Hy vọng tôi và các bạn đọc lý thuyết của ông thì vẫn không bị tâm thần hoặc bị chút ít thôi (vẫn chơi được poker).

    can bang nash.jpg

    Trong lý thuyết trò chơi, cân bằng Nash là một khái niệm giải pháp về một trò chơi không hợp tác (các người chơi không thông đồng với nhau) liên quan đến hai hoặc nhiều người chơi, trong đó mỗi người chơi được giả định đã biết các chiến lược cân bằng của người chơi khác, và không có người chơi nào có thể hưởng lợi bằng cách thay đổi chiến thuật của mình. Nếu mỗi người chơi chọn một chiến thuật và không ai có thể hưởng lợi bằng cách thay đổi các chiến thuật trong khi những người chơi khác không thay đổi, thì các lựa chọn chiến lược hiện tại và kết quả tương ứng tạo thành cân bằng Nash.

    2. Các ví dụ về Nash equilibrium

    Ví dụ 1: Hai tù nhân

    Giả sử có hai người tù đang ở trong 2 buồng giam riêng biệt và cùng nhận được những lời gợi ý giống nhau từ điều tra viên. Nếu họ cùng thú tội đã giết người, mỗi người sẽ bị phạt 10 năm tù giam. Nếu một trong hai người im lặng trong khi người khác thú tội, kẻ chỉ điểm sẽ được thả trong khi người kia lãnh án tù chung thân. Nếu cả hai không nói gì, cả hai đều lãnh án nhưng sẽ chỉ ở trong xà lim 1 năm mà thôi.

    Rõ ràng lựa chọn tốt nhất là cả hai người im lặng. Nhưng một nhà kinh tế học với khái niệm điểm cân bằng Nash ở trong đầu sẽ dự đoán ngược lại: trường hợp hay xảy ra nhất là cả hai đều thú tội.

    Ở điểm cân bằng Nash, mỗi thành viên của nhóm đều đưa ra quyết định có lợi cho bản thân mình nhất và dựa trên suy đoán về những điều người khác sẽ làm. Trong trường hợp 2 tù nhân, giữ im lặng không bao giờ là một lựa chọn tốt dù cho người còn lại chọn gì. Tù nhân A sẽ suy nghĩ rằng nếu tù nhân B nói ra thì mình cũng phải nói vì như vậy sẽ tránh được án chung thân; còn nếu tù nhân B im lặng thì mình sẽ được trả tự do. Như vậy nói ra mới là cách tốt nhất.

    Ví dụ 2: Công ty không có thỏa thuận thông đồng

    Viettel và Vinaphone là hai doanh nghiệp hoạt động trong cùng một ngành và cả hai đều có thể chọn chính sách giá cước 3G thấp hoặc giá cao. Nếu cùng chọn giá cao (ví dụ: cước 3G một tháng 1Gb dung lượng là 200k đồng), họ sẽ thu được mức lợi nhuận đầy đặn 3 triệu USD cho mỗi bên. Nếu giá thấp, mỗi công ty sẽ chỉ thu được 2 triệu USD. Tuy nhiên, nếu một bên chọn giá cao và bên còn lại chọn giá thấp, bên giá thấp sẽ thu được 4 triệu USD trong khi bên giá cao chỉ có 1 triệu USD. Mặc dù cùng chọn mức giá cao là lựa chọn có lợi nhất cho cả hai bên, họ sẽ không làm như vậy. Nếu A đưa ra giá cao, lựa chọn tốt nhất của B là đưa ra giá thấp hơn. Với suy nghĩ tương tự, A cũng sẽ đưa ra mức giá thấp và vì thế mỗi bên chỉ kiếm được 2 triệu USD.

    choi poker3.jpg

    3. Ứng dụng của Nash equilibrium trong game bài Poker

    Theo quan điểm của Ivan Demidov

    Mọi tình huống poker và poker nói chung đều có cân bằng Nash của riêng mình. Theo lý thuyết, nếu mọi người chơi tốt, thậm chí no-limit-hold'em là một trò chơi đã được giải quyết.

    Trước hết, có một sự khác biệt rất lớn giữa việc: biết rằng có một sự cân bằng Nash và tìm được. Ngay bây giờ chúng ta chỉ có thể tìm thấy Cân bằng Nash ở những trường hợp dễ dàng nhất trong NLHE – trường hợp "push-bot" (all-in hoặc fold), các trường hợp khác khó hơn nhiều.

    Một ví dụ nhỏ.

    Chúng tôi đang chơi ba hand, và chỉ có hai cầu thủ có giải (in-the-money). Blind là 120/240. Một cầu thủ có 3.000 chip, chúng tôi có 2.000, và một cầu thủ thứ ba chỉ có một con chip.

    Người đàn ông với một con chip ngồi Button và ông folds. Chúng tôi đang ở trong small-blind. Theo Cân bằng Nash: ta xác suất all-in ~ 13% tỷ lệ call all-in của big-blind là ~ 7.5%. Khoảng bài (range) là rất chắc bài (tight). Bởi vì bạn không muốn bị loại trước khi người còn 1 chip kia. Nhưng giả sử một người chơi rất kém (fish), người sẽ call với 76 suited và các hand tương tự.

    Động thái đó không đem lại lợi nhuận cho anh ta, nhưng cũng không ích lợi gì đối với bạn - đến mức đẩy bạn vào thế -EV.

    Người chiến thắng trong tình huống này? Người đàn ông với một con chip đã fold. Anh ta nhận được hàng tấn giá trị mặc dù chỉ có một con chip và action là fold đầu tiên.

    Như ví dụ này cho thấy, sử dụng được Cân bằng Nash không đảm bảo bạn lợi nhuận. Đó là quan niệm sai lầm phổ biến nhất về "GTO" hay lối chơi tối ưu lý thuyết trò chơi.

    Như chúng ta đã thấy đó không phải là trường hợp, bởi vì Cân bằng Nash chỉ hoạt động nếu mọi người chơi hoàn hảo. Trên thực tế, nếu ai đó không chơi một cách hoàn hảo và mắc lỗi, điều đó có thể ảnh hưởng đến bạn một cách tiêu cực. (dân gian gọi là thua nghiệt, nghiệp chướng …)

    Phần mềm Libatus đánh bại cao thủ poker

    Chuyên gia lập trình Sandholm và các đồng nghiệp của ông dựa vào một khái niệm khác nhau để lập trình Libratus. Dựa vào Cân bằng Nash, tính toán để xác định chiến lược trò chơi tốt nhất để tối đa hóa lợi nhuận của riêng bạn trong khi giảm thiểu lợi nhuận các đối thủ của bạn. Ông nói rằng trong bất kỳ một hand poker nào, cơ hội ngẫu nhiên cho thấy rằng Cân bằng Nash có thể bị mất, nhưng qua nhiều hand, Cân bằng Nash chuyển thành chiến lược "không thể đánh bại".

    Chương trình không thể tính được giải pháp Cân bằng Nash hoàn hảo, nhưng thay vào đó phải là gần đúng.

    Tác giả bài viết: Phan Hoàng Tú
     
    Chỉnh sửa cuối: 16/1/18
  2. trannamanh

    trannamanh New Member

    Cảm ơn bạn, bài viết rất hay
     
  3. mlinhit.hubt

    mlinhit.hubt New Member

    PHÂN TÍCH HAY ĐẤY. ĐỌC MẤY BÀI CỦA BÁC tÚ NÀY THẤY RẤT TÂM HUYẾT. K BIẾT CAO THỦ PHƯƠNG NÀO ĐÂY
     
  4. nguyenvanthuykt42

    nguyenvanthuykt42 New Member

    Em cũng không rõ về cái này,các bác cho em face,zalo hay sKy anh em giao lưu học hỏi chút
     
  5. dt5phongthienanh

    dt5phongthienanh New Member

    CẦN THIẾT THÌ ADD FB MÌNH. "PHONG THANH CHUNG" NHÉ