Cách chơi Poker: Bluff dựa trên toán học củ chuối

pokerct · 9/12/19 lúc 02:03

Cách chơi Poker: Bluff dựa trên toán học củ chuối
Bluffs là một phần thiết yếu của chơi bài poker và mọi cầu thủ giỏi phải có chúng trong tiết mục của họ. Người chơi tạo ra một sai lầm lớn nếu họ không bao giờ BLUFF, nhưng cũng vậy nếu họ BLUFF quá nhiều. Làm thế nào để bạn tìm thấy sự cân bằng phải không? Làm thế nào bạn có thể biết được khi nào thì nên bluff, làm thế nào để bạn biết khi nào và bao lâu bạn nên bluff những người chơi nhất định để có thể lợi nhuận với họ?

Bài viết này đề cập đến nền tảng toán học của những vụ lừa đảo và sử dụng cách tiếp cận lý thuyết trò chơi để minh hoạ các chiến lược có thể.

Tôi có nên BLUFF?
Bạn đang trên river. Bạn khá chắc chắn rằng đối thủ của bạn có một made hand. Từ hành động của anh ta bạn nghĩ rằng anh ta có thể có AA, KK hoặc AK. Bạn giữ A busted draw. Pot là $400 và cả hai chúng tôi có $100 mỗi người. Bạn hành động trước. Nếu bạn check thì bạn sẽ Lose (Hoặc là đối thủ của bạn checks behind và thắng trong showdown, hoặc anh ta bet, và bạn không có đủ tiền để cố gắng bluff anh ta sau đó.)

Hãy giả sử rằng đối thủ của bạn đã đọc bạn một cách chính xác, và trước khi river card, anh ta đang nghĩ bạn có draw . Để đơn giản, giả sử rằng anh ta nghĩ rằng xác suất của busted flush (or gutshot) draw là 80%, và anh ta cho 20% khả năng bạn giữ 87 và với river card bạn tạo thành straight. Nếu bạn có straight với 78, bạn sẽ value bet. Nhưng tiếc là lần này bạn bỏ lỡ.Bạn có hai lựa chọn: bạn bỏ cuộc và check, hoặc cố gắng giành lấy pot với bluff. Hãy để chúng tôi giả sử rằng khi bạn bluff, bạn đẩy all-in với tất cả $100 của bạn, đó là một pot sized bet. Bao lâu bạn nên bluff?

Làm thế nào chúng ta có thể trả lời câu hỏi này?-Đối với điều này chúng ta cần một số toán học. Nhưng đừng lo lắng, nó sẽ không quá phức tạp. Chỉ cần một đại số nhỏ từ trường tiểu học, và một số ý thức chung. Rất tiếc, gần như đã bỏ quên -lý thuyết trò chơi.

Dịch câu hỏi sang toán học
Chúng ta sẽ cần một số ký hiệu. P sẽ tượng trựng cho pot size, trong khi đó B tượng trưng cho bet size. Hãy biểu thị xác suất (đối thủ của bạn thấy) rằng bạn có bàn tay chiến thắng bởi q. Vì vậy, trong ví dụ của chúng ta P = $ 100, B = $ 100 và q = 0.20.Nếu bạn không giống như giả định của chúng tôi là 20%, bạn có thể thay đổi số này, tính toán vẫn giữ nguyên, chỉ cần kết quả thay đổi. Tương tự như vậy, bạn cũng có thể thay đổi pot size hoặc bet size. Vì vậy, các ký hiệu của chúng tôi cũng sẽ khái quát hóa vấn đề. Chúng ta cần biểu thị tần số bluff của chúng tôi bằng cách nào đó, và tần suất đối thủ sẽ call khi chúng tôi bet. Hãy đặt nó là x và y. Vì vậy, x có nghĩa là xác suất của bluffing của chúng tôi. Ví dụ, nếu chúng ta lừa gạt với xác suất 30% (x = 0.3), tần suất lừa đảo của chúng tôi sẽ chỉ là 30% về lâu dài. Tương tự như vậy, y có nghĩa là xác suất của sự kiện mà đối thủ của chúng tôi sẽ call bạn. Vì vậy, câu hỏi ban đầu của chúng tôi chỉ yêu cầu những gì giá trị tối ưu của x là gì?

Lợi nhuận kỳ vọng(expected payoff ) và chiến lược thuần túy
Để bắt đầu, chúng ta hãy trở lại ngay từ đầu. Mục tiêu của chúng tôi trong poker là gì? Để giành tiền. Cụ thể hơn, để giành được càng nhiều tiền càng tốt. Bất cứ khi nào chúng tôi đưa ra quyết định, chúng tôi tự hỏi mình (hoặc ít nhất chúng ta nên hỏi), hành động nào có lợi nhuận kỳ vọng lớn nhất. Trong ví dụ của chúng tôi, nếu bạn có winning hand, bạn sẽ value bet. Khi bạn bet, đối thủ của bạn sẽ call bạn (y phần của thời gian), hoặc fold hand của anh ta (1 - y phần của thời gian). Khi anh ta call, bạn sẽ thắng pot hiện tại cộng với số tiền đối thủ call value bet của bạn: P+B. Khi anh ta FOLD Bạn chỉ thắng pot hiện tại: P ( pot hiện tại luôn luôn đề cập đến kích thước pot trước khi bạn bet) Vì vậy, nếu bạn có winning hand thì phần thưởng dự kiến của bạn là Ew (w là viết tắt của `winning`) sẽ là: Ew = y (P + B) + (1 - y) P.

Đối với busted draw của bạn (nếu bạn có draw trên flop hoặc turn mà không hoàn thiên được gì trên river gọi là busted draw), mọi thứ đang trở nên phức tạp hơn. Ở đây bạn hoặc bluff (x một phần của thời gian), hoặc bỏ hand và check (1 - x một phần của thời gian). Nếu bạn bluff, đối thủ của bạn sẽ call bạn (y phần của thời gian), hoặc fold hand của mình (1 - y phần của thời gian). Khi anh ta call, bạn mất cược của bạn, do đó, hoàn trả ròng của bạn là tiêu cực:-B, Khi anh ta fold, bạn giành chiến thắng trong pot hiện tại: P. Vì vậy, khi bạn bluff, payoff dự kiến của bạn được đưa ra bởi hai trường hợp, và nó là: (1 - y) P - yB

Nếu bạn check(chỉ cần bỏ cuộc), bạn không giành được bất cứ điều gì, do đó, trong trường hợp này, lợi nhuận dự kiến của bạn là số không. Với những lợi nhuận dự kiến của bạn El (l đại diện cho `lose ') với hand của bạn bị mất là: El = (1 - x) 0 + x [(1 - y) P - yB] (chỉ cần kết hợp các trường hợp trên với xác suất tương ứng).

Tất nhiên phần đầu là số không, và chúng ta có thể bỏ qua nó, cho chúng ta: El = x [(1 - y) P - yB].

Nếu bạn biết rằng đối thủ của bạn không bao giờ call (y=0). ví dụ: anh ta bị ngắt kết nối - lợi nhuận kỳ vọng ( expected payoff ) của bạn đơn giản là: El, y = 0 = xP

Để tối đa hóa lợi nhuận dự kiến của bạn, bạn phải chọn x = 1, có nghĩa là bạn luôn phải bluff. Mặt khác, nếu bạn biết rằng đối thủ của bạn luôn call (y=1), lợi tức kỳ vọng của bạn sẽ trở thành: El, y = 1 = - xB

Để tối đa hóa điều này bây giờ bạn phải chọn x = 0, có nghĩa là bạn không bao giờ lừa đảo. (Chỉ cần nhớ thần chú "Đừng bao giờ lừa đảo một calling station!")

Trong ngôn ngữ của lý thuyết trò chơi, chúng tôi chỉ tính toán phản ứng tốt nhất của bạn, biết chiến lược của đối thủ trong hai trường hợp đặc biệt. Nhưng đó là những điều cực đoan, cái gọi là các chiến lược thuần túy. Trong cuộc sống thực, đối thủ của bạn sẽ không thể đoán trước được. Ông sẽ gọi cược của bạn với một xác suất xác định (không phải 0 và không phải 1). Trong lý thuyết trò chơi chúng tôi sẽ nói rằng ông có một chiến lược hỗn hợp.

Sách Poker, video Poker hay tại: https://tinyurl.com/tai-lieu-Poker-Tieng-Viet
#Poker #pokervietnam #pokertour #pokercash #xito #xìtố

pokerct · 3/4/19

Chiến lược tối ưu
Điều thú vị là đối thủ của bạn có thể chọn một tần số call y, khi mà lợi nhuận kỳ vọng của bạn là như nhau cho bất cứ chiến lược nào (có nghĩa là, bất kể x) bạn chọn. Hãy biểu thị tần số gọi này bằng yopt (như trong một ý nghĩa nó là giá trị tối ưu của y). Khá dễ dàng để tính giá trị của yopt.
Đây là kết quả cuối cùng: yopt = P / (P + B).

Trong ví dụ của chúng tôi, P = B = $ 100, do đó, yopt = 1/2. Nếu đối thủ của bạn call 50% of the time. Bạn không thể khôn ngoan hơn anh ta. Khi đối thủ của bạn chơi theo chiến thuật y = yopt, lợi nhuận kỳ vọng(expected payoff ) của bạn sẽ là

El, y = yopt = x [PB / (P + B) - PB / (P + B)] = 0.
(Chỉ cần đặt những gì chúng tôi có cho yopt vào phương trình chung chúng tôi thu được El). Như x không xuất hiện trong phương trình (thực sự không có gì xuất hiện, chỉ số 0), bất cứ chiến lược (bất cứ điều gì x) bạn chọn, bạn không thể tăng hoặc giảm payoff dự kiến của bạn.

Điều thú vị là yopt chỉ phụ thuộc vào pot size và bet size. Nó không phụ thuộc vào q, ví dụ. Điều này cho thấy yopt không phải là tối ưu của y theo nghĩa phổ quát. Nếu ví dụ q = 1, tức là đối thủ của bạn chắc chắn rằng bạn hoàn toàn thắng. Anh ta sẽ không call bạn 1/2 of the time- trên thực tế, ông ấy sẽ không bao giờ call bạn. Sau đó, anh ta sẽ chọn chiến lược tương ứng với y=0 . Chúng ta sẽ thấy sau đó, theo ý nghĩa yopt là tối ưu.

Tương tự như vậy, bạn có thể chọn x theo cách như vậy, bất kể chiến lược nào (bất kể y) đối thủ của bạn chọn, kết quả dự kiến cũng sẽ như nhau. Như trước đây, chúng ta sẽ biểu thị giá trị đặc biệt của x với xopt. Tuy nhiên, nó là một chút khó khăn hơn để có được giá trị của xopt.

Bỏ qua các chi tiết, cuối cùng chúng tôi nhận được: xopt = qB / [(1 - q) (P + B)].

Nếu bạn Bluff thường xuyên với losing hand. expected payoff dưới góc nhìn của đối thủ là:
Eop = (1 - q) P - qPB / (P + B).

Vì không có y trong công thức này, ông chỉ đơn giản là không thể thay đổi expected payoff của anh ta.

Trong ví dụ của chúng ta P = B = $ 100 và q = 0.2, vì vậy xopt = 1/8. Nếu bạn lừa gạt với xác suất 1/8, đối thủ của bạn không thể đánh bại bạn, ngay cả khi ông ấy rất quan sát và biết chiến lược của bạn (có nghĩa là, biết rằng x = xopt). Nếu bạn bluff thường xuyên hoặc ít thường xuyên hơn, đối thủ quan sát của bạn có thể khai thác chiến lược của bạn bằng cách tìm ra phản ứng tốt nhất tương ứng. Vì vậy, nếu bạn đang đối mặt với một đối thủ rất tốt, xopt đảm bảo chiến lược tối ưu cho bạn.

Bao lâu đối thủ chơi tốt sẽ call bet của bạn? Đó là do yopt đưa ra. Nếu bạn đang chơi theo chiến lược nơi x = xopt, anh ta thực sự có thể chọn bất cứ chiến thuật nào anh ấy thích. Chúng tôi thấy rằng anh ta không thểtăng (hoặc giảm) expected payoff của mình.

Nhưng nếu anh ta không sử dụng chiến lược nơi y = yopt, bạn, như một người chơi quan sát, có thể khai thác sai lầm của mình, lựa chọn phản ứng tối ưu cho chiến lược đã cho. Trường hợp duy nhất khi bạn không thể khai thác được chiến thuật của mình là khi anh ấy chọn y = yopt, bây giờ thì bạn chơi bất cứ chiến thuật nào, lợi nhuận kỳ vọng của bạn sẽ vẫn như cũ. Nhưng hãy lưu ý, nếu bạn chọn chiến lược khác với xopt, đối thủ của bạn có thể khai thác lối chơi của bạn bằng cách điều chỉnh chiến lược của mình cho phù hợp.

Vì vậy, bây giờ chúng ta thấy trong những gì cảm giác xopt và yopt là tối ưu: họ cung cấp chiến lược không thể tránh được. Trong lý thuyết trò chơi như một cặp chiến lược (xopt, yopt) được gọi là cân bằng Nash. Đây là một khái niệm rất quan trọng trong lý thuyết trò chơi và kinh tế (vâng, anh ấy giống Nash với vai anh hùng của bộ phim "A beautiful mind", người đoạt giải Nobel Kinh tế 1994). Bây giờ chúng ta thấy nó đóng một vai trò trung tâm trong lý thuyết poker.

Expected payoff trong một số trường hợp đặc biệt
Hãy kết thúc với hai biểu đồ cho thấy expected payoffs của bạn trong một vài trường hợp đặc biệt. Biểu đồ đầu tiên cho bạn payoff cho busted draw của bạn( losing hand), được tính cho ví dụ cụ thể:

expected payoff của đối thủ chỉ là âm cực của bạn, cộng với 100$ đã có trong nồi. Tất nhiên khi bạn giành chiến thắng trong pot, lỗ ròng của bạn là 100$ và anh ta không nhận được gì cả, hoặc đơn giản nhất: khi bạn dự kiến hoàn trả là zero, stack của bạn vẫn còn nguyên vẹn - giống như khi card river đến, do đó cái pot không thể là của bạn, nhưng ai đó phải lấy nó - vì vậy nó sẽ là đối thủ của bạn Trong ngôn ngữ của trò chơi lý thuyết chúng ta có thể nói rằng ví dụ trò chơi của chúng tôi - bởi vì chúng tôi đã ở trên river - không phải là một trò chơi không tổng quát.

Trong khi bạn biết khi nào bạn đang bluffing và khi nào bạn value bet, đối thủ của bạn lại không biết được. Vì vậy, đối với anh ấy (và có lẽ đối với bạn nữa), biểu đồ sau đây mang tính hướng dẫn hơn. Nó chỉ cho bạn expected payoff của bạn cho hỗn hợp losing và winning hand.Trong những tình huống tương tự bạn sẽ phải dẫn trước 20% of the time, và đứng sau 80% of the time. Vì vậy, mức expected payoff là: qEw +(1– q)El

Phần kết luận
Khi bạn đối mặt với một đối thủ tốt, lựa chọn tốt nhất của bạn là sử dụng chiến lược được đưa ra bởi sự cân bằng Nash: xopt. Trong trường hợp này đối thủ của bạn sẽ chơi chiến lược được đưa ra bởi yopt. Nếu không, anh ấy mắc lỗi (vì vậy anh ấy không phải là một cầu thủ giỏi), và bạn có thể khai thác sai lầm của anh ta bằng cách tìm ra cách giải quyết tốt nhất cho chiến thuật của anh ta. Nếu anh ta có xu hướngcall bạn quá thường xuyên, hãy bluff ít hơn. Nếu anh ta call quá ít, bluff nhiều hơn. Nếu bạn có thể đoán được tần suất call thực tế của anh ta, bạn có thể tính toán số tiền bạn bỏ ra (hoặc nhiều hơn) ít hơn để bluff bằng cách tối đa hóa lợi nhuận kỳ vọng của bạn, giống như chúng ta đã làm ở trên.

Phụ lục
Tính giá trị của yopt
Nếu y = yopt, lợi nhuận kỳ vọng của bạn sẽ như nhau cho tất cả các giá trị của x. Đặt x = 0 đầu tiên. Ở đây bạn không thể giành chiến thắng bất cứ điều gì, được phản ánh trong công thức:

El, x = 0 = 0.

Bây giờ lấy x = 1. El, x=1 = (1 – yopt)P – yoptB.

Như El, x = 0 phải giống như El, x = 1, ta nhận được (1 – yopt)P – yoptB = 0,

mà cho chúng ta: (1 – yopt)P = yoptB, P – yoptP = yoptB, P = yopt(P + B),

Và cuối cùng: yopt = P / (P + B).

Đối thủ của bạn nhìn thấy gì

Bây giờ hãy nhìn vào hand của bạn thông qua đôi mắt của đối thủ. Đầu tiên chúng ta viết lên expected payoff, Eop. không giống bạn - anh ta không biết liệu bạn đang ở phía trước hay phía sau anh ta. expected payoff của anh ta cũng phụ thuộc vào q, do đó phức tạp hơn một chút:

Eop = - qyB + q (1 - y) 0 + (1 - q) [xy (P + B) + x (1 - y) 0 + (1 - x) P].

Thuật ngữ đầu tiên tương ứng với trường hợp khi bạn có winning hand. Bạn bet và anh ta call bạn và thua. Thuật ngữ thứ hai là viết tắt của trường hợp khi bạn có winning hand nhưng khi bạn bet thì anh ta lại fold. Phần còn lại tương ứng với các trường hợp khi anh ta đứng trước bạn. Phần đầu tiên trong dấu ngoặc vuông là trường hợp bạn bluff và anh ta call giành chiến thắng pot hiện tại và lượng bet của bạn. . Phần giữa tương ứng với trường hợp khi bạn bluff và anh ta fold, , winning/losing nothing, trong khi thuật ngữ cuối cùng đối với trường hợp khi bạn từ bỏ và anh ta win pot ( bằng cách check behind hoặc bet và bạn fold). Bỏ qua các số 0 trên phương trình ta thu gọn:

Eop = (1 – q)[xy(P + B) + (1 – x)P] – qyB.

Nếu đối thủ của bạn biết rằng bạn không bao giờ bluff (x=0), phản ứng tốt nhất của anh ta là gì? Anh ta sẽ không bao giờ call bạn là điều hiển nhiên. Điều này có thể được nhìn thấy từ phương trình trên, nếu chúng ta viết 0 thay cho x.

Eop x = 0 = (1 - q) P- qyB.
Để tối đa hóa điều này, chúng ta phải chọn y = 0 (không bao giờ call)

Mặt khác, nếu đối thủ của bạn biết rằng bạn luôn bluff (x=1), phản ứng tốt nhất không quá rõ ràng. Đối với
x = 1 chúng ta nhận được:

Eop x = 1 = (1 - q) y (P + B) - qyB = y [(1 - q) (P + B) – qB].

Nếu (1 - q) (P + B) - qB> 0, y = 1 (luôn luôn call) will maximize you opponents expected payoff.

Nếu (1 - q) (P + B) - qB <0, anh ta nên chọn y = 0 (không bao giờ call) thay thế.

(1 - q) (P + B) - qB <0 có nghĩa (P + B) <qB, P + B - qP - qB <qB, P + B <q (P + 2B)

cuối cùng đã cho q> (P + B) / (P + 2B)

Trong ví dụ của chúng ta, khi P = B = $ 100, nếu q> 2/3, đối thủ không bao giờ nên call bạn ngay cả khi anh ta biết bạn luôn bet và do đó trong trường hợp này, bạn luôn luôn bluff, trong khi nếu q < 2/3, anh ta nên luôn call (nếu anh ta biết rằng bạn luôn bluff). Lưu ý rằng giá trị đặc biệt của q cũng chỉ phụ thuộc vào pot size và bet size.

Tính giá trị của xopt
Nếu x = xopt, expected payoff của đối thủ của bạn sẽ giống nhau cho tất cả các giá trị của y. Giống như trước, hãy lấy y = 0. Phương trình của chúng ta cho Eop cho ta

Eop y = 0 = (1 - q) (1 - xopt) P.

Bây giờ hãy y = 1. Lần này chúng ta nhận được: Eop y = 1 = (1 - q) [xopt (P + B) + (1 - xopt) P] - qB.

Như Eop y = 0 phải giống như Eop y = 1, ta nhận được:

(1 - q) (1 - xopt) P = (1 - q) [xopt (P + B) + (1 - xopt) P] - qB,

mà cho chúng ta ((1 - q) (1 - xopt) P xuất hiện trên cả hai mặt, do đó hủy bỏ), vì vậy cuối cùng chúng tôi nhận được xopt = qB / [(1 - q) (P + B)].

qB = (1 - q) xopt (P + B)

Sách Poker, video Poker hay tại: https://tinyurl.com/tai-lieu-Poker-Tieng-Viet
#Poker #pokervietnam #pokertour #pokercash #xito #xìtố

My sunshine · 18/4/19

Ae muốn chơi Poker online? Tham gia ngay thông qua link giới thiệu sau:
https://pokervn.net/threads/huong-dan-cai-dat-va-dang-ky-wpt-global-tu-a-z.608.html

Đảm bảo nhận ưu đãi khủng và nhiều tour đấu miễn phí khi điền đúng mã mời: 9DF1ED

My sunshine · 18/4/19

Khi chơi game Poker bạn chỉ nên Bluff khi chắc chắn đối thủ có một made hand.

Minh Hoàng · 18/4/19

Cách chơi Poker: Bluff dựa vào toán học củ chuối rất thú vị, tác giả bài viết hẳn phải dành nhiều thời gian nghiên cứu lắm.

Đăng nhập

Cách chơi Poker: Bluff dựa trên toán học củ chuối

pokerct Cơ thủ

pokerct Cơ thủ

My sunshine Cơ thủ

My sunshine Cơ thủ

Minh Hoàng Cơ thủ

Diễn đàn PokerVN là cộng đồng dành riêng cho những người chơi poker chuyên nghiệp.

Truy cập nhanh

Liên hệ