这个问题我们在内部问了无数遍。GTO Wizard、PioSOLVER、DeepSolver、Poker Snowie——桌面上摆不下的求解器,每个都有自己的拥趸。再做一个,是不是傲慢?
答案很简单:它们都没解决"对手会不会打最优解"这件事。
GTO 是答卷,不是考题
GTO 策略告诉你在"对手也打最优解"的假设下,你的最佳响应是什么。数学上完美,博弈论上无懈可击。但真实的牌桌不是这样。
你面对的对手池里 80% 的人不玩 GTO。他们 3bet 频率偏低,转牌过牌偏多,河牌 overfold。你用 GTO 对打他们——能赢,但赢得慢,赢得少。真正的钱,是从剥削里来的。
把 GTO 当成地板,把剥削当成天花板。两者都需要,但给玩家学的顺序重要。
我们的三层堆叠
SharkPool 的引擎不是单一模型,是三层堆叠:
- 底层:蓝图策略。用 CFR+ 预解算数十万个 game state,存进 LMDB,毫秒级检索。这是地板——告诉你 GTO 下的最优。
- 中层:实时 MCCFR。冷门 state 上用蒙特卡洛采样现场迭代,8 核 i7 一秒两万次迭代。这是找补——保证你不会因为"查不到"而无答案。
- 顶层:剥削调整。对手类型画像(Nit / TAG / Calling Station 等)会修改输出。面对跟注站,引擎会自己把价值下注频率调高;面对紧凶,会把诈唬频率调低。这是天花板——把 GTO 变成对"当前这个人"的最优。
"陪打"比"查答案"重要
另一个我们不满意的:市面上的求解器都是"你输手牌,它给你答案"。被动、离线、脱离 session 语境。玩家查完合上工具,下次遇到同样的情况依然想不起来。
我们想做的是"实时陪打":你在下注,引擎在旁边看。每一手有推荐,每一手有一句话解释(Why 字段)。解释不是公式,是驱动因子——"BTN vs BB,SPR 6.2,对手 fold-turn 35% 偏低,建议 check 降方差"。
学完你记住的是逻辑,不是频率。频率会变,逻辑不会。
我们不做什么
为了不被误解,几件事我们明确不做:
- 不做代打。SharkPool 在训练和复盘场景运行,不集成到真实金钱对局中。
- 不做 RTA(Real-Time Assistance)。用工具在真钱桌上实时抄答案是作弊。我们的服务条款里明确禁止。
- 不保证盈利。扑克是带方差的游戏。我们提升你长期决策质量——短期方差没人能管。
下一步
beta 阶段我们还在调引擎的一致性(三变体之间的 EV 误差控制在 0.2 BB 以内),调 Mr. Shark 的解读语感(中文要像老教练,英文要像 Reddit 高手)。v1.0 发布前,建议引擎的基线数字会公开发布。
欢迎加入 社群 给我们骂一骂。早期用户的每一条反馈都会进 changelog。