为什么我们做 SharkPool

这个问题我们在内部问了无数遍。GTO Wizard、PioSOLVER、DeepSolver、Poker Snowie——桌面上摆不下的求解器,每个都有自己的拥趸。再做一个,是不是傲慢?

答案很简单:它们都没解决"对手会不会打最优解"这件事。

GTO 是答卷,不是考题

GTO 策略告诉你在"对手也打最优解"的假设下,你的最佳响应是什么。数学上完美,博弈论上无懈可击。但真实的牌桌不是这样。

你面对的对手池里 80% 的人不玩 GTO。他们 3bet 频率偏低,转牌过牌偏多,河牌 overfold。你用 GTO 对打他们——能赢,但赢得慢,赢得少。真正的钱,是从剥削里来的。

把 GTO 当成地板,把剥削当成天花板。两者都需要,但给玩家学的顺序重要。

SharkPool 的引擎不是单一模型,是三层堆叠:

底层:蓝图策略。用 CFR+ 预解算数十万个 game state,存进 LMDB,毫秒级检索。这是地板——告诉你 GTO 下的最优。
中层:实时 MCCFR。冷门 state 上用蒙特卡洛采样现场迭代,8 核 i7 一秒两万次迭代。这是找补——保证你不会因为"查不到"而无答案。
顶层:剥削调整。对手类型画像(Nit / TAG / Calling Station 等)会修改输出。面对跟注站,引擎会自己把价值下注频率调高;面对紧凶,会把诈唬频率调低。这是天花板——把 GTO 变成对"当前这个人"的最优。

另一个我们不满意的:市面上的求解器都是"你输手牌,它给你答案"。被动、离线、脱离 session 语境。玩家查完合上工具,下次遇到同样的情况依然想不起来。

我们想做的是"实时陪打":你在下注,引擎在旁边看。每一手有推荐,每一手有一句话解释(Why 字段)。解释不是公式,是驱动因子——"BTN vs BB,SPR 6.2,对手 fold-turn 35% 偏低,建议 check 降方差"。

学完你记住的是逻辑,不是频率。频率会变,逻辑不会。

为了不被误解,几件事我们明确不做:

beta 阶段我们还在调引擎的一致性(三变体之间的 EV 误差控制在 0.2 BB 以内),调 Mr. Shark 的解读语感(中文要像老教练,英文要像 Reddit 高手)。v1.0 发布前,建议引擎的基线数字会公开发布。

欢迎加入社群给我们骂一骂。早期用户的每一条反馈都会进 changelog。