Mail

引子：一个看起来能赚钱的地方

Polymarket 上有一类市场叫 "Bitcoin Up or Down"，每 5 分钟一局：赌这 5 分钟结束时，BTC 比开盘是涨还是跌。涨买 Up、跌买 Down，结算时赢的一方每份兑付 $1，输的归零。

它看起来太适合「做策略」了：高频、规则极简、还有公开的订单簿。我的直觉很简单——当 BTC 在这 5 分钟里已经明显朝一个方向走了，顺着这个方向下注，是不是胜率更高？ 这就是动量延续（momentum continuation）。

于是我花了两天，写脚本、跑回测、上真金白银的实盘、部署到云服务器、做监控告警。这篇文章不是教你怎么赚钱——恰恰相反，是记录我怎么一步步说服自己「这里有钱赚」，又怎么被数学一步步打醒。

如果你只想要结论：这套技术动量 + 顺势方法，做得越多，收益越接近零；再扣掉手续费和滑点，就更可能变成负数。 这更像有效市场的正常样子，不是我的运气差。

甜蜜的陷阱：小样本里的 +36%

很快我就找到了一个让人心跳加速的「甜区」。在这些条件同时满足时：

BTC 在当前 5 分钟里的位移在 30–40 美元之间（动量够强，但又不过分）
入场价 ask < 0.65（赔率还行，不算太贵）
顺着 24 小时趋势方向做（涨势做 Up、跌势做 Down）

回测结果漂亮得不像话：

区域	样本	胜率	ROI
move 30–40 & ask<0.65 & 顺势	66 笔	79%	+36%

79% 的胜率，每块钱周转一圈赚三毛六。我当时的反应和大多数人一样：「找到了。」

但凡做过量化的人，这时候脑子里都该响一个警报：66 笔，够吗？这个 +36% 到底是真本事，还是运气？

我需要一个裁判：t 是什么，为什么是 t

要回答「这是不是运气」，胜率和总盈利都不够格当裁判：

只看总盈利：运气好连赢几把，总盈利也很好看，骗不了人。
只看胜率：79% 很高，但如果赔率很差（比如每次只赢一点、输就输光），高胜率也可能是亏的。

我需要一个能同时考虑「赚多少、波动多大、做了多少笔」的指标。这就是 t 统计量（t-statistic）。

它来自统计学里最朴素的一个问题——单样本 t 检验：我有一组每笔交易的收益 x₁, x₂, …, xₙ，我想知道它们的真实均值到底是不是 0（0 means「没有任何 edge，纯赌博」）。

t 的定义是：

t = (样本均值 − 0) / (样本标准差 / √n)
  = x̄ / (s / √n)

拆开看这个公式，它的三个零件各管一件事：

分子 x̄（样本均值）：你平均每笔赚多少。赚得越多，t 越大。
分母里的 s（标准差）：你的收益波动有多大。忽赢忽输越剧烈，t 越小——因为波动大意味着「这次的正收益更可能是偶然」。
分母里的 √n（样本量开根号）：你做了多少笔。笔数越多，分母越小，t 越大——样本越多，同样的均值就越可信。

一句话：t 衡量的是「这个正收益的信噪比」。它惩罚波动、奖励样本，正好把「运气」和「本事」拆开。

经验上的门槛是 |t| ≥ 2：大致对应 95% 的置信度，意思是「如果真实均值其实是 0，那么纯靠运气跑出这么大一个 t 的概率不到 5%」。t < 2，我们就没资格说『这不是运气』。

那我那个 +36% 的甜区，t 是多少？

我跑了实盘 49 笔真金白银，全局 t = 0.44。

0.44。离 2 差着十万八千里。

换句话说：账面是赚的（钱包从 $50 涨到过 $66），但从统计上，我完全无法把它和『纯运气的盈亏平衡』区分开。

钻牛角尖：把 t 往上推的各种努力

一个正常人看到 t = 0.44 应该就收手了。但我不是——我钻进了牛角尖，开始一个旋钮一个旋钮地拧，试图把 t 推过 2。

第一个念头：加止损。 亏的时候早点跑，是不是能挽回？我用历史数据把每个止损距离都回测了一遍。结果反直觉：

在这个 79% 胜率的高胜率策略上，止损反而让总收益变差。因为它救回的亏损单（约 +$46）远不如它误杀的、本来会赢的单（约 −$86）。高胜率策略和止损天生相克——你砍掉的大多是「中途吓你一跳、但最后会赢」的单。

第二个念头：调 24h 趋势过滤。 我发现一个诡异的现象——Up 方向一直赚，Down 方向一直亏，是不是该只做 Up？但很快意识到：因为我加了 24h 顺势过滤，方向和行情被绑死了。BTC 跌的时候我只能做 Down，涨的时候只能做 Up。所谓「Up 赚 Down 亏」，根本不是方向问题，而是「行情好不好做」被伪装成了方向差异。

第三个念头：调 ask 阈值。 把入场价收窄到 < 0.6、< 0.55，每笔 ROI 确实更高了（+36% → +44% → +65%）。但有个坑：收窄的同时样本暴跌（66 → 27 → 13 笔），而 t 不升反降。因为 t 的分母里有 √n，样本一少，分母里的 s/√n 反而变大，那点更高的均值根本撑不住。每笔更赚 ≠ 更可信。

第四个念头：给 move 加上限。 我一度坚信 move > 40 是个「坑」，砍掉它就好。结果被现实打脸——实盘最近亏的恰恰是 30–40 的主体，而 move > 40 一共就 4 笔，是个从头到尾都没变过的历史小样本。我又在拿小样本里的噪声当规律。

每一个旋钮，单独看都「有点道理」；但它们有一个共同的特征——都建立在几十笔的小样本上。

大数定律的耳光：做得越多，越接近零

真正让我清醒的，是一张 2×2 的表。

我决定把「方向」和「行情」彻底拆开，看四种组合各自的表现。先在我那个精选的小样本（move 30–40）里看：

	24h 涨	24h 跌
做 Up	+36%	+8%
做 Down	+7%	+38%

漂亮。对角线（顺势）+36%/+38%，反对角线（逆势）+7%/+8%。看起来「顺势确实有效」，逻辑闭环，我差点又信了。

然后我做了唯一正确的一件事：把样本放大。同样的 2×2，换成全部 714 笔交易：

	24h 涨	24h 跌
做 Up	−2%	+1%
做 Down	+5%	+1%

四个格子，全部趴在 0 附近。

那个漂亮的 +38% 顺势优势，一放大就人间蒸发了。

这一刻我才真正理解我看了两天的东西是什么：

样本越大，结果越收敛到真实期望。 小样本之所以能跑出 +36%，不是因为那里有 edge，而是因为样本少、方差大，它有足够的自由度去偶然偏离 0。我做的所有「优化」，本质都是在几十笔的噪声里挑出那些恰好偏正的角落，然后说服自己那是规律。

这就是 大数定律最朴素也最残酷的样子：做得越多，越接近这个游戏的本质。 至少对我验证的这套公开可见的动量 + 顺势信号来说，这个本质是：毛期望接近零，净期望很容易被交易成本推成负数。

这其实就是「有效市场」的定义

退一步想，这个结论一点都不该让人意外。

BTC 5 分钟涨跌，是一个非常接近有效市场的场景。你能想到的那些显而易见的信号——动量多强、24h 趋势、入场价高低——早就被所有人看在眼里，并 price 进了那个 ask 里。

你买 Up 付的 0.62，已经包含了市场对「会涨」这件事的全部共识。你赚的，从来不是「方向对不对」，而是「真实概率」和「市场定价」之间那一点点差。如果你没有比市场更好的信息、更快的执行，或者更独特的定价模型，这个差就很容易在统计上接近零。

我后来用一整套独立证据互相印证，没有一条达到我会继续加真钱的标准：

实盘 49 笔，t = 0.44
正常入场价区间，尤其 ask 0.4–0.6 附近，大样本净期望是负的
趋势过滤的参数组合，没有一个通过可实盘级别的样本外检验（OOS t ≥ 2 且样本足够）
许多「看起来显著」的小区域，一放大样本或切到样本外就垮
止损、趋势、价格、位移，旋钮拧了一圈，全都救不回来

这些证据，指向同一个句号：不是证明 BTC 5 分钟市场永远不可能有任何 edge，而是证明我这套散户可见的技术动量 + 顺势方法，没有证明出可持续、可实盘的 edge。

延伸：哪些事也是越努力越接近零

这件事让我想到一个更大的问题：现实里很多事也像这个市场。不是努力没有用，而是当所有人都看着同一块记分牌、用同一套规则、追同一个信号时，努力会先变成门票，然后变成成本，最后被竞争均摊掉。

几个很常见的例子：

第一，追公开热点做内容。 今天某个平台说短视频要三秒钩子、强情绪标题、固定节奏剪辑，明天所有人都这么做。最早掌握模板的人可能有红利；一旦模板被普及，算法、广告主和竞争者会把红利吃掉。你越努力按模板生产，越接近平台平均值。真正可能有正期望的，不是「更用力地套模板」，而是有独特素材、独特观点、长期信任，或者能沉淀成自己的分发资产。

第二，证书和简历军备竞赛。 一个证书稀缺时，它是信号；人人都有之后，它就变成门槛。刷题、刷项目、刷实习当然有用，但如果大家都在做同一组动作，结果往往不是你获得超额收益，而是门槛整体上移。努力没有消失，只是从「优势」变成了「不被淘汰的成本」。

第三，同质化平台生意。 外卖、网约车、电商、民宿、知识付费，只要供给高度同质、流量入口掌握在平台手里，竞争就会把利润压到很薄。你多干一点，平台抽佣、广告竞价、价格战和消费者比价会把多出来的收益拿走。最后看起来每个人都很忙，但行业平均利润率很平。

第四，二级市场里追人人看得见的信号。 热搜、KOL 喊单、榜单、资金费率、简单技术指标，越公开，越容易被价格提前反映。你不是在和图表交易，而是在和所有看见同一张图的人交易。

这些场景有一个共同结构：

规则公开。
信号公开。
参与者很多。
结果按相对排名分配。
成本真实存在。

在这种结构里，更努力通常只能提高你的成交量、作品数、投递数、工作时长，却不一定提高你的数学期望。你做得越多，越接近系统给普通参与者的平均回报；如果系统本身把交易成本、平台抽成、时间成本算进去，平均回报就可能是负的。

所以问题不是「要不要努力」，而是先问一句：我努力的是不是一个近零期望游戏？

如果答案是是，那真正该找的不是更勤奋的旋钮，而是改变期望的东西：信息差、能力差、分发差、资源差、品牌信任、复利资产、或者干脆换一个没那么拥挤的游戏。

收场：我把它停了，但这不是失败

我停掉了实盘，清空了云服务器上的脚本、状态和 API 凭证，本地的代码和数据先留着。钱包里还剩五十几块，没亏多少——这本来就是个小额验证。

写到这我想说清楚一件事：这不是一次失败，是一次成功的证伪。

我花两天换来的，是一个足够明确的答案：用「技术动量 + 顺势」这套散户能上手的方法，在 BTC 5 分钟市场上，没有证明出可持续、可实盘的 edge。这个答案值钱——它让我不用再花第三天、第十天去拧那些注定拧不动的旋钮。

而且基建是真的赚到了：一套能下单、能结算、能回测、能部署到服务器、能监控告警的完整管线，这些能力换个战场还能用。

几条真正学到的东西

永远先问「样本够不够」。 一个 +36% 的发现，配上 n = 30，约等于没有发现。先看 n，再看收益。
t 比胜率和总盈利都诚实。 因为它把「赚多少、波动多大、做了多少笔」三件事压进一个数，专门用来区分运气和本事。t < 2，就闭嘴。
小样本会奖励钻牛角尖。 维度越多、切得越细，你越容易在噪声里找到一个偶然为正的角落——这叫多重比较（multiple comparisons），是自我欺骗的温床。
「这里没有 edge」是量化里最贵、也最该早点接受的结论。 承认它，比继续骗自己便宜得多。
努力本身不是 edge。 如果规则、信号和工具都公开，努力往往只会把你送到平均值；能改变期望的，是别人没有的东西。
做得越多，越接近真相。 在一个有效市场里，这句话的另一半是：越接近零。

这是一篇失败复盘。如果你也在某个市场、平台或赛道里拧了很久旋钮，却始终把 t 推不过 2——也许该停下来，把样本放大，然后诚实地看那个数字。

做得越多，越接近零：我在预测市场上找 Alpha 的两天

引子：一个看起来能赚钱的地方

甜蜜的陷阱：小样本里的 +36%

我需要一个裁判：t 是什么，为什么是 t

钻牛角尖：把 t 往上推的各种努力

大数定律的耳光：做得越多，越接近零

这其实就是「有效市场」的定义

延伸：哪些事也是越努力越接近零

收场：我把它停了，但这不是失败

几条真正学到的东西

相关推荐

OpenClaw 把《Her》带进现实：我给生活装了一个有记忆、能做事的 AI 伙伴

我用 OpenClaw 搭了一套 AI 自动化系统，它每天帮我处理 15 件事

Get笔记 to Obsidian Importer 2.0 - All in AI 时代的笔记迁移方案