200 刀的 coding plan,请无脑开

前段时间我参加一个访谈,顺口提到自己每个月大概会用掉 100 亿 Token。
当时我没有觉得这是一个特别值得展开的数字。因为在我自己的工作流里,AI 已经不是偶尔打开问两句的工具,而是每天都在跑代码、读文件、改项目、做内容、拆业务的基础设施。100 亿 Token 听起来大,但放在这种使用密度里,并没有那么夸张。
有意思的是,很多人的第一反应不是问我怎么用,而是问我:
“100 亿 Token,你有没有算过成本?”
这个问题暴露的不是大家不会算账,而是大家还停留在旧的计费心智里。很多人一听到 Token,就自动拿 API 单价去乘。这样一乘,当然觉得这是天文数字,觉得普通人根本不可能用得起。
但今天真正反常识的地方就在这里。
如果你用的是 Claude Code 或者 Codex 这类 coding plan,它不是 API 账单。它是订阅。对一个高强度个人用户来说,真正的门槛往往不是几千、几万美金,而是每个月 200 美元。
我最近的使用量已经从每月 100 亿 Token 涨到了接近 300 亿 Token。按这个口径,平均每天就是 10 亿 Token 左右。这个数字当然不是厂商承诺给每个人的固定额度,也不是说订阅就等于无限 API。但它说明了一件事:在今天,一个认真使用 AI coding 工具的人,确实可以用非常低的固定成本,获得过去只能靠企业级预算才能接近的智能密度。
所以这篇文章的判断很简单:
200 刀的 coding plan,请无脑开。
这里的“无脑”,不是说钱不是钱,也不是说开了就一定赚钱。它的意思是,如果你已经想认真用 AI 做项目、写代码、做内容、跑自动化、试一人公司,那么不要再在“200 美元贵不贵”这件事上反复消耗自己。
真正贵的不是 200 美元。真正贵的是你还在用 20 美元聊天框的心态,错过这段可能很短的高补贴窗口。
别用 API 脑子算订阅
先把账算清楚。
今天的大模型有两套很不一样的经济模型。一套是 API。你每输入、输出一批 Token,就按量付费。OpenAI 的 API pricing 页面就是这种逻辑,价格按百万 Token 列出来,输入、缓存输入、输出各有不同。
另一套是订阅。比如 Anthropic 的 Claude Max plan,200 美元档对应 Max 20x,并且包含 Claude Code 访问。OpenAI 的 ChatGPT Pro tiers 也把 Pro 定位成高使用量档位,包含 Codex 等能力。
这两套价格不能简单混在一起看。
如果你按 API 去换算高强度 coding plan 的实际用量,很快会发现一个很大的错位。Tom's Hardware 前段时间引用 SemiAnalysis 的订阅压力测试说,在把高端订阅用于 long-horizon coding tasks 并打满额度时,200 美元 Claude Max 20x 的 API 账面价值最高可以到每月约 8000 美元,200 美元 ChatGPT Pro 的账面价值甚至可以到更高的数量级。这个数字不是官方承诺,也不是厂商真实成本,更不是说每个人都能稳定用出同样结果。但它足够说明方向:现在的个人高端订阅,和按量 API 之间存在非常大的价格差。
这就是我说的杠杆。

你交 200 美元,不是买了一个普通软件会员。你买到的是大厂为了抢高强度用户、抢使用习惯、抢下一代开发范式,而暂时放出来的一段低价智能。
为什么他们愿意这样做?
第一,真正能把 coding plan 用满的人,本身就是最有价值的先锋用户。这个群体会把模型逼到边界,会发现工具链的问题,会自然形成教程、模板、工作流和口碑。大模型公司不只是卖模型,它们也在争夺“以后大家到底怎么开发软件”的默认入口。
第二,这些个人用户以后很可能会反向影响企业采购。一个工程师如果在个人项目里被 Claude Code 或 Codex 改造过工作方式,回到公司以后,他很难再接受纯手写、纯会议、纯 Jira 的旧流程。他会推动团队买更贵的企业版本,接 API,接权限,接私有数据。
第三,高强度个人用户虽然耗算力,但他们的行为有示范效应。一个普通用户在聊天框里问十次“帮我写个标题”,对模型公司的战略价值很有限。一个重度用户每天让 agent 读 repo、改代码、跑测试、部署服务,才真正展示了下一代软件工作的样子。
所以我不觉得 200 美元 plan 是正常价格。它更像一个阶段性的补贴价格。
对公司来说,这是获客和生态建设。对个人来说,这就是窗口。
你买的不是聊天次数,是工作环境
很多人会说,我已经有 20 美元的 ChatGPT Plus 或 Claude Pro 了,为什么还要开 200 美元?
这个问题如果只从“模型聪不聪明”去看,就会看错。
20 美元订阅当然有用。问概念、写邮件、润色文章、临时查一个代码语法,它都很好。但普通聊天框的默认形态还是一次性问答。你把问题丢进去,它给你一段回答。下一次你再来,又要重新铺上下文。项目文件在哪里、之前怎么约定的、代码跑没跑通、测试失败在哪,它大多不会真正替你承担这些连续工作。
coding 工具不一样。
Claude Code、Codex 这一类工具真正改变的不是“AI 回答得更长”,而是它们把模型放进了工作现场。它可以读文件,改文件,运行命令,看报错,继续修。它面对的不是一个孤立问题,而是一个带有上下文、历史、约束和结果验证的项目。
这就是普通 chat 和 coding plan 的区别。
20 美元买的是回答。
200 美元买的是把回答变成文件、命令、测试和交付物的环境。
我在很多交流里都反复说过,一个人不一定要先变成程序员,才有资格使用 coding 工具。恰恰相反,今天大量工作都可以被翻译成文件、脚本、网页、数据库、报告、自动化流程。你不需要掌握每一行代码的语法,但你要学会把需求表达成可执行任务,并且让 AI 在一个真实目录里把它做完。
比如你不是对 AI 说:“帮我写一个网站。”
你要说的是:“这是我现在的项目目录。先读 README 和现有代码,告诉我这个项目结构。然后帮我加一个登录页,接到现有的用户表。写完以后跑测试。如果测试失败,先解释失败原因,再修改。不要引入新的框架,除非你先告诉我为什么。”
前者是聊天。后者是调度。

这也是为什么我说,开 coding plan 的意义不只是“更多 Token”。更多 Token 只是表层。真正重要的是你开始训练一种新的工作方式:你不再把 AI 当成搜索框,而是把它当成一个可以被管理的生产单元。
一开始你会不习惯。你会问得很粗,任务拆得很差,agent 也会写出很多你看不懂的东西。但这正是要高强度使用的原因。你只有每天把它放进真实任务里,才会慢慢知道什么时候该让它自己探索,什么时候该收窄范围,什么时候该重开上下文,什么时候该停止修补直接重来。
这个能力不是看三篇教程就能学会的。
它必须烧出来。
现在便宜,不代表以后一直便宜
很多人反驳我说,模型不是会越来越便宜吗?硬件会进步,推理成本会下降,开源模型也会追上来。那为什么要着急?以后不是会更便宜吗?
这个判断有一半是对的。
从 API 的长期趋势看,单位 Token 的价格大概率会下降。模型蒸馏、推理优化、芯片迭代、竞争压力,都会让某些能力越来越便宜。长期看,同样 1 美元买到的智能会更多,这个方向我不反对。
但 coding plan 的问题不只是“模型成本会不会下降”。它还叠加了一个变量:补贴会不会持续。
今天 200 美元 plan 的性价比之所以离谱,不完全是因为模型已经便宜到这个程度,而是因为订阅里含有大量隐性的补贴。这个补贴可能来自获客阶段,可能来自生态竞争,可能来自高端用户样本的价值,也可能来自公司愿意暂时承受的毛利压力。
这些东西不会永远一样。
当越来越多人学会把额度打满,当模型公司发现少数重度用户吃掉了大量算力,当最先进模型的推理成本仍然很高时,产品形态自然会变化。最常见的变化不难想象:更严格的 usage limits、更贵的高端档、更细的模型分层、把最贵模型从固定订阅里拿出来,改成 credits 或 API。
这不是阴谋论。信号已经出现过。
Anthropic 在发布 Claude Fable 5 / Mythos 5 时,把更高阶模型的价格和订阅安排讲得很清楚:API 定价明显更贵,并且 Fable 5 在发布初期只是短时间包含在 Pro、Max、Team 和 Enterprise 订阅里,之后继续使用需要 usage credits。后来这个模型的访问又因为合规和政策原因发生变化,但这不是重点。重点是定价信号已经很清楚:最顶级、最耗算力的智能,不一定会长期塞在固定月费里。
这也是我说“波峰”的原因。
API 的 intelligence per dollar 可能长期上升,但订阅制 coding plan 的 intelligence per dollar 未必一路上升。它可能先因为补贴冲到一个异常高的位置,然后随着限额、涨价、分层和 credits 被拉回现实。
今天这 200 美元买到的,不只是当前模型能力,也包括大厂竞争期愿意让渡给个人用户的那部分补贴。

这个窗口到底还有多久,我不知道。我也不想把判断建立在某个具体上市日期、某个融资节点、某个季度财报上。那些时间点都会变。
但底层结构很难不变:如果一个产品长期让少数高强度用户用 200 美元消耗掉远高于 200 美元账面价值的算力,它迟早会被重新定价。
所以我现在给人的建议会比较粗暴:如果你有预算,而且你真的想进入 AI 原生工作方式,不要等。先开一个。预算允许的话,OpenAI 和 Claude 各开一个。预算有限,就选你最容易每天打开、最容易接入真实项目的那个。
一年两千多美元当然不是小钱。但如果你把它和课程、学历、会议、硬件、通勤、无效社交相比,它可能是当下最接近实战的学费。
开了以后,不要省,要用满
我知道“用满”这个词很容易被误解。
它不是让你为了消耗而消耗,也不是让你每天开着 agent 乱跑,最后只得到一堆没人用的代码。Token 用量本身没有意义。没有收入变化、成本变化、流程变化、资产沉淀的 Token 消耗,只是另一种形式的刷屏。
但大多数人的问题不是浪费太多,而是根本没用到足够多。
很多人打开 AI 还是非常节省。问一句,等一句。复制一段,自己改半天。额度快满了就紧张,模型提示限制就觉得自己做错了什么。这个习惯在 API 时代可以理解,但在 200 美元 coding plan 的补贴窗口里,它会让你错过最重要的东西:高频试错。
你要把 Token 当成燃料。
每天给它真实任务。不是“帮我想想有什么可以做”,而是把你的时间、技能、已有项目、行业资源、客户线索、内容资产都告诉它,让它拆出今天能交付的最小动作。
如果你不知道做什么,可以从最笨的问题开始问:
- 我现在有这些技能和这些时间,能做哪些小工具,今天就能上线?
- 我过去写过这些内容,能不能改成一个可搜索、可订阅、可变现的页面?
- 我手上这个重复工作,能不能用脚本、表格、数据库或小网站固定下来?
- 我这个项目跑不起来,你先读完目录,给我一个最小可运行版本。
这些问题听起来不高级,但它们会把 AI 从聊天拉回生产。你每天这样用,过一段时间就会发现,自己的提问能力、拆任务能力、判断 agent 是否跑偏的能力,都在变强。
我在《不要在泰坦尼克号上研究如何升舱》里写过,用 AI 提效省下来的时间,不要还给公司。五天的活一天干完,剩下四天不是用来证明你还能做五倍工作量的。那是你的逃生窗口。
今天我想给这句话再补一个理由:不只是时间窗口,还是算力窗口。
你现在不仅有机会把时间拿回来,还有机会用很便宜的价格,调动过去只有团队和预算才能调动的工程能力。这个组合非常少见。时间、工具、算力、分发渠道同时变便宜,一个普通人第一次可以在很低成本下试一个完整闭环。
但闭环是关键。
我在《AI 提效已索然无味,下半场是什么?》里讲过,AI 下半场不是提效,而是闭环。所谓闭环,就是你不只把东西做出来,还要让它面对真实用户,产生可验证结果。结果可以是收入,可以是获客,可以是成本下降,可以是一个过去需要几天、几周的流程被压到几分钟。总之,它要进账本。
我做 Open Exam Preparation 的时候,最直观的体感就是代码和基础设施都变得极便宜。开发靠 Claude Code,部署用 Vercel 的免费额度,数据库用 Neon 的免费层,硬成本主要就是订阅费。但网站做出来本身还不算闭环。真正的难点在后面:内容如何持续生成,流量怎么来,用户为什么留下,怎么变现。
这件事对我很重要。它让我意识到,200 美元 plan 不是让你多做几个 demo 的玩具,而是让你低成本反复尝试“交付一个东西,并验证它有没有商业结果”的训练场。
不要把 Token Maxing 理解成把额度烧完。要把它理解成用最低成本、最高频率,训练自己管理 AI 员工和验证商业闭环的能力。

如果你只用它写周报,它贵。如果你用它替你跑出一个可部署的小产品、一个可重复的内容系统、一个能服务客户的内部工具、一个能缩短交付时间的自动化流程,它就便宜得离谱。
算力便宜以后,最重要的动作是敢重来
当然,开了 plan 不代表你就会自动变厉害。
我见过很多人开了高端订阅以后,很快掉进另一个坑:无限修 bug。
AI coding 的问题不是它不会写代码。它太会写了。它会非常自信地在一个已经污染的上下文里继续写,会为一个错误补另一个错误,会为了维护前面错误的架构继续加抽象。你看着它在终端里忙来忙去,以为项目在推进,实际上只是在把一个坏系统修得更复杂。
我自己也踩过这个坑。
我之前在一次 Cursor 失败项目复盘里写过,我曾经想做一个播客生成工具。一开始需求很简单,后来我又想加状态管理,想做 CLI,想把 raw idea、审核、发布这些阶段都抽象出来。传统软件工程的习惯上来了,总觉得流程越完备越安全。
结果恰恰相反。系统越写越复杂,硬编码路径、文件夹结构、状态流转、工具命令开始互相打架。AI 每次都能修一点,但每次修完又引入新的问题。最后我意识到,真正错的不是某一个 bug,而是整个中间系统已经没有必要。
解决方式也很简单:推倒重来。
重新开一个干净目录,把需求砍回最核心的产出,让 agent 直接做一个能跑的版本。结果反而更快、更稳。
这件事改变了我对 AI coding 的看法。在传统开发里,人力昂贵,所以我们天然珍惜已有代码,能修就修,能补就补。但当生成和重建的成本被 200 美元订阅压得很低时,很多时候继续修补反而是最贵的选择。

开了 plan 以后,你需要给自己几条规则:
- 先要结果,不要先造复杂中间系统。能跑通闭环的朴素实现,优先级高于漂亮架构。
- 小步交付,不要一次让 agent 改半个世界。每次改完都要运行、检查、保存。
- 同一个问题反复修不好,就停。不要让 AI 在污染上下文里道歉三十次。
- 该重来就重来。保留需求、测试和经验,丢掉坏代码。
- 最后看账本。它有没有让收入增加、成本下降、交付变快、资产增加?
这些规则看起来保守,但它们才是高强度使用 AI 的前提。
Token 便宜,不代表你的注意力便宜。200 美元 plan 能帮你降低算力成本,但不能替你判断什么东西值得做,什么东西该停,什么东西只是技术上的自我感动。
所以我说“无脑开”,不是“无脑用”。开通这件事可以果断,使用这件事必须清醒。
谁应该立刻开,谁可以先别开
我不想把这篇文章写成一种消费主义号召,好像每个人不掏 200 美元就落后了。
但如果你已经意识到 AI 会改变自己的工作方式,如果你想做个人项目、内容产品、小工具、自动化服务、一人公司,如果你已经在每周花大量时间研究提示词、看教程、听别人讲 AI 创业,却迟迟没有让 AI 替你交付一个真实东西,那么我会很直接地说:别再省这个钱了。
你缺的不是再看一个免费教程。
你缺的是每天进入一个高强度环境,让 AI 和你一起做事。做错,重来。跑不通,修。修不动,砍。砍完上线。上线以后看有没有人用,有没有人付钱,有没有节省时间。
这个循环才是学习。
一旦你真的进入这个循环,200 美元的心理账本会变掉。你不会再问“我今天问了多少次才回本”,你会问“我这个月用它多做出了什么资产”。一个页面,一个脚本,一个内部工具,一个可重复内容流程,一个能收钱的小服务,一个被压缩到几分钟的交付环节,这些才是回本方式。
当然,我也不建议你一开始就幻想做一个宏大的 AI 公司。大多数人第一步应该非常小。小到你自己会嫌它不体面。
找一个具体痛点,交付一个具体东西,验证一个具体结果。
这和我过去反复说的“先闭环,再提效”是一回事。AI 不是让你把旧工作做得更快,然后继续被旧工作吃掉。AI 是给你一次机会,让你用更小的成本摸到市场、用户和收入。
最好的动作很简单
今天我已经不太建议大家把精力继续花在“怎么写一个更优雅的 prompt”上。那当然有用,但边际收益越来越低。
真正值得投入的是工作环境。
你要让 AI 进入你的文件夹、代码库、内容库、客户材料、数据表和部署流程。你要让它从回答问题,变成产生结果。你要让它每天消耗大量 Token,不是为了炫耀使用量,而是为了让你在真实世界里多试几次、多重来几次、多交付几次。
这就是 200 美元 coding plan 的意义。
它不是永远存在的免费午餐,也不是每个人都能自动吃到的红利。官方页面也说得很清楚,这些 plan 都有 usage limits,不是无限。更高端模型也已经开始出现从订阅里剥离、转向 credits 或 API 的趋势。
所以我不想把话说得太稳。
未来模型会更强,API 会更便宜,开源也会更好。这些我都相信。但今天这个组合,强模型、好工具、高额度、固定月费、大厂补贴,同时出现,对个人开发者来说确实很少见。
不要在旧船上研究如何升舱,也不要在 20 美元聊天框里研究如何优雅省 Token。
如果你负担得起,又真的想进入 AI 原生的工作方式,把 200 美元 plan 开了。然后别供着它,别省着它,别只拿它写几段漂亮废话。
打开终端。打开项目。让它读文件,改代码,跑测试,做页面,写脚本,生成内容,整理数据,部署服务。每天问它一个更具体的问题,每周交付一个更真实的东西。
把 Token 用足。
尽快跑出一个能收钱、能获客、能省成本、能沉淀资产的闭环。
等到补贴变小、限额变紧、最强模型重新回到按量计费的时候,你至少已经不是站在岸边看热闹的人。你已经用这段最便宜的智能,给自己造过一条船。
继续阅读
全部内容请不要在泰坦尼克上研究如何升舱
最近一年,我发现身边越来越多的人开始做自媒体、做分享。很多是从大厂出来的朋友,第一次站到台前,把自己在公司里积累多年的经验讲给大家听。这客观上是好事。我也认真听了不少。 但听多了之后,我发现这些分享大多绕不开两个主题。 一个是如何在大厂里继续往上爬:怎么升职,怎么做 visibility,怎么管理向上关系,怎么在复杂组...
AI 提效已索然无味,下半场是什么?
潮水退去后的硅谷,与那些索然无味的“神话” 如果你今天走在旧金山 SoMa 区的街头,或者去参加任何一场黑客松,你会发现空气中的气味变了。 两年前,这里的咖啡馆里充斥着宏大的叙事。人们红着眼眶讨论通用人工智能(AGI)何时到来,讨论提示词工程是不是下一代人类唯一的母语,讨论怎么用 GPT-4 把现有的 SaaS 软件全...
Fable 5 读完了我的一千篇文章给我的一封信
生成信息:Claude Code / Fable 5 / effort: max。 原始 prompt: 这个是我的 personal 的文章的 repo,核心的内容在 ranchen.org-website/content 不要看其他 folder 里面的文章。 请阅读他们,然后给我写一封信,只有一次机会,只能给我写...
