过去两周,生物制药圈最热的话题,莫过于2026年ASCO年会上那款胰腺癌口服新药daraxonrasib的数据:晚期患者死亡风险直降60%,中位总生存期达到13.2个月,整整翻了一倍。
与此同时,礼来的VERVE-102项目也放出消息——单次输注,就能在人体肝脏DNA上“动刀”,让PCSK9蛋白水平降低高达88%,LDL降低62%,而且疗效维持超过一年。
作为生物技术领域的风险投资人、癌症生物学家,Liang Chang对这类进展自然兴奋。他在哈佛拿的癌症生物学博士,同时也是个AI重度用户——过去两个月,光Token就烧掉了1.4万美元。
科技圈有个著名的“缩放定律”:算力和数据投得越多,模型能力就越强,增长是指数级的。
但Liang Chang在制药领域提出了一个反向判断:AI短期内可能更多是让研发管线变得拥挤,而非直接拉高获批成功率。他称之为生物学与新药研发领域的“反缩放定律”——第一个成功往往消耗了该领域最易得、最有价值的靶点,后续靶点只会越来越难,没有复利,只有衰减。

(来源:Liang's AIxBIO foundry)
科技行业的缩放定律,为什么不能直接套到生物学
如果只看表面,daraxonrasib和VERVE-102这两个项目确实容易让人乐观:RAS和PCSK9这样的重大靶点都突破了,在AI加持下,未来药物研发岂不是能取得更大突破?未来5-10年,会不会有一批类似成果不断涌现?
Liang Chang的回答很谨慎。他认为,这两个项目数据当然值得兴奋,但不能简单推导出“AI会让药物研发像软件一样规模化”。原因很直接:RAS和PCSK9并不是AI刚刚发现的新靶点——它们是生物医药领域最古老、最明确、被反复研究得最透的靶点之一。

(来源:Liang's AIxBIO foundry)
科技行业的增长逻辑,通常建立在可复制性之上。一个产品模型被验证后,可以迅速扩展到更多用户、更多场景、更多国家。用户越多,数据越多;数据越多,模型越好;模型越好,又吸引更多用户。这个循环可以实现复利式增长。
但药物研发不是这样。在生物学里,第一个被验证的靶点,往往不是随机选出来的。它之所以最先被验证,是因为它本身就拥有最强的人体遗传学证据、最清晰的疾病关联、最明确的商业价值,或者最值得长期投入的科学理由。
这就是所谓的“反缩放定律”:在生物学里,第一场胜利并不意味着后面也能胜利。相反,它可能意味着最明显、信号最强、最值得攻克的机会已经被消耗掉了。第二个靶点更难,后面会越来越难。
这与互联网行业的直觉完全相反。互联网里一个成功的产品可以复制到相邻场景,但药物研发里一个成功的靶点,并不意味着相邻靶点也同样有效。疾病机制、组织环境、患者差异、毒性窗口、给药路径、代谢特征……每一项都可能让看起来相近的问题变成完全不同的问题。
所以,AI制药如果沿用科技行业的规模化想象,就很容易高估自己的能力。模型可以迁移,生物学不一定能迁移;工程经验可以复用,但人体内的因果机制不一定能复用。
真正稀缺的不是模型,而是可靠的生物学靶点
Liang Chang在文章中提出了一个重要的判断:好靶点极其稀缺。
人类大约有2万个蛋白编码基因,其中可能有3000到6000个在传统意义上具备一定成药性,而真正拥有获批对应药物的靶点,仅仅只有700个左右。每一个阶段的跨越,都伴随着数量级的锐减。
更重要的是,这些被留下来的靶点并不是随机样本,而是生物学证据最强、最容易被理解、最容易被验证的一批。2024年,一项关于遗传优先级的实证研究发现,排名前0.28%的顶级靶点,从Ⅰ期临床试验一路过关斩将最终获批的概率,要比普通靶点高出近9倍。

(来源:Liang's AIxBIO foundry)
PCSK9就是一个典型案例。它之所以重要,不是因为模型从文献里推理出了它,而是因为人类遗传学给出了非常清楚的说明:一些人生来就携带PCSK9功能缺失变异,这类人群的LDL水平更低,冠心病风险也显著下降。
AI抬高了研发下限,却尚未突破成功率上限
事实上,Liang Chang明确承认AI在药物研发中有巨大价值。
从一个靶点到一款药物,中间有大量工程环节:寻找苗头化合物,优化分子结构,预测蛋白结构,设计抗体或小分子,改善成药性,评估药物代谢动力学,设计实验,优化生产工艺,筛选适应症,设计临床试验,提高运营效率。这些环节中,AI都可能显著提高效率。
AlphaFold对蛋白结构预测的推动,就是一个典型例子。今天,大量公司正在尝试使用AI预测抗体结合、优化成药性特征、生成新分子结构、提高筛选效率。
但需要警惕的是:药物研发里有一层绝非工程学所能解决的,那就是为正确疾病选择正确靶点。新药研发真正的考验往往是针对患者开展的Ⅱ期临床概念验证试验,到了这个阶段,药物必须面对真实患者、真实疾病、真实人体复杂性。

(来源:Liang's AIxBIO foundry)
而这一阶段的数据多年来几乎毫无起色:一款药物从步入临床试验到最终获批上市的成功率,在2014年大约是10%,而到了2020年这一数字甚至降到了接近8%。在此期间,基因组学、CRISPR、机器学习等工具快速发展,但却始终未能提高这一阶段的胜率。
归根结底,AI抬高了工程执行的下限,但它尚未突破生物学规律的上限。
当AI成为标配,热门靶点会更加拥挤
文章里最值得关注的一部分内容是关于“拥挤”的判断。
如果AI让药物研发的工程层变得更便宜、更快,但没有同步扩大经过验证的靶点池,那么资本和创业团队会往哪里去?答案很可能是:更加集中地涌向已验证靶点。
原因并不复杂。AI平台本身已经带有技术风险。如果一个团队还同时押注一个完全未经验证的新靶点,风险就会叠加。为了让融资故事更容易被理解,让早期结果更容易被市场接受,理性的选择往往是把新技术用在老靶点上。靶点越成熟,投资人越容易理解;已有数据越多,AI越容易训练;临床路径越清楚,项目越容易推进。
于是,AI反而可能把行业推向同一个方向。就PCSK9这一个靶点而言,目前已有至少15款抗体、10款siRNA、4款ASO,以及5款口服小分子/环肽药物获得了批准或已步入临床阶段;而针对CD19靶点,更是有超过300个不同临床项目在研:自体CAR-T、异体CAR-T、CAR-NK、单抗、T细胞衔接器……

(来源:Liang's AIxBIO foundry)
当AI成为唾手可得的工具,而可用靶点却依然屈指可数时,短期内的必然结果,就是引发一场针对同一批已验证靶点的惨烈价格战。
如何寻找同类首创的全新靶点?
如果AI不能凭空变出真正的新靶点,那first-in-class靶点到底从哪里来?
Liang Chang的答案很明确:最重要的来源是人类遗传学,但人类遗传学不是坐在电脑前做推理。
你不能靠一个最先进的AI模型,在已有知识库上更努力地推理,就找到下一个PCSK9;也不能单靠所谓虚拟细胞扰动,在模拟环境里推出一个足够可靠的新靶点;必须去真实世界中测序大量真实的人,然后做漫长的湿实验,弄清楚这个遗传信号到底意味着什么。

(来源:Liang's AIxBIO foundry)
再生元制药的GPR75就是一个典型案例。为了找到GPR75这个靶点——其保护性突变与更轻的体重相关,能将肥胖概率降低54%——他们测序了大约64万个人类外显子组。结果发现,这种保护性突变在每万名受试者中仅出现约4例。如此微弱的信号,只有在这样庞大的数据规模下才有可能被捕捉到。
GPR75是2024年被提出的重要肥胖相关靶点。但五年后,即使已有3个平行项目推进,仍然还没有GPR75药物进入人体临床。
治疗代谢相关脂肪性肝炎的靶点HSD17B13也是,它同样来自人类遗传学发现,目前还没有获批药物,但已经有5个临床阶段项目和更多临床前项目。
因此,靶点的发现绝非终点线,它仅仅是打响了又一个长达十年的物理世界艰苦鏖战的发令枪。
这也是AI无法逾越和走捷径的鸿沟,因为绝大多数同类首创靶点,根本还未曾存在于任何AI的训练数据之中。它们依然深藏在真实的临床队列里、在实验室的试管检测中,以及无数科学家在现实物理世界里,用岁月和心血筑就的坚守之中。
归根结底,核心论点是:在科技领域,概念验证意味着大功告成;但在生物学中,概念验证往往意味着九死一生。
保持足够的谦逊,继续扎扎实实地去测序、去寻找,并在任何人能够证明其可行性之前,依然选择去押注那些看似不露锋芒、胜算未卜的冷门尝试。
1.https://liangchang.substack.com/p/the-anti-scaling-law-in-biology-and