从活字字块到Token浪潮:技术民主化的千年接力
日期:2026-03-26 22:05:18 / 人气:3

3月16日至22日,全球最大AI模型API聚合平台OpenRouter记录下一组令人侧目的数据:全球AI大模型总调用量20.4万亿Token,其中超过三分之一流向了中国模型。
连续三周,中国AI大模型的周调用量碾压美国同行——7.359万亿对3.536万亿,涨幅56.9%对7.35%。排行榜前四席,中国模型包揽全部:小米MiMo V2 Pro、阶跃星辰Step 3.5 Flash、MiniMax M2.5、DeepSeek-V3.2。
但比排名更值得关注的是这个被频繁提及却鲜被理解的词——Token(词元)。
1000年前,北宋工匠毕昇在胶泥上刻下一个个反体字,用火焙硬,制成可以反复排列的""活字"",改写了人类知识传播的历史。今天,工程师们将文本切割成名为""Token""的最小单元,用向量和矩阵重新定义智能生产的逻辑。
从泥活字到数字Token,从物理排版到神经网络计算,一场关于""最小单元""的革命,似乎正在以惊人的相似性重演。
但相似不等于相同。本文将借用活字印刷的历史意象,同时严格划定类比的边界——因为技术史的精确性,比叙事的流畅性更重要。
02
Token是什么?AI的“文字食材”
——以及它和活字的“表亲”关系
""Token是大语言模型处理文本的基本单元,可理解为'AI眼中的字块'。""
深圳理工大学算力微电子学院助理教授马智恒这样解释。在输入模型前,文本会被切分成Token并转换为向量。中文通常每个字对应1至2个Token,英文则约0.75个Token per word。
想象你向AI提问:""人工智能会取代人类吗?""
在人类眼中,这是一句话。在AI眼中,这是若干Token的序列——可能是""人工""+""智能""+""会""+""取代""+""人类""+""吗"",或者更细粒度的切分。每个Token都被编码成一个高维向量,在神经网络的层间通过矩阵运算和注意力机制进行处理,最终生成回答。
深圳计算科学研究院崖山LAB负责人欧伟杰打了个比方:如果将""算力""视为""电力"",那么Token就是消耗的""电量"",是衡量AI活跃度与处理规模的核心指标。
综合开发研究院通证数字经济研究中心执行主任马朝良看得更远:""Token背后反映的是一个更大的趋势——人类正在把世界'拆解'成可以被机器理解和处理的最小单位。""
至此,""Token=数字活字""的类比似乎成立。但这里必须插入一个关键的澄清——
活字印刷的""最小单元""(泥活字)是生产工具,可物理复用;Token的""最小单元""是计算过程中的临时数据,每次调用都在消耗算力资源。换句话说,活字越用越省(边际成本递减),Token越用越费(边际成本基本线性增长)。二者在成本逻辑上是反向的。
那么,真正的类比对象是什么?
不是Token本身,而是预训练模型的权重参数——那些在海量数据中训练得到的、可以被无数应用共享调用的""知识结晶""。这些参数才是更接近""数字活字""概念的对象:刻制一次(训练),复用无限(推理)。(注:这是本文提出的类比,非学术界标准术语)
而Token,更像是印刷过程中的""纸张和油墨""——是消耗品,而非生产工具。
但为何Token的调用量如此重要?因为它衡量的是""数字活字""被激活的频率——是技术民主化的温度计,而非技术本身。
03
历史的回响:活字印刷的启示与错位
1040年代,北宋庆历年间,布衣毕昇发明了胶泥活字印刷术。
这比古腾堡的铅活字印刷机早了整整400年。沈括在《梦溪笔谈》中详细记录了这项技术:用胶泥刻字,薄如钱唇,火烧令坚,然后密布字印,满铁范为一板。
但历史开了一个残酷的玩笑。
明清时期,活字印刷在中国未能完全取代雕版。原因复杂:汉字数量庞大,常用字就需数万枚字模;泥活字易损,金属活字成本高昂;科举制度下的书籍需求结构,未能形成足够的商业驱动力。直到19世纪西方铅活字印刷机传入,中国才真正进入活字印刷的大规模应用时代。
发明在先,规模化在后——这是中国古代技术史的常见叙事。
但今天,当Token成为智能生产的""消耗单元"",中国似乎正在走出不同的轨迹。这里的关键差异在于:我们并非Token机制(Transformer架构、注意力机制均源于美国)的""原创发明者"",但正在成为Token规模化流动的主导者。
这是一种不同的历史角色——不是毕昇式的""技术首创者"",也不是古腾堡式的""技术整合者"",而是""技术采纳者+规模化应用者""的新角色。
04
霸榜背后:中国Token经济的三大支点
OpenRouter的数据揭示了一个清晰的格局:中国模型不仅调用量大,而且增长迅猛。这背后是三个相互强化的支点。
第一支点:
价格革命——让""纸张油墨""便宜到可以挥霍
以DeepSeek、MiniMax M2.5为代表的国产模型,大幅降低了API使用成本。
""国产模型以较低的训练成本将AI变为如同柴米油盐一样的生活必需品。""粤港湾控股有限公司执行董事罗介平如此评价。
这里需要再次厘清类比:如果说模型权重更接近""数字活字""(一次性投入,无限复用),那么推理成本就是""印刷耗材""(每次调用,持续消耗)。中国模型的真正突破,在于让""耗材""便宜到可以大规模挥霍——这降低了技术应用的门槛,而非技术生产的门槛。
活字印刷的核心价值,是让知识复制的边际成本断崖式下跌;今天中国AI的核心价值,是让智能服务的边际成本趋近于零。效果相似,机制不同。
第二支点:
开源生态——让""字模""可以被自由复制
中国公司在开源模型领域占据主导地位,与全球顶尖闭源模型的技术代差已缩短至约三个月。
开源意味着什么?意味着""数字活字""(模型权重)可以被全球开发者自由获取、改进、再分发。毕昇的活字技术受限于时代,未能形成持续迭代的社区;今天的开源模型生态,正在以互联网的速度自我强化。
第三支点:
场景红利——让""印刷机""遍布每个角落
这是最具中国特色的变量。
微信月活13亿,钉钉7亿,飞书2亿。这些超级应用构成了AI触达用户的""自来水管网""。
""我国开发者贡献了大量的Token消耗,""罗介平指出,""这些用户只需轻轻一点即可调用AI能力,这无疑带来了海量的模型调用需求。""
欧伟杰称之为""长尾效应"":随着国内大模型在推理成本、响应速度、API成本等方面的持续优化,大量中小企业和开发者开始将AI接入业务流程,触发了调用量的指数级增长。
十亿级用户入口+极低调用成本+开源技术生态,这三者的乘积效应,构成了中国Token经济的基本盘。
但请注意:这里的竞争优势不在于Token本身,而在于Token的流动效率——是基础设施、成本控制、场景渗透的综合结果。
05
冷思考:Token洪流中的真问题
繁荣的表象下,需要保持清醒。
首先是""量""与""质""的落差。
马智恒提醒:""我们也必须清醒认识到,美国在原始模型创新、高端芯片与算力基础设施等领域,仍保持着显著优势。""
调用量领先不等于技术领先。中国模型在应用层的Token消耗上占据优势,但在基础层的模型架构创新、硬件层的算力自主性上,短板依然存在。
其次是""消耗""与""沉淀""的错位。
欧伟杰指出了更隐蔽的挑战:""海量Token的背后,是更大规模的数据吞吐与更复杂的数据治理挑战。大模型的每一次调用,都依赖底层数据库系统对实时数据、历史知识、用户交互的精准管理与毫秒级响应。""
这里有一个反讽:Token调用量越大,意味着""数字活字""(模型权重)被使用得越频繁,但同时也意味着系统脆弱性越高——数据治理、实时响应、安全合规的压力呈指数级增长。
活字印刷不仅要有字块,还要有精良的排版工艺、优质的纸张墨水、高效的发行网络。Token经济同样需要完整的""排版生态""。
最后是""薄利""与""溢价""的困境。
中国模型以价格优势收获全球开发者青睐,但这是否意味着我们只能做""薄利多销""的生意?如何在Token调用量的基础上,构建更高附加值的服务和品牌?
这是从""制造大国""到""品牌强国""的老命题,在AI时代的新投射。
06
未来谁将成为""智能排版大师""?
3月,阿里巴巴正式成立Alibaba Token Hub事业群,旨在围绕""创造Token、输送Token、应用Token""构建完整的AI生态体系。
几乎同时,英伟达CEO黄仁勋在GTC 2026上提出""Token经济学"",将数据中心定义为生产AI智能Token的工厂,强调""算力即收入""。
两种视角,两种逻辑。
美国视角:数据中心是Token工厂,算力即收入,核心是生产能力的垄断。
中国实践:Token Hub是生态枢纽,创造-输送-应用全链条打通,核心是网络效应的捕获。
哪种路径更具可持续性?历史或许能提供参照。
古腾堡的真正突破,不在于发明了活字(金属活字早已存在),而在于整合了活字铸造、印刷机、油墨配方、纸张供应、商业出版的全链条。技术的发明重要,但技术的""排版""——即如何将其嵌入社会经济系统的复杂网络——可能更重要。
今天,中国拥有最丰富的应用场景、最庞大的用户基数、最活跃的开发生态。这些条件使得中国有机会成为AI时代的""排版大师""——不仅生产Token,更定义Token流动的方式、规则和价值分配机制。
尾声:
划定边界后的回望
回到1000年前的开封府,毕昇在胶泥上刻下最后一个反体字,火光照亮了他布满老茧的双手。
他不知道,这项技术将在400年后才在异国他乡真正绽放。他更不知道,1000年后,另一群工程师正在服务器机房中,以每秒万亿次的速度切割、编码、重组着名为""Token""的数字单元。
从泥活字到数字Token,从物理排版到神经网络,人类对技术民主化的追求从未停止。但本文必须以一个严格的限定作结:
Token不是数字活字。模型权重才是。Token只是这些""数字活字""被激活时产生的涟漪。
中国AI的7万亿Token周调用量,衡量的不是技术原创性,而是技术扩散的速度和广度。这不是毕昇式的""发明者叙事"",也不是古腾堡式的""整合者叙事"",而是一种新的""规模化叙事""——同样伟大,但性质不同。
这一次,历史没有完全重演。中国正在书写新的剧本。"
作者:耀世娱乐
新闻资讯 News
- 消失4年再复出,她爆出娱乐圈最黑...03-26
- 瞿颖37分钟翻红:在“预制人”时...03-26
- 当魔改成风,这部6.2反倒成了遗珠03-26
- 这是今年最容易被误解的科幻片?03-26

