There will be NO NEED for Common Humans in the Future Society.
当前模型已经可以在数据充足、正误判断明确且反馈易获得的任务(如应试、比赛、编程)上,达到人类顶尖水准(前1%);在部分任务(如软件工程)上堪比人类小规模中级团队水平。
AI当前还有许多问题,但我相信其中大多数问题会在短期(5年)内解决。
比如模型在一些缺乏充足数据的自然任务和多模态复杂任务(如软硬结合、具身、识图、根据指令修图、医疗)上达不到人类水准,但这些任务随着数据和参数的持续Scaling、模型架构的渐变式升级、上下文窗口的变大、硬件算力和硬件效率的持续升级,终将会被解决。
而以下是一些我认为当前范式下模型没那么容易解决的问题:
- 数据极度稀疏、解法极其创造力、极度困难的任务(如数学难题、理论物理难题)
- 极其强调创造力、要求惊异度、没有标准答案、和大多数数据相似意味着平庸的任务(如写作、绘画)
- 极其庞大且需要高度准确率的任务(创造操作系统、高性能浏览器)
- 需要个体多样性以及群体智慧合作的任务(比如创造一个与人类社会相似的AI社会)
而以下是我认为20年之内模型会拥有的新技能:
- 持续学习的能力
- 长短期记忆成本同时降低,且短期记忆可像人类一样往长期记忆体系中高效蒸馏
- 媲美人类效率的认知能力和学习能力
要知道AI当前的学习效率是极低的,人类根本不需要刷100000道算法题才能学会怎么做Leetcode中90%以上的题目,聪明的人类个体只需要大概200道和体系化的知识网络。
AI吃了这么多数据,在编程这件事上居然只是和人类最强个体持平,是很令人惊讶的,这反映了当前范式下模型训练的低效。 - 多样化个体和协作并产生持续进步的社会的能力
笔者最近有在搞科研,当前的工作流可以说高度依赖于AI(已经很努力地去有自己的见解,有自己的灵感了)。
工作流大致是这样的:
1、用Deep Research了解一个领域并获取该领域内的重要论文
2、用GeminiPro了解这些论文大致讲了什么
3、思考、做出一些猜想、提Proposal、和GeminiPro反复Battle、尝试让GeminiPro提Proposal。
4、用ChatGPT查某个idea是否已经有人做过了,相关论文有哪些,用的什么方法
5、定位几篇关键论文,打印出来仔细阅读,并用ConnectedPaper找这些论文的上下游论文
6、猜想、思考、和AI battle,完善Proposal
7、开讨论会,思考、猜想、判断idea是否有价值
8、用Github Copilot中的Claude Opus做小规模、大规模实验,验证想法
…(以上步骤交叉混合循环进行)
总之,我真没发现有哪一步是AI真的不能自己做的。AI也可以提猜想,只要你给它提供足够好的Context,告诉它什么是“好解释”,该领域有哪些强相关论文。
我也有很努力地试图去学AI不能做的能力(准确来说是我以为AI做不到),比如写严格符合实验要求的Pytorch实验代码,结果发现Opus写得真的比我快且好(并发、测试、超参数调试、文档、实验严谨性……)。
当前阶段AI提的猜想还不够noval,但是实验代码写得比我好且快,AI能联想到的知识也远比我多。
那么,请问:既然Agent集群(如oh-my-opencode)可以一个agent当项目Leader(Sisyphus),一个agent当项目经理(Atlas),一个agent当产品经理(Prometheus),一个agent当信息搜索家(Librarian)……
那么Agent集群也可以端到端地自动化完成我的整个科研过程,进一步地,经过人类顶尖智能体设计的智能体集群,可以完成一切人类按一定步骤和程式完成的任务。
(感兴趣的可以了解一下AI Scientist-v2,已经可以端到端地生产workshop级别的论文)
过不了多久,就会有一个AI产品经理、一个AI HR、一个AI 程序员、一个AI Leader组成的小公司团队;几十年后,就会有一个机器人主刀医师,一个机器人助手医生,一个机器人麻醉医生……他们也不一定会是团队,也可能是一个超级个体(像当前的LLM一样)。
此时会发生什么?
普通人类的劳动力价值将会与完成其劳动所需的算力成本持平。
因为大多数人类和人类团体的劳动成果,都在AI的能力范围之内。
请回忆一下,第一二次工业革命,当纯体力劳动被生产线替代,低端蓝领工人的劳动力价格跌到了什么程度?
未来的几十年里,曾经被认为有极高门槛的脑力劳动中的95%,其价格也将像自由落体般下坠。
未来社会将不再需要普通人类。
本文本应到这里就结束了,因为我实在是无意讨论未来社会会变成什么样,是否应该平均分配,这种讨论对当下决策意义不大。
但我手贱将上述文本扔给了GeminiPro,他提了一个不错的建议:
AI短期内还是杠杆(提升人类生产力,满足人类需求),我们要努力走到杠杆的一端成为杠杆点(始终去寻觅并找到AI还无法做到,需要人类来做的地方)。
比如:
1、成为架构师而不是程序员。未来工程师,可能是去构建Agent系统来解决一个问题。
2、深耕人类需求,深耕“品味”(Taste)。AI始终不懂人类究竟想要什么,他不可能像人类一样提出自己有什么需求,只要AI还在满足人类需求(而非相反),那我们就可以成为提出需求的人。
不要太乐观,也不要太悲观。某些技术往往比人类想象中来得快,但也有很多比人类想象中来得慢(在过去,这往往是工程性突破和创造性突破造成的区别)。