哈佛大学物理学教授 Matthew Schwartz他是《量子场论》教科书的作者,在学术界享有盛誉。在今年年初,Matthew Schwartz决定做一项实验。
他将指导人工智能大模型 Claude 进行一项真正的理论物理计算。

这并非演示,也不是对某个概念进行简单的鉴定,而是要利用 Claude 写出一篇真正能对该领域做出贡献的论文——也就是那种通常需要研究生花费一到两年时间才能完成的复杂计算。
Matthew Schwartz 用了两周的时间,用 Claude 完成了这项任务。
后来,他把这个过程写成了一篇名为《氛围物理学:人工智能研究生》的文章,发表在了 Anthropic 的研究博客上。
在完成这个任务的过程中,Matthew Schwartz 给自己设定了一些限制:
1. 他只能通过文字提示,即用提示词和 Claude 进行交流。
2. 他不能编辑文件。
3. 他也不能复制粘贴自己的计算过程。
他想通过这样的做法,探索是否存在一套人工智能提示词指令,就像指导一位优秀的二年级硕士研究生那样,让人工智能生成可以发表的物理论文。
结果,这个大模型 Claude 的产出量令人难以置信,它一共生成了 110 个草稿版本,超过 51,000 条信息。
Claude 编译了旧的 Fortran 代码,编写了 Python 脚本,并运行了蒙特卡罗模拟,最终生成了一份包含公式、图表和参考文献的 20 页 LaTeX 草稿。
而整个过程仅仅只用了 3 天的时间。

Matthew Schwartz 最终把这篇文章发表在 arXiv 上。他在 Anthropic 的博客中写道,他本人甚至没有时间去完整阅读这篇文章,但文章却引起了轰动。Matthew Schwartz 收到了大量的演讲邀请,普林斯顿高等研究院(Princeton)还召开了他所说的关于“研究领域大语言模型”的紧急会议。
关于这个故事,我觉得有几个方面值得我们思考:
1. 人工智能加速科学研究是大势所趋
我们可以想象,一个原本需要施瓦茨本人独立完成、耗时 3 到 5 个月,或者研究生需要 1 到 2 年才能完成的项目,他从头到尾只用了两周时间。
2. 专业知识并非可有可无
我们可以设想一下,如果没有 Matthew Schwartz 的物理学专业知识,这篇文章就会变成一篇包装精美的胡说八道。
因为人工智能无法区分正确且令人信服的观点,只有人类才能做到。
因此,这并不是人工智能取代物理学家,而是人工智能极大地增强了一位专家的能力。
3. 对教育的影响意义深远
正如他在 Anthropic 博客文章中所倡导的那样,他建议研究生要认真对待大语言模型,并动手实践。
作为一个物理学家,他在文章最后提到:
经过几十年来科学、技术、工程和数学(STEM)对人文学科的冲击,特别是在生成式人工智能高速发展的这几年,人文学科面临着更大的压力和挑战。
然而 Matthew Schwartz 认为,也许在未来,人文学科可能会成为最终得以幸存的唯一学科。
对此您怎么看?

石牌校园西区操场边上的大树菠萝
Photo by Johnnie Walker