陶哲轩甩出调教 GPT-4 聊天记录，点击领取大佬的研究助理

陶哲轩甩出调教 GPT-4 聊天记录，点击领取大佬的研究助理

作者 | IT之家2023-06-26

天才数学家陶哲轩搞数学研究，已经离不开普通人手里的“数学菜鸡”GPT 了!

就在他最新解决的一个数学难题下面，陶哲轩明确指出自己“使用了 GPT-4”，后者给他提出了一种可行的解决方法。

借助 GPT-4，他不仅成功地突破了这一难题，还将答案分享在了 MathOverflow 上：

它给我提供了最终的解题思路，接下来我只需要继续计算就行。

为了给更多数学家分享用 GPT-4 工作的便利性，陶哲轩还将自己的聊天记录 po 了出来，里面完整地记载了他和 GPT-4 的对话。

可以看见，在这份聊天记录中，他把 GPT-4 称呼为“专业数学合作者”，而不仅仅是一个普通的数学助手。

这个身份属实不一般了，不知道之后陶哲轩写论文的时候会不会把 GPT-4 列为共同作者(手动狗头)。

不仅如此，戳对话记录底部的“continue this conversation”按钮，还能一键把对话记录导入自己的 ChatGPT 中，突然闯入人类大师和 AI 的交谈。

陶哲轩解决了什么新问题?

陶哲轩研究的问题，是一个两天前在数学网站 MathOverflow 上更新的提问。

这个名叫“优雅的递归之 A301897”问题，具体长这样：

其中，A301897 是一个被整数数列网站 OEIS 收录的数列：

这个数列中有一系列来自长度为 n 的排列 b 的数，它们有一个共同点，就是满足 Diaconis-Graham 不等式且等号成立。

Diaconis-Graham 不等式由戴康尼斯(Persi Diaconis)和葛立恒(没错，就是“最大数”之父 Ronald Graham)于 1977 年共同提出，属于概率统计方面的研究。

显然，这一大段提问中不仅夹杂着大量专业数学公式，而且还涉及需要跳转的网页资料。

作为数学公认不太好的“数学菜鸡”，GPT-4 真的能像一名专业数学家那样快速读懂公式、给出解决问题的专业建议吗?

事实上，相比直接把问题复制粘贴给 GPT-4，陶哲轩做了三件事：

首先，做一些提示工程，明确 GPT-4 的“身份”和“目标”。其中身份是“一个擅长给技巧性建议的数学合作专家”，目标是“提供一些建议”而非解决问题。
然后，相比直接把大段公式复制进 GPT-4 提问栏(确实可以这样做)，陶哲轩选择将问题描述转成 Markdown 格式。
最后，涉及需要 GPT-4 自己查找资料的内容，陶哲轩将它转变成一个引用注释，并在结尾给出网址。

完整的提问过程长这样：

也就是说，相比让 GPT-4 直接化身数学家去“解决问题”，陶哲轩只是把它当成一个提供灵感来源的“专家”，给自己建议一些研究的方向。

GPT-4 很快给出了 8 个具体的建议：

1、理解问题：在深入证明之前，确保你理解了问题中的每一项。如果你不熟悉 Diaconis-Graham 不等式，研究一下它，了解表达式 a (n) 和 R (n, q) 中的每一项代表什么。

2、简化表达：有时候，复杂的表达可以被简化。例如，你可能想看看表达式中 a (n) 的二项式系数是否可以简化，或者是否可以用更简单的方式计算总和。

3、归纳法：由于 R (n, q) 是递归定义的，因此证明猜想的一种自然方法是使用数学归纳法。你可能想要证明，如果这个猜想对 n 成立，那么它对 n+1 也成立。

4、生成函数：另一种方法是使用生成函数。尝试找到 a (n) 和 R (n, 0) 的生成函数，然后证明它们是相等的。这有时可以把一个复杂的组合问题变成一个更简单的代数问题。

5、渐近分析：正如你提到的，分析 a (n) 和 R (n, 0) 的渐近行为可能会对它们的关系有一些深入的了解。这有时可以用斯特林的阶乘近似来实现，或者通过分析表达式中的主导项来实现。

6、数值证据：虽然不是证明，但收集数值证据有时可以让我们了解如何证明一个猜想。因为你有 PARI / GP 代码，可以用数值来检查猜想，你可能想读一读每个序列的前几项，看看是否能发现任何模式。

7、寻找类似问题：有时，一个问题或猜想是一个已知问题的泛化或变体。在组合文献中寻找类似的问题或定理，看看它们的证明是否可以适用于这个问题。

8、寻求反馈和合作：不要犹豫，从同事那里寻求反馈，或者在 MathOverflow 这样的论坛上发布你的部分结果。协作和同行评议通常是解决复杂数学问题的关键。

最终，陶哲轩使用建议 4，也就是生成函数的方法，成功解决了问题。

当然，解决问题的过程并不需要用到 GPT-4，采用 MAPLE 工作表 + 纸笔手动计算就能完成。陶哲轩也尝试了渐进分析(建议 5)的方法，不过事实证明还是用生成函数更有效。

简单来说，陶哲轩只是用 GPT-4 给自己提供不同的解题思路，也就是“解题灵感”，但具体怎么解答，也就是更加数学的方法，他则不会交给 GPT-4 来完成。

至于“查资料”这种 GPT-4 的应用，陶哲轩也发挥到了极致。

例如在思考问题时，他还会把自己的“灵光乍现”拿出来和 GPT-4 讨论一下，例如他觉得这个问题和卡特兰数(Catalan numbers)有相似之处，希望 GPT-4 帮他查找一下对应的资料。

GPT-4 很快给出了对应的回答，这也促使陶哲轩对另一个问题产生了新的灵感。

简单来说，陶哲轩在短短两段与 GPT-4 的对话中，展示了数学家使用 GPT-4 的正确姿势 —— 找灵感和查资料。

这样一来，即使“数学菜鸡”如 GPT-4，也能成为数学家的 AI 助理了。

大佬是怎么玩儿 GPT 的

分享人类大师和 AI 的聊天记录之余，陶哲轩的乳齿象博文里还附带着一份贴心指南，是他使用 ChatGPT 和 GPT-4 的经验之谈。

根据他过去的实操经验，最要紧的第一点：

不要试图让 AI 直接回答问题，因为这几乎肯定会得到一些看起来专业的废话。

为了避免 GPT 成为废话文学大王，行之有效的方案如下：

让 AI 扮演合作者的角色，而后让它提供策略建议。

Like this：

除此之外，“数学菜鸡”GPT，在大数学家手里能有什么用处?

陶哲轩大概的意思是酱婶儿的：

ChatGPT 数学能力虽然不咋滴，但对做学术研究的人来说是个发散思维的好工具。

(对普通人来说有点不太专业，但对搞数学的学术人员来说刚刚好)

怎么解释用来“发散思维”这句话呢?

陶哲轩表达出来的观点是，既然 ChatGPT 在具体数学问题上给出的答案是不完全正确的，那不如索性发挥发挥它生成答案部分正确的特性。

简而言之，就是让它帮你找灵感 balabalabla：

在处理数学问题时，可以让 ChatGPT 这类大语言模型做一些半成品的语义搜索工作。

也就是说，ChatGPT 不用提供确切的答案，只用生成一些可能的提示。

这样一来，依据 GPT 生成的提示 + 传统搜索引擎搜索，就能很轻松 get 答案。

而且他还自曝，在 GPT-4 发布之前，他本人就从微软那里获得了访问资格。

也就是和微软 154 页《AGI 的火花》论文里同款，未经过安全训练但能力更强的满血版。

从陶哲轩的反馈中可以看到，GPT-4 非常擅长在和人类对话时进行一些 cosplay，比如充当富有同情心的倾听者、热情洋溢的反馈者、富有创造力的灵感来源、翻译者或教师，或者是魔鬼的代言人。

与此同时，对于 AI 在数学研究中的表现，陶哲轩给出的大胆却又严谨的预言：

当与形式证明验证器、互联网搜索和数学符号包等工具整合时，2026 年的 AI，如果使用得当，将成为数学研究中值得信赖的共同作者，而且在许多其他领域也是如此。

除了数学研究，GPT-4 已经是陶哲轩生活中的全方位小助手了。

他经常使用 GPT-4 回答一些随意、措辞含糊的问题，这些问题以前需要在搜索引擎里精心调整关键词才行。

还有位同事，因为亲戚拿到重症诊断而郁郁寡欢。为此，陶哲轩让大手一挥，让 GPT-4 洋洋洒洒写了封慰问信。

结果呢?同事眼含热泪，被感动哭了。

最后说回陶哲轩用 GPT-4 解决数学难题这事儿上来。

在 MathOverflow 下，有的网友觉得他不应该用 GPT 来回答数学问题，感觉是个很敏感的话题。

但还是有人表示了资瓷，表示觉得真的是泰库辣～

陶哲轩倒是毫不避讳地站出来表明了自己的立场，他倒不觉得有啥不好：

现在的担忧，跟维基百科流行初期时大家讨论的重点也没啥区别……

现在在维基百科上 get 初始线索，并且在引为论点时附上链接，展现它是我论据的一部分，都是大伙儿习以为常的事情。

您可能感兴趣

搞懂物联网产业链其实很简单！《2023年中国AIoT产业全景图谱》重磅发布！

2022挚物·AIoT产业领袖峰会【线上直播】

面向物联网应用的十大智能传感器技术趋势

IoT周报丨中芯国际公布核心技术家底；华为苹果即将正面硬刚；任正非：要让寒气传递给每一个人；第一波元宇宙公司要凉了

微软停止涨薪影响明显：员工跳槽意愿上涨23%

PTC披露在核聚变突破中的有利作用

热门文章

1

《中国端侧 AI 全景图谱报告》已正式发布!助力端侧AI产业链上下游迈向发展新高度

1天前

2

存力觉醒、AI未来！2025全球闪存峰会在南京盛大召开

1天前

3

AI 潮涌东方处，数智星火已燎原——2025数智融合领袖峰会绘就产业落地新图景

4天前

4

倒计时1天｜2025数智融合领袖峰会即将开启！

6天前

5

Robrain AI打造机器人"闭环智能"引擎,加速具身智能机器人"灵魂觉醒"

6天前

6

AI智能体+AIoT:智能时代的关键联结,还是又一场幻觉与泡沫?

6天前

7

ISSE 国际智慧空间展览会9月杭州首秀！全球智慧生态×国家级数贸平台，共绘智慧空间新蓝图

6天前

8

消费物联网产品价格比非连接同类产品高44%,成为智能消费市场重要载体

7天前

9

过度炒作+虚假包装？Gartner预测2027年超40%的代理型AI项目将失败

1周前

10

TRUE大会"智慧通行"分论坛圆满落幕!解码未来通行,引领楼宇通行数智变革

1周前

11

构筑汽车网络安全“护城河”

1周前

12

万字回顾首届中国AI算力大会！15+位大咖主会场演讲精华爆棚，来没来都值得收藏

2周前

13

闪存普惠，一步到位 | 华为商业市场极简全闪数据中心Pro+重磅发布

2周前

14

移远通信 × 奥飞娱乐，共同打造AI潮玩2.0时代

2周前

15

是时候重新理解 eSIM 了！

2周前

16

市场规模激增!卫星物联网凭什么赢?

2周前

17

AI赋能下楼宇建筑数智进化：从功能创新到自主觉醒的空间智能体

2周前

18

边缘AI的下一跳:迈向"智能体操作系统"

3周前

19

MWC上海| 华大电子发布国内首颗通过GSMA eSA认证安全芯片CIU98_G50，打造移动安全+物联“芯”生态

3周前

20

【万字长文】物联网的激荡二十年

3周前

谷歌旗下 DeepMind 开发出 RoboCat AI 模型，能控制多种机器人执行一系列任务

谷歌旗下 DeepMind 表示，该公司已经开发出一种名为 RoboCat 的人工智能模型，可以控制不同的机器人手臂执行一系列任务。

2023-06-26

智次方·物联网智库 —— 研究型智能产业服务平台

关于智次方

友情链接

ITES深圳工业展

极客邦科技

智联车智库

智吱屋小程序

本站由阿里云提供计算与安全服务违法和不良信息举报电话：010-88884220 举报邮箱：liuzong@zzw.com 网上有害信息举报

©2022 北京英维塔科技有限公司京ICP备16012223号-1

京ICP备16012223号

智次方·物联网智库 —— 研究型智能产业服务平台

X