agent有感1:claude code/codex/opencode
最近几天玩了玩三个AI智能体(英文称之为AI Agent)——claude code/codex/opencode,有些体会,作文分享。
推出时间
cc于25年2月推出;codex于25年4月推出;opencode于25年5月推出,是cc/codex的开源平替。
这仨都在25年下半年越来越火。我们可以在 https://www.star-history.com 查看他们走红的时间。
最近几天玩了玩三个AI智能体(英文称之为AI Agent)——claude code/codex/opencode,有些体会,作文分享。
cc于25年2月推出;codex于25年4月推出;opencode于25年5月推出,是cc/codex的开源平替。
这仨都在25年下半年越来越火。我们可以在 https://www.star-history.com 查看他们走红的时间。
昨晚读到这篇文章,事关大东方号 (Great Eastern) 对于大西洋电缆的贡献,我想起一个和文章主题不相关的事。
对大西洋电缆的居功至伟的人中,有一个我们的老朋友:开尔文 (1824) 。
我觉得开尔文是个值得尊敬的人。原因有二。
第一,他不会像有的人一样坐而论道,而是确实把自己所学应用到了现实生活中。后来,神经科学的电缆方程也是从开尔文的电缆方程上略加改动得到的。
第二,当年,是他重新发现了格林 (1793) 、卡诺 (1796) 的著作,把它们重新介绍给世人。我相信有的人会把它们据为己有,而不是归于原作者——我甚至不确定牛顿、高斯是否会如此正直。
现在已经是2025年12月了,距离ChatGPT-3.5发布已经过去了36个月,距离ChatGPT-o1发布也已经过去15个月。然而,在和LLM协作这件事上,我却停滞不前,甚至有些退步。
曾经,我会因为 ChatGPT-3.5 写出一篇小作文而欣喜和兴奋,现在我在SIDER或者Cherry Studio里后宫佳丽三千人,却不再因为它们的作文而兴奋。
曾经,我会因为 ChatGPT-3.5 能够五分钟写完五种SVM的实现方法而震撼,会因为只需要在它的代码基础上改一改而开心好几天。现在却已平淡如水,并且会因为LLM没有立刻写出正确的code而生气。
曾经,我会心花怒放地和 ChatGPT-o1 聊数学、物理、统计,以及一切可以用数学语言描述的现象。我惊讶于LLM不仅掌握了编程语言和自然语言,现在甚至掌握了数学语言。
曾经,我会因为 ChatGPT-3.5 能够拒绝回答训练日期之后的事情而惊讶,但现在这件事看起来似乎稀松平常。
今天突然好奇——AI已经能击败象棋和围棋顶级职业选手,但它们能击败DOTA和LOL,CSGO和PUBG的顶级职业选手吗?
我找到两个不错的参考资料:
结论:
今年英雄联盟世界赛改成了全局bp,感觉很有趣,于是时隔多年又关注了,的确精彩,以前翻来覆去就是那些英雄。
有人说中国俱乐部再不拿冠军,英雄联盟热度就更低了。但其实它本来入坑就越来越难。英雄越来越多,新手上来就要面对170个,怎么搞。没有新人加入,它终究会冷寂、停服、被遗忘。
我忍不住想,将来我们的下一代还会玩这些游戏吗。
我回忆起从小玩的那些,即时战略、赛车、横版闯关、爆破、生化、三国杀、类dota、吃鸡、自走棋、搜打撤,但实在找不出它们能流传很久的理由。
没玩过的人压根看不懂,这限制了传播性。问了几个朋友,没玩过lol基本没人看。足球则是一项不会踢的也能看懂的。
玩法不够简洁有力,这限制了美感。上述玩法的确都是很有想象力的发明,但都很冗长。做得最好的是围棋,以及数学。
去滕王阁玩,背滕王阁序免票,于是我就背了背。
我发觉——古人说话,并不可能真的像滕王阁序一样。
今天的网络用语,正像过去的书面文,感觉很快会消亡。
早上看到一只小蚂蚁在努力地搬动几十倍体积于自己的食物。心中忿忿。人类真的比蚂蚁厉害很多吗?蚂蚁无法离开地球,人类无法离开太阳系。
从托勒密的时代开始,物理学最火的研究领域经历过多次变迁:从天文学,到力学,到热学,到电磁学,到原子和分子物理,到粒子物理,到凝聚态。
最后一个转变我想大家都清楚。上世纪六七十年代,物理学家分裂成两派,一派认为the party is over,人类已经没钱造加速器了。另一派认为人类应该努力造。2016年杨振宁和丘成桐的辩论即为此(两人的文章发表在知识分子,如此重要的东西首发于微信公众号,极为罕见)。从今天往回看,历史基本延续了前一派的预测,物理学的重心变到了凝聚态,去研究固体、液体、导体、玻璃的性质。凝聚态不那么费钱,也几乎立刻就能对人类有帮助。
悲伤的是,我觉得,如果没有更大的加速器的话,人类永远也理解不了暗物质和暗能量,也永远不知道量子力学的众多诠释(哥本哈根、德布罗意-波姆、多世界)谁对谁错,也永远不可能实现星际旅行。
但是,我依然是认可杨振宁的想法的。有人说,造大加速器也就能花个几百亿美元,一个恒大欠了几千亿美元,王者荣耀一年的收入有几十亿美元,摩根大通的年收入有一千多亿美元,Harvard每年的收入也有几十亿美元。但是,在目前的经济学体制下,各国投入的研究经费(R&D)至多只能占GDP的5%(各国列表,以色列和韩国最高,5%左右),这是经济学的客观规律,不是人的主观意志能改变的——你不可能要求所有人都勒紧裤腰带过日子,去帮助国家搞科研,把研究经费占GDP的比例提高到50%。如果一个国家真的这么做了,那么就类似于杨广造大运河,过不了几年就会游行、起义、革命,到时候政府停摆,连本来的研究经费都没了。说白了,老百姓更关心能不能在城市里有房子住、有没有游戏可以玩、股票是涨还是跌、小孩能不能受到更好的教育,而不是五十年、一百年之内不会改善人类生活的粒子物理。这也无可非议。
和爸爸一起看了死神来了6
北京时间2025年8月8日凌晨1点,加州时间2025年8月7日上午10点,GPT-5终于发布了。
我关注了两点——数学和幻觉。
之前的流言说:非推理版的 GPT-5 在AIME 2025(美国IMO国家队选拔赛试题)上拿下100分。但这是假的。
除了网页版外,我经常用的AI工具
偶尔用
ragflow (2025春):我的工作不太需要RAG。
Google AI Studio/Doubao/GPT-4o (2024春):打语音和视频电话。
Gamma/AiPPT (2025春):AI帮你做幻灯片。
我还缺少什么?
自24年9月13日OpenAI的o1发布、展示出惊人的数理能力后,DS的R1是第一个赶上的(25年1月),随后是
R1面世时世界只有惊艳。后四者中,羊驼不及预期,Grok差强人意,剩下两个都非常强悍,特别是Gemini 2.5 Pro,似乎已经重新让谷歌回到了它失去了三年的AI王座。
今天,仅仅过了5个月,xAI又发布了Grok 4,迭代速度真是惊人。
上午聊天,聊到我的优点和缺点。其实我还是有蛮多缺点的。
以上都是从小到大都有的缺点,以下是以前没有、读硕士这三年才有的。
主要就是这些,剩下的,偶尔熬夜、偶尔拖延、偶尔吹牛,等等,皆为次要。
第一个日期是2022年11月30日(北京时间),OpenAI放出ChatGPT-3.5。
第二个日期是2024年09月13日(北京时间),OpenAI放出ChatGPT-o1。
中国高考:2024年6月最高者勉强及格、2025年6月最高接近满分。
AIME数据集也类似。
当你约会:那些星星是距离我们几十、几千、甚至几十万光年的恒星。几十万年后,今天的我们将在那里再次相遇。
当你恋爱:心有灵犀,幽灵般的超距作用。
当你狂妄:人类历史螺旋上升。科学家负责上升,政治家负责螺旋。
当你沉沦:所有有序结构终将消散。
| OneNote | Obsidian | |
|---|---|---|
| 价格 | 免费 | 部分功能需付费 |
| 开源 | 闭源 | 闭源 |
| 插件 | 少 | 多 |
| 插入图片 | 面向对象 | 面向过程 |
| 数学公式 | 输入繁琐 | 输入简单 |
我最后的选择依然是OneNote。它更面向对象,维护起来更加方便。至于数学公式,我用别的笔记软件(Markdown, Latex, GoodNote) 代替此功能。
今天在2025年智源大会上听了Bengio和Sutton的讲座。虽然是线上,但是两位老哥都非常有热情,明显是认真准备了。Bengio先,Sutton后。
Bengio的讲座和他两周前的TED讲座主旨类似,但细节更加丰富。
2023年,Hinton表示:我从未听说过高级智能会被低级智能控制住。
Bengio表示:吾有一计。真正危险的是Agentic AI,而Chat AI的威胁并不大。那么,我们可以用Chat AI监督Agentic AI。言下之意——他大概是觉得光靠人类自己是限制不了Agentic AI了。
| Read Aloud | Sider | Speechify | Read Aloud TTS | Read to Me | Natural Reader | |
|---|---|---|---|---|---|---|
| 价格 | Free | $10/Month | $29/Month | Free | Free | Free |
| 直接朗读 | 不能朗读 | 处理后朗读 | 不能朗读 | 不能朗读 | 不能朗读 | |
| 语音自然程度 | 中(高需要每次点击认证) | 高 | 高 | 不知(出错率高) | 不知(出错率高) | 不知(出错率高) |
惊夜鹭而群飞,访枯树以寻古。
叹人生之短暂,欲留名于史书。
今天和小娄聊天,聊到英国的理论物理、粒子物理学家Paul Frampton因色情诈骗被逮捕的事。
2011年,他丧偶后,想再找一个伴侣——随后他用了某个恋爱软件找对象——找到了一个前凸后翘的拉美姑娘——对方说“Age Is Just A Number”(年龄不是问题)——他去拉美和对方见面——对方要求他帮忙带一个行李——行李里面有两千克可卡因——他被判了两年。
虽然看上去很蠢,但是也能理解,哈哈哈。
故事的经过是我从 Sabin 的频道里看的。