Grok 4
自24年9月13日OpenAI的o1发布、展示出惊人的数理能力后,DS的R1是第一个赶上的(25年1月),随后是
R1面世时世界只有惊艳。后四者中,羊驼不及预期,Grok差强人意,剩下两个都非常强悍,特别是Gemini 2.5 Pro,似乎已经重新让谷歌回到了它失去了三年的AI王座。
今天,仅仅过了5个月,xAI又发布了Grok 4,迭代速度真是惊人。
御六家:
自24年9月13日OpenAI的o1发布、展示出惊人的数理能力后,DS的R1是第一个赶上的(25年1月),随后是
R1面世时世界只有惊艳。后四者中,羊驼不及预期,Grok差强人意,剩下两个都非常强悍,特别是Gemini 2.5 Pro,似乎已经重新让谷歌回到了它失去了三年的AI王座。
今天,仅仅过了5个月,xAI又发布了Grok 4,迭代速度真是惊人。
御六家:
上午聊天,聊到我的优点和缺点。其实我还是有蛮多缺点的。
以上都是从小到大都有的缺点,以下是以前没有、读硕士这三年才有的。
主要就是这些,剩下的,偶尔熬夜、偶尔拖延、偶尔吹牛,等等,皆为次要。
第一个日期是2022年11月30日(北京时间),OpenAI放出ChatGPT-3.5。
第二个日期是2024年09月13日(北京时间),OpenAI放出ChatGPT-o1。
中国高考:2024年6月最高者勉强及格、2025年6月最高接近满分。
AIME数据集也类似。
当你约会:那些星星是距离我们几十、几千、甚至几十万光年的恒星。几十万年后,今天的我们将在那里再次相遇。
当你恋爱:心有灵犀,幽灵般的超距作用。
当你狂妄:人类历史螺旋上升。科学家负责上升,政治家负责螺旋。
当你沉沦:所有有序结构终将消散。
OneNote | Obsidian | |
---|---|---|
价格 | 免费 | 部分功能需付费 |
开源? | 闭源 | 闭源 |
插件 | 少 | 多 |
插入图片 | 面向对象 | 面向过程 |
数学公式 | 输入繁琐 | 输入简单 |
我最后的选择依然是OneNote。它更面向对象,维护起来更加方便。至于数学公式,我用别的笔记软件(Markdown, Latex, GoodNote) 代替此功能。
今天在2025年智源大会上听了Bengio和Sutton的讲座。虽然是线上,但是两位老哥都非常有热情,明显是认真准备了。Bengio先,Sutton后。
Bengio的讲座和他两周前的TED讲座主旨类似,但细节更加丰富。
2023年,Hinton表示:我从未听说过高级智能会被低级智能控制住。
Bengio表示:吾有一计。真正危险的是Agentic AI,而Chat AI的威胁并不大。那么,我们可以用Chat AI监督Agentic AI。言下之意——他大概是觉得光靠人类自己是限制不了Agentic AI了。
Read Aloud | Sider | Speechify | Read Aloud TTS | Read to Me | Natural Reader | |
---|---|---|---|---|---|---|
价格 | Free | $10/Month | $29/Month | Free | Free | Free |
直接朗读 | 不能朗读 | 处理后朗读 | 不能朗读 | 不能朗读 | 不能朗读 | |
语音自然程度 | 中(高需要每次点击认证) | 高 | 高 | 不知(出错率高) | 不知(出错率高) | 不知(出错率高) |
惊夜鹭而群飞,访枯树以寻古。
叹人生之短暂,欲留名于史书。
今天和小娄聊天,聊到英国的理论物理、粒子物理学家Paul Frampton因色情诈骗被逮捕的事。
2011年,他丧偶后,想再找一个伴侣——随后他用了某个恋爱软件找对象——找到了一个前凸后翘的拉美姑娘——对方说“Age Is Just A Number”(年龄不是问题)——他去拉美和对方见面——对方要求他帮忙带一个行李——行李里面有两千克可卡因——他被判了两年。
虽然看上去很蠢,但是也能理解,哈哈哈。
故事的经过是我从 Sabin 的频道里看的。
Today, through chatting with GPT and Gemini, I suddenly realized that the sample covariance
$$
s_{ij} := \frac{1}{n-1} \sum_{i=1}^n (s_i - \bar{s}_i) (s_j - \bar{s}_j)
$$
is meaningful if and only if $s_i$ and $s_j$ are paired.
If they are not paired,
any arbitrary pairing would lead to an arbitrary and meaningless covariance value. (from Gemini)
For a real life example, imagine that you want to investigate the production of rice of two different farms. You got $n_1$ bags of rice from the first farm, and $n_2$ bags of rice from the second farm. Each bag has its weight. Here, $s_i$ are weights for bag of rice from the 1st farm, while $s_j$ are weights for bag of rice from the 2nd farm.
I purchased Sider and Monica for 1 month.
Let me see which one is better.
For the first glance:
今天和朋友聊天,聊到性教育、网络色情、年龄限制。我上网查了查,美国出台色情网站严格年龄认证法案的州已经超过一半了,如下图所示:
最早加入的是路易斯安那州,2023年1月1日。最新加入的是亚利桑那州,2025年5月14日。
法案要求色情网站的浏览者上传年龄证明,比如,佐治亚州可以通过上传驾驶证完成年龄认证。
Hi, Guys! Today I watch a YouTube video about 15 popular science YouTubers playing the telephone game. This video was published on Sep 25, 2020, nearly 5 years ago! Time passes by so quick!
The 15 YouTubers include 3Blue1Brown, Welch Labs, Physics Girl, and so on. Among them, 3B1B and Welch Labs are hard-core, others are soft-core. But do not worry, who says we must watch hard-core popular science videos?
Of course, they failed to convey the original meaning, haha.
3Blue1Brown is so good at teaching hard-core knowledge in an easy way. I should call him Richard Feynman in our era.
今天终于成功进行了 Gemini 的学生认证并注册了 Claude,激动的心情不亚于昔日成功注册 ChatGPT 3.5 的会员(2022年12月)和成功认证 GitHub Copilot 的学生身份(2023春)。这篇博客记录了遇到的困难和解决方式。
5月7日,我听说了Gemini给美国学生免费发放16个月会员的事,报道见此。但是,我的两个谷歌账号(1109734844a@gmail.com和bruce.yixuan.li@gmail.com)均无法完成学生认证,显示“This account is not eligible for the Google One AI Premium plan”。我当时要忙别的事,便放下了。
最近沉迷于腾讯的《三角洲行动》(Delta Force)。它于2024年9月上线。玩法上,它有互不干扰的三大玩法,分别借鉴了《逃离塔科夫》(Escape from Tarkov)、《战地》 (Battlefield)、《使命召唤》(Call of Duty),同时,前两种玩法又借鉴了 Valorant 等游戏的人物技能机制。流行程度上,目前它在Steam上日活跃用户在14万左右,这还不包括使用官方客户端和WeGame启动的玩家。国际上,它的YouTube频道办得有声有色,播放量和关注者甚多。
毫不夸张地说,它是腾讯历史上最成功的自研端游。远远超出了昔日的《逆战》和《枪神纪》。
作为一个挚爱剧情的人,我自然去关注了《三角洲行动》的背景故事。其中最具魅力的组织名为哈夫克(Haavk),是一家富可敌国的科技公司。它旗下有两个产品:
粟裕骨灰部分藏于安徽黄山。
今天拜访了此墓。
长征前夕,粟裕所在部队于此被国民党军队击败。之后,又在不远的地方被合围,大多战死,只有粟裕带着小股部队成功突围。之后粟裕也一直留在此地,未去陕北。
粟裕去世时,遵其遗愿,部分骨灰葬于黄山脚下,和昔日的战友在一处。