LLM 帮你把数学证明「翻译」成代码,Trellis 让形式化验证不再依赖天才
(Auto)formalization is supposed to be easy: Trellis process semantics for spelling out rigorous proofs
Trellis 是一个全新的自动形式化系统,它让大语言模型在一个确定性约束的工作流中,把非形式化的自然语言数学证明,迭代地转化为 Lean 语言的形式化证明。核心思路是模拟数学家「写草稿→逐步严格化」的思维过程,用流程设计强制 LLM 在每个步骤都产生可验证的进展,而不是一次性放飞自我。→ 这意味着,过去需要少数精通逻辑框架的人才能做的形式化工作,现在可能有更泛化的解法。对那些想用 Lean 做数学验证的研究者,这套思路比「让 LLM 直接翻译」靠谱得多,可复现性也更高。
数学和逻辑方向的朋友值得细看
地球是圆的?在大数据和算法眼里,我们的星球可能是个不规则的土豆
What shape is the Earth?Aeon杂志的这篇文章尖锐地提出了一个被现代人遗忘的问题:地球到底是什么形状?我们从小被告知是圆的,科学课说是椭球体,但在地理信息系统、GPS定位和卫星遥感眼中,地球的形状其实是一张依靠数学拟合出来的、极不规则的“大地水准面”。 文章从古希腊的哲学争辩一路追溯至当代大数据测绘,揭示了一件反常识的事:根本就没有绝对真实的“地球形状”,只有为了不同目的而建构的模型。地图从来不是客观的,它是权力、技术与想象的产物。→ 在这个依赖定位算法的时代,这篇文章帮你拆解了手机地图里那个看似理所当然的认知底层,非常醒脑。
这篇文章能彻底粉碎你小学形成的世界观
当你甘于渺小,世界反而会为你让出一条路
Being small这篇来自Aeon的哲学散文《Being small》不是教你逃避,而是重新定义「小」的价值。在崇尚宏大叙事和指数增长的时代,作者可能从自然生态、手工技艺或日常生活的微观视角切入,论证「微小存在」如何构成复杂系统的基石,以及谦逊、专注细节为何是对抗现代焦虑的解药。→ 如果你正被「必须做大做强」的叙事压得喘不过气,这篇能给你一个放下包袱的智识理由。
适合睡前读,比刷短视频更能安顿浮躁
两百年前的年轻人,比今天的Z世代更懂躺平和内卷
Gen Z but two centuries agoAeon的《Gen Z but two centuries ago》很可能将当代Z世代标签——焦虑、理想主义、对旧体制的疏离——投射到19世纪初的欧洲青年身上。工业革命早期的学徒、浪漫主义诗人、巴黎的波希米亚艺术家,他们也面临技术颠覆和旧秩序瓦解,用沙龙、漫游和剧烈的美学实验对抗迷茫。→ 核心洞察或许在于:代际冲突的脚本早已写好,今天关于「整顿职场」和「数字 detox」的讨论,不过是两百年前那场未完成的青春反抗的递归。
下次家庭聚会可以用来反驳“一代不如一代”
把孩子当学徒养,可能是对抗教育内耗的最古老答案
Children are apprenticesAeon的《Children are apprentices》将矛头指向现代学校教育的抽象化倾向,主张回归学徒制模式:让孩子在真实情境中通过观察、模仿和参与成年人的有意义工作来学习。文章可能结合人类学证据(如原住民育儿方式)和认知科学,指出当学习嵌入生活实践时,内驱力和韧性自然生长。→ 这对天天盯着作业本崩溃的家长来说,是一个根本性的视角转换:不是逼孩子学习,而是邀请他们进入你的‘工作坊’。
有娃的值得收藏,没娃的可以转发给父母
数学不是人类发明的符号游戏,它一直都在那里等着被发现
Mathematics is out thereAeon的《Mathematics is out there》探讨数学哲学中最古老的争论:数学究竟是人类思维的虚构,还是客观存在的柏拉图世界的一部分?文章可能引用量子力学中的虚数不可或缺、或物理学中数学「不合理的有效性」作为证据,论证数学更像被考古学家挖掘出来的结构,而非随意发明的工具。→ 理解这一点,会改变你对待公式和定理的态度——它们不是必须死记硬背的规则,而是宇宙本身的线索。
数学恐惧症患者读完可能会有瞬间顿悟
电竞人的双11来了!2026年全球总决赛售票官宣,这次别再手慢无
Worlds 2026 Ticket SalesMay 28, 2026拳头游戏官方公布了2026年英雄联盟全球总决赛的售票信息,开售日期定在2026年5月28日。这是LOL电竞最高荣誉的线下观赛机会,每年都一票难求。 → 虽然没有公布举办城市,但按惯例这将是首次开放抢票的关键节点。建议想亲临现场的召唤师提前注册认证,准备好支付方式,并做好和黄牛拼手速的心理准备。对于去不了现场的玩家,这波官宣也意味着赛程预热即将开启。
想去的召唤师现在就可以设日历提醒了
2026年LCS春季赛决战在即,这份观赛指南让你秒变懂王
Fan's Guide to the LCS Spring FinalsJune 4, 20262026年6月4日,LCS春季总决赛即将开打。本文是面向粉丝的完整观赛指南,涵盖赛程安排、参赛战队核心看点、线下观赛活动及直播信息。虽然目前具体对阵尚未完全揭晓,但根据季后赛走势,北美电竞格局正在经历新老交替——传统豪强面临挑战者冲击,新一代本土新星逐渐扛起赛区大旗。→ 如果你是北美粉,这或许是近几年最有悬念的一场决赛;如果你只看LCK/LPL,这份指南也能帮你快速看懂LCS的版本理解和BP逻辑,别错过跨赛区偷思路的机会。
LCS决赛前看一眼,观赛体验直接拉满
季后赛撞上颁奖礼,LCS春季赛这次玩得挺花
LCS Spring Playoffs & Kia AwardsMay 19, 20262026年5月19日,LCS春季季后赛将与Kia Awards颁奖典礼同期进行,官方把竞技与年度荣誉结合,试图制造更丰富的叙事。季后赛阶段正是各战队抢分争夺MSI门票的关键期,而颁奖环节可能会评选赛季MVP、最佳新秀等奖项,甚至影响选手身价与转会风向。→ 这种赛事与娱乐混搭的模式如果效果不错,很可能被其他赛区借鉴;对观众来说,一天之内既能看生死局又能看选手西装领奖,话题度拉满。
想知道谁是北美最强选手,别忘了蹲这一场
她改变了地球的命运,却说书中的诗意不是自己写的
Silent Springs, Windswept Seas: On the Environmental Vision of Rachel Carson在获得国家图书奖时,《寂静的春天》作者蕾切尔·卡森解释说:《环绕我们的海洋》里的诗意并非她刻意添加,而是因为海洋本身充满了诗意。这句话背后是她作为科学家和作家的独特理念——当观察足够深入、描述足够诚实,事实本身就具备打动人心的力量。 → 对于今天的内容创作者和环保传播者,卡森示范了如何不靠煽情也能激发情感共鸣。如果你想做出既有专业深度又有传播力的内容,她的写作哲学至今依然是顶级教材。
做科普、写文案的人,花5分钟看她的原话很值
一部剧的服装里藏有多少电影彩蛋?《The Beauty》设计师亲自拆解
‘The Beauty’ Costume Designer Explains the Show’s Cinematic Influences — and When She Broke from Them在IndieWire圆桌会议上,《The Beauty》服装设计师Sarah Evelyn详尽拆解了该剧精确至极的色彩编码系统。她坦言从众多经典电影中汲取养分,但最关键的一步是有意识地打破参照,转而让服装纯粹为角色内心叙事服务。→ 这意味着观众可以透过颜色变化直接读取人物状态和关系张力,而这种“先致敬后叛逃”的手法也成为剧服设计的进阶课。对戏服迷和视觉叙事爱好者来说,这是一次难得的幕后解码。
追剧时顺带看懂角色隐藏性格,这十分钟很值
为了一条裙子翻遍照片档案,《Love Story》的服装师有多疯狂?
Watch ‘Love Story’ Costume Designer Rudy Mance Explain the ‘Crazy, Obsessive’ Lengths He Went to Recreate Iconic Looks为在荧屏上重现JFK Jr.与Carolyn Bessette的极简时尚美学,服装设计师Rudy Mance沉浸在浩瀚的照片档案中,并依靠两位演员全身心的配合,才将这些标志性造型复活。他披露了寻找特定面料与剪裁的极端过程,以及如何让服装成为演员进入角色状态的开关。→ 这不仅是服装置景,更是一场对90年代风尚的考古式复刻,从中能闻到那个时代特有的自由与节制。热衷传记剧和复古时髦的人都会看得入迷。
对90年代极简美学和名人风格感兴趣的建议收藏
环保纪录片看得人绝望?《海洋》导演说我们有充分理由感到希望
‘Ocean with David Attenborough’ Director Keith Scholey Explains Why Everyone Should Be Hopeful About Ocean Conservation在迪士尼特别放映会上,纪录片《海洋与David Attenborough》导演Keith Scholey传递了一个反直觉的信息:海洋保护正在起效,人类有理由保持乐观。他分享了多个保护区恢复和科技监测带来的成功案例,认为过去的十年里公众意识转变和跨世代合作已经让趋势逆转。→ 这种基于事实的积极叙事比纯粹的危机警告更能激发行动力,对日常被气候焦虑包裹的观众而言,是一部能重新点燃希望的必看之作。
看完你可能会想为海洋做一件小事
在流水线上夜班后写诗,这个故事让我重新理解了文学的意义
Lit Hub Daily: June 8, 2026Lit Hub Daily刊载了Xiao Hai的回忆录片段,记录了他在生产线上经受残酷夜班的同时,仍坚持用诗歌搭建精神世界的经历。文中那句“我们可以端庄又调皮,理智与情感,在一天之内快速切换或同时并存”,正是对这种双面人生的尖锐注脚。→ 诗歌不再只是书斋里的雅趣,而是扎根于工厂噪音中的生存抵抗,提醒我们创作本就是普通人对抗异化的最朴素武器。在加班和疲惫中仍然暗自做梦的人,都能从这短短文字里找到共鸣。
被工作压得喘不过气时,读这个会有力量
2025年最值得读的科幻神作都在这份名单里了,错过再等一年
Here are the winners of the 61st Annual Nebula Awards.美国科幻与奇幻作家协会(SFWA)公布了第61届星云奖获奖名单,这是科幻奇幻领域最具权威性的奖项之一,专门嘉奖2025年最杰出的虚构类作品。星云奖由专业作家投票产生,含金量极高,往往预示着未来雨果奖的风向。 今年正值AI议题大爆发,获奖作品很可能会涉及后人类、人工智能伦理或虚拟现实等前沿主题。→ 对于想了解当代顶级科幻创作动向的读者,这份名单是绝佳的阅读指南,能帮你直接锁定那些既有文学深度又有思想锐度的年度必读作品。
科幻迷下半年的书单这就有了
47:32
这期经济学解释频道视频是一次跨越7年的思想实验回顾。从2019年自动化将如何重塑社会的理论推演,到2022年ChatGPT引发职场大地震,再到2025年AI对实体经济的具体冲击,以及MIT今年发布改变评估方式的研究。 视频核心结论很可能在于:现实比预测来得更快、更不均衡。当初认为的“缓慢替代”变成了“午餐时间的突然体验”。数据显示,AI并未立即造成大规模失业,但正在静悄悄地侵蚀中产脑力劳动的溢价。→ 值得深思的是,在数据比石油还贵的时代,个人隐私变成了训练模型的燃料,连VPN广告都成了这个时代寓言的一部分。
16:35
Conductor联创Charlie Holtz展示了用自家产品编排多个AI编码代理的真实工作流。核心是「语音 + 键盘快捷键」的无缝开发:用20美元的鹅颈麦克风对Claude低语指令,避免开放办公室干扰;通过Cmd+N随时创建新任务,让代理去解读Linear工单并提出解决方案;Cmd+Shift+Y快速检视即将合并的PR,给出评论后AI自动修正。最颠覆的细节是,他大部分时间都在并行启动多个实验性工作空间,其中绝大多数最终并不合入。→ 这意味着AI辅助开发的重心已从写代码移向‘并行实验和选择’,编码正变成一种指挥和审查的艺术。
34:17
2021年的公开数据中,德克萨斯大学GPS专家Todd Humphreys及其学生发现了一个惊人模式:自2019年起,欧洲大范围GPS卫星导航信号出现73次强烈干扰事件,信号强度瞬间骤降至原来的十分之一。干扰波及范围从斯瓦尔巴群岛到西班牙,从加拿大东部到波兰,而信号减弱中心直指波兰或俄罗斯飞地加里宁格勒——一处近年电子战活动频繁的军事重地。研究人员起初怀疑是地面大功率发射器淹没了卫星信号,但干扰的精准时机和广域同步性暗示了更复杂的可能性。→ 这很可能不是单纯的军事演习副产品,而是某种新型电子对抗手段的实战测试;对普通人来说,一旦依赖GPS的系统(航班、电网、金融时间戳)被类似方式定向攻击,后果远比迷路严重。
29:54
从纽约到旧金山,北美路网有超过6400万个路口,可能的路线数量达到10²²⁰,即使每秒检查10亿条也要算10²⁰⁰年。但谷歌或苹果地图能在4秒内给出最短路径,背后是1956年 Dijkstra 在阿姆斯特丹购物途中迸发的算法灵感。Dijkstra 为证明计算机对普通人也有用,设计了能直观演示最短路径规划的程序,从此奠定了图搜索算法的基础。今天的导航系统在此基础上叠加了分层地图、启发式预测和实时交通数据,将不可想象的计算量压缩到眨眼之间。→ 这不仅仅是导航知识,更是任何涉及寻路的智能系统(游戏AI、机器人)的底层逻辑;理解算法如何把“不可能”变“秒出”,对程序员和非程序员都是一种思维升级。
29:05
Emergent 是一个无需编程知识就能构建并发布软件产品的平台,用户可以直接开发、交付和盈利。这家公司最初只是一个四人研究实验室,因打造世界第一编码智能体(在 SWE-bench 登顶)而受到关注,而后转向“让每个人都成为软件创造者”的愿景。在 AI 推动编程门槛急剧降低的浪潮下,Emergent 仅用六个月摸索就冲到了 1 亿美元 ARR,成为印度增长最快的 AI 原生公司之一。→ 这个案例揭示了一个趋势:软件创建本身正在变成大众技能,未来产品可能不再来自专业开发者,而是来自最懂需求的业务人员;对创业者和投资者来说,“无代码+AI”赛道可能比想象中更快兑现价值。
OpenAI和Anthropic同时松口:AI发展要减速,但卡在同一个死结
@emollick: Both Anthropic and OpenAI mention the possibilities of slowing AI development in their latest "whatAnthropic与OpenAI在各自的AI未来展望中,罕见地同时提到需要减缓AI发展速度。但两家都强调,这必须是全球协调行动,且目前没有明确可行的方法。 这份默契揭示出顶尖实验室的深层焦虑:在激烈的商业竞争中,单方面减速等于把领先位置拱手让人,形成经典的“囚徒困境”。→ 对于政策制定者和投资者,这是AI安全进入官方议程的明确信号,但短期内很难看到任何公司自愿踩刹车。关注后续是否会出现行业自律组织或政府介入的尝试。
关心AI监管走向的朋友建议细看原文
一张图让Android用户沉默:Apple AI的真实水平到底有多强?
@berryxia: Apple的AI领先水平远远超乎人们的想象啊! 不信你看这个图就知道了! https://t.co/nca4V2j1Jw博主分享了一张图表,称Apple的AI能力远超人们想象。虽然没有透露具体内容,但从语境推测,可能涉及Apple Intelligence在端侧推理速度、隐私保护下的多模态能力,或与全生态的整合深度。→ 如果图表数据属实,Apple借助自己掌控的硬件和操作系统,有潜力让AI变得像收发短信一样自然,直接绕过目前云端AI的诸多痛点。对于开发者和安卓生态,这是值得警惕的降维打击,但也要当心营销渲染。
果粉和开发者都应该去翻翻那张图
终于不用翻墙?Apple Intelligence可能成为AI大众化的转折点
@kimmonismus: Even though I want to test Apple's Intelligence myself: it looks very promising and could finally pr作者对Apple Intelligence的前景十分期待,认为它有机会真正把AI带给全球数亿iPhone用户,而不只是极客的玩具。当前最大悬念是实际体验能否兑现演示的流畅度。→ 若Siri完成从“傻子”到“管家”的进化,Apple将瞬间成为最大的AI分发渠道,对ChatGPT等独立应用形成巨大冲击。建议重点关注WWDC后的真机评测,这决定了AI能否真正进入主流生活。
准备换手机的同学可以等评测出来再决定
OpenAI秘密提交IPO文件,全民AI公司的股票要来了?
Confidential submission of draft S-1 to the SECOpenAI官方宣布已向美国SEC秘密提交S-1表格,正式踏出上市流程的第一步,但尚未确定后续时间表。保密提交意味着他们可以在不公开敏感财务数据的情况下先与监管机构沟通,试探市场反应。 → 结合Sam Altman近期密集接触中东资金的动作,这可能是在为大规模融资甚至IPO铺路。对普通投资者,虽然暂时买不到,但这标志着AI产业从疯狂烧钱迈向资本化的关键转折。关注后续是否选择传统IPO或直接上市,以及估值逻辑如何定义“AI公司”。
想当OpenAI早期股东的人可以开始做功课了
OpenAI要亲自研究AI抢饭碗了?这个新计划现已开放申请
Introducing the OpenAI Economic Research ExchangeOpenAI正式启动“经济研究交换计划”(Economic Research Exchange),核心是资助外部学者系统研究AI对就业、生产率与整体经济的影响。有别于以往科技公司闭门造车的报告,这次开放申请意味着第三方独立评估将有可能产出更有公信力的数据。→ 此举很可能是在为应对未来更严格的监管做准备,同时为劳动力市场政策辩论提供关键实证。如果你从事劳动经济学或AI社会影响研究,这项资助值得立刻关注。
关注AI政策和劳动市场的朋友现在就可以去看看
开源视频生成一直被按在地上摩擦?CineDance 拿出了一份豪华「食材」清单
CineDance: Towards Next-Generation Multi-Shot Long-Form Cinematic Audio-Video GenerationCineDance 瞄准的是开源视频生成模型的「数据饥渴」难题。商业模型之所以能生成电影感叙事,很大程度上靠的是高质量、结构丰富的训练数据集,而开源社区恰恰缺这个。这项工作构建了一套多镜头、长时程的影视级音视频生成数据集与基准,试图给开源模型喂上「细粮」,让生成效果从短视频 GIF 向多镜头、带叙事逻辑的长视频跃迁。→ 如果这个数据集被广泛使用,开源视频生成模型跟闭源的差距会肉眼可见地缩小。关注视频生成和数据工程的同学,可以重点关注它放出的数据规模和结构设计。
玩视频生成的建议马住,数据集比模型更值钱
「皮质醇 28」和「股市波动」,大模型说它们相似度 0.83——对,它在瞎扯
Correlation Is Not Enough: Embedding Human Metadata for Individual Causal Discovery这篇论文严厉拷打了预训练生物医学语言模型的一个致命缺陷:会把统计相关性当作因果关系。作者举了个离谱的例子:你问模型「皮质醇 28 ug/dL」和「股市波动」有没有关系,它算出余弦相似度高达 0.83,但实际上两者毫无机制联系。这不是个例,目前几乎所有开源医学生物编码器都存在这种「强力脑补」问题。→ 在临床决策、药物发现等高风险场景,这种伪相关性可能导致完全错误的判断。作者提出的解决思路是嵌入人类元数据来发现个体层面的因果关系。这给「AI 医生」们敲了警钟:光靠预训练海量文本关联,并不足以理解生物机制。
做医疗AI的必看,这可能是你模型出错的根源
自动驾驶模型能答对题,但可能看错了地方——你的模型也在「蒙答案」吗?
Where Does the Answer Come From? Benchmarking View-Level Visual Evidence Identification in Multi-View MLLMs for Autonomous Driving这篇论文质疑了多视图多模态大模型在自动驾驶场景里的「真实智商」:模型在多视图驾驶场景中回答正确,并不意味着它依赖了正确的视觉证据。一个典型错误是,车辆前方明明有行人,模型却根据侧后方图像做出了判断,答案蒙对了但证据源是错的。这种「看错地方答对题」在安全关键场景中极其危险。→ 这项工作提出了一个新的评估基准,要追踪模型到底从哪个视图中提取了判断依据,相当于给模型装了「眼动仪」。这对所有用多视角视觉做决策的场景(无人机、机器人)都是一个值得深挖的评估思路。
做感知融合算法的该紧张起来了
Agents-flex 是一个专为 Java 开发者打造的轻量级 AI 应用开发框架,核心特点是零依赖、低门槛,让你用纯 Java 快速构建智能体、聊天机器人等应用。它集成了对 ChatGPT、GPT 等主流模型的支持,同时也提供了灵活的插件体系。 对于长期被 Python 统治的 AI 开发领域,这一框架让庞大的 Java 工程体系有了直接参战的能力。→ 如果你所在团队以 Java 技术栈为主,又想在内部快速落地 AI 功能,Agents-flex 可能是成本最低的入场券。目前项目刚起步,star 数增长迅猛,值得蹲守。
JimLiu/baoyu-design 把 Claude Design 能力打包成了一个本地 Agent Skill,可以在 Cursor、Claude Code 等工具中直接调用。输入一句需求,它就产出完整的、自包含的 HTML 原型、幻灯片或线框图,无需依赖 claude.ai/design 网站,推荐搭配 Opus 4 模型使用。 这意味着设计师和产品经理可以用代码协作的方式,在本地快速验证界面想法,输出的 HTML 可直接打开演示。→ 对于追求效率和隐私的团队,这相当于把 AI 设计能力内化到了自己的开发环境,迭代速度会大幅提升。注意该项目高度依赖 Claude 模型,是典型的 AI-Native 工具链尝试。
Avibe 是一个本地优先的 Agent 操作系统,核心理念是让 AI 助手完全运行在自己的机器上,数据不外泄。它能够驱动官方的 Claude Code、Codex 和 OpenCode 等编程 Agent,并且通过浏览器或任何聊天应用(包括微信、Discord)与它们交互。 有意思的是它的 ChatOps 设计——你可以像聊天一样给 AI 派活,它会在你的本地环境中执行代码、操作文件。→ 这可能是通往「个人 AI 助理+私有数据安全」的理想形态,特别适合对隐私敏感的开发者和极客。但初期配置有一定门槛,适合喜欢折腾的用户。
Deco Studio 是一个开源的 AI Agent 控制平面,主要解决多 Agent 协作时的混乱问题。它提供了统一界面来连接各种工具、雇佣不同的 Agent,并实时追踪每一个 token 的消耗和花费。 对于正在大量使用 AI Agent 的团队来说,Deco 做到了两件要紧事:一是将杂乱无章的 Agent 调用变成可管理的资源;二是把烧钱的速度可视化,避免账单爆雷。→ 如果你们公司已经上了多个 AI Agent 却缺乏运维手段,这个项目相当于给你的 AI 部门装了个「ERP 系统」。建议先跑起来监控现有成本。