Daily Digest — 2026-06-03

LEAD STORY

让AI Agent拥有“永久记忆”，Token消耗还砍了35%——这个开源OS有点狠

MemTensor/MemOS

GitHub/Trending GITHUB AI 开源项目 AI Agent

MemOS Agent记忆 35.24% Token节省混合检索技能复用

MemOS 是一个专为大模型和AI Agent设计的自进化记忆操作系统，最炸裂的数据是：在实际应用中能节省35.24%的Token消耗。它通过混合检索和跨任务技能复用，让Agent记住历史交互并迁移经验，真正实现“越用越聪明”。传统的Agent做长链任务常会“失忆”，MemOS用持久化存储解决了这个痛点。→ 对正在构建复杂Agent应用的开发者来说，这意味着更低的API成本和更连贯的用户体验。TypeScript实现，前端集成会很顺手。

做Agent应用的朋友建议收藏，省钱又提效

NO.02Quick Briefing

02

@berryxia: 微软的新模型MAI-Image-2.5 在图像编辑中斩获第二名的位置。那么可以看出来还是GPT-Image-2 最强，第一！ Google 的Nano Banana 模型都已经被微软的MAI超越

X/@berryxia X/KOL AI AI模型对比图像生成 · 关注AI绘画工具动态的，这张排名图值得看看

03

Value-Aware Stochastic KV Cache Eviction for Reasoning Models

HuggingFace/Papers HF AI AI论文 KV Cache · 做大模型推理部署的同学，这篇论文值得追一下

NO.11探索发现

Steam评分91%的神作，现在只卖一杯奶茶钱

Steam/CheapShark STEAM GAME 游戏折扣游戏折扣 Steam

LIMBO $1.24 91%好评解谜神作

LIMBO 新史低 -90%，入手价仅 $1.24。这款解谜神作在 Metacritic 上拿到 88 分，Steam 好评率高达 91%。作为 Playdead 工作室的成名作，黑白剪影画风和压抑氛围至今仍是独一档的存在，全程无文字叙事却把末世孤寂感拉满。为什么现在值得补票？→ 续作《INSIDE》口碑依然炸裂，玩完原版能更好理解制作组的设计进化。另外这个价格基本是慈善级别了，有 Steam Deck 的可以直接当移动端神优化范例收藏。

恐怖游戏天花板打一折，胆小慎入

Alan Wake (-90%)

Steam/CheapShark STEAM GAME 游戏折扣游戏折扣 Steam

Alan Wake $1.49 恐怖游戏 Remedy

Alan Wake 直接 -90% 到 $1.49，这是 Remedy 在《控制》之前的心理恐怖代表作。Steam 88% 好评，Metacritic 83 分。游戏把“手电筒驱暗”的机制玩到了极致，剧情悬念层叠，非常有斯蒂芬·金的味道。 → 随着《Alan Wake 2》口碑大爆，现在正是用一杯咖啡的钱补完前作剧情的最佳窗口。推荐直接买包含两个 DLC 的完整版，同样骨折。

Metro评分90的废土经典，比快餐还便宜

Metro 2033 Redux (-90%)

Steam/CheapShark STEAM GAME 游戏折扣游戏折扣 Steam

Metro 2033 Redux $1.99 废土FPS 线性射击

Metro 2033 Redux 打骨折到 $1.99。原版就是 90 分的线性 FPS 教科书，Redux 版画质和潜行系统全面进化，Steam 88% 好评。莫斯科地铁下的压迫感、自制弹药当货币的生存设计，让这场废土之旅硬核到令人窒息。 → 如果玩完觉得对味，建议直接等《Metro Exodus》打折，三部曲一起拿下的成本大概不到一份外卖的钱。喜欢《辐射》但厌烦开放世界疲劳的玩家闭眼入。

Steam好评83%的点击冒险，价格跌到忽略不计

Goodbye Deponia (-90%)

Steam/CheapShark STEAM GAME 游戏折扣游戏折扣 Steam

Goodbye Deponia $1.99 点击冒险手绘废土

Goodbye Deponia -90% 后仅 $1.99。Metacritic 80 分，Steam 83% 好评。作为德式点击冒险喜剧三部曲的终章，手绘废土风极具辨识度，谜题逻辑天马行空，主角简直是“倒霉蛋界的堂吉诃德”。 → 虽然不如《Deponia》初代惊艳，但在这个价位，能让你打发 10 个小时并收获多次爆笑的叙事游戏几乎没有竞品。强烈推荐一次性买齐三部曲的捆绑包，连贯体验更佳。

Steam好评92%的历史叙事神作，打一折仅需两美元

Ken Follett's The Pillars of the Earth (-90%)

Steam/CheapShark STEAM GAME 游戏折扣游戏折扣 Steam

The Pillars of the Earth $1.99 互动小说 92%好评

Ken Follett's The Pillars of the Earth 新史低 $1.99。Metacritic 78 但 Steam 玩家好评高达 92%，说明目标受众的黏性极强。游戏忠实改编自肯·福莱特的同名小说，用了中世纪手绘卷轴的美术风格，配音和音乐是广播剧级别的水准。 → 如果你喜欢《权力的游戏》那种多线群像、权谋博弈，这款互动小说式的叙事杰作比很多 3A 更有沉浸感。缺点是节奏偏慢，但 $1.99 买一场长达 20 小时的中世纪传奇，性价比爆炸。

祈祷让感情更甜？科学实锤：这一招只对「真信」的人灵

Religious individuals who pray for their partners tend to report higher relationship satisfaction

Psych/PsyPost PSYCH 心理学亲密关系

祈祷关系满意度宗教虔诚度大学生心理学研究

一项针对大学生情侣的新研究发现，向上帝祈求伴侣福祉能显著提升关系满意度。但别高兴太早——这种积极效应仅存在于定期参加宗教仪式、且将宗教视为生活核心的信徒身上。对「浅层信仰者」而言，祈祷效果几乎为零。研究者指出，这可能是因为虔诚者的祈祷往往更投入、更发自内心，而非流于形式。同时，强大的宗教社群支持网络也起到了推波助澜的作用。→ 这项实验揭示了一个残酷真相：亲密关系中的「神助攻」，本质上是信仰一致性和社群归属感的红利，而非超自然力量的干预。如果你想试试看，先问问自己：这周末会去教堂吗？

NO.06视频精选

SpaceX IPO: Nice Try Though

YouTube/Patrick Boyle VIDEO AI 投资 SpaceX

SpaceX的上市文件S-1彻底打破了SEC文书的枯燥传统。开篇不放资产负债表，而是放了14页火箭与卫星的精美照片，让人瞬间想起WeWork那场灾难级的IPO。更离谱的是，管理层的「商业策略」中反复出现「将意识之光延伸到星辰」这类诗意口号，全文共出现10次。风险提示部分更是刷新三观：投资人被警告「我们不想人类落得和恐龙一样的下场」。文件还勾勒出科幻般的业务版图——地球点对点火箭旅行、在轨制造、月球客运与货运……Patrick Boyle吐槽，这大概是有史以来最不像法律文件的招股书。→ 虽然够酷够反叛，但别忘了当年WeWork也是靠花哨包装吸引眼球，最终一地鸡毛。SpaceX的终极浪漫能否让投资人买账，还得看火星计划到底烧不烧得起这个钱。

Dubai Was An Economic Miracle, Then They Got Bombed

YouTube/Economics Explained VIDEO AI 地缘政治中东

迪拜三十年来精心打造的商业天堂形象正遭遇致命危机。3月1日凌晨，伊朗的空中打击命中了迪拜国际机场、豪华酒店、亚马逊数据中心乃至军事基地，打破了「中东安全绿洲」的叙事。过去，迪拜通过零税收、快速居留权和顶级奢华配套，吸引全球富豪们选择性忽视宗教保守、人权问题与区域动荡。但如今的导弹残骸证明：没有谁能在地缘火药桶里永远独善其身。阿联酋声称已拦截上千次攻击，却未公布实际落地数量。→ 对全球投资者而言，迪拜资产的无风险溢价正在迅速蒸发。地缘政治的脏水，终究溅进了镀金的游泳池。别再迷恋所谓的「安全区」，地图上的冲突红线比税收优惠单更值得关注。

The Anatomy of Genres — A Conversation with John Truby | @BeyondTheScreenplay

YouTube/Lessons from the Screenplay VIDEO 电影编剧电影

写过编剧圣经《故事解剖》的John Truby带来了新作《类型的解剖》，并与「Lessons from the Screenplay」频道展开了一场烧脑对话。主持人Michael还意外透露自己正为BioWare开发《质量效应》新作，这简直是游戏编剧界的梦幻联动。 Truby在播客中痛惜「人们压根不怎么谈论类型」，并深入拆解类型如何塑造世界观、驱动情节。如果你曾用《故事解剖》解构过自己的剧本，这本新书会帮你从类型根源上找到创作蓝图。→ 不管是写科幻、恐怖还是爱情，Truby的体系都能让你摆脱套路，写出真正有深度的类型故事。编剧和叙事工作者们，准备好接住这波知识冲击。

What’s new on my other channels

YouTube/Lessons from the Screenplay VIDEO 电影游戏影视

Michael在「Lessons from the Screenplay」的更新中透露了旗下频道的猛料。「Beyond the Screenplay」播客已经可视化，你可以在YouTube上看他们激情评析《沙丘》。而游戏叙事频道「Story Mode」更是玩出了新花样——邀请了BioWare开发者一起直播玩《质量效应2》经典结局关卡，边操作边讲解设计挑战与叙事技巧。也就是说，你能一边重温薛帕德的最终抉择，一边听到关卡设计师亲自揭秘幕后。还等什么？快去「Story Mode」和「Beyond the Screenplay」看看，绝对让你的创作者肾上腺素飙升。

Where Do You Put the Camera?

YouTube/Every Frame a Painting VIDEO 电影电影创作导演技巧

为什么同一场戏，有的导演拍得行云流水，有的却像在凑镜头？这期《每一帧都是一幅画》或许给出了最精炼的答案：在你决定把摄像机放哪儿之前，先想清楚「这场戏到底在讲什么」。托尼·周借史蒂文·索德伯格的一段幕后花絮点破本质——一个看似平淡的「角色发现找不到卡片」场景，索德伯格纠结了一个多小时，最后顿悟：「这场戏的重点就是车上有一个人」。想通这一点，机位设计瞬间明朗。 → 这个洞察直接颠覆了「多机位＝高质感」的迷信。创作者真正的功夫不在运镜技巧，而在于从琐碎信息中提炼出那个「唯一需要被看见的东西」。如果你正在被分镜表折磨，这条建议可能是今年最能帮你省时间的创作心法。

NO.07科技新闻

YC掌门人点赞：好的公司不该只围着股东转

@garrytan: Thank you @ericries for saying what needs to be said and pointing the way to longer term companies f

X/@garrytan X/KOL AI 创业硅谷

Garry Tan Eric Ries 长期主义公司使命股东至上

Y Combinator CEO Garry Tan 转发精益创业之父 Eric Ries 的观点，强调应该出现更多长期导向、以真实使命为驱动的公司，而不是一味追求股东利益最大化。这并非空谈——在风投圈开始公开讨论「去股东化」相当罕见。→ 信号意义大于具体操作，可能预示着新一代硅谷创始人在治理结构上会有更多实验，值得早期创业者关注。

正在融资的创始人可以看看这条

开局两块B200，一位神秘大佬正悄悄重注AI

@garrytan: RT @Suhail: 1/ it all started w 2 8xB200s excited to be back in the game again

X/@garrytan X/KOL AI AI 硬件创业

Suhail B200 8xB200节点 AI回归 GPU集群

知名连续创业者 Suhail（Playground 创始人）发推宣告，他带着两台 8xB200 服务器重返 AI 战场。B200 是英伟达最新旗舰 GPU，成本不菲，直接跳过 H100 上顶配，说明其新项目训练强度不小。→ Suhail 此前项目多以消费品为主，这次大张旗鼓入局 GPU 重型任务，很可能是一部从零训练的大模型，或者某种需要极致算力的新应用，值得留意后续进度。

关注 Suhail 的朋友别错过这条暗示

“最好”的奖励函数出现，推理模型可能又要变天

@swyx: probably the best reward function for reasoning efficiency i've seen

X/@swyx X/KOL AI AI研究大模型

推理效率奖励函数 swyx LLM推理

知名 AI 评论人 swyx 罕见给出最高评价，称遇到一个「大概是至今最好的」用于推理效率的奖励函数。虽然推文没点名出处，但结合上下文，大概率是某篇探讨如何更高效训练模型进行长链推理（类似 o1 架构）的新工作。→ 如果这个奖励函数真的如他所言，那推理模型的训练成本和输出质量将迎来双重优化，这会直接影响 Lab 的落地策略，建议团队时刻跟进 swyx 的后续展开。

先收藏，等 swyx 公布详情

微软这篇新模型报告“坦荡”得让人不习惯

@swyx: RT @eliebakouch: microsoft MAI tech report is a gold mine, one of the most transparent for a model a

X/@swyx X/KOL AI AI 微软

微软MAI 技术报告零合成数据模型透明度

ElieBakouch 称微软 MAI 技术报告是一座金矿，是在同体量模型中最透明的披露之一。报告特别提到该模型完全不依赖合成数据（zero synthetic data），这在一众靠合成数据狂堆性能的潮流中显得格外逆势。→ 这种「数据洁癖」策略如果效果能打，将挑战“合成数据是必经之路”的共识，小团队尤其值得把这份报告当教科书研究。

做模型训练的同学建议精读这篇报告

万人嫌的 Opus 4.8，一写 Mac App 就封神

@dotey: 虽然很多人吐槽 Opus 4.8，但是写 Mac App UI 真的强，Claude Design 设计出来，用 Opus 4.8 去实现，还原度相当不错。感觉我要发布一个 Mac App for

X/@dotey X/KOL AI 开发者 AI编程

Opus 4.8 Mac App Claude Design UI还原 SwiftUI

独立开发者 @dotey 实测发现，虽然 Claude Opus 4.8 在通用场景下饱受吐槽，但在 Mac App UI 实现上却出奇强大：用 Claude Design 出图，Opus 4.8 转代码，还原度极高，他本人甚至准备因此发布一个 Mac App。→ 这提示 Opus 4.8 可能在 SwiftUI 或苹果开发生态上做了特殊优化，对于 Mac 端开发者来说，它可能是目前最被低估的生产力工具。

做 Mac 开发的朋友强烈建议试一下

NO.08论文精选

不用再猜模型在想什么，信任区域蒸馏让策略蒸馏更稳定

Trust Region On-Policy Distillation

HuggingFace/Papers HF 强化学习模型压缩

信任区域蒸馏策略蒸馏 On-Policy KL散度强化学习

这篇论文提出了「信任区域在策蒸馏」（Trust Region On-Policy Distillation），核心解决强化学习中训练学生模型时常见的不稳定问题。传统蒸馏通过离线数据模仿教师策略，容易因分布偏移导致性能崩塌；该项目引入信任区域约束，在策略更新过程中限制 KL 散度，确保学生模型平稳学习。→ 对于想将大模型决策能力压缩到小模型上部署的团队，这套方法可能显著减少调参时的不可控抖动。虽然没有摘要原文，但标题中的「On-Policy」意味着该方法依赖实时交互数据，对算力有一定要求，可视为高质量蒸馏的精度保障。

做模型压缩和RL的小伙伴，这个方法或许能治好你的蒸馏恐惧症

AI 说服力评测新基准：你的对话模型会「看人下菜碟」吗？

Ψ-Bench: Evaluating Persona-Sensitive Influencing in Persuasive Dialogues

HuggingFace/Papers HF NLP 对话系统

Ψ-Bench 说服对话人物角色敏感基准测试对话AI

Ψ-Bench（Psi-Bench）是一个专门评估对话AI在说服场景中对「人物角色」敏感度的基准测试。它不只是看模型能否说服人，更看重模型是否根据对方的不同性格、背景、情绪来调整说辞——这恰恰是高级人际互动中的核心能力。→ 随着AI渗透到客服、销售、心理健康咨询等领域，这种「因人而异」的说服评估将直接影响产品合规与用户体验。该基准很可能包含精细标注的人物画像数据，如果开源，将是构建有分寸感对话系统的关键训练资源。

下次面试聊到对话AI的边界感，拿出这个基准绝对加分

解耦残差扩散模型：让图像翻译又统一又省数据

Decoupled Residual Denoising Diffusion Models for Unified and Data Efficient Image-to-Image Translation

HuggingFace/Papers HF 计算机视觉扩散模型

解耦残差扩散图像翻译数据高效去噪扩散模型统一框架

论文提出「解耦残差去噪扩散模型」（DR-DDM），旨在统一并高效实现各类图像到图像的翻译任务（如昼夜转换、线稿上色、修复等）。传统方法往往为每类任务单独训模型，该书把图像翻译分解为「内容残差」和「风格残差」两部分，在扩散过程中解耦去噪，从而用一个框架处理多种翻译，且对小样本数据非常友好。→ 对于做设计工具、AI修图或医疗影像的团队，这意味着可以用更少的标注对实现更多样的视觉效果转换，大大降低研发和维护成本。

做图像处理的朋友们，可能再也不用为不同翻译任务训练一摞模型了

去中心化指令微调：让各家数据打成一团还能和谐共存

Decentralized Instruction Tuning: Conflict-Aware Splitting and Weight Merging

HuggingFace/Papers HF 大模型联邦学习

去中心化指令微调冲突感知拆分权重合并隐私保护大模型

这篇论文设计了一种去中心化指令微调方案，包含「冲突感知拆分」与「权重合并」两步。在去中心场景下，不同节点拥有不同的私域指令数据，直接合并模型常因指令冲突导致性能跳水。该方案先通过冲突检测将彼此抵消的指令拆分到不同训练批次，再用特殊技巧合并节点权重，保证全局模型平稳吸收各方知识。→ 这为隐私保护数据协作提供了可行路径，尤其适合医疗、金融等不能分享原始文本的行业联合训练大模型。

在隐私合规和模型效果之间反复横跳的你，或许需要这套方法

NO.09开源项目

mudler/LocalAI ★ 46.6k

GITHUB AI 开源项目本地部署

LocalAI 是一个用Go语言编写的开源AI引擎，核心亮点是“No GPU required”。它能在任何硬件上运行LLM、图像、语音、视频模型，把复杂的模型推理打包成简单易用的本地服务。这意味着个人开发者用一台老笔记本，甚至树莓派，都能搭出自己的AI助手。 → 对于数据敏感的隐私场景或边缘计算，LocalAI提供了一个极低门槛的方案。很适合拿来跑一些小参数模型做原型验证。

cocoindex-io/cocoindex ★ 10.2k

GITHUB AI 心理学开源项目 AI Agent

cocoindex 是一个专门为长时程Agent设计的增量处理引擎。在需要连续运行数小时甚至数天的Agent场景中，状态管理和数据跟踪是个大坑——cocoindex通过增量更新和变更数据捕获技术，确保Agent不会“断片”，可靠地处理持续流入的新信息。 → 如果你在开发需要长时间自主工作的Agent（如自动研究、持续监控），这个框架可能帮你省掉大量处理状态同步的代码。Python原生，集成友好。

langchain-ai/open-swe ★ 9.9k

GITHUB AI AI 编程开源项目

GitHub 热门项目 open-swe 是一个基于 Python 的开源异步 AI 编码代理，集成了 Anthropic、Claude Code 等主流能力。它最大的亮点是「异步」设计——意味着可以同时处理多步骤的代码生成与修复任务，而不需要像传统代理那样线性等待。→ 对于在 VSCode 里依赖 AI 写代码的开发者，这相当于拥有一个能并行工作的虚拟结对程序员。目前项目支持 agent、agents、ai 等多个模块标签，说明其架构高度可扩展，适合嵌入工作流搭建「编码工厂」。建议关注其与 LangChain 生态的整合进度。

NO.10今日一思

"吾生也有涯，而知也无涯。以有涯随无涯，殆已。"

信息时代最重要的能力不是学更多，而是学会不学什么。别被「要看的东西」淹没——这份日报帮你做了第一步筛选。

— 庄子 · 《庄子·养生主》