让AI Agent拥有“永久记忆”,Token消耗还砍了35%——这个开源OS有点狠
MemTensor/MemOS
MemOS 是一个专为大模型和AI Agent设计的自进化记忆操作系统,最炸裂的数据是:在实际应用中能节省35.24%的Token消耗。它通过混合检索和跨任务技能复用,让Agent记住历史交互并迁移经验,真正实现“越用越聪明”。 传统的Agent做长链任务常会“失忆”,MemOS用持久化存储解决了这个痛点。→ 对正在构建复杂Agent应用的开发者来说,这意味着更低的API成本和更连贯的用户体验。TypeScript实现,前端集成会很顺手。
做Agent应用的朋友建议收藏,省钱又提效
Steam评分91%的神作,现在只卖一杯奶茶钱
LIMBO (-90%)LIMBO 新史低 -90%,入手价仅 $1.24。这款解谜神作在 Metacritic 上拿到 88 分,Steam 好评率高达 91%。作为 Playdead 工作室的成名作,黑白剪影画风和压抑氛围至今仍是独一档的存在,全程无文字叙事却把末世孤寂感拉满。 为什么现在值得补票?→ 续作《INSIDE》口碑依然炸裂,玩完原版能更好理解制作组的设计进化。另外这个价格基本是慈善级别了,有 Steam Deck 的可以直接当移动端神优化范例收藏。
恐怖游戏天花板打一折,胆小慎入
Alan Wake (-90%)Alan Wake 直接 -90% 到 $1.49,这是 Remedy 在《控制》之前的心理恐怖代表作。Steam 88% 好评,Metacritic 83 分。游戏把“手电筒驱暗”的机制玩到了极致,剧情悬念层叠,非常有斯蒂芬·金的味道。 → 随着《Alan Wake 2》口碑大爆,现在正是用一杯咖啡的钱补完前作剧情的最佳窗口。推荐直接买包含两个 DLC 的完整版,同样骨折。
Metro评分90的废土经典,比快餐还便宜
Metro 2033 Redux (-90%)Metro 2033 Redux 打骨折到 $1.99。原版就是 90 分的线性 FPS 教科书,Redux 版画质和潜行系统全面进化,Steam 88% 好评。莫斯科地铁下的压迫感、自制弹药当货币的生存设计,让这场废土之旅硬核到令人窒息。 → 如果玩完觉得对味,建议直接等《Metro Exodus》打折,三部曲一起拿下的成本大概不到一份外卖的钱。喜欢《辐射》但厌烦开放世界疲劳的玩家闭眼入。
Steam好评83%的点击冒险,价格跌到忽略不计
Goodbye Deponia (-90%)Goodbye Deponia -90% 后仅 $1.99。Metacritic 80 分,Steam 83% 好评。作为德式点击冒险喜剧三部曲的终章,手绘废土风极具辨识度,谜题逻辑天马行空,主角简直是“倒霉蛋界的堂吉诃德”。 → 虽然不如《Deponia》初代惊艳,但在这个价位,能让你打发 10 个小时并收获多次爆笑的叙事游戏几乎没有竞品。强烈推荐一次性买齐三部曲的捆绑包,连贯体验更佳。
Steam好评92%的历史叙事神作,打一折仅需两美元
Ken Follett's The Pillars of the Earth (-90%)Ken Follett's The Pillars of the Earth 新史低 $1.99。Metacritic 78 但 Steam 玩家好评高达 92%,说明目标受众的黏性极强。游戏忠实改编自肯·福莱特的同名小说,用了中世纪手绘卷轴的美术风格,配音和音乐是广播剧级别的水准。 → 如果你喜欢《权力的游戏》那种多线群像、权谋博弈,这款互动小说式的叙事杰作比很多 3A 更有沉浸感。缺点是节奏偏慢,但 $1.99 买一场长达 20 小时的中世纪传奇,性价比爆炸。
祈祷让感情更甜?科学实锤:这一招只对「真信」的人灵
Religious individuals who pray for their partners tend to report higher relationship satisfaction一项针对大学生情侣的新研究发现,向上帝祈求伴侣福祉能显著提升关系满意度。但别高兴太早——这种积极效应仅存在于定期参加宗教仪式、且将宗教视为生活核心的信徒身上。对「浅层信仰者」而言,祈祷效果几乎为零。 研究者指出,这可能是因为虔诚者的祈祷往往更投入、更发自内心,而非流于形式。同时,强大的宗教社群支持网络也起到了推波助澜的作用。→ 这项实验揭示了一个残酷真相:亲密关系中的「神助攻」,本质上是信仰一致性和社群归属感的红利,而非超自然力量的干预。如果你想试试看,先问问自己:这周末会去教堂吗?
31:42
SpaceX的上市文件S-1彻底打破了SEC文书的枯燥传统。开篇不放资产负债表,而是放了14页火箭与卫星的精美照片,让人瞬间想起WeWork那场灾难级的IPO。更离谱的是,管理层的「商业策略」中反复出现「将意识之光延伸到星辰」这类诗意口号,全文共出现10次。 风险提示部分更是刷新三观:投资人被警告「我们不想人类落得和恐龙一样的下场」。文件还勾勒出科幻般的业务版图——地球点对点火箭旅行、在轨制造、月球客运与货运……Patrick Boyle吐槽,这大概是有史以来最不像法律文件的招股书。→ 虽然够酷够反叛,但别忘了当年WeWork也是靠花哨包装吸引眼球,最终一地鸡毛。SpaceX的终极浪漫能否让投资人买账,还得看火星计划到底烧不烧得起这个钱。
20:41
迪拜三十年来精心打造的商业天堂形象正遭遇致命危机。3月1日凌晨,伊朗的空中打击命中了迪拜国际机场、豪华酒店、亚马逊数据中心乃至军事基地,打破了「中东安全绿洲」的叙事。 过去,迪拜通过零税收、快速居留权和顶级奢华配套,吸引全球富豪们选择性忽视宗教保守、人权问题与区域动荡。但如今的导弹残骸证明:没有谁能在地缘火药桶里永远独善其身。阿联酋声称已拦截上千次攻击,却未公布实际落地数量。→ 对全球投资者而言,迪拜资产的无风险溢价正在迅速蒸发。地缘政治的脏水,终究溅进了镀金的游泳池。别再迷恋所谓的「安全区」,地图上的冲突红线比税收优惠单更值得关注。
1:00:01
写过编剧圣经《故事解剖》的John Truby带来了新作《类型的解剖》,并与「Lessons from the Screenplay」频道展开了一场烧脑对话。主持人Michael还意外透露自己正为BioWare开发《质量效应》新作,这简直是游戏编剧界的梦幻联动。 Truby在播客中痛惜「人们压根不怎么谈论类型」,并深入拆解类型如何塑造世界观、驱动情节。如果你曾用《故事解剖》解构过自己的剧本,这本新书会帮你从类型根源上找到创作蓝图。→ 不管是写科幻、恐怖还是爱情,Truby的体系都能让你摆脱套路,写出真正有深度的类型故事。编剧和叙事工作者们,准备好接住这波知识冲击。
1:07
Michael在「Lessons from the Screenplay」的更新中透露了旗下频道的猛料。「Beyond the Screenplay」播客已经可视化,你可以在YouTube上看他们激情评析《沙丘》。而游戏叙事频道「Story Mode」更是玩出了新花样——邀请了BioWare开发者一起直播玩《质量效应2》经典结局关卡,边操作边讲解设计挑战与叙事技巧。 也就是说,你能一边重温薛帕德的最终抉择,一边听到关卡设计师亲自揭秘幕后。还等什么?快去「Story Mode」和「Beyond the Screenplay」看看,绝对让你的创作者肾上腺素飙升。
7:24
为什么同一场戏,有的导演拍得行云流水,有的却像在凑镜头?这期《每一帧都是一幅画》或许给出了最精炼的答案:在你决定把摄像机放哪儿之前,先想清楚「这场戏到底在讲什么」。 托尼·周借史蒂文·索德伯格的一段幕后花絮点破本质——一个看似平淡的「角色发现找不到卡片」场景,索德伯格纠结了一个多小时,最后顿悟:「这场戏的重点就是车上有一个人」。想通这一点,机位设计瞬间明朗。 → 这个洞察直接颠覆了「多机位=高质感」的迷信。创作者真正的功夫不在运镜技巧,而在于从琐碎信息中提炼出那个「唯一需要被看见的东西」。如果你正在被分镜表折磨,这条建议可能是今年最能帮你省时间的创作心法。
YC掌门人点赞:好的公司不该只围着股东转
@garrytan: Thank you @ericries for saying what needs to be said and pointing the way to longer term companies fY Combinator CEO Garry Tan 转发精益创业之父 Eric Ries 的观点,强调应该出现更多长期导向、以真实使命为驱动的公司,而不是一味追求股东利益最大化。这并非空谈——在风投圈开始公开讨论「去股东化」相当罕见。→ 信号意义大于具体操作,可能预示着新一代硅谷创始人在治理结构上会有更多实验,值得早期创业者关注。
正在融资的创始人可以看看这条
开局两块B200,一位神秘大佬正悄悄重注AI
@garrytan: RT @Suhail: 1/ it all started w 2 8xB200s excited to be back in the game again知名连续创业者 Suhail(Playground 创始人)发推宣告,他带着两台 8xB200 服务器重返 AI 战场。B200 是英伟达最新旗舰 GPU,成本不菲,直接跳过 H100 上顶配,说明其新项目训练强度不小。→ Suhail 此前项目多以消费品为主,这次大张旗鼓入局 GPU 重型任务,很可能是一部从零训练的大模型,或者某种需要极致算力的新应用,值得留意后续进度。
关注 Suhail 的朋友别错过这条暗示
“最好”的奖励函数出现,推理模型可能又要变天
@swyx: probably the best reward function for reasoning efficiency i've seen知名 AI 评论人 swyx 罕见给出最高评价,称遇到一个「大概是至今最好的」用于推理效率的奖励函数。虽然推文没点名出处,但结合上下文,大概率是某篇探讨如何更高效训练模型进行长链推理(类似 o1 架构)的新工作。→ 如果这个奖励函数真的如他所言,那推理模型的训练成本和输出质量将迎来双重优化,这会直接影响 Lab 的落地策略,建议团队时刻跟进 swyx 的后续展开。
先收藏,等 swyx 公布详情
微软这篇新模型报告“坦荡”得让人不习惯
@swyx: RT @eliebakouch: microsoft MAI tech report is a gold mine, one of the most transparent for a model aElieBakouch 称微软 MAI 技术报告是一座金矿,是在同体量模型中最透明的披露之一。报告特别提到该模型完全不依赖合成数据(zero synthetic data),这在一众靠合成数据狂堆性能的潮流中显得格外逆势。→ 这种「数据洁癖」策略如果效果能打,将挑战“合成数据是必经之路”的共识,小团队尤其值得把这份报告当教科书研究。
做模型训练的同学建议精读这篇报告
万人嫌的 Opus 4.8,一写 Mac App 就封神
@dotey: 虽然很多人吐槽 Opus 4.8,但是写 Mac App UI 真的强,Claude Design 设计出来,用 Opus 4.8 去实现,还原度相当不错。 感觉我要发布一个 Mac App for独立开发者 @dotey 实测发现,虽然 Claude Opus 4.8 在通用场景下饱受吐槽,但在 Mac App UI 实现上却出奇强大:用 Claude Design 出图,Opus 4.8 转代码,还原度极高,他本人甚至准备因此发布一个 Mac App。→ 这提示 Opus 4.8 可能在 SwiftUI 或苹果开发生态上做了特殊优化,对于 Mac 端开发者来说,它可能是目前最被低估的生产力工具。
做 Mac 开发的朋友强烈建议试一下
不用再猜模型在想什么,信任区域蒸馏让策略蒸馏更稳定
Trust Region On-Policy Distillation这篇论文提出了「信任区域在策蒸馏」(Trust Region On-Policy Distillation),核心解决强化学习中训练学生模型时常见的不稳定问题。 传统蒸馏通过离线数据模仿教师策略,容易因分布偏移导致性能崩塌;该项目引入信任区域约束,在策略更新过程中限制 KL 散度,确保学生模型平稳学习。→ 对于想将大模型决策能力压缩到小模型上部署的团队,这套方法可能显著减少调参时的不可控抖动。虽然没有摘要原文,但标题中的「On-Policy」意味着该方法依赖实时交互数据,对算力有一定要求,可视为高质量蒸馏的精度保障。
做模型压缩和RL的小伙伴,这个方法或许能治好你的蒸馏恐惧症
AI 说服力评测新基准:你的对话模型会「看人下菜碟」吗?
Ψ-Bench: Evaluating Persona-Sensitive Influencing in Persuasive DialoguesΨ-Bench(Psi-Bench)是一个专门评估对话AI在说服场景中对「人物角色」敏感度的基准测试。 它不只是看模型能否说服人,更看重模型是否根据对方的不同性格、背景、情绪来调整说辞——这恰恰是高级人际互动中的核心能力。→ 随着AI渗透到客服、销售、心理健康咨询等领域,这种「因人而异」的说服评估将直接影响产品合规与用户体验。该基准很可能包含精细标注的人物画像数据,如果开源,将是构建有分寸感对话系统的关键训练资源。
下次面试聊到对话AI的边界感,拿出这个基准绝对加分
解耦残差扩散模型:让图像翻译又统一又省数据
Decoupled Residual Denoising Diffusion Models for Unified and Data Efficient Image-to-Image Translation论文提出「解耦残差去噪扩散模型」(DR-DDM),旨在统一并高效实现各类图像到图像的翻译任务(如昼夜转换、线稿上色、修复等)。 传统方法往往为每类任务单独训模型,该书把图像翻译分解为「内容残差」和「风格残差」两部分,在扩散过程中解耦去噪,从而用一个框架处理多种翻译,且对小样本数据非常友好。→ 对于做设计工具、AI修图或医疗影像的团队,这意味着可以用更少的标注对实现更多样的视觉效果转换,大大降低研发和维护成本。
做图像处理的朋友们,可能再也不用为不同翻译任务训练一摞模型了
去中心化指令微调:让各家数据打成一团还能和谐共存
Decentralized Instruction Tuning: Conflict-Aware Splitting and Weight Merging这篇论文设计了一种去中心化指令微调方案,包含「冲突感知拆分」与「权重合并」两步。 在去中心场景下,不同节点拥有不同的私域指令数据,直接合并模型常因指令冲突导致性能跳水。该方案先通过冲突检测将彼此抵消的指令拆分到不同训练批次,再用特殊技巧合并节点权重,保证全局模型平稳吸收各方知识。→ 这为隐私保护数据协作提供了可行路径,尤其适合医疗、金融等不能分享原始文本的行业联合训练大模型。
在隐私合规和模型效果之间反复横跳的你,或许需要这套方法
LocalAI 是一个用Go语言编写的开源AI引擎,核心亮点是“No GPU required”。它能在任何硬件上运行LLM、图像、语音、视频模型,把复杂的模型推理打包成简单易用的本地服务。这意味着个人开发者用一台老笔记本,甚至树莓派,都能搭出自己的AI助手。 → 对于数据敏感的隐私场景或边缘计算,LocalAI提供了一个极低门槛的方案。很适合拿来跑一些小参数模型做原型验证。
cocoindex 是一个专门为长时程Agent设计的增量处理引擎。在需要连续运行数小时甚至数天的Agent场景中,状态管理和数据跟踪是个大坑——cocoindex通过增量更新和变更数据捕获技术,确保Agent不会“断片”,可靠地处理持续流入的新信息。 → 如果你在开发需要长时间自主工作的Agent(如自动研究、持续监控),这个框架可能帮你省掉大量处理状态同步的代码。Python原生,集成友好。
GitHub 热门项目 open-swe 是一个基于 Python 的开源异步 AI 编码代理,集成了 Anthropic、Claude Code 等主流能力。 它最大的亮点是「异步」设计——意味着可以同时处理多步骤的代码生成与修复任务,而不需要像传统代理那样线性等待。→ 对于在 VSCode 里依赖 AI 写代码的开发者,这相当于拥有一个能并行工作的虚拟结对程序员。目前项目支持 agent、agents、ai 等多个模块标签,说明其架构高度可扩展,适合嵌入工作流搭建「编码工厂」。建议关注其与 LangChain 生态的整合进度。