Horizon Summary: 2026-02-24 (ZH)

From 40 items, 18 important content pieces were selected

DeepMind 旗下 Isomorphic 发布 IsoDDE 模型，药物发现性能比肩 AlphaFold 4 但拒绝开源。 ⭐️ 9.0/10
SGLang v0.5.9 发布，带来大语言模型推理的重大性能优化 ⭐️ 8.0/10
工程师利用 AI 编码代理为不支持的 MacBook 构建 FreeBSD Wi-Fi 驱动 ⭐️ 8.0/10
年龄验证要求正在制造系统性隐私风险与监控基础设施。 ⭐️ 8.0/10
Ladybird 浏览器引擎通过 AI 辅助翻译并严格验证输出，正式采用 Rust 语言 ⭐️ 8.0/10
AI 代码生成使编写代码变得廉价，迫使软件工程重新思考 ⭐️ 8.0/10
Anthropic 指控中国 AI 公司进行工业级模型蒸馏攻击。 ⭐️ 8.0/10
开源框架利用模型脚手架，使本地模型达到顶级 AI 性能水平。 ⭐️ 8.0/10
荣耀拟于 MWC 发布首款人形服务机器人，瞄准消费者辅助领域 ⭐️ 8.0/10
月之暗面估值突破 100 亿美元，Kimi 近 20 天收入超 2025 年全年总额 ⭐️ 8.0/10
软银与 OpenAI 5000 亿美元 Stargate AI 基建项目进展缓慢 ⭐️ 8.0/10
《自然·神经科学》研究揭示怀孕重塑大脑，为分娩和养育子女做好准备 ⭐️ 8.0/10
Anthropic 披露多家中国 AI 实验室对 Claude 发起大规模蒸馏攻击 ⭐️ 8.0/10
Simon Willison 启动“智能体工程模式”项目，旨在记录 AI 编程智能体的最佳实践 ⭐️ 7.0/10
将红/绿测试驱动开发应用于 AI 编码代理可提升代码质量 ⭐️ 7.0/10
PostgreSQL 贡献者分享 30 年吸引开源新贡献者的经验教训。 ⭐️ 7.0/10
AI 公司因批评模型蒸馏技术被指虚伪 ⭐️ 7.0/10
英特尔组建’统一核心’团队研发新架构，或于 2028 年起取代混合核心设计。 ⭐️ 7.0/10

DeepMind 旗下 Isomorphic 发布 IsoDDE 模型，药物发现性能比肩 AlphaFold 4 但拒绝开源。 ⭐️ 9.0/10

DeepMind 旗下的 Isomorphic Labs 发布了名为 IsoDDE 的新一代药物研发 AI 模型。该模型在预测蛋白质与药物分子结合亲和力及抗体结构方面的表现被认为达到了 AlphaFold 4 的水平，但与此前开源的 AlphaFold 系列不同，Isomorphic Labs 选择将其作为专有技术，并未公开具体实现细节。这标志着 AI 驱动药物发现领域的一项重大进展，通过精准预测分子与生物靶点的相互作用，有望加速新候选药物的发现。然而，将其作为专有技术的决定，标志着与 AlphaFold 的开源科学方法发生了显著转变，可能会限制学术界对这一强大工具的广泛访问，从而引发关于商业创新与科学合作之间平衡的讨论。据报道，该模型在处理与训练数据差异巨大的分子时仍能保持精度，显示出较强的泛化能力。目前其技术信息仅限于一份 27 页的技术报告，其内部架构和完整实现细节并未向公众公开。

telegram · zaihuapd · Feb 23, 14:00

背景: AlphaFold 是由 DeepMind 开发的一款革命性 AI 系统，能够根据氨基酸序列精确预测蛋白质的三维结构，这一突破性成果获得了诺贝尔奖，并被开源以加速科学研究。预测小分子药物（配体）如何与蛋白质靶点结合及其结合亲和力，是计算药物发现中一个关键但不同的挑战，通常需要与单纯的蛋白质结构预测不同的方法。Isomorphic Labs 是从 DeepMind 分拆出来的一家独立公司，专门致力于将 AI 应用于药物发现。

标签: #AI-drug-discovery, #protein-prediction, #DeepMind, #proprietary-AI, #structural-biology

SGLang v0.5.9 发布，带来大语言模型推理的重大性能优化 ⭐️ 8.0/10

SGLang v0.5.9 引入了多项关键性能优化，包括将 LoRA 权重加载与计算重叠以减少首字延迟约 78%，集成 TRT-LLM 原生稀疏注意力内核使 DeepSeek V3.2 性能提升 3-5 倍，并为多模态编码器添加了 FP4 注意力后端。它还新增了对 Anthropic API 的原生兼容性，以及一个用于专家混合模型的高效 Flashinfer all-to-all 调度器。这些优化显著降低了在生产环境中部署大语言模型的成本和延迟，使得高效的 LoRA 切换、高性能稀疏注意力以及低精度多模态推理等先进功能更易实现。这些改进对于扩展实时 AI 应用、跟上最新且日益复杂的模型架构（如专家混合模型和长上下文模型）至关重要。 LoRA 权重加载重叠技术为首字延迟带来了约 78% 的降低，并为大型适配器带来了约 34.88% 的每输出令牌时间降低。针对 DeepSeek V3.2 的 TRT-LLM NSA 内核集成在 NVIDIA Blackwell 平台上实现了 3-5 倍的加速，但可能伴随轻微的精度损失。此版本还新增了对 Kimi-K2.5、GLM-5 和 Qwen 3.5 等众多新模型的支持。

github · Kangyan-Zhou · Feb 24, 01:14

背景: SGLang 是一个专为高效部署和执行大语言模型而设计的框架。LoRA 是一种参数高效的微调方法，它向基础模型添加小型、可训练的适配器权重，从而无需完全重新训练即可实现模型定制。原生稀疏注意力是一种注意力机制，通过仅计算相关令牌的子集来提高长序列的处理效率。专家混合模型使用路由机制，动态地将令牌发送到专门的子网络以高效地增加模型容量。

标签: #llm-inference, #performance-optimization, #tensorrt-llm, #model-serving, #quantization

工程师利用 AI 编码代理为不支持的 MacBook 构建 FreeBSD Wi-Fi 驱动 ⭐️ 8.0/10

一位工程师成功利用 AI 编码代理，为一台老旧且不支持的 MacBook 创建了一个可工作的 FreeBSD Wi-Fi 驱动（brcmfmac）。该过程涉及 AI 代理分析现有代码、生成规范说明并编写必要的驱动代码。这展示了 LLM 和 AI 代理在底层系统编程（特别是硬件驱动开发）中的一种新颖且实用的应用。它表明 AI 可以显著降低为小众或遗留系统提供硬件支持的门槛，有望解决长期存在的兼容性问题。工程师采用了一种规划技术，在编写代码之前，先让 AI 生成一份关于 brcmfmac 驱动工作原理的详细规范说明（使用 Markdown 格式）。这种方法凸显了在系统编程的复杂 LLM 任务中进行结构化规划的重要性。

hackernews · varankinv · Feb 23, 21:44

背景: FreeBSD 是一个开源的类 Unix 操作系统。硬件驱动程序（如 Wi-Fi 驱动）是允许操作系统与特定硬件通信的软件组件。为不支持的硬件开发驱动传统上是一项复杂的底层编程任务，需要对硬件和操作系统内核都有深入的了解。AI 编码代理是利用大型语言模型（LLM）来协助或自动化编码任务的工具。

社区讨论: 讨论凸显了人们对 AI 自动化复杂系统任务潜力的兴奋，用户分享了类似的成功案例，例如为旧版 macOS 修补 QEMU。一个关键观点是，由于 AI 代理可以“暴力破解”驱动开发，AI 可能很快使普遍的硬件支持成为一个“已解决的问题”。一些人认为，与原生驱动支持相比，替代解决方案（如使用虚拟机管理 Wi-Fi）显得笨拙。

标签: #AI-assisted-programming, #systems-programming, #FreeBSD, #hardware-drivers, #LLM-applications

年龄验证要求正在制造系统性隐私风险与监控基础设施。 ⭐️ 8.0/10

IEEE Spectrum 的一篇文章分析指出，诸如英国《2023 年在线安全法案》等强制要求在线年龄验证的法律，正迫使平台实施侵入性的验证系统。这些系统常常与数据隐私法相冲突，形成了一个“陷阱”：执行年龄限制反而会损害所有用户的数据保护。这很重要，因为年龄验证要求正在全球范围内变得越来越普遍，可能使企业和政府收集敏感身份数据的行为常态化。为年龄检查而建立的基础设施，可以被重新用于更广泛的监控，从而侵蚀隐私权，并制造数据泄露的集中化风险点。文章强调了一个直接冲突：严格执行年龄规则通常需要采取违反数据最小化等现代隐私原则的数据收集做法。此外，诸如零知识证明这样的技术解决方案（可以验证“超过 18 岁”等属性而不透露确切出生日期）是存在的，但并未被广泛强制要求或实施。

hackernews · oldnetguy · Feb 23, 14:22

背景: 年龄验证是指确认用户年龄的过程，通常法律要求对访问色情内容或社交媒体等年龄敏感内容进行限制。数据保护法，如欧洲的 GDPR，确立了“数据最小化”等原则，将数据收集限制在严格必要的范围内。当年龄验证法律要求收集个人身份证明文件，从而创建与这些隐私原则相冲突的数据库时，紧张关系就产生了。

社区讨论: 社区评论揭示了多样化的技术和政策观点。一些人主张家长责任应优先于系统性验证，另一些人则指出了诸如账户共享等实际执行挑战。基于零知识证明的身份钱包和设备级家长控制等技术解决方案被提议为保护隐私的替代方案。一个反复出现的主题是，人们怀疑当前的立法方法制造的监控风险，比其在儿童保护方面解决的问题更多。

标签: #privacy, #age-verification, #data-protection, #surveillance, #regulation

Ladybird 浏览器引擎通过 AI 辅助翻译并严格验证输出，正式采用 Rust 语言 ⭐️ 8.0/10

Ladybird 浏览器引擎开发团队宣布，他们正在将引擎的代码库从 C++迁移到 Rust，并使用了 Claude Code 和 Codex 等 AI 辅助翻译工具。此次迁移的一个核心要求是，翻译后的 Rust 代码必须产生与原始 C++代码字节级完全相同的输出，这使得可以并行执行新旧代码并进行差异比较，从而立即发现翻译错误。此次迁移意义重大，因为它代表了一个主要的浏览器引擎为了内存安全和并发优势而采用 Rust，这可能会影响其他系统软件项目。将 AI 辅助翻译与严格的字节级等效性要求相结合的新颖方法，为浏览器引擎这类复杂、对性能要求苛刻的软件进行大规模、低风险的编程语言迁移树立了新的先例。翻译过程是人为引导的，涉及数百个小型提示来引导 AI 代理，随后使用不同模型进行多轮对抗性审查，以分析代码中的错误和不良模式。Ladybird 是一个真正独立的、非营利性的、从头构建（而非分叉）的浏览器引擎，目前处于预发布阶段，仅适用于开发和测试。

hackernews · adius · Feb 23, 11:29

背景: Ladybird 是一个正在从头开发的新兴、独立的网络浏览器及其引擎（LibWeb），它与 SerenityOS 项目是分离的。Rust 是一种专注于性能、可靠性和内存安全的系统编程语言，无需垃圾回收，这使其对浏览器引擎等基础软件具有吸引力。字节级完全相同输出是一种验证技术，要求新系统的输出必须在二进制层面与旧系统的输出完全一致，这在迁移过程中可作为强有力的正确性保证。

社区讨论: 社区讨论高度认可字节级完全相同输出这一要求，认为这是避免在翻译过程中引入错误的明智策略。同时，讨论也涉及项目的领导力及其过去的语言转向（从 Jakt 到 Swift 再到 Rust），部分人视其为战略性的创业行为。此外，社区对该团队先前“反对 Rust”的立场以及这一转变将如何影响贡献者群体感到好奇并持有一定的怀疑态度。

标签: #rust, #browser-engineering, #code-migration, #ai-programming, #systems-programming

AI 代码生成使编写代码变得廉价，迫使软件工程重新思考 ⭐️ 8.0/10

Simon Willison 认为，AI 驱动的编码智能体已大幅降低了生成代码的成本，挑战了数十年来塑造软件工程实践的基本假设，即’代码是昂贵的’。这一转变要求开发新的个人和组织习惯，以适应智能体工程，在这种模式下，一名工程师可以同时管理多个并行智能体进行实现、重构、测试和文档编写。这代表了软件开发领域一次根本性的经济转变，迫使人们重新评估围绕昂贵的人力编码时间建立的传统规划、估算和微观决策流程。它影响了产品功能如何被评估、开发时间如何分配，并可能显著加速整个行业的软件交付周期。虽然生成代码现在变得廉价，但生产’优质代码’——定义为可工作、经过测试、有文档、可维护且安全的代码——仍然成本高昂，并且需要大量的人工监督。作者强调，行业仍在探索这种智能体工程范式下的新最佳实践。

rss · Simon Willison · Feb 23, 16:20

背景: 传统的软件工程长期以来一直在一个约束下运作：编写代码是一项耗时且昂贵的活动，需要在宏观（项目）和微观（日常编码）层面进行仔细的规划和权衡决策。’智能体工程’指的是使用 AI 智能体（通常由大语言模型驱动）来自动化或协助编码任务的开发实践。大语言模型是在海量文本数据上训练的深度学习模型，能够理解和生成类人语言，其中也包括代码。

标签: #AI-assisted-development, #software-engineering, #agentic-engineering, #development-economics, #LLM-code-generation

Anthropic 指控中国 AI 公司进行工业级模型蒸馏攻击。 ⭐️ 8.0/10

Anthropic 公开指控三家中国领先的 AI 开发商——深度求索（DeepSeek）、月之暗面（Moonshot AI，Kimi 的创造者）和 MiniMax——对其 Claude 模型进行了“工业级蒸馏攻击”。该公司指控这些公司使用超过 24,000 个虚假账户，与 Claude 进行了超过 1600 万次交互，系统地提取其能力以改进它们自己的竞争模型。这一指控凸显了 AI 行业在大型语言模型知识产权保护方面一个关键且不断升级的冲突，其中合法 API 使用与非法模型提取之间的界限存在激烈争议。它引发了关于模型训练伦理、前沿 AI 商业模式可持续性的根本性问题，并可能引发更严格的 API 控制，甚至围绕 AI 开发的地缘政治紧张局势。 Anthropic 将“蒸馏攻击”定义为具有大规模、集中的查询量、高度重复的结构以及针对 AI 模型最有价值训练数据的内容等模式。该公司表示正在积极投资防御措施，以使此类攻击更难执行、更易检测，但强调需要行业更广泛或协作性的回应来解决此问题。

reddit · r/LocalLLaMA · KvAk_AKPlaysYT · Feb 23, 18:32

背景: 模型蒸馏或模型提取是一种技术，通过查询“教师”模型的 API，训练一个较弱的“学生”模型来模仿更强大的“教师”模型的输出。虽然知识蒸馏是模型压缩领域一个合法的研究方向，但当未经许可大规模用于复制专有模型时，就会引发争议，可能构成知识产权盗窃。Anthropic 和谷歌等公司最近报告称，从其服务中进行大规模模型提取的尝试有所增加。

社区讨论: 社区讨论主要集中在对 Anthropic 的批评上，许多评论者指出了其 perceived hypocrisy，因为大型 AI 公司自身也使用从网络抓取的大量受版权保护的数据训练模型。关键观点包括：对“蒸馏攻击”一词的怀疑，认为中国公司只是使用 API 的付费客户，以及认为这代表了“诗意的正义”或竞争。在所见的评论中，几乎没有人同情 Anthropic 的立场。

标签: #AI Ethics, #Model Distillation, #AI Industry, #Copyright, #LLM Training

开源框架利用模型脚手架，使本地模型达到顶级 AI 性能水平。 ⭐️ 8.0/10

一位开发者发布了一个名为“迭代上下文优化”的开源框架，该框架使用一种称为“模型脚手架”的技术，将专门用于不同推理步骤的本地模型串联起来。这种方法在特定基准测试中，已展现出与 Gemini 3 Deep Think 和 GPT-5.2 Pro 等顶级专有模型相当的性能。这很重要，因为它为开发者和研究人员提供了一条实用的开源路径，无需依赖昂贵的大型专有模型 API 调用，即可实现最先进的推理能力。它使获取高级 AI 性能的过程民主化，有望为需要复杂推理的应用降低成本，并提高隐私性和控制力。该框架采用迭代优化的方法，让模型在多步骤中协作并基于彼此的输出进行构建。讨论中提到的一个关键挑战是“上下文腐化”，即携带过多的中间文本会降低性能，建议的缓解方法是在每次迭代后仅提取并保留最独特的局部解决方案。

reddit · r/LocalLLaMA · Ryoiki-Tokuiten · Feb 23, 08:33

背景: LLM 脚手架是一种技术，它将多个 AI 模型或专用智能体串联起来，每个模型负责处理更大推理过程中的特定子任务，类似于建筑脚手架支撑施工。迭代优化是一个对初始解决方案进行反复分析和改进的过程。本地模型是指在用户自己的硬件上运行的 AI 模型，与基于云的 API 相对。

社区讨论: 社区表现出浓厚的技术兴趣，有用户正在 M2 Mac 等不同硬件上测试该框架，并寻求与 llama.cpp 等工具更好的集成。讨论内容包括实用的实施见解，例如对抗“上下文腐化”的策略，以及与其他方法（如自我审查提示或进化算法）的比较。社区也对与单纯使用单个强大模型相比的成本效益权衡感到好奇。

标签: #llm-scaffolding, #iterative-refinement, #open-source-framework, #model-optimization, #reasoning-systems

荣耀拟于 MWC 发布首款人形服务机器人，瞄准消费者辅助领域 ⭐️ 8.0/10

荣耀宣布将于本周末在巴塞罗那世界移动通信大会（MWC）上发布其首款人形机器人。该机器人主要面向购物辅助等消费者服务领域，标志着荣耀作为智能手机制造商正式进入机器人赛道，这是其数十亿美元 AI 扩展计划的一部分。此举标志着一家领先的智能手机制造商向竞争激烈的人形机器人市场进行了重大战略扩张，并专门瞄准了消费者服务领域。这反映了一个更广泛的行业趋势，即科技公司正大力投资 AI 和机器人技术，以在其核心硬件业务之外创造新的增长途径。此次发布是荣耀数十亿美元计划的一部分，该计划旨在拓展 AI 及新应用，并构建’智能体 AI’服务。选择在全球移动和连接创新的主要舞台 MWC 上首次亮相，突显了此次发布对公司的战略重要性。

telegram · zaihuapd · Feb 23, 11:30

背景: 世界移动通信大会（MWC）是全球移动和连接行业规模最大、最具影响力的活动之一，公司常在此发布重要的新产品和战略。人形服务机器人旨在在人类环境中执行任务，在视觉引导运动、手眼协调和自主操作等领域面临重大技术挑战。’智能体 AI’指的是能够通过采取一系列行动自主追求复杂目标的 AI 系统，超越了传统的反应式或特定任务 AI 模型。

标签: #robotics, #artificial-intelligence, #consumer-technology, #MWC, #tech-announcement

月之暗面估值突破 100 亿美元，Kimi 近 20 天收入超 2025 年全年总额 ⭐️ 8.0/10

2 月 23 日，大模型初创公司月之暗面完成新一轮超 7 亿美元融资，由阿里、腾讯等联合领投，累计融资额超 12 亿美元，公司估值突破 100 亿美元，创下国内企业最快晋级“十角兽”纪录。其 Kimi 模型近 20 天累计收入已超过 2025 年全年总额，且海外收入已超过国内，主要受全球付费用户及 API 调用量增长驱动。这一里程碑事件表明中国 AI 初创企业获得了强劲的市场认可，也预示着全球大模型领域，特别是在长上下文和开源权重模型方面的竞争日趋激烈。收入在短期内爆发式增长显示出巨大的商业吸引力，意味着 Kimi 正在全球开发者和企业中获得显著采用。月之暗面于 2026 年 1 月发布的 Kimi K2.5 模型是一个拥有 1 万亿参数的开源多模态模型，目前在 OpenRouter API 平台上的调用量保持领先。公司估值突破 100 亿美元，刷新了国内企业晋级“十角兽”的最快速度。

telegram · zaihuapd · Feb 23, 12:26

背景: 月之暗面是一家开发 Kimi 系列大模型的中国公司，其模型以支持超长上下文（最初达 12.8 万 tokens）而闻名。Kimi K2.5 是其最新的开源权重多模态模型，能够理解和生成文本、代码及视觉内容。OpenRouter 是一个统一的 API 平台，为开发者提供标准化接口，可访问来自不同提供商的数百个大模型，简化了集成过程并提供了价格透明度。

标签: #AI, #Startups, #Funding, #LLM, #China-Tech

软银与 OpenAI 5000 亿美元 Stargate AI 基建项目进展缓慢 ⭐️ 8.0/10

软银与 OpenAI 今年初联合宣布的 5000 亿美元 Stargate AI 基础设施项目至今未能完成任何数据中心交易，双方在选址等关键合作条款上存在分歧。目前仅计划于年底前在俄亥俄州建设一个小型数据中心，远低于最初承诺的 1000 亿美元“立即投资”目标。这一进展缓慢凸显了执行超大规模 AI 基础设施项目所面临的巨大现实挑战，即使有强大的资金和技术支持。这也标志着一个战略转变，因为 OpenAI 已同时与 Oracle 达成了一项每年价值超过 300 亿美元的独立数据中心协议，这可能降低了其对 Stargate 项目的即时依赖。尽管 Stargate 项目进展缓慢，但 OpenAI 与 Oracle 达成的独立协议提供的数据中心容量已接近 Stargate 年初承诺的规模。缩减后的俄亥俄州计划相比最初愿景大幅削减，而原计划涉及微软、英伟达等多个主要科技公司的参与。

telegram · zaihuapd · Feb 23, 13:15

背景: Stargate 项目是 2025 年 1 月宣布的一项 5000 亿美元倡议，旨在四年内建设新的 AI 基础设施以支持 OpenAI 的发展，包括训练未来的 GPT-6 等模型。AI 基础设施，尤其是数据中心，对于训练和运行大语言模型至关重要，需要在算力（如 GPU）、能源和房地产方面进行大规模投资。各大科技公司正竞相确保支持 AI 热潮的算力容量。

标签: #AI Infrastructure, #OpenAI, #Data Centers, #Business Strategy, #Cloud Computing

《自然·神经科学》研究揭示怀孕重塑大脑，为分娩和养育子女做好准备 ⭐️ 8.0/10

发表在《自然·神经科学》上的一项纵向案例研究追踪了一名参与者，在 26 个时间点（孕前 4 次、孕期 15 次、产后头两年 7 次）进行了磁共振成像扫描，发现整个大脑发生了广泛的解剖结构变化。这些变化可能反映了为分娩和照顾孩子做准备而进行的神经连接精细化调整。这项研究将怀孕确立为成年期一个独特的发展阶段，推动了新兴的’母性大脑可塑性’神经科学领域。理解这些变化有助于为孕产妇心理健康提供支持依据，并通过将其重新定义为一种适应性的神经过程，来挑战关于’孕傻’的刻板印象。该研究采用了密集的纵向设计，对单个参与者的脑部变化进行了前所未有的高时间分辨率追踪，绘制了大脑随时间变化的详细图谱。作为一项案例研究，其基于单一个体的发现需要在更大、更多样化的群体中进行重复验证，以确认其普遍性。

telegram · zaihuapd · Feb 23, 16:00

背景: 母性大脑可塑性指的是女性大脑在孕期和产后发生的结构和功能变化。这些适应性改变被认为是为了满足母亲角色的认知和情感需求，例如增强的同理心和对婴儿信号的响应能力。像磁共振成像这样的神经影像技术使科学家能够在活体中观察这些解剖结构的变化。’孕傻’或与怀孕相关的认知变化一直是坊间传闻，但关于其背后大脑重构的科学证据是近些年才兴起的研究领域。

标签: #neuroscience, #pregnancy, #brain-plasticity, #developmental-biology, #neuroimaging

Anthropic 披露多家中国 AI 实验室对 Claude 发起大规模蒸馏攻击 ⭐️ 8.0/10

Anthropic 近日发布报告，详细披露中国 AI 实验室 DeepSeek、月之暗面（Moonshot AI）及 MiniMax 对其 Claude 模型发起了系统性的蒸馏攻击。这些实验室创建了超过 24,000 个虚假账号，并与 Claude 进行了超过 1,600 万次对话交互，旨在提取其能力以训练和提升他们自己的模型。这一事件凸显了商业 AI 领域知识产权与安全面临的新兴重大威胁，即专有模型成为能力提取的目标。它揭示了 AI 竞争中的地缘政治维度，并对数字领域出口管制和安全法规的可执行性提出了紧迫问题。 Anthropic 通过识别大规模、集中的交互量、高度重复的查询结构以及专注于提取高价值训练数据的内容等模式，发现了这些攻击。该公司正在通过投资行为指纹识别等防御技术来应对，以使此类攻击更难执行、更易被发现。

telegram · zaihuapd · Feb 24, 01:48

背景: 模型蒸馏或提取是一种攻击技术，攻击者与目标 AI 模型（如 Claude）进行大量交互，以生成其输入和输出的数据集。该数据集随后被用于训练一个新的（通常更小的）模型，以模仿原始模型的能力，从而可能规避昂贵、专有的训练需求。此类攻击被视为 AI 领域的一种知识产权盗窃形式。行为指纹识别是一种安全技术，通过分析用户或系统行为的独特模式（如交互序列或时序）来识别和阻止恶意活动。

标签: #AI Security, #Model Distillation, #AI Ethics, #Geopolitics, #Anthropic

Simon Willison 启动“智能体工程模式”项目，旨在记录 AI 编程智能体的最佳实践 ⭐️ 7.0/10

Simon Willison 启动了一个名为“智能体工程模式”的新项目，旨在系统性地记录使用 Claude Code 和 OpenAI Codex 等自主编程智能体开发软件的编码实践与模式。他于 2026 年 2 月 23 日发布了前两章，探讨了廉价代码生成如何改变开发流程，以及测试驱动开发如何提升智能体的输出质量。这是对新兴的“智能体工程”领域进行模式规范化的早期尝试，随着 AI 编程智能体的成熟和更广泛采用，这些模式可能成为该领域的基础。通过区分非结构化的“氛围编码”和有纪律的智能体工程，Willison 提供了一个有价值的概念框架，帮助专业开发者在保持工程严谨性的同时，有效利用这些工具。该项目以一系列“章节”或“指南”的形式构建，Willison 计划随时间推移进行更新，其灵感来源于经典的《设计模式》书籍格式。Willison 明确表示所有文字内容都将由人类撰写，尽管他会使用大语言模型进行校对和生成示例代码，并且他计划每周发布 1-2 个新章节。

rss · Simon Willison · Feb 23, 17:43

背景: “智能体工程”指的是一种有纪律的 AI 辅助软件开发方法，其中自主编程智能体既能生成也能执行代码，从而允许它们独立进行测试和迭代。像 Claude Code 和 OpenAI Codex 这样的工具代表了新一代超越简单代码补全的 AI 助手。这与“氛围编码”形成对比，后者描述的是一种非结构化的编码方式，用户几乎不关注代码本身，通常与非程序员使用大语言模型相关。

标签: #AI Programming, #Software Engineering, #LLM Agents, #Development Patterns

将红/绿测试驱动开发应用于 AI 编码代理可提升代码质量 ⭐️ 7.0/10

Simon Willison 提出将”红/绿”测试优先的测试驱动开发方法应用于 Claude 和 ChatGPT 等 AI 编码代理。这种方法首先编写失败的测试（红阶段），然后实现代码使其通过（绿阶段），有助于防止编写错误或不必要的代码，同时确保强大的测试覆盖。这很重要，因为它解决了 AI 编码代理的两个主要风险：生成无法运行的代码和构建不必要的功能。通过强制执行测试优先开发，开发者可以提高代理的可靠性，减少调试时间，并创建全面的测试套件，防止项目扩展时出现回归问题。作者通过一个具体示例演示了这种方法：要求编码代理”构建一个从 Markdown 字符串中提取标题的 Python 函数。使用红/绿测试驱动开发。”他指出，对于 ChatGPT，需要附加”使用你的代码环境”来确保代理实际执行测试而不仅仅是编写测试。

rss · Simon Willison · Feb 23, 07:12

背景: 测试驱动开发是一种软件开发方法，在实际实现代码之前编写自动化测试。”红/绿”模式指的是两阶段过程：首先编写失败的测试（红），然后实现代码使其通过（绿）。AI 编码代理是设计用于通过基于自然语言提示生成、分析或修改代码来协助编程任务的 AI 系统。

标签: #AI-assisted-development, #test-driven-development, #coding-agents, #software-engineering, #agentic-engineering

PostgreSQL 贡献者分享 30 年吸引开源新贡献者的经验教训。 ⭐️ 7.0/10

在 FOSDEM 2026 上，PostgreSQL 贡献者 Claire Giordano 分享了该项目近 30 年历史中，关于如何吸引和维持新贡献者的经验教训。她指出，虽然项目的提交者已从 5 人增长到 31 人，并且在 PostgreSQL 18 发布周期中有 83 位首次贡献者，但在吸引下一代开发者方面仍面临挑战。这很重要，因为像 PostgreSQL 这样的基础开源项目的长期健康，依赖于在原始维护者退休后，贡献者能够持续更新。这些经验教训广泛适用于任何寻求构建可持续、多元化、全球化社区（而不仅仅是代码贡献）的软件项目。 Giordano 强调，“贡献者”包括所有角色，而不仅仅是程序员，她本人就从未向 PostgreSQL 贡献过代码，而是在其他方面工作。该项目的贡献者渠道是全球性的，提交者分布在像新西兰这样多样化的地点，并且在 2025 年有超过 360 人以“某种方式”做出了贡献。

rss · LWN.net · Feb 23, 15:00

背景: PostgreSQL 是一个功能强大的开源对象关系数据库系统，历史超过 40 年，自 1996 年首次发布以来，已采用开源许可证近 30 年。FOSDEM 是一个重要的年度非商业会议，专注于自由和开源软件开发。演讲者 Claire Giordano 曾在 Sun Microsystems 和 Citus Data（后被微软收购）从事开源工作，现在负责微软围绕 PostgreSQL 的开源社区计划。

标签: #open-source, #postgresql, #community-building, #software-development

AI 公司因批评模型蒸馏技术被指虚伪 ⭐️ 7.0/10

近期讨论指出，AI 公司批评模型蒸馏技术的同时，自身却使用人类创作的数据训练模型，这被视为一种虚伪行为。讨论特别提到了 Anthropic 对蒸馏技术的立场，同时质疑其自身训练数据的来源。这场辩论揭示了 AI 发展中专有创新与开源竞争之间的根本矛盾，同时提出了大语言模型时代知识产权保护的关键问题。其结果可能对商业模式、竞争格局以及 AI 训练数据的法律框架产生重大影响。模型蒸馏是一种合法的技术，较小的’学生’模型从较大的’教师’模型学习，从而能在算力较低的硬件上部署。争议焦点在于，批评这种做法的公司自身是否也在进行伦理上类似的行为——即在未经明确许可的情况下使用受版权保护的人类内容进行训练。

reddit · r/LocalLLaMA · Xhehab_ · Feb 23, 22:04

背景: 模型蒸馏或知识蒸馏是一种机器学习技术，它将知识从大型复杂模型转移到更小、更高效的模型中。这使得较小模型能够近似较大模型的性能，同时速度更快、计算资源需求更少。许多前沿 AI 模型使用从互联网抓取的海量数据集进行训练，这些数据包括受版权保护的文本、图像和代码。使用受版权保护的材料进行 AI 训练的伦理和法律影响尚未解决，正在全球法院系统中积极辩论。

社区讨论: 社区评论强烈指责这种虚伪行为，用户指出批评蒸馏技术的公司自身也依赖人类创作的数据。有人认为这削弱了前沿模型投资的防御性，而另一些人则建议强制开源模型权重作为版权侵权的补偿。讨论将当前的 AI 实践与历史上的互联网抓取辩论联系起来，特别是关于 robots.txt 和搜索引擎索引的争议。

标签: #model-distillation, #ai-ethics, #open-source-ai, #business-models, #copyright

英特尔组建’统一核心’团队研发新架构，或于 2028 年起取代混合核心设计。 ⭐️ 7.0/10

英特尔近期在领英发布的招聘信息显示，该公司正在组建名为’统一核心’的设计团队，负责开发下一代 CPU 的全新微架构。此举表明英特尔计划改变其当前的性能核与能效核混合设计，新架构可能在 2028 年左右的 Titan Lake 架构中首次亮相。这对英特尔而言是一次重大的战略转向，意味着它将放弃自第 12 代酷睿（Alder Lake）以来引领的混合架构行业趋势。如果成功，统一核心设计可以简化软件优化，可能为更多性能核心腾出芯片面积，并重塑其与 AMD、苹果等竞争对手的竞争格局。该项目目前处于早期开发阶段，重点在于优化处理器的性能功耗面积比。在统一架构准备就绪之前，英特尔将继续迭代现有的混合核心设计。新架构下的产品定位区分，可能通过调整缓存容量而非核心类型来实现。

telegram · zaihuapd · Feb 24, 00:35

背景: 自第 12 代酷睿（Alder Lake）处理器起，英特尔采用了混合架构，在同一芯片上集成高性能的’性能核’（P-core）和高能效的’能效核’（E-core），类似于 ARM 的 big.LITTLE 设计。这种方法旨在平衡高负载任务所需的峰值性能与后台工作负载的能效。而’统一核心’架构将回归到在整个处理器中使用单一、同质化的核心设计。

标签: #cpu-architecture, #intel, #microarchitecture, #hardware-design, #semiconductors