知识小站

收录有价值的文章总结,构建个人知识库

213
总文章
69
当月

2026年6月文章

AIObservabilityLLMEngineering

AI 时代的新可观测性:不只看系统崩没崩,还要看模型有没有胡说

New Relic 首席技术战略官 Nic Benders 在播客中抛出一个判断:dashboard 和 alert 时代已经走到尽头,observability 正在从"让你看见"升级为"替你判断";而当 AI 自己成为系统的一部分,传统三支柱(metrics/logs/traces)已经不够用——我们必须新增 token、cost、语义质量、漂移等维度,才能监控一个会"胡说"的模型。

宇琪(编译)/ Tina(策划)·
AIEngineeringAPI GatewayPractice

烧了几百亿 Token 用 AI 重写生产级网关:温铭的 6 条经验

API7.ai 创始人温铭用几百亿 Token 和 Claude Code 完整重写了 AI 网关 AISIX(Rust 从零写),结论不是"AI 写代码有多强",而是"AI 能力已经溢出,跟不上的是人"。他把踩出来的经验浓缩成 6 条:Why 还得人来、禁止手写代码的反弹、AI 写代码必须再用 AI review、决策密度把人拖垮、要让组织先变厚再变大、最后警示"省着用 token"的心态早晚要出大事。

温铭(API7.ai 创始人兼 CEO、Apache APISIX PMC 主席)·
AIConAgentAI 工程化行业观察LLM

AICon 深圳 2026 启动|Agent 时代,哪些方向正在成为行业关键变量?

AICon 深圳站将于 8 月 21–22 日举办,议题征集中。组委会判断:模型能力趋于共识,竞争护城河正从"用哪个模型"转向"围绕模型构建什么"——Harness Engineering、Agent 安全、Coding Agent 重构研发、AI 原生 App 等八个方向,正在成为 Agent 时代的关键变量。

策划|AICon 全球人工智能开发与应用大会 编辑|罗燕珊、Kitty·
eBPF可观测性LinuxSRE安全

内核级的真相:为什么 eBPF 正在取代基于用户空间的 Agent 成为安全可观测性的首选

传统 sidecar/DaemonSet 形态的安全 Agent 与被监控进程共享用户空间,一旦容器被攻陷,Agent 自身就先于告警被 `kill -9` 掉,eBPF 把探针挂到内核系统调用接口,让监控跳出攻击者的可达域,顺带把 CPU 开销压到原方案的 20-40%,并通过 Falco/Tetragon 在生产环境落地"先观察→再告警→最后强制执行"的三段式接入路径。

Niranjan Sharma(译者:张卫滨)·
数据库分布式系统架构设计

数据库到底该怎么选?TDSQL 用一套内核给出了三个答案

在 MySQL 8.0 停更、信创合规成为硬约束的背景下,腾讯云 TDSQL 用同一套金融级内核拆出三档形态——基础版做单机轻量场景、企业版做金融核心 HTAP、全新计算引擎承接复杂分布式查询,试图回答"轻量、分布式、AI 数据底座"三类截然不同的选型诉求,且让客户只为真正用到的能力买单。

InfoQ·
AIAgentDeepSeekClaudeLLM Migration

这家 Agent 公司从 Claude 切到 DeepSeek v4:一年省下数百万美元,迁移工作量却是预期的 100 倍

Lindy(无代码 AI Agent 平台)把 100% 的产品流量从 Anthropic 切到 DeepSeek v4(通过美国本土推理商 Atlas Cloud 托管),年省数百万美元、核心用例性能反升。但 Crivello 坦承迁移工作量是预期的 100 倍,评估(在线 / 离线 / "氛围评估")和提示词重写才是真正的成本黑洞——这也是"前沿模型选型"在 2026 年进入两极分化时代的真实切片。

Paul Sawers / 译者:平川·
AIAgent吴恩达数据架构

吴恩达戳破AI幻象:炒作过头了,未来公司是10人小队+Agent重做数据架构

吴恩达在 LangChain Interrupt 大会上与 Harrison Chase 对谈:AI 热度和"末日叙事"被过度炒作,但编程 Agent 的进化速度被低估。代码变快 10–100 倍后,真正的瓶颈会从工程转向产品、营销、法务和数据架构——未来公司是 1–10 人的通才小队 + Agent 协同,并必须对非结构化数据做大规模 agent-ready 重构。

冬梅(编译)·
工程实践算法去重Pinterest

Pinterest 利用内容指纹技术,在数百万个域名中实现 URL 去重

Pinterest 面对数百万商家域名中大量仅因跟踪/活动参数不同而指向同一页面的 URL 变体,传统白名单/黑名单/启发式规则失效。其 MIQPS(最小重要查询参数集)系统采用数据驱动 + 内容指纹方案:渲染页面生成指纹,对比移除某参数前后的内容差异来判定参数重要性,并结合早期退出、异常检测等工程化策略,在亿级 URL 上实现高效 URL 标准化与去重。

Leela Kumili(平川 译)·
AI行业动态谷歌英伟达

谷歌痛失双AI大牛:诺奖科学家、Gemini负责人相继出走;英伟达员工弃百万年薪考公;传投资人135亿原价赎回Manus|Q资讯

本期 Q 资讯覆盖:谷歌痛失诺奖科学家 John Jumper 与 Gemini 联席负责人 Noam Shazeer 两大 AI 猛将,后者转投 OpenAI;英伟达在职员工成功上岸合肥公务员引热议;DeepSeek 以近 4000 亿元估值完成 510 亿元首轮外部融资;红杉中国、真格联合腾讯拟以 20 亿美元原价从 Meta 手中回购 Manus 控制权;追觅启动大规模战略收缩,裁员 12% 回归四大主业。

Ziyu(整理)·
AI工程文化管理Meta

Meta 几周内毁掉二十年工程文化,给所有"AI 优先"公司上了一课

科技作者 Gergely Orosz 深度还原 Meta 在 2026 年 4 月起的"AI 优先"改组:强制抽调 30%–50% 核心工程师做数据标注、24 小时记录键盘鼠标动作、把 Token 使用量纳入绩效考核。短短数周,公司亲手把奉行了二十年的工程师文化打成"成本中心",并以 Instagram 安全大宕机为代价付出账单。

Gergely Orosz(InfoQ 译者:明知山)·
AI演讲思考

前 OpenAI 高管清华演讲:比失业更可怕的,是 AI 时代我们不知道"我是谁

前 OpenAI Go-to-Market 负责人、全球人工智能顾问 Zack Kass 在清华大学做了一场题为《The Next Renaissance: AI and the Expansion of Human Potential》的演讲。他没有谈具体模型或产品,而是抛出四个底层判断:决定性变化来自推理成本下降;AI 是能力入口而非自动结果;普及会带来新的社会风险;最深层的冲击是身份重构而非岗位替代。

冬梅 / InfoQ·
CursorAI 编程Kimi马斯克

Cursor 1.5T 新模型放弃 Kimi 基座!600 亿美元股票换 Cursor,马斯克第一刀砍向微软 GitHub

Cursor 在 Compile 大会上同时发布 1.5T 自研模型、面向智能体的 Git 平台 Origin,并确认被 SpaceX 以约 600 亿美元全股票收购。新模型放弃 Kimi 基座、从零训练,算力规模达上一代的 10–20 倍;Origin 则被定位为"AI 原生 GitHub",剑指微软 GitHub 的下一代软件基础设施。

褚杏娟·
AI软件工程Google大模型开发效率团队效率

谷歌首席工程师:二十年自然生长出来的软件工程生态,快被大模型 10 倍提速撑爆

Google 首席工程师 Adam Bender 在 Google I/O 2026 抛出震撼警告:AI 让写代码快 10 倍,但代码量 10 倍意味着更长的编译、更重的测试、更堵的代码审查,外加一个没人能理解的代码库。"AI 是放大器,不是方向"——10 倍代码量、10 倍债务,AI 默认不解决任何问题。

宇琪·
AIDeepSeek蒸馏Redis开源

Redis 之父为 DeepSeek 抱不平:美国 AI 圈又为"蒸馏"吵起来了

2026 年 6 月 15 日,Redis 之父 Salvatore Sanfilippo(antirez)在 X 上发文反击美国 AI 圈"中国模型靠 API 蒸馏美国模型"的流行说法,认为这在数学上不可能,并指出 DeepSeek 已公开了完整的预训练/SFT/RL 管线;学界专家 Ryan Greenblatt 与 Nathan Lambert 也加入讨论,认为"蒸馏"一词已被"武器化"为道德话语。

Tina·
AIAnthropicClaude团队画像

Claude背后全是大厂老兵!Anthropic工程团队1680人画像曝光:谷歌系、12年经验、本硕为主

基于 LinkedIn 公开资料对 Anthropic 1680 名工程师的分析显示,这家 AI 公司更像一家高速扩张的基础设施公司:八成员工共享"Member of Technical Staff"头衔,工龄中位数 12.2 年、博士仅占 13.7%,第一大人才来源是 Google(405 人)而非 OpenAI/DeepMind,FAANG 履历者占一半。

褚杏娟·
TypeORMORMNode.js开源

TypeORM 历经近十年发展终于迎来 1.0 版本,标志着项目维护工作重启

TypeORM 团队发布 1.0 版本,这是这款广受欢迎的 TypeScript/JavaScript ORM 的首个主要版本,标志项目自 2016 年创建以来正式告别 0.x 阶段。1.0 完成了底层架构现代化(编译到 ES2023、Node 20+)、移除冗余依赖、补齐实用数据操作 API,并通过 codemod 工具降低迁移成本,被广泛视为维护工作重回正轨的明证。

Daniel Curtis(译者:平川)·
AIEngineering

【大人,AI编程又变天了!Claude Code之父、龙虾创始人同时力捧新范式,杀死提示词工程?】

Anthropic 工程师、Claude Code 创建者 Boris Cherny 最近的一次分享中说道,"现在,我觉得又到了下一个层级:我不再提示 Claude 了,我有一堆循环(loops)在运行,它们才是在提示 Claude 并判断接下来该做什么。我的工作变成了写循环。我认为,这是接下来几个月,甚至今年剩余时间里我们会看到的下一次转变。"

褚杏娟·
SnowflakeAgentic EnterpriseAIEnterprise AI

Snowflake 开启 Agentic Enterprise 时代

# Snowflake 开启 Agentic Enterprise 时代 AI 的技术演进走到今天,"模型更强"已经很难继续为市场带来足够的新鲜感。在 Snowflake Summit 26 的开幕 Keynote 中,Snowflake 抛出了一个更朴素、也更关键的问题:当 Agent 开始进入业务流程,企业凭什么让它做出可信赖判断? 答案仍然指向数据。当 SaaS 的交互方式正在被 Agen...

未知·
AI微软MAI大模型

拒绝蒸馏!微软发布自研MAI-Thinking-1追平Claude Opus 4.6:完全从零训练,不沾任何第三方模型输出

"我们现在已基本追平了几个月的最先进水平。"在 Build 大会前夕,微软 AI 执行副总裁兼 CEO Mustafa Suleyman 在采访中表示。昨日,微软在 Build 大会上发布了一系列自研的 AI 模型。这标志着微软在模型研发上的一次重要推进,去年该公司才推出了首批自研模型,在此之前微软还主要依赖 OpenAI 的模型。

华卫·
NVIDIA黄仁勋RubinAIGPUGTCAI工厂

黄仁勋宣布 Rubin 全面投产,4万名工程师参与构建!史上最强CPU同步亮相

在中国台北英伟达 GTC 大会上,CEO 黄仁勋宣布基于新一代 GPU 平台的 Vera Rubin 架构已进入全面投产阶段。他强调「生成式 AI 已经到来,实用 AI 已经到来」,并指出 NVIDIA 本质上是一家软件公司。Vera Rubin 是英伟达发展史上野心最庞大的研发项目,公司全体四万名工程师全员参与。

冬梅·
AI框架SpringRod JohnsonEmbabel企业级 AI

Spring 创始人重回一线做 AI 框架,却说:这是人类选择的最后一代框架

## 摘要 Rod Johnson 又回到了一线。 他是 Spring 的创造者,曾经几乎重新定义了企业 Java 应用应该怎么写。二十多年后,他重新创业,做了一个面向企业 AI Agent 的开源框架 Embabel,试图把 LLM 放进真实的业务系统里,让它不只是会调用工具,而是能在可控、可解释、可审计的流程里工作。 有意思的是,这一次他做的依然是框架,但他对"框架"的未来并不乐观——至...

Tina·
AISnowflake数据Agent

Token 卖疯了挣的也是小钱,Snowflake 盯上了 AI 时代最贵的资产

## 1 当传统 SaaS 软件被集体唱衰,Snowflake 在做什么? AI 爆发式增长后,所有人都相信一个美丽的故事:AI 会让软件变得更聪明,企业会因为 AI 使用更多工具,员工会因为 AI 提高效率,数据会因为 AI 变得更有价值。 SaaS、云平台、自动化、CRM、数据仓库、创意软件、办公软件——这些曾经在云计算时代建立王国的公司,似乎马上就要进入第二个黄金时代。 然后,故事突然...

冬梅·
AIAnthropicClaudeClaude Code智能体大模型

Anthropic 在 Code With Claude 上发布托管式智能体、主动式工作流与能力曲线

## 摘要 Anthropic 于 5 月 6 日在旧金山举办了 Code with Claude 2026 峰会,并将直播内容发布到了 YouTube。相关分享覆盖了 Claude Code、Claude Developer Platform,以及在 GitHub、Vercel、Datadog、Bun 和多家 AI 原生创业公司中的合作部署案例。贯穿全天的主线话题是:模型能力的阶段性跃迁,会如...

Andrew Hoblitzell·
AIClaude CodeCodexAI 编程

Codex 500万用户福利被怼"作秀"!Claude Code 吃掉近九成 Token,OpenAI 抢用户败在"小气"上?

OpenAI 为庆祝 Codex 用户突破 500 万,恢复了部分用户的 ChatGPT Plus 订阅用量的重置。但用户对此福利的评价两极分化:有人欢迎,认为终于可以跑真正的 eval 和 review-agent 工作了;更多人认为这只是表面文章,"作秀"成分居多。与此同时,AI 成本管理平台 CostHawk 数据显示,100 名操作者中 96 名使用 Claude Code,仅 2 名使用 Cursor。

褚杏娟·
AIDeepSeek开源程序员故事

不会写代码的"鲸鱼哥",被 DeepSeek 改写人生 | 专访 Hunter Bown

Hunter Bown 是一位曾经历多次职业转型失败的美国年轻人,法学学院第一学期经历脑震荡,又在状态很差的情况下参加考试,成绩不理想。没钱没工作没学位,走投无路之际,Claude Code 出现了,给他提供了一种以前没有的"能动性"——只要有想法,就可以真的把它做出来。后来他做了面向 DeepSeek 的终端工具 DeepSeek-TUI(后改名 CodeWhale),一跃成为 GitHub Trending 项目,现已入职美国 AI 模型公司 Arcee AI。

冬梅、四月·

文章日历

2026年 6月

💡 使用提示

  • • 点击日期筛选该日文章
  • • 蓝色圆点表示当天有文章
  • • 再次点击已选日期取消筛选