TLDR AI

Tier C科技媒体ENscrape2026-07-20

TLDR AI — 每日 AI 新闻聚合服务，精选 AI 行业最重要的 5–10 条新闻并附简要解析。通过 HTML 解析获取，覆盖广度大，适合快速扫描当日 AI 动态。

5 篇文章5 篇深度分析生成于 2026-07-20 09:30 UTC

文章列表

5 篇2026-07-18 ~ 2026-08-01

Kimi K3 (1 minute read)

月之暗面（Kimi）发布 2.8T 参数开源模型 Kimi K3，采用 Kimi Delta Attention 和 Attention Residuals 架构，支持原生视觉和百万 Token 上下文，为首个开源 3T 级模型。模型权重将于 2026 年 7 月 27 日开源，已上线 Kimi 旗下多款产品。

月之暗面（Kimi）于 2026 年 7 月 20 日发布 Kimi K3 模型。该模型拥有 2.8T 参数、1M Token 上下文窗口，基于 Kimi Delta Attention 和 Attention Residuals 架构，采用 16/896 专家激活的 MoE 和 Stable LatentMoE 框架，相比 K2 整体扩展效率提升约 2.5 倍。Kimi K3 在 GPU 内核优化、编译器开发和游戏开发等长周期编码任务中表现出色，自称综合性能仍落后于 Claude Fable 5 和 GPT 5.6 Sol。模型已在 Kimi.com、Kimi Work、Kimi Code 和 Kimi API 上线，完整权重将于 2026 年 7 月 27 日开源。

应用落地◆ 深度研判▲积极

7.0查看详情

Analyzed·分析cnbc.com

Gemini 3.5 Pro Reportedly Faced Delays (2 minute read)

据彭博社报道，谷歌旗舰模型 Gemini 3.5 Pro 因编码能力未达内部预期而推迟数月发布，消息导致 Alphabet 股价下跌 4%。

2026 年 7 月 16 日，彭博社援引知情人士消息称，Alphabet 推迟了其旗舰 AI 模型 Gemini 3.5 Pro 的发布，该模型已落后原计划数月，主要原因是编码能力未达内部预期。受此消息影响，Alphabet 股价当日下跌 4%。此时 OpenAI 和 Meta 已分别发布 GPT-5.6 Sol 和 Muse Spark 1.1 等竞品模型。Alphabet 发言人在声明中表示公司正在快速推进多种模型的发布，并保持成本效益。

基建更新◆ 策略投资▼消极

5.5查看详情

Analyzed·分析lmstudio.ai

Introducing LM Studio Bionic: the AI agent for open models (4 minute read)

LM Studio 发布 Bionic，一款面向开源模型的 AI 智能体应用。Bionic 支持编码、研究和文档处理，提供本地与云端灵活执行，承诺零数据留存，并内置基于 Mistral AI 的 Voxtral 本地语音转录功能。

LM Studio 于 2026 年 7 月 20 日发布了 Bionic 产品，这是一款面向开源模型的 AI 智能体应用。Bionic 支持编码、研究和文档处理等任务，用户可选择本地运行、通过 LM Link 连接或使用 LM Studio Secure Cloud 上的开源模型。该产品承诺零数据留存且不将用户数据用于模型训练，内置了 Mistral AI 的 Voxtral 多语言实时转录模型，所有语音转录均在本地设备上完成。Bionic 是一个独立于 LM Studio 的全新应用，用户通过创建 LM Studio 账户即可使用云端模型服务。

应用落地◆ 策略投资▲积极

6.5查看详情

Analyzed·分析x.com

Schema (2 minute read)

新框架 [schema] 在 ARC-AGI-3 公开测试集上使用 Opus 4.8 + Fable 5 达到 99% RHAE，使用 GPT-5.6 Sol 达到 95.35% RHAE，核心理念是让 LLM 像物理学家一样思考。

作者 havenfeng 在 X 平台上发布了一个名为 [schema] 的新框架（harness），该框架旨在让大语言模型像物理学家一样推理。根据公告数据，[schema] 在 ARC-AGI-3 Public 测试集上，搭配 Opus 4.8 和 Fable 5 模型实现了 99% 的 RHAE 分数，搭配 GPT-5.6 Sol 模型实现了 95.35% 的 RHAE 分数。

框架工具◆ 前瞻关注─中性

2.5查看详情

Analyzed·分析huggingface.co

NVIDIA Nemotron 3 Embed (9 minute read)

NVIDIA 发布 Nemotron 3 Embed 开源嵌入模型系列，包含 8B 旗舰版（RTEB 排名第一）和两个 1B 高效变体，支持 32k 上下文窗口、多语言检索和 NVFP4 量化部署，面向生产级 RAG 和智能体检索场景。

NVIDIA 于 2026 年 7 月通过官方博客发布了 Nemotron 3 Embed 系列嵌入模型，包含三个开源模型：Nemotron-3-Embed-8B-BF16（旗舰版，在 RTEB 排行榜上以 78.5% 得分位列第一）、Nemotron-3-Embed-1B-BF16（高效版，RTEB 得分 72.4%，误差率较前代降低 27%）和 Nemotron-3-Embed-1B-NVFP4（Blackwell 优化 4 位量化变体）。该系列支持 32k 上下文窗口、多语言和代码检索，提供 NeMo 微调和蒸馏配方，并通过 Hugging Face、NVIDIA NIM 微服务和 vLLM 生态实现即时部署。

框架工具◆ 深度研判▲积极

6.5查看详情