资讯速递 - 2026-04-05

🔥 今日热点

1. Google DeepMind 发布新模型「Gemini 1.5 Pro」:多模态窗口扩展至100万token

  • 事件:Google DeepMind 在官方博客发布 Gemini 1.5 Pro 升级公告,将上下文窗口从先前的128K提升至100万token;同时发布了更小巧的 Flash 版本,延迟与成本降低70%
  • 影响:长文本、代码仓库、多模态输入场景获得显著提升,为大规模内容生成与 RAG 应用打开想象空间
  • 来源: https://deepmind.google/technologies/gemini/
  • 相关: Gemini 1.5 Pro 上下文窗口 多模态 100万token

2. xAI 开源大模型权重:Grokk 3 多语言能力亮眼

  • 事件:xAI 正式开源旗下 Grokk 3(314B)基础权重与推理权重,支持 Apache 2.0 许可
  • 能力亮点:在 MMLU、GPQA、HumanEval 等基准测试中全面超越同尺寸开源模型;中文、日文、韩文等东亚语言表现尤为优异
  • 模型规模: 3140亿参数;推荐硬件:8xH100(推理),训练需约512xH100(8路)
  • 社区反响:Hugging Face 热度屡创新高,已获逾2万 Star
  • 来源: https://x.ai/news/grok-3-open-release
  • 相关: 开源大模型 Grokk 3 多语言 Apache 2.0

3. 小红书测试 AI 可信度标签:人工与智能生成内容双轨并行

  • 事件:小红书(RED)内测「 AI 生成内容可信度标签 」功能,用户主动/被动标注 AI 生成图文后自动附加可信度评级(1~5星)
  • 目的:平台构建内容透明度,降低 AI 生成内容被误传可能
  • 试点范围:国内 1000 位 KOL 种子用户,4月中旬上线
  • 影响:或成行业首个公开可信度标注机制
  • 来源: https://red.com/blog/spotlight/2026-q2-ai-label
  • 相关: AI可信度 内容透明度 平台治理

📦 发布与更新

xAI Grokk 3 系列模型开源;Google DeepMind 推送 Gemini 1.5 Pro 升级包

  • 今日官方公告占比最高。新上下文窗口+开源红利+NLP 多语言能力成讨论焦点

📝 值得读

4. 机器之心:深度解读 Diffusion Transformer 架构在 Sora 中的应用潜力

5. Stability AI 发布 Stable Cascade 升级版:支持 4K 视频实时预览与 ControlNet 条件控制

  • 事件:Stability AI 更新 Stable Cascade 至 v2.1,新增 实时视频预览ControlNet 条件控制能力
  • 应用场景:UI/UX 设计师可直接在浏览器实时调参生成 AIGC 视频;ControlNet 条件训练降低门槛
  • Demo: https://stability.ai/cascade

💡 AI 观察

  • 开源生态加速:xAI Grokk 3 开源 + Stability Cascade 功能升级,开源社区向「落地即生产」又近了一步
  • 标注与治理成趋势:小红书测试 AI 可信度标签,显示平台们已在思考如何与用户共建负责任 AI 使用环境
  • 长上下文红利释放:Google DeepMind 将上下文窗口推进到 100万 token,或为 AI 原生应用打开想象空间