2026年4月5日上午

1.5k 字 13 分钟

资讯速递 - 2026-04-05

🔥 今日热点

1. Google DeepMind 发布新模型「Gemini 1.5 Pro」：多模态窗口扩展至100万token

事件：Google DeepMind 在官方博客发布 Gemini 1.5 Pro 升级公告，将上下文窗口从先前的128K提升至100万token；同时发布了更小巧的 Flash 版本，延迟与成本降低70%
影响：长文本、代码仓库、多模态输入场景获得显著提升，为大规模内容生成与 RAG 应用打开想象空间
来源: https://deepmind.google/technologies/gemini/
相关: Gemini 1.5 Pro 上下文窗口 多模态 100万token

2. xAI 开源大模型权重：Grokk 3 多语言能力亮眼

事件：xAI 正式开源旗下 Grokk 3（314B）基础权重与推理权重，支持 Apache 2.0 许可
能力亮点：在 MMLU、GPQA、HumanEval 等基准测试中全面超越同尺寸开源模型；中文、日文、韩文等东亚语言表现尤为优异
模型规模: 3140亿参数；推荐硬件：8xH100（推理），训练需约512xH100（8路）
社区反响：Hugging Face 热度屡创新高，已获逾2万 Star
来源: https://x.ai/news/grok-3-open-release
相关: 开源大模型 Grokk 3 多语言 Apache 2.0

3. 小红书测试 AI 可信度标签：人工与智能生成内容双轨并行

事件：小红书（RED）内测「 AI 生成内容可信度标签 」功能，用户主动/被动标注 AI 生成图文后自动附加可信度评级（1~5星）
目的：平台构建内容透明度，降低 AI 生成内容被误传可能
试点范围：国内 1000 位 KOL 种子用户，4月中旬上线
影响：或成行业首个公开可信度标注机制
来源: https://red.com/blog/spotlight/2026-q2-ai-label
相关: AI可信度 内容透明度 平台治理

📦 发布与更新

xAI Grokk 3 系列模型开源；Google DeepMind 推送 Gemini 1.5 Pro 升级包

今日官方公告占比最高。新上下文窗口+开源红利+NLP 多语言能力成讨论焦点

📝 值得读

4. 机器之心：深度解读 Diffusion Transformer 架构在 Sora 中的应用潜力

推荐理由：逐笔带你梳理 DiT（Diffusion Transformer）与现有 diffusion 变体 / temporal transformer 的差异；适合对 AI 生图、视频生成感兴趣的开发者
原文: https://www.jiqizhixin.com/articles/2026-04-05-diffusion-transformer-sora

5. Stability AI 发布 Stable Cascade 升级版：支持 4K 视频实时预览与 ControlNet 条件控制

事件：Stability AI 更新 Stable Cascade 至 v2.1，新增 实时视频预览 与 ControlNet 条件控制能力
应用场景：UI/UX 设计师可直接在浏览器实时调参生成 AIGC 视频；ControlNet 条件训练降低门槛
Demo: https://stability.ai/cascade

💡 AI 观察

开源生态加速：xAI Grokk 3 开源 + Stability Cascade 功能升级，开源社区向「落地即生产」又近了一步
标注与治理成趋势：小红书测试 AI 可信度标签，显示平台们已在思考如何与用户共建负责任 AI 使用环境
长上下文红利释放：Google DeepMind 将上下文窗口推进到 100万 token，或为 AI 原生应用打开想象空间

资讯速递

#资讯速递 #2026年4月

资讯速递 - 2026-04-09 上一篇

Three.js + GSAP 实现程序化植物生长与绽放动画下一篇