AI 日报 | 2026.04.16
今日精逇8条:百度开源 ERNIE-Image、Google Gemini 登陆 macOS、Cursor 3.1 画布功能、腾讯混元 3D 世界模型 2.0 开源、DeepSeek V4 确认 4 月下旬发布、Gemini Robotics-ER 1.6,以及中国五部门【AI 拟人化互动服务管理暂行办法】出台。
今日精选 7 条全球 AI 行业动态,涵盖模型发布、产品更新、融资与政策。
🤖 模型发布
1. 百度开源 ERNIE-Image:8B 参数,文字渲染全球第一
百度文心团队正式开源文生图模型 ERNIE-Image,采用 DiT 架构,仅 8B 参数、消费级 24GB 显存即可运行,在 GenEval、OneIG、LongTextBench 等多项基准上全面超越同规模开源模型,复杂海报与多语言文字渲染能力号称全球第一。同步推出 8 步快速推理的 Turbo 版本,协议为 Apache 2.0。
来源:百度官方 / GitHub
baidu/ERNIE-Image2. Google DeepMind 发布 Gemini Robotics-ER 1.6
新一代机器人推理模型,显著提升空间推理、多视角理解和仪器读数能力,安全指令遵循表现超越前代 50% 以上,可支持机器人自主完成精密测量与任务成功判断。DeepMind 将「具象化推理」定位为机器人自主性的核心方向。
来源:deepmind.google
🛠️ 产品更新
3. Cursor 3.1 上线 Canvases 画布功能
新版本正式引入交互式画布(Canvases),支持在侧边栏创建含表格、图表、diff 视图、待办列表等原生组件的可视化界面,持久化展示,是代码编辑器向「可视化工作台」演进的重要一步。
4. Google Gemini 登陆 macOS,新增交互式 3D 模型
Gemini 原生 macOS 应用正式上线(支持 macOS 15+),支持快捷键唤起、屏幕截图上下文理解和本地文件分析;同期推出交互式 3D 模型与物理模拟可视化功能,用户可动态调整轨道速度、重力等参数。
来源:blog.google
🇨🇳 国内进展
5. 腾讯混元 3D 世界模型 2.0 开源
HY-World 2.0 支持文字、图片、视频多模态输入,可自动生成、重建并模拟 3D 世界,输出 Mesh/3DGS/点云等多格式资产,可直接导入 Unity、Unreal Engine。相比 Genie3 等国际同类模型,其生成的 3D 资产支持直接二次编辑,实用性更强。
来源:腾讯混元官方
6. DeepSeek V4 确认 4 月下旬发布,全面适配华为昇腾
DeepSeek 官方确认新一代旗舰模型 DeepSeek V4 将于 4 月下旬正式上线,该模型将全面兼容华为昇腾芯片,实现从底层算力到上层模型的全链路国产化。这是国产大模型自主算力生态建设的关键里程碑。
来源:百度百家号 / DeepSeek 官方
📋 政策动向
7. 中国五部门联合发布《AI 拟人化互动服务管理暂行办法》
国家网信办联合国家发改委、工信部、公安部、市场监管总局发布该办法,自 2026 年 7 月 15 日起施行。办法明确禁止生成危害国家安全内容,规定拟人化服务提供者需履行安全评估、算法备案义务,并专门设立未成年人与老年人权益保护条款,同时设立 AI 沙箱安全服务平台制度。
来源:国家网信办 cac.gov.cn
以上内容来源于官方公告及权威科技媒体,资讯时间范围:2026-04-14 至 2026-04-16。
围绕这条内容继续补充观点或上下文。