一周AI大事：Kimi万亿模型"横空出世"，小鹏人形机器人“以假乱真”！

一、重磅工具——1万亿参数Kimi“亮剑”，既能做事也会做事

新闻：月之暗面 (Moonshot AI) 宣布推出Kimi K2 Thinking，这是一款专为打造强大AI智能体而从零开始打造的开源AI推理模型。这款高效的混合专家（MoE）模型基于Kimi K2构建，总参数量񙵭万亿，推理时激活参�亿，支持的最长上下文可�.6万词元。

在数学、编程和智能体基准测试中，Kimi K2 Thinking的表现可媲美GPT-5和Claude 4.5 Thinking：在Humanities Last Exam (HLE) 测试中得�.9%，在SWE-bench验证集测试中得�.3%，在BrowseComp (智能体搜索)测试中得�.2%。

这款模型不仅在写作、编码和推理方面具备优异的通用能力，在智能体任务和工具调用方面表现更为出色。它能在无人干预的情况下连续调用工��次，通过数百个步骤的连贯推理来解决复杂问题。Kimi K2 Thinking采用的是量化感知训练（QAT）技术，确保其量化版本不会降低输出质量。鉴于其基准测试结果是基于INT4精度得出的，这更显得模型表现尤为抢眼。

这可能是自DeepSeek R1发布以来，中国企业推出的最重要的AI模型。它再次表明，中国AI实验室正在缩小与美国顶尖AI实验室的差距。

锐评：这次中国AI卷的不是文案，是能做事会做事。

二、AI技术与产品发布——从“算地球”到“换人脸”，大厂“炫技”停不下来

1. 新闻：艾伦人工智能研究所（AI2）推出开源的端到端“地球智能”平台OlmoEarth，旨在利用地球观测数据帮助人们深入理解地球运行机制。其中包含：

OlmoEarth基础模型：基于地球观测数据训练的小型AI模型，参数�万𳗣亿不等，用于执行场景识别或图像语义分割等地理空间相关任务；OlmoEarth Studio：用于数据集建模和微调的功能；OlmoEarth Run：地球建模流程引擎；OlmoEarth Projects：经过微调的地球智能实用模型。

锐评：以后AI上算天下算地，中间算空气。

2. 新闻：微软将自研的文生图模型MAI-Image-1整合进Bing Image Creator和Copilot。这款模型能快速生成高质量的食物、自然和现实世界场景图像，使微软摆脱对OpenAI图像生成技术的依赖。

锐评：微软终于不靠OpenAI画图了，决定自己动手丰衣足食。

3. 新闻：美团龙猫团队发布全模态开源模型LongCat Flash Omni，采用MoE架构，总参数�亿，激活参数�亿。技术报告显示，这款模型在多模态基准测试中达到了SOTA水平。

锐评：美团这次不送外卖，改送模型。

4. 新闻：中国电动汽车公司小鹏发布IRON人形机器人。该公司称这款机器人“最像人”，有柔性皮肤和仿生肌肉。人形骨骼、肌肉和皮肤结构使这款机器人成为迄今最接近人类的机器人，甚至引发了有关“恐怖谷效应”和“科幻成真”的讨论。小鹏还同步发布了VLA 2.0大模型，这是一款用于具身AI的视觉-语言-行动模型，适用于自动驾驶汽车和AI机器人。

【纠错】

【责任编辑:今年负债百万】

深度观察

新华全媒头条丨尹锡悦十年刑期落定？特检组曝光三大罪证，他脸上表情藏不住了