
一、重磅工具——1万亿参数Kimi“亮剑”,既能做事也会做事
新闻:月之暗面 (Moonshot AI) 宣布推出Kimi K2 Thinking,这是一款专为打造强大AI智能体而从零开始打造的开源AI推理模型。这款高效的混合专家(MoE)模型基于Kimi K2构建,总参数量万亿,推理时激活参亿,支持的最长上下文可.6万词元。
在数学、编程和智能体基准测试中,Kimi K2 Thinking的表现可媲美GPT-5和Claude 4.5 Thinking:在Humanities Last Exam (HLE) 测试中得.9%,在SWE-bench验证集测试中得.3%,在BrowseComp (智能体搜索)测试中得.2%。
![]()
这款模型不仅在写作、编码和推理方面具备优异的通用能力,在智能体任务和工具调用方面表现更为出色。它能在无人干预的情况下连续调用工次,通过数百个步骤的连贯推理来解决复杂问题。Kimi K2 Thinking采用的是量化感知训练(QAT)技术,确保其量化版本不会降低输出质量。鉴于其基准测试结果是基于INT4精度得出的,这更显得模型表现尤为抢眼。
这可能是自DeepSeek R1发布以来,中国企业推出的最重要的AI模型。它再次表明,中国AI实验室正在缩小与美国顶尖AI实验室的差距。
锐评:这次中国AI卷的不是文案,是能做事会做事。
二、AI技术与产品发布——从“算地球”到“换人脸”,大厂“炫技”停不下来
1. 新闻:艾伦人工智能研究所(AI2)推出开源的端到端“地球智能”平台OlmoEarth,旨在利用地球观测数据帮助人们深入理解地球运行机制。其中包含:
![]()
OlmoEarth基础模型:基于地球观测数据训练的小型AI模型,参数万亿不等,用于执行场景识别或图像语义分割等地理空间相关任务;OlmoEarth Studio:用于数据集建模和微调的功能;OlmoEarth Run:地球建模流程引擎;OlmoEarth Projects:经过微调的地球智能实用模型。
锐评:以后AI上算天下算地,中间算空气。
2. 新闻:微软将自研的文生图模型MAI-Image-1整合进Bing Image Creator和Copilot。这款模型能快速生成高质量的食物、自然和现实世界场景图像,使微软摆脱对OpenAI图像生成技术的依赖。
锐评:微软终于不靠OpenAI画图了,决定自己动手丰衣足食。
3. 新闻:美团龙猫团队发布全模态开源模型LongCat Flash Omni,采用MoE架构,总参数亿,激活参数亿。技术报告显示,这款模型在多模态基准测试中达到了SOTA水平。
锐评:美团这次不送外卖,改送模型。
4. 新闻:中国电动汽车公司小鹏发布IRON人形机器人。该公司称这款机器人“最像人”,有柔性皮肤和仿生肌肉。人形骨骼、肌肉和皮肤结构使这款机器人成为迄今最接近人类的机器人,甚至引发了有关“恐怖谷效应”和“科幻成真”的讨论。小鹏还同步发布了VLA 2.0大模型,这是一款用于具身AI的视觉-语言-行动模型,适用于自动驾驶汽车和AI机器人。