5月19日微软BuildXM官方网址 2025召开,CEO纳德拉就智能代理(Agentic AI)时代进行主题演讲。具体而言,微软希望构建Agent网络,目标的实现智能体积极主动地发起任务、独立决策、与其他人工智能系统协调,并在极少的人XM官方网址类监督下完成复杂的工作流程。就当前布局而言,Azure AI Foundry作为模型的云端训练中心,开发者可以自由组合模型、功能、工具调度等AI能力,构建所需的AI应用;Windows AI FounXM官方网址dry支持AI模型本地部署在设备侧,无需联网即可运行AI模型、工具与智能体;而Copilot Studio 平台则使所有用户都能构建属于自己的智能体,并支持多智能体协同;此外,微软还宣布加入MCP指导XM官方网址委员会,并推出新开源项目NLWeb,定位智能体网络时代的HTML协议,旨在简化网站自然语言交互界面开发,轻松将任意网站转化为具备 AI 功能的智能应用平台。
谷歌:基于现有生态打造2C Agent 3PXM官方网址战略。
5月20日Google I/O大会召开,除模型更新和AI搜索引擎AI Mode 全面上线以外,谷歌同样展现了自身在Agent方面的布局。其中,Gemini全面向Agent转型,Agent modXM官方网址e功能支持用户要求AI自行完成任务;Chrome也将接入了Gemini,支持在用户在浏览器中进行AI及Agent操作;Project Mariner则在早期原型上进一步升级,目前支持同时完成多达十种不XM官方网址同的任务。此外,谷歌在发布会上明确了自己的to C Agent “3P”战略——Personal(个性化),Proactive(预测性),Powerful(能力),这意味着谷歌将基于大模型能力,依靠GXM官方网址mail 、Docs、地图,以及Gemini和搜索的私域记忆,从而实现对用户未来可能需要被提醒、或许要做的事情,全面提高智能化体验。
Athropic:Claude 4成就全球最强编程模型,辅助AgenXM官方网址t构建
5月23日,Anthropic正式推出Claude 4系列大模型。先期推出的型号包括Claude Opus 4和Claude Sonnet 4,在代码生成、高级推理和AI智能体方面实现了更强的性XM官方网址能。具体而言,作为全球最强的编码模型,Claude Opus 4在SWE-bench(72.5%)和 Terminal-bench(43.2%)基准上均处于领先地位,并能够连续工作数小时,其解决复杂问XM官方网址题的能力为Agent开发提供了更强的支持,GitHub目前已将Claude Sonnet 4作为新的编码智能体模型引入GitHub Copilot。同时,Anthropic基于新模型正式开放了ClauXM官方网址de Code,可作为编程智能体集成在终端、常用IDE上,显著提高开发人员效率。
5月22日,昆仑万维面向全球市场XM官方网址同步发布天工超级智能体(Skywork Super Agents)。Skywork由5个专家智能体和1个通用智能体组成,前者专注Word/PPT/Excel/播客和网页的生成,后者通过接入数十个MCPXM官方网址以处理和生成图片、海报、音乐、MV、宣传片、有声读物、绘本和其他多媒体内容。同时,昆仑万维在场景具体落地方面深度打磨,1)Skywork在接收用户需求时,会要求用户通过“澄清卡片”选择目标及要求,并生XM官方网址成“待办清单”供用户二次确认,从而避免未能清晰理解用户意图导致的效率低下;2)Skywork提供“溯源”功能,所有生成的内容均可以给出清晰可追溯的来源,最大程度避免AI的幻觉问题;3)Skywork还XM官方网址支持用户自己上传文件并构建知识库,打造个人信息源,避免互联网质量参差不齐的信源造成生成质量低下。基于上述能力,Skywork在GAIA评测集上取得了82.42分,超越OpenAI Deep ReseaXM官方网址rch和Manus,位居第一(2025年5月10日数据);在OpenAI推出的Agent评测任务SimpleQA上取得了94.5分,实现了新的SOTA。目前,Skywork已支持海内外用户直接注册使用XM官方网址,为用户带来高效办公体验。