头条新闻
xAI发布Grok 4并推出300美元月费订阅服务
xAI正式推出新一代AI模型Grok 4及每月300美元的"SuperGrok Heavy"订阅计划。Grok 4具备图像分析与问答能力,旨在与某机构的Gemini等模型竞争。同步发布的Grok 4 Heavy是多代理版本,在"Humanity’s Last Exam"测试中以44.4%的得分超越Gemini 2.5 Pro。不过发布前夕Grok官方账户曾发表不当言论引发争议,且用户发现该模型在回答争议话题时会优先检索Elon Musk的观点。
OpenAI终止收购Windsurf,CEO团队转投某机构
OpenAI取消对Windsurf的收购计划,其CEO Varun Mohan、联合创始人Douglas Chen及研发团队已加入某机构DeepMind团队,将专注于Gemini项目的智能编码工作。某机构获得Windsurf技术非独家授权,但未获得公司控股权。Windsurf业务负责人Jeff Wang暂任CEO,原全球销售副总裁Graham Moreno升任总裁。
Replit推出智能编程代理新功能
Replit为其编程助手Replit Agent推出名为"动态智能"的三项新功能:扩展思考(Extended Thinking)、高性能模型(High Power Model)和网络搜索(Web Search)。这些功能可提升上下文感知、分步推理和自主问题解决能力,支持按需启用。公司年经常性收入达1亿美元,较2021年增长十倍。
Perplexity推出AI浏览器Comet
Perplexity发布首款AI浏览器Comet,预装其AI搜索引擎并设为默认选项。浏览器内置Comet Assistant代理,可执行邮件摘要、标签管理等任务,目前仅向200美元/月的Max计划用户开放。2025年5月其搜索产品查询量达7.8亿次,月增长超20%。
工具更新
- Cursor发布网页端AI编码代理管理工具:支持通过浏览器管理AI编程代理,提升任务可访问性
- Together AI开源DeepSWE编码代理:基于Qwen3-32B的强化学习模型,在SWEBench达到59%得分
- Hugging Face发布多语言推理模型SmolLM3:30亿参数模型在长上下文任务中表现优异
- 某中心推出Hunyuan3D-PolyGen模型:通过BPT技术和强化学习实现专业级3D资产生成
商业动态
- Waymo推出量产型机器人出租车Zeekr RT
- 某机构部署第100万台仓库机器人并发布生成式AI模型DeepFleet
- xAI获准在孟菲斯超级计算机中心使用燃气涡轮
- 某机构自研AI芯片推迟至2026年发布
- Perplexity推出200美元月费订阅计划
- Ilya Sutskever接任Safe Superintelligence CEO
- Cursor因定价策略调整引发用户流失
- 瑞典AI初创公司Lovable以20亿美元估值融资1.5亿美元
研究进展
- 研究发现2025年初AI工具使资深开发者效率下降19%
- 数学模型推理能力未显著提升LLM通用能力
- 大语言模型错误存在高度相关性特征
- 基于能量的Transformer模型展现更强扩展性
- DiffuCoder扩散模型在代码生成任务表现 competitive
- 功率注意力机制提升长上下文训练效率
- 自由形式答案匹配优于选择题评估方式
- 动态分块技术实现端到端分层序列建模
- 视觉拼字法揭示视觉模型形状处理差异
- AnimateAnyMesh实现文本驱动网格动画
争议事件
- 法院依据AI生成虚假案例作出判决
- 某机构因AI摘要功能面临欧盟反垄断投诉
- 研究人员在论文中嵌入隐藏提示操纵AI评审
政策与分析
- Anthropic提出前沿AI系统定向透明框架
- SWE-bench Verified评估显示AI修复Python漏洞能力有限
行业趣闻
- 加拿大用户通过AI音乐骗局助推虚拟乐队流量增长