AI周报:Grok 4发布、Windsurf收购终止与Comet浏览器亮相

本周AI领域动态频出:xAI推出多模态模型Grok 4及高价订阅服务,OpenAI终止收购Windsurf而其团队转投某机构,Replit发布智能编程代理新功能,Perplexity推出AI浏览器Comet,同时涵盖多款开源模型与行业争议事件。

头条新闻

xAI发布Grok 4并推出300美元月费订阅服务
xAI正式推出新一代AI模型Grok 4及每月300美元的"SuperGrok Heavy"订阅计划。Grok 4具备图像分析与问答能力,旨在与某机构的Gemini等模型竞争。同步发布的Grok 4 Heavy是多代理版本,在"Humanity’s Last Exam"测试中以44.4%的得分超越Gemini 2.5 Pro。不过发布前夕Grok官方账户曾发表不当言论引发争议,且用户发现该模型在回答争议话题时会优先检索Elon Musk的观点。

OpenAI终止收购Windsurf,CEO团队转投某机构
OpenAI取消对Windsurf的收购计划,其CEO Varun Mohan、联合创始人Douglas Chen及研发团队已加入某机构DeepMind团队,将专注于Gemini项目的智能编码工作。某机构获得Windsurf技术非独家授权,但未获得公司控股权。Windsurf业务负责人Jeff Wang暂任CEO,原全球销售副总裁Graham Moreno升任总裁。

Replit推出智能编程代理新功能
Replit为其编程助手Replit Agent推出名为"动态智能"的三项新功能:扩展思考(Extended Thinking)、高性能模型(High Power Model)和网络搜索(Web Search)。这些功能可提升上下文感知、分步推理和自主问题解决能力,支持按需启用。公司年经常性收入达1亿美元,较2021年增长十倍。

Perplexity推出AI浏览器Comet
Perplexity发布首款AI浏览器Comet,预装其AI搜索引擎并设为默认选项。浏览器内置Comet Assistant代理,可执行邮件摘要、标签管理等任务,目前仅向200美元/月的Max计划用户开放。2025年5月其搜索产品查询量达7.8亿次,月增长超20%。

工具更新

  • Cursor发布网页端AI编码代理管理工具:支持通过浏览器管理AI编程代理,提升任务可访问性
  • Together AI开源DeepSWE编码代理:基于Qwen3-32B的强化学习模型,在SWEBench达到59%得分
  • Hugging Face发布多语言推理模型SmolLM3:30亿参数模型在长上下文任务中表现优异
  • 某中心推出Hunyuan3D-PolyGen模型:通过BPT技术和强化学习实现专业级3D资产生成

商业动态

  • Waymo推出量产型机器人出租车Zeekr RT
  • 某机构部署第100万台仓库机器人并发布生成式AI模型DeepFleet
  • xAI获准在孟菲斯超级计算机中心使用燃气涡轮
  • 某机构自研AI芯片推迟至2026年发布
  • Perplexity推出200美元月费订阅计划
  • Ilya Sutskever接任Safe Superintelligence CEO
  • Cursor因定价策略调整引发用户流失
  • 瑞典AI初创公司Lovable以20亿美元估值融资1.5亿美元

研究进展

  • 研究发现2025年初AI工具使资深开发者效率下降19%
  • 数学模型推理能力未显著提升LLM通用能力
  • 大语言模型错误存在高度相关性特征
  • 基于能量的Transformer模型展现更强扩展性
  • DiffuCoder扩散模型在代码生成任务表现 competitive
  • 功率注意力机制提升长上下文训练效率
  • 自由形式答案匹配优于选择题评估方式
  • 动态分块技术实现端到端分层序列建模
  • 视觉拼字法揭示视觉模型形状处理差异
  • AnimateAnyMesh实现文本驱动网格动画

争议事件

  • 法院依据AI生成虚假案例作出判决
  • 某机构因AI摘要功能面临欧盟反垄断投诉
  • 研究人员在论文中嵌入隐藏提示操纵AI评审

政策与分析

  • Anthropic提出前沿AI系统定向透明框架
  • SWE-bench Verified评估显示AI修复Python漏洞能力有限

行业趣闻

  • 加拿大用户通过AI音乐骗局助推虚拟乐队流量增长
comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计