AI technology
← 返回首页

AI新闻 2026-05-21

每日AI新闻简报,汇集AIBase、机器之心、新智元、Google AI Blog等来源的AI行业资讯。

AI新闻简报(2026年5月21日)

每日AI新闻

  • 【新智元】Gemini 3.5今夜发布:谷歌亲手淘汰谷歌——Gemini 3.5系列整合前沿智能与行动能力,I/O大会展示大模型全面植入搜索、创作与安全防护三大核心场景,同时推出Gemini Omni、Gemini Antigravity、Universal Cart等重磅新品,谷歌正以AI原生战略重新定义自身。

  • 【AIBase】YouTube “AskYouTube”上线:速度提升4倍,推出对话式搜索——用户可通过自然语言与视频内容互动,快速定位关键信息,无需手动浏览完整视频。

  • 【AIBase】谷歌I/O 2026全面展示AI蓝图:Gemini大模型全面进入搜索、创作与安全防护三大环节——从AI搜索到创意工具,谷歌正在将AI能力深度嵌入全线产品生态。

  • 【新智元】全网实测Gemini Omni:一句话改视频,草图变大片——Gemini Omni展现强大的视频生成与编辑能力,用户可通过自然语言指令完成复杂的视频创作任务。

  • 【AIBase】520遇见国产新模王Qwen3.7-Max:阿里通义千问发布新一代旗舰模型——Qwen3.7-Max在全球评测中表现卓越,参数规模与技术能力双突破,进一步巩固国产大模型的领先地位。

  • 【AIBase】Cursor Composer 2.5发布:性能比肩GPT-5.5和Opus4.7,成本显著降低——AI编程工具再进化,Cursor 2.5以更低成本实现顶级代码生成能力,进一步拉低AI辅助编程门槛。

  • 【机器之心】全球排名前三,复旦自进化HarnessEngineering让GPT-5.4再涨7个点——复旦大学研究团队提出的自进化方法在全球基准测试中进入前三,帮助GPT-5.4实现显著性能提升。

  • 【机器之心】ACL 2026 | VChain赋予视频生成「视觉思维链」:NUS、牛津等联合发布AVI全景图综述——通过显式建模时空规划与状态转换,VChain让视频生成模型具备更接近人类的推理能力。

  • 【新智元】一夜告别Token账单!端侧AGI真来了——端侧AI推理能力取得突破,用户可在本地设备上完成复杂的AI任务,大幅降低对云端Token的依赖。

  • 【AIBase】微信读书接入AISkill:授权账号让智能助手管理书架,分析阅读习惯、推荐书籍——腾讯将AI能力延伸至数字阅读场景,智能分析用户阅读偏好并提供个性化书籍推荐。

  • 【AIBase】腾讯发布设计智能体Ardot:一句话生成可编辑设计稿,支持团队组件库和主流设计工具兼容,设计一键转代码——腾讯推出面向设计场景的多智能体协作系统,将自然语言描述直接转化为可交付的设计资产。

  • 【AIBase】OpenAI发布三款实时语音模型:推理对话模型、实时翻译模型、实时转录模型——OpenAI在多模态语音交互领域持续发力,三款专用模型分别针对不同语音场景深度优化。

  • 【AIBase】快手可灵AI拟分拆独立融资,估值达200亿美元,剑指明年IPO——快手旗下AI视频生成业务可灵AI传出独立融资消息,估值高达200亿美元,有望成为AI视频生成领域首个IPO。

  • 【新智元】老黄喝豆汁”破防”背后,国产GPU正在填上CUDA护城河——英伟达CEO黄仁勋访华期间体验豆汁引发热议,国产GPU厂商正加速弥补软件生态短板,CUDA护城河面临挑战。

  • 【AIBase】谷歌翻译迎来20周年:支持近250种语言——谷歌翻译自2006年作为AI实验项目起步,至今已支持几乎所有主流语言,持续推动跨语言交流民主化。

  • 【AIBase】苹果AI辅助功能升级:进一步推动AI普惠——苹果在无障碍AI功能上持续投入,利用端侧AI能力帮助有特殊需求的用户更便捷地使用设备。

  • 【AIBase】豆包订阅方案披露:基础档68元/月,高阶档500元/月——字节跳动旗下豆包大模型正式公布商业化定价,分三档面向不同复杂度的生产力场景。

  • 【AIBase】ChatGPT广告主平台上线:AI商业化迎来分水岭——OpenAI推出广告平台,标志着AI商业化从技术输出向广告变现模式延伸,代理式交易模式成为新方向。

  • 【AIBase】腾讯Q1 AI研发投入225.4亿元——腾讯持续加大AI领域研发投入,一季度研发费用规模再创新高,AI成为公司核心战略方向。

  • 【机器之心】谷歌I/O大会开完,搜索框都变智能体了——谷歌将AI Agent能力深度整合至搜索产品,用户可通过搜索框直接触发复杂的多步骤AI任务执行。

  • 【机器之心】字节奖学金首次全球开放,五年67位得主去向追踪——字节跳动将AI奖学金项目向全球研究者开放,回顾五年间获奖者的学术与职业发展轨迹。

  • 【AIBase】千问5月20日将发布重大模型——阿里通义千问预告重磅更新,引发行业对新一代大模型能力边界的广泛猜测。

  • 【新智元】NUS、牛津等联合发布大模型时代音视频智能综述:系统梳理AVI全景图——多所顶尖学府联合发布关于大模型时代音频、视频与智能交互的综合性研究综述。

  • 【新智元】Karpathy为何突然加入Anthropic,只能当Dario的「-2」?——AI界传奇人物Andrej Karpathy职业动向引发广泛关注,分析其加入Anthropic的战略考量与角色定位。

  • 【AIBase】GPT-5.6内测 / OpenAI/Anthropic补贴大战——OpenAI与Anthropic之间的模型能力竞争与用户补贴策略持续升级,大模型战场火药味十足。

  • 【AIBase】微信小程序接入Hy3 preview,提升开发者智能化开发与运营体验——Hy3预览版正式接入微信小程序生态,降低技术门槛,助力开发者优化核心功能。

  • 【AIBase】支付宝”AI收”新增”商家入驻”Skill:一站式完成应用创建、支付集成、商家入驻——蚂蚁集团将AI能力深度嵌入商业服务流程,商家可通过自然语言完成复杂的入驻操作。

  • 【AIBase】百度发布秒哒App移动端——百度旗下AI应用平台秒哒推出移动端,进一步降低AI应用开发与使用门槛。

  • 【AIBase】腾讯元宝升级——腾讯旗下AI助手元宝完成功能升级,进一步整合腾讯生态内的多元服务能力。

  • 【AIBase】MiniMax关联公司增资至40亿元——AI公司MiniMax完成新一轮增资,注册资本提升至40亿元,融资规模持续扩大。

  • 【机器之心】长三角破局:技术跑进无人区,产业链如何跟上?——长三角地区AI技术研发持续领先,但产业生态配套面临新挑战,产学研究协同成为关键议题。

  • 【AIBase】阿里云”千问云”上线——阿里云推出基于通义千问的云端AI服务,为企业用户提供一站式大模型调用与部署方案。

  • 【AIBase】月之暗面发布Kimi WebBridge——月之暗面发布Kimi跨平台连接工具,进一步拓展Kimi系列产品的生态边界。

  • 【新智元】首个Gemini桌面端曝光:系统级Agent空降PC——Gemini桌面端产品首次曝光,预告AI助手将以系统级Agent形态深度融入个人电脑使用场景。

  • 【AIBase】OpenAI推出ChatGPT个人理财工具——OpenAI拓展ChatGPT应用场景至个人财务管理,AI辅助理财进入消费级市场。

注:以上内容为AI自动聚合摘要。AI新闻来源:AIBase、机器之心、新智元、Google AI Blog。