AI新闻简报(2026-06-20)
每日AI新闻
- 【AIBase】通义LOGOS发布首个统一科学大模型:1B参数版本超越NatureLM,覆盖多模态与科学计算领域。
- 【AIBase】MiniMax M3正式开源:采用全新MSA架构,支持100万token上下文窗口,响应速度翻倍,被视为国内多模态/长上下文技术的重大突破。
- 【AIBase】字节跳动Lance 3B开源统一多模态模型:单”大脑”同时处理图像/视频理解与生成,打破分离模型技术壁垒。
- 【AIBase】字节跳动联合港科大发布MMProLong:优化长文档多模态训练问答对效率,显著超越OCR转录方法。
- 【AIBase】Ideogram 4.0开源9.3B图像生成模型:具备强大的图文生成能力,在DesignArena全球排名第四。
- 【AIBase】阶跃星辰Step 3.7 Flash开源发布。
- 【AIBase】智谱GLM-5.2模型全面开源;GLM-5.1高速版同步上线,获马斯克点赞,HuggingFace提供资金支持。
- 【AIBase】阿里Qwen-Robot系列发布:覆盖操作、移动和世界模型的具身智能模型,解决异构机器人适配痛点。
- 【AIBase】Qwen3.7编程能力全球排名第二。
- 【AIBase】Anthropic宣布Claude语音交互重大升级:新增多语言支持和类电话自然交互模式。
- 【AIBase】OpenAI意外曝光GPT-5.6版本;同时据报正在准备新的双向语音模型GPT-Bidi-1。
- 【AIBase】Hy-Memory在多组测试中超越GPT-5.5,实现更高记忆密度和处理效率。
- 【AIBase】小米MiMo Code开源终端AI编程助手(v0.1.0),基于OpenCode以MIT许可证发布,内置免费顶级多模态模型。
- 【AIBase】GitHub Copilot推出按量付费模式(AI积分制),从简单自动补全向智能代理平台转型。
- 【AIBase】字节跳动Bernini开源统一框架。
- 【AIBase】OpenAI重启机器人业务:CEO Sam Altman宣布招募工程师拓展物理世界具身智能。
- 【AIBase】京东首批人形机器人正式上岗。
- 【AIBase】小米MiMo Claw正式发布:支持1000次连续工具调用,集成MiMo-V2.5-Pro MCP工具能力,免费使用时长增至4小时。
- 【AIBase】法拉第未来FF发布人形机器人与机器狗,进军消费级机器人市场。
- 【AIBase】美团LongCat-Video-Avatar 1.5开源商用级数字人视频生成模型:唇形同步、物理真实感和长视频稳定性优于闭源竞品。
- 【AIBase】微信AI生态开放:发布开发者接入指南,美图秀秀作为首批测试者接入图像处理场景,多家厂商通过微信互联互通推进A2A(Agent到Agent)助手。
- 【AIBase】豆包(字节跳动)上线”任务模式”:进化为支持多轮搜索、深度推理、浏览器自动化及自动生成PPT/文档/数据表的AI Agent;付费版预计6月底上线,含三档订阅,Q3计划与电商联动导流。
- 【AIBase】阿里Qwen全面开放第三方Agent和Skills,瑞幸咖啡和中国东方航空为首批接入者,战略转向”超级Agent”个人助手。
- 【AIBase】蚂蚁集团打通全球智能代理支付链路;支付宝推出全球AI支付方案,支持150万token上下文。
- 【AIBase】微信支付上线”AI专属卡”;Kimi将发行AI原生信用卡。
- 【AIBase】快手推出”AI购物助手”提升货架电商智能导购能力;高德地图”问店”AI能力开放调用,为中小企业提供连锁品牌级智能运营。
- 【AIBase】亚马逊Ring面部识别服务面临集体诉讼。
- 【机器之心/新智元】马斯克提及的Mythos项目引发关注,清华唐杰回应称中国AI已达到Fable水平且进度更快。
- 【机器之心/新智元】Claude Code史诗级更新,突破终端限制,可将工作实时转化为网页看板。
- 【机器之心/新智元】Anthropic营收达5.59亿美元,有望率先盈利,迫使奥特曼考虑降价策略。
- 【机器之心/新智元】史上首次,Agent网络流量超越人类流量。
- 【机器之心/新智元】奥德赛(Odyssey)项目全网爆火,3天狂揽3万星,顶流网红打造本地版ChatGPT。
- 【机器之心/新智元】谷歌开源DiffusionGemma,虽自送差评但推理速度提升4倍。
- 【机器之心/新智元】ICML 2026:UIUC团队发布ProtocolBench,评估Agent通信协议性能。
- 【机器之心/新智元】超越SONIC!人形机器人”小脑”迎来GPT时刻,发布史上最大规模动作捕捉数据集。
- 【机器之心/新智元】博世与清华合作推出FunctionEvolve:LLM-SRBench,让大语言模型首次学会推导数学公式。
- 【Google AI Blog】Google I/O 2026回顾:发布Gemini 3.5(前沿智能+行动能力)与Gemini Omni,推出100美元AI Ultra订阅方案。
- 【Google AI Blog】Google AI搜索进入新时代:AI Mode在美国的使用显示从关键词搜索向自然语言查询的重大转变。
- 【Google AI Blog】Google Workspace新增语音功能:Gmail、Docs、Keep接入语音能力,并发布新设计工具Google Pics;推出Google Beam实验改善混合会议体验。
- 【Google AI Blog】医疗AI研究:AMIE对话式AI在疾病管理方面匹配初级保健医生水平,研究成果发表于《Nature》。
- 【Google AI Blog】Google宣布在阿拉巴马州投资15亿美元建设数据中心,并扩大在弗吉尼亚和密苏里的社区投资。
GitHub Trending
- chopratejas/headroom ⭐38,402(今日+3,938): 压缩工具输出、日志、文件和RAG块再送入LLM,减少60-95% token消耗,答案不变 — Python
- palmier-io/palmier-pro ⭐1,796(今日+749): 专为AI集成打造的macOS视频编辑器
- DeusData/codebase-memory-mcp ⭐8,119(今日+1,055): 高性能代码智能MCP服务器,将代码库索引为持久知识图谱,支持158种语言 — C
- obra/superpowers ⭐233,281(今日+1,113): 一种代理式技能框架和软件开发方法论
- n0-computer/iroh ⭐10,235(今日+307): 模块化网络栈,用拨号密钥替代IP地址 — Rust
- koala73/worldmonitor ⭐57,181(今日+300): 实时全球情报仪表盘,集成AI新闻聚合、地缘政治监控和基础设施追踪
- Kong/insomnia ⭐38,945(今日+291): 开源跨平台API客户端,支持GraphQL、REST、WebSocket、SSE和gRPC
- penpot/penpot ⭐50,556(今日+213): 开源设计与代码协作工具
- BuilderIO/agent-native ⭐1,002(今日+210): 构建代理原生应用的框架
- calebsthio/OpenMontage ⭐6,220(今日+236): 全球首个开源代理式视频制作系统,12条管道、52个工具、500+代理技能
- withastro/flue ⭐5,803(今日+305): 沙盒代理框架
- Lightricks/LTX-2 ⭐7,654(今日+196): LTX-2音视频生成模型的官方Python推理和LoRA训练包
- zai-org/GLM-5 ⭐4,532(今日+478): 智谱GLM-5,从氛围编码到代理工程
- google-research/timesfm ⭐24,043(今日+1,516): Google Research的时间序列基础模型,用于时间序列预测
- aishwaryanr/awesome-generative-ai-guide ⭐27,585(今日+155): 生成式AI研究更新、面试资源和笔记本一站式仓库
注:以上内容为AI自动聚合摘要。AI新闻来源:AIBase、机器之心、新智元、Google AI Blog。GitHub数据来源:github.com/trending。