- 涵盖91个开源代码库、共113项任务的DeepSWE编码基准测试中,GPT-5.5、5.4、Opus4.7分数为70%、56%、54%
- SaaS-Bench评测揭露智能体全自动办公深层缺陷,难以完成跨系统长流程工作,Claude通过率仅3.8%
- 微软发布开源Webwright框架,用约1000行代码构建网页AI智能体,提升GPT-5.4跑分81%
- 由扎克伯格夫妻资助的研究机构Biohub发布用于预测、设计和发现的“蛋白质生物学世界模型”
- 全球首个全自动AI科学家Robin发现治疗干性年龄相关黄斑变性的新药,仅需2小时完成人类数月工作量
- 清华校友王冠团队提出HRM-Text预训练模型,使用1/900 token、1/432算力,预训练训练成本仅1500美元
- Bonsai Image 4B端侧生图模型在iPhone 17 Pro Max上仅需9.4秒生成512×512图像
- 在加州大学圣地亚哥分校的图灵测试中,GPT-4.5以73%判定率超越真人
- MemEye评测框架对多模态智能体长期记忆进行视觉体检,揭示细节丢失问题,强调保留原图的重要性
- 韩国物理AI视频预训练公司RLWRLD种子轮融资600亿韩元,约4180万美元
- 前NotebookLM开发者创立的音频生成应用Huxe因Spotify推出类似的功能而关闭,曾融资460万美元
- Spotify联席CEO为AI音乐业务辩护,称“受控的产品优于不受监管的AI垃圾内容”
- Ansel Adams信托指控其作品《新墨西哥州埃尔南德兹的月升》未经许可被AI上色展出并销售
- 25岁华裔Cecilia Shen正打造好莱坞首个AI电影工作室PAI,估值10亿美元,旨在垄断长篇AI内容市场
- 《未来真相》作者罗森鲍姆承认其新书存在AI合成引言,仍坚持使用AI工具
- 巴诺书店称要求出版商为所有AI生成书籍加标签,如有明确需求,不反对销售标注AI生成的书籍
- 美国Merlin Labs研发的AI自动飞行系统完成首次试飞,已获超1亿美元美国空军合同,预计用于C-130运输机
- 谷歌计划在印度建设150亿美元的AI数据中心,居民担忧水资源压力
- Meta美国佐治亚州摩根县在建数据中心引水源恶化,当地居民靠外运水做饭洗澡,环保署承诺调查
- AllFaith基准测试发现ChatGPT等模型存在系统性宗教偏见,近九成AI模型未提供宗教内容
- 领英联合创始人雷德·霍夫曼的数字分身ReidAI自2024年以来已完成75次演讲和发言
- AI公司Andon Labs进行AI当老板实验,结果旗下电台内容失控、实体店亏损严重
- FT:AI智能体正帮助小型咨询公司处理大型工作负载,瓦解“四大”等头部公司霸权
- 伦敦超过巴黎重登欧洲科技中心,目前全球排名第四;2025年伦敦初创公司融资177亿美元