Workflow
Qwen Chat Memory
icon
搜索文档
沉痛悼念!杨振宁逝世,享年103岁;传智谱AI解散数十人产研中心,有人当天就走;李书福儿子创立具身智能公司被曝解散|AI周报
AI前线· 2025-10-18 13:11
行业热点事件 - 智谱AI在9月底进行组织调整,商业化部门旗下的产研中心约60人团队被整体解散,其中一半员工离职,另一半分流至交付部门,赔偿标准为N+1 [5][6] - 李书福之子李星星创立的具身智能公司一星机器人被曝解散,该公司于2025年5月成立,上个月刚完成数亿元种子轮融资,技术团队已遭哄抢 [8][10] - OpenAI CEO宣布ChatGPT将于2025年12月推出支持成人内容的版本,仅限于经过验证的成年用户使用 [17] - 甲骨文在AI World大会上宣布,30天内与四家公司签订了650亿美元新的云基础设施合同,公司预计到2030财年云基础设施收入将增长至1660亿美元 [18] - 大量用户反馈iPhone17新机出现无法激活问题,苹果客服回应为服务器问题正在维修,同时苹果宣布纯eSIM机型iPhone Air将于10月22日全面发售 [20][21] - 前滴滴高级副总裁付强正式加入蘑菇车联出任公司总裁,全面负责AI业务的战略落地与商业化布局 [22] - 蚂蚁集团宣布组织架构调整,将搜索、广告、推荐的工程与算法团队合并成立AIRS部门,全面承接短视频、短剧、直播等所有内容相关业务 [23] - 小米与北京大学联合署名论文发表于arXiv,曾被曝获雷军千万年薪招募的DeepSeek前核心开发者罗福莉出现在通讯作者之列 [24][25] - 成都警方通报小米SU7碰撞后爆燃事故,经检测当事人涉嫌酒后驾驶机动车,事故造成当事人死亡 [26] 大模型技术发布 - 百度正式发布并开源自研多模态文档解析模型PaddleOCR-VL,该模型参数仅0.9B,在OmniBenchDoc V1.5评测中以92.6分取得全球第一成绩 [28][29] - Manus发布通用AI代理系统Manus 1.5,平均任务完成时间从15分钟缩短至不足4分钟,效率提升近4倍,复杂任务质量提升约15% [30] - 阿里旗下通义千问正式推出Qwen Chat Memory功能,使模型能够在多轮对话中记住用户偏好、习惯及过往交流内容 [31] - 李飞飞团队发布实时生成世界模型RTFM,能够与用户交互时实时生成视频,单张H100 GPU即可运行 [32] - 火山引擎发布豆包大模型系列更新,截至2025年9月底,豆包大模型日均tokens调用量已突破30万亿,相比今年5月底增长超80% [33] - 甲骨文推出新一代云端AI超级计算机OCI Zettascale10,峰值性能可达16zettaFLOPS [34] - 智元机器人发布新一代工业级交互式具身作业机器人精灵G2,目前已获数亿元订单并开启首批商用交付 [35] - Anthropic推出小型AI模型Claude Haiku 4.5,编码性能与Sonnet 4基本持平,成本仅为后者三分之一,处理速度提升超过两倍 [37][38] - 英伟达宣布AI超级计算机DGX Spark正式交付,提供1 PFLOP AI性能和128GB统一内存,可本地运行最高2000亿参数的AI模型推理 [39] 企业应用与合作 - 微软宣布Windows 11的Copilot应用正式支持语音唤醒指令"Hey Copilot",同时在所有市场上线Copilot Vision功能 [42] - 影目科技发布新一代AI智能眼镜INMO GO3,并宣布打造AI+AR产业生态平台影目世界,携手腾讯、蚂蚁集团、智谱AI等公司共建原生内容生态 [42] - 华泰证券上线AI原生应用"AI涨乐",该应用为国内首个专注交易场景的AI原生应用,推出语言用户界面主打盯盘和选股功能 [42] - 沃尔玛宣布与OpenAI建立合作,消费者可在ChatGPT内直接购物并使用即时结账功能 [42] - 谷歌与世界银行宣布建立全新联盟,合作聚焦部署开放网络堆栈,整合谷歌云AI技术与世界银行发展专长 [42] - X旗下AI助手Grok正式推出即时语音搜索功能,用户可通过语音直接触发网页搜索并获取答案 [42]
腾讯研究院AI速递 20251017
腾讯研究院· 2025-10-17 07:06
谷歌视频生成模型Veo 3.1 - 谷歌发布视频生成模型Veo 3.1,具备更强叙事与音频控制、首尾帧与多图参考等精控功能,并接入Gemini API与Vertex AI [1] - 模型支持720p或1080p分辨率24fps视频,原生时长4-8秒,使用Extend功能最长可扩展至148秒,可合成多人物场景并实现音画同步 [1] - 用户已在Flow中生成超过2.75亿个视频,但成片质感较Veo 3进步有限,基础物理表现有所改善但人物表演与复杂调度仍存在问题 [1] Anthropic轻量模型Claude Haiku 4.5 - Anthropic发布轻量级模型Claude Haiku 4.5,编码性能可与Claude Sonnet 4相媲美,成本仅为其三分之一(每百万输入token 1美元,输出5美元),推理速度提升一倍多 [2] - 在计算机使用基准OSWorld上得分50.7%超越Sonnet 4的42.2%,数学推理测试中借助Python工具成绩高达96.3%远超Sonnet 4的70.5% [2] - 模型主打实时低延迟任务场景如聊天助手、客服、协同编程,通过严格安全性评估,偏差行为发生率显著低于其他Claude模型 [2] 阿里通义千问记忆功能 - 阿里通义千问正式上线Qwen Chat Memory功能,使AI能够记录并理解用户在过去对话中的重要信息,包括个人偏好、兴趣方向或特定任务背景 [3] - 该功能可跨越多轮甚至多天对话保留个性化认知,是AI助手向长期陪伴型智能体迈出的关键一步 [3] - 所有记忆内容可由用户查看、管理和删除,用户拥有完整控制权,首先在网页版Qwen Chat上线,未来推广至更多终端 [3] 字节跳动语音模型升级 - 火山引擎升级豆包语音合成模型2.0和声音复刻模型2.0,通过Query-Response能力实现情境理解与语气把控,可通过细节描述精准生成对应情感 [4] - 语音合成2.0提供默认模式、语音指令和引入上文三种模式,可控制整段情绪基调、方言类型、语速音调等,模型能自动理解上下文情绪连贯生成 [4] - 声音复刻2.0可精准复现动漫人物和真人音色语速情绪,对公式朗读测试准确率接近90%,在教育场景专项优化 [4] 谷歌与耶鲁大学AI抗癌研究 - 谷歌与耶鲁大学联合发布270亿参数大模型Cell2Sentence-Scale(C2S-Scale),基于Gemma模型构建,提出并验证让肿瘤对免疫系统更易被识别的全新抗癌假设 [5][6] - 模型通过双环境虚拟筛选流程对4000多种药物进行模拟,发现激酶CK2抑制剂silmitasertib仅在免疫信号活跃环境中显著增强抗原呈递,该预测已在体外实验中多次验证 [6] - 研究展示AI模型生成原创科学假设的潜力,有望打开人类抗癌新途径,模型及代码已在Hugging Face和GitHub全面开放 [6] AI模型训练与工程挑战 - Anthropic预训练团队负责人强调预训练核心是推动损失函数下降,如何平衡预训练和后训练、各自作用叠加还是互补仍在早期探索阶段 [7] - 当前AI研究最大瓶颈是计算资源受限而非算法突破,真正的挑战在于如何有效利用算力并解决规模扩展中的工程难题 [7] - 对齐问题核心是让模型分享人类目标,预训练与后训练各有优势,后训练迭代快适合调整模型,某些对齐可融入预训练增强鲁棒性和智能性 [7] 上下文工程技术 - LangChain创始工程师与Manus联合创始人探讨上下文工程,强调AI Agents执行复杂长期任务时上下文窗口会因大量工具调用急剧膨胀导致性能下降 [8] - 有效的上下文工程通过卸载、精简、检索、隔离和缓存等技术,将恰到好处的信息填入上下文窗口,Manus设计了基于多层阈值的自动化流程协同使用压缩和总结 [8] - 核心设计哲学是避免上下文过度工程化,最大性能飞跃来自简化架构和信任模型,优先选择上下文工程而非过早模型专业化 [8] AI在开发领域的应用现状 - Google Cloud DORA 2025报告显示90%开发者已在日常工作中使用AI,每天中位数使用时长2小时约占工作日四分之一,但只有24%表示高度信任AI输出 [9] - AI不是单向效率药丸而是放大镜,在文化健康协作顺畅团队中作为加速器提升效率,但在环境存在问题的团队会放大裂缝导致交付更加不稳定 [9] - 报告首次提出七种典型团队人设和DORA AI能力模型,包括用户导向、版本控制、数据可用性等七项关键能力 [9] NVIDIA发展历程与AI战略 - 黄仁勋回顾1993年红杉100万美元投资NVIDIA,三十年后成长为超过1万亿美元市值实现100万倍回报,强调从第一性原理推演未来是突破关键 [10] - CUDA的诞生让GPU从图形设备变成通用加速平台,2012年AlexNet在ImageNet竞赛获胜成为转折点,NVIDIA为神经网络开发CUDNN库使模型训练速度成倍提升 [11] - AI工厂核心是系统整合而非芯片性能,从建筑供电到软件栈提供完整算力生产线,主权AI成为新一轮国家竞争核心 [11]