Workflow
腾讯研究院
icon
搜索文档
腾讯研究院AI每周关键词Top50
腾讯研究院· 2026-01-17 10:33
芯片与硬件 - 美国发布AI芯片新规 [3] 模型与算法 - DeepSeek开源「记忆」功能 [3] - UniPat AI推出「纯视觉考卷」模型 [3] - 美团提出新的稀疏注意力机制 [3] - 谷歌发布MedGemma 1.5医疗模型 [3] - 智谱发布GLM-Image模型 [3] - 爱诗科技推出实时世界模型 [3] - 1X公司发布1X World Model [3] - 千寻智能发布Spirit v1.5 [4] - 阶跃星辰发布Step-Audio-R1.1 [4] 应用与产品 - Anthropic对部分国家实施访问限制 [3] - xAI开源推荐算法 [3] - Tailwind CSS讨论AI编程的影响 [3] - 追觅发布家庭机器人 [3] - 清华大学研究AI药物筛选 [3] - 谷歌推出UCP协议 [3] - Midjourney发布Niji 7动漫模型 [3] - 昆仑万维发布Video v1.0 [3] - Anthropic推出AI办公Cowork [3] - 苹果与谷歌就Gemini展开合作 [3] - OpenAI收购Torch医疗公司 [3] - Anthropic推出HIPAA级医疗AI [3] - 百川发布医疗大模型 [3] - OpenAI展示AI音频设备 [3] - 谷歌发布Veo 3.1 [3] - Vidu发布AI MV工具 [3] - 马斯克展示AI游戏选手 [3] - 谷歌推出Personal Intelligence [4] - 英伟达进行智驾实测 [4] - 千问App推出AI购物功能 [4] - 滴滴推出小滴Agent [4] - GPT-5.2在长程任务上取得突破 [4] - 擎天租推出机器人租赁服务 [4] - 逐际动力推出COSA系统 [4] - 哥伦比亚大学研发人脸机器人 [4] 行业观点与趋势 - OpenAI讨论模型「能力过剩」现象 [4] - YC分享AI原生公司发展路径 [4] - 月之暗面进行Kimi技术分享 [4] - Anthropic探讨Agent评估方法 [4] - 多家公司讨论AGI-Next发展方向 [4] - Anthropic总结开发效率规律 [4] - Linux之父称赞Vibe Coding体验 [4] - 马斯克对AGI发展做出预测 [4] - MIT评选2026年十大突破性技术 [4] - Fal平台分析内容生成发展趋势 [4] - 谷歌探讨AI时代的软件工程 [4]
AI发现的25个好故事
腾讯研究院· 2026-01-16 19:24
文章核心观点 - 文章通过AI在全球范围内发掘了25个被主流媒体忽略的商业案例,这些案例的共同点在于利用技术解决真实、具体的社会或环境问题,而非追求炫酷的概念或高估值 [3][4] - 这些案例揭示了真正的创新往往发生在经济系统的“下水道”或被认为“无利可图”的领域,其核心是将“无用”变为“有用”,修补世界破损的循环 [6][7] - 技术在这些案例中的角色并非取代人类,而是重构人的尊严和价值,赋能个体,并倾向于构建新经济的底层操作系统,成为“铺路人”而非“淘金者” [10][13] - 改变世界往往始于微小的、具体的痛点,这些商业点子通过解决真实问题和连接真实的人,最终累积成巨大的价值 [16][17] 根据相关目录分别进行总结 环保与资源循环创新 - **ZwitterCo** 发明了一种能够“免疫”污垢的两性离子过滤膜,解决了传统反渗透膜易被油脂和蛋白质堵塞的问题,致力于处理全球80%未经处理即排放的废水 [6] - **EcoPeace** 制造太阳能动力小船在韩国湖泊巡游,吸入藻类并收集数据,还打造了兼具游船和夜市功能的“治愈之舟”,用商业利润供养环保成本 [6] - **TBM** 在日本利用主要成分为石灰石的LIMEX材料制造纸张和塑料替代品,该过程几乎不消耗水和木材 [7] - **哥伦比亚的创业公司** 将咖啡加工中废弃的果肉转化为富含抗氧化剂的超级食品原料,变废为宝 [8] - **印度的Brisil** 从稻壳灰中提取高性能二氧化硅,销售给轮胎制造商用于生产“绿色轮胎” [8] - **Kind Designs** 在美国使用3D打印技术制造表面模仿红树林根系纹理的海堤,促进牡蛎等海洋生物附着,使海堤随时间推移愈发坚固并净化海水 [13][17] 能源与建筑效率革新 - **Ampd Energy** 在香港用大型电池集装箱取代建筑工地的柴油发电机,减少污染和噪音,并将建筑业接入数字时代 [7] - **WexEnergy** 在纽约为旧楼窗户安装高科技隔热板,无需更换窗户即可将建筑能效提升一倍 [7] - **Brenmiller Energy** 在以色列利用碎石进行热能储存,该方案成本低、寿命长,旨在解决工业热能的脱碳难题 [7] 医疗健康与赋能体系 - **Abridge** 在美国利用生成式AI实时聆听医患对话并自动生成电子病历,让医生能更专注于患者,改善医患关系 [10] - **Buymed** 在越南建立一个强大的B2B供应链和物流网络,连接了数万家小型药店,而非建立自有连锁店来竞争 [12] - **Nutrix** 开发唾液皮质醇检测仪,试图量化企业的“职业倦怠”问题 [16] - **PetPharm** 着眼于韩国6000家药店,旨在盘活被浪费的动物药品分销渠道 [16][24] 农业与食品技术 - **EasyRice** 在泰国利用AI进行大米质量检测,将质检速度提高10倍,在农民与收购商之间提供客观公正的评估标准 [11] - **UMAMI Bioworks** 在新加坡从事细胞培养海鲜研发,其定位是成为海鲜食品工业的赋能者与核心部件供应商(类似“Intel Inside”) [11] - **Belterra** 在巴西亚马逊雨林通过金融和技术支持系统,让农民发现“种树比砍树更赚钱” [11] 乡村发展与社区赋能 - **Frontier Markets** 在印度农村赋能超过两万名被称为“Saheli”(闺蜜)的农村女性,通过配备平板电脑,她们以建立信任的方式推广和销售产品,攻克电商“最后一公里”难题 [2][10] - **Jibu** 在非洲通过特许经营模式,支持当地创业者经营水站,在提供洁净水的同时创造收入和尊严 [11] - **Satoyume** 在日本山梨县小菅村进行乡村振兴实践,将整个村庄重构为一个“拥有700名员工的酒店”,让村民深度参与其中 [13] 监测与生态保护 - **Synature** 在瑞士利用AI音频监测技术监听森林中的狼嚎和虾的进食声等,定位为“全球动物监测的神经系统”,服务于生态保护和精准农业 [13]
腾讯研究院公众号获“AIGC Rank 2025年度影响力AI媒体”
腾讯研究院· 2026-01-16 19:24
公司荣誉与定位 - 腾讯研究院公众号在AIGC Rank发布的2025年度榜单中获评“年度影响力AI媒体”[5] - 公司秉持“用户为本、科技向善”的使命愿景,致力于在人工智能时代锚定人文关怀与制度理性,推动AI健康、包容、可持续发展[7] 年度内容产出与影响力 - 全年发布人工智能相关深度文章共计120篇,系统探讨大模型治理、算法伦理、数字劳动、智能社会等前沿议题[9] - 多篇原创内容引发学界与业界广泛关注,其中单篇最高阅读量突破5万次[9] - 在全年248个工作日中,坚持每日推出「每日AI速递」栏目,累计发布248期,追踪全球AI政策、技术突破与社会影响[9] - 每周推出「AI关键词」专栏,全年共发布50期,通过概念解析帮助公众理解技术背后的制度逻辑与人文关切[9] 未来方向 - 公司计划在2026年继续深耕AI时代的社会科学研究,强化跨学科对话,拓展公共讨论的深度与广度[7]
腾讯研究院AI速递 20260116
腾讯研究院· 2026-01-16 00:06
美国对华AI芯片出口政策调整 - 美国对英伟达H200、AMD MI325X等先进AI芯片征收25%关税,并将对华出口许可审查从“推定拒绝”改为“逐案审查” [1] - 新规限制对华芯片数量不得超过美国客户总量的一半,并针对特定技术参数(如TPP在14000-21100、DRAM带宽4500-6200GB/s)的芯片征收关税 [1] - 美国通过《远程访问安全法案》限制中国通过云计算服务远程获取AI芯片,并要求商务部在7月前提供数据中心芯片市场最新情况 [1] 谷歌发布Personal Intelligence功能 - 谷歌正式发布由Gemini 3模型驱动的Personal Intelligence功能,底层打通Gmail、Photos、YouTube和Search四大应用,实现跨应用数据调取与私有上下文理解 [2] - 该功能内置自然语言纠错机制,用户可直接在对话框指出AI错误,系统实时修正认知记录 [2] - 功能目前处于Beta测试阶段,优先向Google AI Pro和AI Ultra等付费用户开放,支持全平台,未来将覆盖免费版用户 [2] 英伟达智能驾驶技术进展 - 英伟达搭载全新L2++级辅助驾驶系统的奔驰CLA在旧金山完成近40分钟测试,表现流畅无碰撞,被认为与特斯拉FSD能力相当且因雷达冗余感知更安全 [3] - 公司计划2026年上半年推出L2级高速与城市驾驶功能,2026年底覆盖全美,2027年推进Robotaxi部署,2028年实现L3级高速公路驾驶 [3] - 英伟达仅用1年实现城市自动驾驶功能追平特斯拉8年成果,采用Drive AGX Thor芯片(约3500美元),基于强化学习系统持续改进 [3] 阿里千问App上线AI办事功能 - 千问App上线400多项办事功能,接入淘宝、支付宝、飞猪、高德等阿里生态,首次实现点外卖、购物、订机票酒店等AI购物功能 [4] - 新增功能包括AI点外卖(支付在对话界面内完成无需跳转)、AI打电话订餐厅、50项政务服务直达入口、智能旅行规划等 [4] - 上线“任务助理”功能,提供应用开发、办公、咨询、生活办事等能力,得益于AI Coding、全模态理解、超长上下文处理等技术突破 [4] 滴滴上线出行AI助理“小滴” - 滴滴上线Agent“小滴”,用户通过一句话即可选择油电动力、空气清新、车型车色,并能识别模糊需求(如“带大件行李”)自动推荐合适车辆 [5][6] - “小滴”具备需求优先级排序能力,分为“必要”、“优先安排”等多个等级,优先满足排序靠前的需求 [6] - 上线3个多月迭代后,AI激活了滴滴精细化运营积累,机器人能记住用户习惯提供个性化服务 [6] 阶跃星辰语音模型技术突破 - 阶跃星辰原生语音推理模型Step-Audio-R1.1登顶Artificial Analysis Speech Reasoning榜单,以96.4%准确率超越Grok、Gemini、GPT-Realtime等主流模型 [7] - Step-Audio-R1是全球首个开源原生语音推理模型,可端到端理解语音内容,实现深度语音推理、实时响应和音频领域可扩展CoT,无需增加额外时延 [7] - Step-Audio-R1.1兼顾更强实时对话和复杂语音推理能力,完整实时语音API将于2月上线,目前chat模式已支持边想边说的流式推理 [7] AI代码生成能力展示 - Cursor CEO让GPT-5.2连续运行168小时,写下300万行代码、数千个文件,从零构建出包含HTML解析、CSS布局、文本渲染和JavaScript虚拟机的完整浏览器 [8] - 项目采用多智能体系统分层架构(规划者、执行者、评审者),实现上百个Agent协同工作数周几乎无冲突 [8] - 实验显示GPT-5.2能长时间自主工作并保持专注,而Claude Opus 4.5倾向尽早结束任务,GPT-5.1-Codex规划能力较弱容易中断 [8] 机器人租赁平台“擎天租”发展 - 全球首个机器人租赁平台“擎天租”完成种子轮融资,高瓴创投领投,复星创富、慕华科创等跟投 [9] - 平台上线三周注册用户突破20万,日均租赁订单稳定在200单以上,连接50个核心城市600多家服务商,汇聚1000多台不同品牌机器人设备 [9] - 采用共享租赁+平台化调度模式,租金从长租200元/天到日租上千元梯度定价,与中国人保财险合作推出损伤险和责任险,承诺“只换不修” [9] 仿生面部机器人技术进展 - 美国哥伦比亚大学研究登上Science Robotics封面,展示具备仿生面部结构的人形机器人,通过深度学习实现与语音和歌曲同步的真实唇部运动 [10] - 机器人面孔在柔性硅胶皮肤下隐藏20余个微型电机,通过“视觉-动作”自监督学习构建Facial Action Transformer模型,观察自己面部变化学会控制表情 [11] - 机器人可将声音信号直接转化为连续自然的唇部运动,在多种语言、不同语音环境甚至歌曲中均能完成连贯的唇部同步,跨语言泛化能力稳健 [11]
谁在沉迷AI算命?
腾讯研究院· 2026-01-15 17:14
生成式AI,与传统的算命手艺相遇,产生了让人意想不到的化学反应。 无论是大西洋两岸的占星和塔罗牌,还是中国本土的梅花易数和生辰八字,都是在主流商业视野之外, 最为"闷声发大财"的AI商业化品类。 章文龙 腾讯研究院特约作者 AI算命,就这样成为了时代情绪的出口。 被AI重塑的算命生意 AI算命,或者说"线上玄学",其历史远比大模型更久。早在2000年左右,国内就出现了第一批线上算命 网站。 在海外,线上算命甚至得到了资本的青睐。2017年,一位理工科背景的印度投资人Puneet Gupta,创办 了在线占星咨询平台Astrotalk。 Astrotalk的由来颇具戏剧性。Puneet Gupta原本对占星术持怀疑态度,他在2015年从投行离职,创办了 一家IT服务公司 CodeYeti。彼时,一位兼职占星师的同事预言,CodeYeti 将在两年内倒闭,而他在 2017-2018年开启的新事业将会取得巨大成功。 两年后,CodeYeti 果然因合伙人离开而关停。"破防"的 Gupta 转而投身玄学赛道,Astrotalk 应运而生。 如今,Astrotalk 已垄断了印度本土在线占星 80% 的市场份额,坐拥 ...
腾讯研究院AI速递 20260115
腾讯研究院· 2026-01-15 00:03
美国对华AI芯片出口管制政策调整 - 美国商务部工业和安全局修改出口管制条例,将高性能芯片限制放宽至TPP低于21000和DRAM带宽低于6500GB/s,为英伟达H200和AMD MI325X对华出口创造了法律空间 [1] - 新规要求申请人证明美国市场有足够供应且对单一国家出口不超过美国总销量的50%,预计到2026年,H200芯片可为英伟达贡献超过476亿美元营收,其中中国市场贡献近160亿美元 [1] - 美国众议院以369票通过《远程访问安全法案》,限制通过云平台远程接入获取先进算力以训练AI模型,此举可能冲击海外合建数据中心项目 [1] 全球AI视频生成技术竞争加剧 - 谷歌Veo 3.1实现重大升级,新增“素材生视频”功能,通过上传图片和文本指令即可生成高质量视频,角色一致性达到新高度,并支持原生9:16竖屏输出及1080p、4K超分辨率技术,直接适配移动端平台 [2] - 爱诗科技发布全球首个支持最高1080P分辨率实时生成的世界模型PixVerse R1,用户可通过文字或语音实时干预视频生成过程,将视频生成从“固定片段”转变为“无限可视化流” [4] - Vidu AI开放平台推出“一键生成MV”功能,用户提交音乐、参考图像与文本指令后,系统可全自动输出叙事连贯、音画同步的MV,其“多图参考生视频”技术允许上传至多7张参考图,在长达五分钟的视频中精确复刻人物特征与美学风格 [5][6] 中国AI模型与算力自主化进展 - 智谱AI联合华为开源新一代图像生成模型GLM-Image,该模型基于昇腾Atlas 800T A2设备和昇思MindSpore框架完成全流程训练,是首个在国产芯片上完成的SOTA多模态模型,在相关榜单获得开源第一,中文文字渲染成绩达0.979 [3] - GLM-Image模型API调用生成一张图片成本仅需0.1元,特别擅长海报、PPT、科普图等知识密集型场景及汉字生成任务 [3] 具身智能与机器人技术突破 - 1X公司为其家用人形机器人NEO发布全新“大脑”1X World Model,该模型通过观看海量网络视频和人类第一视角实操录像来理解物理世界,基于140亿参数生成式视频模型,采用多阶段训练策略 [7] - 该模型的逆动力学模型在400小时未经过滤的机器人数据上训练,能从生成的视频中提取对应动作轨迹,官方推文浏览量已突破500万 [7] AI在游戏与医疗领域的应用与影响 - 《英雄联盟》韩服出现神秘玩家,在51小时内完成56局对局,取得52胜4败、综合胜率92%的战绩,登顶时胜率高达95%,该账号使用了22名不同英雄,对线胜率86%断层领先,引发关于其是否为AI的广泛猜测 [8] - 谷歌发布MedGemma 1.5 4B版本,首次支持CT和MRI三维体数据以及全切片数字病理图像等高维医学影像分析,将MRI疾病发现分类准确率从51%提升至65%,解剖结构定位精度从3%跃升至38% [9] - 同步推出的MedASR语音识别模型,在胸部X光报告口述场景中词错误率仅5.2%,比通用模型Whisper低82% [9] AI对软件工程行业的结构性冲击 - 谷歌Cloud AI总监提出AI时代软件工程面临的五个关键问题,涉及初级工程师需求、基本功价值、职业角色转变、专才风险及大学计算机专业必要性 [10] - 哈佛研究显示,公司引入生成式AI后,初级开发者岗位数量在六个季度内下降约9%-10%,而高级工程师就业几乎没有变化,大型科技公司招聘应届生数量减少50% [11] - 建议初级工程师构建AI集成作品集并手动编写关键算法,资深工程师需注重架构审查以适应“代理式”工程环境,通才将比专才更具竞争力 [11]
中美AI巨头都在描述哪种AGI叙事?
腾讯研究院· 2026-01-14 16:33
文章核心观点 - 2025年人工智能领域的技术发展标志着“暴力美学”时代的终结,行业从单纯依赖堆砌参数转向深化基础研究,以突破通用人工智能的瓶颈 [5] - 技术进步主要集中在流体推理、长期记忆、空间智能和元学习四大领域,旨在解决模型在即时推理、长期记忆和视觉处理等方面的能力偏科问题 [6] - 通过测试时计算、新型记忆架构、世界模型和元学习等方向的突破,行业在“补短板”方面取得了显著成功,为模型能力的整体提升和未来演进奠定了基础 [7] 流体推理的进化 - **测试时计算的范式革新**:智能被重新定义为不仅是参数的函数,也是时间的函数,以OpenAI o1和DeepSeek R1为代表的模型通过在推理阶段投入更多计算资源进行“慢思考”,实现了推理能力从0到8的质变 [11][12][13] - **强化学习工程优化**:强化学习在提升推理能力中扮演关键角色,其工程可拆分为探索策略、评分系统和参数更新算法三部分,2025年后两部分有明显发展 [15] - **评分系统革新**:基于可验证奖励的强化学习和稀疏奖励指标全面崛起,通过给予模型对错结论作为奖励信号,使其能自发探索推理过程,大幅提升了在数学、代码等领域的能力 [16][17] - **参数更新算法革新**:GPRO算法流行,它通过让模型生成一组答案并计算平均分来替代传统的评论家模型,节省了50%的显存,成为国内各家公司在2025年延展的基础框架 [19] - **强化学习存在天花板**:研究发现强化学习的性能增长符合S型曲线而非幂律,存在性能天花板,但其工程实践(如使用长思维链和大批量大小)已变得更加精确和可预测 [21][23] 记忆与学习 - **记忆能力是短板**:长期记忆存储是通往通用人工智能得分中仍为0的能力分支,缺乏记忆导致模型无法在现实中自我学习,且个性化体验难以实现 [25][26] - **Titans架构突破**:这是一个深度的神经长期记忆模块,能在推理时实时更新自身参数,根据输入信息的“惊奇度”决定存储内容,并引入遗忘机制,从根本上挑战了Transformer的无状态假设 [28][29][30][31] - **Nested Learning架构**:将模型参数按低、中、高频率分层更新,使整个模型参数非冻结,能够持续学习和保有长期记忆,其成本低于传统的监督微调和强化学习方法 [31][33] - **RAG的模型化演进**:检索增强生成系统从静态资料库演变为具备反思与进化能力的系统,例如ReMem引入了“行动-思考-记忆-优化”的全链路处理,能对记忆进行修剪、重组和清理,实现经验复用 [35][36][38] - **克服灾难性遗忘**:通过稀疏记忆微调等方法,模型在注入新知识时仅更新部分参数槽位,在TriviaQA任务中仅导致11%的旧知识遗忘,远优于全量微调的89% [39][40] - **策略蒸馏进步**:在策略蒸馏结合了强化学习的采样和监督微调的密集反馈,让学生模型在自己的“犯错分布”中学习,提供了一种低成本且避免遗忘的参数更新方式 [42] 空间智能与世界模型 - **视觉处理能力提升**:在Sora 2、Veo 3等视频生成模型爆发的推动下,视觉处理能力从2024年的0分提升至2025年的5分,模型开始展现出对物理规律的掌握 [45] - **自监督生成模型的缩放定律**:视觉自回归模型和扩散Transformer被证实遵循特定的缩放定律,例如DiT模型对批量大小和学习率高度敏感,但遵循特定定律后能力可大幅提升 [46][47] - **原生多模态的优势**:研究发现,尽管训练效率较低,但原生多模态架构在参数利用率上可能比晚期融合架构有更高的性能上限 [49] - **VAE的替代方案**:SVG模型通过直接用图像理解模型代替变分自编码器,统一了语义空间,据称训练效率提升6200%,并在多项指标上击败了扩散Transformer和SDXL [50] - **符号主义的世界构建**:以李飞飞团队Marble平台为代表,其基于3D高斯泼溅等技术,从多模态输入生成可探索的3D空间表示,追求更稳定和可控的生成效果 [53][55][56] - **预测即理解的路径**:Meta的V-JEPA 2通过预测被遮挡的视觉内容来学习物理规则的表征,在使用超100万小时视频训练后,模型展现出了反事实预测的能力 [57][58][59] 元学习 - **元学习的核心价值**:赋予模型“学习如何学习”的能力,使其能通过少量样本快速适应新问题,是实现低成本快速适应和应对未知世界的关键 [62][63] - **对上下文学习的重新审视**:有研究认为上下文学习可能只是激活了预训练知识而非真正学习,这与元学习理念不同,但2025年出现了利用改进的上下文框架进行元学习的新尝试 [64][65] - **测试时计算催生隐式元学习**:研究证明模型在推理时的长思维链探索本质上是寻找最优路径,通过优化探索策略(如最小化累积遗憾)可以引导模型学会如何分配算力进行有效思考 [66][69] - **显式元学习系统的探索**:例如DiscoRL系统,通过内外双层循环让AI自主发现学习算法,其发现的Disco57算法在雅达利基准上击败了人类设计的顶级算法,并展现出强大的泛化能力 [70][72] - **中训练路径**:介于预训练和强化学习之间,让智能体通过自主探索产生后果并反思,以建立因果模型,在复杂环境中的成功率平均提升9.6% [72][73] 其他关键技术进展 - **对抗数据与算力瓶颈**:行业通过混合专家模型、合成数据与强化学习结合来突破瓶颈,例如利用DeepSeek-R1生成的长思维链数据对小模型微调,效果优于人类专家编写的数据 [81][82] - **数据质量重于数量**:研究表明数据达到一定规模后存在冗余,筛选前10%最长、最复杂的推理路径样本进行训练,其效果可匹配甚至超越全量数据集 [83] - **合成数据与模型崩溃**:大规模使用合成数据可能导致模型崩溃,但通过自我验证机制过滤(如设定置信度阈值)或使用另一个模型作为裁判进行清洗,可以有效缓解此问题 [85][86] - **小模型能力的飞跃**:蒸馏技术的进步是关键,包括针对混合专家模型的特化蒸馏方案(学习所有专家的“暗知识”)以及思维融合蒸馏(提取多个教师模型的稳健推理逻辑) [88][90][92] - **注意力机制演进**:多头潜在注意力及其变体普及,用于降低显存占用;线性注意力通过混合架构(如Kimi Linear的3:1设计)在性能上首次全面超越全注意力,并在1M上下文解码时吞吐量达到全注意力的6.3倍 [94][96] - **连续空间建模**:大型概念模型和连续自回归语言模型等尝试打破离散词元的限制,通过预测连续概念向量来提升语义带宽和推理速度 [97][100] 2026年可能的技术方向 - **记忆工程化实践**:记忆技术预计将在2026年迎来大规模工程化落地,涉及架构层革新或现有RAG、监督微调技术的精修,以实现持续学习和个性化智能体 [103][104] - **标准架构变革**:模型架构可能向分区、分层、增加功能层(如记忆层)的混合架构演进,以更贴近人脑运作模式,补齐能力短板 [105][106] - **自进化AI的探索**:在记忆、合成数据和元学习等技术完善的基础上,能够让AI进行自我对弈、自我算法优化的自进化研究将在2026年产生更多可能性 [107][112]
腾讯研究院AI速递 20260114
腾讯研究院· 2026-01-14 00:29
Anthropic发布AI办公助手Cowork - 公司发布AI办公神器Cowork,复用Claude Code底层逻辑,可创建文档、制定计划、分析数据并自动整理桌面文件 [1] - Cowork具备主动性与自主性,能自主制定计划并实时同步进度,支持连接器整合外部信息源并与Chrome联动,Claude Max用户可在macOS应用抢先体验 [1] - 该工具由团队仅用一周半开发完成,Claude Code编写了100%的代码,默认需用户明确授权且可随时叫停 [1] 苹果与Google达成AI合作协议 - 苹果与Google达成多年深度合作协议,下一代苹果基础模型将基于Gemini构建,新版Siri将基于Gemini彻底重造,数据通过私有云计算运行以保护隐私 [2] - 苹果AI团队面临严重人才流失,100多人团队已有数十名核心成员跳槽,Gemini拥有1.2万亿参数远超苹果现有1500亿参数,合作成为按时交货的必然选择 [2] - Google每月处理1.3千万亿Tokens,Gemini全球市场份额突破20%,马斯克批评这是权力过度集中,OpenAI地位从默认智能层降为辅助角色 [2] DeepSeek发布条件记忆模块Engram - DeepSeek发布新论文提出条件记忆Engram模块,与MoE条件计算互补,通过O(1)时间复杂度完成知识查找,解决Transformer缺少原生知识查找机制的问题 [3] - Engram将270亿参数扩展至等参数等FLOPs条件下显著优于纯MoE基线,MMLU提升3.4、BBH提升5.0、HumanEval提升3.0,长上下文检索准确率从84.2%提升至97.0% [3] - 结合元旦期间公布的mHC研究,DeepSeek V4的模样愈发清晰,条件记忆将成为下一代稀疏大模型核心建模原语,支持从主机内存预取且几乎无性能开销 [3] OpenAI收购AI医疗初创公司Torch - OpenAI以约1亿美元(约合人民币6.79亿元)收购AI医疗初创公司Torch,其中6000万美元立即兑现,其余用于员工留任激励 [4] - Torch支持接入Kaiser Permanente、Apple Health等医疗系统数据,统一查看实验室检测结果、处方信息及就诊记录,并通过AI进行归类整理和健康洞察 [4] - Torch四人创始团队全部加入OpenAI参与构建ChatGPT Health模块,此前曾创办并运营线上诊所平台Forward,于2024年末关闭后创立Torch [4] Anthropic推出医疗级AI服务 - Anthropic推出符合HIPAA标准的医疗级AI服务,允许医院医疗机构及个人用户在合规前提下处理受保护健康数据,明确引用PubMed、NPI注册表等权威数据库 [5][6] - Claude支持从Apple Health、Function Health等应用导出个人健康数据进行汇总和理解,承诺不使用任何医疗用户数据训练模型 [6] - 美国最大非营利医疗系统之一Banner Health已有超22000名临床服务提供者使用Claude,85%使用者认为工作效率提升,与诺和诺德、斯坦福医疗保健等机构展开合作 [6] 百川开源医疗大模型Baichuan-M3 - 百川开源Baichuan-M3医疗大模型,在HealthBench以65.1分综合成绩位列全球第一,HealthBench Hard以44.4分夺冠,全面超越GPT-5.2,幻觉率3.5%全球最低 [7] - M3首次具备原生端到端严肃问诊能力,提出SCAN原则(安全分层、信息澄清、关联追问、规范化输出),问诊能力显著高于真人医生平均水平 [7] - M3采用全动态Verifier System升级强化学习系统,设计新SPAR算法解决长对话训练问题,医疗应用百小应已同步接入M3面向医生与患者开放 [7] OpenAI计划量产特殊音频硬件Sweetpea - OpenAI硬件项目To-go确认为取代AirPods的特殊音频产品,内部代号Sweetpea,富士康已接到通知要求在2028年第四季度前为五款设备做好量产准备 [8] - 该设备由Jony Ive团队设计,主机采用金属材质外形酷似卵石,内部装有两个胶囊状单元可佩戴耳后,主处理器目标锁定2nm制程芯片让AI推理在本地运行 [8] - 预计2026年9月发布,第一年预估出货量4000-5000万部(AirPods年出货量约6000-7000万),定制芯片允许用户通过指令控制替代iPhone操作 [8] 美团发布稀疏注意力机制LoZA - 美团LongCat系列发布稀疏注意力机制LoZA,将50%低性能MLA模块替换为流式稀疏注意力SSA,形成ZigZag交错结构,计算复杂度降至线性级O(L·S) [9] - 处理128K上下文解码速度比原版快10倍,256K上下文预加载速度快50%解码阶段省30%算力,LongCat-Flash-Exp解锁1M上下文窗口,性能超越Qwen-3 [9] - LoZA无需从头训练在中期训练阶段即可完成改造,每个窗口包含1个全局块和7个局部块(单块128Token),设计1024Token稀疏窗口兼顾局部细节与整体逻辑 [9] 2026年十大突破性技术趋势 - MIT科技评论发布2026年十大突破性技术,涵盖超大规模AI数据中心、钠离子电池、碱基编辑、机制可解释性、先进核反应堆等十大方向 [10] - 其中,超大规模数据中心吞噬超1吉瓦电力足以供整座城市使用,钠离子电池已在特定车型应用,碱基编辑首例N=1定制治疗成功 [11] - 报告特别关注AI发展从“能做什么”转向“该做什么”,生命科学在伦理争议中持续突破认知边界,技术与伦理平衡成为核心议题 [11] AI内容生成趋势与价值 - Fal平台CEO透露生成5秒24帧视频算力消耗是生成200个token文本的12000倍,4K分辨率再增10倍,顶级视频模型半衰期仅30天 [12] - Fal平台支持600多个生成式媒体模型,前100名客户平均同时使用14个不同模型,团队认为动画、动漫或卡通类内容会最先实现AI生成规模化 [12] - 对话认为当内容生成变得无限时有限IP反而更有价值,视频模型架构需提升10-100倍才能实现4K实时生成,教育和个性化广告是最具潜力应用场景 [12]
腾讯研究院数字内容研究实习生招聘
腾讯研究院· 2026-01-13 16:35
文章核心观点 - 腾讯研究院正在招聘数字内容研究方向的实习生 该岗位聚焦于影视、综艺、短视频、微短剧等数字内容产业及文化与科技融合创新的研究 要求应聘者具备行业研究能力并能熟练运用AI工具 [1][3][4] 岗位职责与工作内容 - 研究方向涵盖影视、综艺、短视频、微短剧等数字内容产业发展及文化与科技融合创新 [1][3] - 工作内容包括提供研究支持 并综合应用各类AI工具完成信息查询、数据分析、案例研究和文章撰写 [2][3][4] - 需完成日常交办的其他工作 [5] 岗位要求与任职资格 - 学历与专业要求为重点大学的出版、经管、统计、传媒等专业在校硕士或博士研究生 有相关研究成果者可放宽专业限制 [7] - 候选人需了解数字内容行业趋势与技术创新 对影视、综艺、短视频、微短剧等行业热点有独立认识和思考 并具备互联网行业研究经验 [7] - 需具备较强的写作能力、数据分析能力和行业研究素养 喜爱研究并有意从事研究工作 [7] - 要求责任感强且有契约精神 实习期6个月以上者优先 [7][8] 工作安排与待遇 - 实习时间要求每周坐班5天 实习期6个月以上 立即上岗者优先 [1] - 工作地点位于北京市朝阳区亚洲金融大厦 [9] - 工作待遇为税后150元/天 [9]
胡泳:海外青少年社交媒体限制,背后的逻辑与趋势
腾讯研究院· 2026-01-13 16:35
澳大利亚社交媒体年龄禁令立法 - 澳大利亚议会于2024年11月28日通过《2024网络安全修正案》,自2025年12月10日起禁止16岁以下未成年人持有社交媒体账户,涵盖Facebook、Instagram、TikTok、Snapchat、Reddit和X等主要平台 [3] - 法律要求平台采用可靠的年龄验证机制,而非仅依赖用户自我申报,违者将面临最高5000万澳元(约合2.35亿元人民币)的罚款 [3] - 该法案被视为全球数字治理领域的重要先例,Meta公司声明自2025年12月4日起将阻止澳大利亚16岁以下青少年注册新账户并移除相关账号 [3] 全球政策扩散与反应 - 澳大利亚的立法成为国际政策扩散的催化剂,英国政治领导人已考虑对未成年人使用社交媒体实施类似限制,并明确引用澳大利亚模式 [3] - 挪威政府有意推动设定15岁的使用界限,马来西亚政府正研究澳大利亚等国做法,计划在2026年实行青少年社交媒体禁令 [4] - 美国民意调查显示,选民对禁止16岁以下青少年使用社交媒体的类似禁令持有相当支持的态度 [4] 法律挑战与执行争议 - 2025年11月26日,“数字自由计划”宣布就新法律向澳大利亚高等法院提起诉讼,称其违反宪法中对政治言论的隐含自由,法院已同意受理,辩论安排在2026年进行 [4] - Reddit在高等法院提起诉讼,申诉书指出该法律因限制年轻人的政治言论而违宪,并认为拥有账户的未成年人反而能更有效地免受网络伤害 [5] - 澳大利亚广播公司报道指出,现有的年龄验证系统并不总能准确识别用户年龄,且许多儿童已通过各种方式规避禁令 [5] - TikTok将立法描述为“仓促制定”,并警告这可能将年轻用户推向“互联网的黑暗角落” [5] 立法背后的社会与心理动因 - 美国社会心理学家乔纳森·海特2024年3月出版的《焦虑的一代》一书,成为澳大利亚修正案的催化剂,书中描述了由于智能手机及社交媒体便捷访问导致的Z世代心理健康危机 [8][9] - 海特认为“童年的大重构”有四个基本危害:社交剥夺、睡眠剥夺、注意力分散以及沉迷 [9] - 澳大利亚通讯部长米歇尔·罗兰援引政府调查报告称,95%的澳大利亚家长认为网络安全是养育孩子最严峻的挑战,14岁至17岁未成年人中近三分之二曾浏览有害内容 [10] - 2024年夏天,美国卫生总监维韦克·穆尔西在《纽约时报》专栏呼吁在社交媒体应用上张贴类似烟盒的警示标签,指出其使用与年轻人心理健康风险相关 [10] “手机式童年”的四大风险 - **认知与大脑发展风险**:长期碎片化刺激削弱专注力、延迟满足能力与自我控制力,影响前额叶功能;快速切换的信息流取代深度思考,削弱抽象思维与因果推理;多巴胺即时反馈重塑奖励系统,降低对现实努力的耐受度 [15] - **睡眠不足的风险**:智能手机的诱惑让人无法抵挡直至深夜,发出的蓝光扰乱睡眠,睡眠不足会导致思维推理能力受损、体质变弱、体重增加,并影响情绪直至患上抑郁症和焦虑症 [16] - **自我与价值建构风险**:社交媒体放大同龄人“高光时刻”,导致频繁社会比较,自我价值更依赖外部反馈如点赞,易陷入自我否定;挫折耐受度降低,回避困难,依赖即时安抚;自我效能感被削弱,身份认同被算法标签与流量反馈外包 [16][17] - **社会化与关系风险**:长期以屏幕为中介的互动削弱现实社交能力如面对面沟通、共情与冲突解决;同伴关系被平台逻辑重构,转向以“共同在线”为核心的浅表化连接;家庭互动被稀释,亲子共处时间与情感回应下降,家庭作为情绪支持的功能被削弱 [18] 治理建议与全球趋势转向 - 乔纳森·海特提出四管齐下的系统性干预方法:孩子进入高中前不配备智能手机;16岁前不允许使用社交媒体;将手机明确排除在学校之外;通过制度与家庭实践让孩子重获更多独立活动的空间与责任 [19] - 全球政策制定者正采取新的青少年手机与社交媒体管理政策,公共辩论倾向于支持更严格限制,这是多重结构性压力叠加的结果 [21] - 趋势背后的多维因素包括:代际不对称与“补救性立法”,承认过去放任错误并为下一代设定更清晰边界;数字主权与文化焦虑的外溢,限制承担心理保护、文化防御与社会稳定多重功能;互联网从“工具”转向“环境”的认知转折,引发对进入方式、安全与可控性的讨论 [21][22] - 限制并非终点,而是为更长期的公共讨论赢得时间,以讨论童年、公共空间以及技术应如何被嵌入社会,社会需要在效率、自由与脆弱性之间重新学会设立边界 [23]