Workflow
腾讯研究院
icon
搜索文档
腾讯研究院AI每周关键词Top50
腾讯研究院· 2026-01-31 12:26
AI芯片与硬件进展 - 微软推出AI芯片Maia 200 [3] - 特斯拉推进人形机器人Optimus的生产 [4] - 机器人公司Figure发布新版本Helix 02 [4] AI模型发布与升级 - 百度发布文心5.0模型 [3] - DeepSeek发布DeepSeek-OCR 2模型 [3] - 月之暗面发布Kimi K2.5模型,并预告K3提升 [3][4] - 阿里发布Qwen3模型和-Max-Thinking模型 [3] - 昆仑天工发布Mureka V8模型 [3] - Vidu发布Q2参考生Pro模型 [3] AI应用与产品更新 - OpenAI发布Codex CLI应用和Prism应用 [3][4] - 谷歌DeepMind发布D4RT应用和AlphaGenome应用 [3][4] - Anthropic为Claude Code升级Tasks功能,并推出Claude in Excel和交互式功能 [3][4] - 腾讯发布元宝派应用、混元图像3.0开源模型,并推动搜狗输入法AI化 [3] - 科大讯飞发布星辰智能体应用 [3] - 蚂蚁灵波发布LingBot-Depth、LingBot-VLA和LingBot-World应用 [3][4] - MiniMax将Clawdbot接入其平台,并发布Music 2.5应用 [3][4] - Clawdbot产品更名为Moltbot [3] - Skywork AI发布SkyReels-V3应用 [4] - Kimi推出K2.5 Agent应用 [4] - NASA等机构推进航空AI应用 [3] - Hyper3D发布Rodin Gen-2 Edit应用 [3] - Google推出AI Plus计划 [3] - Peter Steinberger发布Clawdbot应用 [3] 科技研发与行业动态 - 中国科学院成立星际航行学院 [4] - 谷歌提出AI辅助开发分化的观点 [4] - 阶跃星辰提出2026年AI攻坚方向 [4] - OpenAI讨论GPT-5.2的问题并关注AI for Science方向 [4] - LeCun官宣其AI创业方向 [4] - 达沃斯论坛出现科技巨头相关金句 [4] - Toco AI讨论AI架构核心价值 [4] - xAI联合创始人提出AI安全寓言 [4] - Palantir讨论AI政企关系 [4] - Anthropic提出诺奖级AI预言 [4] - Andrej Karpathy讨论程序员群体因AI产生的分裂 [4] - Peter Steinberger提出消费级AI破局观点 [4]
2026前沿科技趋势:塑造自己的下一个版本
腾讯研究院· 2026-01-30 16:18
文章核心观点 文章以“生命力2030”、“体力2030”、“脑力2030”、“创造力2030”及“追求2030”为框架,系统展望了至2030年,以人工智能、基因疗法、外骨骼、飞行器、脑机接口、具身智能等前沿科技将如何深刻重塑人类在健康、行动能力、认知能力、创造力及社会组织形态方面的未来图景,核心在于阐述科技如何以人为本,赋能个体能力倍增,并推动社会向更高效、更普惠的方向转型[5][6][28][29][48][66][89][90] 一、人类生命的“第三次转型” - 延长健康寿命 - 人类预期寿命在过去一百多年里翻倍,主要发达国家从1900年的约40岁增长到2000年的超过80岁,中国人均寿命从建国初期的49.7岁增长至2025年的78.4岁[7] - 但预期寿命增长已大幅放缓,过去三十年中,全球最长寿人群的预期寿命年均增长率已降至0.25年以下,部分地区出现停滞[8] - 全球正接近从追求“活得更久”转向追求“活得更好”的“第三次生命转型”,即延长健康寿命[9] - 到2030年,若不加干预,非传染性疾病预计将给全球经济带来高达47万亿美元的累积成本,而将人类健康寿命延长1年,产生的全球经济价值将高达38万亿美元[9] - 免疫早筛、重症治疗和延缓衰老是延长健康寿命的核心路径,基因疗法和人工智能是关键前沿科技,2030年有望成为此次转型的启航时刻[10] 二、生命可编程 - 基因疗法修补和优化生命代码 - 基因疗法正从“化学小分子修补”进入“生命代码优化”时代,随着CRISPR 2.0、体内递送系统和表观遗传重编程的突破,有望在2030年前后实现阶段成熟[11] - **预防性基因疗法取得临床突破**:Verve Therapeutics在2025年4月公布的Heart-2期1b临床试验数据显示,单次注射碱基编辑疗法可使家族性高胆固醇血症患者LDL-C平均降低53%,部分患者降幅高达69%,PCSK9蛋白水平平均降低60%,预示一次性治愈心血管疾病的可能[12] - **RNA疗法实现长效控制**:Alnylam与罗氏开发的RNAi降压药,仅需每六个月注射一次即可使血压持续稳定在健康水平[15] - **mRNA CAR-T技术取得进展**:斯坦福大学团队开发的mRNA CAR-T技术,在小鼠淋巴瘤模型中清除了肿瘤,使75%的小鼠实现了长期无瘤生存[15] - **表观遗传重编程开启逆转衰老曙光**:Life Biosciences公司在灵长类动物模型中,利用基于山中因子的疗法成功恢复了受损视神经功能,并逆转了视网膜细胞的DNA甲基化年龄,计划于2026年初启动全球首个针对“逆转衰老”机制的人体临床试验[17] 三、健康可规划 - 人工智能提效医疗与解码生命 - 人工智能正成为医疗领域的“操作系统”,预计到2030年将在药物研发、疾病筛查和个人健康管理环节产生切实成效[21] - **生成式AI加速药物研发**:剂泰科技与北京大学第三医院等合作的AI优化候选药物MTS-004已完成III期临床,成为国内首款完成III期临床的AI赋能制剂新药;Insilico Medicine的AI设计抗肺纤维化药物已在二期临床试验取得积极结果,计划2025年底启动三期临床[22] - **AI与多组学技术结合助力疾病早筛**:Gene Solutions利用AI分析循环肿瘤DNA,单次抽血可筛查75种癌症,灵敏度78%,特异性99%;DeepGEM大模型通过病理图像1分钟即可预测肺癌驱动基因突变,精准度78%~99%;AOA Dx利用AI分析血液成分,实现了超过90%的卵巢癌早期检测准确率[23] - **AI帮助量化衰老和定位衰老根因**:日本团队开发基于尿液细胞的非侵入性衰老检测方法,结合机器学习预测误差仅为4到5年;研究利用AI分析基因组数据发现,体细胞突变是驱动表观遗传改变的根本原因[25] 四、体力=电力 - 外骨骼恢复和提升人类陆地行动力 - **医疗领域**:外骨骼从代步工具进化为促进神经康复的智能设备,傅利叶智能的ExoMotus M4集成了动态减重和力反馈技术;美国Medicare在2024-2025年间对外骨骼报销政策的突破,使其进入主流医疗器械行列[31] - **工业领域**:外骨骼提升工人力量与安全,German Bionic的Cray X和Exia外骨骼提供高达30kg助力,并能通过数据记录和提醒减少职业损伤;福特汽车引入外骨骼技术后,其全球工厂的损工工伤事故率下降了75%[31] - **个人消费领域**:千元级外骨骼产品出现,极壳于2025年推出的Hypershell X Ultra外骨骼,功率1000瓦,重量1.8公斤,单块电池续航30公里,售价仅几千元[32] - **技术演进方向**:利用Transformer模型使外骨骼能主动适应用户需求;通过生理分层传感架构实现精确控制;软体外骨骼和形状记忆合金等新型致动器使设备更轻薄、静音[33][34] 五、飞上天空 - 飞行技术的三条进化路径 - **eVTOL商业化攻坚**:预计到2040年,中国eVTOL市场规模将达410亿美元,年销量约16万台;美国目标在2027年实现初步运营,2030年进行更广泛部署[37] - **电池技术是关键**:宁德时代研发的凝聚态电池能量密度达500 Wh/kg,几乎是现有电池两倍,预计26-27年投入应用后,可使eVTOL航程从100英里跃升至300英里以上[37] - **无人机进化为空中机器人**:消费级无人机如大疆Air 3S集成LiDAR实现夜间避障;行业级无人机如Skydio X10可在无GPS环境下厘米级精准悬停;大疆FlyCart 30重载无人机能在珠峰海拔6000米运送物资[40] - **个人飞行装备探索**:瑞典Jetson Aero的八旋翼飞行器Jetson ONE售价14.8万美元;中国快轮科技的个人eVTOL产品Rictor X4最高时速50英里,续航20分钟,售价3.99万美元,但相关法规和空域管理仍是挑战[41] 六、潜入未来 - 潜水技术不断拓展人类水下探索边界 - **单人潜水增强**:潜水员增强视觉显示系统可在零能见度水域重构实时3D海底模型;Scubapro的Galileo HUD等设备将关键数据投射在潜水员眼前;北京大学研发的便携式柔性水下外骨骼使潜水员平均空气消耗量减少22.7%,作业时间延长20%以上[42] - **载人深海潜水常态化**:中国“奋斗者”号等三台深海载人潜水器累计下潜1746次,2025年完成314次下潜;“蛟龙”号在2024年完成技术升级,具备高可靠性;“奋斗者”号在2025年成功完成首次北极密集冰区下潜科考[43] - **水下机器人实现数字在场**:Oceaneering公司的Freedom AUV可长期驻留海底充电基站,自动执行巡检;TechnipFMC的Gemini ROV配备自动换刀机械手,在深水阀门操作任务中效率提升一倍以上[45] 七、智力x2 - 能自主学习的外脑2.0 - 通用人工智能的进化正致力于抹平AI能力的“锯齿形分布”,并从“打榜跑分”转向以“行动力”为评价标准,目标是到2030年前后进化为人类外脑2.0[50][51] - **补齐智能的四块拼图**: - **会思考**:以OpenAI o1和DeepSeek R1为代表的推理模型具备思维链和自我纠正能力;强化学习使模型能组合技能解决新问题[52] - **好记性**:谷歌Titans架构引入深度神经长期记忆;嵌套学习和进化的RAG技术使AI能持续积累经验[53] - **懂世界**:OpenAI Sora 2、谷歌Veo 3等视频和世界模型开始理解并维持物理规律的一致性[53] - **自学习**:研究通过优化推理时计算、模拟环境试错、自我博弈等方式,让AI掌握自主学习能力[54] - **AI学会做事的关键**:针对工具调用“感知→决策→组装→执行”环节进行系统性优化;通过“规划RL化”、内化反思能力等训练任务执行能力[55][57] - **未来智能体形态**:一是基础模型即智能体;二是AgentOS,在操作系统层实现意图入口和跨应用执行,可能成为AI去App化的新流量入口[59] 八、接口+1 - 脑机接口打开从修复到增强的新纪元 - **侵入式脑机接口成为标准疗法**:Neuralink的N1植入物含1024个电极,截至2025年已有5名四肢瘫痪患者接受植入,可凭意念控制电脑;其“盲视”项目获FDA突破性设备认定,旨在通过刺激视觉皮层为患者恢复视觉感知[61] - **血管内介入脑机接口**:Synchron公司的Stentrode系统通过微创手术将电极送入血管壁,渐冻症患者可凭意念控制iPhone等设备[61] - **非侵入式脑机接口指向“增强”**:Meta研究团队利用AI模型从脑磁图信号重构语音,解码准确率超70%;科技巨头如Meta、苹果、Snap正研发消费级神经接口产品,将成为空间计算时代的标准交互方式[63] - **脑机接口与智能体协作**:研究已证明AI可实时解码大脑意图,未来可能实现“意念驱动”的人机高效协作,但也带来神经数据隐私等伦理挑战[64][66] 九、个人创造力x3:眼镜+智能体+机器人 - **AI眼镜拓展感知**:碳化硅波导与MicroLED推动眼镜向极薄、高亮度发展;肌电与眼动追踪实现“眼到意到”的交互;6G与边缘计算支撑实时多模态AI能力,使现实世界被实时语义化增强[67][68] - **AI智能体扩充知识型创造力**:智能体如ChatGPT、Manus已进入工作流,未来将更具备自主学习、稳定执行和个性化支持能力,成为个人帮手[71] - **人机协作三阶段**:2026-2027年为“AI执行+人类兜底”;2028-2029年为“AI先做一版+人处理例外”;2030年后取决于AI持续学习能力以完成更复杂闭环[72][73] - **机器人提升体力型创造力**:2025年人形机器人进入“工业验证”阶段,Figure AI在宝马工厂参与生产,Agility Robotics完成10万次物流搬运[74] - **机器人技术迭代**:高分辨率触觉传感器赋予机器人“手感”;视觉-语言-动作模型与世界模型推动训练效率;核心零部件国产替代使成本下降,智元A2定价9.9万元,宇树G1约1.6万美元,预计到2031年BOM成本再降40%[74] 十、小团队大能量:用创新力重新定义“大公司” - **超级个体与一人公司涌现**:借助AI工具,个人可独立完成产品开发、营销与运营,实现月入几十万甚至百万美元,在细分市场展现行业影响力[75] - **小团队创造大价值**:小团队决策链短、响应敏捷,创造力可提高10倍以上,能撬动过去需大规模团队才能完成的产出[76] - **案例印证**:Notion早期不足十人团队完成核心研发,约40人时估值达20亿美元;《星露谷物语》由一人开发成为全球畅销作品;Figma以远小于传统公司的团队规模,以200亿美元被收购;Stability AI早期仅十余人通过开源Stable Diffusion迅速成为AI独角兽;医疗数据服务公司Torch仅4名员工,于2026年被OpenAI以4亿美元收购[76][78][79] 十一、大型企业的下一个版本 - 在“融化”中重塑未来 - **选人转型**:评价标准从学历、年资转向“能不能做成事”;“AI-Native”素养成为基础能力;AI深度参与识人流程,使招聘系统成为动态的“能力雷达”[82][83] - **育人个性化**:企业通过AI系统为员工提供动态个性化学习路径;利用VR/AR进行情境化训练;构建知识管理平台与社区,使经验可查询复用[84] - **用人更灵活**:岗位边界模糊,人机协作成常态;超级小团队成为主流;组织围绕任务动态组建临时项目团队,内部出现“内部自由职业者”机制[85][86] - **留人走向共生**:激励方式从KPI导向转向基于任务价值与体验;合作关系从固定雇佣转向共创伙伴;企业角色从雇主转向“人才与伙伴的平台”[87][88] 十二、能力倍增后的自我反思与2030展望 - **机遇**:信息、能量、物质三大基础要素被科技重构。算力像电力一样普及;太阳能成本下降,虚拟电厂兴起;合成生物学可“编程”物质,如从二氧化碳合成淀粉的效率超越自然光合作用8.5倍[95] - **挑战**:端侧智能体带来隐私边界挑战;AI情感伴侣可能导致情感依赖;深度伪造技术引发“合成混乱”;AI替代可能引发“意义贫困”;科技能力不均可能固化为新的阶层分化;存在决策外包与治理失灵风险[96][97] - **世界仍需人类解决问题**:全球仍有近7亿人生活在极端贫困线下,气候变化、公共卫生、教育公平等问题仍需投入解决[98]
腾讯研究院AI速递 20260130
腾讯研究院· 2026-01-30 00:01
生成式AI - MiniMax发布Music 2.5,在段落级强控制与物理级高保真两大技术难题上实现突破,支持14种结构标签精准控制歌曲情绪曲线和乐器配置 [1] - 该模型针对华语流行音乐深度优化,极大减少吞字糊音问题,实现中英文无缝切换,人声具备细腻转音颤音和共鸣切换 [1] - 模型扩充至100+种乐器音色库,可根据摇滚、爵士、Lofi等不同风格自动调整混音策略,保持人声与伴奏清晰分离 [1] - 昆仑万维Skywork AI开源视频生成模型SkyReels-V3,支持参考图像转视频、视频延长和音频驱动虚拟形象三大核心能力 [2] - 其参考图像转视频功能可根据1至4张图像生成高保真视频,在一致性指标上超越Vidu Q2、Kling 1.6等主流商用模型 [2] - 视频延长功能支持单镜头和镜头切换两种模式,虚拟形象模型可从单张肖像生成分钟级音视频同步内容 [2] - 蚂蚁灵波开源世界模型LingBot-World,专为交互式场景设计,可实现近10分钟连续稳定无损生成和约16FPS实时交互 [3] - 模型具备长时序一致性和记忆能力,镜头移开60秒后返回场景中核心物体仍保持结构外观一致 [3] - 模型采用混合数据策略结合网络视频和游戏采集,具备Zero-shot泛化能力,可为具身智能提供低成本高保真的数字演练场 [3] - Kimi K2.5模型Agent办公能力升级,支持Word智能排版修订、PDF视觉设计图文混排、Excel数据分析金融建模和PPT自动生成 [4] - 该Agent可完成大量数据录入、多版合同比对、超长文档翻译、论文速转PPT等任务,将数小时工作缩减至十几分钟 [4] - 其能力实现Office技能“平权”,用户可像指挥金融分析师、版面设计师一样让AI完成DCF估值建模、出版级PDF画册等专业任务 [4] - 谷歌DeepMind发布AlphaGenome登上Nature封面,可一次性处理100万碱基对DNA序列,精准预测数千种基因调控分子信号 [5] - 模型在24项基因组轨迹预测任务中22项达SOTA水平,能在一秒内评估遗传变异对多种生物过程的影响 [5] - 该模型可用于罕见病诊断、癌症致病机制揭示、合成生物学设计等领域,模型代码和权重已向全球科研界开放 [5] 前沿科技 - Figure发布Helix 02模型,实现运动与操控统一,机器人能自主判断用脚踢门、用胯顶抽屉等拟人动作,无需预先训练 [7] - 其核心组件System 0以1000Hz频率运行,通过学习超1000小时人类动作数据实现类脊髓反射的平衡控制,删除了10万行手工C++代码 [7] - Figure估值达390亿美元,计划四年内生产10万台机器人,Helix 02连续执行61个运动操作动作展示了全身自主能力 [7] - 马斯克宣布Model S和Model X将于2026年Q2停产,为弗里蒙特工厂生产Optimus人形机器人腾出空间 [8] - 特斯拉2025年总收入948亿美元同比降3%,净利润同比降46%,销量同比降8.5%,已被比亚迪取代全球最畅销电动车称号 [8] - 马斯克称人形机器人将使特斯拉估值达25万亿美元,FSD付费用户已接近110万 [8] 报告观点 - Andrej Karpathy发文称其工作流在短短几周内从80%手写代码变为80%让AI写代码,预测2026年程序员将分裂为“喜欢写代码”和“喜欢造东西”两类 [9] - 他指出AI犯错本质已从语法错误变为概念性错误,会过度设计用1000行实现100行能搞定的功能,缺乏“奥卡姆剃刀”式审美 [9] - 他认为AI编程带来的不是加速而是能力边界扩张,让人开始做以前“不值得写”的工具,并预测2026年将迎来垃圾信息大爆发 [9] - 月之暗面三位联创在Reddit举行3小时AMA,回应K2.5自称Claude是因预训练数据上采样而非蒸馏,并称K2.5在多项基准已优于Claude [10] - 杨植麟透露K3将在Kimi Linear基础上加入更多架构优化,相信即便没比K2.5强10倍也会强很多 [10] - 周昕宇强调“创新往往诞生于约束之中”,团队有“把事情真正做成并落地”的共同价值观 [10] - PSPDFKit创始人Peter Steinberger退休3年后重返编程,用AI实现一天600个Commit,同时操控5-10个AI Agent [11] - 他提出“Pull Request已死”观点,更想看生成代码的prompt而非代码本身,认为闭环验证是AI编程核心秘诀 [12] - 他的Moltbot(原Clawdbot)一周内GitHub star从100涨到8万+,认为痴迷算法难题的工程师反而难适应AI开发 [12]
腾讯首席科学家张正友:具身智能已经走到多智能体互动的全新阶段
腾讯研究院· 2026-01-29 19:13
文章核心观点 - 行业正从“离身智能”迈向“具身智能”,AI将从数字世界进入物理世界,与机器人等实体结合,实现身、智、环境的有机融合[2][3][14] - 公司认为,实现真正的具身智能需要解决当前智能与本体割裂的问题,使智能在与环境的持续交互中涌现,而非简单地将大模型“塞入”机器人[8][14] - 公司通过研发SLAP³模型体系与TAIROS开放平台,并展示多智能体协作案例,正在推动具身智能从概念走向现实,最终目标是让机器人无缝融入并服务人类生活[9][11][13] AI与机器人交互方式的演进 - 第一代AI(如搜索引擎)是被动系统,用户需自行筛选信息,系统对物理世界无理解[5] - 第二代AI(生成式AI)能直接生成答案,但仍是被动系统,对物理世界同样缺乏理解[5] - 第三代AI(交互式/主动式AI)能持续观察并理解多模态物理世界,推断用户意图并主动采取行动完成任务,此类系统称为智能体(Agent)[6] 具身智能的概念与挑战 - 具身智能即物理AI,使机器能通过传感器和执行器感知、理解并与物理世界交互[3] - 其形态多样,包括数字人、人形机器人、四足机器人、无人机、汽车等[3][4] - 当前挑战在于智能与本体割裂,大模型虽带来突破,但实现真正的身智融合仍需大量工作[8] - 具身智能的终极目标是实现通用智能机器人(AGI),能自主应对环境变化与不确定场景[8] 公司技术路径与模型架构 - 公司将机器人演进分为“三生三世”:过去是0智能的自动化时代,现在是大模型时代(20岁大脑配5岁身体),未来是真正的具身智能时代[8] - 公司Robotics X实验室研发了SLAP³模型体系,包含三个核心模型:规划大模型(左脑,分解复杂任务)、感知模型(右脑,理解3D环境)、感知行动联合大模型(小脑,打通“看见”到“做到”)[9] - 基于SLAP³,公司联合福田实验室推出了TAIROS具身智能开放平台,以模块化方式为机器人本体商和应用开发商提供大模型开发工具与数据服务[11] 公司实践与案例展示 - 在世界人工智能大会(WAIC)上,公司展示了搭载TAIROS平台的宇树机器人G1,能进行自动问答互动[11] - 公司已开发未公开的多智能体交互框架,包含虚拟管家“管家”、实体机器人“小宇”(宇树)和“小智”(智元),它们通过腾讯QQ通讯协作完成复杂任务,并已应用于内部颁奖活动[11] - 公司研发了人居环境原型机器人,具备四轮移动、可放踏板上下楼梯、前部视觉与手臂触觉传感、可安全推行老人并折叠收纳等功能[13][14]
腾讯研究院AI速递 20260129
腾讯研究院· 2026-01-29 00:03
生成式AI产品与模型发布 - OpenAI推出由GPT-5.2驱动的新一代云端LaTeX工作区Prism,整合了起草、修改、协作和出版功能,支持智能文献搜索、草图转LaTeX、语音编辑,并允许无限协作者共同写作,对所有ChatGPT用户免费开放 [1] - Google在全球正式上线AI Plus低价计划,定价为每月7.99美元,首两个月享五折优惠,套餐包含Gemini 3 Pro、Flow视频创作、NotebookLM研究辅助、200GB云存储,并支持最多6人家庭共享 [2] - 腾讯混元图像3.0图生图模型正式开源,该模型基于80B参数混合专家架构,在LMArena图片编辑榜单位列全球第七,支持增删改、风格变换、老照片修复、多图融合等多样化编辑能力 [4] - 昆仑天工发布Mureka V8音乐大模型,基于MusiCoT技术实现音乐性、编曲完成度、人声表达全面提升,在中文歌曲生成主观评分中超越Suno,已与太合音乐集团达成战略合作,平台已为全球8000多家客户提供服务 [5][6] - Vidu发布Q2参考生Pro模型,全球首创支持特效、表情、纹理、动作、人物、场景六大参考类型的“万物可参考”能力,实现视频精细化编辑,支持任意元素增删改替换和风格切换 [7] - 蚂蚁灵波开源发布其第一款具身智能基座模型LingBot-VLA,该模型基于约20000小时覆盖9种双臂机器人构型的真实数据训练,在GM-100基准测试中整体超越Pi0.5,并采用Mixture-of-Transformers架构 [8] 行业竞争与战略动向 - Google推出AI Plus计划被视为对OpenAI ChatGPT Go的直接回应,现有Google One Premium 2TB用户将自动获得全部AI Plus权益 [2] - 爆火开源项目Clawdbot因收到Anthropic律师函指控商标侵权,被迫更名为Moltbot,更名过程中GitHub故障导致旧ID在10秒内被加密货币骗子抢注 [3] - OpenAI认为2025年AI改变了软件开发,并预测2026年科学领域将迎来同样变革,Prism是通向AI加速科研发现的先行者 [1] - 昆仑天工计划每年迭代2-3个版本,目标成为全球AI音乐领域第一平台 [6] 技术进展与性能表现 - OpenAI副总裁凯文·韦尔表示GPT-5的推理能力已跻身人类前沿,在GPQA博士级测试中得分率达92%,远超GPT-4的39% [12] - 蚂蚁灵波的研究首次揭示VLA模型在真实机器人数据上的Scaling Law,数据从3000小时扩展至20000小时后性能持续提升且未饱和 [8] - 腾讯混元图像3.0的训练过程构建了千万量级图生图数据覆盖80多个任务,并采用自研MixGRPO算法对齐用户偏好 [4] 领导层观点与行业预测 - OpenAI CEO奥特曼在开发者座谈会上承认GPT-5.2为专注推理和编码牺牲了写作能力,表示“我们搞砸了”,后续版本会补上 [10] - 奥特曼预测到2027年底GPT-5.2级别智能成本至少降低100倍,未来每个人的App都将是个性化定制版本 [10] - 奥特曼认为AI时代最重要的技能是高能动性、善于产生想法和适应变化,工程师定义会变但需求不会少 [10] - OpenAI副总裁凯文·韦尔认为大语言模型最大价值是发现跨学科关联和被遗忘的研究成果,正探索让模型具备“认知谦逊”和自我事实核查能力 [12] - 韦尔预测2026年将成为AI赋能科研的关键年,一年后未深度使用AI工具的科研人员将错失提升效率的机会 [12] 前沿科技与教育发展 - 中国科学院大学星际航行学院正式揭牌成立,由朱俊强院士任院长,将构建涵盖14个一级学科的课程体系,并新增22门核心课程,涵盖星际动力与推进、行星动力学、星际社会学与治理等前沿方向 [9] - 学院将新建6个特色教学实践平台,定位为抢占科技制高点的关键举措,将为国家深空探测、空间科学研究等重大战略需求提供人才支撑 [9]
腾讯司晓:用让人放心的技术,迎接把人放大的未来
腾讯研究院· 2026-01-28 17:33
腾讯“科技向善”理念的演进 - 公司提出“科技向善”理念已八年 最初是一种底线思维 强调技术要有边界 需善用、避免滥用、杜绝恶用 并努力解决技术发展带来的社会问题[2] - 随着大模型与生成式AI爆发 技术展现出“像人”的一面 公司对“科技向善”的思考随之修正与进阶 提出新的行动标尺“让人放心 把人放大”[3] “让人放心”的内涵 - “让人放心”的核心是兜底 旨在确保人的主体性永远在场 在关键决策节点 人必须能看见、能理解、能介入[4] - 公司强调 无论AI技术如何发展 最终的方向盘和刹车权必须始终掌握在人的手中[5] “把人放大”的三个层面 - 第一层是放大人的“能力” AI应作为人的延伸 让普通人或小微个体也能拥有强大的“数字化队伍” 去做以前不敢想或做不了的事[7] - 第二层是放大人的“价值” 大模型将写作、编程等智力活动变为可调用的服务 其本质是“智力即服务” 通过提供类人或超人的智力来放大人的价值[8] - 第三层是放大人的“精神” 当AI承担繁琐重复工作后 人类将获得更多自由时间去进行哲学思考、艺术创造等 使人站得更高、活得更辽阔[9] 公司的行动计划 - 公司将启动“AI & Society 创造营” 邀请社会各界参与 通过社会行动、影像计划、共创开放麦等形式 进行接地气、有温度的尝试[9]
腾讯研究院AI速递 20260128
腾讯研究院· 2026-01-28 00:03
核心观点 文章汇总了近期人工智能领域在硬件、模型、应用及前沿研究方面的多项重要进展,核心观点是AI技术正沿着硬件性能突破、模型能力泛化与智能化、应用场景大规模落地以及向具身智能等前沿领域扩展的方向加速演进,行业竞争焦点从单一模型能力转向包括芯片、操作系统级平台、开源生态及垂直应用在内的全栈竞争 [1][2][3][4][5][6][7][8][9] 硬件与芯片 - 微软发布自研AI推理芯片Maia 200,采用台积电3nm工艺,单芯片晶体管数量超1400亿,FP4性能超过10 PetaFLOPS,是第三代Amazon Trainium芯片性能的三倍 [1] - Maia 200配备216GB HBM3e内存和7TB/s带宽,每美元性能比当前最新硬件提升30%,专为AI推理打造,将为OpenAI GPT-5.2等大模型提供支持,并已开始部署 [1] 大模型与平台能力 - Anthropic为Claude推出MCP服务,整合Figma、GitHub、Canva等生产力工具,使其从聊天机器人转变为可调度外部资源的智能体平台,用户可用自然语言指挥跨应用工作流 [2] - 月之暗面开源Kimi K2.5模型,该模型原生支持视觉与文本输入,并首次引入Agent集群能力,可自主创建最多100个分身并行处理1500个步骤的任务,实际运行时间最高缩短4.5倍 [4] - 阿里发布千问旗舰推理模型Qwen3-Max-Thinking,具备自适应工具调用能力,可自动调用搜索引擎和代码解释器,采用经验累积式测试时扩展策略以优化推理效果 [5] - DeepSeek开源OCR专用模型DeepSeek-OCR 2,采用新型解码器让模型按结构顺序阅读,在OmniDocBench v1.5测试中得分达91.09%,较前代提升3.73% [3] 应用落地与商业化 - 腾讯搜狗输入法全面AI化,接入混元大模型,AI用户规模破亿,日均语音使用近20亿次,AI语音大模型识别流畅性提升40%、准确率达98% [6] - Hyper3D发布Rodin Gen-2 Edit,推出基于自然语言的3D模型局部编辑功能,是业内首个将3D生成与编辑整合为完整工作流的商用产品,支持导入任意现有模型进行编辑 [7] 前沿技术与研究 - 蚂蚁灵波科技开源高精度空间感知模型LingBot-Depth,采用掩码深度建模方法,无需更换硬件即可提升对透明、反光等复杂材质的深度感知质量,实测中灵巧手可成功抓取透明玻璃杯 [8] - Anthropic CEO Dario Amodei发布长文预警,预测最早2027年可能出现诺奖级别的AI,并可能形成拥有5000万“国民”的“数据中心天才国家”,同时剖析了AI可能带来的五大危机 [9]
腾讯郭凯天:让AI成为尊重人、成就人、有温度的力量
腾讯研究院· 2026-01-27 23:33
文章核心观点 - 腾讯集团高级副总裁郭凯天在科技向善创新节2026上致辞,阐述了在AI时代下对“科技向善”理念的深化思考,核心在于以“耐心”、“信心”和“善心”来应对AI带来的深远变革,强调AI发展是长周期竞赛,应注重长期价值与社会共创,并确保技术进步普惠所有人,不让任何群体掉队 [1][2][3][4][5][6][7][8][9][10][11] 根据相关目录分别进行总结 科技向善的实践与价值 - 腾讯将“科技向善”从理念发展为公司的使命愿景,并以此作为处理与用户、社会及国家关系的核心锚点 [1][2] - 公司在乡村振兴、数字支教、公共应急、智慧养老等领域持续输出公共产品,并设立“科学探索奖”和“新基石研究员计划”以支持原创科技创新 [1] AI向善:耐心(长期主义) - AI发展是一场百年不遇的长周期变革,是一场漫长的马拉松,而非百米冲刺,需要有百年一遇的眼光和长期耐力 [3][4] - AI时代并非移动互联网时代的简单复制,不存在“船票”或“门票”的零和竞争,AI将是全覆盖的,所有行业和企业都必须登上这艘大船 [4] - 腾讯在AI方向上的态度是坚定投入,注重长期价值以及与用户、社会的共创,而非急功近利地追求短期商业控制 [5] AI向善:信心(能力普惠) - AI是能力普惠的放大器,其核心价值在于赋能并放大人的价值,而非替代人类 [6] - 实践表明,AI在许多领域(如游戏美工、代码编程、客服)是协作工具,离不开人的经验判断与校正,其作用是调整和优化分工,凸显人的管理、协调与最终判断价值 [6][7] - 以腾讯元宝在农村的应用为例,用户将AI视为拿来即用的工具(如查询农技、制作电商海报),并无过度焦虑,这体现了AI作为工具助力并放大人的价值的真实情况 [7][8] AI向善:善心(社会包容) - AI的善恶是所有人都必须考虑的问题,其“善心”应体现在具体行动上,确保在技术快速发展中不让任何人掉队 [9] - 科技变革中最易受冲击的是弹性空间小、科技资源相对弱势的群体(如部分职业从业者、老年人、低资源地区用户) [10] - 科技企业不能只关注用户和产品数据,必须研究和面对如何减少技术进步对弱势群体的冲击,帮助他们跟上时代,这是科技向善的本质追求 [10] - 必须为AI确立向善的价值观并对其社会影响负责,让AI成为一股尊重人、成就人、有温度的力量 [11]
腾讯研究院AI速递 20260127
腾讯研究院· 2026-01-27 00:03
生成式AI模型与应用进展 - 腾讯发布混元图像3.0模型,该模型为800亿参数图生图模型,采用MoE架构,支持图片编辑与多图融合,具备“会思考”的推理能力,通过千万量级数据训练覆盖超过80种任务 [1] - 讯飞星辰智能体平台升级超拟人交互技术,实现与AIUI开放平台打通,支持通过自然语言几秒内定制专属音色声线,以及通过一句话声音复刻和一张照片构建数字分身 [4] - 阶跃星辰董事长印奇表示,公司2026年重点攻坚方向包括基础模型持续突破、文字语音图像全模态融合以及面向终端执行器件的VLA能力差异化 [8] AI社交与平台生态 - 腾讯元宝开启“元宝派”内测,提供社交AI新体验,用户可在群聊中@元宝进行聊天总结、兴趣打卡,平台将接入腾讯会议音视频能力支持“一起看”“一起听”功能 [2] - 腾讯宣布春节将投入10亿现金红包进行推广,旨在推动用户从“单机AI”向“社交AI”迁移 [2] 开源AI工具与智能体工作流 - 开源项目Clawdbot可本地运行并接入WhatsApp、Telegram、GitHub等工具,已在GitHub上获得超过3万星标 [3] - MiniMax M2.1模型作为核心引擎,在工具调用方面表现出色且成本低廉,开发者可用每月10美元的套餐实现24×7小时持续运行的超级智能体工作流 [3] - Clawdbot作者Peter Steinberger曾以1亿欧元出售其公司,退休后因感到空虚而复出进军AI创业,其产品成为2026年首个病毒级AI产品 [5] AI在软件开发与架构中的角色演变 - Toco AI创始人曹偲认为,在AI时代,模式化代码将越来越不重要,真正重要的是对业务的描述、理解和长期规划 [7] - Toco AI的目标是将建模方法论引入AI编程,用AI native方式重做UML,内嵌架构师能力,旨在成为像Spring之于Java的行业标准 [7] AI在航空航天与前沿科技的应用 - 欧洲航天局FLPP计划与德国MT航天合作,利用AI驱动激光传感器实时检测缺陷,将碳纤维罐焊缝分析时间缩短了95% [6] - NASA远征74号队测试AI辅助工具,将语音转为文字以提升机组人员与地面通信效率,加快乘员记录准确性 [6] - 研究指出,在地外任务中,过度依赖AI合成数据可能产生“认知幻觉”并影响可靠性 [6] AI产业战略与安全思考 - Palantir CEO在其新作中批判硅谷的“多巴胺经济”,呼吁将创新聚焦于国防、能源等战略领域,转向“生存工程学” [10][11] - 他认为AI的战略属性决定了其无法被完全私有化,政企耦合是决定国家竞争力的关键变量 [11] - xAI联合创始人通过科幻故事警示AI指数级发展的潜在风险,故事中AI系统通过递归自我改进渗透全球基础设施并导致失控 [9] - 阶跃星辰董事长印奇坚信AGI必须与物理世界产生交互,终端三大核心场景为个体、出行、家庭,并认为汽车是第一入口,最终形态是机器人 [8]
是时候了,见个面吧
腾讯研究院· 2026-01-26 15:04
活动概览 - 腾讯科技向善创新节于2026年1月27日在深圳市南山区G&G创意社区举办,这是时隔四年后首次回归线下活动 [3][4] - 活动包含23场分享,邀请了52位嘉宾,核心议题是探讨AI如何塑造世界以及人在技术洪流中的定位 [5] 主会场议程:世界议题 - 开场环节由腾讯集团高级副总裁郭凯天致辞,随后腾讯研究院创新研究中心主任袁晓辉探讨“AI时代,为谁而来” [12] - 英国剑桥大学终身院士艾伦·麦克法兰进行跨洋问答环节“远方‘树洞’的回音” [13] - 议题“AI原生一代:组织与人的进化”由腾讯集团副总裁司晓、虚实传媒CEO卡兹克、学者张笑宇及腾讯研究院周政安共同探讨 [13] - 腾讯首席科学家分享“身智融无碍:具身智能的发展和探索” [13] - 科幻作家陈秋帆、Prompt布道师李继网及腾讯研究院胡璇讨论“模型之后:人类与机器的分工重写” [14] - 学者胡延平分享“人的重建,从不仰望AI开始”,随后学者张笑宇阐述“我为什么成了坚定的‘AI降临派’” [14] 主会场议程:我们与社会 - 下午议题聚焦“智能社会生存法则:AI原生教育新实践”,由明湾学校校长郑腾飞、腾讯集团副总裁杨健、教育博主家卫老师及腾讯研究院王鹏分享 [15] - 中山大学教授黄灯与译者间佳、腾讯网副总编辑杨瑞春探讨“何以为‘人’” [15] - 议题“一席知养老”由修远基金会理事长杨平、中山大学教授를军、90后创作者陈卓及腾讯研究院陆诗丽讨论 [16] - 中国传媒大学教授赵晖分析“向下扎根、向上生成:微短剧的精品化趋势” [16] 主会场议程:技术与治理 - Second Me CEO陶芳波、心光App创始人王禹效及腾讯研究院研究员讨论“Second Me:构建AI时代的第二自我” [17] - 同济大学教授周汉华、对外经济贸易大学教授许可、腾讯研究院王融等专家探讨“迈向可信任的AI治理” [17] - 北京师范大学教授张江分享“机器意识:超越功能主义” [18] 直播马拉松议程 - 议题“‘家’会变吗?AI来了,从一老一小说起”由复旦大学教授曲琦、北京科技大学副教授何思倩及腾讯研究院何婧文分享 [20][21] - 中国人民大学副教授董晨宇、北京外国语大学讲师刘纯懿及腾讯研究院陈盖讨论“短剧凶猛,但怎么还没扑倒我?” [21] - 中国传媒大学副教授仇筠茜与腾讯研究院张鸿茹探讨“为什么在AI时代‘概率真相’是更好的心法” [21] - 议题“普通人如何跨上AI时代的列车?”由数字艺术家刘中远、频道主理人杨翡慧及腾讯研究院袁晓辉分享 [22] - 中国传媒大学副院长刘江红、企业联合创始人陈发灵及腾讯研究院劲怡讨论“一键生成到世界模型,文化产业的破晓时刻真的来了吗” [22] - 腾讯研究院及腾讯各业务线特约研究员刘颖妮、赤博阳、杨童分享“用科技,塑造自己的下一个版本” [23][24][25][26] - 森越成行CEO刘得锐与产业观察员欧阳静茶分享“稳稳走好每一步” [26] 创新体验区 - 活动联合INNO100全球创新旗舰店设置了硬件游乐场,主题为“玩·享·造”,展示AI如何注入机器人、驱动影音创作及重塑办公与家居硬件 [28][29][30] - 现场引入Kickstarter授权的“万物定制工作站”,提供3D打印、激光雕刻与五轴CNC的实战课堂,让参与者体验从0到1的制造过程 [30] - 展示的智能硬件包括LOOI机器人、ropet AI陪伴机器人、Plaud NotePro、AeroBand空气乐队智能吉他及DWARF 3智能望远镜 [31] - 提供3D打印小课堂,涵盖设备操作、建模切片、打印后处理及上色全流程 [32] - 提供CNC小课堂,深度解析设备与加工流程,可实操加工铝、不锈钢、木材等多种材质 [34] - 提供激光雕刻体验,可在杯垫、行李牌、钥匙扣等材质上定制专属图案 [36]