Workflow
腾讯研究院
icon
搜索文档
【全球招募】用AI唤醒千年文明!探元计划NextGen数智活化赛道:五大文化场景等您“揭榜挂帅”
腾讯研究院· 2026-01-20 17:53
文章核心观点 - 腾讯探元计划NextGen发起“数智活化赛道”,旨在通过AI、多模态大模型、XR、计算机视觉等前沿技术,解决文化遗产在公众理解、体验互动与技艺传承方面的痛点,推动文化资源的数字化焕新与活化利用[2][4][7][56] 赛道议题与目标 - 赛道致力于通过前沿技术激发创新内核、重塑表达形态、创造体验革命,以产生新动能、新形态、新场景[5] - 议题一为“文化垂类多模态智能体”,要求智能体具备深层次语义理解、低幻觉推理和自主决策能力,能生成满足特定文化、审美与情感需求的数字内容[5] - 议题二为“沉浸式互动体验场景创新”,要求在交互感知、多感官数据融合、沉浸式呈现、情感计算、虚实融合及数字人/机器人导览等技术应用上创新产品和业态[6] - 议题三为“人机协同技艺传承发展”,旨在通过构建技艺“数字基因库”、智能化教学系统、生成式设计引擎等方式,实现AI驱动的个性化技艺传承与创意生产转化[7] 五大特定命题场景 - **场景一:云居智友(云居寺多模态智能体)** - 类型为博物馆/国家级档案文献遗产,痛点为石经内容难懂、叙事方式陈旧、体验单薄参与感低[8] - 期待构建一个懂历史、有温度、能创作、可交互的垂类多模态AI智能体,打通“石经—人心”的“最后一公里”[9] - **场景二:杭州西湖(文化遗产活化叙事系统)** - 类型为世界文化景观遗产,痛点为游客停留于浅层观光,难以触及千年文脉[15] - 期待基于游客动线与三维模型,用AI重建历史风貌,生成隐私安全的个性化沉浸式游览影像[16] - **场景三:海岱智游(大汶口文化沉浸式互动体验)** - 类型为博物馆/考古遗址,痛点为展陈静态、公众难理解史前社会与符号含义、古代制陶技艺流程断裂[19] - 期待形成可应用的AI体验系统平台,实现与“虚拟先民”对话、模拟制陶、解码八角星纹,让观众“进入历史”[19] - **场景四:廊桥智传(木拱桥营造技艺智能传承系统)** - 类型为非物质文化遗产(联合国人类非遗),痛点为技艺认知门槛高、年轻传承动力不足、实操成本高昂[29] - 期待开发智能教练系统,融合知识图谱与实时动作识别技术,引导用户动手拼装实体模型,像搭建乐高一样理解结构原理[29] - **场景五:广东醒狮“虚实共生”传承课堂** - 类型为非物质文化遗产(国家级),痛点为陈列展览缺乏互动性与体验性,需数字技术赋能传播[36] - 期待借助先进技术手段,对醒狮动作细节、发力方式等进行动作捕捉与结构化呈现,实现数字动态呈现和观众互动体验[36] 项目申报与支持 - 项目流程分为三大阶段:项目申报(2025年12月—2026年1月)、项目遴选与公示(2026年2月—3月)、项目共创孵化与成果沉淀(2026年4月—10月)[48] - 项目遴选将应用腾讯Cultech-SQI评价体系,聚焦场景代表性(S)、创新性(Q)和话题性(I)[50][52] - 资金支持包括:共创落地项目共选出2-3个,每组有机会获得数十至百万元扶持资金;概念探索项目共选出3-4个,每个项目有机会获得20-40万元扶持资金[52] - 额外支持包括北大等行业权威专家“陪伴式”孵化、腾讯SSV技术能力与传播资源连接、纳入北大文化创新案例库以及优秀成果通过探元平台走向国际舞台[52] 参与方式与目标群体 - 寻找拥有AI大模型、XR、计算机视觉、生成式AI、人机交互等核心技术能力,能独立承接特定命题场景的技术团队[43] - 同时开辟“开放命题”通道,鼓励文化场景单位(如文博机构、非遗中心)与技术团队组成联合体进行联合申报,共同提出创新解决方案[44][45][46] - 申报截止日期为2026年1月31日[53] - 该赛道由北京大学文化产业研究院负责运营,聚焦世界文化遗产、博物馆及非物质文化遗产三大文化资源,旨在通过科技赋能形成新模式、新业态和新产品[56]
腾讯研究院AI速递 20260120
腾讯研究院· 2026-01-20 00:03
特斯拉AI芯片路线图 - 公司宣布其AI5芯片设计已接近完成,AI6芯片处于早期阶段,目标是将芯片设计周期缩短至9个月,并预测将成为全球产量最高的AI芯片 [1] - AI5芯片将采用三星2nm和台积电3nm制程,总体性能是前代AI4的50倍,内存容量是AI4的9倍,预计于2027年量产 [1] - 公司曾与三星签署价值165亿美元的协议,由三星在美国生产AI6芯片,预计2028年推出 [1] AI助理记忆与功能升级 - Anthropic为其AI助手Claude Cowork升级了“永久记忆”功能,通过引入知识库系统让AI分门别类存储信息,该功能将成为Claude默认的主要模式 [2] - 此次升级还包含增强MCP连接器体系以提升自动化能力、开发语音模式、升级Pixelate等,用户界面将新增右侧Artefacts区域以实现成果的持续管理 [2] - 持续学习被视为实现AGI的关键突破,OpenAI和谷歌均在布局记忆功能,行业观点认为持久记忆将彻底改变AI助理的概念 [2] AI设计工具与平台创新 - 昆仑万维推出Skywork Design Agent,聚焦海报设计、社媒物料、LOGO品牌视觉和通用创意生图四大核心场景,支持文生图和以图生图深度控制 [3] - 该产品新增自研画布引擎,支持图文手动编辑、AI修图、元素拆分图层等功能,提供PNG、JPG、PDF多格式导出,并具备独有的“添加到知识库”功能以解决素材管理问题,已在海外全面上线 [3] - 扣子平台推出Coze Skill功能,允许用户将个人方法论和行业经验封装成可复用的“技能包”,并上线技能商店以构建经验交易市场,专业人士可沉淀行业技能包供他人调用变现 [4] - 扣子平台还新增“长期计划”功能,可实现目标导向的AI协作,能将模糊目标拆解成清晰步骤并自动执行,同时推出了视频Agent Skill的公测 [4] AI大模型在游戏中的应用 - 巨人网络在游戏《超自然行动组》中推出“AI大模型挑战”模式,将大模型技术接入游戏对战环节,被视为国内大DAU游戏首次在核心玩法层面实现大模型规模化应用 [5] - 游戏中的AI角色由大模型实时驱动作为玩家对手,支持语音交互、模仿真人行为并主动采取行动,上线一周内AI对局次数超过2500万次 [5] - 游戏与阿里云、火山引擎、腾讯云合作,重点优化实时推理和高并发支持,成为业内首个整合多家大模型能力投入实际运营的案例 [6] AI硬件与办公生态整合 - 安克创新联合飞书推出仅重10克的AI录音豆,解决了传统AI录音卡片携带不便和遮挡麦克风的痛点,可像胸针别在领口或项链挂在胸前 [7] - 该设备搭载飞书AI实现实时总结,会议进行中即可生成结构化逻辑地图,支持24种语言实时翻译和说话人区分,会后自动生成智能画板和纪要 [7] - 录音内容直接流向飞书知识库而非存储在硬件,打通了日历、云文档、消息等飞书全生态,降低了构建知识库的负担 [7] 人形与重载机器人进展 - 萝博派对将双足人形机器人“萝博头原型机”全栈开源,其跑步速度达3m/s,是目前全球技术成熟度领先的全开源人形机器人 [8] - 开源内容涵盖硬件结构图、EBOM物料清单、供应商名单、AMP运控算法代码及Know-how知识库,团队目标是将具身智能开发成本降低80% [8] - 银河通用发布具身智能重载机器人Galbot S1,双臂最大持续作业负载达50公斤,已在宁德时代工厂承担核心生产环节 [9] - 该机器人搭载行业首创全自主、零遥操的“具身搬运模型”,采用纯视觉感知方案,具备8小时超长续航和自主换电能力,可实现7×24小时运转,公司近期完成21亿元融资,估值突破200亿元 [9] AI协作平台的发展与影响 - OpenAI的Codex产品负责人称,自ChatGPT5发布以来,平台规模增长了20倍,每周处理数万亿字符,其核心目标是打造具备主动性的“团队协作伙伴”而非被动响应工具 [10] - 以Sora安卓应用为例,其仅用28天从零开发到上线并登顶App Store,Atlas浏览器团队效率提升显著,原本需要两三人两三周的工作现在一人一周即可完成 [10] - 行业观点认为,距离AGI被严重低估的限制因素是人类打字速度和多任务处理速度,真正拖慢系统效率的往往是人机交互的物理和认知瓶颈,而非模型本身 [10]
我们正在亲手撰写历史
腾讯研究院· 2026-01-19 21:24
文章核心观点 - AI技术发展已进入新阶段,上半场以模型参数竞赛为标志的时期已结束,下半场的核心议题转向探讨在技术洪流中“何以为人”以及如何确立人的价值与尺度 [2][3][6][7] - 腾讯研究院将于2026年1月27日举办“科技向善创新节”,以“正在发生”为主题,通过23场分享、52位嘉宾的讨论,共同探索AI如何塑造世界以及人类如何坚守本质 [9][12][15] 大会概况与议程 - 大会主题为“正在发生”,旨在探讨AI文明史的当下进程 [9][15] - 活动包含主会场、直播马拉松和硬件游乐场三大板块,共计23场分享,邀请52位嘉宾 [9] - 大会首次开放300个线下观众席位,采用先到先得的方式获取 [13] 主会场议题与嘉宾 - 议题覆盖AI时代的宏观意义、组织进化、具身智能、人机分工、教育实践、社会伦理及AI治理等多个维度 [18][21][24][25][26][27] - 重要演讲包括腾讯集团高级副总裁郭凯天致辞、腾讯首席科学家张正友探讨具身智能、科幻作家陈树帆等人讨论人机分工重写等 [18][21] - 议题深入至具体领域,如“AI原生一代:组织与人的进化”、“身智融无碍:具身智能的发展和探索”、“人的重建,从不仰望AI开始”、“何以为‘人’”、“迈向可信任的AI治理”等 [18][21][22][25][27] 直播马拉松议题 - 该板块以连续直播形式探讨AI对家庭、媒体、文化及个人发展的影响 [28] - 具体议题包括“AI来了,‘家’会变吗”、“短剧凶猛,但怎么还没扑倒我”、“为什么在AI时代‘概率真相’是更好的心法”、“普通人如何跨上AI时代的列车”、“从一键生成到巴乔侯型,文化产业的破晓时刻真的来了吗”以及“用科技,塑造自己的下一个版本” [29][30][31][32] 硬件游乐场 (INNO100) - 该板块与INNO100全球创新旗舰店合作,打造实体互动体验区,展示AI如何融入硬件产品 [35][36] - 展示产品包括LOOI机器人、ropet AI陪伴机器人、AeroBand空气乐队智能吉他、DWARF 3智能望远镜等智能硬件 [37][38] - 提供实践工作坊,如引入Kickstarter授权的“万物定制工作站”,并开设3D打印、CNC加工及激光雕刻小课堂,让参与者亲手体验从设计到制造的全流程 [36][39][41][42][43][44]
腾讯研究院AI速递 20260119
腾讯研究院· 2026-01-19 00:01
超大规模计算基础设施与能源挑战 - 马斯克旗下xAI的Colossus 2超算集群正式投入运行,成为全球首个功率达到1吉瓦(GW)的超算集群,计划于4月升级至1.5吉瓦,最终装机容量将达到2吉瓦 [1] - 该集群完工后将内置55.5万张GPU,远超Meta和微软的规模,全部专用于Grok模型,预计将支撑6万亿参数的Grok 5模型训练 [1] - 数据中心用电激增对美国电网构成压力,导致PJM电网区域6700万居民可能面临轮流停电风险,xAI已部署168个特斯拉Megapack储能系统以缓解对电网的冲击 [1] 大模型产品商业化与市场策略 - OpenAI正式启动广告业务,计划在美国的免费版和新推出的ChatGPT Go订阅服务中测试广告,广告将出现在回答底部并明确标记,而Pro、Business和Enterprise版本则无广告 [2] - OpenAI推出低价订阅服务ChatGPT Go,价格为每月8美元,提供GPT-5.2 Instant版本,其消息量和图像创建量是免费版的10倍 [2] - OpenAI承诺广告不影响回答内容,不向广告商出售用户数据,用户可关闭个性化广告并随时清除相关数据 [2] 翻译工具与多语言模型竞争 - OpenAI低调上线ChatGPT Translate翻译工具,支持50多种语言,并提供一键调整译文语气(如“商务正式”、“学术风格”)的功能 [3] - 谷歌强势回应,开源了TranslateGemma模型,支持55种语言,其120亿(12B)参数版本性能超越270亿(27B)参数的基线模型,40亿(4B)参数版本可在手机端运行 [3] - TranslateGemma模型保留了多模态能力,可以翻译图像中的文字,其4B版本采用Apache 2.0许可证,支持商业使用 [3] 高效开源图像生成与编辑模型 - Black Forest Labs开源了FLUX.2 Klein模型,包含40亿(4B)和90亿(9B)参数两个版本,在现代硬件上实现了端到端推理时间低于0.5秒,统一了文生图和图像编辑能力 [4] - 4B模型仅需13GB显存即可在消费级GPU上运行,9B版本性能可与参数规模为其5倍的模型匹敌,4B版本采用Apache 2.0许可证 [4] - 模型提供了FP8和NVFP4量化版本,在RTX GPU上分别实现了最高1.6倍和2.7倍的推理加速,显存占用降低了40%至55% [4] 3D内容生成技术升级 - 混元3D Studio 1.2全面开放公测,其组件生成能力升级为PartGen 1.5,拆分精度从1024³提升至1536³分辨率,并支持笔刷交互进行拆分控制 [5] - 基础模型升级为混元3D 3.1版本,几何细节和纹理颜色还原度大幅提升,支持通过八视角图像输入生成3D模型 [5] - 新版本引入了全尺度组件精细化处理和分割掩码控制,实现了更完整的复杂物体拆分和专业可控的组件生成 [5] 大模型智能体能力与训练方法创新 - 美团发布了5600亿参数的LongCat-Flash-Thinking-2601模型,引入了“重思考”模式,可同时启动8路并行思考后汇总得出结论 [7] - 该模型的智能体能力获得重大提升,在工具调用和搜索等基准测试中达到顶尖水平,团队还提出了自动化环境规模扩展的泛化能力评测方法 [7] - 模型采用环境规模扩展与多环境强化学习进行训练,并引入了面向噪声环境的课程式稳健训练,显著提升了在分布外场景的适应能力 [7] OpenAI内部争议与法律诉讼 - 法庭解封了超过100份与马斯克诉OpenAI案相关的证词文件,文件显示奥特曼通过YC基金间接持有OpenAI股份,同时秘密拥有OpenAI创业基金,与其公开声明存在矛盾 [8] - 文件曝光了Brockman 2017年的日记,其中承认想把OpenAI转为营利公司并踢出马斯克,称“这是摆脱埃隆的唯一机会” [8] - OpenAI反驳称马斯克曾要求获得50%-60%的股权和CEO职位但被拒绝,法官认为证据争议较大,适合由陪审团裁决,审判定于4月27日开始 [8] 脑机接口技术进展与升级路径 - Neuralink首位受试者Noland揭秘,其大脑芯片可通过三种方式升级:Telepathy应用更新、植入体固件OTA无线更新以及硬件迭代 [8] - 此前85%的电极发生脱离后,团队通过软件算法更新让剩余15%的电极性能反超完好状态,实现了不开颅修复问题 [8] - 下一代计划采用“双芯配置”,在大脑和脊髓各植入一枚芯片以搭建“数字桥梁”,目标是让瘫痪者重新行走;奥特曼投资的Merge Labs也已入局脑机接口领域 [8] 行业对AGI发展的判断与预测 - 红杉资本合伙人联合发布博客,指出AGI(通用人工智能)已经到来,其功能性定义为“能把事情搞清楚的能力”,认为长周期智能体已具备形成假设、验证、调整直至找到答案的能力 [9] - 文章举例说明,智能体能在31分钟内自主完成一项招聘任务:从LinkedIn搜索到YouTube筛选演讲者,再交叉比对Twitter找出倦怠信号,最终锁定精准候选人 [9] - 长周期智能体的能力被认为每7个月翻一番,预计到2028年能完成人类专家一天的工作,到2034年能完成一年的工作,并称“你对2030年的梦想,2026年就能实现” [9] 大模型能力演进与个性化方向 - OpenAI后训练负责人表示,GPT-5.1首次让所有聊天模型都变成了推理模型,模型可根据问题难度自主决定思考时长,实现更智能的资源分配 [10] - 团队重点改进了模型的上下文记忆、自动模型切换的风格一致性和指令遵循能力,并新增了“风格与特质”个性化功能,允许用户自定义模型的表达方式 [11] - 未来模型将更加可定制,记忆功能让模型能记住用户背景和偏好,真正的方向是模型主动理解用户,但用户始终掌握主导权 [11] AI对工作效率的影响与潜在风险 - Anthropic发布的新《经济指数报告》显示,任务越复杂,AI带来的效率提升越惊人:完成高中学历水平的任务速度提升9倍,完成大学学历水平的任务速度提升达12倍,颠覆了“AI只擅长简单劳动”的认知 [12] - 报告发现,人机协作能将AI处理任务的时长上限从基准测试的2小时推高至19小时,接近10倍提升,人类学会拆解任务和提供反馈修正是关键 [12] - 报告警示存在“去技能化”风险,AI正系统性剔除工作中的高智力部分,当前AI覆盖的任务平均需要14.4年的教育背景,高于经济活动平均所需的13.2年 [12]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2026-01-17 10:33
芯片与硬件 - 美国发布AI芯片新规 [3] 模型与算法 - DeepSeek开源「记忆」功能 [3] - UniPat AI推出「纯视觉考卷」模型 [3] - 美团提出新的稀疏注意力机制 [3] - 谷歌发布MedGemma 1.5医疗模型 [3] - 智谱发布GLM-Image模型 [3] - 爱诗科技推出实时世界模型 [3] - 1X公司发布1X World Model [3] - 千寻智能发布Spirit v1.5 [4] - 阶跃星辰发布Step-Audio-R1.1 [4] 应用与产品 - Anthropic对部分国家实施访问限制 [3] - xAI开源推荐算法 [3] - Tailwind CSS讨论AI编程的影响 [3] - 追觅发布家庭机器人 [3] - 清华大学研究AI药物筛选 [3] - 谷歌推出UCP协议 [3] - Midjourney发布Niji 7动漫模型 [3] - 昆仑万维发布Video v1.0 [3] - Anthropic推出AI办公Cowork [3] - 苹果与谷歌就Gemini展开合作 [3] - OpenAI收购Torch医疗公司 [3] - Anthropic推出HIPAA级医疗AI [3] - 百川发布医疗大模型 [3] - OpenAI展示AI音频设备 [3] - 谷歌发布Veo 3.1 [3] - Vidu发布AI MV工具 [3] - 马斯克展示AI游戏选手 [3] - 谷歌推出Personal Intelligence [4] - 英伟达进行智驾实测 [4] - 千问App推出AI购物功能 [4] - 滴滴推出小滴Agent [4] - GPT-5.2在长程任务上取得突破 [4] - 擎天租推出机器人租赁服务 [4] - 逐际动力推出COSA系统 [4] - 哥伦比亚大学研发人脸机器人 [4] 行业观点与趋势 - OpenAI讨论模型「能力过剩」现象 [4] - YC分享AI原生公司发展路径 [4] - 月之暗面进行Kimi技术分享 [4] - Anthropic探讨Agent评估方法 [4] - 多家公司讨论AGI-Next发展方向 [4] - Anthropic总结开发效率规律 [4] - Linux之父称赞Vibe Coding体验 [4] - 马斯克对AGI发展做出预测 [4] - MIT评选2026年十大突破性技术 [4] - Fal平台分析内容生成发展趋势 [4] - 谷歌探讨AI时代的软件工程 [4]
AI发现的25个好故事
腾讯研究院· 2026-01-16 19:24
文章核心观点 - 文章通过AI在全球范围内发掘了25个被主流媒体忽略的商业案例,这些案例的共同点在于利用技术解决真实、具体的社会或环境问题,而非追求炫酷的概念或高估值 [3][4] - 这些案例揭示了真正的创新往往发生在经济系统的“下水道”或被认为“无利可图”的领域,其核心是将“无用”变为“有用”,修补世界破损的循环 [6][7] - 技术在这些案例中的角色并非取代人类,而是重构人的尊严和价值,赋能个体,并倾向于构建新经济的底层操作系统,成为“铺路人”而非“淘金者” [10][13] - 改变世界往往始于微小的、具体的痛点,这些商业点子通过解决真实问题和连接真实的人,最终累积成巨大的价值 [16][17] 根据相关目录分别进行总结 环保与资源循环创新 - **ZwitterCo** 发明了一种能够“免疫”污垢的两性离子过滤膜,解决了传统反渗透膜易被油脂和蛋白质堵塞的问题,致力于处理全球80%未经处理即排放的废水 [6] - **EcoPeace** 制造太阳能动力小船在韩国湖泊巡游,吸入藻类并收集数据,还打造了兼具游船和夜市功能的“治愈之舟”,用商业利润供养环保成本 [6] - **TBM** 在日本利用主要成分为石灰石的LIMEX材料制造纸张和塑料替代品,该过程几乎不消耗水和木材 [7] - **哥伦比亚的创业公司** 将咖啡加工中废弃的果肉转化为富含抗氧化剂的超级食品原料,变废为宝 [8] - **印度的Brisil** 从稻壳灰中提取高性能二氧化硅,销售给轮胎制造商用于生产“绿色轮胎” [8] - **Kind Designs** 在美国使用3D打印技术制造表面模仿红树林根系纹理的海堤,促进牡蛎等海洋生物附着,使海堤随时间推移愈发坚固并净化海水 [13][17] 能源与建筑效率革新 - **Ampd Energy** 在香港用大型电池集装箱取代建筑工地的柴油发电机,减少污染和噪音,并将建筑业接入数字时代 [7] - **WexEnergy** 在纽约为旧楼窗户安装高科技隔热板,无需更换窗户即可将建筑能效提升一倍 [7] - **Brenmiller Energy** 在以色列利用碎石进行热能储存,该方案成本低、寿命长,旨在解决工业热能的脱碳难题 [7] 医疗健康与赋能体系 - **Abridge** 在美国利用生成式AI实时聆听医患对话并自动生成电子病历,让医生能更专注于患者,改善医患关系 [10] - **Buymed** 在越南建立一个强大的B2B供应链和物流网络,连接了数万家小型药店,而非建立自有连锁店来竞争 [12] - **Nutrix** 开发唾液皮质醇检测仪,试图量化企业的“职业倦怠”问题 [16] - **PetPharm** 着眼于韩国6000家药店,旨在盘活被浪费的动物药品分销渠道 [16][24] 农业与食品技术 - **EasyRice** 在泰国利用AI进行大米质量检测,将质检速度提高10倍,在农民与收购商之间提供客观公正的评估标准 [11] - **UMAMI Bioworks** 在新加坡从事细胞培养海鲜研发,其定位是成为海鲜食品工业的赋能者与核心部件供应商(类似“Intel Inside”) [11] - **Belterra** 在巴西亚马逊雨林通过金融和技术支持系统,让农民发现“种树比砍树更赚钱” [11] 乡村发展与社区赋能 - **Frontier Markets** 在印度农村赋能超过两万名被称为“Saheli”(闺蜜)的农村女性,通过配备平板电脑,她们以建立信任的方式推广和销售产品,攻克电商“最后一公里”难题 [2][10] - **Jibu** 在非洲通过特许经营模式,支持当地创业者经营水站,在提供洁净水的同时创造收入和尊严 [11] - **Satoyume** 在日本山梨县小菅村进行乡村振兴实践,将整个村庄重构为一个“拥有700名员工的酒店”,让村民深度参与其中 [13] 监测与生态保护 - **Synature** 在瑞士利用AI音频监测技术监听森林中的狼嚎和虾的进食声等,定位为“全球动物监测的神经系统”,服务于生态保护和精准农业 [13]
腾讯研究院公众号获“AIGC Rank 2025年度影响力AI媒体”
腾讯研究院· 2026-01-16 19:24
公司荣誉与定位 - 腾讯研究院公众号在AIGC Rank发布的2025年度榜单中获评“年度影响力AI媒体”[5] - 公司秉持“用户为本、科技向善”的使命愿景,致力于在人工智能时代锚定人文关怀与制度理性,推动AI健康、包容、可持续发展[7] 年度内容产出与影响力 - 全年发布人工智能相关深度文章共计120篇,系统探讨大模型治理、算法伦理、数字劳动、智能社会等前沿议题[9] - 多篇原创内容引发学界与业界广泛关注,其中单篇最高阅读量突破5万次[9] - 在全年248个工作日中,坚持每日推出「每日AI速递」栏目,累计发布248期,追踪全球AI政策、技术突破与社会影响[9] - 每周推出「AI关键词」专栏,全年共发布50期,通过概念解析帮助公众理解技术背后的制度逻辑与人文关切[9] 未来方向 - 公司计划在2026年继续深耕AI时代的社会科学研究,强化跨学科对话,拓展公共讨论的深度与广度[7]
腾讯研究院AI速递 20260116
腾讯研究院· 2026-01-16 00:06
美国对华AI芯片出口政策调整 - 美国对英伟达H200、AMD MI325X等先进AI芯片征收25%关税,并将对华出口许可审查从“推定拒绝”改为“逐案审查” [1] - 新规限制对华芯片数量不得超过美国客户总量的一半,并针对特定技术参数(如TPP在14000-21100、DRAM带宽4500-6200GB/s)的芯片征收关税 [1] - 美国通过《远程访问安全法案》限制中国通过云计算服务远程获取AI芯片,并要求商务部在7月前提供数据中心芯片市场最新情况 [1] 谷歌发布Personal Intelligence功能 - 谷歌正式发布由Gemini 3模型驱动的Personal Intelligence功能,底层打通Gmail、Photos、YouTube和Search四大应用,实现跨应用数据调取与私有上下文理解 [2] - 该功能内置自然语言纠错机制,用户可直接在对话框指出AI错误,系统实时修正认知记录 [2] - 功能目前处于Beta测试阶段,优先向Google AI Pro和AI Ultra等付费用户开放,支持全平台,未来将覆盖免费版用户 [2] 英伟达智能驾驶技术进展 - 英伟达搭载全新L2++级辅助驾驶系统的奔驰CLA在旧金山完成近40分钟测试,表现流畅无碰撞,被认为与特斯拉FSD能力相当且因雷达冗余感知更安全 [3] - 公司计划2026年上半年推出L2级高速与城市驾驶功能,2026年底覆盖全美,2027年推进Robotaxi部署,2028年实现L3级高速公路驾驶 [3] - 英伟达仅用1年实现城市自动驾驶功能追平特斯拉8年成果,采用Drive AGX Thor芯片(约3500美元),基于强化学习系统持续改进 [3] 阿里千问App上线AI办事功能 - 千问App上线400多项办事功能,接入淘宝、支付宝、飞猪、高德等阿里生态,首次实现点外卖、购物、订机票酒店等AI购物功能 [4] - 新增功能包括AI点外卖(支付在对话界面内完成无需跳转)、AI打电话订餐厅、50项政务服务直达入口、智能旅行规划等 [4] - 上线“任务助理”功能,提供应用开发、办公、咨询、生活办事等能力,得益于AI Coding、全模态理解、超长上下文处理等技术突破 [4] 滴滴上线出行AI助理“小滴” - 滴滴上线Agent“小滴”,用户通过一句话即可选择油电动力、空气清新、车型车色,并能识别模糊需求(如“带大件行李”)自动推荐合适车辆 [5][6] - “小滴”具备需求优先级排序能力,分为“必要”、“优先安排”等多个等级,优先满足排序靠前的需求 [6] - 上线3个多月迭代后,AI激活了滴滴精细化运营积累,机器人能记住用户习惯提供个性化服务 [6] 阶跃星辰语音模型技术突破 - 阶跃星辰原生语音推理模型Step-Audio-R1.1登顶Artificial Analysis Speech Reasoning榜单,以96.4%准确率超越Grok、Gemini、GPT-Realtime等主流模型 [7] - Step-Audio-R1是全球首个开源原生语音推理模型,可端到端理解语音内容,实现深度语音推理、实时响应和音频领域可扩展CoT,无需增加额外时延 [7] - Step-Audio-R1.1兼顾更强实时对话和复杂语音推理能力,完整实时语音API将于2月上线,目前chat模式已支持边想边说的流式推理 [7] AI代码生成能力展示 - Cursor CEO让GPT-5.2连续运行168小时,写下300万行代码、数千个文件,从零构建出包含HTML解析、CSS布局、文本渲染和JavaScript虚拟机的完整浏览器 [8] - 项目采用多智能体系统分层架构(规划者、执行者、评审者),实现上百个Agent协同工作数周几乎无冲突 [8] - 实验显示GPT-5.2能长时间自主工作并保持专注,而Claude Opus 4.5倾向尽早结束任务,GPT-5.1-Codex规划能力较弱容易中断 [8] 机器人租赁平台“擎天租”发展 - 全球首个机器人租赁平台“擎天租”完成种子轮融资,高瓴创投领投,复星创富、慕华科创等跟投 [9] - 平台上线三周注册用户突破20万,日均租赁订单稳定在200单以上,连接50个核心城市600多家服务商,汇聚1000多台不同品牌机器人设备 [9] - 采用共享租赁+平台化调度模式,租金从长租200元/天到日租上千元梯度定价,与中国人保财险合作推出损伤险和责任险,承诺“只换不修” [9] 仿生面部机器人技术进展 - 美国哥伦比亚大学研究登上Science Robotics封面,展示具备仿生面部结构的人形机器人,通过深度学习实现与语音和歌曲同步的真实唇部运动 [10] - 机器人面孔在柔性硅胶皮肤下隐藏20余个微型电机,通过“视觉-动作”自监督学习构建Facial Action Transformer模型,观察自己面部变化学会控制表情 [11] - 机器人可将声音信号直接转化为连续自然的唇部运动,在多种语言、不同语音环境甚至歌曲中均能完成连贯的唇部同步,跨语言泛化能力稳健 [11]
谁在沉迷AI算命?
腾讯研究院· 2026-01-15 17:14
文章核心观点 - 生成式AI与传统算命结合,已成为一个在主流商业视野之外快速增长的商业化品类,其本质是后疫情时代社会情绪不确定性增加背景下,人们寻求精神慰藉与暂时确定性的出口 [2][3][4] - AI算命通过技术手段将传统高成本、高仪式感的玄学活动转变为低成本、即时反馈的日常快消品,重塑了算命行业的商业模式与用户习惯 [6][7][10] - AI在算命中的角色主要是对传统算力的人力替代,其强大的数据处理与多轮对话能力提供了类心理咨询的体验,但其缺乏体系完整性、逻辑缝合及伦理判断的缺陷也带来了潜在问题 [11][13][14][15] 被AI重塑的算命生意 - **海外市场案例**:印度在线占星平台Astrotalk垄断了本土80%的市场份额,拥有4000万用户和1.5万名活跃占星师,每分钟营收超过250美元,EBITDA利润率近20%,ROCE高达40% [5][6] - **中国市场现状**:2024年中国AI玄学(含AI算命)市场规模已突破120亿元,年增长率达43.7% [10] - **产品形态与商业化**:AI算命产品(如“AI人生K线图”)在AI Agent平台中排名靠前,此类第三方服务在社交及二手电商平台以5-10元价格售卖,不到半个月累计成交量可达上万 [6] - **行业变革**:AI将算命从一种传统仪式演化为日常化的“赛博黄历”,用户未来将进行高频次、碎片化的玄学消费 [6][7] AI,最后的“心灵摆渡人” - **用户基础广泛**:历史调查显示每四个中国人中至少一人相信算命,总人数超3亿,当前算命主力军为18-35岁年轻人,占比高达68% [9][19] - **成本结构颠覆**:传统算命市场极度非标,服务收费从几十元到几十万元不等,而AI产品大多免费或仅需支付模型订阅费,使用成本被无限摊薄,未来随着token成本降低将更便宜 [10] - **技术原理契合**:算命本质是一套严密的符号系统与解释规则,算命师的工作是根据输入变量在规则库中推演,这与AI大模型的原理相似,AI扮演了不知疲倦的“机械臂”角色,是对传统算力的人力替代 [10][11] - **能力优势**:AI对结构化数据的处理能力及速度远超人类,具备长上下文处理能力后,能在多轮对话中维持信息连贯性,并进行回溯与关联 [11] 心灵树洞的B面 - **技术缺陷**:现有AI算命模型缺乏单一流派的体系完整性,倾向于将不同流派生搬硬套,导致底层逻辑冲突,且缺乏人类“复盘-修正”的闭环能力,每次服务都是断裂的 [13] - **情感交互的双面性**:AI能敏锐捕捉用户情绪颗粒度,输出照顾用户情绪的观点,提供不带道德审判的接纳,让用户卸下防备,但也因缺乏发散性思维和语境感知,只能基于字面意思提供策略,处理复杂人性时显得苍白 [14] - **伦理风险**:AI受困于绝对的“工具理性”,面对赌博求财或破坏家庭等咨询,会无底线地提供建议,成为人性幽暗面的技术共谋者,而人类命理师则会基于价值理性拒绝此类咨询 [15]
腾讯研究院AI速递 20260115
腾讯研究院· 2026-01-15 00:03
美国对华AI芯片出口管制政策调整 - 美国商务部工业和安全局修改出口管制条例,将高性能芯片限制放宽至TPP低于21000和DRAM带宽低于6500GB/s,为英伟达H200和AMD MI325X对华出口创造了法律空间 [1] - 新规要求申请人证明美国市场有足够供应且对单一国家出口不超过美国总销量的50%,预计到2026年,H200芯片可为英伟达贡献超过476亿美元营收,其中中国市场贡献近160亿美元 [1] - 美国众议院以369票通过《远程访问安全法案》,限制通过云平台远程接入获取先进算力以训练AI模型,此举可能冲击海外合建数据中心项目 [1] 全球AI视频生成技术竞争加剧 - 谷歌Veo 3.1实现重大升级,新增“素材生视频”功能,通过上传图片和文本指令即可生成高质量视频,角色一致性达到新高度,并支持原生9:16竖屏输出及1080p、4K超分辨率技术,直接适配移动端平台 [2] - 爱诗科技发布全球首个支持最高1080P分辨率实时生成的世界模型PixVerse R1,用户可通过文字或语音实时干预视频生成过程,将视频生成从“固定片段”转变为“无限可视化流” [4] - Vidu AI开放平台推出“一键生成MV”功能,用户提交音乐、参考图像与文本指令后,系统可全自动输出叙事连贯、音画同步的MV,其“多图参考生视频”技术允许上传至多7张参考图,在长达五分钟的视频中精确复刻人物特征与美学风格 [5][6] 中国AI模型与算力自主化进展 - 智谱AI联合华为开源新一代图像生成模型GLM-Image,该模型基于昇腾Atlas 800T A2设备和昇思MindSpore框架完成全流程训练,是首个在国产芯片上完成的SOTA多模态模型,在相关榜单获得开源第一,中文文字渲染成绩达0.979 [3] - GLM-Image模型API调用生成一张图片成本仅需0.1元,特别擅长海报、PPT、科普图等知识密集型场景及汉字生成任务 [3] 具身智能与机器人技术突破 - 1X公司为其家用人形机器人NEO发布全新“大脑”1X World Model,该模型通过观看海量网络视频和人类第一视角实操录像来理解物理世界,基于140亿参数生成式视频模型,采用多阶段训练策略 [7] - 该模型的逆动力学模型在400小时未经过滤的机器人数据上训练,能从生成的视频中提取对应动作轨迹,官方推文浏览量已突破500万 [7] AI在游戏与医疗领域的应用与影响 - 《英雄联盟》韩服出现神秘玩家,在51小时内完成56局对局,取得52胜4败、综合胜率92%的战绩,登顶时胜率高达95%,该账号使用了22名不同英雄,对线胜率86%断层领先,引发关于其是否为AI的广泛猜测 [8] - 谷歌发布MedGemma 1.5 4B版本,首次支持CT和MRI三维体数据以及全切片数字病理图像等高维医学影像分析,将MRI疾病发现分类准确率从51%提升至65%,解剖结构定位精度从3%跃升至38% [9] - 同步推出的MedASR语音识别模型,在胸部X光报告口述场景中词错误率仅5.2%,比通用模型Whisper低82% [9] AI对软件工程行业的结构性冲击 - 谷歌Cloud AI总监提出AI时代软件工程面临的五个关键问题,涉及初级工程师需求、基本功价值、职业角色转变、专才风险及大学计算机专业必要性 [10] - 哈佛研究显示,公司引入生成式AI后,初级开发者岗位数量在六个季度内下降约9%-10%,而高级工程师就业几乎没有变化,大型科技公司招聘应届生数量减少50% [11] - 建议初级工程师构建AI集成作品集并手动编写关键算法,资深工程师需注重架构审查以适应“代理式”工程环境,通才将比专才更具竞争力 [11]