腾讯研究院
搜索文档
当AI遇见青春期:AI的青少年“性教育”大考,它及格了吗?
腾讯研究院· 2025-10-24 18:43
如何塑造一位合格的"引路人"。 直面AI与青少年性教育,我们试图解析:AI是否能够以准确、包容、不失温情的语言,成为值得 信赖的信息源?是否能在谈及月经时,消解历史的羞耻,传递积极的身体观念?又是否能为残障 青少年点亮一盏平等指引的灯? 敬请关注腾讯研究院今日发布《当AI遇到青春期:AI与青少年性教育测评研究》 我们正站在一个历史性的交汇点。 人工智能的浪潮以前所未有的力量,重塑着知识的边界与人类学习的路径。 我们的孩子, 作为天生的"数字原住民",正自然而然地拥抱这一变革。 当社会的目光大多聚焦于AI如何 提升学业成绩、开拓学术视野时,一个如 "房间里的大象" 般庞大而关键的议题,正悄然浮 现:我们的孩子,已经开始向AI探索那个成长中最私密、最困惑,也十分需要引导的奥秘 —— 性 。 当这本应充满关怀与智慧的启蒙篇章,遇见了一位 无所不知、随时在线的"AI伙伴" ,我们 面临的核心议题不再是简单的接纳或拒斥,而是 如何共同塑造一位合格的"引路人"。 这位新伙伴,能否以科学和共情, 守护青春期的敏感与尊严?又能否跨越数字鸿沟,为每一 个独特的成长需求提供支持? 为探寻答案, 腾讯研究院与北京科技大学何思倩老师 ...
腾讯研究院AI速递 20251024
腾讯研究院· 2025-10-24 00:01
谷歌AI学习平台 - 谷歌推出AI学习平台Google Skills,整合内部资源提供超过3000门课程,覆盖大型语言模型技术及伦理内容[1] - 平台采用游戏化激励方式,过去一年已有2600万人在其分散平台学习技能,现集中至统一入口[1] - 平台与150多家雇主组成招聘联盟,用户完成证书可跳过初筛直接进入面试,构建学习至就业的闭环[1] Sora项目升级 - Sora2将推出“角色客串”功能,允许用户将现实物品或生成人物投射到虚拟世界并创建独特IP进行互动[2] - 社交体验将优化,支持特定社群组队分享并减少过度内容审核,应用优化包括流畅度提升和视频编辑功能[2] - 安卓版即将上线,可在谷歌应用商店预注册[2] 快手AI编程产品 - 快手发布AI编程产品矩阵,包括KAT-Coder模型、CodeFlicker开发工具和万擎MaaS平台三位一体解决方案[3] - KAT-Coder模型在SWE-bench Verified榜单解决率达73.4%,其开源版达74.6%,收入在8个月内增长4倍[3] - CodeFlicker工具已在公司内部80%工程师中使用,支持自动生成代码仓库说明书和企业级定制服务[3] 多模态图像编辑模型 - 港科大贾佳亚团队推出DreamOmni2多模态图像编辑模型,在GitHub两周内获得1.6k星标,可处理多个参考图像并理解抽象概念[4] - 基于FLUX Kontext模型,该模型在传统任务上优于现有开源模型,支持风格迁移、动作模仿和多图编辑[4] - 采用创新三阶段数据构建范式和索引编码技术,首次实现从单一物体到完整3D场景的生成并已开源[4] 3D生成大模型 - 字节跳动推出3D生成大模型Seed3D 1.0,基于Diffusion Transformer架构,可从单张图像生成高精度3D模型[5] - 该1.5B参数模型在纹理材质生成上对标SOTA水平,能准确还原精细特征[5] - 生成的3D模型可导入仿真引擎供机器人训练,并支持从单一物体扩展至完整3D场景生成[6] Meta AI部门调整 - Meta在AI部门进行大规模裁员约600个职位,华人AI科学家田渊栋及其团队受影响,FAIR实验室成为重灾区[7] - FAIR实验室遭重创,有消息称其首席科学家可能辞职,而新成立的TBD超级智能实验室仍在招聘[7] - 公司认为原有架构过于官僚化,正将重心从开放式基础研究转向超级智能竞赛,近期达成270亿美元数据中心融资[7] AI智能终端 - 科勒推出Dekoda智能马桶售价599美元起,通过AI摄像头视觉分析排泄物判断肠道健康等状况[8] - 使用需订阅年费26至70美元的应用,其AI模型基于超100万数据点训练并采用布里斯托大便分类法[8] - 产品面临隐私争议和高昂价格限制,分析结果相对简单仅分为正常、硬便、稀便等类别[8] 量子计算突破 - 谷歌发布量子回声算法在Willow芯片上运行,解决原子相互作用速度比Frontier超级计算机快13000倍,数小时完成需3.2年的计算[9] - 这是量子计算机首次在真实硬件上成功运行可验证算法,结果可在其他同等水平量子计算机上重复验证[9] - 算法可研究从分子到黑洞的各种系统结构,为药物研发和材料科学应用铺路[9] AI模型性能比较 - Vercel公司CEO表示内部测试中Kimi K2运行速度是GPT-5和Sonnet 4.5的5倍(2分钟对比8-10分钟)[10] - Kimi K2准确率超60%,比GPT-5(低于40%)高出50%,比Sonnet 4.5(低于50%)也有优势[10] - 硅谷多家公司如Cline、Cursor等已接入K2模型,因其性能强且价格更便宜[10] 视频模型发展趋势 - a16z合伙人指出视频模型进入产品时代,不同模型如Sora 2和Veo 3正走向专业化发展[12] - 模型能力与产品间存在巨大鸿沟,创作者需手动完成的工作应由产品层面解决[12] - 未来将出现针对特定场景的专用模型、帮助用户选模型的产品和整合创作套件[12]
复旦大学肖仰华:AI的尽头是人文
腾讯研究院· 2025-10-23 16:30
肖仰华 复旦大学计算与智能创新学院教授、博导,上海科学智能研究院AI科学家,上海市数据科学重点实验室主任 【 精彩观点 】 1.技术进步历来伴随人的某些能力退化,这不是今天才出现的问题。AI同时引发了升智和降智。 2.在消费端:内容极大丰富后,人很难直接消费,将转为"终级消费者"。由个人的AI代理先做筛选与分 级消费,给人"二次精选"。未来还会出现"面向AI代理的生产与营销"。 3.能力外包可能"反噬主体":当你尚未具备某种专业能力,就把它交给AI,你反而失去了发展该能力的 机会。 4.我们要设定一个安全外包的条件是:你已是该事项的"专家",有足够的判别力与监督力,AI出错你能 识别和纠正;否则,就不该外包给AI来做。 5.未来的人类社会将开启新的大航海时代,类似于马斯克探索宇宙,走向深空。这将有助于避免人类在 地球上的内卷式消耗。 6.必须正视"闲置劳动力"的安置。工业时代已是二八定律,AI时代可能走向"2%和98%"——极少数人 完成绝大部分生产。 7.AI不仅解放时间,更可能让人"全面自由":身体与头脑的大量工作都被替代,人变成纯粹自由的人。 这种自由不是所有人都能妥善安置,很多人会堕落与放纵。必须重视 ...
腾讯研究院AI速递 20251023
腾讯研究院· 2025-10-23 00:33
生成式AI产品发布与更新 - OpenAI发布基于Chromium内核的AI浏览器ChatGPT Atlas,目前免费开放macOS版,后续将推出Windows及移动端版本 [1] - Atlas核心功能为将ChatGPT深度集成至浏览器,可查看用户页面内容并通过侧边栏回答问题,配备浏览器记忆功能和智能体模式以执行订票、购物等复杂任务 [1] - Claude正式发布桌面版,同时支持Mac和Windows系统,提供全局快捷键、窗口分享、语音输入和工具连接四大核心功能 [2] - 谷歌AI Studio推出全新vibe Coding体验,用户通过点击Build一键生成AI应用,使用Gemini 2.5 Pro制定计划并生成文件,支持免费使用且无需信用卡 [3] - 百川智能发布业内首个循证增强医疗大模型Baichuan-M2 Plus,通过首创"六源循证范式"构建权威医学知识体系,幻觉率比DeepSeek-R1低3倍 [5][6] 多模态与3D模型技术突破 - 腾讯混元世界模型1.1正式开源,首次支持多模态先验注入和多任务统一输出,采用纯前馈架构实现秒级推理,处理8-32视图输入仅需1秒且支持单卡部署 [4] - 该模型基于统一架构实现点云、深度、相机参数、表面法线和新视角合成等多种3D几何预测,在仿真器及真实物理世界任务中性能显著超越现有方法 [4] - 华为HarmonyOS 6实现与苹果iOS/iPadOS/macOS互传,纯血鸿蒙终端设备突破2300万台,小艺AI支持速记、AI修图、自动订票购物等功能,并支持16种方言交互 [7] 机器人与XR硬件创新 - 松延动力推出全球首款万元以内消费级人形机器人Bumi小布米,售价9998元,拥有21个自由度,搭载自研伺服电机和深度强化学习算法,能够稳定行走、跳舞和完成复杂动作 [8][9] - 该机器人定位教育和陪伴场景,支持语音交互和图形化编程,公司已完成6轮融资,N2机型在人形半马比赛多项目夺冠并成为销量破千的人形机器人公司 [9] - 三星发布首款旗舰XR头显Galaxy XR,售价1799.99美元(约合人民币1.28万元,仅为Vision Pro一半),重545克比Vision Pro轻1/4,搭载3552×3840分辨率Micro-OLED屏 [10][11] - Galaxy XR首款搭载Android XR平台并内置Gemini AI助手,DCI-P3色域覆盖96%超过Vision Pro,配备18个传感器实现头部手部眼部精准追踪,续航2-2.5小时 [11] 开发工具与框架演进 - Dexmal原力灵机推出开源VLA代码库Dexbotic,基于PyTorch框架开发,采用Data、Model、Experiment三大核心组件架构,支持π0、OpenVLA-OFT等多个主流VLA算法 [7] - 该代码库用户只需配置一次环境即可在各类仿真环境中复现算法,支持云端与本地一体化训练,同时推出首款开源硬件DOS-W1,采用快拆结构和可替换模块 [7] - 前Manus研究员指出AI Agent能力质变的关键在于围绕模型设计的"认知流程",而非底层模型智力增长,开发者角色从"提示词工程师"转变为"Agent流程架构师" [12]
硅谷996背后是AI的锅吗?丨硅谷AI转型录NO.2
腾讯研究院· 2025-10-22 17:33
《硅谷AI 转型录》 是由腾讯研究院发起的一个全新的观察系列。AI已经开始在底层重构我们工作的方方 面面,这一次"AI革命",不仅仅是简单的生产工具升级,而是一场关于生产关系、协作方式和价值创造 的深刻变革。腾讯研究院的袁晓辉和余一,将携手硅谷顾问陈然以及更多行业先驱,深入硅谷的创新变 革一线,聚焦于两个核心:一是AI如何作为一种基础能力,渗透并重构我们的工作、创造和竞争。二是 不同的群体,特别是硅谷的先锋企业和个人,如何开创人机协作的新范式,如何适应甚至引领这场变 革。不只关心正在发生什么,更关心它为何发生,以及它将走向何方。 第一期的硅谷AI转型录,聚焦硅谷大裁员背后的AI组织重构。 第二期硅谷AI转型录则要从"加班"开始聊 起,发现之前被很多人诟病的996文化,似乎在硅谷的创业文化中有复苏的迹象,甚至很多硅谷的创业公司 将996作为一种硬性要求写在自己的招聘要求中。AI时代,996会重新成为一种必要的职场文化吗?如何应 对AI带来的焦虑和疲惫?怎么定义和筛选AI原生人才?AI会对公司的人员招聘、职能划分以及组织架构等 方面带来哪些意想不到的改变? 【金句亮点】 横向对比中国和美国的法律框架,你会发现中国 ...
腾讯研究院AI速递 20251022
腾讯研究院· 2025-10-22 00:01
Anthropic产品更新 - 上线网页版Claude Code功能 作为研究预览版向Pro和Max用户开放 支持从浏览器直接委派编程任务并在云端基础设施上运行 [1] - 功能支持并行运行多个编程任务 连接GitHub仓库自动创建PR 每个会话在独立沙盒环境中运行 具备实时进度追踪和安全网络限制 [1] - iOS应用同步开放Claude Code功能 使开发者可随时随地编程 特别适合处理漏洞积压 常规修复或并行开发等任务 [1] - 正式上线Claude生命科学版Claude for Life Sciences 基于Claude Sonnet 4.5打造 在Protocol QA基准获0.83分超越人类基准0.79分 [7] - 新增Benchling BioRender PubMed等科研平台连接器 支持Databricks和Snowflake进行大规模生物信息学分析 [7] - 推出single-cell-rna-qc等专项技能 可胜任文献综述 实验方案生成 生物信息学分析等任务 覆盖从早期发现到成果转化全流程 [7] AI模型技术突破 - 清华与智谱联合推出Glyph框架 将文本信息渲染成图像后用视觉模型处理 实现3-4倍文本压缩率 128K窗口可处理1M tokens文本 [2] - Glyph采用持续预训练 LLM驱动的渲染搜索和后训练三阶段方法 通过遗传算法自动寻找最优渲染配置 性能与Qwen3-8B相当 [2] - DeepSeek开源3B规模DeepSeek-OCR模型 提出"上下文光学压缩"思路将文字信息压缩到图片 压缩率10倍内OCR解码准确率高达97% [8] - 模型采用编码器DeepEncoder和解码器DeepSeek3B-MoE-A570M架构 在OmniDocBench取得新SOTA 仅用100个视觉token超越GOT-OCR2.0 [8] - 单A100-40G GPU每天可生成超20万页训练数据 研究提出用光学压缩模拟人类遗忘机制的思路 为构建无限长上下文架构提供新方向 [8] 行业应用与市场影响 - 马斯克宣布X平台将在未来几周内彻底移除启发式推荐算法 改由Grok通过阅读和观看全部内容自动匹配用户兴趣 成为首个完全抛弃启发式算法的大型社交平台 [3] - 麦肯锡收到OpenAI颁发的Tokens消耗大客户奖牌 意味着大量花费数百万美元购买的战略咨询PPT实际由ChatGPT制作 [6] - 麦肯锡自2023年推出内部AI Lilli以来 超70%的4万名员工日常使用 平台每月响应超50万条问题 但两年内已裁员超5000人约10% [6] - 咨询业入门级职位招聘数量同比暴跌54% 初级岗位"书本知识"被AI复制导致就业率骤降13% AI初创公司正蚕食二线咨询公司市场份额 [6] 企业级AI服务部署 - Adobe发布AI Foundry服务 企业可通过该平台与Adobe合作构建基于自身品牌和知识产权训练的专属生成式AI模型 [4] - 服务基于完全使用授权数据训练的Firefly系列模型提供支持 按使用量而非席位付费 自Firefly上线以来企业用户已生成超250亿个创意资产 [4] - 搜狗输入法推出行业首个电脑端AI陪伴助手"小婉" 基于腾讯混元大模型AI分身打造职场搭子 可随时唤起进行对话交流 [5] - 腾讯视频在《许我耀眼》中推出基于主角的独家AI分身追剧搭子 采用文字回复加语音播报方式 配备主角同款声音营造真实沉浸对话体验 [5] AI发展理论框架 - OpenAI前核心研究员Jason Wei提出三个理解2025年AI发展的核心思想:验证者定律 智能商品化和智能的锯齿状边缘 [9] - 验证者定律包含五个可验证性维度:客观性 验证速度 可批量验证 低噪音和连续反馈 任何可解决且易于验证的任务最终都会被AI攻克 [9] - AI影响最大的是数字任务 对人类来说不难且数据丰富的领域 某些领域如软件开发将极大加速 而非数字任务将保持不变 [9]
2025中国设计师AI应用现状及趋势洞察|附下载
腾讯研究院· 2025-10-21 17:03
AI应用普及率与增长趋势 - 2025年AI在设计行业整体使用率达到85.8%,较2024年提升23.7个百分点 [3] - 将AI投入实际项目生产的比例从2024年的25.7%跃升至2025年的43.8% [19] - 未使用任何AI工具的设计师比例从2024年的37.9%断崖式下降至2025年的14.2% [19] - 海外设计师AI应用情况与国内基本一致,82.8%的海外设计师正在应用或探索AI,仅17.1%未使用任何AI工具 [23] AI易用性提升与工具演进 - 因"操作复杂"而不使用AI工具的设计师比例从2024年的31.9%下降至2025年的25.2% [22] - 45.7%的设计师最明显感受到"学习成本降低,操作更加友好" [25] - 通用型AI如腾讯元宝、豆包、Deepseek成为设计师低成本接触AI的窗口 [4] - 专业垂直AI工具如Stable Diffusion、D5 AI、Midjourney更受深度使用者青睐 [31] - AI精准解决垂直设计问题的能力显著提升,此前"AI不能理解设计意图"的痛点(34.8%)正在持续优化 [34] 使用障碍转变与经济性考量 - 阻碍设计师使用AI的原因从技术性壁垒转向经济性壁垒 [5] - 因"AI需要付费"而放弃使用的国内设计师比例从2024年的21.8%跃升至2025年的37.8% [40] - "硬件配置不够"的比例从14.9%提升至23.5% [40] - 海外设计师中36.8%因"工具需要付费"直接放弃使用,成为首要原因 [40] 企业规模与AI渗透率差异 - 100人以上规模设计企业中66.2%将AI应用于实际项目,100人以下企业中该比例仅为33.5% [6][42] - 大型企业在AI技术采用率和整合深度上显著领先中小型事务所 [42] - 中小型企业仅在"软件/平台费用"支出占比上领先大型企业,更倾向于采用灵活、低成本的SaaS工具 [44] 企业AI能力建设投入重点 - "软件和平台费用"以47.2%位居AI相关支出首位 [7] - "人才和培训"以37.3%的比例位居第二,重要性超过"硬件升级"(30.8%)和"日常运维与技术支持"(26.4%) [7][47] - 企业对人的投资与对工具的投资同步进行,显示行业成熟认知 [49] 设计师态度与职能转变 - 认为AI不会威胁设计师岗位的比例从2024年50%提升至2025年58.2% [8][50] - AI工具使用频率与威胁感知呈负相关:频繁使用者中仅29.8%视AI为威胁,很少使用者中该比例达56.2% [52] - 64.3%的设计师感受到个人工作职能延伸,其中17.4%认为显著扩大,46.9%认为有一定程度扩大 [9][54] - 77.2%的受访者表示AI应用增强了对设计方案的掌控能力 [9] - 设计师核心价值从动手执行转向"问题定义"和"价值判断" [55] AI应用深度与行业挑战 - 仅约10%的设计师在绝大多数项目中应用AI,AI应用高度集中在"初步方案设计阶段" [10] - AI面临深度融入流程、获取垂直数据集、工作流碎片化等多重挑战 [10]
腾讯研究院AI速递 20251021
腾讯研究院· 2025-10-21 00:01
AI基础设施与算力 - 甲骨文推出全球最大云端AI超级计算机OCI Zettascale10,由80万块NVIDIA GPU组成,峰值算力达16 ZettaFLOPS,计划于2026年下半年向客户提供服务[1] - 该超算采用独创Acceleron RoCE网络架构,通过每块GPU的NIC充当小型交换机连接多个隔离网络平面,以降低通信延迟并确保故障时自动切换路径[1] 大语言模型进展 - 谷歌Gemini 3.0疑似以lithiumflow(Pro版)和orionmist(Flash版)马甲上线评测,Gemini 3 Pro成为首个能精确识别钟表时间的AI模型,在SVG绘制和音乐作曲方面表现出色[2] - 谷歌向所有开发者开放Gemini API调用谷歌地图工具功能,可整合2.5亿个地点的位置感知,按每1000条有事实依据的提示收费25美元,支持路线规划等场景[7] - DeepSeek开源3B参数OCR模型DeepSeek-OCR,通过光学二维映射技术实现长文本上下文压缩,压缩率小于10倍时OCR精度达97%[3] AI应用与产品创新 - 元宝AI录音笔推出新功能,基于腾讯天籁降噪技术实现录音转写,并具备“内心OS”功能解读发言人弦外之音,支持多人发言智能拆分[4] - Vidu Q2参考生功能正式上线,推理速度比Q1版本快3倍,支持多主体一致性生成,免费用户可生成最长30秒视频,付费用户最长可延长至5分钟[5][6] - 宇树发布180cm仿生人形机器人H2,体重70kg,关节总数31个比前代增加约19%,可跳芭蕾舞和表演武术,应用场景扩展至娱乐演示和陪伴服务[9] AI性能评测与市场表现 - 实盘交易实验显示DeepSeek V3.1在1万美元本金下盈利超3500美元排名第一,仅进行5次交易,而Gemini 2.5 Pro进行45次交易成为赔钱最多的模型[8] - DeepSeek-OCR模型在OmniDocBench测试中仅用100个视觉token超越GOT-OCR2.0,单张A100-40G GPU每天可生成超20万页训练数据[3] 行业专家观点 - Karpathy预测AGI仍需十年时间,认为强化学习效率极低像“通过吸管吸取监督信号”,需要新的学习机制[10] - 提出“认知核心”概念,建议通过精简LLMs和提高泛化能力,预测未来模型将先变大再变小,最终收敛向更小更专注的认知内核[11]
「AI向善播播间」倒计时1天!关于「性」,那些跟爸妈张不开嘴的,能和AI聊吗?
腾讯研究院· 2025-10-20 17:33
直播活动概述 - 腾讯研究院将于10月21日14:30-17:30举办「AI向善播播间」第一季直播活动,主题为“AI与困境儿童青少年” [2][3][32] - 活动旨在探讨AI技术在儿童成长教育领域的应用潜力,特别是在提供情感支持、性教育及防范性侵害等方面的可能性 [1][13][29] - 直播将呈现“AI向善测评板(困境儿童青少年专项研究)”的成果,并邀请科技、公益、教育等领域的专家分享一手经验 [13][14] 核心项目与资源 - “AI向善语料库”是公司于2024年8月与数百家专业社会组织共同发起的项目,是国内外首个通过公益共创构建的AI训练公共语料库 [6] - 该语料库首个主题为【老年人】,汇聚了8,047条问答对,并于今年7月正式面向公益组织与非营利性研究机构免费开放申请 [6] - 公司今年新启动了“AI向善测评板”项目,聚焦“社会困弱人群的AI福祉测评”,特别关注边缘和困境人群的问题 [6][11][12] 专家阵容与研究方向 - 主持人陆诗雨为社会学博士、AI向善语料库负责人,致力于将“人的视角”引入AI语境中 [14] - 嘉宾何思倩是北京科技大学工业设计系副教授,其研究关注人工智能时代的儿童福祉,主张通过参与式、批判式与预见性设计方法推动AI应用的社会技术叙事转型 [15][16][17] - 嘉宾张耀华是“你我伙伴”性教育品牌发起人,其项目已覆盖全国31个省级行政区的4,000多所学校,拥有2万多位志愿者讲师,惠及儿童和青少年超过500万人次 [19][20][21][22] - 嘉宾张榛来自上海慧灵社区助残服务中心,积极探索心智障碍群体在心理健康、青春期性教育等议题上的人工智能创新应用 [24][25][26][27]
年轻人上场,职场代际正发生关键转折
腾讯研究院· 2025-10-20 17:33
"37岁的员工害怕为他们工作的23岁的员工,"《纽约时报》最近宣布。换句话说,千禧一代不再是冉冉升起的年轻员工。他们是老 板,他们正试图弄清楚Gen Z年轻成年人,他们现在是酷的仲裁者。 随着 Z 世代主导入门级职位,千禧一代开始步入 40 岁,X 世代步入 40 岁末和 50 岁,婴儿潮一代步入 50 岁末和 60 岁以上,职场代 际动态在 2020 年代处于关键转折点。上世纪 40 年代末和 50 年代初出生的婴儿潮一代——几十年来一直主导领导层的一代人——在步 入 70 多岁时正快速退休。到 2030 年,所有婴儿潮一代都将满 66 岁或以上,掌权的大多将是 X 世代和千禧一代。由于慢生活策略和 技术促进更健康的老龄化,婴儿潮一代在政治和商业领域的主导地位持续时间比平常更长。2020 年代显然是这种情况发生改变的十 年。 世代和文化的变化指向了几个趋势,这些趋势将在未来几年塑造商业和投资。 琼·M.特文格 圣地亚哥州立大学心理学教授 远程工作 领导层的代际更替将促进这一变化。X一代老板 (他们的职业生涯始于计算机革命时期) 比婴儿潮一代更可能批准员工在家工作,或者 至少是部分时间在家工作。千禧一代也有同 ...