腾讯研究院

搜索文档
复旦大学肖仰华:AI的尽头是人文
腾讯研究院· 2025-10-23 16:30
肖仰华 复旦大学计算与智能创新学院教授、博导,上海科学智能研究院AI科学家,上海市数据科学重点实验室主任 【 精彩观点 】 1.技术进步历来伴随人的某些能力退化,这不是今天才出现的问题。AI同时引发了升智和降智。 2.在消费端:内容极大丰富后,人很难直接消费,将转为"终级消费者"。由个人的AI代理先做筛选与分 级消费,给人"二次精选"。未来还会出现"面向AI代理的生产与营销"。 3.能力外包可能"反噬主体":当你尚未具备某种专业能力,就把它交给AI,你反而失去了发展该能力的 机会。 4.我们要设定一个安全外包的条件是:你已是该事项的"专家",有足够的判别力与监督力,AI出错你能 识别和纠正;否则,就不该外包给AI来做。 5.未来的人类社会将开启新的大航海时代,类似于马斯克探索宇宙,走向深空。这将有助于避免人类在 地球上的内卷式消耗。 6.必须正视"闲置劳动力"的安置。工业时代已是二八定律,AI时代可能走向"2%和98%"——极少数人 完成绝大部分生产。 7.AI不仅解放时间,更可能让人"全面自由":身体与头脑的大量工作都被替代,人变成纯粹自由的人。 这种自由不是所有人都能妥善安置,很多人会堕落与放纵。必须重视 ...
腾讯研究院AI速递 20251023
腾讯研究院· 2025-10-23 00:33
生成式AI产品发布与更新 - OpenAI发布基于Chromium内核的AI浏览器ChatGPT Atlas,目前免费开放macOS版,后续将推出Windows及移动端版本 [1] - Atlas核心功能为将ChatGPT深度集成至浏览器,可查看用户页面内容并通过侧边栏回答问题,配备浏览器记忆功能和智能体模式以执行订票、购物等复杂任务 [1] - Claude正式发布桌面版,同时支持Mac和Windows系统,提供全局快捷键、窗口分享、语音输入和工具连接四大核心功能 [2] - 谷歌AI Studio推出全新vibe Coding体验,用户通过点击Build一键生成AI应用,使用Gemini 2.5 Pro制定计划并生成文件,支持免费使用且无需信用卡 [3] - 百川智能发布业内首个循证增强医疗大模型Baichuan-M2 Plus,通过首创"六源循证范式"构建权威医学知识体系,幻觉率比DeepSeek-R1低3倍 [5][6] 多模态与3D模型技术突破 - 腾讯混元世界模型1.1正式开源,首次支持多模态先验注入和多任务统一输出,采用纯前馈架构实现秒级推理,处理8-32视图输入仅需1秒且支持单卡部署 [4] - 该模型基于统一架构实现点云、深度、相机参数、表面法线和新视角合成等多种3D几何预测,在仿真器及真实物理世界任务中性能显著超越现有方法 [4] - 华为HarmonyOS 6实现与苹果iOS/iPadOS/macOS互传,纯血鸿蒙终端设备突破2300万台,小艺AI支持速记、AI修图、自动订票购物等功能,并支持16种方言交互 [7] 机器人与XR硬件创新 - 松延动力推出全球首款万元以内消费级人形机器人Bumi小布米,售价9998元,拥有21个自由度,搭载自研伺服电机和深度强化学习算法,能够稳定行走、跳舞和完成复杂动作 [8][9] - 该机器人定位教育和陪伴场景,支持语音交互和图形化编程,公司已完成6轮融资,N2机型在人形半马比赛多项目夺冠并成为销量破千的人形机器人公司 [9] - 三星发布首款旗舰XR头显Galaxy XR,售价1799.99美元(约合人民币1.28万元,仅为Vision Pro一半),重545克比Vision Pro轻1/4,搭载3552×3840分辨率Micro-OLED屏 [10][11] - Galaxy XR首款搭载Android XR平台并内置Gemini AI助手,DCI-P3色域覆盖96%超过Vision Pro,配备18个传感器实现头部手部眼部精准追踪,续航2-2.5小时 [11] 开发工具与框架演进 - Dexmal原力灵机推出开源VLA代码库Dexbotic,基于PyTorch框架开发,采用Data、Model、Experiment三大核心组件架构,支持π0、OpenVLA-OFT等多个主流VLA算法 [7] - 该代码库用户只需配置一次环境即可在各类仿真环境中复现算法,支持云端与本地一体化训练,同时推出首款开源硬件DOS-W1,采用快拆结构和可替换模块 [7] - 前Manus研究员指出AI Agent能力质变的关键在于围绕模型设计的"认知流程",而非底层模型智力增长,开发者角色从"提示词工程师"转变为"Agent流程架构师" [12]
硅谷996背后是AI的锅吗?丨硅谷AI转型录NO.2
腾讯研究院· 2025-10-22 17:33
《硅谷AI 转型录》 是由腾讯研究院发起的一个全新的观察系列。AI已经开始在底层重构我们工作的方方 面面,这一次"AI革命",不仅仅是简单的生产工具升级,而是一场关于生产关系、协作方式和价值创造 的深刻变革。腾讯研究院的袁晓辉和余一,将携手硅谷顾问陈然以及更多行业先驱,深入硅谷的创新变 革一线,聚焦于两个核心:一是AI如何作为一种基础能力,渗透并重构我们的工作、创造和竞争。二是 不同的群体,特别是硅谷的先锋企业和个人,如何开创人机协作的新范式,如何适应甚至引领这场变 革。不只关心正在发生什么,更关心它为何发生,以及它将走向何方。 第一期的硅谷AI转型录,聚焦硅谷大裁员背后的AI组织重构。 第二期硅谷AI转型录则要从"加班"开始聊 起,发现之前被很多人诟病的996文化,似乎在硅谷的创业文化中有复苏的迹象,甚至很多硅谷的创业公司 将996作为一种硬性要求写在自己的招聘要求中。AI时代,996会重新成为一种必要的职场文化吗?如何应 对AI带来的焦虑和疲惫?怎么定义和筛选AI原生人才?AI会对公司的人员招聘、职能划分以及组织架构等 方面带来哪些意想不到的改变? 【金句亮点】 横向对比中国和美国的法律框架,你会发现中国 ...
腾讯研究院AI速递 20251022
腾讯研究院· 2025-10-22 00:01
Anthropic产品更新 - 上线网页版Claude Code功能 作为研究预览版向Pro和Max用户开放 支持从浏览器直接委派编程任务并在云端基础设施上运行 [1] - 功能支持并行运行多个编程任务 连接GitHub仓库自动创建PR 每个会话在独立沙盒环境中运行 具备实时进度追踪和安全网络限制 [1] - iOS应用同步开放Claude Code功能 使开发者可随时随地编程 特别适合处理漏洞积压 常规修复或并行开发等任务 [1] - 正式上线Claude生命科学版Claude for Life Sciences 基于Claude Sonnet 4.5打造 在Protocol QA基准获0.83分超越人类基准0.79分 [7] - 新增Benchling BioRender PubMed等科研平台连接器 支持Databricks和Snowflake进行大规模生物信息学分析 [7] - 推出single-cell-rna-qc等专项技能 可胜任文献综述 实验方案生成 生物信息学分析等任务 覆盖从早期发现到成果转化全流程 [7] AI模型技术突破 - 清华与智谱联合推出Glyph框架 将文本信息渲染成图像后用视觉模型处理 实现3-4倍文本压缩率 128K窗口可处理1M tokens文本 [2] - Glyph采用持续预训练 LLM驱动的渲染搜索和后训练三阶段方法 通过遗传算法自动寻找最优渲染配置 性能与Qwen3-8B相当 [2] - DeepSeek开源3B规模DeepSeek-OCR模型 提出"上下文光学压缩"思路将文字信息压缩到图片 压缩率10倍内OCR解码准确率高达97% [8] - 模型采用编码器DeepEncoder和解码器DeepSeek3B-MoE-A570M架构 在OmniDocBench取得新SOTA 仅用100个视觉token超越GOT-OCR2.0 [8] - 单A100-40G GPU每天可生成超20万页训练数据 研究提出用光学压缩模拟人类遗忘机制的思路 为构建无限长上下文架构提供新方向 [8] 行业应用与市场影响 - 马斯克宣布X平台将在未来几周内彻底移除启发式推荐算法 改由Grok通过阅读和观看全部内容自动匹配用户兴趣 成为首个完全抛弃启发式算法的大型社交平台 [3] - 麦肯锡收到OpenAI颁发的Tokens消耗大客户奖牌 意味着大量花费数百万美元购买的战略咨询PPT实际由ChatGPT制作 [6] - 麦肯锡自2023年推出内部AI Lilli以来 超70%的4万名员工日常使用 平台每月响应超50万条问题 但两年内已裁员超5000人约10% [6] - 咨询业入门级职位招聘数量同比暴跌54% 初级岗位"书本知识"被AI复制导致就业率骤降13% AI初创公司正蚕食二线咨询公司市场份额 [6] 企业级AI服务部署 - Adobe发布AI Foundry服务 企业可通过该平台与Adobe合作构建基于自身品牌和知识产权训练的专属生成式AI模型 [4] - 服务基于完全使用授权数据训练的Firefly系列模型提供支持 按使用量而非席位付费 自Firefly上线以来企业用户已生成超250亿个创意资产 [4] - 搜狗输入法推出行业首个电脑端AI陪伴助手"小婉" 基于腾讯混元大模型AI分身打造职场搭子 可随时唤起进行对话交流 [5] - 腾讯视频在《许我耀眼》中推出基于主角的独家AI分身追剧搭子 采用文字回复加语音播报方式 配备主角同款声音营造真实沉浸对话体验 [5] AI发展理论框架 - OpenAI前核心研究员Jason Wei提出三个理解2025年AI发展的核心思想:验证者定律 智能商品化和智能的锯齿状边缘 [9] - 验证者定律包含五个可验证性维度:客观性 验证速度 可批量验证 低噪音和连续反馈 任何可解决且易于验证的任务最终都会被AI攻克 [9] - AI影响最大的是数字任务 对人类来说不难且数据丰富的领域 某些领域如软件开发将极大加速 而非数字任务将保持不变 [9]
2025中国设计师AI应用现状及趋势洞察|附下载
腾讯研究院· 2025-10-21 17:03
AI应用普及率与增长趋势 - 2025年AI在设计行业整体使用率达到85.8%,较2024年提升23.7个百分点 [3] - 将AI投入实际项目生产的比例从2024年的25.7%跃升至2025年的43.8% [19] - 未使用任何AI工具的设计师比例从2024年的37.9%断崖式下降至2025年的14.2% [19] - 海外设计师AI应用情况与国内基本一致,82.8%的海外设计师正在应用或探索AI,仅17.1%未使用任何AI工具 [23] AI易用性提升与工具演进 - 因"操作复杂"而不使用AI工具的设计师比例从2024年的31.9%下降至2025年的25.2% [22] - 45.7%的设计师最明显感受到"学习成本降低,操作更加友好" [25] - 通用型AI如腾讯元宝、豆包、Deepseek成为设计师低成本接触AI的窗口 [4] - 专业垂直AI工具如Stable Diffusion、D5 AI、Midjourney更受深度使用者青睐 [31] - AI精准解决垂直设计问题的能力显著提升,此前"AI不能理解设计意图"的痛点(34.8%)正在持续优化 [34] 使用障碍转变与经济性考量 - 阻碍设计师使用AI的原因从技术性壁垒转向经济性壁垒 [5] - 因"AI需要付费"而放弃使用的国内设计师比例从2024年的21.8%跃升至2025年的37.8% [40] - "硬件配置不够"的比例从14.9%提升至23.5% [40] - 海外设计师中36.8%因"工具需要付费"直接放弃使用,成为首要原因 [40] 企业规模与AI渗透率差异 - 100人以上规模设计企业中66.2%将AI应用于实际项目,100人以下企业中该比例仅为33.5% [6][42] - 大型企业在AI技术采用率和整合深度上显著领先中小型事务所 [42] - 中小型企业仅在"软件/平台费用"支出占比上领先大型企业,更倾向于采用灵活、低成本的SaaS工具 [44] 企业AI能力建设投入重点 - "软件和平台费用"以47.2%位居AI相关支出首位 [7] - "人才和培训"以37.3%的比例位居第二,重要性超过"硬件升级"(30.8%)和"日常运维与技术支持"(26.4%) [7][47] - 企业对人的投资与对工具的投资同步进行,显示行业成熟认知 [49] 设计师态度与职能转变 - 认为AI不会威胁设计师岗位的比例从2024年50%提升至2025年58.2% [8][50] - AI工具使用频率与威胁感知呈负相关:频繁使用者中仅29.8%视AI为威胁,很少使用者中该比例达56.2% [52] - 64.3%的设计师感受到个人工作职能延伸,其中17.4%认为显著扩大,46.9%认为有一定程度扩大 [9][54] - 77.2%的受访者表示AI应用增强了对设计方案的掌控能力 [9] - 设计师核心价值从动手执行转向"问题定义"和"价值判断" [55] AI应用深度与行业挑战 - 仅约10%的设计师在绝大多数项目中应用AI,AI应用高度集中在"初步方案设计阶段" [10] - AI面临深度融入流程、获取垂直数据集、工作流碎片化等多重挑战 [10]
腾讯研究院AI速递 20251021
腾讯研究院· 2025-10-21 00:01
AI基础设施与算力 - 甲骨文推出全球最大云端AI超级计算机OCI Zettascale10,由80万块NVIDIA GPU组成,峰值算力达16 ZettaFLOPS,计划于2026年下半年向客户提供服务[1] - 该超算采用独创Acceleron RoCE网络架构,通过每块GPU的NIC充当小型交换机连接多个隔离网络平面,以降低通信延迟并确保故障时自动切换路径[1] 大语言模型进展 - 谷歌Gemini 3.0疑似以lithiumflow(Pro版)和orionmist(Flash版)马甲上线评测,Gemini 3 Pro成为首个能精确识别钟表时间的AI模型,在SVG绘制和音乐作曲方面表现出色[2] - 谷歌向所有开发者开放Gemini API调用谷歌地图工具功能,可整合2.5亿个地点的位置感知,按每1000条有事实依据的提示收费25美元,支持路线规划等场景[7] - DeepSeek开源3B参数OCR模型DeepSeek-OCR,通过光学二维映射技术实现长文本上下文压缩,压缩率小于10倍时OCR精度达97%[3] AI应用与产品创新 - 元宝AI录音笔推出新功能,基于腾讯天籁降噪技术实现录音转写,并具备“内心OS”功能解读发言人弦外之音,支持多人发言智能拆分[4] - Vidu Q2参考生功能正式上线,推理速度比Q1版本快3倍,支持多主体一致性生成,免费用户可生成最长30秒视频,付费用户最长可延长至5分钟[5][6] - 宇树发布180cm仿生人形机器人H2,体重70kg,关节总数31个比前代增加约19%,可跳芭蕾舞和表演武术,应用场景扩展至娱乐演示和陪伴服务[9] AI性能评测与市场表现 - 实盘交易实验显示DeepSeek V3.1在1万美元本金下盈利超3500美元排名第一,仅进行5次交易,而Gemini 2.5 Pro进行45次交易成为赔钱最多的模型[8] - DeepSeek-OCR模型在OmniDocBench测试中仅用100个视觉token超越GOT-OCR2.0,单张A100-40G GPU每天可生成超20万页训练数据[3] 行业专家观点 - Karpathy预测AGI仍需十年时间,认为强化学习效率极低像“通过吸管吸取监督信号”,需要新的学习机制[10] - 提出“认知核心”概念,建议通过精简LLMs和提高泛化能力,预测未来模型将先变大再变小,最终收敛向更小更专注的认知内核[11]
「AI向善播播间」倒计时1天!关于「性」,那些跟爸妈张不开嘴的,能和AI聊吗?
腾讯研究院· 2025-10-20 17:33
直播活动概述 - 腾讯研究院将于10月21日14:30-17:30举办「AI向善播播间」第一季直播活动,主题为“AI与困境儿童青少年” [2][3][32] - 活动旨在探讨AI技术在儿童成长教育领域的应用潜力,特别是在提供情感支持、性教育及防范性侵害等方面的可能性 [1][13][29] - 直播将呈现“AI向善测评板(困境儿童青少年专项研究)”的成果,并邀请科技、公益、教育等领域的专家分享一手经验 [13][14] 核心项目与资源 - “AI向善语料库”是公司于2024年8月与数百家专业社会组织共同发起的项目,是国内外首个通过公益共创构建的AI训练公共语料库 [6] - 该语料库首个主题为【老年人】,汇聚了8,047条问答对,并于今年7月正式面向公益组织与非营利性研究机构免费开放申请 [6] - 公司今年新启动了“AI向善测评板”项目,聚焦“社会困弱人群的AI福祉测评”,特别关注边缘和困境人群的问题 [6][11][12] 专家阵容与研究方向 - 主持人陆诗雨为社会学博士、AI向善语料库负责人,致力于将“人的视角”引入AI语境中 [14] - 嘉宾何思倩是北京科技大学工业设计系副教授,其研究关注人工智能时代的儿童福祉,主张通过参与式、批判式与预见性设计方法推动AI应用的社会技术叙事转型 [15][16][17] - 嘉宾张耀华是“你我伙伴”性教育品牌发起人,其项目已覆盖全国31个省级行政区的4,000多所学校,拥有2万多位志愿者讲师,惠及儿童和青少年超过500万人次 [19][20][21][22] - 嘉宾张榛来自上海慧灵社区助残服务中心,积极探索心智障碍群体在心理健康、青春期性教育等议题上的人工智能创新应用 [24][25][26][27]
年轻人上场,职场代际正发生关键转折
腾讯研究院· 2025-10-20 17:33
"37岁的员工害怕为他们工作的23岁的员工,"《纽约时报》最近宣布。换句话说,千禧一代不再是冉冉升起的年轻员工。他们是老 板,他们正试图弄清楚Gen Z年轻成年人,他们现在是酷的仲裁者。 随着 Z 世代主导入门级职位,千禧一代开始步入 40 岁,X 世代步入 40 岁末和 50 岁,婴儿潮一代步入 50 岁末和 60 岁以上,职场代 际动态在 2020 年代处于关键转折点。上世纪 40 年代末和 50 年代初出生的婴儿潮一代——几十年来一直主导领导层的一代人——在步 入 70 多岁时正快速退休。到 2030 年,所有婴儿潮一代都将满 66 岁或以上,掌权的大多将是 X 世代和千禧一代。由于慢生活策略和 技术促进更健康的老龄化,婴儿潮一代在政治和商业领域的主导地位持续时间比平常更长。2020 年代显然是这种情况发生改变的十 年。 世代和文化的变化指向了几个趋势,这些趋势将在未来几年塑造商业和投资。 琼·M.特文格 圣地亚哥州立大学心理学教授 远程工作 领导层的代际更替将促进这一变化。X一代老板 (他们的职业生涯始于计算机革命时期) 比婴儿潮一代更可能批准员工在家工作,或者 至少是部分时间在家工作。千禧一代也有同 ...
腾讯研究院AI速递 20251020
腾讯研究院· 2025-10-20 00:01
英伟达与台积电合作推进先进制程本土化 - 英伟达与台积电在美国亚利桑那工厂历史性亮相首片用于AI的Blackwell芯片晶圆,首次实现先进芯片的"美国本土造"[1] - 台积电亚利桑那工厂总投资达1650亿美元,计划生产2纳米、3纳米、4纳米和A16等先进制程芯片[1] - Blackwell芯片采用定制4NP工艺,拥有2080亿晶体管,两个子芯片通过NV-HBI连接速度高达10TB/s[1] Anthropic提升AI代理能力与模块化 - Anthropic发布Agent Skills功能,允许将提示词、代码包等专业能力打包成可按需加载的skills,支持多个skills叠加且Claude自动识别所需能力[2] - Skills可在Claude apps、Claude Code和API三个平台通用移植,包含核心指令、可执行脚本和资源文件,仅在需要时加载最小必要信息[2] - 官方预设包括9个处理常见文档格式的skills,用户可自定义上传,并提供辅助工具帮助创建新skills[2] 生成式AI模型在3D内容创建取得突破 - 李飞飞团队发布实时生成式世界模型RTFM,仅需单块H100 GPU即可实时渲染持久且3D一致的世界[3] - RTFM采用自回归扩散Transformer架构,通过端到端学习大规模视频数据,无需构建显式3D表征,直接从2D图像生成新视角图像并模拟反射等复杂效果[3] - 模型通过带位姿的帧作为空间记忆实现无限持久性,配合上下文调度技术可在长时间交互中保持大型世界几何形状持久性[3] AI代理在软件开发与测试自动化进展 - Manus 1.5版本引入具备操作能力的"内建浏览器",允许AI像用户一样点击网页按钮、测试功能、修复bug,将上线部署等传统人工环节纳入Agent执行能力[4] - 新增Library文件库统一管理生成内容,开放多人协同编辑,平均任务完成时长从15分36秒缩短至3分43秒,效率提升约77%[4] - 实测通过自然语言完全无代码完成音乐网页应用构建,包括歌词改写、情绪调节、音频上传等交互功能[4] 操作系统集成AI实现人机交互革新 - Windows 11大更新引入"Hey Copilot"语音唤醒功能和Copilot Vision屏幕理解能力,可实时查看屏幕内容并指导用户操作[5] - Copilot Actions可在本地文件上执行操作如整理照片、提取PDF信息等,Copilot Connectors打通OneDrive、Outlook和Google等主流应用[5] - 文件资源管理器集成Manus AI操作,可右键文档选择自动生成网站,还整合了视频编辑和会议安排功能[6] 多模态文档解析技术达到新水平 - 百度开源PaddleOCR-VL多模态文档解析模型,仅0.9B参数量在OmniDocBench V1.5榜单获92.6分全球第一,在四大核心能力全部拿下SOTA[7] - 模型支持109种语言,覆盖手写、竖排、艺术字体等复杂形态,公式识别CDM得分0.9453,表格理解得分89.8,阅读顺序预测误差仅0.043[7] - 采用两阶段架构融合动态分辨率视觉编码器与语言模型,在单张A100上推理速度达1881token/s,发布16小时内登顶HuggingFace Trending全球第一[7] AI加速核聚变能源研发进程 - Google DeepMind与核聚变能源巨头CFS合作,利用AI加速"人造太阳"SPARC装置研发,其开发的TORAX等离子体模拟器可运行数百万次虚拟实验[8] - 合作聚焦三大方向:构建快速精准可微分的聚变等离子体模拟系统、寻找最大化聚变能量输出的高效路径、运用强化学习探索实时控制策略[8] - TORAX能在CPU与GPU灵活运行并无缝集成AI模型,通过强化学习AI Agent可在模拟环境中探索海量潜在运行场景[8] AI对劳动力市场产生结构性影响 - 哈佛大学研究通过追踪6200万劳动者和超2.45亿招聘信息发现,采用AI的企业初级岗位显著下降,主要通过放缓招聘而非裁员实现[9] - AI冲击最大的人群是强校和普通名校毕业生,顶尖精英大学和末流院校反而受影响较小,呈现"U型"格局[9] - 批发零售行业初级岗位风险最大,内容审核员、财会行政等办公室底层职位面临替代,技能呈现"两极化"趋势[9] AI生成内容引发互联网生态担忧 - Reddit联合创始人预警互联网被AI生成内容淹没失去真实生命力,OpenAI CEO认为该理论可能有道理,现在存在很多大模型驱动的账号[10] - 监测显示机器人流量约占整体应用流量31%,自动化流量达51%,AI生成文章数量在2024年11月首次超过人类撰写文章[10] - 研究指出模型在AI生成数据上继续训练会导致"模型崩溃",AI内容成为训练数据可能带来模型能力下降[10] 对AI发展路径与AGI前景的行业观点 - AI专家Andrej Karpathy直言智能体存在认知缺陷,强化学习很糟糕,认为AGI仍需十年时间[11] - 强调强化学习通过噪声极大,人类并不真正使用强化学习,预训练是"糟糕的进化",LLM被预训练文档记忆所困扰[11] - 预计AGI将融入约2%GDP增长而非爆炸式增长,认为AI本质是计算的延伸,教育是让人类在AI时代保持价值的关键[11]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-10-18 10:33
算力与芯片 - 万里眼推出超高速示波器 [3] - 英伟达发布个人AI超算 [3] - 苹果发布M5芯片 [3] - OpenAI自研AI芯片 [3] 模型进展 - Anthropic发布Claude Haiku 4.5模型 [3] - 谷歌预告Gemini 3.0并开启Gemini 3.0 Pro内测 [3] - 阿里推出Qwen3-VL模型 [3] - Mamba发布Mamba-3模型 [3] - Meta研究概念分割技术 [3] - 谷歌提出ReasoningBank框架 [3] 应用与产品 - 谷歌发布视频生成模型Veo 3.1 [3] - 阿里为Qwen Chat增加记忆功能 [3] - 火山引擎推出语音合成2.0技术 [3] - 科大讯飞发布翻译耳机 [3] - OPPO推出ColorOS 16系统 [3] - Karpathy发布nanochat应用 [3] - 微软推出文生图模型 [4] - 腾讯优图实验室发布Youtu-Embedding技术 [4] - QQ浏览器进行AI功能升级 [4] - LiblibAI推出AI创作工作室 [4] - GPT和Gemini在天文奥赛中夺金 [4] - 苹果研发AI眼镜 [4] - 陶哲轩测试GPT-5 Pro [4] - Chamath转向使用中国模型 [4] - Every Cure利用AI攻克绝症 [4] 科技与研发 - 谷歌和耶鲁合作开发抗癌神器 [4] - 港科大和英伟达推出NewtonBench [4] - SpaceX星舰进行第11次飞行 [4] - 宇树科技推出功夫小子机器人 [4] - 《时代周刊》发布最佳发明榜单 [4] 行业观点与趋势 - Andrew Tulloch重返Meta [4] - Anthropic探讨预训练与后训练的平衡 [4] - LangChain和Manus关注上下文工程 [4] - 谷歌发布AI使用报告 [4] - NVIDIA提出AI工厂概念 [4] - Anthropic探讨AI设计AI的可能性 [4] - Ilya Sutskever参与AGI实现讨论 [4] - Philippe Aghion讨论AI经济奇点 [4] - 宾大研究AI的语气影响 [4] - ARK Invest分析AI与GDP的关系 [4] - 行业探讨AI机遇的正反面 [4] - Sam Altman讨论工作性质的改变 [5] - 斯坦福研究Agentic上下文 [5] - Rich Sutton讨论AI泡沫破裂 [5] - State of AI Report发布AI年度报告 [5] - Hinton提出AI有意识的观点 [5] 行业生态 - 腾讯设立青云奖学金 [4] - 腾讯研究院进行中国公众对生成式AI看法的年度调研 [7]