Workflow
Software and Internet
icon
搜索文档
AI是一场不可避免的交互革命
经济观察网· 2025-12-17 20:07
2025年12月1日,字节跳动旗下AI(人工智能)工具豆包与中兴通讯(000063)联合推出的豆包手机开 售,主打AI跨应用自动化操作功能。首批3万台工程机秒罄,二手机溢价一度高达1.29万元。 就像旅游服务,过去以旅行社为主,如今主导市场的却是携程这类App。未来,只要AI能帮用户办妥一 切,谁还会在乎通过哪个平台呢?重复性与刚需型购物类App将首当其冲,或许只有社交类、能提供情 绪价值的App尚有一线生机。 未来,大多数App——电商平台、各类服务平台、应用软件等,可能都会变成专业数据库或商品库。用 户提出需求后,AI在后台执行即可,不再需要打开这些App,以往的流量入口与分发路径都将被颠覆。 但这不就是AI发展的必然结果吗?因为现在生成式AI并不是真正的AI,操作式AI才是。 在当下这样一个App时代,AI"掀桌子"了,这是"兵临城下"威胁生存方式的大问题,可能未来商家卖货 都不需要讨好投资者只需要讨好AI即可,因此大厂们也"掀桌子"了。 最令人惊讶的是,它能像真人一样替你操作手机,"听懂"指令并"代替"你执行几乎所有的手机操作。例 如,你对手机说:"买一个必胜客披萨,对比美团、淘宝、京东哪个最优惠后下 ...
Xiaomi MiMo-V2-Flash开源:能力比肩标杆闭源模型Claude 4.5 Sonnet
凤凰网· 2025-12-17 18:26
凤凰网科技讯12月17日,小米官方宣布Xiaomi MiMo-V2-Flash开源。据悉,该模型是小米专为极致推理 效率自研的总参数309B(激活15B)的MoE模型,通过引入Hybrid注意力架构创新及多层MTP推理加速, 在多个Agent测评基准上进入全球开源模型Top2。代码能力比肩标杆闭源模型Claude4.5Sonnet,但推理 价格仅为其2.5%且生成速度提升至2倍。 今日上午的2025小米"人车家全生态"合作伙伴大会上,Xiaomi MiMo大模型负责人罗福莉也介绍了该模 型构建的细节。她称,Xiaomi MiMo-V2-Flash在大部分评测基准上超过了DeepSeek V3.2和K2- Thinking,同时对比参数量减少了二分之一至三分之二,在全球大致处于相同水位的顶尖模型速度和成 本象限里,MiMo-V2-Flash实现了低成本、高速度,已初步具备模拟世界的能力。 罗福莉称,在她看来,下一代智能体系统不是一个"语言模拟器",而是一个真正理解人类世界,并与之 共存的"智能体"。Agent执行能力方面,应实现从"回答问题"到"完成任务"的转变,具备记忆、推理、 自主规划、决策、执行等能力。从 ...
腾讯大模型研发架构升级,成立AI Infra部
财经网· 2025-12-17 18:19
公司组织架构升级 - 腾讯于12月17日升级大模型研发架构,新成立了AI Infra部、AI Data部、数据计算平台部 [1] - 此次架构升级旨在全面强化公司大模型的研发体系与核心能力 [1] 核心人事任命 - Vincesyao出任“CEO/总裁办公室”首席AI科学家,向腾讯总裁刘炽平汇报 [1] - Vincesyao同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报 [1] - 王迪继续担任大语言模型部副总经理,向Vincesyao汇报 [1] - 刘煜宏担任AI Data部负责人,陈鹏担任数据计算平台部负责人,均向公司副总裁蒋杰汇报 [1] 新部门职责与战略定位 - AI Infra部负责大模型训练和推理平台技术能力建设,聚焦大模型分布式训练、高性能推理服务等核心技术 [1] - AI Infra部的目标是构建大模型AI Infra核心竞争力,为大模型算法研发和业务场景落地提供稳定高效的技术支持和服务 [1] - AI Data部将负责大模型数据及评测体系建设 [1] - 数据计算平台部将负责大数据和机器学习的数据智能融合平台建设工作 [1]
加强模型研究,腾讯官宣前OpenAI研究员姚顺雨加盟
凤凰网· 2025-12-17 18:10
摘要: 之后他在普林斯顿大学获得计算机博士学位,2024年毕业后加入OpenAI担任Research Scientist,参与了 OpenAI的Computer-Using Agent、Deep Research等多个产品项目。 作为腾讯大模型体系的重要一环,AI Infra部将负责大模型训练和推理平台技术能力建设,聚焦大模型 分布式训练、高性能推理服务等核心技术能力,构建大模型AI Infra核心竞争力,为大模型算法研发和 业务场景落地提供稳定高效的技术支持和服务。 架构升级后的AI Data部、数据计算平台部,将分别负责大模型数据及评测体系建设、大数据和机器学 习的数据智能融合平台建设工作。王迪继续担任大语言模型部副总经理,向Vincesyao汇报。刘煜宏担 任AI Data部负责人、陈鹏担任数据计算平台部负责人,均向公司副总裁蒋杰汇报。 腾讯一直是全球AI人才储备中国阵营的第一梯队,姚顺雨的加入意味着腾讯已为新的AI竞赛准备好弹 药。 12月17日,凤凰网科技获悉,腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台 部,全面强化其大模型的研发体系与核心能力。Vincesya ...
官宣!前 OpenAI 华人科学家姚顺雨加入腾讯,大模型“系统战”开启!
AI科技大本营· 2025-12-17 17:42
腾讯大模型战略与组织架构升级 - 腾讯大模型研发架构进行重大升级,前OpenAI科学家姚顺雨加盟,出任首席AI科学家,直接向总裁刘炽平汇报,并兼任新成立的AI Infra部及大语言模型部负责人,向技术工程事业群总裁卢山汇报 [2] - 此次升级新成立了三个关键部门:AI Infra部(聚焦大模型分布式训练、高性能推理服务)、AI Data部(专注大模型数据及评测体系)、数据计算平台部(致力于大数据和机器学习的数据智能融合平台建设)[6][8] - 架构调整标志着腾讯在AI大模型领域的战略重心正从单纯的“算法研究”向“系统化工程建设”深度进阶 [5] 核心人才引进与行业影响 - 姚顺雨是全球公认的AI Agent与大模型推理领域的领军人物,其提出的ReAct范式和参与的思维树研究,已成为当前大模型应用的主流范式 [5][7] - 姚顺雨的加入被视为腾讯在AI领域的一次“精准且重量级”的补强,带来了OpenAI级别的研究视野和世界顶级的技术直觉 [5] - 近期混元团队的高密度人才引进与架构重组,旨在支撑下一阶段高强度的技术攻坚,补齐大模型拼图中关键的“工程化”部分 [11] 腾讯混元大模型的发展现状与成果 - 过去一年,混元发布了超过30个新模型,其中混元2.0在复杂推理与文本生成场景表现国内领先,混元3D模型开源社区下载量已突破300万 [13] - 腾讯混元大模型已在内部超过900款应用和场景中落地,AI能力已全面渗透进微信、QQ、腾讯会议等国民级产品 [10][13] - 在开发效率方面,90%的腾讯工程师正在使用腾讯云代码助手CodeBuddy,50%的新增代码由AI辅助生成,代码评审环节的AI参与度高达94% [13] 行业竞争态势的演变 - AI的竞争已不再局限于模型参数的比拼,而是进入了数据、算力基础设施与算法深度融合的“系统战”阶段 [8] - 腾讯元宝作为C端AI原生应用,凭借“每天一个版本”的迭代速度,稳居国内AI应用前三 [13]
腾讯升级大模型研发架构,新成立AI Infra、AI Data等部门
新浪财经· 2025-12-17 16:54
责任编辑:何俊熹 新浪科技讯 12月17日下午消息,腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平 台部,全面强化其大模型的研发体系与核心能力。Vincesyao出任"CEO/总裁办公室"首席AI科学家,向 腾讯总裁刘炽平汇报;同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报。 作为腾讯大模型体系的重要一环,AI Infra部将负责大模型训练和推理平台技术能力建设,聚焦大模型 分布式训练、高性能推理服务等核心技术能力,构建大模型AI Infra核心竞争力,为大模型算法研发和 业务场景落地提供稳定高效的技术支持和服务。 架构升级后的AI Data部、数据计算平台部,将分别负责大模型数据及评测体系建设、大数据和机器学 习的数据智能融合平台建设工作。王迪继续担任大语言模型部副总经理,向Vincesyao汇报。刘煜宏担 任AI Data部负责人、陈鹏担任数据计算平台部负责人,均向公司副总裁蒋杰汇报。(罗宁) 架构升级后的AI Data部、数据计算平台部,将分别负责大模型数据及评测体系建设、大数据和机器学 习的数据智能融合平台建设工作。王迪继续担任大语言模型部 ...
腾讯混元世界模型1.5发布 可生成实时交互的3D场景
凤凰网· 2025-12-17 15:27
凤凰网科技讯 12月17日,腾讯混元团队正式发布混元世界模型1.5(WorldPlay)。该模型支持通过文本 描述或单张图片生成可实时交互的3D场景,用户可通过键盘、鼠标或手柄在生成的世界中自由探索。 据悉,此次发布版本强调空间记忆能力,当用户在场景中移动并返回先前区域时,模型能保持三维结构 的前后一致性。模型支持以24帧/秒的速率生成720P视频流,并可将交互场景导出为3D点云复用。 腾讯宣布,此次同步开源了涵盖数据、训练与流式推理部署的实时世界模型全链路框架。技术报告公开 了包括重构记忆机制、长上下文蒸馏及基于3D奖励的强化学习后训练等模块的细节。该模型主要面向 AI游戏关卡生成、影视场景预览、虚拟现实及具身智能研究等场景。目前用户可通过官网申请体验。 ...
Apple App Store Fees Face Pressure From EU Developers
PYMNTS.com· 2025-12-17 02:48
A collection of app developers and consumer groups want Europe to enforce laws against Apple.By completing this form, you agree to receive marketing communications from PYMNTS and to the sharing of your information with our sponsor, if applicable, in accordance with our Privacy Policy and Terms and Conditions .Complete the form to unlock this article and enjoy unlimited free access to all PYMNTS content — no additional logins required.The Coalition of App Fairness (CAF) on Monday (Dec. 15) issued an open le ...
Meta is making 'AI core to how we work' with the help of tools from Google and OpenAI
Business Insider· 2025-12-16 20:31
公司战略:打造“AI优先”工作场所 - 公司核心优先事项是“让人工智能成为我们工作的核心” 旨在将人工智能工具整合到员工工作的方方面面 [1][2] - 公司为员工提供了一套经过改进的人工智能工具套件 并确认其重点是使用人工智能帮助员工处理日常工作 [4] - 公司通过游戏化(如“Level Up”内部游戏)和将人工智能使用成效与绩效评估挂钩(2026年起)来鼓励员工采用和试验人工智能 [10] 工具开放与集成策略 - 公司自2024年6月起向员工广泛开放竞争对手的人工智能模型 包括谷歌和OpenAI的产品 [1][5] - 公司内部生产力套件已迁移至谷歌Workspace(包括Chat、Gmail、Docs和Drive) 以解锁人工智能驱动功能并更好地与扩展的工具集集成 [8] - 在工程侧 公司扩大了对智能体编码系统的访问 增加了谷歌Gemini 3 Pro 并探索与OpenAI Codex CLI等工具的新集成 战略核心是提高生产力和加速开发 [9] 可用人工智能工具详情 - 截至2024年11月 所有员工均可访问谷歌的Gemini 3 Pro和OpenAI的ChatGPT-5 [3] - 员工可访问的工具列表包括:Agentic Auto(顶级智能体)、Advanced Auto(实验性复杂任务处理)、iLlama(针对内部问题优化的快速Llama 3.1模型)、Llama 4 Maverick、GPT-4.1、Gemini 3 Pro以及编码助手Devmate等 [4] - 公司内部编码工具Devmate使用了Anthropic的Claude模型 [5] - 公司还向员工提供了Midjourney的AI图像生成工具 用于加速设计工作和创意原型制作 [7] 内部人工智能开发与投资 - 公司已在面向消费者的自有人工智能模型上投资了数百亿美元(tens of billions) [6] - 员工可以访问基于其Llama模型构建的内部人工智能助手Metamate [6] - 公司鼓励员工同时使用自有模型(采用“Llama”命名规范)和其他公司的产品 [2]
阿里发布电影级视频模型万相2.6,人人都能当电影主角
格隆汇· 2025-12-16 14:11
(原标题:阿里发布电影级视频模型万相2.6,人人都能当电影主角) 12月16日,阿里发布新一代万相2.6系列模型,该系列模型面向专业影视制作和图像创作场景进行了全 面升级,全新的万相2.6是国内首个支持角色扮演功能的视频模型。该模型同时支持音画同步、多镜头 生成及声音驱动等功能,是全球功能最全的视频生成模型。据记者了解,万相2.6已同步上线阿里云百 炼、万相官网。 今年9月,阿里率先在国内发布音画同步的视频生成模型万相2.5,极大提升视频创作的效率,在权威大 模型评测集LMArena上,万相图生视频位居国内第一。此次发布的万相2.6进一步提升了画质、音效、 指令遵循等能力,单次视频时长实现国内最高的15s,万相2.6还新增了角色扮演和分镜控制功能,不仅 能一键完成单人、多人、人与物合拍的视频,还能自动实现多镜头切换等专业任务,满足专业影视级场 景需求。 万相2.6是国内首个支持角色扮演功能的模型,能参考输入视频中的角色外观和音色、实现角色扮演, 按照提示词生成单人、多人、人与物合拍的视频 据介绍,通义万相在模型结构上集成了多项创新技术,可对输入参考视频进行多模态联合建模与学习, 参考具有时序信息的主体情绪、姿 ...