Workflow
模型编排
icon
搜索文档
氪星晚报|联想集团与英伟达联合推出“联想人工智能云超级工厂”;OpenAI与盖茨基金会将向非洲医疗人工智能领域投资5000万美元;我国去年电影全产业链产...
36氪· 2026-01-21 19:40
人工智能与算力基础设施 - 联想集团与英伟达深化合作,联合推出“联想人工智能云超级工厂”,并发布“联想AI工厂”整体解决方案,旨在帮助企业数据中心向高效“AI工厂”转型,助力全栈AI技术在中国落地 [1] - 微软CEO纳德拉指出,AI时代的战略核心在于算力基础设施、模型编排能力及企业知识深度嵌入,而非单一基础模型,微软核心战略之一是将Azure打造成大规模“Token工厂”以应对指数级增长的算力需求 [8] - 数据堂与灵心巧手达成战略合作,双方将在具身智能领域整合高质量训练数据与先进设备载体的优势能力,推动技术创新与产业应用深度融合 [4] - 智元机器人公布“机器人动作重定向”专利,该方法通过数据映射、优化、碰撞检测与安全验证等步骤,旨在提升机器人在复杂场景下的交互能力与运动适应性 [3] 人工智能应用与投资 - OpenAI与盖茨基金会启动“Horizon 1000”试点项目,将共同投入5000万美元资金、技术及专业支持,旨在推进人工智能在非洲国家(首站卢旺达)健康领域的应用,目标在2028年前覆盖1000家基层医疗机构 [8] - OpenAI在其ChatGPT消费者计划中推出年龄预测模型,以识别18岁以下用户并自动启用内容保护措施,成年用户若被误判可使用Persona身份验证服务恢复访问权限 [2] - 广东省政府发布政策措施,支持各地市稳妥有序开放自动驾驶多场景道路测试应用、扩大高级别自动驾驶应用区域,鼓励核心技术攻关和自动驾驶大模型落地 [8] 能源与大型项目 - 日本东京电力公司重启柏崎刈羽核电站6号机组,该核电站自2011年“3·11”大地震后一直停运,重启前已完成地方同意手续但曾因设置错误延期 [1] - 规模达5800亿美元的卡塔尔投资局据悉考虑进行重大重组,计划将其海外资产与国内投资组合分开,并可能设立新机构管理价值数百亿美元的国内资产,以优化全球投资布局并为天然气项目收益做准备 [2] 消费与娱乐产业 - 呷哺呷哺集团跨界布局牛排赛道,推出全新子品牌“呷牛排”,首店将于2月6日在北京昌平龙德广场开业 [7] - 2025年中国电影全产业链产值达到8172.59亿元,票房拉动系数约为1:15.77,两项数据均位居全球前列 [9] - 永辉超市股份有限公司于2025年6月申请注册多枚“胖小辉”商标,国际分类涉及烟草烟具、餐饮住宿等,目前状态为申请中,该公司此前于2024年11月成功注册多枚“胖永辉”商标 [5][6]
直击达沃斯|微软CEO纳德拉:AI时代的核心不是“单一模型”,而是“模型编排与算力工厂”
新浪财经· 2026-01-21 16:36
微软的AI战略核心 - 在AI时代,公司的战略重心不在于是否拥有单一“基础模型”,而在于算力基础设施、模型编排能力以及企业知识的深度嵌入 [1][11] - 公司当前最核心的AI战略并非只做一个模型,而是有更重要的战略选择 [4][14] 核心战略一:构建“Token工厂”与算力基础设施 - 公司当前最核心的AI战略之一是将Azure打造成大规模的“Token工厂” [3][13] - 随着AI应用全面铺开,算力需求呈指数级增长,云服务商必须具备建设异构基础设施集群、并通过软件提升利用率和降低总体拥有成本的能力 [3][13] - Azure已经是公司最大的业务,未来AI带来的算力需求规模巨大,要求公司极其擅长建设本地化的“算力工厂” [5][15] - 这意味着构建一个高度异构的基础设施集群,并通过软件最大化利用率、降低总体拥有成本,这是所有超大规模云服务商一直在做的事 [5][15] 核心战略二:应用服务层与模型编排 - 公司AI战略的第二部分是应用服务层,如果所有人都在构建AI Agent、强化学习环境、评测系统,那么就必然需要一个“应用服务器层”,这正是公司在Foundry所做的事情 [5][16] - 未来的AI应用不会依赖单一模型,任何企业都会同时使用多个模型,甚至针对同一任务编排多个模型协同完成 [3][13] - 公司在医疗领域推出的“决策编排”实践表明,通过为模型分配不同角色并进行编排,其效果显著优于任何单一前沿模型 [3][5][13][16] 对模型生态的展望 - 对于开源与闭源模型之争,其演变类比于数据库市场,未来模型生态将高度多样化,既有闭源前沿模型,也会出现达到前沿水平的开源模型 [3][6][13][17] - 真正的竞争力在于企业能否将自身的隐性知识嵌入到自己可控的模型权重中 [3][7][13][18] - 对于未来模型的数量,公司的极端答案是:世界上有多少家公司,就应该有多少个模型,这正是知识经济向AI经济转变的方式 [3][8][9][13][19][20] 终端侧与桌面计算战略 - 公司确认已经拥有可在Windows桌面本地运行、充分利用NPU与GPU资源的模型 [3][10][13][21] - 高性能工作站正在回归,桌面计算形态将在AI时代重新获得战略价值,而公司在桌面生态上具有天然优势 [3][10][13][21]
腾讯研究院AI速递 20260121
腾讯研究院· 2026-01-21 00:03
一、马斯克兑现承诺开源X推荐算法!100% AI驱动0人工规则 - 马斯克兑现承诺,开源了X平台的全新推荐算法,该算法采用与Grok相同的Transformer架构,完全移除了手工特征和人工规则,由AI驱动 [1] - 算法通过Thunder和Phoenix双引擎构建信息流,预测15种用户行为并加权计算得分,其中回复作者评论的权重是点赞的75倍 [1] - 算法中负面反馈(如拉黑、举报)会严重降低内容权重,停留时间和真实互动成为核心指标,小号也有机会获得曝光,粉丝数量优势被削弱 [1] 二、智谱GLM-4.7-Flash开源,首次采用DeepSeek的MLA架构 - 智谱AI开源轻量级模型GLM-4.7-Flash,总参数为300亿,激活参数仅30亿,定位为“本地编程与智能体助手”,其API免费开放调用 [1] - 该模型首次采用了DeepSeek率先使用的MLA架构,支持200K上下文窗口,在SWE-bench代码修复测试中得分为59.2分 [1] - 本地部署实测在苹果M5芯片上可达到每秒43个token的生成速度,已支持HuggingFace、vLLM及华为昇腾NPU [1] 三、MiniMax 揭开第二代智能体面纱,定位 AI-native Workspace - MiniMax发布Agent 2.0,定义为“AI原生工作台”,推出桌面端应用实现本地与云端无缝连接,可操作本地文件并启动网页自动化任务 [2] - 推出Expert Agents功能,通过封装私有知识和行业标准作业程序打造垂直领域专家分身,能将通用专家的70分水平提升至95分甚至100分 [2] - 用户可自定义Expert Agents,实现从研读到交付的闭环能力,桌面端已上线Windows和Mac双版本 [2] 四、阶跃星辰多模态小模型Step3-VL-10B 开源,10B击败200B - 阶跃星辰开源多模态模型Step3-VL-10B,仅100亿参数在多项评测中媲美甚至超越了GLM-4.6V 1060亿、Qwen3-VL 2350亿等模型 [3] - 模型具备极致视觉感知、深层逻辑推理和端侧Agent交互三大核心能力,在AIME数学竞赛测试中达到世界第一梯队水平 [3] - 模型采用1.2万亿数据全参数联合预训练、超过1400次强化学习迭代和创新的PaCoRe并行协调推理机制,Base和Thinking版本同时开源 [3] 五、月之暗面正在进行新一轮融资,新融资估值达到48亿美元 - 月之暗面正在进行新一轮融资,估值达到48亿美元,较20天前公布的C轮43亿美元估值上涨了5亿美元,融资可能很快完成 [4] - 公司目前现金持有量超过100亿元人民币,短期不急于上市,计划将上市作为加速通用人工智能的手段择时而动 [4] - 技术层面聚焦于Token效率与长上下文能力,提出Muon优化器实现2倍效率提升,并推出Kimi-Linear线性注意力机制 [5] 六、真可用游戏Agent诞生!可实时高频决策,思维链还全程可见 - 超参数科技推出游戏智能体COTA,完全由大模型原生驱动,在第一人称射击游戏中实现职业级水准表现,其推理链路全程可见 [6] - 采用“双系统分层架构”模拟人类快慢思考,Commander负责战略决策,Operator执行毫秒级操作,将响应时间压缩至100毫秒 [6] - 该产品验证了大模型在高频对抗游戏场景的可行性,为具身智能等现实世界问题提供了参考思路 [6] 七、微软CEO:掌握模型编排能力,才能在AI时代建立护城河 - 微软CEO纳德拉表示,人工智能正在接管复杂的知识工作,企业竞争的关键不是寻找最厉害的模型,而是掌握“模型编排”能力 [7] - 人工智能普及需要从供给侧提升“每美元每瓦特产生token的效率”,需求侧则要求企业从“观念、能力、数据”三个维度推动转型 [7] - 真正的“企业主权”是将独有的经验和知识转化为自己掌控的人工智能模型,防止核心价值流向模型提供商 [7] 八、a16z 2026预测:创业公司的机会在“有主见”的交互界面 - a16z分析指出,ChatGPT周活跃用户达8至9亿保持霸主地位,但Gemini增速达155%正在追赶,AI助手市场呈现“赢家拿走大头”格局 [8] - OpenAI通过ChatGPT界面推送的购物、任务、学习等新体验均未真正突围,受限于现有对话框界面难以提供一流产品体验 [8] - 成功突围的人工智能产品如Replit、Suno、Character AI的共同点是拥有观点鲜明且专注的界面,创业公司机会在于针对特定工作流的深度优化 [8] 九、大模型人格可以被量化!Anthropic最新论文发现辅助轴 - Anthropic研究团队发现模型人格可以被量化,存在一个主导维度“辅助轴”,用于衡量模型以“智能助手”模式运行的程度 [9] - 通过沿辅助轴方向进行干预可以控制模型的角色扮演意愿,向智能助手方向引导能显著降低有害回答的比例,抵御人格越狱攻击 [9] - 提出“激活上限”技术,可在几乎不损伤模型性能的前提下,将人格越狱成功率降低近60%,为人类控制人工智能开辟了新路径 [9]
硅谷一线创业者内部研讨:为什么只有 5%的 AI Agent 落地成功,他们做对了什么?
Founder Park· 2025-10-13 18:57
文章核心观点 - AI Agent在生产环境的部署失败率高达95%,主要瓶颈并非模型智能度,而是上下文工程、安全性、记忆设计等基础设施的缺失[2][3] - 成功的AI产品开发核心在于构建复杂而强大的“上下文选择系统”,而非简单的提示工程[3] - 行业即将迎来一波专注于记忆工具包、编排层、上下文可观测性等基础设施工具的浪潮[49] 上下文工程 - 精细调整模型的需求非常少见,设计完善的检索增强生成系统通常已能满足需求,但大多数现有系统设计过于初级[5] - 先进的上下文工程是为大语言模型量身打造的特征工程,需实现可版本化、可审计、可测试[9][10] - 应采用语义与元数据双层架构,统一处理杂乱输入格式,确保检索到的是高度相关的结构化知识,而非仅是相似内容[11][12] - 文本转SQL系统在生产环境部署挑战巨大,成功团队会构建业务术语表、带约束的查询模板、验证层及反馈循环作为支撑[13][20] 安全与信任机制 - 安全性、溯源能力与权限控制是阻碍系统部署的关键障碍,而非可有可无的功能[14] - 系统必须支持基于角色的行级别访问控制,即使问题相同,也需为不同权限用户提供定制化输出[16][21] - 信任的核心在于系统能否表现出一致、可解释、可审计的行为,而非原始技术能力[18] - 5%成功部署的AI Agent共同点是采用“人在回路”设计,将AI定位为辅助工具,并构建反馈循环[18] 记忆功能设计 - 记忆功能不是简单存储,而是涉及用户体验、隐私和系统整体架构的设计决策[22] - 记忆应分为用户级、团队级和组织级三个层级,优秀团队会将其抽象为独立的上下文层与行为层,实现版本化与自由组合[23][28] - 记忆能提升用户体验与Agent流畅度,但过度个性化会触及隐私红线,共享记忆若范围不当会破坏访问控制[30][34] - 当前技术栈缺失安全、可移植、由用户掌控的内存层,这是一个重要的创业机会点[30][42] 多模型推理与编排 - 模型编排是一种新兴设计范式,企业根据任务复杂度、延迟要求、成本敏感度等因素设计智能路由逻辑[31][32] - 典型模式包括:简单查询调用本地模型、结构化查询调用领域特定语言、复杂分析调用前沿模型,并采用双模型冗余设计作为回退[35][36] - 模型选择本身可通过追踪“哪些查询在哪些模型上表现更好”来持续学习优化,路由策略需自适应而非手动调整[37] 交互界面设计 - 并非所有任务都需要聊天机器人,自然语言交互的价值在于极大降低复杂工具的使用门槛[39] - 理想应用场景包括处理情绪化任务和进行探索性、开放式的查询[40][46] - 核心是理解用户选择自然语言的根本原因来设计交互,而非将所有交互塞进聊天框架,并应提供GUI控件支持后续精细化调整[40] 未来机会与待解问题 - 重要创业机会点包括:上下文可观测性、可组合记忆、领域感知的领域特定语言[41][42][44] - 善用延迟可创造价值体验,深度分析即使耗时10秒,只要展示思考过程并给出有效答案,用户也能接受[45] - 生成式AI的下一个护城河将源于上下文质量、记忆设计、编排可靠性和信任体验四方面[50][51]