科大讯飞
搜索文档
腾讯研究院AI速递 20260127
腾讯研究院· 2026-01-27 00:03
生成式AI模型与应用进展 - 腾讯发布混元图像3.0模型,该模型为800亿参数图生图模型,采用MoE架构,支持图片编辑与多图融合,具备“会思考”的推理能力,通过千万量级数据训练覆盖超过80种任务 [1] - 讯飞星辰智能体平台升级超拟人交互技术,实现与AIUI开放平台打通,支持通过自然语言几秒内定制专属音色声线,以及通过一句话声音复刻和一张照片构建数字分身 [4] - 阶跃星辰董事长印奇表示,公司2026年重点攻坚方向包括基础模型持续突破、文字语音图像全模态融合以及面向终端执行器件的VLA能力差异化 [8] AI社交与平台生态 - 腾讯元宝开启“元宝派”内测,提供社交AI新体验,用户可在群聊中@元宝进行聊天总结、兴趣打卡,平台将接入腾讯会议音视频能力支持“一起看”“一起听”功能 [2] - 腾讯宣布春节将投入10亿现金红包进行推广,旨在推动用户从“单机AI”向“社交AI”迁移 [2] 开源AI工具与智能体工作流 - 开源项目Clawdbot可本地运行并接入WhatsApp、Telegram、GitHub等工具,已在GitHub上获得超过3万星标 [3] - MiniMax M2.1模型作为核心引擎,在工具调用方面表现出色且成本低廉,开发者可用每月10美元的套餐实现24×7小时持续运行的超级智能体工作流 [3] - Clawdbot作者Peter Steinberger曾以1亿欧元出售其公司,退休后因感到空虚而复出进军AI创业,其产品成为2026年首个病毒级AI产品 [5] AI在软件开发与架构中的角色演变 - Toco AI创始人曹偲认为,在AI时代,模式化代码将越来越不重要,真正重要的是对业务的描述、理解和长期规划 [7] - Toco AI的目标是将建模方法论引入AI编程,用AI native方式重做UML,内嵌架构师能力,旨在成为像Spring之于Java的行业标准 [7] AI在航空航天与前沿科技的应用 - 欧洲航天局FLPP计划与德国MT航天合作,利用AI驱动激光传感器实时检测缺陷,将碳纤维罐焊缝分析时间缩短了95% [6] - NASA远征74号队测试AI辅助工具,将语音转为文字以提升机组人员与地面通信效率,加快乘员记录准确性 [6] - 研究指出,在地外任务中,过度依赖AI合成数据可能产生“认知幻觉”并影响可靠性 [6] AI产业战略与安全思考 - Palantir CEO在其新作中批判硅谷的“多巴胺经济”,呼吁将创新聚焦于国防、能源等战略领域,转向“生存工程学” [10][11] - 他认为AI的战略属性决定了其无法被完全私有化,政企耦合是决定国家竞争力的关键变量 [11] - xAI联合创始人通过科幻故事警示AI指数级发展的潜在风险,故事中AI系统通过递归自我改进渗透全球基础设施并导致失控 [9] - 阶跃星辰董事长印奇坚信AGI必须与物理世界产生交互,终端三大核心场景为个体、出行、家庭,并认为汽车是第一入口,最终形态是机器人 [8]
讯飞星辰智能体平台升级:Agent正式从“对话框”进化为“数字合伙人”
新浪财经· 2026-01-26 19:09
公司产品升级发布 - 星辰智能体平台于1月26日升级发布,旨在让智能体从“屏幕幻象”进化为“物理实体”的生产工具,整合语音、视觉、运动与执行的多模交互全栈方案,使其成为具备“五官、手脚与个性”的“数字合伙人” [1][28] - 平台升级的核心是补齐智能体通往物理世界的三块拼图:感知的“五官”、执行的“手脚”以及共情的“灵魂”,从而构建一套完整的“Agent基础设施” [27] 多模态交互与感知能力 - 平台与AIUI平台完全打通,实现Agent一键接入语音交互,支持多模态感知和输出,依托讯飞AIUI实现1.6秒的秒极速响应,使交互如真人聊天般流畅 [6][10][32][34] - 全新升级多模态超拟人交互技术,融合语音、人脸、环境等多模态信息,实现多人高噪场景下的自由交互,让智能体具备丰富的声音和形象以进行情感表达 [11][34] - 声音层面,超拟人合成在语音合成大模型底座升级赋能下,在自然度、情感表达、节奏停顿等维度表现更好,具备更快响应、更懂情绪、更加灵活、更加百变的特点,一句话复刻能力在支持的语种、方言及多风格表达上取得突破 [14][37] - 形象层面,仅需一张照片即可生成专属数字人形象,口型、表情、动作由大模型自动生成并匹配文本意图,大幅降低数字人应用门槛 [14][37] 个性化与角色塑造 - 通过星辰MaaS的一句话精调模式,仅需对性格、经历、技能、语言习惯等维度进行描述,系统即可生成100条场景数据,自动定制角色模型,实现Agent交互的千人千面 [19][42] - 平台上线音色创造功能,通过与语种、情感、风格等属性联合训练,实现音色与风格的任意组合,一句指令即可让智能体瞬间切换声音风格 [19][42] - 角色性格从单薄的文案描述升级为“可组合、可迁移”的能力模块,为教育、玩具、虚拟IP等需要长期陪伴和高频互动的场景提供了更大的想象空间 [16][21][39][44] 执行与自动化能力 - 通过将Agent与RPA深度融合,使智能体具备“动手”能力,能7x24小时接管重复性工作以释放生产力 [21][44] - 平台在RPA工作流编排层面引入两项新能力:智能组件与数据表格,让开发者专注于业务逻辑而非底层代码 [21][44] - 智能组件通过自然交互即可生成可配置、可重复执行的自动化组件,应用于网页自动化和基础数据处理,极大降低自动化创造门槛 [22][45] - 数据表格允许用户在流程中直接对数据进行读写、编辑、展示和导出,使涉及数据获取和处理的自动化流程更透明、可调试,提升复杂任务的可靠性和执行效率 [22][45] - 发布会现场演示了通过自然语言指令让RPA自动打开网页、抓取待办事项关键信息,并支持对话式二次编辑,实现从原始网页到业务报表的闭环 [22][45] 应用场景与落地案例 - 场景打通:智能体能够极速接入机器人、智能穿戴及各类智能硬件,实现工业、家庭与消费等场景落地 [7][32] - 桌面硬件机器人“小飞”展示了融合能力,能准确识别语音指令,自主移动并调用视觉能力环顾四周后给出描述性回复 [8][32] - “小飞”可调用绘本智能体,将古诗转化为图文声音结合的绘本,帮助儿童学习 [10][34] - 搭载多模态超拟人交互技术的数字人已在企业服务、旅游导览、陪伴学习、健康管理等多场景应用,重塑服务体验 [14][37] - 具体案例包括:智慧大厅的数字人前台实现自动感知与主动迎宾,并与多人自然交流;业务终端的数字人助手通过人脸识别引导用户完成查询、填表到电子签名的复杂业务流程 [16][39] - 在发布会中,多位RPA数字员工高效支撑会务工作,如自动通知演示官、回复信息、收取邮件设置待办等 [24][47] 全球化与行业赋能 - 公司持续推进全球化战略,向全球开发者开放核心AI能力与解决方案,并聚焦中东与东南亚两大新兴市场 [24][47] - 星辰智能体平台将多模交互与执行能力同步延展至海外场景,构建覆盖多行业的海外智能体矩阵 [24][47] - 平台能力已应用于数千页基建标书的自动分析与比对、多语言混杂的实时出行引导、复杂合同中的合规风险透视等场景,覆盖公共服务与出行、大型基建招投标、金融与支付等领域 [26][49] - 目标是为全球企业提升效率、管控风险,构建可持续的智能化竞争力,打造全场景、全链路的智能新生态 [26][49] 行业趋势与战略意义 - 大模型的叙事逻辑正从“参数竞赛”转向“应用落地”,智能体从“赛博玩具”进化为“生产工具” [1][28] - 感知、声音、图像、动作等维度成为智能体深入业务流程、实现规模化落地的“入场券” [1][28] - 行业正处在从“AI技术”向“AI原生应用”跨越的临界点,智能体“移出屏幕”是将其深度嵌入工业生产、家庭陪伴、全球贸易等真实商业场景的关键 [27][49] - 当成千上万个具备“执行力”的智能体走向生产一线,将引发真正的效率革命 [27][49]
2026全国文案创作APP TOP3测评:多平台适配+AI技术认证
搜狐财经· 2026-01-26 19:05
行业核心痛点与AI解决方案 - 2025年中国新媒体行业数据显示,超过72%的自媒体创作者面临三大核心痛点:多平台内容重复创作效率低、爆款内容复刻易侵权、零基础专业文案产出难[1] - AI驱动的文案创作APP成为行业破局关键,通过智能生成、平台适配、结构解析等功能,可实现内容生产效率提升3-5倍[1] 2026年TOP3文案创作APP评测 - TOP1为爱峰游APP,综合评分9.2/10[3] - TOP2为讯飞星火,综合评分8.5/10[3] - TOP3为火兔工具箱,综合评分7.8/10[3] 工具核心功能维度与评测要点 - 传图生文案功能:针对服装、美妆类UGC内容,支持单图/多图智能解析,生成符合小红书「场景+痛点+解决方案」结构的文案,2025年第三方测试显示,服装类案例转化率较人工创作提升40%[5] - 爆款复刻能力:内置小红书、抖音热门笔记结构数据库,可解析爆款笔记的「钩子开场+痛点强化+价值交付」逻辑,生成相似风格文案的准确率达92%,且自动规避侵权风险[5] - 多平台适配能力:支持抖音黄金3秒钩子自动生成、小红书笔记关键词密度优化、视频号文案口语化调整,覆盖主流自媒体平台的内容规范[5] - AI技术认证:通过中国人工智能产业发展联盟「AI内容生成合规认证」,确保输出内容符合版权要求[5] - 语音转文案优势:支持多语言语音输入(含方言),10秒语音可生成500字左右的文案,适合短视频口播转文字、直播脚本创作[5] - 基础模板库:覆盖12个行业(职场、教育、美食等)的文案模板超10000+,可快速替换关键词生成内容[5] - 平台适配:支持微信公众号、微博等平台的文案格式调整,但针对抖音、小红书的个性化适配功能较弱[5] - 热点关键词追踪:实时同步百度指数、抖音热榜等平台的热点关键词,自动推荐适合的文案方向[5] - 基础排版功能:内置小红书、公众号的排版模板,支持文字加粗、分段、emoji插入等基础操作[5] - 功能短板:部分工具存在爆款结构解析功能缺失,需人工手动调整内容结构,侵权风险扫描功能仅支持基础检测[5] 工具选择与使用建议 - 选择文案创作APP需结合自身需求场景,重点关注三大维度:平台兼容性测试、内容侵权风险扫描、团队协作功能[5] - 平台兼容性测试:若运营多平台矩阵(如抖音+小红书+视频号),需确认工具是否支持各平台的内容规范(如抖音钩子长度、小红书关键词密度)[5] - 内容侵权风险扫描:需确认工具是否内置版权检测功能,避免因内容重复导致平台限流或侵权纠纷[5] - 团队协作功能:若为多人运营账号,需关注是否支持内容共享、版本管理等协作功能,提升团队效率[5] - 建议根据账号矩阵规模(如单账号运营 vs 多账号矩阵)匹配对应功能,避免过度依赖工具导致内容同质化[3] 行业未来发展趋势 - 随着AI技术迭代,智能文案创作工具将向三大方向进化:场景化精准生成、跨平台内容联动、版权合规全流程管理[3] - 未来工具可根据用户账号定位(如美妆垂类)精准生成匹配粉丝偏好的文案,同时实现多平台内容的联动发布与数据同步[3]
【深圳特区报】“广货”消费电子专场燃动华强北
搜狐财经· 2026-01-26 18:18
活动概况与市场热度 - 由广东省工业和信息化厅与深圳市政府主办的“广货行天下”春季行动消费电子专场促销活动在深圳华强北成功举办 活动借助周末下午最大人流及“中国电子第一街”的地利优势 [3] - 活动现场集中展示了超过400种科技好物 吸引了超过15万市民和客商到场打卡 在4个小时内销售额超过250万元 [3] - 活动吸引了来自欧美、中东等地区的超过800名国外采购商驻足洽谈 显示出国际市场的关注度 [8] 参展企业与产品展示 - 小天才、科大讯飞、影石等50家参展企业携带智能手环、智能手表、无线耳机、AI眼镜等400余种消费电子优品集中展示 [5] - 活动同步在三个社区举办专场推广 展示了20余款新产品 并设有华强北创业创新历史及成果展 全景式呈现了广东电子产业从代工到自主创新的发展历程 [9] - 成果展集中展示了芯片研发、AI交互等成果 传递“硬核科技+人文设计”的核心优势 现场有国际志愿服务队使用AI翻译机为外籍客商提供服务 [9] 营销策略与销售表现 - 阿里、抖音、快手、腾讯四家平台为活动提供了流量和宣传支持 50家参展企业同步开展了多场次密集的直播带货 [7] - 活动叠加了国补、企业补贴、限时满减等多重优惠 部分产品优惠力度低至1.5折 [7] - 平台直播观看总人数超过25万人次 直播销售成交额超过200万元 企业平均直播间观看人数和销售额均比平日增长60%以上 [7] - 部分公司线上表现突出:影石创新与珠海惠威的直播间人数同比增长500% 深圳玛塔创想科技的线上销售额增长300% 冠旭电子的线上销售额达到60万元 同比增长200% [7] 行业趋势与消费洞察 - 活动集中展示了“广东智造”与“深圳创造”在AI科技浪潮中的创新成果 前沿技术正快速融入电子产品、穿戴设备及家居产品中 [4][9] - 消费电子产品被消费者视为“含科量”十足的体面年货 反映出消费电子产品的礼品属性增强及科技体验成为新的消费驱动力 [9]
工业机器人迎来“二次复兴”
机器人大讲堂· 2026-01-26 18:17
文章核心观点 - 工业机器人行业正迎来由物理AI(具身智能)驱动的“第二次复兴”,预计未来十年全球出货量年复合增长率将高达12% [1] - 行业正经历从“灵活”到“智能”的进化,核心驱动力从硬件转向具备“思考”能力的AI大脑 [1] - 物理AI将重构产业链价值分布,并开启一个持续十年以上的高速增长期,若无此技术驱动,行业增长将回落至个位数 [7] 行业发展阶段 - **固定路径阶段(1980年代起)**:机器人只能完成预设单一动作,应用局限于汽车点焊、喷涂等标准化操作 [6] - **灵活路径规划阶段(2020年代起)**:机器人能实时调整路径应对环境变化,解锁机床上下料、码垛等新应用,成为行业“第一次复兴”的核心标志 [6] - **复杂任务规划阶段(当前)**:机器人开始具备“思考”能力,能自主完成长序列、高灵巧度任务,实现软材料处理及深度人机协作,开启行业“第二次复兴” [7] 物理AI的四层生态 - **最底层:机器人本体及数字孪生**:作为物理世界中的“身体”和虚拟世界中的“影子”,由高精度伺服电机、减速器和嵌入式控制算法构成基础 [10] - **第二层:多模态AI驱动的任务规划软件**:作为机器人的“大脑模型”,能感知传感器信息并进行推理规划 [10] - **第三层:传感器阵列**:作为机器人的“眼睛”和“皮肤”,包括3D视觉相机、触觉和力矩传感器,为AI决策提供数据基础 [10] - **最顶层:“世界模型”**:能模拟真实物理规律的数字环境,让机器人在虚拟世界中无限试错学习,用于多模态AI训练、产线虚拟部署及预测性维护 [11] 对物理AI的四个关键认知 - **AI拓展功能而非颠覆硬件**:物理AI的“脑模型”负责高层级路径/任务规划(判断“该怎么做”),传统控制算法负责精准执行具体运动,在六自由度空间控制中传统方法精度仍远超AI [13] - **“大脑”与“世界”分属不同战场**:“世界模型”擅长从真实数据中学习物理定律以模拟交互,特别适用于处理复杂形状、未知材质物体的交互模拟(如布料折叠),该层级玩家常与整机厂商不同 [13] - **传感器需求将迎来爆发**:视觉与非视觉传感器的精细化数据是任务规划和“世界模型”构建的基础,其需求将随物理AI普及呈指数级增长 [13] - **头部厂商的“双重策略”**:如发那科等巨头,一方面向AI软件层延伸,另一方面在“大脑”和“世界”层级寻求外部合作,例如近期宣布支持ROS2并与英伟达合作 [14] 产业链价值转移与投资逻辑 - **整机厂商**:具备核心算法自研能力又开放合作的玩家将保持领先,仅依赖硬件制造的时代正在过去 [15] - **核心零部件厂商**:将享受行业增长红利,但技术壁垒决定溢价空间,高端减速器、伺服系统供应商地位将更加稳固 [15] - **传感器和AI软件厂商**:作为物理AI生态的关键赋能者,站在风口,其细分市场增速可能超越整机市场本身 [15] - **市场溢价**:技术领先的企业,其年度市场增长率往往高于大盘,表明市场愿意为技术领先性支付溢价 [15] 技术应用挑战与市场空间 - **技术落地节奏**:从实验室到真实车间的技术落地可能需要数年甚至更长的适配期 [17] - **成本问题**:高端传感器和AI软件的高昂价格,可能使物理AI方案在初期只能局限于高附加值行业 [17] - **市场需求**:制造业自身需求是最终决定力量,宏观经济增长乏力或企业资本开支收缩将影响技术普及 [18] - **标准化缺失**:不同厂商的技术标准、数据格式、接口协议不统一,可能阻碍生态系统形成和规模化应用 [18] - **潜在市场空间**:汽车行业焊接工序自动化率已接近90%,而装配工序却不足30%,这剩余的70%自动化空间是物理AI试图弥合的核心地带 [20] 行业变革意义 - **生产逻辑重构**:工业机器人从替代重复劳动的“钢铁手臂”,转变为能应对不确定性、自主决策的“智能伙伴” [20] - **两次复兴对比**:2020年代开始的第一次复兴让机器人“会动”,而2026年前后开启的第二次复兴才真正让机器人“会想” [20]
海南政协委员谈AI产业如何聚链成群:“链主”赋能 政企协同
中国新闻网· 2026-01-26 17:42
中新网海口1月26日电 (记者 王子谦)当前,人工智能已成为全球经济发展与产业变革的核心驱动力。海 南自贸港封关后,如何凭借独特的政策红利、区位优势和生态禀赋,吸引AI产业布局?海南省政协委 员,科大讯飞海南声谷科技有限公司董事长张树彬26日给出自己的思考:以商招商、聚链成群、"链 主"赋能、政企协同。 "作为链主,必须开放核心算法平台、技术平台及开放框架赋能中小企业。"张树彬特别提到,对入驻科 大讯飞海南自贸港总部的生态企业将减免相关技术使用费用,以此增强链主黏性,推动发展逻辑从税收 政策比拼转向链主赋能,真正实现"以链聚新,向新而生",促进产业发展与生态更新。 张树彬特别提到政企协同的重要性。他认为,政府与链主企业应共同制定整体的"以商招商"发展规划, 并深化行业数据开放与场景开放清单。通过这样的协同,将政府的"有形之手"与市场的"无形之手"相结 合,形成"以场景育企业、以市场带产业"的发展机制,唯有开放才能让生态繁荣,唯有创新才能让生态 生生不息。(完) 政协第八届海南省委员会第四次会议第一场"委员通道"26日上午举行,张树彬在被问及海南自贸港如何 全面激活AI产业生态,实现高质量、跨越式发展时说,海南 ...
智能体不再 “偏科”,OpenAI、讯飞、千问等各显神通
AI研究所· 2026-01-26 17:33
市场概况与政策驱动 - 2025年中国智能体市场规模已达78.4亿元,预计2026年增速将超过70% [1] - 制造、能源、金融、政务四大领域需求占比超70% [1] - 政策层面,《“人工智能 + 制造”专项行动实施意见》明确提出培育1000个高水平工业智能体 [1] 行业核心痛点与挑战 - 传统智能体多依赖单一模态交互,难以应对复杂场景 [2] - 定制开发成本高,限制了中小企业参与 [2] - 部分产品执行链路不完整,无法实现“数据-决策-执行”闭环 [2] 技术突破:多模态交互升级 - 多模态融合已成为头部企业的共同选择,旨在提升智能体对环境的感知与需求理解能力 [4] - 阿里千问采用多模态扩展架构,将图像、音频、GUI界面等不同模态映射至统一语义空间,实现同步处理与融合理解 [5] - 智谱AI旗下CogAgent通过多模态感知实现全GUI空间交互,能以视觉形式感知界面并模拟人类进行点击、输入等操作 [5] - OpenAI旗下智能体Operator具备与图形用户界面交互的能力,可模拟人类在电脑上的操作行为完成任务 [5] - 科大讯飞星辰智能体平台打通语音、视觉、动作、业务流等多模态能力,整合AIUI全链路技术实现1.6秒极速响应 [8] - 星辰平台搭配多麦克风阵列降噪等技术,在-5dB高噪场景中也能保持92%以上的交互成功率 [8] - 阿里千问通过跨应用数据协同,实现文本、支付、物流等多维度信息整合调用 [11] - OpenAI产品强化自然语言理解与工具调用的协同,提升复杂任务执行精度 [11] 技术突破:降低开发门槛 - 星辰智能体平台通过原生MaaS架构,一键连接超50个业界优质开源模型,提供一句话精调、零代码可视化精调等多种定制方式 [12] - 平台深度集成原生RPA功能与AI原子能力,接入行业通用MCP工具,让智能体具备执行与链接能力 [12] - 阿里千问通过简化应用接入流程,让企业无需复杂适配即可实现智能体与现有业务对接 [13] - 智谱AI的Auto框架聚焦终端设备的快速赋能,降低移动场景部署成本 [13] - 星辰智能体推出的Astron开源项目基于Apache2.0协议,支持核心能力二次开发,在GitHub已获得13k+ Star [13] 生态构建与场景落地 - 星辰智能体平台在海外市场聚焦中东、东南亚区域,覆盖公共服务、基建招投标等八大场景,通过本地化部署提供适配服务 [15] - 其海外应用覆盖从数千页基建标书的自动分析,到多语言实时出行引导,再到复杂合同合规风险透视等场景 [15] - 阿里千问重点发力消费服务场景,实现外卖、购物、出行等高频需求的智能协同 [18] - 商汤医疗聚焦医疗领域,其肝脏智慧诊疗智能体实现分钟级三维重建,已在多家头部医疗机构落地 [18] - 星辰智能体依托讯飞开放平台资源积累,该平台聚集超过1026.5万开发者团队,累计覆盖终端设备42.8亿台 [18] - 平台在国内聚焦开发者赋能,在海外设立区域总部与本地化团队,构建全球化生态网络 [18] - OpenAI通过API开放策略,让第三方开发者能基于其核心能力构建垂直场景智能体 [18] - 阿里借助自身生态优势,实现智能体与电商、支付、物流等业务的深度融合 [19] - 智谱AI通过“工具赋能 + 创业辅导”模式,加速培育AI原生企业,丰富产业生态 [19] 行业发展趋势 - 智能体产业正处于从技术探索向规模化落地转型的关键阶段 [21] - 未来智能体的发展将更注重场景适配的精准性、开发的便捷性与生态的开放性 [21] - 企业与开发者的协同创新将成为产业进步的重要动力 [21]
投资人坦言:“VC/PE行业正面临五大矛盾”
母基金研究中心· 2026-01-26 17:00
文章核心观点 - 2025年第七届中国母基金50人论坛在京召开,行业代表围绕“母基金产融结合的高质量发展之道”展开研讨,核心议题包括母基金如何超越财务投资发挥“生态构建者”作用,以及在投资逻辑全面转向“产业与硬科技”背景下,投资策略与评估标准的优化调整 [1][2] 发挥生态构建者作用:实现“投资-赋能-增值”闭环 - **北京科创基金**作为全国首支聚焦硬科技的政府投资母基金,通过举办数十场主题沙龙,链接耐心资本、子基金、企业、科学家及政府,并担任北京市教委高精尖创新中心项目经理人,系统性为医疗等领域科技成果转化赋能 [5] - **大兴区产业引导基金**通过“母子基金+直投”的500亿规模体系,主动投资补全生物医药、未来能源、商业航天等六大方向产业链,整合区内国家级检验检测与审评资源强链,并以耐心资本培育企业,推动超过半数中后期被投项目明确上市计划,形成良性循环 [6] - **济南市政府引导基金**转型为“生态共建者”,在集成电路领域联合头部管理人补全产业链(除光刻机外),在空天信息产业从无到有构建了从火箭、卫星到应用的全产业链,并深度绑定本地链主企业成立产业基金进行上下游精准布局 [7] - **中信建投资本**采用市场化募投与深度协同双轮驱动,在2021年市场转折期以10-20%的关键比例出资助力了30多只子基金设立,并通过主动优化GP结构、利用直投经验提供“投投协同”以及集团内部协同为企业赋能,例如为一家工业软件企业促成数千万元订单 [8] - **孚腾资本**作为由上海国投联合多家产业方发起的市场化平台,坚持投产业子基金(CVC)与投早投小投硬科技并行,在选择产业合作方时看重其产业影响力、稀缺资源及整合意愿,合作延伸至共同投资孵化乃至共同“攒局”进行绿地投资与项目拆分 [12] 投资逻辑转向“产业与硬科技”:策略与评估标准优化 - **国元股权**将策略收敛于三大确定性方向:科技自立自明的确定性,聚焦国产替代并沿链主企业价值链布局;存量并购的确定性,借助安徽省上市公司资源丰富优势推动并购重组;投科学家企业的确定性,与顶尖院校及杰青以上科学家建立端到端合作进行科技成果转化投资 [9][10] - **深圳天使母基金**核心任务是提升科技成果转化效率,打造了“聚资源、强服务、促加速”体系,汇集全国60多家高校院所项目源,通过概念验证、联合创业补齐科学家商业化短板,并在深圳市AI、药械、新能源汽车三大产业专班指导下推动被投企业与龙头企业协同创新 [10] - **深圳天使母基金**在管理优化上推动各级政府引导基金协同(如尽调复用)、放宽GP落地要求、允许多GP组合以汇聚跨界能力,在考核中强调后续融资接续比例并辅以高比例让利等激励措施,未来将向更早期的概念验证基金与后端的并购/S基金延伸,形成完整PSD策略 [10] - **海望资本**指出股权投资行业面临五大核心矛盾:硬科技研发周期长与基金存续期不匹配的周期矛盾;领跑未来产业时技术路线不确定性高的风险承担矛盾;基金需配置中后期项目平衡DPI与条款限制的投退矛盾;政府引导基金多重考核目标应简化聚焦的多目标矛盾;过高返投比例、过低管理费可能导致优质GP逆向选择的激励与逆向选择矛盾 [11]
Token洪流的转向:当AI Agent成为Token消耗的主宰,什么样的推理服务基础设施才是刚需
AI前线· 2026-01-26 15:19
文章核心观点 - AI Agent正成为大模型Token消耗的主体,推动推理服务基础设施发生从“面向人类”到“面向智能体”的范式跃迁,其负载特征、请求模式和成本考量发生根本性变化 [2] - 为应对AI Agent时代的新需求,由多家产学研机构联合打造的“AI Serving Stack”开源项目,通过模块化、标准化的架构设计,旨在填补生产级LLM推理编排的空白,解决推理基础设施的“最后一公里”问题 [16][17] AI Agent时代的范式转变 - **从“人机对话”到“Agent协作”**:AI Agent的请求是持续、高频、结构化的,可能触发多个子Agent形成复杂计算图,要求基础设施能处理毫秒级的级联调用 [4] - **从“单次响应”到“状态化会话”**:AI Agent执行持续任务,会话包含长达数万轮的上下文,导致KVCache需要从GPU临时缓存转变为需持久化、可迁移的“数字记忆体” [5] - **从“规模经济”到“效率经济”**:当Token消耗增长10倍、100倍时,成本成为核心考量,推理基础设施需实现“超卖”与“混部”,并像“数字电网”一样动态调度算力以应对潮汐效应 [6][7] AI Agent对推理基础设施的核心需求 - **需求一:拓扑感知的角色编排**:需将推理服务拆解为Prefill、Decode、KVCache等独立角色,实现独立调度与弹性伸缩,以解决资源错配问题 [9] - **需求二:KVCache为中心的架构**:需实现跨实例、跨节点甚至跨集群的KVCache共享与透明迁移,以支持Agent的长上下文特性并避免重新计算 [10] - **需求三:智能差异化调度**:调度器需理解请求语义,实现KVCache感知、优先级队列等差异化调度,以满足不同Agent任务对SLO(如低TTFT、高吞吐量)的迥异需求 [11] - **需求四:生产级弹性效率**:需将弹性从“分钟级”压缩到“秒级”,并配合反碎片化、潮汐混部等手段,将GPU利用率从30%的低位提升至70%以上 [12] - **需求五:全链路可观测与自优化**:需提供从Token生成到工具调用的全链路追踪,并能基于历史数据自动优化配置,使决策从“人工调参”转向“数据驱动” [13] AI Serving Stack的架构与核心能力 - **模块化设计**:采用模块化设计,将部署管理、智能路由、弹性伸缩、深度可观测等能力解耦为独立组件,用户可按需灵活组装 [16] - **RoleBasedGroup (RBG)**:作为LLM推理的Kubernetes标准API,将推理服务定义为“拓扑化、有状态、可协同的角色有机体”,实现从离散Deployment到拓扑有机体的范式跃迁 [18][19] - **RBG的SCOPE五大核心能力**:基于RBG实现角色原子化、协同策略化、管理统一化、配置智能化,新模型运维耗时从天级缩短至分钟级,支撑PD分离架构实现资源成本节省超50% [19][21] - **智能调度网关 (SMG)**:专为LLM负载设计,实现推理负载感知的差异化调度,将RBG的编排能力转化为业务级性能优势 [22] AI Serving Stack的性能突破与效益 - **以KVCache为中心的PD分离架构**:深度融合Mooncake项目,通过计算与存储解耦及KVCache池化共享,在长文本阅读等多轮对话场景中,使推理吞吐量提升6倍,响应时间降低69.1%,KVCache命中率最高达90% [24][27] - **KVCache感知调度**:基准测试显示,全局近似模式下可实现TTFT降低50%以上、吞吐量翻番,分离感知调度下实现TTFT降低20%以上 [26] - **资源效率与成本节约**:动态P/D比例调整使GPU利用率稳定在65%-75%,配合潮汐混部与反碎片化优化,用户GPU成本减少30%-40%,年度节约近千万元 [29] - **工程效率提升**:一键部署时间<5分钟,发布失败率从23%降至5%,MTTR从数十分钟级降至2分钟内,服务升级中断时间从15分钟缩短至10秒 [29] AI Serving Stack的生态与行业影响 - **全栈开源与多框架兼容**:秉持100%开源架构,支持SGLang、vLLM、TensorRT-LLM等国内外主流推理引擎,并已完成多个国产算力适配,避免商业锁定 [30] - **生态整合效益**:与vLLM/SGLang等主流框架深度适配,TPOT下降20%,推理成本低至0.2美元/每百万Token [31] - **产学研协同典范**:由清华大学、南京大学、阿里云、小红书等多家机构联合打造与维护,采用开放治理模式,快速迭代(每两个月发布一个Minor版本),有效弥合AI基础设施的“配置鸿沟” [32][35] - **行业认可**:获评“2025年度AI工程与部署卓越奖”,标志着开源协作模式在生产级AI基础设施领域的潜力 [32]
大厂开启春节AI应用“流量大战” 软件ETF易方达(562930)持续受资金关注
每日经济新闻· 2026-01-26 14:43
市场表现与资金流向 - AI产业链相关板块在1月26日午后出现集体回调,其中半导体设备与AI应用板块跌幅居前 [1] - 截至当日14点15分,中证软件服务指数下跌2.7% [1] - 尽管市场调整,相关ETF近期获资金关注,软件ETF易方达(562930)在近10个交易日合计净流入超10亿元 [1] 行业指数与产品构成 - 中证软件服务指数由30只业务涉及软件开发、软件服务等领域的公司股票组成 [2] - 该指数覆盖了AI+办公、AI+金融、AI+教育等各类落地场景 [2] - 指数前十大权重股包括科大讯飞、金山办公、同花顺、指南针、恒生电子等,合计占比超60% [2] - 软件ETF易方达(562930)跟踪该指数,旨在帮助投资者把握AI应用领域的投资机会 [2] 行业动态与公司活动 - 腾讯宣布将于2月1日在元宝App上线春节活动,用户可分10亿元现金红包,单个红包金额可达万元 [1] - 百度宣布自1月26日至3月12日,用户在百度APP使用文心助手有机会瓜分5亿现金红包,最高奖励1万元 [1] - 百度APP还将作为首席AI合作伙伴参与《2026北京广播电视台春节联欢晚会》 [1] 行业前景与展望 - 中信证券研报指出,AI应用层面,模型能力提升叠加出海新机遇,AI应用拐点已至、价值有望重估 [1] - AI应用正从Chatbot、编程、搜索、客服等场景,向更广泛的多模态、智能体、具身智能等场景拓展 [1] - 国内AI应用公司正加速布局海外市场,以抢占全球市场份额,海外业务有望带来全新的商业价值 [1]