星辰系列大模型
搜索文档
首家央企AI独角兽浮出水面!背靠自研大模型,4家国家队资本背书
量子位· 2026-01-07 14:09
事件概览 - 中电信人工智能科技有限公司完成首轮增资,引入四家国家级战略投资方,成为央企首家AI独角兽 [1][2] 战略投资方分析 - **国家人工智能基金**:战略性引导基金,旨在长期投资芯片、算法等AI基础设施,为高风险、长周期项目提供支持 [7][8] - **北京人工智能基金**:由北京市政府主导,聚焦AI生态建设与产业闭环,助力企业接入庞大产业应用场景 [7][9] - **华舆高新交控基金**:中车资本旗下平台,背后是庞大的轨道交通实体产业资源,为AI产品提供天然“试炼场”和可预期的变现能力 [10][11] - **央视融媒体基金**:与中央电视台联动,拥有顶级宣传资源,能为企业提供市场信任背书 [13][14] - 四家国家队投资方协同,整合政策导向、产业试炼与权威背书,旨在合力攻克单一企业无法解决的技术与产业壁垒 [15] 核心技术实力:“星辰”系列大模型 - 公司构建了“全模态、全尺寸、全国产”的“三全”模型体系,覆盖语义、语音、视觉、多模态四种核心能力 [17] - **星辰语义大模型**:基于全国产化万卡集群和国产框架打造,近期开源的MoE模型TeleChat3-105B-A4.7-Thinking在多项评测中比肩业内头部,语义大模型累计下载量已突破40万 [19] - **星辰语音大模型**:支持60多种方言自由混说,已在中国电信万号智能客服规模落地,日均处理超过100万通电话 [19] - **星辰视觉大模型**:在跨模态检索上达到国际领先水平,已在防汛防涝、应急指挥等实际场景中投入使用 [19] - **星辰多模态大模型**:整合语义理解、语音合成及数字人等技术,为复杂内容生产和交互打下基础 [20] - 星辰大模型成功入选2025年度央企十大国之重器 [22] 业务落地与商业化成果 - **C端产品**: - 推出央企首个视频生成创作工具TeleStudio,支持2K分辨率、20秒以上长镜头和精准动作生成 [26] - 推出天翼智能防诈,提供全流程通话守护 [28] - 推出AI眼镜、AI智伴玩偶等硬件,旨在让AI以更自然的方式渗透日常生活 [29] - **B端产品与平台**: - 推出“星辰超级智能体”,强调为企业提供高自由度的定制能力,以对齐业务需求 [30][32] - 打造一站式智能体“训练基地”——星辰MaaS平台,提供完整工具包帮助企业组建专属AI军团 [35][37] - 星辰智能体平台公有云已服务数万名开发者,累计创建智能体数量突破10万;私有化部署方案已在超过50家大型国央企中成功落地 [37] 国家队优势与产业落地能力 - 央国企内部拥有海量可落地场景,可作为新产品内部测试与迭代的训练场 [39][40] - 中国电信在产业数字化方面经验丰富,2024年其产业数字化收入达到1466亿元,占整体营收近30%,并拥有超10亿公众客户、上千万政企客户及全国渠道网络 [41][42] - 央企对安全合规性的严苛要求,使其在需要与业务深度嵌合的智能体领域具备天然优势 [43] - 国家队天生擅长推动产业落地,是连接前沿技术与产业的桥梁 [38][44] 发展理念与行业意义 - 公司坚持技术自研路线,积极响应国家“开源协同、自主可控”的发展方向 [1] - 公司秉持“长期主义”,在数据标注等环节扮演生态规划者、产能运营者和新职业培育者三重角色,追求通过技术赋能带动产业发展、培育繁荣生态的长期价值 [49][50][51][52][53] - 央企首家AI独角兽的出现,标志着国家队在AI领域的市场认可,其“国家队+自研模型”的模式可能重塑全球AI竞争格局,推动AI技术大规模产业落地 [2][21][46][55][56]
超10万亿Tokens的高质量数据集是怎么炼成的?专访中国电信天翼AI阮宜龙
量子位· 2025-09-26 10:08
公司数据资源 - 拥有超过10万亿tokens的通用大模型语料数据及覆盖14个关键行业的专业数据集 总存储量达350TB [1] - 数据经过精心标注和优化 包含多模态内容 可直接用于行业应用 [3] - 高质量数据集通过采集 加工等处理流程 能直接用于AI模型开发训练 提升模型性能 [4] 技术平台架构 - 星辰MaaS平台作为核心 构建"数据-模型-服务"完整闭环 包含四大核心组件 [7] - 数据工具链覆盖"采-存-算-管"链路 支持文本 图片 音视频等多类型数据统一接入与处理 [18] - 模型工具链覆盖"标-训-推-评"链路 支持40多种标注任务 通过AI预标注使效率提升5倍以上 [18] - 智能体作为执行中枢 灵活调度资源并自主完成复杂任务 实现决策智能化与行为自动化 [7] 模型体系与能力 - 建立"三全"星辰大模型体系:全模态 全尺寸 全国产 [8] - 成功研发万亿参数大模型 采用全国产万卡集群和国产深度学习框架训练 [9] - 语音大模型精准识别60种方言 语义大模型参数规模庞大 视觉模型鉴伪技术达国际领先水平 [39] - 完成中央网信办"境内深度合成服务算法备案"和"生成式人工智能服务"双备案 [39] 行业应用案例 - 在纺织行业实现AI验布 瑕疵检测准确率从50%提升至95%以上 生产效率提升50% [9] - 服务物流集团 纳管超500P国产化算力卡 构建多个物流行业高质量数据集 [29] - 在医疗领域与北京三甲医院合作构建医疗质量管理数据集 推动医院运行管理智能化升级 [36] - 在农业领域为雄安新区打造"雄小农"应用 帮助当地农民实现超过15%的增收 [37] - 在政务服务领域基于1200万条工单记录建成520万条高质量语料 支撑25个智能应用场景 [38] 生态建设与产业赋能 - 支撑成都 沈阳等多个国家级数据标注基地建设 扮演产业生态规划者 产能运营者和新职业培育者角色 [34] - 在成都联合打造"蓉数公园・新津数据要素服务站" 引入数十家标注企业及教研机构 [34] - 建立培训认证体系 规模化培养数据标注师 AI训练师等数字化人才 [35] - 形成"政府引导+央企主导+生态协同"可复制模式 构建完整生态链 [35] 战略定位与发展愿景 - 基于国家战略 市场需求 运营商优势禀赋和使命责任四个层面重仓投入数据基础设施建设 [14] - 承载成为国家战略科技力量和领先的通用人工智能服务提供商的愿景 [42] - 持续发力技术领先 应用普惠 生态开放和人才培养四大方向 [43] - 日增数据量达1.6PB 基础数据集超10万亿tokens 服务超10亿公众客户和上千万政企客户 [16]