Workflow
基础大模型
icon
搜索文档
“人工智能+”加速推动产业向智向新跃升 中国基础大模型迭代速度加快
央视网· 2025-09-02 14:39
中国信息通信研究院院长余晓晖称:"中国大模型的进步是非常快的,无论是说从大语言模型的基础能力,还是推理能力,还是说多模态 模型的理解和生成能力。" 在中国最早发展数据标注产业的地区之一贵州,已逐渐形成数据标注全产业链,创新要素聚集、产业链上下游联动、区域协同发展。 央视网消息:国务院日前印发《关于深入实施"人工智能+"行动的意见》,《意见》提出要加快推动"人工智能+"产业发展。近期,一系列 面向工业制造领域的大模型相继发布,加速推动人工智能全环节落地应用。目前,中国算力总规模位居全球第二,基础大模型迭代速度加快, 大模型产业形成涵盖基础层、模型层、应用层的完整架构。 《意见》首次布局了智能原生新技术、新业态、新模式,也首次提出第一、二、三产业全要素智能化转型发展路径。推动工业全要素智能 联动,加快人工智能在设计、生产、运营等全环节落地应用。专家表示,"人工智能+"正加速推动国民经济三大产业向智能化跃迁。 一款面向钢铁、有色金属、化工、建材等领域,聚焦流程工业的大模型近日在杭州正式发布,同期,130余家行业头部企业、设计院等成 立了"工业AI数据联盟",加快推动工业数据场景化、规模化应用与服务共享,加速数据价值 ...
阶跃星辰发布基础大模型Step 3 推动国产模型和芯片联合创新
新华财经· 2025-07-25 20:57
公司动态 - 阶跃星辰发布新一代基础大模型Step 3,专为追求性能与成本均衡的企业和开发者设计 [1] - Step 3将在7月31日面向全球企业和开发者开源,为开源世界贡献多模态推理模型 [1] - 公司联合近10家芯片及基础设施厂商发起"模芯生态创新联盟",首批成员包括华为昇腾、沐曦、天数智芯等 [2] - 华为昇腾芯片已实现Step 3的搭载和运行,沐曦、天数智芯和燧原也已初步实现运行Step 3 [2] - 2025年公司商业化应用快速增长,全年预计收入近10亿元 [2] - 上海国有资本投资有限公司与阶跃星辰达成深度战略合作,将在近期参与投资公司最新一轮融资 [2] 行业趋势 - 大模型技术迈向推理时代,最适合实际应用的大模型需要满足强智能、低成本、可开源和多模态四个特征 [1] - 要让大模型真正能用起来,需要从模型、芯片、平台到应用的全产业链协同创新 [2] - 公司聚焦智能终端智能体方向,重点布局汽车、手机、物联网设备等关键应用场景 [2] - 公司积极拓展垂直行业应用,与金融财经、内容创作、零售等领域头部公司深度合作 [2] 产品技术 - Step 3是新一代推理模型,专为追求性能与成本均衡的企业和开发者设计 [1] - 公司提出大模型需要满足强智能、低成本、可开源和多模态四个特征 [1] - 模芯生态创新联盟将为企业和开发者提供高效易用的大模型解决方案 [2]
阶跃星辰发布新一代基础大模型Step3
快讯· 2025-07-25 17:16
阶跃星辰发布新一代基础大模型Step3 - 公司发布新一代基础大模型Step3,主打多模态推理能力 [1] - 新模型在国产芯片上32K上下文推理效率最高可达DeepSeek R1的300% [1] - Step3大模型计划在7月31日向全球开源 [1]
IDC发布2025基础大模型报告:文心大模型综合能力第一
快讯· 2025-06-06 10:05
文心大模型评估表现 - 文心大模型在IDC《中国基础大模型产品综合评估报告,2025》8项核心评估维度中获得7项最高分,成为唯一获得7项满分的大模型 [1] - IDC指出百度是国内最早投入大模型产研的公司,始终专注基础大模型研发 [1] - 文心大模型在多轮对话大模型的记忆、理解、指令遵循能力明显领先 [1]
每周一问大模型 | 基模“五强”谁最水,谁最强?
搜狐财经· 2025-05-19 15:26
中国基础大模型五强竞争格局 - 字节跳动、阿里巴巴、阶跃星辰、智谱AI和DeepSeek被列为国产基础大模型领域的核心力量,形成"基模五强"竞争格局 [1] 阿里巴巴 - 综合实力最强,通义千问模型在MMLU、CMMLU等权威评测中排名靠前,Qwen-72B能与GPT-4正面抗衡 [47][53] - 开源生态领先,Qwen系列在Hugging Face上持续维护,下载量超3亿次,社区活跃度高 [47][64] - 商业化能力突出,通过阿里云"百炼平台"服务超29万家企业,API调用量高 [61] - 资金投入巨大,近三年AI战略投入达3800亿元人民币,未来三年计划继续投入3800亿元 [39][61] - 技术布局全面,覆盖文本、图像、视频、语音等多模态领域 [64] 字节跳动 - 生态整合能力强,依托抖音、今日头条等平台,将AI嵌入内容推荐、协同办公等场景 [61] - C端落地领先,豆包APP日活跃用户数高,月活超1亿,产品交互体验优于竞品 [50][61] - 资金投入充足,2025年拨出超1500亿元战略支出,张一鸣亲自推动AI战略 [39][61] - 多模态能力覆盖电商、医疗、教育等场景,视频生成工具"即梦"在电商直播、虚拟偶像场景落地 [9][61] - 技术团队强大,整合光年之外、零一万物等团队,吸纳吴永辉等技术大牛 [39][61] DeepSeek - 技术突破显著,DeepSeek-R1在代码能力上超过Gemini 2.5,推理性能接近甚至超越其他模型 [39] - 极致性价比,训练成本仅为行业头部1/10,API定价低至OpenAI的1/30 [24][61] - 工程创新突出,通过降秩KV矩阵、混合专家架构优化计算效率 [24] - 开源策略获得开发者青睐,DeepSeek-Coder等模型性能极强,在GitHub社区影响力迅速上升 [39][47] - 在LMSYS Org榜单中数学、代码生成任务排名第一 [24] 阶跃星辰 - 多模态技术领先,发布22款基座模型,其中16款为多模态模型,覆盖文本、图像、视频、语音、音乐等 [11][24][39] - 视频生成技术突出,Step-Video-T2V为全球参数量最大、性能最优的开源视频生成模型 [61] - 商业化增长迅速,2024年多模态API调用量增长45倍,聚焦智能体与终端结合 [13] - 获得头部客户,在智能终端领域与OPPO、吉利、智元机器人等合作 [13][24] - 融资顺利,B轮融资数亿美元,有上海国有资本等强力支持 [39] 智谱AI - 政企市场优势明显,中标32个政府及企业项目,金额达1.29亿元,覆盖金融、医疗、政务等20余行业 [14][24] - 学术背景深厚,背靠清华大学,GLM系列模型在中文问答、代码生成等领域表现优异 [14][21] - 商业化收入增长显著,年增长超100%,是首个启动IPO的大模型公司 [14] - 技术布局全面,构建基座模型、推理模型、多模态模型全栈产品体系 [24] - 开源策略启动较晚,计划2025年启动,生态建设落后于阿里巴巴 [12] 未来竞争焦点 - 智能上限竞争,聚焦模型推理能力、长链思维链突破,如DeepSeek的RL机制、阶跃的多模态融合 [15][23] - 多模态与智能体落地,多模态能力是AGI基础,智能体落地将决定技术溢出价值 [23] - 商业化路径验证,需要持续验证开源生态、垂类场景、性价比策略的市场接受度 [23] - 成本控制关键,DeepSeek的工程优化、阿里的算力基建将是规模化决胜关键 [15] - 技术架构突破,阶跃星辰需要解决多模态理解与生成一体化架构难题 [11][13] 行业竞争排名 - 综合实力排名:阿里巴巴最强,字节跳动次之,DeepSeek和阶跃星辰最具潜力,智谱AI相对短板 [15][44][64] - 技术专长排名:DeepSeek在数理推理领域领先,阶跃星辰在多模态技术突出,阿里巴巴在开源生态领先 [20][33][44] - 商业化能力排名:阿里巴巴和字节跳动商业化成熟度最高,智谱AI在政企市场有优势,DeepSeek商业化路径待验证 [15][22][61]
大湾区ETF(512970)涨近1%,国企共赢ETF(159719)盘中翻红,国资委:坚定不移提升央企基础大模型性能和水平
搜狐财经· 2025-05-12 11:11
大湾区主题指数及ETF表现 - 中证粤港澳大湾区发展主题指数(931000)上涨1.05%,成分股广东宏大涨6.04%、中船防务涨4.54%、华大基因涨3.93% [1] - 大湾区ETF(512970)上涨0.85%至1.19元,近1周累计上涨2.34% [1] - 大湾区ETF管理费率0.15%、托管费率0.05%,为行业较低水平 [1] - 指数前十大权重股合计占比53.49%,比亚迪(9.53%)、中国平安(7.81%)、招商银行(7.53%)为前三 [6][8] - 权重股立讯精密单日涨3.52%、TCL科技涨2.34%,中国平安与招商银行均涨超1.2% [8] 国企共赢ETF及政策动态 - 国企共赢ETF(159719)上涨0.20%至1.49元,近1周涨1.02%,近3年净值上涨44.07% [2][4] - 该ETF年化收益超越基准3.48%,历史持有3年盈利概率100%,在指数股票型基金中排名前4.41% [2] - 今年以来相对基准回撤仅0.15%,为可比基金最低,管理费率0.25%+托管费率0.05%为行业最低 [3] - 前十大成分股均为"中字头",中国石油(15.58%)、中国石化(12.33%)、中国建筑(8.89%)权重最高 [4][6] - 国务院国资委会议强调央企需强化AI技术应用,打造高价值场景标杆,推动产业共同体建设 [3] - 机构看好央国企红利行情,认为政策端受益于化债/重组,资金端受益于险资入市,行业端关注低估值高股息消费板块 [3] 成分股市场表现 - 国企ETF成分股中国石化涨0.53%、中国中铁涨0.54%、中国铁建涨0.51%,中国移动A股跌0.34% [6] - 大湾区成分股海信家电、领益智造跟涨,中兴通讯涨1.48%,迈瑞医疗涨1.58% [1][8]
多模态=AGI入场券?阶跃星辰姜大昕:死磕基座大模型,探索多模态理解生成一体化
量子位· 2025-05-10 12:40
基础大模型研发战略 - 公司明确表态坚持基础大模型研发,认为行业技术发展仍处于陡峭上升期,GPT-4等前沿技术迭代速度极快[1][2] - 坚持研发的逻辑包括:技术趋势的快速演进要求紧跟主流增长路径,避免被淘汰[1][2] - 应用与模型存在共生关系——模型决定应用上限,应用反哺模型场景数据[3] 产品形态与商业化路径 - 公司C端产品完成从"跃问"到"阶跃AI"的品牌升级,形态从手机App转向端云一体Agent平台[4] - 商业化逻辑遵循"模型突破先于商业化"原则,参考OpenAI的GPT-3.5到ChatGPT演进路径[4] - 终端产品定位明确聚焦C端市场,涵盖助手类与内容类应用场景[4] 技术演进两大趋势 - **强化学习转型**:行业从模仿学习转向强化学习,OpenAI的o1/o3和DeepSeek-R1均采用该技术[7][8] - **多模态融合**:多模态被视为实现AGI的必经之路,涉及符号/视觉/空间等多元智能形态[9][12] 多模态研发实践 - 公司采取散弹式研发策略,两年内发布22款基座模型,其中16款为多模态模型(占比73%),覆盖文字/语音/图像/视频等方向[10] - 多模态模型细分领域包括图像理解生成、视频处理、音乐生成及多模态推理等7类[10] - 技术路线聚焦"单模态→多模态→理解生成一体化→世界模型→AGI"的演进路径[12] 理解生成一体化技术突破 - 多模态理解生成一体化指同一模型完成理解与生成,而非传统三段式流程[13] - 视觉模态因高维度连续分布特性,其NFP(Next-Frame-Prediction)技术复杂度显著高于语言模型的NTP[13][14] - 公司图像编辑模型Step1X-Edit已初步实现该技术,但承认仍需架构优化与数据打磨[17] - 技术难点在于视觉领域缺乏类似Transformer的统一架构,公司正探索可扩展的解决方案[16] 综合能力建设 - 实现理解生成一体化需语言模型、视觉推理、内容生成等全栈能力支撑,无法单点突破[20][21] - 公司通过并行多条技术路线保持技术领先性,内部各方向能力均衡发展[17][22]
国资委:加快掌握关键领域根技术 坚定不移提升央企基础大模型性能和水平
快讯· 2025-05-09 09:27
央企人工智能发展 - 坚持自立自强 加快掌握关键领域根技术 坚定不移提升央企基础大模型性能和水平 [1] - 突出应用导向 引导企业将人工智能深度融入研发 生产的关键场景 打造战略性 高价值场景应用标杆 [1] - 强化协同合作 加快落地产业共同体 探索高质量数据集共建共享新模式 [1] - 筑牢安全底座 推动央企切实提升人工智能内生安全能力 确保符合国家安全和主流价值观要求 [1]