Workflow
基础大模型
icon
搜索文档
IDC发布2025基础大模型报告:文心大模型综合能力第一
快讯· 2025-06-06 10:05
文心大模型评估表现 - 文心大模型在IDC《中国基础大模型产品综合评估报告,2025》8项核心评估维度中获得7项最高分,成为唯一获得7项满分的大模型 [1] - IDC指出百度是国内最早投入大模型产研的公司,始终专注基础大模型研发 [1] - 文心大模型在多轮对话大模型的记忆、理解、指令遵循能力明显领先 [1]
每周一问大模型 | 基模“五强”谁最水,谁最强?
搜狐财经· 2025-05-19 15:26
中国基础大模型五强竞争格局 - 字节跳动、阿里巴巴、阶跃星辰、智谱AI和DeepSeek被列为国产基础大模型领域的核心力量,形成"基模五强"竞争格局 [1] 阿里巴巴 - 综合实力最强,通义千问模型在MMLU、CMMLU等权威评测中排名靠前,Qwen-72B能与GPT-4正面抗衡 [47][53] - 开源生态领先,Qwen系列在Hugging Face上持续维护,下载量超3亿次,社区活跃度高 [47][64] - 商业化能力突出,通过阿里云"百炼平台"服务超29万家企业,API调用量高 [61] - 资金投入巨大,近三年AI战略投入达3800亿元人民币,未来三年计划继续投入3800亿元 [39][61] - 技术布局全面,覆盖文本、图像、视频、语音等多模态领域 [64] 字节跳动 - 生态整合能力强,依托抖音、今日头条等平台,将AI嵌入内容推荐、协同办公等场景 [61] - C端落地领先,豆包APP日活跃用户数高,月活超1亿,产品交互体验优于竞品 [50][61] - 资金投入充足,2025年拨出超1500亿元战略支出,张一鸣亲自推动AI战略 [39][61] - 多模态能力覆盖电商、医疗、教育等场景,视频生成工具"即梦"在电商直播、虚拟偶像场景落地 [9][61] - 技术团队强大,整合光年之外、零一万物等团队,吸纳吴永辉等技术大牛 [39][61] DeepSeek - 技术突破显著,DeepSeek-R1在代码能力上超过Gemini 2.5,推理性能接近甚至超越其他模型 [39] - 极致性价比,训练成本仅为行业头部1/10,API定价低至OpenAI的1/30 [24][61] - 工程创新突出,通过降秩KV矩阵、混合专家架构优化计算效率 [24] - 开源策略获得开发者青睐,DeepSeek-Coder等模型性能极强,在GitHub社区影响力迅速上升 [39][47] - 在LMSYS Org榜单中数学、代码生成任务排名第一 [24] 阶跃星辰 - 多模态技术领先,发布22款基座模型,其中16款为多模态模型,覆盖文本、图像、视频、语音、音乐等 [11][24][39] - 视频生成技术突出,Step-Video-T2V为全球参数量最大、性能最优的开源视频生成模型 [61] - 商业化增长迅速,2024年多模态API调用量增长45倍,聚焦智能体与终端结合 [13] - 获得头部客户,在智能终端领域与OPPO、吉利、智元机器人等合作 [13][24] - 融资顺利,B轮融资数亿美元,有上海国有资本等强力支持 [39] 智谱AI - 政企市场优势明显,中标32个政府及企业项目,金额达1.29亿元,覆盖金融、医疗、政务等20余行业 [14][24] - 学术背景深厚,背靠清华大学,GLM系列模型在中文问答、代码生成等领域表现优异 [14][21] - 商业化收入增长显著,年增长超100%,是首个启动IPO的大模型公司 [14] - 技术布局全面,构建基座模型、推理模型、多模态模型全栈产品体系 [24] - 开源策略启动较晚,计划2025年启动,生态建设落后于阿里巴巴 [12] 未来竞争焦点 - 智能上限竞争,聚焦模型推理能力、长链思维链突破,如DeepSeek的RL机制、阶跃的多模态融合 [15][23] - 多模态与智能体落地,多模态能力是AGI基础,智能体落地将决定技术溢出价值 [23] - 商业化路径验证,需要持续验证开源生态、垂类场景、性价比策略的市场接受度 [23] - 成本控制关键,DeepSeek的工程优化、阿里的算力基建将是规模化决胜关键 [15] - 技术架构突破,阶跃星辰需要解决多模态理解与生成一体化架构难题 [11][13] 行业竞争排名 - 综合实力排名:阿里巴巴最强,字节跳动次之,DeepSeek和阶跃星辰最具潜力,智谱AI相对短板 [15][44][64] - 技术专长排名:DeepSeek在数理推理领域领先,阶跃星辰在多模态技术突出,阿里巴巴在开源生态领先 [20][33][44] - 商业化能力排名:阿里巴巴和字节跳动商业化成熟度最高,智谱AI在政企市场有优势,DeepSeek商业化路径待验证 [15][22][61]
大湾区ETF(512970)涨近1%,国企共赢ETF(159719)盘中翻红,国资委:坚定不移提升央企基础大模型性能和水平
搜狐财经· 2025-05-12 11:11
大湾区主题指数及ETF表现 - 中证粤港澳大湾区发展主题指数(931000)上涨1.05%,成分股广东宏大涨6.04%、中船防务涨4.54%、华大基因涨3.93% [1] - 大湾区ETF(512970)上涨0.85%至1.19元,近1周累计上涨2.34% [1] - 大湾区ETF管理费率0.15%、托管费率0.05%,为行业较低水平 [1] - 指数前十大权重股合计占比53.49%,比亚迪(9.53%)、中国平安(7.81%)、招商银行(7.53%)为前三 [6][8] - 权重股立讯精密单日涨3.52%、TCL科技涨2.34%,中国平安与招商银行均涨超1.2% [8] 国企共赢ETF及政策动态 - 国企共赢ETF(159719)上涨0.20%至1.49元,近1周涨1.02%,近3年净值上涨44.07% [2][4] - 该ETF年化收益超越基准3.48%,历史持有3年盈利概率100%,在指数股票型基金中排名前4.41% [2] - 今年以来相对基准回撤仅0.15%,为可比基金最低,管理费率0.25%+托管费率0.05%为行业最低 [3] - 前十大成分股均为"中字头",中国石油(15.58%)、中国石化(12.33%)、中国建筑(8.89%)权重最高 [4][6] - 国务院国资委会议强调央企需强化AI技术应用,打造高价值场景标杆,推动产业共同体建设 [3] - 机构看好央国企红利行情,认为政策端受益于化债/重组,资金端受益于险资入市,行业端关注低估值高股息消费板块 [3] 成分股市场表现 - 国企ETF成分股中国石化涨0.53%、中国中铁涨0.54%、中国铁建涨0.51%,中国移动A股跌0.34% [6] - 大湾区成分股海信家电、领益智造跟涨,中兴通讯涨1.48%,迈瑞医疗涨1.58% [1][8]
多模态=AGI入场券?阶跃星辰姜大昕:死磕基座大模型,探索多模态理解生成一体化
量子位· 2025-05-10 12:40
基础大模型研发战略 - 公司明确表态坚持基础大模型研发,认为行业技术发展仍处于陡峭上升期,GPT-4等前沿技术迭代速度极快[1][2] - 坚持研发的逻辑包括:技术趋势的快速演进要求紧跟主流增长路径,避免被淘汰[1][2] - 应用与模型存在共生关系——模型决定应用上限,应用反哺模型场景数据[3] 产品形态与商业化路径 - 公司C端产品完成从"跃问"到"阶跃AI"的品牌升级,形态从手机App转向端云一体Agent平台[4] - 商业化逻辑遵循"模型突破先于商业化"原则,参考OpenAI的GPT-3.5到ChatGPT演进路径[4] - 终端产品定位明确聚焦C端市场,涵盖助手类与内容类应用场景[4] 技术演进两大趋势 - **强化学习转型**:行业从模仿学习转向强化学习,OpenAI的o1/o3和DeepSeek-R1均采用该技术[7][8] - **多模态融合**:多模态被视为实现AGI的必经之路,涉及符号/视觉/空间等多元智能形态[9][12] 多模态研发实践 - 公司采取散弹式研发策略,两年内发布22款基座模型,其中16款为多模态模型(占比73%),覆盖文字/语音/图像/视频等方向[10] - 多模态模型细分领域包括图像理解生成、视频处理、音乐生成及多模态推理等7类[10] - 技术路线聚焦"单模态→多模态→理解生成一体化→世界模型→AGI"的演进路径[12] 理解生成一体化技术突破 - 多模态理解生成一体化指同一模型完成理解与生成,而非传统三段式流程[13] - 视觉模态因高维度连续分布特性,其NFP(Next-Frame-Prediction)技术复杂度显著高于语言模型的NTP[13][14] - 公司图像编辑模型Step1X-Edit已初步实现该技术,但承认仍需架构优化与数据打磨[17] - 技术难点在于视觉领域缺乏类似Transformer的统一架构,公司正探索可扩展的解决方案[16] 综合能力建设 - 实现理解生成一体化需语言模型、视觉推理、内容生成等全栈能力支撑,无法单点突破[20][21] - 公司通过并行多条技术路线保持技术领先性,内部各方向能力均衡发展[17][22]
国资委:加快掌握关键领域根技术 坚定不移提升央企基础大模型性能和水平
快讯· 2025-05-09 09:27
央企人工智能发展 - 坚持自立自强 加快掌握关键领域根技术 坚定不移提升央企基础大模型性能和水平 [1] - 突出应用导向 引导企业将人工智能深度融入研发 生产的关键场景 打造战略性 高价值场景应用标杆 [1] - 强化协同合作 加快落地产业共同体 探索高质量数据集共建共享新模式 [1] - 筑牢安全底座 推动央企切实提升人工智能内生安全能力 确保符合国家安全和主流价值观要求 [1]