Workflow
文心X1
icon
搜索文档
DeepSeek月均下载量暴跌72.2%!周鸿祎:梁文锋不屑于做APP,他把技术全都开源免费【附大模型行业市场分析】
前瞻网· 2025-07-25 09:34
DeepSeek下载量变化 - 2025年二季度月均下载量从一季度的8111.3万骤降至2258.9万,降幅达72.2% [2] - 用户流失主要因第三方平台分流,59.2%转向百度App,38.6%转向豆包App [2] - 阿里、字节、百度等大厂推出低价同类API进一步挤压市场空间 [2] DeepSeek开源策略与行业影响 - 采用低成本高性能开源模式,训练成本仅600万美元+2048块H800 GPU [3] - 开源推动第三方平台开发更优质服务,加速AI技术普及 [3] - 创始人梁文锋专注AGI研发而非流量变现,技术全开源免费 [4] 国内大模型竞争格局 - 截至2024年4月国内推出305个大模型,其中10亿参数以上达254家 [4] - 百度文心4.5性能超GPT4.5但API价格仅1%,文心X1价格约为DeepSeek-R1一半 [5] - 主流模型特点:文心系列侧重综合能力,通义千问采用混合推理,DeepSeek-R1数学推理强且成本为国际模型1/10 [6] 技术成本优势与行业应用 - DeepSeek-R1推理成本为OpenAI的1/30 [5] - AI大模型成为城市规划和工业革新核心驱动力,提升动态规划与决策效率 [7] - 轻量化、低成本化趋势加速行业大模型开发与规模化应用 [9]
我让10个大模型又参加了完整版数学高考,第一名居然是它。。。
数字生命卡兹克· 2025-06-10 05:20
大模型数学能力测试 核心观点 - 对多个大模型进行完整版数学高考测试(满分150分),结果显示讯飞星火和豆包以145分并列第一,Qwen3以143.3分位列第三,Gemini 2.5 pro、混元T1和文心x1分别以139.7分和137分位居第四、第五 [15][16][17][18] - 测试发现大模型在解答题表现优异(大部分正确),但单选题第6题成为所有模型的共同难点 [9] - 多模态大模型在涉及图片理解的题目中表现不佳,仅OpenAI o3在三次测试中答对两次 [10] 测试规则 - 补充测试智谱Z1、Kimi1.5、文心X1等模型,排除Claude 4 [3] - 大题按小问赋分,由高中教师估分并取严格标准(仅按结果正确性评分) [3][5] - 每道题运行模型3次,按正确比例给分 [5] - 文本题转换为LaTeX格式输入,图片题直接截图测试(无多模态能力的模型取其他多模态模型平均分) [6][7] 模型表现细节 - **讯飞星火/豆包**:除第6题外全对,展现超高稳定性 [15] - **Qwen3**:解答题全对但填空题因1次失误丢1.7分 [16] - **Gemini 2.5 pro**:解答题表现较弱,总分139.7分 [17] - **DeepSeek-R1-0528**:因推理链过长导致答案偏离,适合复杂度更高的题目 [11] 行业趋势观察 - 相比2023年测试时大模型"不识一二三四五"的窘境,当前模型已能达到优秀学生水平,体现AI技术快速迭代能力 [19][20][21] - 测试结果超出预期,反映头部模型在结构化问题解决上的显著进步 [9][15][21]
6大模型决战高考数学新一卷:豆包、元宝并列第一,OpenAI o3竟惨败垫底
机器之心· 2025-06-08 06:35
大模型高考数学测试表现 - 字节豆包与腾讯元宝以68分并列第一,正确率93% [6][8] - 深度求索DeepSeek和阿里通义分别以63分、62分紧随其后,正确率86%和85% [8] - 百度文心X1 Turbo得分51分(正确率70%),OpenAI o3表现最差仅34分(正确率47%)[10][11] 题目类型分析 单选题(8题/40分) - 豆包、通义、元宝、文心均得35分,DeepSeek得30分,o3仅20分且错4题 [16][17] - o3在基础题出现逻辑混乱,如第2题未给出答案,第5题计算错误 [17] - DeepSeek因OCR识别问题导致第6题无法作答 [22][23] 多选题(3题/18分) - 豆包、DeepSeek、元宝全部满分,通义错1题得12分 [29][31] - 文心X1错2题(含1题未响应),o3未全对且存在单选式作答 [31][33] - 通义因步骤简略导致第11题误选AD,而正确答案为ABC [32] 填空题(3题/15分) - 豆包、DeepSeek、通义、元包均满分,文心X1因第13题取值错误得10分 [34][36] - o3第13题仅答-2、第14题以小数2.44替代分数61/25,共得10分 [36] 技术进展与现存问题 进步 - 国产模型均超及格线(43.8分),较去年显著提升,豆包/元宝正确率达93% [40] - 增加反思能力,如DeepSeek会验证步骤(耗时达15分钟/题) [40] - 推理步骤更完善,多数模型展示完整逻辑链路(除通义外) [41] 问题 - 计算细节错误频发,如符号误判、公式套用错误 [43] - 图形与几何直觉处理不足,如DeepSeek无法识别图表信息 [23][43] - 对题目条件敏感度低,多选题易漏选/误选 [43]
百度AI战略提速首季赚77亿 千辆萝卜快跑奔向全球15城
长江商报· 2025-05-23 07:40
财务表现 - 2025年一季度营业收入325亿元同比增长3% 归母净利润77亿元同比增长42% [2] - 核心业务收入254.63亿元同比增长7% 归母净利润76.33亿元同比增长48% [4] - 在线营销收入160亿元同比下降6% 非在线营销收入94亿元同比增长40% 爱奇艺收入72亿元同比下降9% [5] 智能云业务 - 智能云收入同比增长42% 云业务经营利润率超10% AI相关收入实现三位数增长 [6] - 中标国内大模型项目19个金额4.5亿元 在通用大模型厂商中中标数量和金额均列第一 [7] - 升级MaaS平台千帆 扩充多模态与推理模型工具链 文心4.5 Turbo和X1 Turbo提升性能并降价 [6] 自动驾驶进展 - 萝卜快跑覆盖全球15座城市 部署超1000辆无人车 一季度订单量140万单同比增长75% [9][11] - 进入迪拜/阿布扎比市场 开展公开道路测试 计划部署超1000台全无人车 [9] - 与神州租车合作推出自动驾驶汽车租赁服务 探索扩展至瑞士/土耳其等地区 [10] 研发投入与资本动向 - 一季度研发投入45.44亿元 2021-2024年研发投入连续四年超200亿元 [11] - 桥水基金持仓从20万股增至210万股 富达投资从33万股增至250万股 [11][12] - ARK创始人六次增持百度 累计持仓翻倍 [12] 行业地位 - 拥有中国最大规模AI专利组合 涵盖基础模型/智能体等领域 [7] - 入选《Fast Company》亚太最具创新力公司第二 因自动驾驶实验规模获认可 [6] - 国内大模型招投标总规模24.67亿元 百度中标金额占比达18.2% [7]
永安期货港股市场回顾
新永安国际证券· 2025-05-22 11:17
市场行情 - A股延续上攻态势,上证指数收涨0.21%报3387.57点,深证成指涨0.44%,创业板指涨0.83%[1] - 港股高开,午后涨幅收窄,香港恒生指数收盘涨0.62%报23827.78点,恒生科技指数涨0.51%,恒生国企指数涨0.84%,大市成交额扩大至2163亿港元[1] - 美国三大股指全线收跌,道指跌1.91%,标普500指数跌1.61%报5844.61点,纳指跌1.41%[1] 政策动态 - 特朗普减税法案仍陷僵局,共和党领导人计划最早美东时间周三晚间推进表决,财政恶化前景刺激30年期美债收益率升至5.1%,逼近20年来最高水平,美股和美元联袂下挫[8][11] - 上海市发布提振消费专项行动方案,拟新增数码产品购新补贴,增加适合个人投资者投资的债券相关产品[1][8][11] 企业动态 - 手回集团招股,拟全球发售2435.84万股,入场费3265元,预计于下周五挂牌,2024年度股东应占亏损收窄至1.36亿元人民币[10] - 恒瑞医药以上限44.05元定价,H股预计本月23日开始在联交所主板买卖[10] - 比亚迪在欧洲推新车海豚Surf,低配版折后售价低于2万欧元[12] 企业财报 - 百度首季经调整净利润跌8%至65亿元人民币,胜预期,收入约324.52亿元,按年增3%[12] - 小鹏汽车首季经调整净亏损收窄至4.3亿元人民币,去年同期录亏损14.1亿元[12] - 微博首季纯利升1.16倍,经调整净利润升12%,净收入3.97亿美元,升0.3%[12]
闪电快讯|百度吴甜:飞桨文心开发者数量已超2185万
新浪财经· 2025-05-20 21:16
百度AI技术进展 - 百度发布最新版文心大模型4 5及深度思考模型X1 Turbo 文心4 5 Turbo效果更好 成本更低 文心X1 Turbo实现更先进的思维链 增强问答 创作 逻辑推理 工具调用和多模态能力 [1] - 文心4 5和4 5 Turbo实现文本 图像和视频混合训练 通过多模态异构专家建模等技术 学习效率提高近2倍 多模态理解效果提升超过30% [1] - 文心X1 Turbo突破思维链优化范式 结合工具调用构建复合思维链 通过多元统一奖励机制实现端到端优化 大幅提升跨领域问题解决能力 [1] 多模态AI应用案例 - 百度研发"剧本"驱动多模协同的超拟真数字人技术 支持超过10万数字人主播 直播转化率达31% 降低80%直播开播成本 [4] - 基于文心大模型的语言和代码能力 百度推出代码智能体和智能代码助手"文心快码" 在百度每日新增代码中占比超过40% 累计服务760万开发者 [4] 技术性能与生态规模 - 文心4 5 Turbo训练吞吐达文心4 5的5 4倍 推理吞吐达8倍 [4] - 飞桨文心开发者数量超过2185万 服务67万家企业 创建模型达110万 [4] 大模型发展前景 - 随着大模型能力拓展和效率提升 可探索更前瞻的创新应用 [2]
智谱发的「干活Agent」,不用邀请码
36氪· 2025-04-01 21:52
智谱AutoGLM新产品"沉思"发布 - 公司推出具有深度思考能力的AI Agent产品"AutoGLM沉思",免费上线并支持开放式问题探究与操作执行[3][4] - 产品能模拟人类思维过程,完成从数据检索、分析到生成报告的全流程,并支持多模态理解(图文网页)[4][5] - 展示用例包括具身智能行业研究、生成式AI技术影响分析、复古相机推荐等具体场景[4] 产品技术特性与竞品对比 - 相较于Manus强调"行动"可视化,"沉思"更突出思维链展示,展现模型理解-拆解-检索-解决的完整思考过程[9][10] - 当前预览版仅支持研究整理类任务(如输出代码),无法像Manus直接交付可操作成果(如网页游戏),需用户额外执行[12][13] - 技术架构整合三款新模型:GLM-4-Air-0414(语言理解)、GLM-Z1-Air(问题分析)、GLM-Z1(反思验证)[15] 商业化与行业趋势 - 公司提出"沉思大模型"概念,强调动态联网搜索、工具调用、自我验证等能力对突破传统AI局限性的价值[17] - 新模型GLM-Z1-Air推理速度较R1提升8倍,成本降至1/30,并支持消费级显卡运行,三款模型将于4月14日开源[18] - CEO认为未来应用形态将以模型为核心,产品化外壳变薄,模型能力直接决定产品能力[20] 公司战略定位 - 坚持预训练路线,认为强化学习等方法仍依赖基座模型天花板,预训练是必须持续投入的方向[20] - 提出Agent存在类似大模型的Scaling Law,推理计算扩展可提升性能[20] - 拒绝被标签化为To B公司,强调根据场景需求创造价值而非限定客户类型[25]
当接入DeepSeek成标配,文小言的杀手锏是什么?
雷峰网· 2025-03-25 20:36
大模型行业竞争格局演变 - 2023年为基础模型混战阶段,百度率先发布文心大模型3.5,厂商聚焦技术内卷 [2] - 2024年转向应用为王,ToB市场爆发价格战,ToC领域展开买量大战 [2] - 2025年黑马Deepseek入场,以150人团队承接单日2000万活跃用户,颠覆行业竞争逻辑 [2][5] 开放合作成为行业主流策略 - 头部厂商(如腾讯、百度)通过接入Deepseek-R1满血版实现技术互补,微信、百度搜索首批整合该模型 [6] - 百度文小言全量开放Deepseek-R1及文心最新大模型,强化拍照搜索、图片创作等场景体验 [7] - Deepseek推动行业生态扩容,提升B端/C端市场对AI技术的认知,激活中游厂商活力 [7][8] 多模型协同与自主技术并重 - 文小言采用多模型自动调度机制,整合Deepseek、文心4.5和文心X1,覆盖多模态输入输出需求 [11][17] - 文心4.5原生多模态模型实现文字/图片/音频/视频协同建模,支持扫题搜题、梗图解析等复杂场景 [12][16] - 文心X1具备深度思考链与工具链整合能力,可生成装修方案、润色简历等,差异化超越Deepseek [21][30] 用户价值驱动的产品升级 - 行业竞争核心转向用户需求满足,Deepseek开源与厂商技术整合双向推进 [35][36] - 文小言4月全面免费开放超长文档处理、AI绘画等尖端功能,强化普惠属性 [36] - 头部厂商通过开放生态与敏捷迭代巩固用户心智壁垒,如百度文小言持续扩圈产品生态 [7][31] 技术能力差异化对比 - Deepseek强项为思维链推理,但缺乏多模态能力;文心模型补足图像/音频等刚需场景 [11][15] - 百度工具链积累赋能文心X1,实现一站式解决方案(如简历排版),减少多工具切换 [30][31] - 厂商需平衡外部合作与自研投入,文小言案例显示"合作中保持独立"为关键生存策略 [31]
承认百度仍在AI第一梯队没那么难
雷峰网· 2025-03-17 12:05
核心观点 - 百度在面临Deepseek等竞争对手压力下,选择放下面子,通过发布文心4.5和X1两款新模型展示技术实力,保持行业竞争力 [2][3][4] - 公司通过技术迭代和成本优化,在保持模型性能的同时大幅降低推理成本,并免费开放给用户,以扩大市场份额 [13][14] - 百度转变策略,从封闭走向开放,加快迭代速度并拥抱开源,以适应快速变化的市场环境 [18] - 公司凭借庞大的用户基础、商业化实践和全栈AI能力,保持在行业第一梯队的位置 [22][25] - AI行业竞争加剧,但百度通过务实策略和生态优势,继续在牌桌上参与竞争 [27][29] 文心4.5和X1技术特点 - 文心4.5是多模态大模型,具备理解照片、图表、视频内容的能力,并能识别网络幽默和讽刺 [7] - 采用原生多模态架构,与Gemini、Llama 4、GPT-4o思路一致,通过模态融合和专有机制提升性能 [9] - 引入多模态异构专家扩展技术,针对不同领域使用专业"专家"并通过自适应模态感知损失函数实现协作 [10] - 优化长文本处理、多轮交互、学习效率和幻觉问题,提升模型质量和训练效率 [11] - 文心X1采用递进式强化学习训练方法,建立统一评估系统,融合多种奖励机制 [12] - 两款模型推理成本大幅降低,文心4.5成本为GPT-4.5的1%,X1成本为Deepseek R1的一半 [13] 商业化策略 - 文心4.5和X1已在官网免费开放,企业版定价显著低于竞品 [14] - 百度搜索、文小言等产品逐步接入新模型,推动AI能力普惠 [15] - 近十年累计研发投入超1800亿,收入20%以上投入研发 [15] - 2024年文心大模型日均调用量达16.5亿次,同比增长33倍 [22] - 飞桨平台拥有1808万开发者和43万企业客户,创建101万个模型 [22] - 文心千帆已帮助客户完成3.3万个模型精调,开发77万个企业应用 [22] 行业竞争态势 - Deepseek的出现改变了行业格局,给百度带来巨大压力 [2][3] - AI行业玩家各有所长,技术、产品和营销策略各不相同 [21] - Deepseek的开源策略带动了整个行业发展,加速了企业AI应用进程 [24] - 行业竞争加剧,缺乏商业化能力的公司将被淘汰 [24] - 百度凭借全栈AI能力和庞大生态,保持在第一梯队 [25][27] 公司战略转变 - 从封闭走向开放,加快迭代速度并拥抱开源 [18] - 放下"面子",直面竞争,展示真实技术实力 [17][18] - 从追求技术领先转向注重商业化落地和盈利能力 [24] - 内部决策速度加快,文心4.5全面免费等决策半天内完成 [18] - 计划6月底公布开源版本,下半年推出文心5.0 [18]
大消费的反击?——A股一周走势研判及事件提醒
Datayes· 2025-03-16 22:15
文章核心观点 投资者对顺周期行情持续性存疑,但消费仍有持续性,因政策支持、促消费是重点且当前消费无交易拥挤和压力;还对行情、券商观点、下周发酵板块、要闻等进行分析[1]。 行情回顾 国内主要指数表现 - 上证综指近一周涨1.39%,近一月涨2.97%等[22] - 深证成指近一周涨2.52%,近一月涨14.89%等[22] 外围市场主要指数表现 - 恒生指数近一周跌1.12%,近一月涨4.44%等[22] - 标普500近一周跌2.27%,近一月跌5.30%等[22] 主力及北向资金流向 - 当周A股主力资金净买入402.14亿元,连续2周净买入,净买入前五大行业是非银金融、食品饮料等[23] - 北向资金当周成交10048.67亿元,连续2周成交减少,沪股通成交4745.9424亿元,深股通成交5302.7256亿元[24] 行业资金流向 - 当周最受资金追捧行业是非银金融,净流入152.74亿元,食品饮料、有色金属紧随其后;资金净流出规模最大三个行业是机械设备、计算机和电子[25] 股票型ETF场内净申购情况 - 当周股票型ETF场内净申购金额128.7亿元,结束连续6周净赎回,单周净申购规模创2个月以来最大;份额增加最多五只ETF是广发恒生科技ETF等,减少最多五只ETF是华泰柏瑞沪深300ETF等[27] 行业景气度 行业景气象限分布 - 截至2025 - 03 - 15,纺织服装、建筑装饰、休闲服务行业位于衰退象限,传媒、电子、汽车行业位于扩张象限[29] 行业景气度变化 - 截至2025 - 03 - 15,化工、休闲服务、医药生物行业景气度提升居前,国防军工、非银金融、汽车行业景气度回落居前[30] 行业估值与风险情况 - 截至2025 - 03 - 15,农林牧渔、钢铁、国防军工行业位于“高景气、低估值”象限;计算机、化工、汽车行业估值水平偏高,采掘、公用事业、食品饮料行业估值水平偏低[31] - 截至2025 - 03 - 15,纺织服装、建筑装饰、休闲服务行业位于“低景气、高动量”象限;国防军工、非银金融行业趋势强度由弱转强[32] - 截至2025 - 03 - 15,农林牧渔、钢铁、建筑材料行业位于“高景气、低风险”象限;农林牧渔、化工、钢铁行业位于“高动量、低风险”象限;商业贸易、计算机行业交易拥挤度偏高,建筑材料、建筑装饰、化工行业交易拥挤度偏低[33][34] 券商周度策略核心观点 多方观点 - 中信建投认为短期需注意春季行情时间及空间达历史平均水平,结构上科技成长向顺周期高低切或仍有小幅演绎空间,关注有色、建材等行业及深海科技等主题[6] - 华创证券称空中加油正在发生,流动性层面条件基本满足,配置推荐小盘成长科技链细分芯片及红利质量核心资产、消费制造龙头[6] - 财通证券表示政策与景气趋势相向而行,全球资产东升西落,国内板块轮动轮到金融 + 消费,关注大金融、消费、机器人等板块[6] - 民生证券指出中国亮点在消费侧变化,政策力度加大且注重长效机制改革,关注顺周期消费板块、有色金属、油气等[6] - 中信证券认为年报季市场回归业绩驱动,A股核心资产蓄力上涨,关注高端制造、AI等[6] - 西部证券称降息周期中美元流动性外溢,追逐大宗商品和中国优势资产,拥抱“反脆弱性”[6] - 光大证券表示A股市场估值处于均值附近,随着政策发力,增量资金将加速流入提升估值,关注科技成长和消费板块[6] 空方观点 - 开源证券认为市场恐高情绪、阶段性获利了结和两会日历效应或使市场短期盘整,但行情核心驱动力未变,需坚定牛市第二阶段判断,关注科技成长、消费等行业及中欧贸易关系缓和预期差机会[6] 下周发酵板块解读 大消费 - 中办、国办印发《提振消费专项行动方案》,涉及股市、优化生育概念、养老概念、消费电子、汽车、家电、房地产、旅游、消费新赛道等领域[9] 英伟达产业链 - 当地时间3月17 - 21日,英伟达将举办全球AI界顶级峰会GTC2025,3月19日凌晨黄仁勋将发表主题演讲[10] AI游戏 - 米哈游创始人蔡浩宇神秘AI游戏公司首个项目《Whispers From The Star》曝光,主打AI驱动角色实时对话[11] 光伏 - 光伏硅料 - 组件环节主要企业对硅片 - 组件上半年配额重新调整,上半年每个季度有1% - 3%上调[11] 华为机器人 - 华为下周将推出首款预装原生鸿蒙正式版新形态折叠屏手机及全产品线多款新产品,鸿蒙智行三款新车或将亮相;华为海思麒麟X90 CPU芯片获安全可靠等级测评II级证;华为申请注册“MATEROBOT”商标[11][12] 商业航天 - 马斯克称重型运载火箭“星舰”将于2026年底搭载特斯拉人形机器人“擎天柱”登陆火星,载人火星任务最早2029年实施,2031年可能性更大[16] 要闻 中国宏观 - 《求是》杂志发表习近平总书记重要文章《坚持和落实“两个毫不动摇”》;国务院国资委强调做强做优做大国有资本和国有企业等[36] 美国宏观 - 特朗普宣布对胡塞武装采取军事行动,美国消费者信心创逾两年新低等[36] 海外消息 - 加拿大总理要求审查购买美国F - 35战机计划,德国将1000亿欧元用于应对气候变化等[36] 市场热点 - “3·15”晚会点名企业涉及多家上市公司,交易所紧急问询;证监会会同公安、网信整治股市虚假“小作文”等[37] 行业动态 - 特斯拉在中国开发低成本Model Y,生产成本有望降低20% - 30%;长城针对哈弗全系车型推出限时一口价政策等[37] 利好公告 - 祥鑫科技与三度智能、武迪电子签订战略合作协议;福达股份拟增资及收购股权开拓人形机器人业务等[37] 利空公告 - 2连板巨力索具业绩预告无修正情况;9连板信隆健康市盈率、市净率与同行业差异大等[37] 排雷名单 - 国九条涉及150只ST股,重点防范140只,涉及传媒、家具、软件等多个行业公司,存在涉嫌信息披露违规、年报财务可能不达标等问题[7] 下周关注 - 3月17日公布1 - 2月份国民经济运行数据;国新办将就提振消费有关情况举行发布会;比亚迪举办超级e平台技术发布会[18][20] - 3月17 - 21日英伟达GTC大会举行;3月18 - 19日2025全固态电池技术交流大会在安徽蚌埠举行等[10][20]