Workflow
文心
icon
搜索文档
DeepSeek真的不行了吗
经济观察报· 2025-07-29 19:12
DeepSeek用户数据下滑与国产AI前景 - DeepSeek月均下载量从2025年Q1的8111.3万降至2258.9万,降幅达72.2% [2] - DeepSeek使用率由年初7.5%下滑至3%,主要因R2版本延迟发布及高幻觉率问题 [2][3] - 数据统计未涵盖腾讯元宝、百度、夸克等第三方接入渠道,实际影响可能被夸大 [6] DeepSeek的战略定位与行业影响 - 公司以开源开放为核心,创始人明确"不做应用只做研究"的底层技术路线 [7] - 用户活跃度和商业变现非核心指标,目标是为行业提供技术支撑 [7] - 模型权重广泛复制后,行业需解决技术领先性维持和商业模式可持续性问题 [8] 国产AI整体竞争格局 - Qwen、文心、夸克、Kimi等大模型紧咬全球AI前列,国内多路线并行发展 [7] - 中国优势在于超大规模市场、丰富应用场景及海量用户行为数据 [7] - 行业竞争从"参数竞赛"转向"生态竞速",需构建开放协同的创新网络 [9] AI产业发展的关键挑战 - 技术突破需转化为场景价值,真实场景数据(如医疗、教育)反哺技术进步 [10] - 需建立跨企业/机构的开放协作机制,实现数据、算力、算法自由流动 [10] - 公共政策应避免过早选定技术路线,允许市场自发选择和多头并进 [9] 行业长期趋势判断 - 技术护城河在于组织能力与市场结构,非单一模型参数领先 [9] - 中国AI"第二增长曲线"取决于技术向商业/社会价值的转化能力 [11]
ETF盘中资讯|特朗普发布“AI行动计划”,国产替代重要性凸显!重仓国产AI的589520盘中猛拉3%,寒武纪涨超7%
搜狐财经· 2025-07-25 14:41
AI行业市场表现 - 科创人工智能ETF华宝(589520)场内价格盘中涨逾3%,实时成交额超2000万元,交投活跃 [1] - 成份股中云从科技涨超10%,寒武纪、恒玄科技涨逾7%,虹软科技、云天励飞涨超4% [1] - 科创人工智能ETF华宝近4日连续获资金净流入,合计金额1332万元,反映资金看好板块后市 [1] 美国AI政策动向 - 美国总统特朗普发布"AI行动计划",签署三项行政命令推进政策落实 [3] - 政策包括出口美国人工智能全栈产品、加快数据中心建设审批、取消阻碍AI开发的联邦法规 [3] - 市场分析认为该政策将使英伟达、AMD、谷歌、微软、OpenAI和Meta受益 [3] - 中信证券认为该计划将加剧美国科技巨头在AI领域的军备竞赛,包括人才争夺和研发投入 [3] 技术发展动态 - OpenAI将于8月推出GPT-5,可能引入视频等新输入形式,拓宽生成式AI应用场景 [4] - 中银证券指出GPT-5发布将为产业链上下游带来新投资机会,并倒逼国内厂商加速技术迭代 [4] 国产AI产业链特点 - 科创人工智能ETF华宝(589520)具备端云融合、自主可控特征,配置应用软件、终端应用、终端芯片、云端芯片四大环节 [5] - 国产DeepSeek实现弯道超车,打破海外算力封锁,为国产AI公司奠定基础 [6] - 科创板人工智能指数自9.24行情以来累计上涨90.90%,跑赢科创综指(61.53%)等宽基指数 [6]
AI下半场,大模型要少说话,多做事
虎嗅· 2025-07-01 09:33
大模型性能与竞争格局 - DeepSeek模型性能快速提升 2024年4月排名靠后 8月进入TOP10 12月成为基础能力第一的开源模型[1] - 基础模型TOP10中中国占6个 美国占4个 包括通义千问 豆包 混元 文心等[3] - 模型排名轮动加速 GPT-4o曾保持200天第一 现在十几天就会变化[7] - 训练成本高企 每次至少几百万美元 保鲜期短导致玩家减少[8] 模型训练技术趋势 - 预训练与后训练并存 预训练提升基础能力 强化学习从实战中学习潜力大[14] - 下游企业减少参与训练 转向提示词工程 检索增强 工作流等工程化方法[9] - 智谱AI坚持预训练路线 技术团队实力和资源储备是关键[12] Agent发展与应用 - Agent成为运行在大模型上的软件 自主规划能力显著提升[21] - 提示词仍重要 精心设计的系统提示词可充分激发模型能力[22] - Agent可能不是单一产品 而是多功能集合 开发平台将成关键[29] - 未来或形成个位数基座模型+垂直行业应用平台的格局[30] 基准测试体系价值 - "方升"测试体系包含700万条数据 聚焦产业实战应用[1][44] - 测试方法标准化 题目非开源 每次抽取1-2万题后作废[47][48] - 基准测试是指挥棒 定义方向 中美差距缩小因目标一致[51] 技术路线与产业方向 - 谷歌DeepMind强化学习路线被低估 在生物 材料等领域价值巨大[34][37] - 当前模型缺乏世界模型能力 需突破空间关系 物理定律等[38] - AI下半场需减少信息过载 增强意图理解 任务规划等能力[52]
AI大模型幻觉测试:马斯克的Grok全对,国产AI甘拜下风?
搜狐财经· 2025-06-24 19:45
马斯克与xAI动态 - xAI正在进行3亿美元股权交易 估值达1130亿美元 [1] - 马斯克计划用Grok 3.5/4重写人类知识语料库 旨在删除错误信息并补充缺失内容 [1] - Grok 3在AI幻觉测试中表现优异 三轮问题均回答正确 [9][16][29] AI幻觉行业现状 - 行业普遍采用RAG框架、外部知识库结合及精细化训练工具减少AI幻觉 [2] - 测试显示深度思考模式可显著降低幻觉 豆包和通义开启后纠正草莓问题错误答案 [7][11] - 联网功能提升准确性 豆包和通义因默认联网在误导问题中表现优于其他国产模型 [16][21] 技术解决方案与争议 - 多轮推理、分步验证及外部知识融合机制被证明可有效抑制AI幻觉 [35] - 用户可通过开启深度思考、联网搜索及增加限定词减少幻觉 [37] - 学术界指出AI幻觉在蛋白质设计等领域有创造性价值 诺贝尔奖得主David Baker团队利用该特性取得突破 [38] 知识语料库重构争议 - 行业专家Gary Marcus质疑重写语料库可能导致观点偏见 影响客观性 [37] - 清华大学研究团队认为完全消除幻觉可能阻碍科学创新 [38] - 实时更新机制比全量重写更具效率优势 后者可能拖累开发进度 [37]
下一个十年,AI的大方向
虎嗅· 2025-06-12 09:16
本文来自微信公众号:阿朱说 (ID:azhushuo),作者:吕建伟,原文标题:《大方向》,题图来 自:AI生成 2015年,AlphaGo打败李世石,人工智能出圈,迎来爆发。AI四小龙纷纷创业,大多主打视觉识别。这 也难怪,毕竟2015年以来爆发的人工智能热潮,其导火索是:2009年李飞飞创建图片标注数据集、2012 年辛顿在这个图片识别竞赛中刷分屠榜。 今年是2025年,十年了。大家猛然发现,人工智能已经火了十年了。 回顾过去人工智能火的十年,现在来看,AI四小龙纷纷凋零。 二 现在是2025年6月份,我想回顾一下中国AI在这半年来的进展,我让AI给我列一下目前的中国人工智能 大模型: 百度-文心、阿里-通义、腾讯混元与元宝、字节豆包、幻方-DeepSeek、智谱-GLM、月之暗面-Kimi、百 川、零一万物、MiniMax-ABAB、面壁-CPM、商汤-日日新、科大讯飞-星火、360-智脑、昆仑万维-天 工、华为-盘古…… 三 如果说,AI的2015~2025年这十年是上半场,主打视觉识别,而下半场,2025~2035年这十年,会是视 觉生成吗?视觉识别经历的十年会不会也会如AI四小龙一样尴尬呢? 我又 ...
激进与克制:阿里与拼多多的AI叙事转变
IPO早知道· 2025-03-15 09:41
以下文章来源于明亮公司 ,作者主编24小时在线 明亮公司 . 追踪新商业、好公司,提供一手情报与领先认知。 作者:苏打 出品:明亮公司 ! 近日,有消息称拼多多已组建电商推荐大模型团队,负责人为原百度凤巢的核心成员。尽管拼多多并未正面回应,但这一消息一度引发广 泛关注。 作为几乎唯一一个"缺席"AI大模型布局的万亿规模体量"大厂",市场对拼多多AI战略规划的关注或许并非大模型乃至AI本身,而是起家于C 端的巨头公司们,对未来不同发展路径的判断模型。 我们的一个观察是,阿里实际上与美国几家大厂的模式更为接近——未来承诺更大规模的资本支出;而拼多多作为其中看似"异类"的代表, 仍专注于C端用户体验、供应链效率和出海。 值得一提的是,它们均拥有大量C端用户, 但有些选择最终将自己凝聚成具备"核心技术"的to B服务商 ,而有些选择持续深耕消费端,并于 其中攫取最强心智和竞争力。 而近期的资本市场表现,也一定程度上反映出其对两种不同方向的预期。截至发稿,阿里巴巴TTM市盈率约19.9倍;拼多多约11.6倍——市 场暂时写好了答案。 拼多多的克制:是「应用」还是做模型 大模型浪潮兴起后,阿里、百度、字节等是最先摆明态度 ...