Seek .(SKLTY)
搜索文档
工信部:DeepSeek、通义千问等国产大模型引领全球开源创新生态
第一财经· 2025-09-09 11:01
人工智能产业发展态势 - 人工智能企业数量和产业规模持续增长 [1] - 国产大模型DeepSeek、通义千问引领全球开源创新生态 [1] - AI手机、AI眼镜等终端产品加速普及 [1] - 行业专用大模型落地应用取得初步成效 [1]
基于DeepSeek的证券业AI Agent平台分析与实践
证券日报网· 2025-09-08 19:49
文章核心观点 - DeepSeek大模型与AI Agent平台的结合正推动证券行业智能化转型 通过算法创新和系统优化显著降低训练成本 并实现业务与技术的深度融合 [1][3][4] - 湘财证券通过自主研发搭建了深度定制化的AI Agent平台 整合了超过6家厂商的大模型资源和14个业务知识库 已对接12个业务部门并推出21项特色工具 [6][7][9] - 该平台通过低代码特性和模块化设计降低技术门槛 使业务部门能自主构建AI应用 提升跨部门协同效率和市场响应速度 [4][9][15] - 平台在财富管理、经纪、投顾等场景实现自动化与智能化 例如通过"湘伴慧创"AI创作台生成精准营销话术和投资建议 [17] 技术架构与创新 - DeepSeek采用MoE架构和共享专家设计压缩通用知识 通过双向流水并行和FP8混合精度计算降低算力需求 [1] - 平台私有化部署DeepSeek R1模型 包含提示词工程、工作流编排、可视化工作室等模块 整合多渠道业务系统 [6] - 基于DeepSeek R1的深度思考节点支持边思考边执行 深度检查节点确保工作流完整性 [7] - 通过自然语言处理和机器学习技术构建知识图谱 提升知识库的关联性与可理解性 [14] 业务应用与成效 - 平台覆盖智能问答、软文创作、多模态内容生成等功能 应用于财富管理、合规、信用交易等业务线 [17] - 通过客户画像数据推理分析丰富标签体系 形成有效营销线索 [17] - 内部CDH平台与BI工具实现数据可视化 外部数据平台增强客户画像和市场预测能力 [15] - 整合企业微信、投顾平台等渠道构建全方位客户服务体系 提升客户粘性和满意度 [15] 组织与实施策略 - 湘财证券设立"业技融合共建会"作为跨部门协作平台 推动技术与业务深度合作 [10] - 采用自上而下的推进框架 由业务专家、数据专家和AI工程师组成核心团队 [12] - 制定标准化项目实施流程 涵盖智能体选型、知识库配置、部署测试等环节 [13] - 通过用户反馈机制持续迭代知识库 确保信息时效性与准确性 [14]
国内外AI大厂重押,初创梭哈,谁能凭「记忆」成为下一个「DeepSeek」?
36氪· 2025-09-07 17:07
大模型记忆能力的技术演进 - 大模型记忆能力是指模型具备人类对记忆的组织、检索和应用方式 属于长期记忆或终身记忆范畴 区别于当前依赖长文本和外部数据库的短期记忆[3] - 技术演进背景是模型推理能力已成为行业标配 而通用Agent仍空缺 技术曲线放缓促使行业寻求通过记忆能力实现持续学习和长上下文理解[2] - 记忆能力研究自2023年底兴起 因Scaling Law边际效应下降 算力堆叠仅能带来不足10%的性能提升 需寻找新技术范式[12][19] 行业参与者布局动态 - 2024年8月多家厂商密集推出记忆功能:Anthropic的Claude支持对话记忆检索[4] 谷歌Gemini支持跨对话提炼用户偏好[4] 字节跳动Seed团队发布多模态M3-Agent系统[4] - OpenAI于2023年2月已在ChatGPT上线记忆功能 2024年Sam Altman明确将记忆作为GPT6重点[4][5] - 新兴玩家加速入场:马斯克xAI的Grok于4月实现多轮对话记忆[6] Mistral AI宣布与20多个企业平台集成记忆系统[6] 技术实现路径分析 - 参数化记忆路径:通过模型架构创新实现记忆存储 如Temp-Lora方法用临时模块记录历史交互[18] 非Transformer架构包括谷歌Titans三级记忆机制和Meta的记忆层替换方案[25] - 上下文工程路径:通过Prompt和KV cache管理实现记忆 如Manus公司极致化Agent间记忆复用 但依赖人工工程且错误归因困难[26] - 外部数据库路径:采用RAG和向量数据库存储信息 但存在检索准确性低 工程成本高且无法通过训练提升模型性能的局限性[27] 应用场景与商业前景 - 记忆能力是AI Agent突破的关键 需支持不依赖Context Window的终身记忆 满足游戏陪伴等长期交互场景需求[15][21] - 两类商业模式分化:OpenAI等C端厂商通过全局记忆或局部记忆增强用户粘性[31] 中间件服务商如MemOS和Zep提供开源框架推动去中心化记忆生态[32] - 技术成熟度需1-2年实现大规模应用 3-5年解决幻觉和隐私等治理问题 市场格局未定 存在黑马机会[34][35] 学术与产业研究进展 - 中国科学院院士鄂维南团队于2024年7月发布记忆分层模型Memory³ 将参数拆解为隐性/显性/外置记忆库 获Meta和谷歌跟进[8] - 腾讯AI Lab早期研究RAG提升记忆能力 2021年获ACL杰出论文奖 2024年1月开发出参数化记忆方法解决游戏Agent终身记忆需求[13][18]
DeepSeek年底或发布超级智能体:能自主学习,AGI之路再进一步?
搜狐财经· 2025-09-05 22:04
公司动态 - DeepSeek正秘密筹备全新AI智能体 计划在第四季度推出[1][7] - 公司今年早些时候凭借R1模型在多项基准测试中展现与OpenAI顶尖产品相媲美甚至超越的性能[1] - 以数百万美元成本实现惊人成果 而meta的GenAI部门高管年薪远超百万美元[1] - 连续五天公开技术细节 通过开源推动人类向通用人工智能迈进[3] - 发布V3技术架构及开源AI商业模式 巩固业界地位[3] - 近期相对沉默仅发布小版本升级 全力投入智能体开发[5] 技术突破 - 全新AI智能体能够仅凭用户提供的极少量指令执行多步骤复杂任务[5] - 智能体不仅能执行复杂任务 还能基于过往行动进行学习和自我完善[7] - 与只能进行简单文本回应的聊天机器人不同 旨在应对更广泛复杂的任务[8] - 功能范围从规划假期到编写调试代码无所不能[8] - 构建仅需极少人工干预便能执行复杂现实世界任务的自主化AI系统[8] 行业影响 - 开源举措影响OpenAI 促使其时隔多年后再次提供开源权重模型[5] - 国内外AI企业纷纷加入开源AI竞逐 王座几度更迭[5] - 当前AI智能体仍普遍需要大量人工监督 领域处于起步阶段[11] - OpenAI Anthropic和微软等巨头也推出了各自简化工作任务的智能体[11] 发展层级 - AI发展分为五个层级:聊天机器人(Level1) 推理者(Level2) 智能体(Level3) 创新者(Level4) 组织(Level5)[7] - DeepSeek智能体意味着向AI发展的下一阶段迈进[7]
DeepSeek新模型曝光,梁文锋亲自督战,要和OpenAI硬碰硬
36氪· 2025-09-05 20:48
公司动态 - DeepSeek正在开发具备更高阶AI Agent功能的新模型 目标在2025年四季度发布 直接对标OpenAI [2] - 新AI系统核心特征包括基于过往行动学习自我完善 以及通过最少指令自动完成多步骤复杂任务 [4] - 公司创始人梁文锋亲自督战新模型开发 此前被行业专家解读为"憋大招" [4] - 公司8月21日发布开源模型DeepSeek-V3 1 上下文长度扩展至128k 参数规模约685B 重点增强代码理解与Agent任务执行能力 [10][12] - 模型引入混合推理架构 支持思考与非思考双模式 可智能切换提升推理效率 [12] - 公司面临用户流失压力 月下载量从一季度8111 3万骤降至二季度2258 9万 降幅达72 2% [23][24] - 当前产品存在服务器响应速度慢 幻觉问题 用户流向第三方平台等挑战 [22] 行业趋势 - AI智能体被视为大模型后重点赛道 具备自主决策 任务拆解与跨应用协同能力 [7] - 行业普遍认为2025年将成为"Agent元年" 是智能体发展的黄金时间 [4][10] - 国外巨头微软 谷歌与国内阿里 腾讯 字节跳动均已布局AI智能体赛道 [10] - 政策层面提出到2027年智能体应用普及率超70% 2030年超90% 智能经济成为重要增长极 [10] - 行业独角兽Manus推出首款通用AI Agent引发广泛关注 邀请码被炒至天价 [9] 竞争格局 - OpenAI旗下ChatGPT agent已实现网页交互 信息整合与自然语言对话三位一体功能 [14][16] - ChatGPT agent可实现用户直接下达任务 10分钟内完成复杂操作 [18] - 智能体技术仍存挑战 包括需人工干预 隐私泄露风险(如授权Gmail GitHub账户可能导致信息泄露) [13][21] - 大模型行业迭代速度极快 呈现内卷态势 多家企业通过烧钱抢人抢占市场 [23]
消息称DeepSeek四季度发布新一代模型:聚焦智能体,梁文锋督战
凤凰网· 2025-09-05 18:36
公司动态 - DeepSeek正在开发具备更先进AI智能体功能的AI模型 能够在用户输入最少指令的情况下代表用户执行多步骤操作 并基于以往操作进行学习和改进 [1] - 公司创始人梁文锋正推动团队在2024年最后一个季度发布这款新软件 [1] - 公司今年1月发布的R1模型能够模仿人类推理过程 研发成本仅为数百万美元 [1] 行业趋势 - 科技行业近几个月出现智能体开发趋势 OpenAI、Anthropic和微软都相继推出了各自的智能体软件版本 [1] - 华人创立的创业公司Manus AI凭借"通用AI智能体"获得全球关注 [1] - 行业目标是构建日益自主化的AI系统 使其能够在几乎无需人工干预的情况下发起并完成复杂的现实世界任务 [2] 技术特点 - AI智能体旨在处理复杂任务 包括规划旅行到编写和调试计算机代码 [1] - 与仅以简短文字回应的聊天机器人不同 AI智能体专注于处理更复杂的多步骤操作 [1] - 目前AI智能体仍需要大量"成人监督" 尚未实现完全自主化 [2]
AI医疗,迎来DeepSeek时刻了吗?
36氪· 2025-09-05 16:46
政策与市场动态 - 国家发布《人工智能+行动意见》 推动AI在辅助诊疗、健康管理和医保服务等场景应用 [1] - 中国AI医疗市场规模预计从2023年88亿元增长至2033年3157亿元 年复合增长率达43.1% [1] - 全球AI医疗市场规模预计2032年突破4910亿美元(约3.5万亿元人民币) [1] - 蚂蚁、京东、华为、字节等科技巨头切入AI医疗赛道 聚焦问诊、用药和健康管理场景 [1] 行业核心痛点 - 医疗行业核心矛盾在于优质医生供给严重不足 基层缺乏会看病的医生而非设备 [1][7] - 全球医疗体系普遍存在供给不足、资源不均和成本高昂困境 美国2024年医疗支出增长8.2%突破5万亿美元 [5] - 英国NHS体系面临服务效率低下和财政压力加大挑战 [6] - 中国医改虽提升公平性 但难以在短期内解决优质医疗资源供给不足问题 [7] 技术发展机遇 - AI医疗可能成为"超级入口" 因医疗数字化程度高且决策以家庭为单位 商业价值巨大 [4] - 大语言模型在医疗诊断任务表现提升 o1-preview模型在诊断推理和管理推理任务中超越主治医师水平 [15] - 中国医疗行业经过20年信息化建设积累高质量数据 为AI医疗发展奠定基础 [15] - AI医生更适合定位为替代基层全科医生 发挥跨学科多病种综合判断优势 [16] 应用场景展望 - AI可参与问诊、分析、分诊环节 实现常见病直接开方、急重症转诊和疑难病例辅助决策 [19][20] - 推动医疗数据系统性整合 形成"数据-模型-应用"反馈循环 美国Tempus AI已覆盖肿瘤学等多领域 [21] - 促进合理用药 基于用药指南和最新文献减少非必要处方 [22] - 间接影响保险支付模式 通过全周期健康管理降低医疗支出并为保险精算提供风险分层依据 [24] 挑战与监管 - 责任归属是待解难题 需明确AI作为独立决策者或辅助工具时的责任主体 [26] - FDA发布AI监管框架 采用基于风险情境的动态评估模式而非简单按任务类型划分风险 [26] - 湖南曾明确禁止使用人工智能自动生成处方 [25] - 技术实际成效受限于系统对接能力、监管框架和临床接受度 [24]
美国AI独角兽宣称停止服务中国公司,针对DeepSeek?
观察者网· 2025-09-05 16:26
公司动态 - Anthropic公司于9月5日宣布立即停止向中国控股公司提供服务 包括中国大陆公司及境外设立的中国背景子公司或实体[1] - 禁令同样针对俄罗斯和伊朗等被美国视为对手国家的实体 理由是出于美国国家安全的考量[1] - 公司联合创始人Dario Amodei曾表示不将中国DeepSeek视为对手 但反复强调美国应加强人工智能出口管制[4] 业务与财务 - Anthropic主要聚焦企业级客户 其年收入8.75亿美元绝大部分来自企业产品Claude Enterprise的销售[3] - 公司近期完成130亿美元新一轮融资 估值达到1830亿美元(约1.3万亿元人民币) 成为全球估值第四的独角兽企业[3] - 公司开发的Claude 4系列语言模型在编码能力上表现突出 获得金融和医疗保健等行业企业客户青睐[3] 行业竞争 - 中国AI公司DeepSeek R1模型在今年年初震惊硅谷 打破了美国在AI领域的技术垄断和市场主导地位[4] - 阿里巴巴和字节跳动等中国互联网大厂已加入人工智能军备竞赛 致力于开发能与美国OpenAI等公司抗衡的AI服务[3] - Anthropic停止向中国公司提供服务表明美国AI公司被赶超的危机感正不断增强[4] 政策环境 - 美国国会及多个政府部门已提出或实施相关限制措施 国防部 国会 海军 NASA及得州相继禁止在政府设备上使用DeepSeek[4] - 中国外交部发言人表示中方一贯反对将科技和经贸问题政治化 工具化 武器化[1] - 中方主张各方应共同推动人工智能开放 包容 普惠 向善 追求共享智能红利而非对抗竞争[4]
花一万元植入DeepSeek 一场没有终点的流量游戏
36氪· 2025-09-05 14:06
行业背景与兴起原因 - DeepSeek在2025年春节后爆火推动AI大模型在C端用户中破圈 成为企业流量焦虑下的新入口 [1][3] - 移动互联网红利见顶导致传统增长手段失效 Gartner预测2028年传统搜索引擎流量将下降50% [2] - GEO(生成式引擎优化)作为SEO的新形态 核心目的是通过影响AI生成答案实现品牌露出和流量获取 [1] 市场现状与竞争格局 - GEO服务商数量激增 估计达500-1000家 包含原SEO服务商和公关公司转型 [2] - 服务报价区间为数千元至十万元 按关键词/问题数量计费 行业出现日接数十单的繁忙现象 [2][5] - 同质化程度高 操作流程标准化 需投放40-50篇定制文章才能初见成效 [5] 技术原理与操作策略 - GEO通过AI联网搜索环节实现 模型在静态数据集不足时会抓取互联网最新信息 [6][7] - 需针对不同模型偏好定制内容:豆包偏向抖音生态内容 DeepSeek偏好官网和总结性文章 [8] - 内容需隐藏于高信息密度结构化文章中 如多品牌对比评测或种草长文 避免被识别为软文 [8] 效果局限性与行业痛点 - 模型黑箱特性导致效果难监测 受提问时间、用户画像、IP地址等多因素影响结果 [9][11] - 全球AI搜索流量占比不足5% 转化率微乎其微 效果难以量化评估 [11] - 模型算法变更会导致策略失效 需持续调整投放 类似"黑暗行船" [9] 平台治理与信息污染 - 2025年全球互联网AI生成内容占比超50% 股民交流平台和知识社区成信息污染重灾区 [15][16] - 平台采用权重调整、黑白名单规则治理 但GEO内容逻辑自洽使机器识别难度指数级上升 [19] - 部分灰产通过AI批量炮制虚假文章 如杜撰"某公司入股DeepSeek"等融资细节 [16] 行业演进与未来方向 - 硅谷GEO赛道受资本青睐 Profound获红杉3500万美元B轮融资 估值过亿美元 [21] - 海外技术路线偏向工具化 通过分析对话日志和逆向工程推测算法迭代方向 [22] - 长期需提升内容质量赢得AI信任 低质量AI生成内容在搜索平台表现显著差于人工内容 [22] 企业实践与成功案例 - 知名品牌如安克创新直接在商品页标注"DeepSeek推荐" 线下餐饮通过官网建设获增量流量 [1][24] - 企业需主动建设官网、披露权威媒体信息 否则竞品GEO可能导致测评中被比下去 [23] - 对从未线上投放的长尾品牌 GEO仍存在短期红利机会 [24]
花一万元植入DeepSeek,一场没有终点的流量游戏
36氪· 2025-09-05 13:07
GEO行业兴起背景 - DeepSeek在2025年春节后爆火出圈 带动大模型产品在C端用户破圈 引发企业和服务商流量焦虑 [1][5] - 移动互联网红利见顶 传统增长手段难以为继 Gartner预测2028年传统搜索引擎流量将下降50% [5] - 精明的中国商家迅速利用DeepSeek流量 出现"DeepSeek推荐"招牌的面馆和安克创新等品牌在商品页直接使用大模型推荐标签 [1] GEO服务市场现状 - 服务商数量激增 两个月内估计新增500-1000家 包括原SEO和公关公司转型 [3] - 报价区间在数千元到十万元 按关键词/问题数量计费 [6] - 操作流程标准化 需铺设40-50篇定制文章才能初见成效 [6] - 行业呈现"雷声大 雨点小"特征 全球AI搜索流量占比不足5% 转化率微乎其微 [18] 技术原理与操作策略 - GEO瞄准大模型联网搜索环节 通过投放AI偏好内容源博取收录概率 [8] - 不同AI模型有显著信源偏好:豆包偏向抖音生态 DeepSeek爱引用官网和总结性文章 Kimi优先教育价值内容 [9][10] - AI偏爱信息密度高的结构化内容 如横向对比评测 深度种草长文 带结构化表格和Q&A的文章 [11] - 需避免通篇只提自家品牌 应将内容嵌入长文中防止被识别为软文 [10] 行业挑战与局限性 - 大模型运行原理为黑箱 无数据接口 无法监测出现次数和用户问题类型 [14][15] - 效果受多重因素影响:提问时间 用户画像 对话上下文 IP地址改变 导致效果不稳定 [17] - 模型算法频繁变更 导致投放策略易失效 效果维持时间短 [15][17] - 无法量化效果 难以证明销量增长与GEO的直接关联 [18] 平台治理与反制措施 - 大模型厂商采用"规则+黑白名单"风控体系 辅以人工运营排查 [24][25] - 为权威媒体和机构提供蓝V标识 与专业机构合作生成答案 [25] - 调整内容权重 类似谷歌EAT规则 严重污染源将被停止采信 [24] - 信息污染严重 全球互联网AI生成内容比例超过50% [22] 海外发展模式对比 - 硅谷GEO赛道炙手可热 Profound获红杉3500万美元B轮融资 估值过亿美金 [30] - Profound采用工具导向模式 提供自研工具分析引用频率和点击率 通过抓取对话日志进行逆向工程 [32] - Perplexity已为合作内容添加"Sponsored"标签 ChatGPT和豆包尝试推送商品链接 [37] 未来发展趋势 - GEO更偏向品牌广告而非效果广告 对线上零基础的长尾品牌存在增量红利 [18][36] - 从业门槛提高 需理解模型偏好 团队招聘要求升至专科和本科 [33] - 企业需做好SEO基础建设 包括官网建设 产品说明线上化 定期向权威媒体披露信息 [33] - 平台商业化进程加速 灰色地带生存空间缩小 [37]