DeepSeek

搜索文档
中国 AI 投资人:练习时长两年半
Founder Park· 2025-05-06 20:05
大模型行业动态 - 中国大模型能力获得认可,行业进入新篇章 [2][5] - DeepSeek推动中国AI生态良性变化,改变科研评价标准 [33][34] - 大模型发展进入L2阶段,对L1产品形成降维打击 [38][39] - 模型公司融资趋缓,资金开始流向应用层 [52][56][58] Manus成功经验 - 实现全球化营销和海外融资突破 [13][14] - 通过PLG方式实现快速增长,吸引硅谷投资 [15] - 团队具备快速调整产品方向的能力 [16] - 真格基金连续投资四次,看重创始人战略定力 [17][18][20] DeepSeek行业影响 - 降低大模型使用成本,促进小模型发展 [36] - 普及推理能力,提供宝贵训练数据 [37] - 推动AI商业化,降低客户教育成本 [37] - 证明L2对L1产品的降维打击 [38] 创业投资策略 - 应用层投资逻辑回归产品、用户需求和商业模式 [55][59] - 垂直领域机会多于通用领域 [97][98][106] - 早期创业者应关注小而美的闭环验证 [94][95] - ARR指标争议大,更应关注用户行为质量 [93][96] AI硬件与玩具 - Plaud Note年收入7000万美元,缺乏竞争对手 [76][81][83] - AI玩具应避免过度依赖"可爱"属性 [127] - 玩具开口说话可能破坏想象空间 [130][136] - 创造独特IP和玩法比单纯智能化更重要 [137][138] 技术发展趋势 - 视频生成技术处于早期采用阶段 [70] - AI基础设施比云计算时代更复杂 [70] - 多模态模型变化快于语言模型 [63][64] - 工具链设计需要预留技术突破冗余度 [64][65]
外资LP正视“东升西落”
FOFWEEKLY· 2025-05-06 17:58
全球资本格局调整 - 全球经济呈现"东升西落"趋势,中国成为全球资本避风港新选择 [5] - 美国关税战引发国际抵制,美债收益率飙升至4.5%(10年期)和5%(30年期),美元资产信用风险凸显 [7][8] - 外国投资者持有美债比例从2014年50%降至2024年30%,中国持续减持美债 [8] 外资LP对中国市场的重新评估 - 中国科技企业如DeepSeek在AI领域突破,导致英伟达市值单日蒸发6000亿美元 [11] - 中国优质科技企业估值低于美国同行30%以上,形成技术-估值双重剪刀差 [11][12] - 2025年一季度多家欧美顶级LP恢复或启动对中国基金的新配置计划 [12] 外资LP在中国的本土化布局 - 施罗德资本已募集4支人民币基金,管理资产30亿元人民币 [9] - 沙特PIF与中国金融机构签署500亿美元合作协议,并在深圳设立10亿美元私募基金 [9][17] - 汉领资本、KKR等外资机构通过QFLP试点设立本地基金,如开泰银行设立15亿元QFLP基金 [16][17] 政策环境优化 - 《2025年稳外资行动方案》取消外商投资性公司境内贷款限制,优化并购规则 [12] - QFLP试点全国推广,超50个地区发布政策支持外资灵活参与股权投资 [13] - 路威凯腾首支人民币基金超额募资20亿元,显示外资GP对人民币市场的重视 [13] 外资LP投资策略进化 - 外资LP从观望转向系统布局,参与地方政府产业基金和科技园区项目 [17] - 沙特主权基金通过新能源、医疗健康等领域投资实现与中国产业升级深度融合 [17] - 外资GP加速募集人民币基金,如汉领资本2025年3月完成嘉兴基金备案 [16][17] 中国资本市场角色转变 - 中国从"世界工厂"转向"世界创新者",硬科技企业全球竞争力吸引外资 [20] - 人民币资产在全球配置中的权重参数被调高,成为三重红利(资产、创新、政策)交汇点 [14] - 东南亚、中东、欧洲长期资本频繁来华调研,形成"中国创新,全球市场"新范式 [9][20]
Think a Recession Is Coming? This AI Stock Can Still Thrive.
The Motley Fool· 2025-05-06 17:15
One of the core assumptions that underpins the artificial intelligence (AI) boom is that each new generation of AI model will require ever-increasing computational horsepower to train and run. DeepSeek, the Chinese AI company that managed to put out an AI model that performed well using a fraction of the computational resources of top-tier AI models, raised some serious questions about the future of the AI industry. There are some other signs, as well, that more computing power may not be the answer. OpenAI ...
国行版苹果AI渐近 阿里百度提供支持但分工不尽相同
快讯· 2025-05-06 16:34
据知名科技记者马克·古尔曼透露, 苹果AI有望在iOS 18.6系统中首次在中国大陆启用部分功能,背后 将由 阿里巴巴和 百度提供技术支持。具体而言,百度的文心一言大模型将作为国行版苹果AI的核心云 端智能引擎;阿里负责提供审查机制,以对AI生成内容进行本地合规审核。《科创板日报》此前报道 指出,苹果还与DeepSeek进行过洽谈,尽管双方最终没有达成合作,但未来苹果将会兼容更多国产大 模型进入到iPhone当中。 ...
AI时代下的数智链主:趋势与展望
搜狐财经· 2025-05-06 16:28
数智链主的全球竞争与行业重塑 - 智能化进程正在突破行业门槛,对传统链主企业形成毁灭性竞争,数智链主必须成为全球首个突破AI大规模实用化门槛的企业[5][6] - AI应用一旦突破行业性门槛(如图像识别车牌准确度达标),将快速颠覆行业模式(如全国停车场取消收费员)[6] - 电动车替代燃油车和纺织业"黑灯工厂"案例显示,智能化可能引发产业逆转移[8] 技术路线之争与链主生态 - AI发展存在霸权与平权两条路线:OpenAI代表的"AI霸权"追求单一通用AGI,DeepSeek代表的"AI平权"推动开源社区扩散[9] - 技术路线竞争呈现动态特征:每月/每周AI排行榜更新,霸权与平权相对存在(如局部行业小霸主)[10] - 数智链主需在场景化AI开发中承担领导角色,带领产业链智能化[9] 数智链主的三大核心责任 - 深度数字化:需进行流程精细数字化(如记录工人每个动作数据),而非表面数字化[12] - 用中学AI:从边缘到核心渐进应用AI,避免等待成熟导致落后[13] - 全链数智化:链主需主导供应链智能化,防止AGI巨头从外部颠覆行业(如烹调机器人威胁餐饮业)[14] 长期趋势与行业洗牌 - 全社会数智化是长期过程,AI发展历经多次潮起潮落(如图灵时代至今)[15] - 未来竞争聚焦两大方向:中美AGI主战场+行业垂类AI应用(中国被认为具产业优势)[15] - 行业龙头若未能转型数智链主,将面临类似互联网颠覆服务业的淘汰风险[15]
国产大模型密集发布,同类规模最大的科创综指ETF华夏(589000)近15天获得连续资金净流入
搜狐财经· 2025-05-06 14:56
科创板市场表现 - 上证科创板综合指数(000680)强势上涨1.67% [3] - 成分股精进电动(688280)上涨20.06%,九联科技(688609)上涨20.02%,*ST天微(688511)上涨19.97% [3] - 科创综指ETF华夏(589000)上涨1.49%,最新价报0.95元,盘中换手3.51%,成交1.38亿元 [3] - 科创综指ETF华夏近1周日均成交2.07亿元,排名可比基金第一 [3] - 科创综指ETF华夏近15天合计"吸金"30.27亿元,最新规模达38.70亿元,创成立以来新高 [3] 大语言模型动态 - 阿里发布新一代Qwen-3系列大语言模型,涵盖百亿参数到数十亿参数多个版本 [4] - 小米发布并开源首个专为推理任务设计的大语言模型XiaomiMiMo [4] - DeepSeek发布DeepSeek-Prover-V2-671B新模型和DeepSeek-Prover-V2-7B增强模型 [4] - 海通国际认为国产开源模型未来将面临同质化竞争,需通过定制化演进在垂直行业建立壁垒 [4] - 成熟的Agent被视为AI商业化的下个突破口 [4] 科创综指ETF华夏概况 - 科创综指ETF华夏紧密跟踪上证科创板综合指数,聚焦硬科技领域 [4] - 重点布局新一代信息技术、高端装备、生物医药、新能源、新材料及节能环保等战略性新兴产业 [4] - 场外联接包括华夏上证科创板综合ETF联接A(023719)和华夏上证科创板综合ETF联接C(023720) [4]
云计算沪港深ETF(517390)大涨超4%,位居ETF涨幅榜前三
新浪财经· 2025-05-06 14:47
指数表现 - 中证沪港深云计算产业指数(931470)上涨2.74%,成分股天源迪科(300047)上涨20.00%,华胜天成(600410)上涨10.01%,润和软件(300339)上涨9.01% [3] - 云计算沪港深ETF(517390)上涨4.16%,最新价报1.13元,近2周累计上涨3.15% [3] - 中证计算机主题指数(930651)上涨3.02%,成分股润和软件(300339)上涨8.91%,三六零(601360)上涨5.96%,金山办公(688111)上涨5.45% [8] - 计算机ETF(159998)上涨2.85%,最新价报0.9元,近1年累计上涨20.83% [8] 流动性及规模 - 云计算沪港深ETF盘中换手4.66%,成交1382.15万元,近1月日均成交994.03万元 [3] - 计算机ETF盘中换手1.83%,成交5464.60万元,近1周日均成交5516.59万元 [8] - 计算机ETF最新规模达29.55亿元,创近1月新高,最新份额达33.75亿份,创近1年新高 [8] - 计算机ETF近7天合计资金净流入2.06亿元,最高单日净流入9666.06万元 [8] 收益能力 - 云计算沪港深ETF近3年净值上涨56.99%,指数股票型基金排名12/1742,居于前0.69% [4] - 云计算沪港深ETF自成立以来最高单月回报33.39%,最长连涨月数6个月,最长连涨涨幅66.14%,上涨月份平均收益率9.82% [4] - 云计算沪港深ETF年盈利百分比66.67%,历史持有3年盈利概率80.85% [4] - 云计算沪港深ETF近3个月超越基准年化收益0.97%,排名可比基金1/2 [4] 风险与跟踪 - 云计算沪港深ETF近1年夏普比率1.16,排名可比基金1/2 [4] - 云计算沪港深ETF今年以来相对基准回撤0.39%,在可比基金中回撤最小 [4] - 云计算沪港深ETF管理费率0.50%,托管费率0.10%,费率在可比基金中最低 [4] - 云计算沪港深ETF近2年跟踪误差0.051%,在可比基金中跟踪精度最高 [4] 估值水平 - 中证沪港深云计算产业指数最新市盈率(PE-TTM)22.95倍,处于近1年13.38%分位,估值低于近1年86.62%以上的时间 [5] 行业动态 - 阿里通义千问发布Qwen3系列开源大模型,旗舰版Qwen3-235B-A22B在代码、数学、通用能力等基准测试中超越DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型 [9] - 小米开源首个参数规模7B的推理大模型XiaomiMiMo,在数学推理和代码竞赛测评表现超越o1-mini和QwQ-32B-Preview [9] - DeepSeek发布Prover-V2模型,参数量达6710亿 [9] - 开源证券表示国产大模型能力快速跃进为AI应用生态繁荣奠定坚实技术底座 [9] - 海通国际认为开源模型未来将通过定制化演进在垂直行业中建立长期壁垒与用户黏性 [9] 相关产品 - 云计算沪港深ETF(517390)紧密跟踪中证沪港深云计算产业指数,选取50只业务涉及提供云计算服务以及为云计算提供硬件设备的上市公司证券 [10] - 计算机ETF(159998)跟踪中证计算机主题指数,选取涉及信息技术服务、应用软件、系统软件、电脑硬件等业务的上市公司证券 [10]
AI智能体,是不是可以慢一点? | ToB产业观察
钛媒体APP· 2025-05-06 13:42
大模型应用套壳争议 - Manus采用第三方大模型进行工程化包装实现通用AI智能体能力 被业内质疑为"极致套壳" 但创始团队认为这是成功策略 [2] - 行业普遍以自研基础大模型为荣 DeepSeek OpenAI等头部企业聚焦底层技术研发 形成赢者通吃格局 [2] - 金沙江创投朱啸虎直言"所有AI应用都是套壳应用 所谓壁垒是忽悠人的" 反映行业对应用层技术价值的争议 [2] 市场融资与估值动态 - Manus背后公司"蝴蝶效应"获Benchmark领投7500万美元融资 估值飙升至5亿美元 [2] - 融资事件显示资本市场对AI智能体赛道的认可 尽管存在技术争议 [2] 大厂AI智能体布局 - 字节组建至少5个团队开发不同AI智能体产品 推出"扣子空间"协作平台 提供股票分析和行研分析两类专业Agent [4] - 百度95后团队30天研发对标Manus的"心响"APP 涵盖超200个任务类型 包括专业咨询和日常规划 [4] - 阿里与Manus战略合作 基于通义千问开源模型实现功能复制 并推出"心流"智能体开启公测 [5] 技术生态构建 - 阿里云 腾讯云 蚂蚁集团 百度等大厂相继拥抱MCP机制 推动智能体间通信和资源连接 [6] - 民生证券预测MCP协议+Agentic-based决策路径将成为主流范式 大厂通过协议引入生态伙伴推动产业发展 [6] 安全风险与治理挑战 - AI智能体自主决策特性带来更高安全风险 包括幻觉问题 提示注入攻击 数据泄露等隐患 [7] - 多智能体协作导致访问控制漏洞 资源竞争冲突等问题 安全管理复杂度指数级上升 [8] - 70%以上企业客户对AI智能体认知不足 行业缺乏专职安全团队 产品安全性能存疑 [7][8] 技术本质与发展趋势 - AI智能体需解决感知 理解 规划 执行等多环节协同 技术架构复杂度远超传统系统 [11] - 微软预测未来将出现专业智能体集群 通过通信协作完成任务 Anthropic和谷歌分别推出MCP A2A协议提升搭建效率 [10] - 行业需从被动执行转向主动进化 如自动驾驶系统对传统技术模块的AI化改造 [11]
从“管控”到“赋能” ,杭州政府撬动科技进步的5点举措
36氪· 2025-05-06 12:04
杭州数字治理模式 - 杭州以"数字时代治理实验室"姿态重构政企关系,形成"无事不扰,有事必应"的治理范式,本质是对政府职能的哲学重构 [1] - DeepSeek在算法架构优化、异构计算加速、数据要素治理三大领域突破,其成长与杭州"政策-技术-资本"协同创新体系深度共振 [1] - 杭州政策工具箱持续迭代,从"瞪羚计划"到"鲲鹏行动",千亿级算力基建专项和MaaS创新工坊推动AI产业形成"标杆引领-集群崛起-生态繁荣"循环 [1] 政府转型动因 - 传统管制型政府存在审批流程冗长(数周至数月)、部门信息孤岛导致重复提交材料等问题,抑制创新活力 [2] - 2000年代初杭州内部调研显示:若不改革,5年内将流失30%高科技项目,危机感驱动转型 [4] - 城市定位为"创新之城、活力之城"及宋代延续的重商文化("市井繁华、商贾云集")为转型提供目标牵引与文化支撑 [4] 服务型政府实践 - "无事不扰"通过清单管理(195项权力清单)、分类监管(信用分级)、负面清单(企业自主定价/人事)三大机制落实,2024年杭州企业总数突破100万户 [9] - "有事必应"依托企业服务热线、行业专员制度及"一站式"服务,西湖区"西小服"AI助手实现政策自动匹配与诉求闭环处理 [7][9] - "一照通办"整合251项企业事项,凭营业执照即可办理,证照通过数据共享核验无需重复提交 [12] 数字经济发展 - 杭州设定2025年量化目标:开放算力规模达5000PFLOPS以上、培育1个国际先进通用大模型 [16] - 构建"多元异构"智能计算平台,支持头部企业攻关多模态大模型、中小企业研发垂直领域专用模型 [17] - "亲清在线"平台实现政策智慧推送,2017年"最多跑一次"改革群众满意率达94.7%,87.9%事项实现"跑一次" [14][20] 制度创新成效 - 流程再造实施"一窗受理、集成服务",2018-2020年全国网上政务服务能力评估稳居前二 [19][20] - 推行告知承诺制,非关键前置条件允许企业承诺后先行开展活动,加速项目进度 [20] - 区块链技术确保数据真实性,电子证照复用减少纸质材料提交,营商环境持续优化 [20]
AI Agent:模型迭代方向?
2025-05-06 10:28
纪要涉及的行业和公司 - **行业**:AI行业 - **公司**:微软、OpenAI、Anthropic、Deepseek、Kimi、Meta 纪要提到的核心观点和论据 AI商业化进展 - **观点**:AI商业化进展整体慢于预期,ToB端更慢,ToC端OpenAI产品仍以chatbot为主 [1][3] - **论据**:微软Copilot未达2023年3月披露时预期效果,OpenAI产品未进入agent阶段 大模型迭代趋势 - **观点**:过去三年全球大模型能力通过前训练和后训练提升,近三个季度后训练成主要迭代方式,推理模型能力显著提高 [2] - **论据**:思维链数据使agent执行复杂任务时可利用过程数据提升推理能力,大模型厂商迭代模型,无迭代能力公司用工程化方式完善产品 agent面临的问题及解决方法 - **观点**:agent执行复杂任务准确率受大模型能力限制,可通过工程化方法和后训练技术提高准确率 [1][5][9] - **论据**:工程化方法如将任务拆分由多个Agent执行;后训练技术如思维链技术可提高模型推理能力 各公司在agent研究方面进展 - **观点**:Anthropic在agent产品化和模型能力方面比OpenAI更具优势 [1][6] - **论据**:Anthropic技术积累更超前,ComputeUse系统运行时间早于OpenAI相应产品至少一个季度 大型科技公司推动大模型发展方式 - **观点**:大型科技公司通过技术研发和工程化手段推动大模型发展 [1][7] - **论据**:Deepseek、OpenAI和Anthropic专注技术研发,其他公司采用工程化手段完善产品 Chatbot和Agent对模型幻觉容忍度差异 - **观点**:Chatbot对模型幻觉容忍度高,Agent需每步操作准确无误,提升执行准确率是当前模型重要问题 [1][8] - **论据**:Chatbot一问一答,个别回答错误不影响后续;Agent执行多步任务,每步正确率90%最终任务也可能失败 DeepSeek发展情况 - **观点**:DeepSeek在2024年推出系列新型多模态模型,提升整体性能与应用范围 [4][12] - **论据**:发布GPT系列多个版本,Prover系列不同版本陆续推出 Prover V2相关情况 - **观点**:Prover V2为解决agent产品化问题提供新思路,性能有显著提升 [1][5][20] - **论据**:核心作者公开信息并提供论文;参数量达6,711亿,采用混合专家模型等改进使其能解决更复杂任务 推理能力提升挑战与方法 - **观点**:推理能力提升依赖算法设计,各公司缺乏统一路径,Deepseek通过两阶段训练提升下一代模型推理能力 [30][32] - **论据**:成功设计奖励函数和强化学习算法可提高推理效果;第一阶段用专家模型迭代,第二阶段优化数据集和架构 Agent AI商业化与算力需求 - **观点**:Agent AI商业化需全面分析,算力需求对Agent发展有重要影响 [37][38] - **论据**:市场可能低估关键算力需求,识别后将推动Agent发展,大厂改造推荐引擎已显示算力提升重要性 其他重要但可能被忽略的内容 - **Kimi情况**:Kimi发布72B预训练版本,能力较强,产品质量优于初期,团队技术实力较强 [24] - **测试集特点**:Putnam Benchmark测试集侧重分解解决问题能力;Deepseek Prover Bench不仅测试数学问题,还对比非形式化与形式化推理,在Deepseek V3版本展示非正式推理优势 [25][26] - **Lean四版本作用**:Lean四版本作为Deepseek Prover V2形式化证明标准,确保验证过程严谨准确 [27] - **DeepSigmaMath模型应用**:V1和V1.5版本参数量约7B,采用监督学习,转向强化学习和树搜索增强探索能力;V2版本参数量提升至7,000亿,采用混合专家模型架构,提高Prover能力 [28] - **基座模型挑战**:数据集和架构优化无市场共识,增加参数量是否为未来迭代主要方式存在分歧 [31] - **DeepSeek模型迭代路径**:从2024年2月DeepSeek模型开始,经Prover 1.0、V1.5、DeepSeek V3等版本,最终蒸馏出7B参数小型高性价比模型,未来可能演化出R2或V4 [34][35]