DeepSeek

搜索文档
杭州市创业投资协会周恺秉:杭州科创崛起离不开两个“微小但重要”的变量
21世纪经济报道· 2025-05-16 21:02
杭州创业投资体系演进 - 周恺秉长期参与杭州科技创新体系建设,自20世纪90年代起持续呼吁加大科技投入,2011年关注创业投资项目退出机制,2015年建议构建"硅谷式"创业生态系统 [1] - 杭州创新公式包含三大核心变量:冒险宽容的文化、市场经济体制机制、活跃的创投资本,同时涉及创业生态、营商环境等多元因素 [3][4] - 杭州"六小龙"企业涌现印证城市包容度与文化交融的关键作用,44家浙江省独角兽企业中杭州占80%(55家中的44家) [5][11] 城市特质与创业生态 - 杭州社会包容度体现在市民交往无地域歧视、普通话普及、倡导"创业失败亦英雄"理念,推动浙商群体从借贷文化转向投资文化 [6] - 地理区位促成南北文化融合:承接江苏山东的稳健与绍兴温州的冒险,形成兼具科学理性与冒险精神的独特创业气质 [6][7] - 第一代企业家以本地人为主(马云、宗庆后等),而"六小龙"创始人中省外籍占比达67%(4/6),反映城市吸引力 [6] 资本生态建设实践 - 政府引导基金2008年率先探索,培育普华资本、华睿投资等本土机构,管理规模从数千万扩展至数百亿元 [8][10] - 创投机构呈现差异化格局:本土天使投资人专注早期(如李治国),红杉高瓴等头部机构布局成长期项目,形成互补 [8][9] - 杭高投通过支持"小而美"基金(规模1-5亿元)培育早期生态,每年全省50%投融资案例(约500个)来自杭州企业 [10][11] 科技金融协同发展 - 杭州银行体系突破传统间接融资模式,成为全国科技金融创新高地,各大银行积极布局科技金融业务 [10] - 创业投资与科技金融共同构成企业支持网络,该模式具备全国推广价值 [10]
安联投资:当下或许是把握收益基金稳健潜力的好时机
智通财经· 2025-05-16 16:17
收益基金概述 - 收益基金聚焦于能产生稳定回报的资产,如派息股、特定类型债券,也可能涵盖商品及其他另类资产 [1] - 这类基金旨在为投资者提供定期收益,因而以纪律化方式管理,投资风格更为审慎稳健 [1] - 许多收益基金分散投资于多个资产类别,以缓冲波动和不明朗市场环境带来的影响 [1] 收益基金的好处 - 收益基金可通过提供定期收益支持投资者的生活方式,也可作为有用工具,帮助投资者满足日常需求,同时应对波动的市场环境 [2] - 在当前股价波动、利率"长期高企"及美国政策难以预测的环境下,这类基金或许比以往任何时候都更具吸引力 [6] 收益基金的投资策略 - 可能配置债券,尤其是利率风险相对较低的债券,如短存续期债券及浮动利率票据 [3] - 债券收益率较近年水平大幅上升,这不仅意味着更佳的潜在回报,也为可能上升的利率提供缓冲 [3] - 投资股票时,收益基金往往聚焦股息理想的公司,这类公司通常规模庞大、业绩稳定且股价波动较小,例如可口可乐和宝洁 [3] - 部分基金(如多元资产基金)会投资于一系列与股股价相关性较低的资产类别,可能包括私募股权、私募信贷等另类资产,或石油、黄金等商品 [3] 当前市场环境下的收益基金吸引力 - 在关税和贸易战威胁全球经济走势、大量资本涌入快速发展但难以预测的科技行业的背景下,收益基金的审慎稳健特征颇具吸引力 [4] - 浮息票据等其他固定收益工具受影响可能较小——其票息会根据短期利率定期调整 [4] - 收益基金可能会配置这类债券及其他债券,如短存续期高收益债券或可转换债券 [4] 多元化的重要性 - 未来几年,股票和债券的合理平衡对财富保护和累积至关重要 [5] - 在主动管理的多元资产收益基金中,基金经理可根据市场情况调整股债配比,以管理风险并提供较稳定的回报 [5] 收益基金的适用性 - 对于偏好较稳定回报、不受价格大幅波动影响,或需要资金维持现有生活方式的投资者来说,收益基金是不错的选择 [6] - 对于回报预期进取或投资期限较长的投资者,倾向投资增长型股票等风险资产的基金可能更合适 [6]
疆亘资本总裁胡仲江:GP从“财务出资人”升级为“生态建筑师”
搜狐财经· 2025-05-16 14:41
DeepSeek的崛起与AI产业变革 - DeepSeek通过70亿级模型实现千亿模型效能,将企业部署成本压缩90%,颠覆传统大模型的算力竞赛逻辑[4] - 技术上将大模型精华浓缩到小模型,产品上做成即插即用的"智能U盘",生态上通过开放基础版吸引开发者再销售定制升级版[4] - 在金融、政务领域推出"合规私有化AGI"方案,如政务部门可用本地服务器训练处理敏感数据的AI助手,银行可快速替代耗时数年的风控流程[4] 中国AI产业现状与投资方向 - 应用层面能用更少数据做出更接地气成果,但核心技术仍受制于国外基础架构,如国产芯片处理复杂AI任务稍显吃力[5] - 投资转向能让AI扎根产业的领域,如电力行业AI调度系统让新能源利用率达95%,中科院实验室AI化学家指挥机械臂完成危险实验[5] - 未来胜负手在于用"手术刀式"垂直智能体在国产化技术栈重建护城河,让AI完成从数字革命到实体重塑的跨越[5] 地方政府与GP合作模式变革 - DeepSeek改变地方政府对"核心竞争力"理解,从税收优惠转向"数据主权"争夺,如浙江、山东整合政务数据形成AI训练资产包[6] - GP角色从"财务出资人"升级为"生态建筑师",需具备数据分析能力帮助政府量化数据价值并设计合规使用框架[6] - 新型合作机制基于价值共创和风险共担,通过对赌协议等方式形成利益共同体,探索数据驱动新商业模式[6][7] 文化自信回归与投资机会 - 传统文化符号以游戏、影视、消费品为载体进入大众生活,文化作为独立生产要素参与价值创造[7] - 文化估值体系重构,IP价值取决于"文化渗透率"而非短期曝光量,需能持续衍生生活方式解决方案[8] - 技术赋能范式转移,AI与区块链成为文化资产化基础设施,破解传统技艺规模化难题并为文化确权[8] 2025年中国一级市场预测 - 投资方向深度转变,专业基金比跟风机构更具优势,企业估值两极分化,缺乏核心技术公司市值可能腰斩[10] - 退出路径重新洗牌,传统上市方式不再可靠,更多转向产业并购,倒逼投资人提前布局产业链关键环节[10] - 国际环境影响显著,国产替代成生死线,最大机会在避开正面交锋的"曲线创新"领域如中国主导物联网标准[10]
R2来之前,DeepSeek又放了个烟雾弹
虎嗅APP· 2025-05-15 21:03
DeepSeek V3技术突破 - 核心观点:通过"软硬一体"协同设计实现极致降本增效,仅使用2048块英伟达H800 GPU即达到行业领先水平 [2] - 关键技术1:采用"多头隐注意力机制"(MLA)压缩KV Cache,显著降低长文本处理的显存占用 [2] - 关键技术2:优化混合专家模型(MoE)架构,通过动态激活专家提升运算效率并控制有效规模 [3] - 关键技术3:引入FP8混合精度训练,在非敏感环节降低计算量和内存占用,速度提升30%且不影响最终性能 [3] - 关键技术4:设计多平面网络拓扑结构,优化GPU集群数据传输路径减少通信瓶颈 [4] DeepSeek Prover V2进展 - 参数规模从7B跃升至671B,实现数量级突破 [5] - 聚焦数学等科学发现领域,挑战人类智力极限的高壁垒场景 [5] 行业竞争格局 - 头部厂商在参数规模、多模态、应用生态展开全方位竞争,技术迭代加速 [6] - 算力成本攀升和商业化路径模糊成为行业普遍挑战 [6] - 未来竞争关键将转向资源利用效率和垂直场景深度挖掘 [6][7] 公司战略定位 - 通过工程优化实现"非顶级硬件配置下的领先性能",为行业提供可行性路径 [4] - 技术路线强调成本效益与特定高价值场景的结合,区别于单纯追求规模扩张 [6][7] - 系列动作预示R2模型将带来性能突破和行业新思路 [7]
梁文锋参与发表回顾性论文:DeepSeek首次揭秘V3模型背后扩展方案
快讯· 2025-05-15 18:57
DeepSeek刚刚发表了一篇名为《深入解读 DeepSeek-V3:AI 架构的扩展挑战与硬件思考》(Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures)的回顾性论文,梁 文锋也是作者之一。这篇论文深入剖析了最新的大模型DeepSeek-V3及其AI基础设施扩展方案, DeepSeek-V3的实践充分证明了硬件-软件协同设计在提升AI系统可扩展性、效率和鲁棒性方面的巨大潜 力。(AI寒武纪) ...
R2来之前,DeepSeek又放了个烟雾弹
虎嗅· 2025-05-15 18:52
DeepSeek V3技术突破 - 公司通过"软硬一体"协同设计实现极致降本,仅使用2048块英伟达H800 GPU即完成模型训练 [2] - 采用"多头隐注意力机制"(MLA)压缩KV Cache显存占用,显著提升长文本和多轮对话处理能力 [2] - 优化混合专家模型(MoE)架构,通过动态激活相关专家提升运算效率并控制资源消耗 [3] - 引入FP8混合精度训练,在保持模型性能同时降低50%计算量和内存占用 [3] - 设计多平面网络拓扑结构优化GPU集群数据传输效率,减少训练瓶颈 [4] DeepSeek Prover V2进展 - 参数规模从7B跃升至671B,实现数量级突破 [5] - 聚焦数学等科学发现领域,展现AI解决高复杂度问题的潜力 [5] 行业竞争态势 - 头部厂商在参数规模、多模态和应用生态展开全方位竞争 [6] - 算力成本攀升和商业化路径模糊成为行业普遍挑战 [6] - 公司技术路线显示效率优化与垂直场景深耕将成为竞争关键变量 [6] 公司战略定位 - 通过工程优化实现非顶级硬件条件下的行业领先性能 [4] - 技术路径为中小玩家提供算力约束下的可行性方案 [4] - 系列动作预示将推出突破性R2模型并带来行业新思路 [7]
首次披露!DeepSeek V3 发布软硬一体协同训练论文,公开「降成本」秘诀
雷峰网· 2025-05-15 18:13
DeepSeek-V3 成本效益与架构创新 - 核心观点:通过软硬件协同设计实现大型模型的高效训练与推理,仅需2048个NVIDIA H800 GPU即达到最先进性能 [4] - 采用DeepSeek-MoE与多头潜在注意力(MLA)架构,FP8混合精度训练使内存消耗降低50% [7][8] - MLA通过压缩KV缓存至潜在向量减少内存占用,共享KV、滑动窗口缓存等技术进一步优化存储 [10][11][12] 低精度与计算优化 - 首创FP8训练框架,通信量较BF16减少50%,提出硬件改进建议如提升累加精度至FP32 [16][17][18] - MoE架构使计算成本降至250 GFLOPS/令牌,显著低于密集模型的2448 GFLOPS [13] - 多标记预测(MTP)框架提升推理速度1.8倍,令牌接受率达80%-90% [14] 互联驱动设计 - 针对H800 NVLink带宽限制(400GB/s),采用8张400G Infiniband网卡增强扩展能力 [20][23] - 节点内NVLink(160GB/s)与节点间IB(40GB/s)带宽差异促生节点受限路由策略,减少跨节点流量 [24][26][27] - 提出未来硬件需统一网络适配器、专用通信协处理器以优化资源利用 [29][30] 大规模网络架构 - 部署八平面胖树网络(MPFT),支持16384 GPU理论规模,成本较三层胖树降低41% [32][34][40] - MPFT实现流量隔离与低延迟,专家并行带宽超40GB/s,训练效率与单平面网络持平 [37][44][47] - InfiniBand延迟(2.8μs)优于RoCE(3.6μs),但建议RoCE优化如自适应路由与拥塞控制 [50][51][53] 未来硬件方向 - 需解决互联故障、静默数据损坏等问题,建议校验和验证与诊断工具预装 [59][60][61] - 提出CPU-GPU直连、共封装光学、动态带宽分配等创新方向 [61][64][66] - 内存架构推荐DRAM堆叠加速器与晶圆级集成技术以突破带宽瓶颈 [72]
ICML 2025 | 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题
机器之心· 2025-05-15 14:04
核心观点 - 提出新型深度思考范式PENCIL,通过交替执行「生成-擦除」机制显著提升大模型复杂推理能力 [1][3] - PENCIL在理论上实现图灵完备性,能以最优空间O(S)和时间O(T)复杂度解决所有可计算问题,传统CoT需O(T)空间导致指数爆炸 [23][24] - 实验显示PENCIL在3-SAT、QBF等NP完全问题上准确率保持≥99%,Einstein's Puzzle任务中25M小模型准确率达97%远超CoT的25% [15][21][22] 交替生成-擦除范式 - 动态擦除机制:引入[CALL][SEP][RETURN]特殊标记,按规则丢弃无用中间结果,上下文长度从数万token压缩至千级 [5][8][9] - 支持递归结构:擦除后的上下文可包含其他特殊标记,实现类似函数调用的多层嵌套 [9] - 三大应用模式:任务分解(子问题处理)、搜索回溯(无效路径清理)、摘要总结(冗长思考压缩) [13] 性能优势 - **准确率**:在n=10的SAT任务中PENCIL准确率99% vs CoT 50%,QBF任务100% vs 73% [15][16] - **计算效率**:相同FLOPs下PENCIL训练收敛速度更快,上下文长度控制在问题规模n的线性增长(O(n))而非CoT的指数级(O(exp(n))) [12][17] - **资源节省**:KV缓存复用机制使自注意力计算量减少,25M参数模型在Einstein's Puzzle上准确率提升3.88倍 [21][22] 理论突破 - 空间最优性:将图灵机模拟的上下文长度从O(T)降至O(S),尤其适合S<<T的NP完全问题(如旅行商问题) [24][25] - 实现路径:通过FASP编程语言构造「思考-总结」循环,证明固定大小Transformer可达成最优复杂度 [28] - 本质差异:传统CoT需保留完整计算历史,PENCIL通过状态摘要实现内存回收 [27]
华尔街见闻早餐FM-Radio | 2025年5月15日
华尔街见闻· 2025-05-15 07:20
市场概述 - 美股涨势疲态显现 标普惊险三连阳 道指两连跌 科技股表现强劲 英伟达涨近4% 特斯拉 AMD收涨超4% 超微电脑涨近16% [2] - 中概指数反弹超1% 腾讯财报后涨超3% 京东回落逾4% [2] - 美债收益率创一个月新高 美元两连跌后V形反弹 离岸人民币盘中跌超200点失守7.21 [2] - 原油跌落三周高位盘中跌超1% 黄金回落至一个月低位盘中跌超2% [2] - A股集体收涨 沪指重返3400点 恒科指涨超2% 国债普跌 [2] 中国宏观经济 - 4月社融增量1.16万亿元 新增人民币贷款2800亿元 M2-M1剪刀差扩大 前四个月人民币存款增加12.55万亿元 [3][9] - 七部门设立"国家创业投资引导基金" 引导资本投早投小投长期投硬科技 推动科技创新公司债券发展 [3][9] - 对美关税调整 125%→10% 24%税率暂停90天 美国撤销加征91%关税 下调小额包裹关税 [14] - 4月企业新发放贷款利率处于历史低位 部分银行消费贷款利率低于保本点 [15] 科技与互联网 - 腾讯Q1营收同比增13%达1800亿元 王者荣耀流水创新高 AI对广告游戏云业务产生实质性贡献 GPU储备充足 [3][11][12] - 鸿海Q1销售额同比增24% 净利润421亿新台币超预期 受益于关税前囤货潮及AI服务器需求 [11] - Poe报告显示DeepSeek使用率下降50% OpenAI因GPT-4o暴涨 快手Kling占据文生视频21%份额 [11] - 阿里巴巴被称中国最佳AI赋能者 动态PE仅12倍 摩根士丹利预计阿里云收入增速2026财年加速至25% [17] 新能源与高端制造 - 宁德时代赴港IPO获机构超额认购30倍 募资额或达410亿港元 成2021年后香港最大IPO [16] - 多晶硅龙头企业计划成立700亿元基金 整合过剩产能 目标将价格从3.6万元/吨提至4.5-6万元/吨 [18] - 中国企业发射12颗太空计算卫星 组成全球首个太空计算星座 节约数据中心能源成本 [17] 海外市场与公司 - 波音获卡塔尔航空210架飞机订单 总价值960亿美元 创史上最大单 波音股价涨超3%创15个月新高 [10] - 超微电脑与沙特DataVolt签200亿美元AI协议 股价盘中涨约20% [21] - 桥水Q1大买黄金ETF超3亿美元 新进京东超1亿美元 增持阿里百度 减持谷歌英伟达Meta [21] 行业趋势 - 传感器行业受益于人形机器人发展 力矩传感器存在高壁垒 国内厂商市场空间扩大 [22] - 船舶行业供需缺口明显 手持订单覆盖率3.8年 头部船厂排产至2028年后 利润迎向上拐点 [23] - 有色金属价格强势 特朗普关税政策推升通胀预期 金价中枢抬升 铜铝持续去库 [23] - 外骨骼机器人应用拓展至消费级 传感系统 控制系统 驱动系统为核心 [23] 资本市场动态 - 价值投资巨头Baillie Gifford看好字节跳动 预计有五倍回报率 警惕"填鸭式投资"危害 [16] - 小米短期订单量下降引担忧 德银指21万台电动车积压显示需求强劲 四大催化剂或推动股价反弹 [17] - 小马智行传闻赴港二次上市 创始人锁定期延长540天 股价盘前飙涨16%后收跌超4% [18]
机构密集调研50多家人形机器人产业链公司
中国证券报· 2025-05-15 05:31
机构调研人形机器人产业链 - 二季度以来390家机构调研中控技术 公司投资浙江人形机器人创新中心并发布"领航者1号"和"领航者2号NAVIAI"整机 第三代将接入DeepSeek多模态模型Janus Pro 计划在石化企业高风险场景落地应用 [1] - 208家机构调研蓝思科技 公司自2016年布局智能机器人领域 工业机器人已应用于产线 正拓展人形机器人核心部件研发 [2] - 160家机构调研富临精工 公司加快布局机器人电关节模组及零部件 智能电关节产品已小批量生产并适配主流客户 [2][3] - 37家机构调研领益智造 公司掌握伺服电机/减速器等执行层技术 已提供头部/灵巧手/四肢总成等核心硬件 [3] 商业化进展与技术突破 - 中控技术人形机器人将实现自然环境感知与人机交互 石化实验室场景成为首批落地应用方向 [1] - 领益智造具备联合开发与整机组装经验 提供从结构件到高功率充电/散热的全栈解决方案 [3] - 创世纪升级钻铣/五轴加工中心等设备 定制化产品满足关节/骨架等精密加工需求 相关收入快速增长 [4] - 安培龙完成MEMS力传感器开发 已向多家机器人客户送样 [4] 行业趋势与公司布局 - 华为/特斯拉等企业加速具身智能布局 行业确定性趋势为工业场景应用 [3] - 蓝思科技结合AI眼镜/XR头显等新领域 深化产业链合作推动场景协同 [2] - 富临精工预研智能电关节 技术人员储备与研发投入已完成前期准备 [3] - 上市公司普遍通过技术升级(创世纪)或硬件创新(安培龙)切入人形机器人赛道 [4]