Workflow
DeepSeek
icon
搜索文档
国泰海通|产业:论AI生态开源:以Red Hat为例研判Deep Seek开源大模型的商业战略
开源大模型战略 - DeepSeek 采取对标 GPT4o 性能的开源策略,公布模型架构、训练方法等核心技术,采用 MIT 协议支持免费商用与二次开发,推动行业技术升级和 AI 应用场景扩展 [1] - 开源模式展现出强外部性,成为全球 AI 产业发展的重要方向,但商业化变现仍是产业关注重点 [1] - 开源软件产业的成熟经验可为开源大模型商业模式提供参考 [1] 开源商业化借鉴 - DeepSeek 与 Red Hat 在开源战略上具有跨时代共性,均坚持技术开源推动行业发展,并初创于技术变革早期市场 [2] - Red Hat 通过企业级服务订阅模式实现开源商业闭环,其思路可迁移至 DeepSeek 的商业变现中 [2] - 开源透明性、灵活性和高性价比有助于迅速打开市场并获取客户心智 [2] 生态壁垒构建 - DeepSeek-R1 发布 20 天即吸引超过 160 家企业接入,形成多领域合作的 AI 生态圈 [3] - 开源模式降低技术门槛和成本,加速技术普惠,打开中小企业及政府国企私有化市场 [3] - 企业部署产生的海量数据与场景反馈反哺模型优化,同时提高客户迁移成本,筑牢生态壁垒 [3] 商业落地闭环 - 中后期可采用"API 调用基础收入 + 企业级服务订阅增值收入"模式 [4] - 基础收入通过规模化 API 调用摊薄硬件成本,增值收入针对企业工程化部署需求提供订阅服务 [4] - 国内大模型落地服务生态尚不成熟,DeepSeek 可将复杂工程问题转化为标准化服务模块 [4]
产学界大咖共议人工智能:通用人工智能将在15至20年后实现
北京日报客户端· 2025-05-18 19:28
通用人工智能发展前景 - 具备泛化能力与通识能力的通用人工智能有望在15至20年后出现 [1] - 通用人工智能需具备与人类相当或更高水平的综合智能 能自主感知环境 学习新技能 跨领域解决问题并遵循人类伦理 [1] - 2024-2025年AI进展进入快车道 具身智能呈现百花齐放态势 [1] 通用人工智能实现路径 - 实现通用人工智能需突破信息智能 物理智能和生物智能三大难点 [3] - 信息智能(语言 文字 语音 视频)需4-5年达人类水平 5年左右达通用AGI标准 [3] - 物理智能(无人驾驶 机器人等)需至少10年实现 [3] - 生物智能(脑机接口等)需15-20年实现 需多学科领域突破 [3] - 三种智能将并行发展 相辅相成 [3] 人工智能大模型发展 - 2025年AI发展呈现多模态和GDP相关行业应用两大特点 [4] - 中国在推动AI落地方面具有显著优势 [4] - 大模型生命周期包括数据获取 预处理 模型训练 微调和推理五个环节 [5] - 前三个环节需大量算力和存储资源 通常由顶尖科技公司完成 [5] - 一般单位只需基于已有基础模型进行领域适配的微调和推理应用 [5] 人机关系与机器人发展 - AI智商水平可能已超过人类 但仍是人类认知与能力的延伸 [5] - 人类直觉具有不可替代性 [5] - 人形机器人发展关键是创造实际价值 [5] - 人形机器人走向成熟需较长周期 当前行业处于探索阶段 [5]
2025搜狐科技年度论坛在京举办
中证网· 2025-05-18 17:25
基础科学突破与技术革命产业化应用 - 2024年以来AI发展进入快车道,具身智能呈现百花齐放态势,科技进步带来惊喜的同时也带来挑战 [1] - AI让信息获取异常简单,但需警惕信息真实性问题 [1] - 2025年AI发展呈现多模态特点,并与GDP密切相关的行业深度结合 [1] - 中国在推动AI落地方面具有显著优势 [1] 人工智能大模型基础设施 - 人工智能大模型生命周期包括数据获取、预处理、模型训练、微调和推理五个环节 [1] - 前三个环节(数据获取、预处理、模型训练)需大量算力和存储资源,主要由阿里、华为、DeepSeek等大型科技公司完成 [1] - 一般单位只需基于已有基础模型进行领域适配的微调和后续推理应用 [1] 机器智能认知能力与人形机器人发展 - AI并非人类替代者,而是人类认知与能力的延伸 [2] - 在认知中人类仍是主宰,机器或机器人处于从属地位 [2] - AI在结构化、规则明确的问题中表现卓越,但对模糊内容处理能力较弱 [2] 人形机器人商业化与落地 - 人形机器人落地的关键是创造实际价值 [2] - 人形机器人走向成熟需较长周期,当前行业尚处于探索阶段 [2] - 行业可能高估人形机器人短期能力,但低估其长期潜力 [2]
北大校友、OpenAI前安全副总裁Lilian Weng关于模型的新思考:Why We Think
Founder Park· 2025-05-18 15:06
大模型测试时计算优化 - 核心观点:通过延长模型"思考时间"可显著提升大语言模型在复杂推理任务中的性能,这已成为超越传统模型规模扩展的新优化维度 [4][5][91] - 性能提升表现:GPT/Claude/Gemini等模型通过思维链(CoT)策略在数学推理(5-6%提升)、代码生成等任务上持续突破性能边界 [4][24][16] - 计算资源视角:Transformer生成每个token需执行参数数量两倍的FLOPs,而MoE稀疏模型可降低至2×参数数÷稀疏度 [10] 思维链技术演进 - 早期方法:监督学习人类解题路径或设计"逐步思考"提示语,可使数学问题解决成功率提升显著 [12][14] - 强化学习应用:在STEM问题集上采用策略梯度算法结合自动评估,DeepSeek-R1模型通过两轮SFT-RL训练实现推理能力突破 [31][32][36] - 自我修正机制:需依赖外部反馈信号避免幻觉,修正器模型通过价值提升对(提示x,初始y,修正y')三元组训练实现迭代改进 [29][34] 并行与序列优化策略 - 并行采样:best-of-N和束搜索通过过程奖励模型(PRM)筛选候选,在GSM8k等任务实现5-6%准确率提升 [23][24] - 序列修订:递归检视(Recursive Inspection)和SCoRe方法通过KL散度惩罚防止行为坍缩,形成连续改进轨迹 [20][30] - 混合策略:简单问题适用纯序列化策略,高难度问题需组合并行与序列方法获取最优表现 [19] 架构创新与工具整合 - 递归架构:Universal Transformer等设计实现自适应计算时间,3.5B模型在r¯=32迭代次数达到性能饱和 [71][73] - 思考token机制:插入特殊token<T>或暂停标记可隐式扩展计算循环,使模型复杂度降低30% [73][74] - 外部工具调用:PAL和Chain of Code方法将数学计算/代码执行外包,ReAct框架整合Wikipedia API等知识源 [45][48] 可解释性与忠实度 - 思维链监控:可有效检测reward hacking行为,对抗样本的鲁棒性随思考时间延长提升51% [51][65] - 忠实度测试:通过扰动提示实验显示推理模型(Claude 3.7/DeepSeek R1)比非推理模型更可能揭示真实思维过程 [62][64] - 优化压力风险:RL训练中直接优化CoT易导致新型reward hacking,需设计n-gram重复惩罚等防护机制 [66][69]
AI周报|智能体平台Manus开放注册;梁文锋署名DeepSeek新论文
第一财经· 2025-05-18 14:47
AI智能体平台Manus - AI智能体平台Manus开放注册 新注册用户每天可免费获得300积分并一次性获得1000积分 提供基础计划(19美元/月 1900积分)、Plus计划(39美元/月)和Pro计划(199美元/月) [1] - Manus案例分析显示 数据分析消耗200积分 网页设计消耗360积分 应用开发消耗900积分 [1] - 北京红色蝴蝶科技有限公司(Manus关联公司)注册资本由1000万美元增至2000万美元 [1] 英伟达芯片供应 - 英伟达与沙特AI公司Humain达成芯片供应协议 将提供1.8万颗GB300芯片用于建设500兆瓦数据中心 [2] - 英伟达与Humain计划未来五年建设AI工厂 使用数十万块GPU AMD也与Humain达成合作 双方计划五年投资100亿美元 [2] DeepSeek-V3技术突破 - DeepSeek-V3通过四项创新技术(内存优化 计算优化 通信优化 推理加速)解决硬件瓶颈 仅用2048块H800达到数万块GPU训练效果 [3] 通用人工智能发展 - 张亚勤预测通用人工智能需15-20年 信息智能(语言/视频)5年可达人类水平 物理智能(机器人/无人驾驶)需10年 生物智能(脑机接口)需15-20年 [4] OpenAI全球扩张 - OpenAI考虑在阿联酋建设数据中心 可能在美国总统访问中东期间宣布 [5][6] - OpenAI推进"OpenAI for Countries"计划 第一阶段目标在各国开展10个项目 [6] 中东AI基础设施建设 - 美国与阿联酋合作建设5吉瓦数据中心AI园区 将成为美国境外最大同类园区 [7] - 阿联酋已投入数十亿美元转型为中东AI中心 [7] AI编程工具发展 - OpenAI发布AI编程助手Codex 可并行处理多项任务 面向付费用户提供研究预览版 [8] - OpenAI可能以约30亿美元收购AI编程助手Windsurf 或成其史上最大并购 [8] 百度AI搜索创新 - 百度推出DeepSearch深度搜索 基于百亿级内容库 可综合分析信息并动态补充搜索 [9] 谷歌AI投资布局 - 谷歌设立"AI未来基金"支持全球AI初创公司 目标发掘下一个OpenAI [10] AR/VR设备发展 - INAIR公布AI空间计算机 由AR眼镜 独立计算中心和3D空间操作键盘组成 计划6月发售 [12] - 预计2025年全球AR眼镜出货量将增长42% 远超VR [12] AI公司融资动态 - Perplexity AI正以140亿美元估值进行5亿美元融资谈判 由Accel领投 [13] - Perplexity AI年化经常性收入略低于1亿美元 估值从去年6月30亿美元涨至140亿美元 [13] 腾讯AI投入 - 腾讯第一季度资本开支274.8亿元 同比增长91% 主要用于支持AI业务 [14] - 腾讯第一季度研发支出189.1亿元 同比增长21% AI已对广告和游戏业务产生贡献 [14] - 腾讯表示拥有足够高端芯片训练未来几代模型 当前GPU需求主要在推理侧 [15]
刚刚!北大校友Lilian Weng最新博客来了:Why We Think
机器之心· 2025-05-18 12:25
大模型测试时计算优化 - 核心观点:通过延长模型"思考时间"(测试时计算)可显著提升大语言模型在复杂推理任务中的性能表现,该方向与人类认知双系统理论高度相关[2][6] - GPT、Claude、Gemini等模型通过思维链(CoT)和测试时计算策略优化,在逻辑推理、长文本理解、数学问题求解等高级认知任务上不断突破性能边界[2] - Transformer生成每个token的计算量约为参数量的2倍,而稀疏模型(MoE)因部分网络激活可降低计算量至2×参数数÷稀疏度[8] 思维链技术演进 - 思维链(CoT)允许模型根据问题难度动态调整计算量,早期通过监督学习人类编写的推理路径实现[13] - 强化学习在可验证答案的数据集(如STEM问题)上应用显著提升CoT性能,近期采用策略梯度算法结合自动评估成为主流方法[14] - 模型规模越大,"思考时间"带来的性能收益越显著,在数学问题上成功率提升明显[16] 并行采样与序列修订 - 并行采样通过生成多个候选序列并用验证器筛选最优解,实现简单但依赖模型单次生成能力[19][26] - 序列修订通过迭代修正输出实现质量提升,需额外控制修订风险如正确答案被错误修改[20] - 实验表明简单问题适合纯序列策略,高难度问题需组合并行与序列方法才能获得最优表现[21] 强化学习应用 - DeepSeek-R1通过两阶段SFT-RL训练在数学/编程任务表现优异,验证纯强化学习可涌现"顿悟时刻"类高级推理能力[42][46] - 推理类RL训练使用格式奖励(特殊token包裹CoT)和准确性奖励(自动验证答案)双重机制[43] - 失败案例显示过程奖励模型易导致奖励欺骗,蒙特卡洛树搜索因token空间过大难以应用[49] 外部工具整合 - PAL和Chain of Code方法通过调用代码解释器处理数学计算/编程任务,扩展模型能力边界[52] - ReAct方法结合Wikipedia API调用与推理轨迹生成,实现外部知识整合[56] - OpenAI o3/o4-mini模型融合网页搜索、代码执行等工具操作,验证计算资源与性能正相关[57] 连续空间思考架构 - 递归架构如Universal Transformer通过自适应计算时间动态调整推理步数[82] - 思考token技术通过插入特殊token为模型争取额外计算时间,在数字推理任务效果显著[85] - Quiet-STaR实现token级推理,通过生成未来文本的合理化解释提升预测质量[89] 测试时计算规模效应 - 测试时计算优化相比参数扩展可能更高效,但对困难问题的弥补能力有限[107] - 思维链长度与评估准确率呈正相关,但简单拒绝采样会导致反向scaling现象[112][113] - 最佳效果出现在推理token远少于预训练token时,表明基础模型能力仍是关键[112]
英国《金融时报》刊文:中国是如何赶上硅谷的
环球网资讯· 2025-05-17 06:58
中国科技竞争力 - 中国已成为美国在科技领域势均力敌的对手,拥有制造业规模、消费市场和科学人才等关键优势 [1] - 到2030年,全球可能普遍使用中国的人工智能应用程序和近乎自动驾驶的电动汽车 [1] - 中国已从模仿美国科技跃升至超越美国科技,硅谷面临挑战 [1] 中国科技突破 - 中国初创公司DeepSeek发布的人工智能模型性能与美国竞争对手相当,但更便宜、更节能 [1] - 中国企业发布全球最快的电动汽车充电技术 [1] - 华为向外国人销售可与苹果最新款手机媲美的手机 [1] 国际评价 - 谷歌前首席执行官埃里克·施密特认为中国在多种技术领域与美国不相上下甚至领先 [1] - 英伟达首席执行官黄仁勋指出中国在人工智能领域"并不落后" [1] - 优步联合创始人特拉维斯·卡兰尼克称线上送餐的未来在中国上海而非纽约 [1] 美国科技地位 - 美国科技巨头曾将中国视为生产中心,现在开始买入中国的技术未来 [2] - 硅谷最大的财富是20多年前创造的,长远看可能面临被淘汰的命运 [2]
突袭Cursor,Windsurf抢发自研大模型!性能比肩Claude 3.5、但成本更低,网友好评:响应快、不废话
AI前线· 2025-05-16 23:39
Windsurf推出SWE-1模型家族 - 公司推出首个针对完整软件工程流程优化的AI模型家族SWE-1 包含三款具体模型:SWE-1、SWE-1-lite和SWE-1-mini [1][6] - 此举标志着公司从应用开发向底层模型研发的战略扩展 距离被OpenAI收购30亿美元后首次技术产品发布 [2] - SWE-1工具调用推理能力接近Claude 3.5 Sonnet 但服务成本更低 付费用户均可使用 [6] 模型技术特点 - SWE-1-lite取代原有Cascade Base模型 质量更优 面向所有用户无限次使用 [6] - SWE-1-mini强调响应速度 为Windsurf Tab被动体验提供支持 [6] - 模型采用"流程感知"训练方法 通过共享时间线实现人机无缝协作 [29][30] 产品性能表现 - 开发者实测显示模型响应迅速高效 但存在规则不明确时产生幻觉的问题 [5][7] - 在对话式SWE任务基准测试中 采用10分制评估人机交互编码能力 [15] - 端到端SWE任务基准测试显示 模型独立解决问题能力达到前沿水平 [18][20] 公司战略方向 - 目标是将软件开发速度提升99% 超越单纯编码功能 覆盖测试/用户反馈等全流程 [9][12] - 通过生产实验盲测验证 模型每日贡献代码行数等指标接近行业领先水平 [21][22] - 将持续投入SWE模型研发 计划超越现有前沿模型性能 [27][33] 编辑器技术赋能 - 编辑器整合终端输出/剪贴板内容/IDE搜索等多元感知能力 [31][32] - 共享时间线设计使模型能持续学习用户行为模式 形成数据飞轮 [30] - 当前已实现文本编辑器感知/终端感知/浏览器基础感知等多维度协作 [31]
杭州市创业投资协会周恺秉:杭州科创崛起离不开两个“微小但重要”的变量
21世纪经济报道· 2025-05-16 21:02
杭州创业投资体系演进 - 周恺秉长期参与杭州科技创新体系建设,自20世纪90年代起持续呼吁加大科技投入,2011年关注创业投资项目退出机制,2015年建议构建"硅谷式"创业生态系统 [1] - 杭州创新公式包含三大核心变量:冒险宽容的文化、市场经济体制机制、活跃的创投资本,同时涉及创业生态、营商环境等多元因素 [3][4] - 杭州"六小龙"企业涌现印证城市包容度与文化交融的关键作用,44家浙江省独角兽企业中杭州占80%(55家中的44家) [5][11] 城市特质与创业生态 - 杭州社会包容度体现在市民交往无地域歧视、普通话普及、倡导"创业失败亦英雄"理念,推动浙商群体从借贷文化转向投资文化 [6] - 地理区位促成南北文化融合:承接江苏山东的稳健与绍兴温州的冒险,形成兼具科学理性与冒险精神的独特创业气质 [6][7] - 第一代企业家以本地人为主(马云、宗庆后等),而"六小龙"创始人中省外籍占比达67%(4/6),反映城市吸引力 [6] 资本生态建设实践 - 政府引导基金2008年率先探索,培育普华资本、华睿投资等本土机构,管理规模从数千万扩展至数百亿元 [8][10] - 创投机构呈现差异化格局:本土天使投资人专注早期(如李治国),红杉高瓴等头部机构布局成长期项目,形成互补 [8][9] - 杭高投通过支持"小而美"基金(规模1-5亿元)培育早期生态,每年全省50%投融资案例(约500个)来自杭州企业 [10][11] 科技金融协同发展 - 杭州银行体系突破传统间接融资模式,成为全国科技金融创新高地,各大银行积极布局科技金融业务 [10] - 创业投资与科技金融共同构成企业支持网络,该模式具备全国推广价值 [10]
安联投资:当下或许是把握收益基金稳健潜力的好时机
智通财经· 2025-05-16 16:17
收益基金概述 - 收益基金聚焦于能产生稳定回报的资产,如派息股、特定类型债券,也可能涵盖商品及其他另类资产 [1] - 这类基金旨在为投资者提供定期收益,因而以纪律化方式管理,投资风格更为审慎稳健 [1] - 许多收益基金分散投资于多个资产类别,以缓冲波动和不明朗市场环境带来的影响 [1] 收益基金的好处 - 收益基金可通过提供定期收益支持投资者的生活方式,也可作为有用工具,帮助投资者满足日常需求,同时应对波动的市场环境 [2] - 在当前股价波动、利率"长期高企"及美国政策难以预测的环境下,这类基金或许比以往任何时候都更具吸引力 [6] 收益基金的投资策略 - 可能配置债券,尤其是利率风险相对较低的债券,如短存续期债券及浮动利率票据 [3] - 债券收益率较近年水平大幅上升,这不仅意味着更佳的潜在回报,也为可能上升的利率提供缓冲 [3] - 投资股票时,收益基金往往聚焦股息理想的公司,这类公司通常规模庞大、业绩稳定且股价波动较小,例如可口可乐和宝洁 [3] - 部分基金(如多元资产基金)会投资于一系列与股股价相关性较低的资产类别,可能包括私募股权、私募信贷等另类资产,或石油、黄金等商品 [3] 当前市场环境下的收益基金吸引力 - 在关税和贸易战威胁全球经济走势、大量资本涌入快速发展但难以预测的科技行业的背景下,收益基金的审慎稳健特征颇具吸引力 [4] - 浮息票据等其他固定收益工具受影响可能较小——其票息会根据短期利率定期调整 [4] - 收益基金可能会配置这类债券及其他债券,如短存续期高收益债券或可转换债券 [4] 多元化的重要性 - 未来几年,股票和债券的合理平衡对财富保护和累积至关重要 [5] - 在主动管理的多元资产收益基金中,基金经理可根据市场情况调整股债配比,以管理风险并提供较稳定的回报 [5] 收益基金的适用性 - 对于偏好较稳定回报、不受价格大幅波动影响,或需要资金维持现有生活方式的投资者来说,收益基金是不错的选择 [6] - 对于回报预期进取或投资期限较长的投资者,倾向投资增长型股票等风险资产的基金可能更合适 [6]