Workflow
DeepSeek V4模型
icon
搜索文档
梁文锋的幻方量化去年收益57%,跻身百亿级量化基金业绩榜第二!
21世纪经济报道· 2026-01-14 16:38
幻方量化业绩与资金实力 - 公司2025年收益均值达56.55%,在管理规模超百亿的量化私募中位列第二 [1] - 公司近三年收益均值为85.15%,近五年收益均值为114.35% [1] - 公司当前管理规模已超700亿元,稳居国内私募量化投资领域第一梯队 [1] - 据业内人士估算,基于1%管理费和20%业绩提成,公司去年强劲表现可能带来超过7亿美元的收入 [2] 幻方量化与DeepSeek的关联 - 公司创始团队自2008年即开始使用机器学习技术探索全自动量化交易 [2] - 公司于2023年7月孵化出杭州深度求索人工智能基础技术研究有限公司(DeepSeek),正式进军通用人工智能 [2] - 公司创始人梁文锋持有DeepSeek多数股权,且DeepSeek的研究经费来源于公司的研发预算 [2] - 公司的丰厚收益能为DeepSeek的大模型研发提供坚强的资金支持 [1][2] DeepSeek大模型研发进展与对比 - DeepSeek计划在2026年2月春节前后发布新一代AI模型DeepSeek-V4,该模型是V3的迭代版,具备强大的编程能力 [3] - 内部初步测试显示,V4在编程能力上超过了Anthropic的Claude和OpenAI的GPT系列等市场上的其他顶级模型 [3] - DeepSeek曾披露其V3模型的总训练成本预算为557万美元 [2] - 作为对比,智谱截至2025年上半年累计研发投入约44亿元,MiniMax截至2025年第三季度累计研发开支约4.5亿美元(约31.6亿元人民币) [3] 公司技术背景与监管动态 - 公司策略和开发团队由多学科顶尖人才组成,包括奥林匹克学科竞赛奖牌得主、AI领域专家及各学科博士 [1] - 公司于2016年10月首次上线由深度学习生成的交易仓位,2017年全面应用深度学习技术进行交易 [2] - 公司于2019年和2021年分别投资建成“萤火一号”和“萤火二号”AI训练平台 [2] - 意大利反垄断机构AGCM已于2026年1月5日结束针对DeepSeek的调查,并以具有约束力的承诺作为结案条件,该调查始于2025年6月,涉及公司涉嫌未警告用户其模型可能产生虚假讯息 [3][4]
梁文锋旗下幻方量化去年收益率56.6%,位列百亿级量化基金业绩榜第二
新浪财经· 2026-01-14 14:06
幻方量化业绩表现 - 2025年收益均值达56.55%,在中国管理规模超百亿的量化私募中位列第二[1][4] - 近三年收益均值为85.15%,近五年收益均值为114.35%[1][4] - 目前管理规模已超700亿元,2019年破百亿元,2021年一度突破千亿元[1][4] 幻方量化与DeepSeek的关联 - 幻方量化由创始人梁文锋于2008年创立,是一家有数学、计算、研究和AI基因的对冲基金[1][4] - 公司丰厚的业绩为梁文锋旗下的DeepSeek提供了充足的研发资金[1][4] - 2023年4月,幻方量化宣布全力投身人工智能技术,并孵化出杭州深度求索人工智能基础技术研究有限公司(DeepSeek)[2][5][6] 幻方量化的AI技术布局 - 2016年10月,公司第一个由深度学习算法模型生成的股票仓位上线实盘交易[1][4] - 至2017年底,公司几乎所有的量化策略都已采用AI模型计算[1][4] - 2019年12月,成立幻方AI(杭州幻方人工智能基础研究有限公司),致力于AI算法与基础应用研究[1][4] - 公司斥巨资打造了“萤火一号”和“萤火二号”AI研究设施[1][4] DeepSeek的技术突破与市场影响 - 2025年1月,DeepSeek的R1模型发布后彻底火爆,成为AI行业最大“黑马”[2][6] - R1推理模型能力达行业顶尖水平,训练成本比竞争对手低一个数量级以上[2][6] - 通过自研的稀疏注意力机制(DSA)等技术,在长文本处理等任务上实现了数倍的推理速度提升和显著的内存节省[2][6] - 公司通过开源策略构建了强大的生态影响力[2][6] DeepSeek的最新动态与未来计划 - 2025年1月12日晚,DeepSeek与北京大学团队共同发布新论文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》[3][6] - 同日,DeepSeek开源了相关记忆模块Engram[3][6] - 近日有消息称,DeepSeek将于2月发布新一代旗舰AI模型DeepSeek V4,该模型具备强大的编程能力,预计将对当前AI竞争格局产生重大影响[2][6]
计算机ETF(512720)涨超2.4%,连续2日净流入超2亿元,关注 AI 应用端投资机会
每日经济新闻· 2026-01-14 11:32
市场表现与资金流向 - 1月14日,计算机ETF(512720)当日涨幅超过2.4% [1] - 该ETF连续2个交易日资金净流入超过2亿元人民币 [1] 行业与产品动态 - 根据Information消息,DeepSeek或将在2月中旬正式发布下一代V4模型 [1] - DeepSeek V4模型的突破主要体现在编程能力超越当前主流模型、处理和解析极长代码提示词的能力、训练各阶段对数据模式理解能力的提升且不易衰减、以及更严密可靠的推理能力 [1] - 2025年初,DeepSeek的出现重塑了全球人工智能竞争格局,并在开源社区构建了深远影响力 [1] - 2025年初以来,DeepSeek模型持续升级迭代 [1] - 火山引擎已成为中央广播电视总台《2026年春节联欢晚会》独家AI云合作伙伴 [1] - 字节跳动旗下智能助手豆包将配合总台春晚上线多种互动玩法 [1] - 参考宇树机器人在2025年春晚的表现,豆包优秀的多模态能力有望引发广泛关注 [1] 投资机会与行业催化 - 近期行业催化密集,建议重点关注AI应用端投资机会 [1][2] - 计算机ETF(512720)跟踪中证计算机指数(930651),该指数选取业务涉及计算机硬件、软件及服务等领域的上市公司证券,涵盖信息技术行业主要细分领域 [2] - 该指数反映中国计算机相关上市公司证券的整体表现,具备显著的科技成长风格特征 [2]
幻方量化去年收益率56.6%,为DeepSeek提供超级弹药
21世纪经济报道· 2026-01-14 10:16
幻方量化业绩表现 - 2025年收益均值达56.55%,在中国管理规模超百亿的量化私募中位列第二[2] - 近三年收益均值为85.15%,近五年收益均值为114.35%[2] - 2025年管理规模已超700亿元人民币,稳居国内私募量化投资领域第一梯队[2] 幻方量化业务与团队 - 公司是一家AI量化交易公司,成立于2015年,持续投入AI算法研究[2] - 创始团队自2008年开始使用机器学习技术探索全自动量化交易[3] - 2016年10月第一份由深度学习生成的交易仓位上线,2017年全面应用深度学习技术进行交易[3] - 策略和开发团队由多学科顶尖人才组成,包括奥赛金牌得主、AI领域专家及各学科博士[2] 幻方量化技术投入与孵化 - 2019年投资建成“萤火一号”AI训练平台,2021年投资建成“萤火二号”AI训练平台[4] - 2023年7月孵化出杭州深度求索人工智能基础技术研究有限公司,正式进军通用人工智能[4] - 公司创始人与大股东梁文锋持有DeepSeek多数股权,并停止为基金引入外部资金[4] 幻方量化收入估算与资金反哺 - 据业内人士估算,基于1%管理费和20%业绩提成,公司去年强劲表现可能带来超过7亿美元收入[6] - 幻方量化的丰厚收益能反哺DeepSeek,为其大模型研发提供资金支持[2][5] DeepSeek大模型业务 - DeepSeek的研究经费来源于幻方量化的研发预算[4] - DeepSeek V3模型的总训练成本预算在557万美元[7] - 计划在2月春节前后发布新一代AI模型DeepSeek V4,内部测试显示其在编程能力上超过Claude和GPT系列[7] 行业研发投入对比 - 智谱截至2025年上半年累计研发投入约44亿元人民币[7] - MiniMax截至2025年第三季度累计研发开支约4.5亿美元[7]
马斯克:X平台将开源新算法 软件ETF基金(561010)涨停
21世纪经济报道· 2026-01-12 16:46
市场表现与交易数据 - 1月12日市场震荡拉升,三大指数均涨超1%,沪深两市成交额达3.6万亿元 [1] - 软件ETF基金(561010)涨停,上涨9.97%,盘中换手率30.33%,成交额4955万元,市场交投活跃 [1] - 该ETF成分股中,拓尔思、新点软件、科大国创、万兴科技、金现代、星环科技、福昕软件、中科星图等出现20CM涨停 [1] 全球AI算力与算法开源动态 - 马斯克宣布将在一周内正式开源X平台最新的内容推荐算法,覆盖所有用于决定向用户推荐自然内容和广告内容的代码,并计划每四周重复此开源过程 [1] - 在CES 2026展会上,英伟达发布全面量产的NVIDIA Rubin平台,AMD公布"Helios"平台并首次公开MI400系列加速器产品组合,预示全球AI算力基础设施正加速迭代 [1] - 全球AI算力平台能力持续提升的趋势,与大模型持续升级形成共振,将推动AI产业蓬勃发展 [1] 中国AI模型与产业发展 - 以Kimi K2 Thinking、DeepSeek V3.2为代表的国产大模型能力不断提升,有望加快在千行百业的落地进程,进一步促进我国AI产业发展 [1] - DeepSeek计划于2月中旬发布的V4模型在编程任务表现上已超越主流模型,在处理极长代码提示词方面有显著提升,其底层架构创新mHC解决了训练不稳定性问题,为后续应用繁荣提供支撑 [2] AI应用商业化与生态布局 - 互联网大厂加速布局AI应用入口,阿里推出"千问"APP致力于打造个人AI助手,蚂蚁发布全模态助手"灵光",字节跳动旗下豆包日活已过亿 [2] - 火山引擎成为2026年春晚独家AI云合作伙伴,标志着AI应用正从技术探索走向规模化落地阶段,相关产业链将迎来发展契机 [2] 软件ETF基金产品信息 - 软件ETF基金(561010)紧密跟踪中证全指软件开发指数 [2] - 中证全指行业指数将中证全指指数样本按中证行业分类分为11个一级行业、35个二级行业、90余个三级行业及200余个四级行业,再以进入各层级行业的全部证券作为样本编制指数 [2] - 该ETF设有场外联接基金,A类代码020729,C类代码020730 [2]
AI应用持续爆发,科创创业人工智能ETF永赢(159141)强势涨超3%
新浪财经· 2026-01-12 11:05
科创创业人工智能ETF市场表现 - 2025年12月3日成立的科创创业人工智能ETF永赢(159141)于1月12日上涨3.50%,收盘价为1.125元,是同类规模最大的产品 [1][4][5] - 该ETF前十大成分股普遍大涨,其中中文在线上涨18.11%至34.43元,昆仑万维上涨17.14%至63.28元,润泽科技上涨15.46%至79.90元,拓尔思上涨16.02%至25.56元,合合信息上涨14.67%至303.20元 [1][2] - 该ETF成交活跃,部分成分股成交额巨大,昆仑万维成交额达92.73亿元,润泽科技成交额达59.88亿元,中文在线成交额达36.67亿元 [2] AI行业近期催化事件 - 两大AI大模型公司近期在港股上市表现亮眼,智谱AI上市2日上涨36%,市值达700亿港元,Minimax(稀宇科技)上市当日大涨109%,市值突破1000亿港元,铸就全球大模型企业规模化上市里程碑 [2] - DeepSeek预计在2月中旬发布下一代V4模型,将实现四大核心突破:支持百万字级超长上下文处理、多模态融合与长链任务自主执行、优化私有化部署适配高价值场景、支持FP8算子适配国产芯片 [3] - 豆包春晚联动形成双重催化,共同推动AI应用商业化加速落地 [3] AI产业链投资与商业化趋势 - 科创创业人工智能ETF永赢(159141)精准覆盖AI全产业链,上游算力芯片与光模块、中游大模型与云计算、下游产业应用,其中AI芯片、光模块与云计算配置占比超过78% [4] - 生成式AI产品正逐渐成为信息获取的核心入口,流量迁移趋势显现,GEO(生成式引擎优化)有望成为适配AI新入口时代的新型营销范式 [3] - 2026年被认为是AI应用商业化的深化之年,影响正从后台的成本节约走向前台的价值创造,市场对AI营销中GEO概念的关注度明显提升 [3]
模型迭代与AI入口竞争共振,AI产业链行情值得期待
东方证券· 2026-01-11 11:42
行业投资评级 - 行业评级为“看好”(维持)[6] 报告核心观点 - 新一轮模型迭代与互联网大厂加速应用推广共振,AI应用将迎来较好的投资机遇,算力产业链也将受益于应用端加速带来的需求提升[3] - 编程能力是模型重点提升方向,也是当前B端应用落地最成熟和最主流的赛道[9] - DeepSeek V4模型编程能力如大幅提升,将进一步支撑未来应用端繁荣[9] - 互联网大厂加大AI应用入口争夺力度,大模型公司集体上市促进行业发展加速[9] 事件与行业动态总结 - **模型迭代事件**:DeepSeek计划在2月中旬正式发布下一代V4模型,重点强化编程能力[2] - **公司上市动态**:国内AI大模型公司智谱、MiniMax本周相继登陆港股市场,其中智谱上市后两个交易日股价上涨超36%,而MiniMax上市首日上涨超109%,市值破千亿港元[2] - **大厂应用竞争**:阿里推出“千问”APP,蚂蚁推出“灵光”和“阿福”(后者月活用户已达3000万,单日提问量超1000万),字节旗下豆包日活已过亿,火山引擎成为2026年春晚独家AI云合作伙伴[9] 行业趋势与依据总结 - **编程能力成为竞争焦点**:2025年以来,国内外领先模型公司均致力于提升代码能力,如Anthropic的Claude系列、OpenAI的GPT系列,以及国内的通义千问、智谱GLM-4.7、月之暗面Kimi-K2均加入代码SOTA模型争夺战[9] - **AI编程赛道成熟且主流**:Anthropic的AI编程工具Claude Code在发布仅6个月后年度化收入就达到了10亿美金,根据OpenRouter数据,AI Coding占据全球token总消耗的50%[9] - **DeepSeek V4性能突破**:初步基准测试显示,V4在编程任务上的表现已超越目前的主流模型(如Claude系列、GPT系列),在处理和解析极长代码提示词的能力上也有显著提升[9] - **底层架构创新**:DeepSeek发布重磅论文提出全新架构mHC(流形约束超连接),解决了大模型训练的不稳定性问题,为后续模型迭代和应用端繁荣提供支撑[9] 投资建议与标的总结 - **AI应用领域相关标的**:包括卓易信息(688258)、合合信息(688615)、星环科技-U(688031)、托普云农(301556)、税友股份(603171,买入)、汉得信息(300170)、泛微网络(603039,买入)、鼎捷数智(300378)、科大讯飞(002230,买入)[3] - **AI算力领域相关标的**:包括寒武纪-U(688256)、海光信息(688041,买入)、润泽科技(300442)、东阳光(600673)、首都在线(300846)、优刻得-W(688158)、润建股份(002929)、奥飞数据(300738)、禾盛新材(002290)、金盘科技(688676)、科华数据(002335)[3]
知情人士:DeepSeek将于2月发布其最新旗舰AI模型
新浪财经· 2026-01-09 21:33
公司新产品发布计划 - 深度求索公司预计在未来几周内,具体可能在2月中旬农历新年前后,推出新一代旗舰AI模型V4 [2] - V4模型是2024年12月发布的V3模型的迭代版本,主打强劲的代码生成能力 [2] - 公司内部基准初步测试显示,V4在代码生成领域的表现优于Anthropic Claude、OpenAI GPT等现有主流模型 [2] 公司技术进展与模型性能 - V4模型在超长代码提示词的处理与解析方面实现了技术突破,对复杂软件项目开发工程师具备显著应用优势 [4] - 该模型在训练全流程中对数据模式的理解能力得到优化,且未出现性能衰减问题 [4] - V4模型输出的答案逻辑更为严谨清晰,体现出更强的推理能力,在执行复杂任务时的可靠性将大幅提升 [4] - 公司此前发布的V3.2版本在部分基准测试中表现优于OpenAI的GPT-5以及谷歌的Gemini 3.0 Pro [3] 公司过往成就与市场影响 - V3模型的推出帮助深度求索在全球人工智能领域崭露头角 [2] - R1开源“推理型”模型的发布震动了硅谷与华尔街,一举将公司推向全球舞台 [2] - R1模型的设计逻辑是在给出答案前先进行深度“思考”以解决复杂问题,其引发广泛关注的原因在于,相较于美国研发的头部模型,公司投入的训练成本相对较低但模型性能十分亮眼 [2] - 在国内市场,公司推出的融合R1与V3双模型能力的聊天机器人产品迅速走红 [3] 公司研发与技术创新 - 深度求索首席执行官梁文锋联合署名发表研究论文,提出了一种全新的训练架构 [4] - 该架构能够支持研发人员在不按比例增加芯片投入的前提下,构建参数规模更大的AI模型 [4] - 这一系列技术进展表明,深度求索的技术创新步伐仍在持续迈进 [4]
知情人士:DeepSeek将于2月发布其最新旗舰AI模型。
新浪财经· 2026-01-09 21:23
公司产品发布计划 - 深度求索公司预计将在未来几周内推出新一代旗舰级人工智能模型V4,主打强劲的代码生成能力 [2][6] - V4模型是公司于2024年12月发布的V3模型的迭代版本,计划于2月中旬农历新年前后推出,但具体时间可能调整 [2][6] - 公司员工基于内部基准的初步测试显示,V4模型在代码生成领域的表现优于Anthropic、Claude、OpenAI GPT等现有主流模型 [2][6] 公司技术实力与过往表现 - 公司此前发布的V3模型帮助其在全球人工智能领域崭露头角,而R1模型的发布则震动了硅谷与华尔街,将公司推向全球舞台 [2][6] - R1是一款开源的“推理型”模型,其设计逻辑是在给出答案前先进行深度“思考”以解决复杂问题,其引发关注的原因在于相较于美国头部模型,训练成本相对较低但性能亮眼 [2][6] - 2024年12月,公司发布的V3.2版本在部分基准测试中表现优于OpenAI的GPT-5以及谷歌的Gemini 3.0 Pro [3][7] - 自V3.2发布后,公司一直未推出重量级迭代模型,这使得即将到来的V4模型备受业界瞩目 [3][7] 新产品V4的技术特点 - V4模型在超长代码提示词的处理与解析方面实现了技术突破,对从事复杂软件项目开发的工程师具备显著应用优势 [4][7] - 该模型在训练全流程中对数据模式的理解能力得到优化,且未出现性能衰减的问题 [4][7] - 用户或许会发现V4模型输出的答案逻辑更为严谨清晰,体现出该版本模型具备更强的推理能力,在执行复杂任务时的可靠性将大幅提升 [4][7] 公司近期技术进展 - 上周,公司发表了一篇由首席执行官梁文锋联合署名的研究论文,提出了一种全新的训练架构 [4][8] - 该全新架构能够支持研发人员在不按比例增加芯片投入的前提下,构建参数规模更大的人工智能模型 [8][9] - 这一系列技术进展表明,深度求索公司的技术创新步伐仍在持续迈进 [4][9] 公司市场与产品策略 - 在国内市场,公司推出了一款融合R1与V3双模型能力的聊天机器人,该产品迅速走红 [3][6]