Seek .(SKLTY)

搜索文档
MiniMax发布推理模型对标DeepSeek,算力成本仅约53万美元
第一财经· 2025-06-17 15:26
公司动态 - MiniMax宣布连续五天发布重要更新,首日开源推理模型MiniMax-M1 [1] - MiniMax-M1在多项基准测试中表现优异,比肩DeepSeek-R1、Qwen3等开源模型,接近海外领先模型 [3] - 模型训练效率超出预期,仅用3周时间、512块H800 GPU完成强化学习训练阶段,算力租赁成本53.47万美元 [3] - MiniMax-M1在编程能力测试中表现突出,一次通过"拆烟囱"编程案例,优于DeepSeek-R1-0528和Gemini-2.5-Pro [3] - 模型中文写作严谨优先,幻觉较低,注重指令遵循 [5] - MiniMax-M1拥有100万上下文窗口长度,与Gemini 2.5 Pro相当,是DeepSeek R1的8倍 [5] - 在长上下文理解任务(MRCR)中表现优异,超越所有开源权重模型和部分海外顶尖模型,全球排名第二 [5] - 在TAU-bench测试中表现出色,超越DeepSeeK-R1-0528和Gemini-2.5 Pro,仅次于OpenAI o3和Claude 4 Opus [7] - 在代码能力(SWE-bench)上显著超越大部分开源模型,仅微弱差距次于DeepSeek最新发布的R1 [7] - MiniMax提出创新强化学习算法CISPO,在数学AIME实验中比字节DAPO算法收敛性能快一倍 [8] - 模型定价采用阶梯式,对标DeepSeek-R1性价比更高 [8] - MiniMax预告后续四天将有更多更新,业界预期海螺新版本即将亮相 [9] 行业动态 - 月之暗面同日开源编程模型Kimi-Dev-72B,基于阿里云Qwen2.5-72B微调 [8] - Kimi-Dev-72B在SWE-bench编程基准测试中取得全球最高开源模型水平,成绩超过新版DeepSeek-R1 [8] - 但实际测试显示Kimi-Dev-72B生成的代码需要修改多个bug才能运行,引发过拟合质疑 [9] - AI六小龙经过半年沉寂后重新加入大模型竞争 [9] - 云启资本合伙人陈昱表示长文本能力对社交应用、情感陪伴应用和Agent是关键技术 [7] 技术亮点 - MiniMax-M1训练材料足够新,思考时多次反刍成功避坑 [3] - 闪电注意力机制为主的混合架构使长文本处理具有算力效率优势,8万Token推理只需DeepSeek R1约30%算力 [7] - CISPO强化学习算法显著优于DeepSeek早期使用的GRPO [8] - 模型在样式和光影效果方面仍有不足,创意内容生成能力有限 [5]
一财社论:中国创新药“DeepSeek”时刻来临了吗
第一财经· 2025-06-16 21:32
中国创新药行业崛起 - 2025年中国创新药进入厚积薄发时期 近期多点开花 包括阿斯利康与石药集团达成53亿美元战略合作 三生制药与辉瑞就抗肿瘤药物SSCJ-707达成交易 辉瑞支付12 5亿美元首付款 最高48亿美元里程碑付款 百时美施贵宝拿下德国BioNTech的PD-L1/VEGF双抗BNT327 潜在交易总额111亿美元 BNT327是BioNTech以不到21亿美元价格从中国创新药企普米斯手中获得 [1] - 中国创新药板块表现强劲 截至6月13日 A股中证创新药产业指数年内累计上涨17 34% 恒生生物科技指数累计涨幅达61 96% 许多港股医药基金QDII收获大量失地 [1] 行业交易与国际化进展 - 自2021年开始 中国创新药对外授权总交易金额年均复合增长率超过80% 显著高于全球同期数据的10%左右 今年一季度中国药企参与的并购与授权交易金额为369亿美元 占全球总量675亿美元的一半以上 [2] - 中国创新药已在抗体偶联药物ADC 双抗等多个细分领域获得国际认可 模仿创新和跟随速度具有巨大国际竞争力 商业拓展BD交易持续增多 创新资本价值获国际社会高度认可 [2] 行业崛起核心驱动因素 - 海外市场开放准入 中国生物医药企业积极参与国际创新药生态链 海外市场能对创新资产进行有效估值和定价 知识产权保护体系健全 便于创新资产变现或贴现 海外医疗市场资源整合优势强 [3] - 中国创新药行业享受无事不扰的自由创新环境 临床试验等方面政策相对宽松 国内人才红利降低综合成本 客观上为行业营造"沃土" [3] - 中国生物医药领域形成精细分工的集群化创新生态 从创新方向锚定到概念验证 从动物实验到临床研究 各地生物医药园提供精细化分工专业服务平台 各司其职分工协作降低创新成本 [3] 行业发展挑战与未来方向 - 出海对许多企业是必然要求 也是应对国内市场困境无奈之举 集采压力 资本市场承载力不足 热门靶点扎堆 同质化竞争构成行业发展核心痛点 [4] - 需解决创新药在国内市场的价值转化问题 使其惠及民众并实现创新引领 国内市场需发挥塔基作用 推动创新资产内外循环相互助推 集采需走出单纯低价策略 体制机制上为创新药打开国内市场空间 [4] - 上海出台《关于加强新时期专利侵权纠纷行政裁决工作的实施方案》 组建产业知识产权创新联合体 健全知识产权保护机制 生物医药领域开展多项产学研医融合项目 搭建新兴医药创新生态 降低创新成本 提高医疗成果转化率 [5] 行业持续发展关键 - 需持续营造并巩固让创新活力自由奔涌的环境 创新和治理的底层逻辑是道法自然 政府需少干预多服务 为创新发展提供无事不扰的自由拓展沃土 [6]
摩根士丹利:DeepSeek R2:AI推理新一代重量级模型?
摩根· 2025-06-16 11:16
报告行业投资评级 - 韩国科技行业投资评级为Cautious(谨慎) [7] 报告的核心观点 - DeepSeek的R2模型发布或重新定义中国AI开发、定价和供应链方式,有望成为加速中国AI应用落地的关键催化剂 [1] - R2是中国初创公司DeepSeek思维模型的第二次重大迭代,在多语言推理和代码生成等方面有进展,成本低且性能强,若成功将扰乱AI市场 [2] - R2依托华为昇腾910B芯片集群训练,构建自有供应链,减少对外部依赖 [3] - 中国公司有更多资源部署AI技术,“中国AI 60强”个股或参与R2行情和中国AI发展 [10] 根据相关目录分别进行总结 R2模型介绍 - R2是针对国产硬件优化的万亿参数模型,在多语言推理、代码生成和多模态能力方面取得重大进展,可重新定义AI应用落地的价值、性能和单位成本 [9] - R2优先提高编程能力,采用混合专家混合(MoE)架构,总共有1.2万亿个参数,其中780亿个参数是活跃的,成本比大多数先进模型便宜97% [13] R1模型进展 - 2025年5月29日,DeepSeek发布R1推理模型的更新版本R1 - 0528,使用9900万个tokens完成评估,比原版本多40%,性能在多个测试中有提升 [11] 供应链情况 - DeepSeek可能建立本地硬件供应链,R1曾使用数万张英伟达GPU训练,现在可能用华为昇腾910C芯片推理 [16] - 华为昇腾910C可达到英伟达H100性能的60%,采用中芯国际7纳米N + 2制程工艺,但华为在构建软件和支持生态系统方面还有挑战 [17] 投资影响 - DeepSeek的受益者在业绩、营收和盈利修正方面是长期赢家,后训练阶段tokens增加对本土GPU、GDDR和中国HBM是好兆头 [20] - 全球人工智能公司年初至今整体下跌 -5%,iPhone供应链表现不理想,传统子细分市场每股盈利回升但相对温和 [20] DeepSeek模型演变 - DeepSeek强调软件驱动的资源优化,已发布R1、V3和Prover - V2等模型,即将推出R2和V4模型 [23] - Prover - V2专注数学定理形式化证明,采用改进的MoE架构和压缩的KV缓存,推出MTP框架提高生成速度 [25] R2/V4模型功能 - “推理时间扩展”是R2和V4模型性能突破的关键,采用GRM技术,中型模型可在基准测试中表现出色 [26] - 通过点式生成奖励建模(GRM)、自我原则批评调整(SPCT)和元奖励模型(meta RM)实现模型架构改进 [27][32] 行业覆盖公司评级 - 报告对韩国科技行业多家公司给出评级,如Ecopro BM为Underweight(U),Fadu Inc为Equal - weight(E),Hanmi Semiconductor Co. Ltd.为Overweight(O)等 [81]
恒生生科指数1月以来涨超60%,中国创新药的“DeepSeek时刻”超过了AI
华尔街见闻· 2025-06-15 19:44
行业表现与市场热度 - 恒生生物科技指数2025年涨幅超60%,显著超越AI板块17%的涨幅,显示创新药成为市场焦点[1] - 2025年Q1中国药企参与的并购与授权交易总值达369亿美元,占全球总量675亿美元的半数以上[3] - 港股IPO市场火爆,Duality Biotherapeutics上市首日股价翻倍,累计涨幅189%,江苏恒瑞制药首日涨25%后累计涨幅31%[4] 商业模式与盈利能力 - 中国创新药企打破"持续烧钱"刻板印象,百济神州2025年Q1实现GAAP盈利,全年收入指引49-53亿美元[7] - 信达生物2024年Non-IFRS净利润首次转正达3.3亿元,康方生物产品销售收入突破20亿元,EBITDA亏损收窄至2亿元[7] - BD授权收入常态化,恒瑞医药Q1利润增长主要源于BD首付款计入[9] 技术突破与交易动态 - ADC领域2024年中国license-out交易总额102.4亿美元,占全球交易额20%,科伦博泰与Merck&Co交易总额达94.75亿美元[15][16] - 双抗赛道康方生物依沃西单抗总交易额达50亿美元,普米斯生物PD-L1/VEGF双抗PM8002交易总额超10亿美元[17][19] - GLP-1减重药物全球销售额超500亿美元,中国企业加速布局多靶点及口服小分子药物[19] 研发实力与全球地位 - 近10年中国原研创新药进入临床数量达4382个,超越美国的4009个,2024年704款新药进入临床全球第一[13] - 中国在新药研发数量上已超越美国,成为全球药物创新的重要力量[13] 人才与政策支持 - 海外科研人才加速回流,显著提升国内研发能力,如Franklin Templeton指出的人才红利效应[23] - 中国药企与美国企业建立合作关系,被视作服务提供商,受美国关税上调影响有限[23]
周末重点速递丨中金称全年阶段性底部可能已经出现;券商热议中国军贸的“DeepSeek时刻”来临
每日经济新闻· 2025-06-15 10:11
汽车数据出境安全新规 - 工信部等八部门公开征求《汽车数据出境安全指引(2025版)》意见,规定汽车数据处理者向境外提供数据需申报安全评估的情形包括:向境外提供重要数据、累计向境外提供100万人以上个人信息(不含敏感个人信息)、累计向境外提供1万人以上敏感个人信息、关键信息基础设施运营者向境外提供个人信息、国家有关规定明确的其他情形 [1] 券商市场展望 中国股市 - 预计中国股市将继续区间波动,建议优化杠铃策略+关注企业出海+把握区间波动机会 [2] - A股韧性凸显,历史"大底"及今年阶段底部或均已出现,下半年或延续窄幅波动特征,节奏上或为"前稳后升" [4] - 上行空间取决于一揽子政策尤其是财政政策能否继续发力支持复苏趋势延续 [4] 美股市场 - 美股估值扩张空间或有限,杠铃策略同样有效,AI仍是投资主线 [2] 行业投资机会 互联网行业 - 下半年投资机会主要来自AI行情下的估值修复 [2] - 外部地缘环境仍是主要扰动因素,"口红效应"带动情绪经济,泛娱乐或跑赢大电商 [2] 科技行业 - "国补"带来的增量效应或在下半年逐步缓和 [2] - AI大模型行业将保持快速增长,智能辅助驾驶渗透率加速上升 [2] - 海外关税不确定性影响或将减弱 [2] 新能源汽车行业 - 中国新能源乘用车全年销量将同比增长24%,对应渗透率53.3% [2] - 智能辅助驾驶快速向大众市场渗透,带动激光雷达、智驾芯片、智驾Tier1等环节受益 [2] 消费行业 - "新消费"企业有望继续跑赢整体消费板块 [2] - 基本面较强的传统消费企业在较低估值水平及短期数据催化下,有望表现出较大股价弹性 [2] 医药行业 - 多款国产创新药有望实现出海授权,创新药销售收入高速增长 [3] - 数个国产重磅创新药物年内获批,更多生物科技企业迎来商业化盈利 [3] - 对2025年下半年医药板块整体持乐观态度,首选推荐创新药板块 [3] 军工行业 - 全球军贸格局或将重塑,中国有望进一步巩固全球军工竞争地位 [6] - 中国军贸进口份额从2015年的4.3%降至2024年的0.2%,正从传统装备向高技术、高附加值产品拓展 [6] - 可关注雷达系统、制导装备、无人机&反无人机技术、军机、装甲车、军舰等领域 [6] 金融科技行业 - 稳定币代表金融科技领域的大变革,可能成为下一代支付技术 [7] - USDT当前发行规模超1500亿美元,资产规模的80%配置了美债和类美债资产 [7] - 稳定币将推动货币国际化,后续关注Circle上市等催化 [7][8] 行业配置建议 - 产能周期视角下的机会:工业金属、锂电池、创新药、商用车、轨交设备和铁路公路等 [5] - 高景气机会:AI产业链(云计算、算力、机器人、智能驾驶)、国防军工 [5] - 分红确定性强的红利板块:消费龙头、公用事业等 [5]
ESG信披观察 | DeepSeek概念股普遍加大绿电使用并升级算力 专家提醒:注意碳排放数据真实性
每日经济新闻· 2025-06-14 15:00
AI普惠与社会责任 - 科大讯飞程序员李连才开发"信息无障碍顾问""中医推拿顾问""盲人导师助手"三个智能体,以AI技术帮助视障群体[1] - 科大讯飞通过AI技术促进教育公平,实现精准教研和学生学情分析,并构建AI诊疗系统提升基层医疗水平[8] - 三六零通过SaaS产品"360安全云"助力中小微企业数字化转型,服务中小企业、教育机构等[8] ESG披露与碳排放 - A股42家DeepSeek概念股中24家发布2024年度ESG报告,披露率57%,市值TOP10企业中有9家公布温室气体排放数据[1][2] - 科大讯飞2024年5月数据中心绿电占比达90%,采用风光电等可再生能源[4] - 金山办公在数据中心楼顶安装2640块光伏板,年发电70万~80万千瓦时,节能机房设计年节约传统能耗81万千瓦时[5] - 中科曙光首创ParaStor液冷存储系统,EB级数据中心年节电450万千瓦时,减少近1500吨二氧化碳排放[5] 算力升级与技术创新 - 中科曙光实施"立体计算"战略,通过立体算力建设、应用赋能和生态共生加速算力转化[6] - 浪潮信息推出"智慧计算"战略,发布元脑第八代算力平台,支持"一机多芯"并打破多项国际测试纪录[6] - 优化算法可减少训练阶段算力消耗,同时提升AI性能和效率,高质量数据结合精进算法能进一步降低算力需求[7] AI资源分配与普惠挑战 - AI资源分配不均导致部分企业边缘化,技术鸿沟引发就业替代、服务歧视等问题[8] - 行业需降低AI使用成本和门槛,保障公平竞争和社会就业环境[8]
IBM陈旭东:DeepSeek很热,但影响尚未全面到来!
快讯· 2025-06-13 18:32
"DeepSeek很热,但它的大影响还没全面到来"。"生成式AI影响最大的不是企业,而是他擅长的领域 ——文生图、翻译、写代码等,这些利用大语言模型能力的领域发展迅速,但真正改变企业流程、提升 效率的事情并不多。"这是IBM大中华区董事长、总经理陈旭东对当前生成式AI发展的冷静评价。(新 浪科技) ...
独家对话IBM陈旭东:DeepSeek很热,但影响尚未全面到来! 丨 科创100人
新浪科技· 2025-06-13 18:24
生成式AI发展现状 - DeepSeek热度高但对企业的大规模影响尚未全面到来,当前主要影响集中在文生图、翻译、写代码等大语言模型擅长的领域[2][3] - 许多企业拥抱AI前需补数字化基础课,数字化水平不足导致AI应用受限[4] - 智能体本质是软件,规模化应用需信息化基础、工具平台和真实需求三者结合[4][5] 企业AI投资误区与策略 - 客户对AI存在三大误区:认为AI无所不能、拥抱AI容易、ROI计算不准确(将信息化投资误计入AI)[5] - AI投资需覆盖硬件(算力)、软件平台、人员培训三方面,缺一不可[5][6] - 企业应优先开发知识库和智能问答系统,这类"入门级"投资具有长期价值且不会后悔[6][7] - AI投资ROI需长远评估,重点关注重复性工作优化,IBM内部HR系统应用AI后工单减少61%[6] 行业盈利与竞争格局 - 全球生成式AI产业仍处早期,OpenAI尚未回收训练成本,国内企业盈利周期将被拉长[7] - 当前盈利的AI企业多为服务型公司(如数据清洗),类比淘金热中卖牛仔裤的商家,规模有限[8] - 国内AI企业分三类:大模型+云服务巨头(阿里/腾讯等)、定制化开发服务商、IBM等混合云+工具平台提供商[8][9] - IBM混合云战略集成1000+流行软件(如SAP、CRM),具备API调度优势,重点服务民营和出海企业[10] 数字化转型与AI协同 - 企业需将历史手工数据转化为AI可读格式,类似《纽约时报》旧报纸电子化案例[7] - 数字化是AI应用前提,IBM过去40年帮助国企/银行转型的经验现拓展至民营企业[10]
阿里千问与DeepSeek入选全球AI开源贡献榜前十
快讯· 2025-06-12 18:33
AI开源社区贡献榜 - Hugging Face发布最新AI开源贡献榜 中国团队表现亮眼 阿里通义千问位列全球第五 中国第一 DeepSeek排名第九 是前十中唯二的非美国机构[1] - 榜单评估指标包括开源模型 数据集 开发者关注度 社区活跃度及全球影响力等[1] 中国AI公司表现 - 阿里通义千问跻身全球第五 中国第一 展现中国AI公司在开源领域的领先地位[1] - DeepSeek位列全球第九 与阿里通义千问同为前十中仅有的非美国机构[1] 评估标准 - Hugging Face官方对全球开源模型主要机构进行评估 考察多维度指标[1] - 评估维度包括开源模型 数据集 开发者关注度 社区活跃度及全球影响力[1]
OpenAI开源模型发布推迟至夏末,为了狙击DeepSeek R2?
华尔街见闻· 2025-06-11 10:37
OpenAI开源模型延期 - OpenAI宣布原定6月推出的开源模型将延期至"今年夏天晚些时候",首席执行官Sam Altman表示研究团队取得了"出乎意料且相当令人惊叹"的进展,需要更多时间完善[1] - 该开源模型规划具备与GPT-4o相当的复杂推理能力,目标性能超越当前顶尖开源模型如中国DeepSeek的R1模型[2] - 公司曾讨论为开源模型增加连接云端大模型的接口功能以处理超复杂查询,但最终版本是否包含这些功能尚不确定[2] AI行业竞争态势 - 法国Mistral实验室推出首个AI推理模型系列Magistral,中国通义千问(Qwen)4月发布混合AI推理模型系列,行业竞争显著加剧[2] - OpenAI面临战略转型压力,Altman承认过去在开源领域"站在历史错误的一边",此次开源被视为修复开发者关系的核心举措[2] - 市场猜测OpenAI延期可能为狙击中国DeepSeek即将发布的R2模型,避免性能对比风险[2] DeepSeek技术进展 - DeepSeek R2作为R1迭代版本,在技术架构、功能特性和资源效率实现显著升级,摩根士丹利预测其AI调用成本大降87%且具备多模态处理能力[3] - 公司保持每季度重大更新的开发节奏,2024年9月推V2.5、12月发V3基础架构、2025年3月升级至V3-0324版本[4] - 创始人梁文锋强调中国要成为创新贡献者而非搭便车,将探索通用人工智能作为核心使命[4]