Workflow
Seek .(SKLTY)
icon
搜索文档
Kimi和Minimax,争夺“下一个DeepSeek”心智
36氪· 2025-07-01 16:41
行业格局演变 - 中国大模型行业格局从"六小龙"演变为"基模五强",DeepSeek的崛起显著改变竞争态势[1] - Kimi和Minimax近期分别推出Kimi-Dev编程模型/Minimax-M1推理模型,通过技术突破寻求差异化竞争[1][7][11] - 行业竞争焦点从早期用户争夺转向技术前沿突破,更适合以技术为核心的创业团队[6] Kimi战略与产品 - 聚焦Agent赛道推出Kimi-Researcher,专攻金融/学术等垂类场景,平均生成万字报告并引用26个可溯源信源[7][8] - 采用端到端自主强化学习技术,单任务平均进行23步推理,筛选前3.2%高质量信息,在低幻觉垂类赛道获积极反馈[7][8] - 技术路线与DeepSeek多次"撞车",包括注意力机制优化等基础研究,显示其技术实力仍处第一梯队[17][18] Minimax技术突破 - 推出4560亿参数推理模型M1,支持100万token输入/80k token输出,长上下文能力全球前二[11] - 采用MoE架构创新,训练成本性价比显著,性能超越多数开源模型及Claude 4 Opus,仅次于Gemini 2.5 Pro[11] - 2023年即押注MoE路线,早于行业转向,但市场影响力未达预期[20] 竞争策略差异 - Kimi选择垂直Agent路线,通过深度研究功能切割专业场景,避开大厂主战场[3][29] - Minimax坚持全栈布局,通过多模态技术(如AI语音合成)展示全场景渗透能力[13][29] - 两家公司均试图打破"参数比拼"的初级竞争模式,转向用户心智占领[27] 创始团队特质 - Kimi创始人杨植麟兼具顶尖学术背景(CMU/苹果AI导师)和企业级AI落地经验,融资能力突出[16] - Minimax创始人闫俊杰技术预判精准,早期All in MoE路线但商业化节奏滞后[20] - 投资方认为团队技术预判能力(如长文本/MoE布局)仍是核心竞争优势[22][29] 行业趋势观察 - AI应用加速渗透生活场景,从工具转向收益驱动的商业化阶段[25] - 通用Agent市场被大模型公司主导,创业公司需聚焦垂直领域构建壁垒[25] - 技术突破与市场定位的精准耦合成为重塑行业认知的关键,参考DeepSeek崛起路径[27][29]
A股半年收官 北证50指数半年涨近40% DeepSeek概念及兵装重组概念上半年领涨
新华财经· 2025-06-30 15:43
市场表现 - 沪深两市主要股指30日开盘涨跌不一,沪指微幅低开,深成指和创业板指高开 [1] - 沪指收盘报3444 43点,涨幅0 59%,成交额约5671亿元 深成指报10465 12点,涨幅0 83%,成交额约9197亿元 创业板指报2153 01点,涨幅1 35%,成交额约4622亿元 [1] - 科创综指报1229 83点,涨幅1 70%,成交额约1128亿元 北证50指数报1447 18点,涨幅0 52%,成交额约307亿元 [1] - 沪指上半年涨2 76%,深成指上半年涨0 49%,创业板指上半年涨0 53%,科创综指上半年涨9 93%,北证50指数上半年涨39 45% [2] 板块表现 - 军工股延续近期强势表现,板块指数已连续6个交易日收阳 脑机接口板块指数当日显著高开,早盘期间震荡攀升 [1] - 游戏股早盘期间波动上扬,午后在高位窄幅整理 光刻机、大飞机、BC电池、商业航天、培育钻石、外骨骼机器人、电子身份证等板块亦有较大幅度上涨 [1] - 银行、证券等金融股多有小幅下跌,但整体跌幅不大 [1] - 年初至今,DeepSeek概念、兵装重组概念、贵金属、可控核聚变、农机、人形机器人、小红书概念、脑机接口、AI智能体、稀土永磁板块涨幅靠前 [2] 机构观点 - 7月A股市场将迎来业绩、贸易与政策三大变量的集中考验,市场波动率可能显著提升,但也孕育着重要的结构性机会 [3] - 投资者宜追寻相对确定性投资机会,重点关注半导体设备、光伏组件等业绩确定性高的硬科技板块,同时布局可能受益政策刺激的地产链、数字经济等方向 [3] - 短期看,海外风险边际下行,行业亮点不断,股市活跃资金偏多的背景下,市场情绪有望延续修复 [3] - 中期视角下,国内政策发力应对经济下行压力是较为确定的 随着宏观政策持续为经济复苏提供助力,国内经济基本面预期逐步改善 [3] - 中国股市的无风险利率实质性降低,中长期资金和民间资本入市已进入历史转折点 人民币由过去的贬值预期转向稳定甚至略升值的预期,也是中国资产重估的重要推力 [4] 资金动态 - 今年以来已有663只新基金成立,合计发行份额达5267 68亿份 股票型基金明显成为基金公司今年布局的重点 [5] - 2024年债券型基金的发行份额占比为70 19%,今年以来显著下降至46 89% 股票型基金的发行份额占比从21 14%显著上升至35 35% [5] - 股票型基金新发规模创下自2021年下半年以来的近4年新高 [5] 行业数据 - 2025年5月,期货公司实现营业收入31 72亿元,同比增长2 03% 实现净利润8 2亿元,同比增长19 88% [6] - 2025年1至5月,期货公司累计实现营业收入152 47亿元,同比增长5 40% 累计实现净利润40 84亿元,同比增长34 56% [6]
选择合适的大型语言模型:Llama、Mistral 和 DeepSeek
36氪· 2025-06-30 13:34
大型语言模型(LLM)比较分析 1 计算要求 - Llama、Mistral和DeepSeek提供不同参数规模的模型(7B、13B至65-70B),参数数量直接影响每次推理所需的计算量(FLOPs)[2] - 7B模型每个token生成需约140亿FLOPs,70B模型则需约1400亿FLOPs,计算量相差10倍[2] - DeepSeek 67B模型与Llama 70B计算需求相当,每个token生成约1e11 FLOPs[2] 2 硬件需求 - 7B-13B模型可在单GPU运行(7B需15GB VRAM,13B需24GB VRAM),70B级模型需2-4个GPU或专用加速器[3][4] - 7B/8B模型适合消费级GPU(如NVIDIA 16GB显存),65B+模型权重达130-140GB需多GPU并行[3][4] - Mistral 7B因优化架构可在CPU边缘设备运行,适合离线场景[15] 3 内存管理 - FP16推理时7B模型占14-16GB内存,13B占26-30GB,65B+超130GB需多设备[5] - 微调需2-3倍模型内存,LoRA/QLoRA技术可将内存需求降至全量微调的1/10[6][7] - Mistral滑动窗口和DeepSeek MLA技术优化长上下文处理,降低KV缓存内存占用[8] 4 性能权衡 - 交互式应用(如聊天机器人)优先低延迟(7B模型每秒数十token),批处理任务侧重吞吐量(70B模型每秒数token)[10] - 动态批处理技术可平衡延迟与吞吐量,提升GPU利用率30%以上[11] - 小模型单请求响应更快,大模型通过硬件并行化实现更高精度[11] 5 生产部署 - 三大模型均兼容Hugging Face生态,支持Transformers/vLLM/TensorRT-LLM等框架[13][16] - 云部署方案包括AWS Bedrock(Mistral)、IBM watsonx.ai(8×7B混合模型)及A100/H100虚拟机[15] - 4位量化技术使7B模型可在高端CPU运行,Llama.cpp优化后支持手机端部署[15] 6 基准性能 - DeepSeek 8B在MMLU(78.1%)、GSM8K(85.5%)、HumanEval(71.1%)全面领先,数学/代码能力突出[18][21] - Llama-3-8B综合能力强(MMLU 68.4%,GSM8K 79.6%),适合通用场景[19][23] - Mistral 7B效率最优(MMLU 60.1%),推理速度比Llama-2-13B快30%[20][24] 7 技术演进 - 当前8B模型性能已超越早期30B模型,MMLU得分提升20个百分点[22] - 架构创新(滑动窗口/MLA)使小模型处理131k长上下文成为可能[8] - 训练技术突破(思路链提示/RLHF)推动小模型在数学/代码领域接近GPT-4水平[22]
DeepSeek德国遭下架揭示AI出海哪些难题?
36氪· 2025-06-30 08:35
欧美数据合规壁垒 - 德国数据保护机构要求苹果、谷歌下架DeepSeek应用,理由是"数据安全风险",而Meta等欧美企业仍可运营,反映规则制定权的争夺[1][5] - 欧盟GDPR条例表面保护隐私,实际成为贸易壁垒,中国企业合规成本较普通行业高20%以上,微软为合规投入17亿美元建数据中心[2] - 美国以国家安全为由禁止TikTok获取关键资源,Meta仅需交罚款即可运营,印尼征收10%数字服务税,南非要求60%云计算服务本地化,AWS为此多投4亿美元[3] 中国AI企业突围路径 - **在地设点**:TikTok"三叶草计划"年投入12亿欧元建独立数据中心,避免Meta式4%年营收罚款[8] - **技术换信任**:华为在沙特采用加密技术处理医疗数据,获5亿美元投资并参与NEOM智慧城市项目,但技术方案难以跨国复用[9] - **开源透明**:DeepSeek开源后社区贡献200+微调模型,推理速度提升40%,合规成本降50%,但需承担社区模型责任风险[10][11] 新兴市场拓展策略 - 中东市场需遵守宗教规则(如伊斯兰教法禁人体图像),沙特要求数据本地存储,华为通过加密技术绑定政府项目[15] - 拉美侧重主权自主,巴西2025年将中国AI技术纳入"优先采购清单"以对冲美国影响[16] - 东南亚需利益共享,需提高本地伙伴分成比例突破谷歌/Meta生态壁垒,如Gojek、Grab[17] 全球规则制定权争夺 - 技术层:全球83%AI论文用PyTorch,华为MindSpore仅占4%,需通过持续开源吸引开发者[21][22] - 基建层:宁夏数据中心利用风电将PUE降至1.1,符合欧盟碳关税要求,"绿电+算力"打破碳壁垒[24] - 治理层:中国在ISO/IEC AI标准提案采纳率18%(美国39%),宁德时代通过CTP电池技术重构全球测试规范[25]
德国一机构要求苹果谷歌下架DeepSeek,中方多次表态:反对将经贸科技问题政治化
环球时报· 2025-06-30 06:37
德国数据保护机构要求下架DeepSeek应用 - 德国数据保护专员梅克·坎普要求苹果和谷歌在德国下架中国初创公司DeepSeek的应用 指控其涉嫌违反欧盟《通用数据保护条例》(GDPR)[1] - 指控内容包括非法将用户个人数据传输至中国 且未能证明在中国的德国用户数据受到与欧盟同等保护[3] - 行动由坎普与巴登-符腾堡州、莱茵兰-普法尔茨州和不来梅的数据保护专员协调 因DeepSeek在欧洲无分支机构 由当地机构管理[3] 国际监管动态与DeepSeek回应 - 意大利、韩国、澳大利亚当局也在调查DeepSeek 意大利调查是否违反GDPR 韩国曾以数据保护不足为由暂停下载 4月底恢复服务[4] - 中国外交部回应称中国政府依法保护数据隐私和安全 反对泛化国家安全概念和将经贸科技问题政治化[4] - 南开大学专家刘刚表示AI大模型通常仅分析用户提供数据得出结果 不会跨境传输数据[3] 应用下架影响与法律依据 - 若苹果和谷歌遵循评估 DeepSeek将从应用商店下架 但德国当局无权强制下架 浏览器版本不受影响[3] - 依据欧盟《数字服务法》要求屏蔽应用 该法案在德国由联邦网络管理局负责执行[4] - 《明镜》周刊指出GDPR规定对非法运营商可处全球收入4%罚款 某些商业行为可能被禁止[4] 当前应用状态 - 截至29日 DeepSeek在苹果应用商店仍可查阅和下载[5]
OpenAI最新点名的中国竞争对手,不是DeepSeek
观察者网· 2025-06-29 18:29
开源大模型与智能体趋势 - 开源大模型和智能体成为AI领域新焦点,以DeepSeek和Manus为代表 [1] - AI六小虎热度下滑,部分观点认为其陷入发展瓶颈 [1] OpenAI对中国AI企业的评价 - OpenAI点名智谱为中国大模型领域新锐代表,称其取得"显著进展" [1][3] - 智谱被视为中国打造独立自主AI生态的重要力量 [3] - OpenAI内部分析师认为智谱的"中国版OpenAI本土化产品"在欧美进入前取得进展 [4] 智谱的国际化战略 - 智谱响应"一带一路"和"数字丝绸之路"战略,向越南、印尼、马来西亚等国家输出基础设施和技术支持 [4] - 展示"负责任、透明且易于审计"的中国AI方案,合作对象包括阿联酋、沙特和肯尼亚等 [4] - 智谱董事长刘德兵表示公司致力于推动国产大模型技术出海,帮助共建国家构建自主大模型 [6] OpenAI与智谱的竞争关系 - CNBC评论称OpenAI将智谱视为威胁 [5] - OpenAI与阿联酋达成"星际之门阿联酋"项目合作,计划在亚太推广类似模式 [5] - 智谱被美国商务部列入实体清单后,OpenAI仍点名其出海进展 [5] 智谱的产品与资本动态 - 智谱开发GLM系列模型,产品矩阵包括智谱清言、CodeGeeX和CogVLM [5] - 公司于2024年启动上市辅导流程 [5]
德国对DeepSeek下手
观察者网· 2025-06-28 20:11
德国数据保护要求 - 德国数据保护专员要求苹果和谷歌将DeepSeek应用从德国应用商店下架 理由是数据保护方面的担忧 [1] - 专员声称DeepSeek非法将用户个人数据传输至中国 但未提供具体证据 [1] - 谷歌表示已收到通知正在评估 苹果暂未回应 DeepSeek也未置评 [1] 欧盟潜在禁令风险 - 专家分析德国下架要求可能导致欧盟范围内对DeepSeek的禁令 因德国规定适用于欧盟其他国家及英国 [1] - 禁令实施需欧盟监管机构达成共识 认定举措合适 [1] 欧洲国家限制措施 - 意大利已封禁应用商店中的DeepSeek [2] - 荷兰禁止在政府设备上使用DeepSeek [2] - 比利时建议政府官员不要使用DeepSeek 相关分析仍在进行中 [2] DeepSeek技术发展 - DeepSeek今年1月推出R1大模型 凭借低成本和高效能引发全球行业关注 [1] - 美国和部分欧洲国家随后以数据安全政策为由展开审查 [1] 中国政府立场 - 中国外交部表示中国政府依法保护数据隐私和安全 不要求企业违法采集或存储数据 [2] - 中方反对泛化国家安全概念和将经贸科技问题政治化 将维护中国企业合法权益 [2]
朱民:AI对经济影响巨大,DeepSeek等技术有潜力改变整个游戏规则
搜狐财经· 2025-06-27 11:37
地缘政治对全球贸易和投资的影响 - 当前地缘政治冲击正在迅速改变全球贸易格局,欧洲和亚洲的贸易总量已下降约20% [2] - 美国对某些商品征收超过200%的关税可能导致相关贸易难以进行 [2] - 地缘政治不确定性导致供应链投资停滞,企业难以制定长期决策 [2] - 地缘政治风险对股权市场产生负面影响,进而波及全球股市 [2] 中国股市与政策应对 - 全球股市因地缘政治持续动荡,但中国股市表现相对平稳 [3] - 2018年贸易战为中国提供经验,政策储备如量化宽松可构建市场波动"安全网" [3] AI技术对经济的影响 - AI技术如DeepSeek有潜力改变游戏规则,对经济产生巨大影响 [3] - AI发展经历两个关键阶段,重大转变是转向开放式、开源式技术 [3] - DeepSeek等开源技术降低企业应用AI门槛,重塑行业竞争格局 [3] - 企业可利用开放AI资源,开启"AI+"时代,推动经济新路径 [3]
AQ对医院意义或不输DeepSeek
新京报· 2025-06-26 18:31
医疗AI行业现状 - 国内已出现近300个医疗大模型产品,但真正被广泛使用的几乎没有,主要受限于技术门槛、安全性、责任划分和合规路径等多重现实门槛 [1] - AI医疗产品主要分为侧重科研分析的通用大模型和聚焦影像识别、辅助诊断的垂直模型 [1] - 手术室被视为"医疗人工智能的高地",但通用大模型难以胜任手术室内的"秒级更新"和实时反馈需求,更适合用于医学教育和事后分析 [2] AQ产品定位与功能 - AQ聚焦问诊咨询、导医分流、报告解读、用药指导等高频服务点,试图成为医疗系统之外的"智能缓冲区" [1] - 产品已接入90万医生、覆盖5000家医院,通过AI名医分身提供24小时问诊服务,并将问诊内容同步到医生工作站 [3] - 支持拍照上传检验单,系统自动分析异常指标、提供解读意见,并能关联历史记录提示是否需要进一步就医 [7] - 建设健康管理生态,支持用药计划、慢病监测、设备对接、饮食与运动建议等多维健康档案管理服务 [8] AQ技术能力 - 依托蚂蚁医疗大模型在HealthBench与MedBench两大权威榜单持续领跑 [3] - 在OpenAI主导的HealthBench测评中,复杂推理能力(HealthBench Hard得分0.2702)与医学共识能力(HealthBench Consensus得分0.9275)两项核心指标超过DeepSeek [3] - 采用多模态识别模型,支持检验单自动分析 [7] - 超过百位医生参与模型训练,设有20位三甲医院学科带头人组成的顾问团对输出结果进行周期性评估和优化 [11] AQ实际应用效果 - 上海仁济医院泌尿科与蚂蚁集团共建的"RJUA智能体"上线半年内服务30万患者,占门诊总量超过50% [7] - 医疗文书工作占用了手术团队医护人员约50%的工作时间,AI协助可极大减轻医护负担 [3] - 每天有上千万份医学检验报告出具,但90%的人看不懂报告内容,AQ可帮助解读 [7] 医院对AI的需求 - 三级医院仅占医疗机构总数的7.8%,却承担了全国50%以上的门诊量,资源高度集中导致"号难挂""医难见"现象普遍 [6] - 医院更需要AI在"医护最疲惫的重复性简单工作方面帮一把",让医生把有限时间用于核心诊疗环节 [4] - AI应明确应用边界与角色定位,分为患者自用、基层医生辅助和专家决策支持三个层级 [11] AQ合规优势 - 与地方卫健委合作,具备合法身份、数据来源合规 [10] - 所有输出内容均以"AI生成"标注,不作为最终医疗建议,引导用户在必要时"仍需就诊"或"建议咨询医生" [12] - 符合《卫生健康行业人工智能应用场景参考指引》明确的"咨询+连接+辅助"层级设计 [12]
DeepSeek未上榜!
中国基金报· 2025-06-26 18:08
全球独角兽榜单概况 - 截至2025年1月1日全球共有1523家独角兽企业总价值超40万亿元[2] - SpaceX以2.6万亿元首次成为全球价值最高独角兽企业[3] - OpenAI以2.2万亿元位列第二过去一年价值增长1.46万亿元为增长最多企业[3][5] AI行业表现 - 478家上榜企业与AI相关占比31.38%其中128家为纯AI公司[4] - 榜单前十名中三家新入围企业有两家来自AI领域包括xAI和Anthropic[7] - xAI成立仅两年以8400亿元价值新上榜排名第四[7] - OpenAI价值两年间从1380亿元增长至2.2万亿元[6] 中国企业表现 - 字节跳动以2.2万亿元价值与OpenAI并列第二过去一年增长5840亿元[3][6] - 蚂蚁集团以6350亿元价值排名第五[3] - Shein价值3650亿元但过去一年下降1095亿元[3] - "杭州六小龙"中群核科技(160亿元)宇树科技(125亿元)强脑科技(90亿元)三家企业上榜[8] - 群核科技2021年估值已超20亿美元正冲刺港股IPO[9] - 宇树科技员工超1000人年营收超10亿元[8]