Workflow
V3模型
icon
搜索文档
2025年上半年中国商界十大热门人物
搜狐财经· 2025-07-02 11:40
评选依据 - 基于行业影响力、创新突破性、社会话题度及企业战略变革性,综合企业营收增速、技术突破、舆论场声量等维度 [1] - 聚焦梁文锋、饺子、王宁、董明珠等十位商界人物,其故事折射出中国商业文明在效率、伦理与创新之间的持续进化 [2] 梁文锋(深度求索) - 推出DeepSeek人工智能通用大模型,引爆全球市场 [3] - 2月参加民营企业座谈会 [5] - 3月推出DeepSeek-V3模型更新版 [6] - 持续推动DeepSeek向通用人工智能迈进 [7] - 6月以1846.2亿元财富首次上榜新财富创富榜前10强 [9] 雷军(小米集团) - 2月参加民营企业座谈会 [10] - 3月参加全国两会 [11] - 3月底小米SU7发生碰撞后车辆爆燃导致3人死亡事件 [11] - 6月小米SU7系列交付量突破25万台,推出首款SUV车型YU7,预订量超过29万台 [11] - 小米汽车工厂引入数字孪生技术,将产能提升至年产35万台 [12] 方洪波(美的集团) - 1月签发"六条禁令",体现"反加班"意识 [13] - 春节后参加广东省高质量发展大会并发言 [14] - 美的集团2024年度营收4091亿元,登顶全球家电企业榜首,B端业务首次突破千亿 [15] - 推动美的全球化布局加速 [15] 刘强东(京东集团) - 2月推动京东外卖上线,首月订单量突破2500万单 [16] - 4月亲自送外卖并与外卖员一起吃饭、喝酒 [16] - 京东物流通过AI算法实现全球库存调配,海外营收增长65% [18] - 6月底京东外卖日订单量突破2500万单,市占率达到31% [19] 陈天石(寒武纪) - 寒武纪市值突破3200亿元,首款3nm芯片"玄戒O1"流片成功 [20] - 宣布投资可控核聚变项目,引发资本热炒 [20] 王兴兴(宇树科技) - 人形机器人上央视春晚,使宇树科技迅速出圈 [22] - 2月参加民营企业座谈会 [22] - 宇树科技估值超120亿元,完成C轮融资后加速IPO [22] 曾毓群(宁德时代) - 宁德时代市值稳居全球动力电池第一,成立百亿基金加码储能 [24] - 主导"零跑汽车电池技术输出"与特斯拉FSD合作传闻 [24] 王宁(泡泡玛特) - 泡泡玛特旗下LABUBU拍出108万天价 [24] - 6月以1467亿财富成为河南新首富 [26] - 泡泡玛特市值高达3360亿港元 [26] 杨宇(《哪吒》导演/可可豆动画) - 《哪吒之魔童闹海》以157亿票房登顶中国导演票房榜 [29] - 特效镜头达1900个,海底龙宫场景耗时三年打磨 [29] - 不参加庆功宴而闭关创作《哪吒3》 [31] 董明珠(格力电器) - 2月将格力空调专卖店改名为"董明珠健康家" [32] - 618与孟羽童合开直播间,销售额破亿 [34] - 推动格力空调压缩机技术突破,但空调主业增速放缓至5% [34]
一文了解DeepSeek和OpenAI:企业家为什么需要认知型创新?
混沌学园· 2025-06-10 19:07
核心观点 - AI技术正在重新定义商业创新模式,企业需转变思路以保持竞争力 [1][2] - OpenAI和DeepSeek分别通过不同路径实现AI技术突破,为行业提供创新范式 [3][4] - AI能力的"涌现"现象成为技术跃迁的关键特征 [19][20][21] - 人机交互范式因ChatGPT发生根本性变革 [22][23][24] - 中国公司DeepSeek打破"美国原创、中国应用"的思维定式,展现基础研究实力 [75][77][78] OpenAI的创新路径 创立背景 - 2015年由马斯克和奥特曼创立,初衷是防止AI技术被巨头垄断 [9] - 从谷歌挖来核心科学家伊利亚·苏茨克维尔,坚持开源、安全、普惠理念 [10][12] 技术突破 - 基于Transformer架构的"自注意力机制"大幅提升语言理解能力 [13] - Scaling Law揭示模型规模与性能的线性关系,指导大规模投入 [15][16] - GPT系列模型通过"涌现"现象实现能力跃升,参数量临界点触发智能爆发 [19][20] 产品里程碑 - ChatGPT通过自然语言交互降低使用门槛,引发全球现象级应用 [22][23] - 推理模型o1实现从直觉思维(系统1)到理性推理(系统2)的认知跃迁 [26][30] DeepSeek的逆袭战略 技术路线 - 提出"有限Scaling Law",在资源受限下追求高性能 [32][33] - MLA技术优化内存效率,MoE架构实现计算资源动态分配 [38][39][42] - V3模型6710亿参数仅激活37亿,训练成本5557万美元(行业1/10) [44] 核心突破 - R1模型采用纯强化学习(类似AlphaGo Zero),展示完整推理过程 [45][47][49] - 在奥数竞赛中与OpenAI o1准确率相当,登顶美国应用榜单 [50][51] 组织创新 - 动态团队构成和自组织管理激发"涌现"式创新 [55][56][57] - 研究员自主提出MLA架构和训练公式,体现扁平化协作 [59][60] - 150人论文署名包含数据标注员,打破传统KPI束缚 [61][62] 行业启示 技术趋势 - AI从专用工具向通用智能演进,"涌现"成为能力突破关键指标 [20][21] - 对话式交互(ChatGPT)和推理能力(o1/R1)定义下一代AI标准 [23][26][45] 创新生态 - 中国公司首次在基础研究领域实现全球领先,打破技术跟随惯性 [75][77] - 资源效率(DeepSeek)与规模投入(OpenAI)并存,拓宽行业可能性 [32][44] 组织变革 - 传统金字塔管理让位于开放协作和资源自由调配的新型研发模式 [55][63][68] - "非标准人才"和纯粹技术热情成为创新核心驱动力 [66][67]
小红书开源1420亿参数大模型,部分性能与阿里Qwen3模型相当
钛媒体APP· 2025-06-10 09:07
小红书开源大模型dots.llm1 - 小红书hi lab团队开源首款文本大模型dots.llm1 包括base模型和instruct模型 并公开训练信息如超参数和中间训练checkpoint [2] - dots.llm1采用混合专家模型(MoE)架构 总参数量1420亿 推理时仅激活140亿参数 使用11.2万亿token高质量训练数据 [3] - 模型性能对标阿里Qwen系列 dots.llm1.inst在中英文通用场景、数学、代码、对齐任务上表现亮眼 部分性能与Qwen3-32B相当或更优 [6][7] 技术细节与性能表现 - 训练数据质量显著优于开源TxT360数据 经过两阶段SFT训练得到最终模型 [5] - 优化Grouped GEMM算子 在英伟达H800上前向计算平均提升14% 反向计算平均提升6.68% [5] - 中文任务表现突出 CLUEWSC得分92.6 C-Eval得分92.2 超越DeepSeek-V3等模型 [7] - 在MMLU、DROP等英文基准测试中表现接近主流大模型 代码生成能力与Qwen2.5-72B相当 [8] 公司战略与估值 - 小红书2023年起持续投入大模型研发 近期推出AI搜索应用"点点"和"问一问"功能 [9] - 公司估值从200亿美元跃升至260亿美元 一级市场老股报价达350亿美元 2024年净利润超10亿美元 [9] - 股东包括真格基金、金沙江创投、阿里、腾讯等20余家知名机构 [9] 未来发展方向 - 计划集成更高效架构设计如GQA、MLA和线性注意力 探索更稀疏MoE层提升计算效率 [10] - 将加深对训练数据的理解 探索更接近人类学习效率的方法 [11] - 技术文档显示团队计划贡献更多全模态大模型 可能发力多模态领域 [11]
DeepSeek核心高管离职创业,瞄准Agent赛道
虎嗅APP· 2025-06-09 20:54
以下文章来源于AGI接口 ,作者宋思杭 AGI接口 . AI卷起的财富风暴。 出品|虎嗅科技组 作者|宋思杭 值得注意的是,这并非AI行业首次出现核心高管离职创业的案例。从OpenAI的多位联合创始人出 走,到国内大厂AI团队的人才分流,高端AI人才的流动已成为行业常态。 一个近两年在OpenAI发生的典型案例是,曾一直与奥特曼不和的首席科学家伊利亚在2024年5月 离开公司后一个月,便联合前Y Combinator合伙人格罗斯(Daniel Gross)和前OpenAI工程师列 维(Daniel Levy)共同创立Safe Superintelligence(简称"SSI"),迄今为止,这家公司总融资额 已达到30亿美元,第二轮融资后估值直接飙升至320亿美元。SSI也因此成为史诗级独角兽。 然 而 , 尽 管 关 于 这 位 DeepSeek 核 心 高 管 的 创 业 项 目 并 无 相 关 融 资 披 露 , 但 这 并 不 妨 碍 , 从 DeepSeek"出走"的人也有可能创造下一个独角兽神话。 而这种现象背后恰反映了AI行业的几个特点:一是技术迭代速度快,新方向不断涌现,为创业提 供了丰富的机会 ...
DeepSeek再出手!R1升级版性能大提升,美国对手慌了?
金十数据· 2025-05-30 11:52
DeepSeek的R1模型自1月发布以来,曾因多项指标优于西方竞争对手而引发全球关注,并导致科技股暴 跌。然而,自V3模型发布后,DeepSeek的热度有所下降,市场更关注其R2模型的发布。此前有消息 称,R2将采用混合专家模型(MoE),参数量预计达1.2万亿,单位推理成本较GPT-4大幅降低。但截 至目前,DeepSeek仍未正式确认R2的发布时间。 R1推理模型的最新版本R1-0528再次引发了全球媒体的广泛关注。 路透社报道称,此次发布加剧了与美国竞争对手如OpenAI的竞争。在由加州大学伯克利分校、麻省理 工学院和康奈尔大学研究人员开发的LiveCodeBench排行榜中,DeepSeek的R1-0528在代码生成方面仅 略低于OpenAI的o4 mini和o3推理模型,但超过了xAI的Grok 3 mini和阿里巴巴的Qwen 3。 CNBC指出,DeepSeek此次升级模型发布低调,但其推理能力使其能够执行更复杂的任务。《华尔街日 报》中文版则提到,DeepSeek的低成本、高性能R1模型自年初以来吸引了全球目光,推动了中国科技 股的上涨,也显示出市场对中国AI能力的乐观预期。 DeepSeek ...
刚刚!DeepSeek,突传重磅!
天天基金网· 2025-05-29 13:41
DeepSeek模型更新动态 - DeepSeek-R1模型完成小版本试升级 用户可通过官方网页 APP 小程序测试 API接口和使用方式保持不变 但未公布具体更新内容 [1][2] - 3月底DeepSeek-V3模型完成小版本升级 新版本DeepSeek-V3-0324在推理 前端开发 中文写作 中文搜索等方面能力优化 海外评测机构排名显示其超过xAI的Grok3和OpenAI的GPT-4 5(preview) [2] - 市场传闻R2模型参数规模达1 2万亿 较R1的6710亿参数几乎翻倍 动态激活参数780亿 实际计算量仅占总参数6 5% 但未获官方证实 [1][3] 行业应用扩散情况 - 西藏大学推出"藏大智言"DeepSeek平台 昌都市政务云完成大模型部署 拉萨高新区搭建政务大模型应用打造高原特色"智慧政务"试点 [4] - 瑞幸咖啡APP和小程序上线AI智能体1 0版 接入DeepSeek及豆包大模型 实现语音点单功能 [4] - 中科江南基于DeepSeek开发财政业务AI智能助手 智能报告 智能辅助审核等应用 部分券商利用模型读取沪深300成份股ESG报告 [4] 技术影响与行业评价 - 研究指出DeepSeek通过开源生态 效率优化与成本控制打破欧美闭源垄断 推动技术民主化 重构全球AI生态 将行业从"算力军备竞赛"转向效率优化 [5] - 国信证券建议关注人工智能等"制造+科技"领域 认为政策支持与技术突破将催化行业的"DeepSeek时刻" 未来主题机会可能出现在商业航天 人工智能 新能源等技术领域 [6]
刚刚!DeepSeek,突传重磅!
券商中国· 2025-05-28 21:39
DeepSeek模型升级与市场动态 - DeepSeek-R1模型完成小版本试升级,官方网页、APP、小程序已开放测试,API接口和使用方式保持不变 [1] - 3月曾对V3模型进行小版本升级,新版V3模型在海外专业AI评测中得分超过xAI的Grok3和OpenAI的GPT-4.5(preview) [2] - 传闻R2模型参数规模达1.2万亿,相比R1的6710亿参数几乎翻倍,动态激活参数为780亿,计算量消耗仅为总参数的6.5%,但未获官方证实 [3] DeepSeek行业应用扩散 - 西藏大学推出"藏大智言"DeepSeek平台,昌都市政务云和拉萨高新区已部署DeepSeek大模型用于智慧政务 [4] - 瑞幸咖啡上线AI智能体(1.0版),接入DeepSeek及豆包大模型实现语音点单功能 [4] - 中科江南基于DeepSeek开发智能体,应用于财政业务AI助手、智能报告等场景,部分券商利用DeepSeek读取沪深300成分股ESG报告 [4] 技术突破与行业影响 - DeepSeek通过开源生态和低成本策略推动AI普惠,打破欧美闭源垄断,重构全球AI竞争逻辑 [5] - 国信证券建议关注人工智能等"制造+科技"领域,政策支持与技术突破将催化"DeepSeek时刻",相关主题机会包括商业航天、新能源、量子科技等 [6]
紫金港资本陈军:依然聚焦有长期主义的优秀企业和企业家
搜狐财经· 2025-05-21 11:56
此文为融中特别策划·《投资人:快答2025》系列报道第十九篇。 前言: 2025年,以一副猝不及防的形态出现,国防、科技、文化、国际政治领域的变化让人目不暇接。回望 过去几年,我们共同经历了一场前所未有的全球性震荡。疫情、战争、经济衰退、地缘政治……这些 关键词充斥着我们的视野,也深刻地改变着世界的运行规则。然而,危机往往与机遇并存,动荡中也 孕育着新的希望。 2025年,作为投资人,我们比任何人都更深刻地感受到时代浪潮的冲击,更能深切的感受到春江水 暖。站在产业前端,立在创新前沿,投资人对于已经到来的2025有着什么样的期冀和见解? 我们邀请了多位顶尖投资人,将以他们敏锐的洞察力和独到的见解,为我们勾勒出一幅未来经济、投 资的路线图。 2025年,创投行业行至一个关键的十字路口。随着全球经济形势之复杂变化和地缘政治的不确定性,市场面临着 全新的挑战与机遇。作为有着其中,见证过多个投资周期起伏的紫金港资本,凭借其稳健的投资策略和深刻的行 业洞察,在不确定性中寻找着确定性,为投资者照亮前行的道路。 成立于2014年的紫金港资本,以学院派投资风格著称,核心成员多为浙大校友,他们不仅拥有丰富的投资与企业 管理经验, ...
早餐 | 2025年5月16日
快讯· 2025-05-16 07:16
美联储主席鲍威尔:将重新评估2020版货币政策框架的"关键部分",长期利率可能走高,"供应冲 击"或成新常态。 美国4月PPI同比上涨2.4%低于预期,环比-0.5%,降幅创下五年来最大。美国4月零售销售环比 0.1%小幅超预期,消费者支出疲软显露端倪。 特朗普同阿联酋签2000亿美元商业协议,合作在阿联酋建5GW数据中心。卡塔尔的特朗普"礼 包"进一步揭开:主权财富基金拟十年在美投资5000亿美元。 伊朗称愿与美国达成协议。伊朗最高领袖顾问:伊朗愿承诺永不制造核武,换取美解除制裁。 哈马斯官员:若实现永久停火,可交出加沙地带控制权。 阿里Q4营收同比增7%不及预期,阿里云增长加速18%,AI收入连续七个季度三位数增长。 梁文锋参与发表回顾性论文:DeepSeek首次揭秘V3模型背后扩展方案。 Meta将推迟发布旗舰AI模型Behemoth,股价盘中跌超3%。 CoreWeave获英伟达持股7%,向OpenAI供40亿美元云计算产能。 伯克希尔Q1大砍银行股,清仓花旗,苹果持仓未变,啤酒制造商持仓翻倍,存在保密持仓。 沃尔玛Q1销售额增长2.5%略低于预期,CFO警告关税价格上涨可能从本月开始。 ...
谷歌前CEO称,中美差距已终结
搜狐财经· 2025-05-09 14:41
文︱陆弃 5月5日,《纽约时报》刊发了一篇耐人寻味的评论文章,作者不是别人,正是前谷歌首席执行官埃里克 ·施密特。这位曾长期代表硅谷秩序的人物,罕见地放下了美国科技优越感的傲慢,承认中国已经在人 工智能等前沿技术领域从"追赶者"转变为"并跑者"甚至"领跑者",直言"中国远远落后于美国的时代已 然终结"。如果说十年前这样的判断还会被视为"危言耸听",那么今天,这已成为西方智识阶层中最不 愿承认、却不得不正视的现实。 文章从DeepSeek、Temu、TikTok讲起,到人形机器人、电动汽车、工业制造,逐项列举了中国科技近 年来取得的突破。施密特指出,尽管美国对中国实施了严厉的芯片出口管制和技术打压,但这些压力并 没有使中国"退步",反而加速了其自主研发、产业迭代和人才体系的强化。"制裁的副作用",反而塑造 了更坚韧、更务实的技术生态。正如文章中那句讽刺性极强的笑话所说:"美国也应该制裁一下我们的 男足,这样他们就能踢得好点。" 在某种程度上,这是对"脱钩战略"的当头棒喝。美国想通过技术封锁遏制中国,但最后却惊讶地发现, 中国在芯片、AI大模型、机器人等领域的产业链不仅没有断裂,反而因压力而爆发出惊人的创造力。 ...