Workflow
人工智能(AI)
icon
搜索文档
DeepSeek首度公开R1模型训练成本仅为29.4万美元,“美国同行开始质疑自己的战略”
新浪财经· 2025-09-19 21:25
【文/观察者网 王一】DeepSeek今年年初以高性价比、高性能、开源驱动等特点惊艳了世界。其团队近 日在英国《自然》杂志发表论文首次披露,DeepSeek-R1模型的训练成本仅为29.4万美元,构建基础大 语言模型也只花费了约600万美元,这一成本已远远低于美国同行透露的数字,而那还只是美国公司公 布出来的大概成本。 英国路透社9月18日指出,DeepSeek的成本远低于美国竞争对手此前透露的数字,这一信息可能会再次 引发外界围绕中国在全球人工智能(AI)领域地位的讨论。印度新闻网站"Devdiscourse"19日也称, DeepSeek首次提供成本数据,引发了美国公司对自己战略的质疑。 美国有线电视新闻网(CNN)、美国彭博社等美媒19日都对DeepSeek的29.4万美元训练成本感到惊讶。 美国消费者新闻与商业频道(CNBC)评价说,考虑到OpenAI花了多少钱,DeepSeek的成本简直"惊人 (astonishing)",他们的模型已经推翻了只有拥有最先进、最快芯片的国家才能在AI竞赛中占据主导 地位这一假设,现在他们甚至用数字对此进行了量化。 17日,《自然》杂志刊登了由DeepSeek团队共同 ...
“训练成本才这么点?美国同行陷入自我怀疑”
观察者网· 2025-09-19 19:28
文章核心观点 - DeepSeek以远低于美国同行的成本实现了高性能AI模型训练 其训练成本仅为29.4万美元 基础大语言模型构建成本约600万美元 显著低于OpenAI超过1亿美元的训练成本[1][2] - 公司通过开源策略和高效计算资源使用 推动高端AI技术民主化 改变了行业竞争规则[6][7] - 公司首次在同行评审论文中披露技术细节 回应了美国对其芯片获取及技术复制的不实指控[4][5] 成本与效率突破 - DeepSeek-R1模型训练仅使用512块英伟达H800芯片 成本为29.4万美元[2] - 基础大语言模型构建总成本约600万美元 远低于美国公司公开披露的数字[1] - 采用网络爬取数据与自生成数据结合的节俭策略 仅聚焦计算投入 实现成本优化[6] 技术方法与行业影响 - 使用蒸馏技术提升模型性能并降低计算成本 通过Meta开源模型Llama构建部分精简版本[5] - 训练数据包含OpenAI模型生成内容 但属网络爬取过程中的无意结果 非刻意复制[5] - 模型实现顶级性能与高度效率 推动AI竞争从GPU数量导向转向资源效率导向[6][7] 芯片使用与合规性 - 研发前期使用A100芯片进行小模型实验 R1模型训练全程采用合法采购的H800芯片集群[4] - 在512块H800芯片上进行80小时训练 直接回应美国关于违规使用H100芯片的指控[4] 行业地位与认可 - 成为全球首个经过同行评审的主流大语言模型 获《自然》杂志刊登[2] - Hugging Face专家确认其方法可被第三方复现 无需依赖OpenAI秘密数据[6] - 被评价为"推翻仅靠先进芯片主导AI竞赛"的假设 实现"高端AI民主化"[1][6]
跨越AI鸿沟
经济观察网· 2025-09-19 19:05
过去几年中,人工智能(ArtificialIntelligence,以下简称AI)技术日新月异,几乎每一天都有新的AI模 型或应用诞生。与此同时,围绕AI的各种叙事也可谓气势磅礴。诸如"AI是新的电力""AI是新的互联 网""AI是'第四次工业革命'"这样的言论几乎不绝于耳。无论是企业年会、学术论坛,还是资本市场的 推介材料,人们谈起AI时几乎都带着一种近乎宗教般的热情;而在企业界,"AI即将全面改造企业"几乎 成为了一种共识。 然而,不久前,麻省理工学院(MassachusettsInstituteofTechnology,以下简称MIT)"互联智能体和去中 心化 AI"(NetworkedAgentsandDecentralizedAI,以下简称NANDA)项目组的一份报告却给当前的AI热 泼下了一盆冷水。根据这份名为《商业领域AI使用状况》(StateofAIinBusiness)的报告,尽管目前 80%以上的企业已经尝试使用生成式AI,约40%的企业订阅了生成式AI服务,但只有约5%的试点真正 进入生产阶段并带来了实质性的价值,其余95%的项目则未产生任何可见的回报。换言之,已经切切实 实尝到AI甜头 ...
行业转型下的合规博弈?助贷新规倒计时,36%利率或再现
南方都市报· 2025-09-19 15:31
榕树贷款产品与运营模式 - 产品年化利率范围为7.2%-36% 最高贷款额度为20万元[2] - 平台不直接放贷 作为智能综合服务平台匹配其他资方出资[4] - 实际获批额度存在个体差异 以系统审核为准 利率因用户和资方不同而无统一标准[4] 百融云创公司背景与业务结构 - 榕树贷款背后贷款机构为广州数融互联网小额贷款有限公司 系百融云创全资子公司 注册资本2亿元[2][5] - 百融云创为人工智能技术服务公司 通过MaaS和BaaS模式提供服务 2025年上半年收入16.12亿元同比增长22% 期内溢利2.01亿元同比增长41%[7][8][9] - BaaS金融行业云收入8.57亿元同比增长45% 占总收入53% 基于MaaS优势进行用户精准画像和分层 按促成信贷交易规模收取技术服务费[9][10] 助贷新规核心要求与影响 - 新规禁止增信服务机构以咨询费、顾问费等名义变相提高费率 禁止通过双融担、捆绑会员费将综合利率推高至36%[11][13] - 商业银行需确保借款人单笔贷款综合融资成本符合最高人民法院规定 超过年利率24%部分可予调减[12] - 新规对双融担模式、会员制等擦边创新造成影响 或导致助贷机构不得涉足年化利率超过24%的业务[13] 行业合规转型趋势 - 权益类产品成为助贷机构变相提高综合融资成本的方式 为维持利润而布局[14] - 新规落地后擦边高息模式难以为继 合规头部平台或迎更多机会 中小平台面临转型难题甚至被淘汰[15] - 行业洗牌已近在眼前 利率红线存在从严解读(上限24%)和从宽解读(上限36%但不受法院支持)的争议[13][15]
关税威胁下,提供5500亿美元投资的美日协议能否重振美国制造业?
第一财经· 2025-09-19 14:46
当前,美国企业资本支出意愿持续低迷,招聘活动与投资意向仍未复苏。 自本月初与日本达成的贸易协议正式生效以来,美国政府正探讨如何利用日本承诺的5500亿美元投资重 振本国制造业。 目前特朗普政府正与日本团队讨论过使用部分5500亿美元帮助在美建厂,但情况依旧变化多端,已有十 余个提案仍在考虑。比如,美国总统特朗普与美商务部部长卢特尼克提出在美建设燃气轮机及仿制药生 产设施、投资新建核电站与能源管道等选项。 当前,美国制造业整体表现疲软。本周最新数据显示,美国9月纽约联储制造业指数从11.9大幅下滑 至-8.7。新订单与发货量显著减少,企业资本支出意愿持续低迷,招聘活动与投资意向仍未复苏,消费 者信心亦未见明显改善。 牛津经济研究院高级经济学家帕莱什(Nico Palesch)此前对第一财经记者表示,当前很难有信心预测 美国制造业或所谓再工业化的实质性回归。 "一方面,制造商作为潜在投资主体,普遍对销售前景持悲观态度,因此不太可能大规模扩建产能。另 一方面,近年来的工厂建设热潮主要得益于拜登政府时期的《通胀削减法案》和《芯片与科学法案》, 而特朗普政府削减了相关补贴,仅靠关税难以支撑广泛的制造业复兴。"帕莱什说。 ...
贝莱德基金王晓京:挖掘差异化阿尔法,大中盘宽基仍具性价比
搜狐财经· 2025-09-19 13:08
近日,A股热情与震荡交织,指数从连续上攻到震荡盘整。量化指增产品的超额表现一度集体承压,市场对"什么样的策略既能抗震荡、又不失进攻 性"的追问日渐迫切。 在这样一个时点,贝莱德中证500指数增强型基金迎来发行期,贝莱德基金也开启了主动权益产品的全面系统化转型升级。王晓京作为贝莱德基金量 化及多资产投资总监,他的投资理念与操作逻辑,受到市场关注。 近日,王晓京接受了中国证券报记者专访。这位将贝莱德系统化主动权益(简称"SAE")旗舰策略在本土落地的基金经理,致力于用"AI+另类数 据"的方法论,去回答投资者最关切的问题:如何在中国市场,长期而稳定地拿到差异化超额收益? 本次发行的贝莱德中证500指数增强基金,是公司在布局沪深300和中证A500指增产品之后的又一系统化策略产品。为什么选择中证500指数?大盘在 连续上涨后,当下是否还是合适的入场时间? 贝莱德基金量化及多资产投资总监王晓京 以"AI+另类数据"打造低相关性策略 "从长期来看,指增策略的稳定性与超额收益的低相关性是我们的核心优势。"王晓京表示,"我们不做风格漂移,不靠单因子押注,也不参与短线的 拥挤交易。我们要做的,就是稳健而不失锋芒,从侧面寻找基 ...
西部证券晨会纪要-20250919
西部证券· 2025-09-19 12:17
宏观政策与市场影响 - 美联储于9月17日宣布降息25个基点,联邦基金利率目标区间降至4.0%-4.25% [1][4] - 经济预测上调2025年GDP增速预期至1.6%(原1.4%),2026-2027年分别上调至1.8%和1.9% [5] - 点阵图中位数显示2025年降息空间增加至3次,10月降息25个基点为大概率事件,12月降息仍需观察 [1][4][7] 北交所市场表现 - 北证50指数收盘1607.44点,下跌0.6%,整体市盈率达75.57倍,高于创业板 [9][11] - 成交金额264.5亿元,较前日增加5.5亿元,但连续两日小幅回落 [9][11] - 当日275家公司中147家上涨,涨幅最高个股达30%(泓禧科技、三维股份) [9] 行业与主题投资机会 - 市场主线聚焦机器人概念、汽车零配件板块及科技自主可控领域 [11] - 需关注政策红利(如扩大服务消费)与产业升级(机器人技术突破、汽车智能化) [11] - 建议关注业绩确定性强、技术壁垒高的细分龙头,警惕热门赛道估值偏高风险 [2][11] 重点公司动态 - 慧为智能使用500万元自有资金购买理财产品,预计年化收益率2.99% [10] - 柏星龙使用1600万元募集资金购买理财产品,预计年化收益率1.2%-2.0% [10] - 鹿得医疗推出半年度权益分派方案:每10股派发现金1元 [10]
20年后你会患哪些疾病?这款AI大模型登上Nature,能够预测上千种疾病风险
生物世界· 2025-09-19 12:04
撰文丨王聪 编辑丨王多鱼 排版丨水成文 20 年后,你会患上哪些疾病 ?这个看似无法回答的问题如今可能有了答案—— 一款名为 Delphi-2M 的 AI 大模型能够 通过分析一个人的医疗记录和生活方式,为超过 1000 种疾病提供风险评估,甚至能够提前数十年做出精准预测。 这项研究于 2025 年 9 月 17 日 发表在了国际顶尖学术期刊 Nature 上 ,论文题为: Learning the natural history of human disease with generative transformers ,研究团队 来自 德国癌症研究中心 (DKFZ) 、 欧洲分子生物学实验室欧洲生物信息学研究所 (EMBL-EBI) 、哥本哈根大学。 该研究开发了一款名为 Delphi-2M 的 AI 大模型,具有 令人惊叹的一次性模拟和预测多种疾病的能力, 利用健康记录和生活方式因素来预测一个人在未来 20 年 内患上癌症、皮肤病、免疫疾病等多达 1258 种疾病的可能性,从而 生成完整的未来健康轨迹,帮助 医生和健康规划者更好地理解和应对个性化健康需求。 对于大多数疾病 (包括痴呆症、心血管疾病以及死 ...
AI赋能第22届东博会 大批“硬核科技”亮相
环球网资讯· 2025-09-19 09:24
人工智能技术应用 - 人工智能首次赋能中国—东盟博览会筹备全过程 其中中国展区AI或AI赋能展品占比超过50% [2] - 机器人咖啡师为参会者制作花式咖啡 展示AI在服务行业的应用潜力 [2] - 宇树机器人与人类进行拳击比赛互动 体现AI在娱乐和人机交互领域的创新 [4] 智能硬件产品展示 - 混动货运无人机亮相展会 展示新能源与智能物流结合的技术突破 [6] - 机器狗展示载重能力 体现四足机器人在物流和巡检领域的应用前景 [8] - 智能消防头盔展出 显示AI技术在应急救援装备领域的集成创新 [14] 前沿科技体验 - 增强现实眼镜让参会者体验沉浸式数字文旅 展示AR技术在文化旅游领域的应用 [10] - 空气架子鼓演奏展示无实体乐器的人机交互技术 体现新型交互设备的创新 [12] - 列车模型展出 代表智能交通装备的技术进步 [16]
50亿美元!GPU巨头英伟达牵手CPU老将意图几何?
美股IPO· 2025-09-19 08:24
投资交易核心条款 - 英伟达向英特尔投资50亿美元 以每股23.28美元价格购买普通股 持股比例约4%或更高[2] - 投资协议不涉及英特尔代工业务 双方将共同开发面向PC和数据中心的芯片[2] - 合作内容包括共同设计定制数据中心CPU和AI芯片(GPU) 并实现高速连接技术[2] 市场即时反应 - 英特尔盘前交易一度飙升逾30% 开盘后续扬逾25%[2] - 英伟达股价上涨逾3% AMD下跌近4% 台积电股价下跌2%[3] - 此次投资是英特尔继获得美国政府57亿美元和软银20亿美元投资后的又一重大资本注入[2] 战略合作内容 - 英伟达将为英特尔提供专属定制图形芯片 助力其在对抗AMD的竞争中占据优势[3] - 双方计划携手推出"多代"新品 但具体面市时间未透露 且不改变各自原有产品规划[3] - 合作可能为英伟达未来将代工业务从台积电延伸至英特尔埋下伏笔[3] 对英特尔的影响 - 投资被分析师形容为"及时雨" 使AI领域落后的英特尔重新成为基础架构一环[5] - 净负债近296亿美元的财务状况获得缓解 任何降低负债举措都受肯定[5] - 与英伟达的关联带来技术资源与市场信任 稳住长期受质疑的公司形象[5] 对英伟达的考量 - 50亿美元投资规模对财务影响有限 但能减轻垄断疑虑并打开芯片生产管道[5] - 被视为带有地缘政治色彩的战略联盟 可能获得美国政府更多政策支持[5] - 在美国本土实现投资多元化 或在中美芯片竞争中获得更多回旋空间[5] 产业竞争格局变化 - 两大历史竞争对手合作被比喻为"洋基与红袜握手言和" 对美国芯片设计产业意义重大[7] - 对AMD形成竞争压力 使其在数据中心和客户市场面临双重挑战[8] - 分析师预测AMD可能跟进入股英特尔 苹果也在考虑类似保护资金的举措[8] 对台积电的影响评估 - 短期高阶GPU订单依然稳固 因双方磨合需要时间[8] - 长期可能承接部分新增CPU及SoC订单 但台积电先进制程优势难以取代[8] - 合作未承诺对英特尔代工部门单独下单 不应视为台积电重大利空[7] 英特尔长期挑战 - 公司仍需推出能扭转颓势的芯片产品 才能真正实现转型[8] - 追赶台积电仍需漫长道路 亟需有力商业模式和吸引客户的产品[7] - 尽管获得资金注入和技术背书 但商业模式和产品竞争力仍是核心考验[7][8]