R2模型
搜索文档
刚刚,DeepSeek梁文锋入选Nature年度十大人物,被称为“科技颠覆者”
36氪· 2025-12-09 10:24
梁文锋与DeepSeek公司 - 公司创始人梁文锋入选《自然》2025年度十大人物,被评价为“科技颠覆者” [1] - 公司发布的DeepSeek AI模型被描述为“惊艳了世界”和“让科学家感到兴奋” [3][4] - 创始人梁文锋为40岁的前金融分析师,曾通过AI算法在股市赚取数百万美元,并于2023年在杭州创立DeepSeek公司 [5] R1模型的技术与市场影响 - 公司于今年1月突然发布功能强大但价格低廉的R1模型,挑战了美国在AI领域的领先优势认知 [4][5] - R1是一款推理大语言模型,擅长通过步骤分解解决数学和编程等复杂任务 [5] - 该模型是首个以开放权重形式发布的此类模型,研究者可免费下载并进行开发 [7] - R1的成功促使中美其他公司纷纷效仿,相继发布各自的开源模型 [7] - 尽管R1在多项能力上与驱动ChatGPT的美国顶尖模型不相上下,但其训练成本远低于竞争对手 [7] - 例如,Meta的Llama 3 405B模型的训练成本高出十倍以上 [9] 公司的运营理念与透明度 - 公司追求透明度,R1模型是首个接受同行评议的主流LLM,公司完整公布了其构建和训练的技术细节 [8] - 通过公开技术“配方”,公司为其他AI研究者提供了训练推理模型的宝贵经验 [11] - 公司在招聘时更看重个人潜力而非经验水平,组织架构扁平化,研究人员可自主决定研究方向 [20] - 公司没有利用其知名度追求商业成功,而是致力于解决AI研究中困难的基础性问题 [20] - 公司承诺其模型将永久开源 [23] 创始人的背景与公司发展 - 创始人梁文锋出身于广东乡村,父母是小学教师,后于浙江大学获得工程学硕士学位 [11] - 他于2015年联合创立对冲基金高飞资本,随后在2023年分拆出DeepSeek公司 [13] - 出于研究好奇,他在过去十年里购买了1万块英伟达GPU [17] - 与许多西方AI企业家一样,公司的目标是指向实现通用人工智能 [17] 模型的应用与行业地位 - DeepSeek模型已深度融入中国人的生活,地方政府利用其运营聊天机器人热线、协助市民填表,每天有数千万人通过微信使用这些模型 [20] - 这一趋势得益于政府推动AI通过智慧城市、医疗保健等应用融入经济发展 [20] - DeepSeek已成为国家形象转型的象征——从卓越的模仿者蜕变为真正的创新者 [20] - 全球正热切期待公司即将推出的下一代推理模型R2 [21] - 公司计划向世界免费开放R2模型 [23] 《自然》年度十大科学人物其他入选者(摘要) - 中国科学院深海科学与工程研究所研究员杜梦然因在海平面9000米以下发现最深的动物生态系统入选,被称为“深潜者” [25] - 美国微生物学和免疫学科学家Susan Monarez因在政治压力下坚守科学诚信而受到关注 [28] - 学者Achal Agrawal因揭露印度高校惊人的论文撤稿率及推动科研评估改革入选 [31] - Tony Tyson作为打造耗资8.1亿美元薇拉·鲁宾天文台望远镜的核心推动者入选 [34] - Precious Matsoso作为促成全球首份《大流行病条约》的核心谈判代表入选 [37] - Sarah Tabrizi因在亨廷顿舞蹈症治疗上取得关键进展入选 [40] - Luciano Moreira因领导在巴西培育数十亿只蚊子以阻断登革热等病毒传播的计划入选 [43] - Yifat Merbl因发现免疫系统新层面——蛋白酶体产生抗菌肽段而入选 [45] - 婴儿KJ Muldoon作为全球首例接受高度个性化CRISPR基因编辑治疗的患者入选 [48]
背刺
猫笔刀· 2025-02-25 22:20
美国对华投资限制升级 - 特朗普签署《美国优先投资政策》备忘录,限制中国对美关键产业(半导体、AI、量子)的收购,扩大项目审查并阻止敏感人才流动 [1] - 美国对华投资方面,禁止投资中国军民融合领域,计划取消对华最惠国待遇 [1] 中概股及港股市场反应 - 美股中概股ETF大跌6%,阿里巴巴大跌10%,恒生科技指数低开4%后资金抄底,最终收跌1.57% [2] - 南下资金全天净流入220亿,占恒生科技成交额1374亿的显著比例,近1个月累计净流入1226亿,历史累计3.94万亿(占港股总市值40万亿的10%) [4] - A股成交1.89万亿,中位数下跌0.88%,能源金属板块涨1.4%(因刚果(金)停止钴出口4个月,该国占全球钴供应76%) [4] 自动驾驶与汽车行业动态 - 特斯拉更新城市道路Autopilot功能(L2级辅助驾驶),市场误读为FSD落地 [4] - 自动驾驶等级表显示当前技术仍处L2阶段(需驾驶员随时接管),与L4/L5全自动驾驶差距显著 [5] 光伏与风电行业 - 国内光伏组件涨价0.02-0.05元/瓦,因电力政策、供需回暖及上游成本传导 [4] - 光伏行业经营面改善但速度缓慢,资金对重资产周期行业兴趣不足 [4] 其他行业表现 - 跌幅板块:种业-4%、影视-2.8%、保险-2.2%、白酒-2.1%、游戏-2%、养殖业-1.8% [4] - 电影《哪吒》票房预期150-160亿,光线传媒700亿市值已透支单部电影利润 [4] 国际事件与资源动态 - 俄罗斯计划稀土产量倍增,并向美国供应,反映美俄关系潜在变化 [8] - 俄罗斯在乌克兰占领11.1万平方公里(占乌领土18.5%),停战谈判焦点为领土交换 [6] 科技与虚拟货币 - DeepSeek计划5月推出R2模型,性能显著优于竞品 [8] - 比特币跌破9万,以太坊跌破2400,市场情绪转向谨慎 [8]