开源模型

搜索文档
黄仁勋:有点嫉妒年轻一代
财联社· 2025-07-17 19:43
人工智能发展趋势 - 人工智能下一波发展将聚焦"物理人工智能",即把推理能力应用于机器人等物理机械领域 [1][8] - 过去十年间人工智能计算性能已提升10万倍,为海量数据处理与高效学习奠定了基础 [2] - 人工智能正接近"通用人工智能"阶段,有望在多数认知任务及测试中超越人类表现 [8] 开源生态与工程 - 开源模型已改变人工智能的技术与商业格局,成为重要发展趋势 [2] - 开放创新从研究层面延伸至工程领域,能够实现全球生态系统资源整合 [3] - 中国在开源工程领域的布局尤为明智,其开源模型不仅助力本土生态发展,更对全球生态系统形成支撑 [3][4] 人工智能在科学领域的应用 - 面向科学的人工智能将产生最重大的影响,尤其在生物学和物理领域 [5][6] - 人工智能可解析蛋白质、化学物质、细胞乃至生命的本质,助力药物改进与设计 [5] - 人工智能在预测物理过程效率上远超物理模拟,将成为推动科学发展的核心力量 [6] 算力与芯片技术 - 算力是改变世界的基础架构,AI只是算力带来的成果之一 [10] - 未来硅基技术发展将转向多复合芯片组合,单芯片时代已过 [10] - 预计需要二十年时间完成技术探索和框架构建 [11] 人工智能与人才培养 - 年轻人需掌握问题思考的"第一原则",建立深度思考的思维体系 [12] - 建议学习科学推理、计算机编程等基础知识,即便未来未必从事相关工作 [12] - 融合人工智能的计算机成为"平等器",让各类人群都能获得赋能 [13]
关于科技未来的炸裂预言!黄仁勋王坚大佬对谈,年轻人尤可关注
21世纪经济报道· 2025-07-17 15:56
AI技术演进与未来趋势 - 生成式AI爆发仅是开始 下一波浪潮是物理AI 包括机器人 模拟自然法则 辅助药物设计等领域 [1][6] - AI已超越人类在图像识别 语音识别和语言理解能力 并进入推理阶段 能分解并解决未知问题 [1][6] - 技术迭代周期约4-5年 过去12年AI从认知任务扩展到生成式智能 未来将深度融合物理世界 [6][7] 算力的核心地位 - 算力是AI基础架构 改变世界的本质是算力而非计算机 AI将算力提升至新境界 [1][9] - 英伟达算力10年提升10万倍 支撑AI从预训练 人工强化训练到自主推理的演进 [9][10] - AI不仅模拟人类智慧 更增强创造力 其运行机制与大脑相似但更具扩展性 [9] 开源生态与全球协作 - 中国AI开源论文数量全球第一 Kimi DeepSeek等开源模型推动全球创新协作 [2][10] - 开源工程加速创新 允许跨组织贡献 形成安全发展路径 如DeepSeek论文获A+级全球审查 [11] - 开源模型赋能医疗 金融 机器人等行业 使各领域能定制专属AI解决方案 [11] AI与科学研究的融合 - AI将颠覆生物学研究 通过理解蛋白质 细胞结构辅助药物设计 延长人类寿命 [12] - 物理AI可模拟天气 海洋等复杂系统 比传统方法更高效预测自然现象 [13][14] - 硅基技术仍是AI算力基石 未来20年将通过多芯片复合架构持续突破性能极限 [14][15] 行业领袖对年轻人的建议 - 掌握第一性原理和科学推理 避免过度依赖AI答案 需保持批判性思维 [16][17] - AI是终极平等器 尽早掌握交互能力可赋能各阶层 农民 老年人均能受益 [18] - 当代年轻人将成为AI原住民 终生与AI共生 获得全程陪伴与记忆存储 [19][20] 中国科技力量崛起 - 杭州被视作中国硅谷 孕育DeepSeek Qwen等领先模型 展现区域创新实力 [11][12] - 中国在AI工程与制造领域进步显著 低估华为等企业的观点被批"极其天真" [23]
黄仁勋、王坚对谈全文:一场关于AI、算力与未来的炸裂“预言”
21世纪经济报道· 2025-07-17 14:07
AI技术演进与未来趋势 - 生成式AI爆发只是开始,下一波浪潮是物理AI(physical AI),即AI与物理现实融合,如机器人、模拟自然法则、辅助药物设计等 [2][7] - 2012年深度学习崛起是AI发展转折点,如今AI已超越人类在图像识别、语音识别和语言理解上的能力,并正在学会"推理" [2][6] - AI技术迭代周期约4-5年一次重大突破,过去12年AI迅速发展,目前已能解决大部分认知性任务 [7] - 算力是AI基础架构,AI将算力带到新境界,与其说计算机改变世界不如说是算力改变世界 [2][9] 开源模型与全球协作 - 中国是全球AI开源论文最多的国家,Kimi、DeepSeek等开源模型是中国AI参与全球协作的重要代表 [3][10] - 开源推动创新速度,开源模型汇集全球资源造福整个生态系统,是安全发展AI的方式 [11][12] - 开源不仅开放研究还要开放工程,每个人可贡献创新,如DeepSeek论文获A+评级并向全球开放 [11][12] AI与科学研究的融合 - AI将深刻影响科研方式,可用于理解蛋白质、细胞等生物结构,辅助药物设计延长人类寿命 [13] - AI能模拟复杂物理特性如天气、海洋物理等,帮助预测和推进科学发展 [13][14] - 生物学工程化是历史性机会,AI将帮助理解自然真相和模拟自然法则 [13][14] 算力与硬件技术发展 - 过去10年英伟达算力提高10万倍,能处理更多数据使机器学习更有效 [11] - 硅科技仍将是未来10-20年AI发展基础,但技术路径将转向多复合芯片等新架构 [14][15] - 新一代计算架构如CPU与不同组件连接,技术先进但仍有20年发展空间 [14][15] 行业生态与区域发展 - 杭州正成为全球创新中心,孕育DeepSeek、Qwen等颠覆性AI模型,被誉为"中国硅谷" [12] - AI不仅模拟人类智慧更增强人类创造力,将像飞机扩展人类活动范围一样扩展人类思维 [9]
黄仁勋对谈王坚,称“嫉妒年轻人”
第一财经· 2025-07-17 13:35
核心观点 - 算力是AI发展的基础架构,AI是基于算力发展起来的成果 [1] - AI技术在过去10多年中每隔5年就有一次大变革,目前已能完成大部分认知性任务,下一波浪潮是物理AI [2] - 开源模型改变了AI技术发展方式,中国研究者在AI相关论文数量上全球领先 [2] - 半导体硅为AI发展奠定基础,未来将通过复合芯片和光模块(CPO)技术提升算力 [4] - AI将改变人类与科技的关系,年轻一代将成为"AI原住民" [4] - AI会让人人更平等,各行业人群都应尽快应用AI技术 [5] AI技术发展 - 2012年深度学习技术"大爆炸"使AI能力超越科学家水平 [1] - 2012-2017年计算机视觉、语音识别超越人类能力,随后语言理解也实现超越 [2] - 生成式AI已能理解并生成信息,实现跨模态"翻译" [2] - 物理AI将是下一波浪潮,AI能力将融入物理世界如机器人领域 [2] - 开源模型成为AI发展新趋势,通过全球审查确保安全性 [2] 算力与芯片技术 - 半导体硅为AI发展提供坚实基础 [4] - 未来将采用多复合芯片组合方式,芯片组面积可达桌子大小 [4] - 光模块(CPO)技术将用于芯片连接 [4] - 相关技术发展仍需5-10年时间,公司已在规划10年后框架 [4] AI与人才培养 - AI是年轻人的终生机遇,年轻一代将成为"AI原住民" [4] - 需要建立深度思考体系,具备与AI交互和问题描述能力 [4] - 需培养辨析思维,判断AI回答的正确性 [4] - 不应认为AI会完全替代学习需求 [4] 行业应用前景 - AI将实现与人类共生发展,记录人生旅程 [4] - 机器人领域已实现落地应用,单台机器人可替代1.4-2名工人 [7] - AI将促进社会平等,各行业人群都应尽快应用 [5]
黄仁勋对谈王坚:赞DeepSeek写出A+论文,称“嫉妒年轻人”
第一财经· 2025-07-17 12:41
AI技术发展 - 算力是AI发展的基础架构,AI是基于算力发展起来的成果 [4] - 2012年深度学习技术大爆炸后,AI在计算机视觉、语音识别、语言理解等方面超越人类能力 [4] - 生成式AI近年快速发展,已能理解并生成信息,实现跨模态翻译(如文本到视频) [4] - AI每隔5年经历一次大变革,当前阶段可完成大部分认知性任务,下一波浪潮是物理AI(如机器人) [4] - 2023年开源模型成为AI领域重大改变,中国研究者发布的AI论文数量全球最高 [5] 算力与芯片技术 - 半导体硅为AI发展奠定基础,未来转变将集中在多复合芯片架构和光模块(CPO)连接技术 [5] - 英伟达规划未来5-10年技术框架,包括芯片组设计和光互联方案 [5] 行业机遇与人才 - AI是年轻人的终生机会,新一代将成为"AI原住民",与科技共生成长 [1][6] - 未来需培养深度思考能力,掌握与AI交互、问题描述及结果辨析的技能 [6] - AI将推动社会平等,降低各群体(如农民、老年人)的技术使用门槛 [6] 企业动态 - 英伟达CEO高度评价中国AI研究(如DeepSeek论文达到A+级科学与工程水平) [5]
华人工程师被疯抢,世界第一AI创业公司,走进覆灭前夜
钛媒体APP· 2025-07-15 12:54
全球AI人才争夺战 - 马斯克xAI公司创始团队12人中至少有5名华人工程师 包括吴宇怀 吉米·巴 杨格 戴子航和张国栋 [2][3] - Meta以四年3亿美元总包方案挖角OpenAI华人工程师余家辉 首年薪酬超1亿美元 [5][6][7] - Meta"超级智能团队"14名成员中8位为华人 多数来自OpenAI和谷歌DeepMind [10] OpenAI面临的核心挑战 - 2023年11月管理层内斗导致CEO奥特曼短暂出局 最终700名员工联名逼宫使其回归 [18][19][20] - 创始团队13人中仅剩3人留任 中高层流失严重 包括首席科学家 安全团队负责人等关键岗位 [20][21][22] - 2023年至今完成三轮共566亿美元融资 但股权激励支出达44亿美元 占营收119% [23][30] 中国AI力量的崛起 - 开源模型DeepSeek以557万美元训练成本实现比肩ChatGPT性能 迫使OpenAI考虑开源策略 [25][26] - 字节跳动挖角谷歌DeepMind前副总裁吴永辉 其为Gemini应用总技术负责人 [27][28] - 中国高校培养的顶尖人才正成为全球AI主力 Meta挖角团队中多人本科毕业于清华 北大等校 [10][11][12] 行业竞争格局变化 - OpenAI从谷歌DeepMind挖角3名顶级工程师 但随后自身遭Meta大规模挖角至少8名核心研究员 [14][15] - 谷歌DeepMind收购原OpenAI目标公司Windsurf 强化Gemini项目工具开发能力 [29] - OpenAI反挖角特斯拉 Meta xAI等公司技术高管 但股权激励模式难持续 [30] 技术路线调整 - DeepSeek打破"性能-成本-速度"不可能三角 推动OpenAI计划推出开源推理模型 [25][26] - OpenAI原定2024年夏季发布开放权重模型 但已两次推迟且无限期搁置 [26] - 中国通义 豆包 Kimi等模型快速迭代 形成对OpenAI的技术追赶压力 [27]
杭州行感悟
小熊跑的快· 2025-07-13 16:26
杭州明星公司 - 杭州涌现出越来越多明星公司 但交通拥堵问题依然存在 [1] - 阿里及阿里系相关公司是当地重点企业 [3] 阿里系业务现状 - 阿里云被视为阿里未来最重要的业务亮点 资本市场关注度集中于此 [4][5] - 淘宝面临增长瓶颈 商户贡献收入占比从4年前85%以上降至50% 份额被抖音 拼多多 小红书侵蚀 [4] - 淘宝用户体验问题突出 退货运费等政策导致消费乐趣下降 [4] 阿里云核心优势 - 规模效应显著:全球第四 中国第一 存储和GPU租赁具备成本优势 [6] - 基础设施完善:工具集齐全 数据中心易扩展迁移 客户扩容首选特性明显 [6] - AI浪潮推动二次上云:企业自建AI服务器存在CPU/GPU配平 存储扩展等痛点 云算力租赁需求激增 [6][7] 云计算行业趋势 - 开源模型+公有云架构或成主流 企业数据安全敏感度提升推动该趋势 [8] - 国际巨头面临商业模式抉择:Google在开源模型与云服务间摇摆 AWS/微软倾向开源模型带动云收入 [9] - 中国云化率仍低 政府/高校/金融/国企等领域存在巨大渗透空间 [6] 阿里云竞争策略 - 战略执行聚焦:内部指令贯彻直线结构 有利于业务推理和扩展 [10] - 市场定位精准:业务开放度介于腾讯云与火山云之间 叠加规模沉淀形成差异化 [10] - 2013-2016年已建立300亿级IaaS业务基础 具备先发优势 [6]
Perplexity CEO:或将利用Kimi K2进行后训练
第一财经· 2025-07-13 15:50
公司与行业动态 - 美国AI搜索初创公司Perplexity CEO阿拉温德(Aravind Srinivas)在社交媒体表示可能利用Kimi K2模型进行后训练 [1] - 此前Perplexity已使用DeepSeek R1进行模型训练 [1] - Kimi K2是月之暗面Kimi发布的万亿参数开源模型 强调代码能力和通用Agent任务能力 [1]
Perplexity CEO表示将利用Kimi K2进行后训练
快讯· 2025-07-13 14:16
行业动态 - 美国AI搜索初创公司Perplexity获英伟达投资 其CEO阿拉温德在社交媒体宣布将基于Kimi K2模型进行后训练 [1] - Perplexity此前已使用深度求索(DeepSeek)的R1模型进行训练 显示公司持续整合全球领先的开源模型资源 [1] 技术突破 - 月之暗面Kimi本周五发布万亿参数开源模型K2 该模型在多项测试中取得全球主流开源模型最佳成绩 [1] - K2模型表现优异 被Perplexity选为后训练基础 体现其技术领先性和商业应用潜力 [1]
Kimi K2 详测|超强代码和Agent 能力!内附Claude Code邪修教程
歸藏的AI工具箱· 2025-07-12 02:16
昨晚试了一下在 前端能力上非常强,基本上在一流梯队,我感觉接近 Claude Sonnet 3.7 和 4 之间 ,测试 的几个提示词效果都不错。 最重要的是有人hack了一个用法, 可以替换掉 Claude Code 的默认模型,用 K2 驱动 Claude Code ,再也 不用担心封号,搭配他输出百万 Token 16 元的超划算价格,我直接爽用! 咱们先看测试结果,后面我会附上如何在 Claude Code 中使用 K2 的保姆级教程。 K 2 前端能力测试 我们循序渐进,先来藏师傅的经典提示词,这次加上了 PPT 逻辑,让整个页面支持类似 PPT 的翻页,每一 页的高度固定带来了一些挑战。 大家好,我是歸藏(guizang),熬夜给大家带来 Kimi K2 模型和提升K2模型的CC+K2邪修教程。 今晚 Kimi 终于放出了自己憋了半年的大招,拥有 1T 参数量的 MoE 模型 K2。 基准测试中取得开源模型 SOTA成绩, 尤其在代码、Agent、数学推理任务上表现突出 。 而且模型居然还是开源的,预训练模型和指令微调模型全部开源,可以在 Kimi( kimi.com )快速尝试。 不是很多朋友想 ...