Workflow
AI科技大本营
icon
搜索文档
AI 写码一时爽,代码审查火葬场?GitHub Copilot 副总揭秘新瓶颈 | GTC 2025
AI科技大本营· 2025-03-31 14:55
我们距离 AI 在绝大多数软件开发任务中实现人类水平的能力和自主性大约还有 24 到 36 个月的时间。 责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 主持人: 大家好,我是 NVIDIA 开发者工具 AI 技术软件工程总监,马特·弗雷泽(Matt Frazier)。 众所周知,AI 辅助开发者工具,或者说代码生成、AI 代码生成——现在有很多叫法——正在从根本上改变我们开发软件的方式。NVIDIA 自然非常关 注这一趋势如何影响我们处理软件和加速计算的方法。 为此,在 GTC 2025(英伟达大会)上,我们邀请了来自多家公司和不同行业的 AI 代码生成通用应用专家,以及 CUDA 优化与相关研究领域的专家, 共同探讨这个话题。 我想快速问各位读者几个问题: 如果你对以上任何一个问题感同身受或感到好奇,那么接下来的讨论就值得你关注。下面,我想介绍一下参与本次讨论的嘉宾。 莎娜·达马尼(Sana Damani) ,她是 NVIDIA 架构研究组的研究科学家,致力于提升 GPU 上并行应用程序的性能,以及提高调试和优化工作的易用 性。 有多少人特别在 CUDA 调试中使用过 AI 驱动的代 ...
从DeepSeek R1的复现看深度思考模型的未来|ML-Summit 2025
AI科技大本营· 2025-03-31 14:55
备受瞩目的 2025 全球机器学习技术大会(ML Summit 2025)将于 4 月 18-19 日在上海虹桥西郊庄园丽笙大酒店召开。本次盛会由 CSDN & Boolan 联合主办,汇聚了超 50 位来自学术界和工业界顶尖专家,共同探讨智能体、联邦学习、多模态大模型等热门 AI 技术实践。 作为全球机器学习技术大会的老朋友,新浪微博首席科学家及 AI 研发部负责人张俊林将带来《从 DeepSeek R1 的复现看深度思考模型的未来》的精 彩分享。 张俊林作为「大模型技术拆解得最通透的实战派」,在 2024 年的机器学习技术大会上,他对 Gemini 多模态架构、OpenAI o1 技术的硬核拆解,让 开发者直呼"终于有人讲透技术本质"。 系统梳理技术脉络: 回顾 DeepSeek R1 开源后的各类复现研究,涵盖 SFT 阶段的轻量适配(如 S1)与 RL 阶段的创新实践。 深度解析训练范式: 重点剖析其核心的两阶段训练模式——如何通过冷启动微调结合多领域数据优化进行 SFT,以及如何运用 GRPO 强化学习 与全场景对齐实现模型"深度思考"能力的跃迁。 探讨关键技术问题: 尝试解答一系列备受关注的核心问 ...
抛弃 OpenAI 后,Figure 机器人“进化”:像人一样行走!
AI科技大本营· 2025-03-28 11:41
"AI 的下半场是落地,而具身智能将是最佳载体"。 紧接着,Figure 又于近日宣布,其工业机器人 Figure 02 通过纯强化学习算 法,成功实现了如人类般自然流畅的行走。 强化学习驱动: 突破 Sim-to-Real 难题 责编 | 梦依丹 出品 | CSDN(ID:CSDNnews) Figure 自 2 月宣布与 OpenAI 结束合作转而拥抱完全自主研发路线后,动作频频。 先是于 2 月下旬正式发布其倾力打造的机器人操作系统 Helix ,该系统被视为 Figure 实现"真正自主"的关键基石。不仅如此,搭载该模型的 Figure 02 也已进驻物流工厂,承担起快递分拣的重任,显示了其初步的商业化潜力。 然而,仅仅在模拟环境中训练是不够的。如何将模拟环境中的学习成果成功迁移到真实的机器人身上,是一个巨大的挑战,被称为 "Sim-to-Real" 问 题。为了克服这一难题,Figure 团队采用了两种关键策略: 通过将域随机化与高频扭矩反馈控制相结合,Figure 成功地实现了零样本迁移(Zero-Shot Transfer),即无需额外的微调,在模拟环境中训练出的策 略可以直接应用于真实的 Fi ...
大厂竞相押注人形机器人,我们距离通用还有多远?
AI科技大本营· 2025-03-27 10:23
这两年,具身智能 的进展让人目不暇接。从特斯拉人形机器人 Optimus 在舞池跳舞 ,到宇树 Unitree H1 机器人在春晚扭 秧歌,再到智元机器人灵犀 X2 骑自 行车......这些场景不断刷新着大众对智能机器人的认知,也展示了它们在现实世界中的 适应能力。但一个耐人寻味的现象是,每次成为焦点的,几乎都是人形机 器人。 为什么"人形"成为关注焦点?这或许可以从科技巨头的布局中找到答案。 今年 1 月,英伟达 CEO 黄仁勋在采访时表示:"通用人形机器人技术将最为实用,因为我们的世界是围绕人类需求建造的。" 他坦言,实现这一目标极具挑战,但随着 Transformer、大型语言模型(LLM)及基础模型的突破,已让通 用机器人迈入可 能实现的阶段。短短两个月后,在 GTC 大会上,他直言 直:"通用机器人时代已经到来。" 与此同时,特斯拉 CEO 埃隆·马斯克也在 CES 2025 上做出过大胆预测:人形机器人将成为"史上最大产品",全球或将需要 300 亿台,远超任何其他产品。 其实从本质上看,具身智能指的是"有身体的智能",其核心在于智能决策与物理世界的深度融合。人形机器人之所以成为当 前最受关注的 ...
长文本向量模型在4K Tokens 之外形同盲区?
AI科技大本营· 2025-03-27 10:23
责编 | 梦依丹 2025 年 2 月发布的 NoLiMA 是一种大语言模型(LLM)长文本理解能力评估方法。不同于传统"大海捞针"(Needle-in-a-Haystack, NIAH)测试依赖 关键 词匹配的做法,它最大的特点是 通过精心设计问题和关键信息,迫使模型进行 深层语义理解和推理,才能从长文本中找到答案。Jina AI 技术团队 受到启发,并进针对向量模型 jina-embeddings-v3 进行了类似实验。 NoLiMa: https://arxiv.org/abs/2502.05167 NoLiMA 的研究结果揭示了一个重要问题:那些号称能处理几十万甚至上百万词元(tokens)的 LLM,在真正需要理解长文本的任务里,性能大打折 扣。比如,在 32K 词元的长度下,有 10 个受测模型,表现还不如处理短文本(小于 1K 词元)时的一半好;就连表现最好的 GPT-4o,性能也从接近完 美的 99.3% 掉到了 69.7%。 【编者按】 2025 年 2 月发布的 NoLiMA 是一种大语言模型(LLM)长文本理解能力评估方法。不同于传统"大海捞针"(Needle-in-a-Haystack ...
超越 Suno,全球首个 CoT 音乐模型Mureka O1 来了!
AI科技大本营· 2025-03-26 18:20
人人都是音乐创作人的时代来临了! 出品丨AI 科技大本营(ID:rgznai100) AI 正渗透各行各业,前不久,一首由 AI 创作的歌曲火爆出圈,在短短几天内登上热歌榜单。AI 正在为音乐爱好者打开音乐创作之门。据 Fortune Business Insights 数据显示,2023年全球数字音频工作站(DAW, Digital Audio Workstation)市场规模高达约30亿美元,预计2026年约70%的 DAW企业将使用AI技术辅助音乐创作。 《Mureka》AI 音乐人 MV 全网首发,歌手:Mureka;该作品由 AI 生成,其中音乐由 Mureka 生成,视频由 SkyReels 技术支持生成。 点开这首《童年的夜晚》,旋律柔和动听,人声温柔真挚,咬字清晰,歌词很贴近提示词的风格,完全没有 AI 感,很不错。 将生成的歌曲下载下来后,小编发现它支持音轨分离下载。普通歌曲下载只有一条音轨,而Mureka 提供音乐生成的独立的人声、伴奏等多轨输出,比 如鼓声、贝斯等,这样对编曲者来说无疑是二次创作的神器,方便用户后续混音。 什么?你说提示词生成是小case啦?来,上难度,点击高级模式,Mu ...
美国机器人“四小龙”:通用机器人仍需十年,专用机器人即将出现,机器人的扩展法则会在五年内被探索出来 | GTC 2025
AI科技大本营· 2025-03-26 18:20
我们这一代人 出生得太晚,没能赶上探索地球的地理大发现时代; 我们出生得又太早,可能无法亲身参与星际旅行,探索其他星系。 但我们却恰逢其时, 躬逢其盛,见证并参与到解决机器人技术难题的伟大历史进程中。相信在不久的将来,所有能够移动的物体都将实现自主化。 责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 今天这篇文章将会回顾英伟达大会重点宣传的一个论坛:《 通用机器人的新时代:人形机器人崛起 》(A New Era of Generalist Robotics: The Rise of Humanoids),英伟达跟紧物理世界 AI 和具身智能的新风向,邀请到美国 四家 顶尖的 人形机器人 公司老板,参与这场对话。 那么问题来了,现在全世界的人形机器人领域都有哪些顶级公司呢? 相信很多人和小编一样,只认识国内的宇树机器人,对国外现在的机器人战局不太 了解,所以我们先看一张图,了解当前的时局情况: | 特斯拉 | | Google | | NVIDIA | | | | --- | --- | --- | --- | --- | --- | --- | | 美国 | | 美国 | | 美国 | ...
大模型“神仙打架”,掀起复现潮、技术大升级后,我们需要关注什么? | 万有引力
AI科技大本营· 2025-03-25 09:45
以下文章来源于CSDN ,作者万有引力 CSDN . 成就一亿技术人 作者 | 万有引力 出品 | CSDN(ID:CSDNnews) 在过去短短的几周里,大模型赛道的信息密度飙升至前所未有的高度。DeepSeek 连续 五天开源 ,直接引发了一场复现热潮;阿里巴巴通义实验室、 腾讯相继推出面向视觉文档的 RAG 系统 ViDoRAG、新一代混元快思考模型 Turbo S ,加速了大模型的演进步伐;马斯克用 20 万张 GPU 训练出的 Grok 3 ,超越了许多业界标杆,再次验证了"大力出奇迹"的定律; Claude 3.7 Sonnet 迎来编码能力大升级,AI 编程的技术平权时代正在加速到来; DeepSeek 论文与 Kimi"撞车",越来越多公司开始布局稀疏注意力与线性注意力机制,这些技术正成为 Transformer 之后的关键探索方向;此外, Manus 模式的"虚拟机"概 念迅速走红,正在重塑大模型的运行方式... 在这场眼花缭乱的技术竞赛背后,真正值得我们关注的是什么?DeepSeek 的五连发 究竟意欲何为?在 545% 的成本利润率之下,其他大模型公司是 否也能找到盈利空间?面对行业变 ...
2025人工智能系列活动全景透视,慕尼黑上海电子展邀您共探未来!
AI科技大本营· 2025-03-25 09:45
继 DeepSeek 一夜刷屏后,近日发布的 AI Agent 产品 Manus 再次震撼科技圈,"一石激起千层浪", 各行各业都翘首以盼 AI 带来的颠覆式创新。 当然,AI+终端应用的落地也离不开政策托举,在今年全国两会期间,政府工作报告再度提及"人工智 能+",持续推进"人工智能+"行动,将数字技术与制造优势、市场优势更好结合起来,支持大模型广 泛应用,大力发展智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端以及智 能制造装备。 在今年 4月15-17日 即将在上海新国际博览中心开幕的 慕尼黑上海电子展 上,主办方将重磅推出 "人 工智能联合展区"、"AI技术创新论坛"、 "人形机器人展示区"、"人形机器人创新论坛 " 等系列活 动,集产品展示、技术展示、应用体验和行业交流于一体;通过展示新的AI技术和应用,将为观众呈 现AI在未来生活中的无限可能。同期的 "医疗电子创新论坛" 和 "嵌入式系统创新论坛 "也将涵盖不 少AI+的相关话题,一起来跟小编看看吧~ PART.01 人工智能联合展区 地点:上海新国际博览中心丨N5馆N5.749 时间:2025年4月15-17日 2025慕尼黑 ...