Workflow
量子位
icon
搜索文档
Cursor发布首个编程大模型!代码生成250tokens/秒,强化学习+MoE架构
量子位· 2025-10-30 09:06
最新进展, Cursor 2.0 正式发布,并且首次搭载了「内部」大模型。 没错,不是GPT、不是Claude,如今模型栏多了个新名字—— Composer 。 实力相当炸裂: 据官方说法, Composer仅需30秒就能完成复杂任务,比同行快400% 。 Jay 发自 凹非寺 量子位 | 公众号 QbitAI Cursor的首个编码模型,刚刚发布了! 太多了太多了,根本看不完。 400%效率飞跃 当然,其他的都是小菜,最炸裂的依然是—— Cursor居然有了自己的基座模型 。 基于模型升级,Cursor 2.0带来了不少新玩意儿—— 原生浏览器工具 :模型可以自己动手测试代码、调错、迭代,直到结果完全正确。 语音生成代码 :不用敲键盘,张嘴就行,直接把思路变成代码。 全新界面逻辑 :从「以文件为中心」切换为「以Agent为中心」,多个Agent可以同时运行、互不干扰。 让多个Agent同时尝试同一问题并择优采用,能显著提升最终结果。 要知道,以前的Cursor虽然火,但本质上还只是套壳GPT或Claude,再厉害也不是Cursor的功劳。 而这次不一样,Composer正式登场,Cursor终于能挺直腰板了 ...
Sora连更三大新功能!一键打造IP形象,限时免注册码抢占安卓市场
量子位· 2025-10-30 09:06
产品功能更新 - 推出角色客串新功能,允许用户保持非人类客串角色(如宠物或动画形象)的一致性,并可从生成的视频中提取虚拟角色进行自循环[6][7] - 新增视频拼接功能,用户可将两条生成的短视频连接起来以延长视频时长[12] - 新增社区排行榜功能,包括被使用最多的客串角色和被二创最多的视频等类别[13] 平台战略转型 - 通过Cameo和角色客串等功能,推动平台从纯粹的技术演示工具向社交平台转型,使用户从旁观者转变为参与者和IP创造者[4][5][9] - 用户可将自己创建的角色分享给平台其他用户使用,实现自主IP打造[10] 市场扩张策略 - 在美国、加拿大、日本和韩国四个国家限时取消邀请码限制,直接开放注册以快速扩大用户基数[2][17] - 此次限时开放注册的时间点与Sora Android版本上线节点重合,旨在抢占安卓市场的窗口期以扩大市场份额[18] - 限时开放的原因与算力不足有关[3] 用户增长机制 - 早期采用“1邀4”的病毒式传播机制,即每个激活账号的用户获得4个邀请码分享给朋友,成功制造巨大话题热度[15] - 邀请码机制催生了灰色市场,价格最高曾达175美元,公司明确禁止买卖行为,违规将导致整个OpenAI账号被永久封禁[16]
再创历史!英伟达市值一夜突破5万亿美元,今年涨幅56%,黄仁勋晋升全球第八富豪
量子位· 2025-10-30 09:06
但不断创纪录的英伟达,相比之下创始人、CEO黄仁勋就"委屈"一些了,即便不断创造股价和市值神话,但 老黄的个人财富水涨船高之后, 也才以1792亿美元的持股价值跃居福布斯全球富豪榜第八 。 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 见证历史,英伟达市值突破5万亿美元大关! 轻轻松松 成为全球第一家市值突破5万亿美元的公司 。而且英伟达的纪录英伟达破,当初率先突破4万亿美元的也是英伟达——追赶英伟达的 只有英伟达了。 10月29日,美股开盘不久,英伟达股价一度上涨5.44%,盘中触及212.19美元/股,收盘价稳定在207.04美元/股。 随之而来的,是一个足以载入科技史的新数字: 5.03万亿美元 。 还有一个醒目的数字值得关注。 从2025开年至今10个月时间里,英伟达股价已暴涨了56% ——放眼全球,还有什么标的有这样体量巨大又 增长迅猛的案例?还有谁? 根据道琼斯市场数据,英伟达现在的市值已经超过了AMD、Arm Holdings、ASML、博通、英特尔、泛林集团、美光科技、高通和台积电的 总和。 与此同时,其市值还超过了标普500指数中的整个行业板块,包括公用事业、工业和消费品。 相比特斯 ...
14000人原地被裁!亚马逊今日:打工人水深,AI机器人火热
量子位· 2025-10-29 17:30
裁员规模与执行细节 - 亚马逊宣布裁员约1.4万名员工,占公司35万名全职员工的4% [10] - 裁员人数为净裁员数,通过内部调岗成功留任的员工不计入其中 [12] - 首批收到通知的7500名员工中,超过78%为L5至L7级别的经理层 [17] - 超过80%的裁员来自零售业务部门,包括在线商城、物流体系和生鲜杂货等核心业务 [18] - 公司为受影响员工提供90天的内部转岗机会,招聘团队优先考虑内部候选人 [13][14] - 未能转岗的员工将获得遣散费、再就业辅导和医疗保险延续等过渡支持 [15] 裁员背景与战略动机 - 亚马逊CEO Andy Jassy强调公司需重新找回盈利能力,未来几年将使用AI提高效率并减少员工总数 [22][23] - 此次裁员被视为公司降本增效和资源重组的重要举措,旨在将节省的薪资开支重新分配到固定资产投入和研发支出等新增长引擎 [21][32] - 公司解释裁员是为应对AI技术变革,精简组织架构以更快适应新蓝海市场 [29] - 尽管第二季度销售额同比增长13%至1677亿美元,超出华尔街预期,公司仍坚持裁员以优化资源配置 [27][28] AI与自动化战略布局 - 亚马逊正积极部署AI和机器人技术,计划通过自动化提升效率并减少人力依赖 [2][23] - 公司斥资4亿美元收购机器人初创公司Covariant,并基于其技术开发了智能机械臂Bluejay和Starling,用于提升仓储自动化水平 [33][34][35][36] - 2024年启用的新仓库已部署上千台机器人负责订单拣选与履约,计划到2027年将高自动化仓库模式扩展至近50个履约中心 [39][40] - 分析指出,自动化技术可能在未来几年取代超过50万个蓝领岗位,目前亚马逊仓储与物流环节有超过120万名合同工或外包人员 [41][42] 市场反应与行业影响 - 裁员消息公布后,亚马逊股价当天立即上涨1%,反映出市场对成本削减措施的积极态度 [5][6] - 与按兵不动的苹果相比,亚马逊在押注AI和自动化未来方面表现更为激进 [47] - 有观点认为,裁员可能带来长期风险,若AI技术发展不及预期或遭遇泡沫,公司可能面临人才短缺问题 [48]
全球首个具身智能开放平台来了!让大模型长出“身体”,像人一样自然表达交互
量子位· 2025-10-29 17:30
魔珐星云平台核心特点 - 魔珐科技发布全球首个面向开发者的具身智能3D数字人开放平台——魔珐星云 [3][4] - 平台可根据文本实时生成3D数字人的语音、表情、眼神、手势和身体动作,实现自然流畅的多模态交互 [8] - 平台具备低于1.5秒的端到端延迟、千万级并发能力,并可在百元级算力架构上运行 [6] 平台三大应用方向 - 为大模型和AI智能体提供身体和表达能力,使其能通过语音、表情和动作与人类互动 [11] - 将手机、平板、电视、车载屏幕等终端升级为具身智能界面,使屏幕从被动信息载体变为主动服务者 [12] - 驱动人形机器人实现自然沟通,通过虚拟端生成关节级运动并映射到机器人,使其能通过语音、眼神、手势交流 [14][15] 技术架构与核心优势 - 以自研文生多模态3D大模型为核心,将语义、语音、表情、动作纳入统一生成体系,实现多模态统一驱动 [27] - 采用创新的云-端拆分架构,云端生成语音和动作参数,端侧AI直接渲染画面,无需传统引擎与GPU支持,实现带宽小、延迟低、算力省 [28] - 平台可在RK3566、3588等百元级芯片上流畅运行,并适配国产信创芯片,支持多终端和中低端设备 [28] 公司能力与数据积累 - 团队自2018年起积累数千小时的高质量3D动画资产,为模型表现力提供关键支撑 [30][31] - 公司具备完整的感知、理解、行动三层能力,可为不同客户提供从模型到驱动的一体化解决方案 [33] - 公司已完成从项目到产品再到平台的转变,将3D数字人能力全面开放给开发者和企业 [32] 行业定位与差异化 - 与传统数字人平台不同,魔珐星云基于3D多模态生成模型驱动互动,而非合成表演,使AI交流具备身体语言层次感 [36][38] - 与Sora等视频生成模型不同,魔珐星云目标为驱动存在,通过低延迟和轻量架构实现语义、语音、动作一体化实时驱动 [39][40] - 平台定位为具身智能3D数字人,旨在让任何屏幕、界面、应用都能拥有身体,以自然方式进行交互和服务 [41][45] 行业影响与演进路径 - 魔珐星云弥合了虚拟世界大模型“有脑无身”和现实世界机器人“有身无魂”的鸿沟,贯通虚拟具身和真实具身 [54] - 平台重新审视“具身智能”概念,强调身体在人机交互与情感表达中的关键作用,超越对机器人劳动的单一关注 [55][57] - AI发展可视为具身演进路线:文字AI(无具身)→语音助手(半具身)→数字人(虚拟具身)→机器人(真实具身) [53]
不好美国要捧杀了!新研究:中国正在成为全球科学领导者
量子位· 2025-10-29 17:30
答案揭晓:中美科技实力大PK,以及得出的结论是—— 中国正在成为全球科学领导者 。 一水 发自 凹非寺 量子位 | 公众号 QbitAI 发表于2024年6月,却在当下登上《美国国家科学院院刊》,然后还被硅谷热议了。 究竟是什么论文? 和以往比比论文量、引用数不同,这项研究通过引入机器学习模型,分析了600万份论文的作者署名模式、通讯作者身份、机构影响力等多重 线索,核心评估了 "团队领导者" 这一指标。 研究人员表示,通过关注中国科学家在跨国合作中权力地位的变化: (我们) 为研究中国在国际科学领域中的地位提供了一个新视角。 而且他们还带来了一系列出人意料的发现——截至2023年,中美合作中中国领导者占比升至45%,且预计在2027-2028年达到相同水平。 预计到2030年,中国将在AI、半导体、能源和材料科学等战略领域实现与美国平起平坐的领导地位。 就是说,比人们预想的更快,中国将在科研力量上超越美国了? u1s1,虽然经彭博社报道后,外国网友们都在自嘲:西方科学无可争议的主导地位时代即将终结。 咳咳,究竟是客观结论还是战略"捧杀",还是先来看看论文是如何得出上述结论的吧—— 用AI模型分析600万篇论 ...
人工智能年度榜单火热报名中!五大奖项,寻找AI+时代的先锋力量
量子位· 2025-10-29 17:30
组委会 发自 凹非寺 量子位|公众号 QbitAI 为了让更多从业者感受智能浪潮的跃迁,也为了给予更多同行同路人掌声与鼓舞,我们将正式启动 「2025人工智能年度榜单」评选报名 。 本次评选将从 企业 、 产品 、 人物 三大维度,设立五类奖项。欢迎企业踊跃报名! 让我们共同见证年度之星,点亮未来的方向。 企业榜 产品榜 详细评选标准及报名方式如下。 2025 人工智能年度领航企业 将面向中国人工智能领域,评选出最具综合实力的企业, 参选条件 : 2025 人工智能年度 领航企业 2025 人工智能年度 潜力创业公司 2025 人工智能年度 杰出产品 2025 人工智能年度 杰出解决方案 1、注册地在中国,或主营业务主要面向中国市场; 2、主营业务属于人工智能及相关产业,或已将人工智能广泛应用于主营业务,并在细分领域居于行业领先地位; 评选标准 : 人物榜 2025 人工智能年度 焦点人物 2025 人工智能年度潜力创业公司 聚焦于中国人工智能领域创新创业力量,将评选出最具投资价值和发展潜力的AI创业公司, 参选条件 : 评选标准 : 3、具备成熟的产品或服务,已获得实际客户应用及市场认可; 4、近一年在技术 ...
阿里新研究:统一了VLA和世界模型
量子位· 2025-10-29 17:30
时令 发自 凹非寺 量子位 | 公众号 QbitAI 如果说视觉让AI看见世界,动作让AI改变世界,那么—— WorldVLA正在让AI理解世界。 在该框架下, 实验结果表明,WorldVLA的表现显著优于独立的动作模型与世界模型,充分体现了二者之间的相互增强效应。 | Model Type | Discrete | Continous | Input | Output | | --- | --- | --- | --- | --- | | Action Model | OpenVLA (Kim et al., 2024) | TO (Black et al., 2024) | T + V | A | | Video Prediction Model | | MAGVIT (Yu et al., 2023) SVD (Blattmann et al., 2023) | T + V | V | | World Model | iVideoGPT (Wu et al., 2025) | DWS (He et al., 2025) | T + V + A V | | | Action World Model | W ...
美国AI公司们,开始青睐Made in China的大模型
量子位· 2025-10-29 16:00
文章核心观点 - 美国AI公司正越来越多地采用中国大模型,这一趋势由模型的强大性能和高性价比共同驱动 [14][16][26][34][44] 美国公司采用中国模型的案例 - AI编程产品Windsurf被发现其“神秘模型”实为中国智谱的GLM模型 [2][3][7] - 估值93亿美元的公司Vercel宣布与智谱合作,提供GLM-4.6的API服务,其老板称赞该模型在评测中排名第三且是前五名中唯一开源的 [17][19] - 无服务器AI推理平台Featherless在Kimi K2发布时表示支持其新模型 [22] - Social Capital公司创始人表示已在Groq上开始使用Kimi-K2,并指出OpenAI和Anthropic的模型“太贵了” [30][31][33] 中国模型的优势 - 性能得到认可,例如GLM-4.6在特定评测中排名靠前,以及DeepSeek、Qwen等模型在海外频受关注 [19][27][28] - 性价比高,美国公司因成本考虑转向中国模型,中国厂商在价格竞争上具有优势 [26][31][34][35] - 中国厂商积极推出优惠活动,如快手提供2000万免费token,智谱推出包月折扣,MiniMax和快手延长免费期限等 [36] 行业趋势分析 - AI产业正从技术炫技阶段加速迈向务实应用阶段,成本、速度和可扩展性成为企业大规模部署时的关键考量 [40][41] - 企业的选择表明高性价比的适用技术是商业落地的硬道理,打破了“唯最强模型论” [42] - 全球AI竞争格局正变得更加多元化和激烈,标志着新竞争时代的到来 [43][44]
单条演示即可抓取一切:北大团队突破通用抓取,适配所有灵巧手本体
量子位· 2025-10-29 13:11
核心观点 - 北京大学及BeingBeyond团队提出DemoGrasp框架,通过将多步马尔可夫决策过程重构为基于轨迹编辑的“单步MDP”,解决了灵巧手通用抓取中传统强化学习面临的探索效率低、奖励函数设计复杂等挑战 [1][2][4] 技术原理与核心创新 - 核心创新在于用单条成功演示轨迹替代从零开始的探索,将高维抓取任务转化为演示编辑任务,再通过单步强化学习优化编辑参数 [4][6][7] - 方法以一次成功的抓取演示轨迹为起点,通过对轨迹中的机器人动作进行编辑以适应不同物体与姿态,包括改变腕部位姿以确定抓取位置,调整手指关节角度以确定抓取方式 [4][9][16] - 在紧凑动作空间的单步MDP问题上,使用单张RTX 4090显卡训练24小时即可收敛到成功率大于90% [12] 仿真训练与性能表现 - 在仿真环境中利用IsaacGym创建数千个并行世界进行训练,策略网络根据初始观测输出手腕和手指编辑参数,通过海量试错学会根据不同形状物体输出合适参数 [10][11] - 在权威数据集DexGraspNet(3.4K物体)上,视觉策略成功率达到92%,训练集到测试集的泛化差距仅为1% [17] - 性能显著优于现有方法:在基于状态的设定下,DemoGrasp在训练集、测试集(可见类别)和测试集(未见类别)的成功率分别为95.2%、95.5%和94.4%;在基于视觉的设定下,成功率分别为92.2%、92.3%和90.1% [18] 跨本体扩展与泛化能力 - 无需调整任何训练超参数,成功适配6种不同形态的机器人(五指、四指灵巧手,三指夹爪和平行夹爪),在175个物体上训练后,在多个未见过的物体数据集上达到84.6%的平均成功率 [19][20] - 具备强大的空间泛化能力,可适应大范围的物体初始位置随机化(50cm×50cm) [17] 虚实迁移与真机应用 - 通过视觉模仿学习将策略蒸馏成与真机对齐的RGB策略,实现从仿真到真机的直接迁移 [13][14] - 在真实机器人测试中,使用Franka机械臂和因时灵巧手,成功抓取了110个未见过的物体 [21] - 对于常规大小的物体,抓取成功率均达到90%以上;对于扁平物体和小物体等困难抓取任务,成功率达到70% [22][24] - 支持在杂乱多物体摆放的场景下实现用语言指令引导抓取,真机单次抓取成功率达到84% [24] 技术实现细节 - 采用流匹配生成模型的方法学习从图像观测和机器人本体感知预测动作,训练时使用预训练的ViT提取图像特征并进行充分的域随机化以缩小仿真到真机的视觉差异 [23] - 适配单目/双目、RGB/深度相机等多种相机观测,实验表明双目RGB相机组合效果最佳,能更好地抓取小而薄的物体 [23]