Workflow
大模型
icon
搜索文档
VLA的论文占据自动驾驶前沿方向的主流了。。。
自动驾驶之心· 2025-09-20 00:03
从今年各个CV与AI顶会来看,VLA及其相关衍生方向,已经成为自动驾驶公司和高校实验室的主攻方向,占据了自驾前沿方向近一半的产出。特别是推理增强VLA、强 化学习、相关benchmark等等。 想象一下, 如果能通过语言下达指令(找到最近的星巴克),并且车辆能够丝滑的行车&泊车,是一件多么幸福的事情! VLA打破了传统方法的单任务局限,使得自动驾驶车辆能够在多样化的场景中自主决策,灵活应对未见过的环境!VLA更加直白和干净,很多方法也取消了传统端到端的 复杂的3D感知任务。借鉴VLM更强大的通用泛化能力,除了任务更简洁,VLA更重要的还是提供了一种解决corner case的可能性。 而随着学术界和工业界的目光投向端到端这个技术领域,我们发现了很多问题。自动驾驶VLA的技术栈仍然没有收敛!一系列算法如雨后春笋般冒出: 技术栈多?入门困难? 前一段时间我们推出了《端到端与VLA自动驾驶小班课》,这门课侧重在端到端自动驾驶的技术栈梳理,同学们的反馈很好。 所以很多同学联系自动驾驶之心想学习更多 关于VLA的前沿知识! 因此自动驾驶之心联合清华大学的教研团队共同打造了《自动驾驶VLA实战教程》 ,针对自动驾驶VLA ...
免费送书 |雷军作序推荐!AI已经无法阻挡,我们能做些什么?
搜狐财经· 2025-09-19 20:21
似乎所有人都在谈论人工智能(AI),比如会写作文的ChatGPT、会画动画的Sora、能深度思考的Deepseek、会陪你聊天的Qwen……它们像一群飞速进化 的数字大脑,正在改变我们的学习、生活和工作。 但你有没有好奇过: 别急,所有问题的答案,都藏在一本既有趣又深刻的书里——《人工智能70年:从达特茅斯会议到大模型时代》。 好奇喵限时免费送书活动已开启,参与方式见文末! 它们是怎么"变聪明"的? 谁在背后推动这场改变世界的科技革命? AI究竟是人类的好朋友,还是像科幻电影中的大反派呢? 这本书由小米集团创始人雷军先生作序推荐,它不是一本枯燥的科技课本,而是一场穿越70年AI风云的沉浸式旅程。 作者陈宗周以资深科技媒体人兼科普作家的独特视角,巧妙地编织了"故事线"与"技术线"两条主线,让硬核的科技知识在鲜活的人物与事件中生动起来。 陈宗周,科普作家,资深科技媒体人,中囯科协第七届全国委员会委员。 新书目录 阅读本书,你会比其他人更了解AI是什么,知道AI能做什么、不能做什么。当同学们还在为AI感到惊奇或害怕时,你已经能化身小小科学家,理性地分 享你对AI的见解了。 你会在这里遇见那位被称作"倔强爷爷"的杰弗 ...
OpenAI、Anthropic台前斗法,微软、亚马逊幕后对垒
36氪· 2025-09-19 20:00
人工智能竞赛早已不再是单纯的商业合作,而是一场围绕未来十年技术制高点的权力博弈。在这场竞赛中,没有永恒的同盟,只有永恒的资本 和利益 美国的AI(人工智能)市场,正上演两大阵营的对垒。 台前,是全球最大的两家AI创业公司,OpenAI和Anthropic。幕后,则是微软、亚马逊这两家科技巨头,也是全球前两大云厂商,两家长期把持着云市场 60%以上的份额。 两大阵营对垒的格局是如何形成的? 今天的AI竞赛,背后是算力和模型的竞赛——微软、亚马逊需要用算力和资本,换取创业公司的模型和技术,进而获得更大的市场。OpenAI、Anthropic 需要靠巨头的输血快速成长。这也是微软和OpenAI、亚马逊和Anthropic这两对盟友合作的基础。 今年8月和9月,OpenAI和Anthropic接连完成新一轮融资,它们分别成为全球第三、第四大独角兽(第一是估值4000亿美元的SpaceX,第二是估值3150亿 美元的字节跳动)。 OpenAI累计融资超过797亿美元,估值3000亿美元。微软至少为OpenAI输血130亿美元,占其公开总融资额的16%以上。Anthropic累计融资超过312亿美 元,估值1830亿美元 ...
海外人形机器人:特斯拉引领,迈向具身智能新纪元
民生证券· 2025-09-19 19:55
报告行业投资评级 - 推荐 维持评级 [5] 报告核心观点 - 海外人形机器人产业已迈入智能化发展新阶段 技术研发 量产落地及商业应用等多维度迎来跨越式发展 [1] - 特斯拉Optimus研发进展迅速 软件与硬件端同步突破 预计2025年底推出Optimus 3 2026年开始量产 [2] - 海外人形机器人硬件百花齐放 头部厂商产业化进展不断加速 2025年有望成为海外人形机器人量产元年 [3] - 投资建议重视特斯拉量产确定性主线以及明星初创公司的国内供应链 看好Optimus V3潜在边际变化最大的硬件环节 [4] 行业发展历程 - 萌芽探索阶段(20世纪60年代末至90年代)以实现基本双足行走功能为主要目标 代表为日本早稻田大学WABOT系列 [14] - 集成发展阶段(21世纪初至2010年)以感知和智能控制整合为主要特点 代表为本田ASIMO系列 [15] - 高动态发展阶段(2010年至2022年)控制理论技术进步提升机器人认知能力 代表为本田升级版ASIMO和波士顿动力ATLAS [16] - 智能化发展阶段(2022年至今)大型语言模型快速进步加速具身智能出现 电驱动成为主流技术路线 代表为特斯拉Optimus [17] 技术路线分析 - 日本侧重形态仿生与服务应用 开发复杂逼真仿生机器人 面向家庭和服务应用 [18] - 美国引领功能学习与复杂环境操作产业化 在机器人操作领域取得重大进展 [21] - 欧洲多国展开多元化创新探索 在人类认知和人工智能研究 情感识别等领域有丰富实践 [24] 竞争格局 - 科技巨头通过全栈布局 内生发展及外延拓展三线并进入局人形机器人领域 [27] - 美国凭借AI领域强大积累领跑人形机器人赛道 初创公司数量13家与中国持平 过去10年融资总额达13.7亿美元居全球首位 [29] - 头部企业侧重技术融合与场景落地 通过资本纽带绑定创新主体 多数玩家避免单一路径依赖以降低试错风险 [28] 发展趋势 - 具身大模型持续赋能海外主机厂突破感知-决策-执行闭环技术瓶颈 [31] - Figure AI自研VLA模型Helix实现跨场景任务泛化 支持零样本学习到动态包裹处理升级 [31] - 1X Technologies依托OpenAI投资强化具身学习架构 结合世界模型优化家庭场景长周期任务泛化能力 [31] - Physical Intelligence分层交互系统Hi Robot整合高层推理VLM与底层执行VLA模型 开放式指令跟随准确率超越GPT-4o达40% [31] - 应用落地聚焦工业制造 物流仓储及家庭服务三大场景 [33] 特斯拉Optimus进展 - 软件端:2024年已具备上肢重物搬运 动态抓握及下肢复杂地形自主运动能力 2025年将优化崎岖地形步态 速度响应及跌倒恢复功能 [10] - 硬件端:Optimus 3将在2025年底推出 2026年开始量产 搭载22自由度灵巧手 采用轻量化解决方案 [10] - 量产计划:2025年出货量预计5千-1万台 2027年实现百万台级别量产 5年内实现年产100万台目标 [10] - 售价预估:2-3万美元 关注强降本诉求下高壁垒 高价值量环节国产替代机遇 [10] 其他主机厂产业化进展 - Figure AI:推出首个人形VLA模型Helix 发布BotQ人形机器人工厂 全球融资最多估值最高 与宝马达成合作 [64] - Boston Dynamics:从液压转向电驱 Altas惊艳世界 与英伟达 RAI研究所 本田研究所开展合作 [64] - 1X Technologies:发布NEO Gamma软硬件全面升级 首家实现商业化销售的人形机器人公司 [64] - Sanctuary AI:Phoenix 8采用轮式设计 搭载全新触觉传感器 拥有21自由度液压灵巧手 [64] - Agility Robotics:Digit加速量产 全球首家人形机器人工厂RoboFab已投产 目标年产能1万台 [64] - Apptronik:谷歌参投3.5亿美元A轮融资 与谷歌 奔驰 GXO和捷普合作推动Apollo商业化 [64] 投资建议 - 客户维度:重视特斯拉量产确定性主线以及明星初创公司的国内供应链 [4] - 产品维度:看好Optimus V3潜在边际变化最大的硬件环节包括灵巧手传动方案/触觉传感器构型 PC/ABS机甲外壳 类RV替代髋部/肩部谐波减速器 轻量化以塑代钢 万向节替代关节轴承等 [4] - 推荐标的:拓普集团 均胜电子 新泉股份 银轮股份 旭升集团 北特科技 建议关注浙江荣泰 万向钱潮 [4]
紫东太初4.0发布,国产大模型迈向“边看、边识、边思”新阶段
第一财经· 2025-09-19 19:21
为推动紫东太初4.0的技术优势转化为实际产业价值,"紫东太初云"平台同步发布。 9月19日,首款全栈国产化深度推理大模型"紫东太初"4.0在武汉发布,具备"边看、边识、边思"的类人多模态推理认知能力,特别是在带图思考多模态复杂 推理和工具调用的能力上,全面超过了GPT5。 2024年图灵奖得主理查德·萨顿表示,人类数据正在迅速接近极限,智能体将越来越多通过与世界交互而获得持续学习的能力,潜力远超以往。 中国科学院自动化研究所副总工程师、武汉人工智能研究院院长王金桥在接受第一财经记者采访时介绍,从3.0原生的多模态统一框架到4.0多模态细腻度的 复杂思考,紫东太初完成了国产大模型从"纯文本思考""简单操作带图思考"到"细粒度多模态语义思考"的三重跃迁。 以推理"赢得一场斯洛克需要几步"为例,"紫东太初"4.0通过输入的图片可先定位白球、粉球和红球的位置,再通过台上不同球的得分进行复杂的推理和数 学计算,进一步告诉大家他要做5杆斯洛克才能赢得这场球。 在视频多模态2AG应用上,"紫东太初"4.0能够实现180分钟长视频的深度理解,细腻度片段定位和内容自动分析、总结,在视频问答、细腻度检索和文档检 索等6项任务中达 ...
攻克大模型训推差异难题,蚂蚁开源新一代推理模型Ring-flash-2.0
机器之心· 2025-09-19 18:43
核心技术创新 - 蚂蚁百灵团队推出Ring-flash-2.0开源模型 采用MoE+长思维链+强化学习技术路线 总参数量100B 激活参数量6.1B [1] - 独创棒冰(icepop)算法实现双向截断和掩码修正 通过冻结训推精度差异过大的token梯度回传 解决强化学习训练稳定性问题 [6] - icepop算法相比GRPO训练方法能避免180-200步后的训练崩溃 并将训推精度差异控制在合理范围内 [8][9][10][12] - 采用两阶段强化学习方案:先通过Long-CoT SFT训练让模型学会思考 再通过RLVR强化推理能力 最后加入RLHF优化格式和安全 [14][16] 性能表现突破 - 模型在数学AIME25测试中获得86.98分 CodeForces elo分数达90.23 性能达到40B以内密集模型的SOTA水平 [1] - 支持128K长上下文处理 在4张H20显卡部署下实现200+ token/s的生成速度 相对加速比最高达7倍以上 [21] - 通过1/32专家激活比和MTP层架构优化 仅激活6.1B参数即可等效撬动40B密集模型性能 [21] - 在数学 代码和逻辑推理等多领域推理榜单取得显著突破 [1] 行业影响意义 - 模型突破2025年行业存在的"死亡曲线"问题 解决长思维链场景下MoE模型RL训练奖励崩溃的难题 [5] - 推动大模型竞争进入"高性价比"时代 核心指标从参数数量转向成本效益 [18][25] - 首次实现Long-CoT+RL技术的工程可落地 同步解决训练稳定性 推理成本和开源生态问题 [26] - 开启MoE长思考高性价比时代 为高并发场景提供低成本推理解决方案 [21][26]
寒武纪陈天石:不实
半导体芯闻· 2025-09-19 18:38
如果您希望可以时常见面,欢迎标星收藏哦~ 来源:内容来自腾讯科技,作者:苏扬,谢谢。 "网上传播的关于公司在某厂商预定大量载板订单、 收入预测、新产品情况、送样及潜在客户、供 应链等相关信息,均为误导市场的不实信息。"寒武纪董事长陈天石说。 9月18日,陈天石携财务负责人、董秘叶淏尹等出席2025上半年业绩说明会,回应投资者提问。 此前,8月27日,寒武纪发布半年报,2025年上半年,寒武纪营收和利润均大幅增长,其中营收 28.81亿元,同比增长4347%,扣除非经常性损益的净利润为9.13亿元,去年同期为-6.09亿元。 可以说,2025年是寒武纪洗刷"没有业绩空涨"的关键一年。 在此之前,寒武纪股价经历了接近一年半的上涨,最高接近1600元。高盛更是一路上调目标价至 2104元,不过这种涨幅是建立在2024年上半年、2023年没有太多业绩兑现的基础之上。 在被问及今年上半年"扭亏为盈",收入大幅增长的可持续性时,陈天石没有直接回答,而是委婉的 表示继续加大技术创新,而关于如何推动技术创新,陈天石在回应40亿定增获批和用途时做了一 些说明。 "拟开展面向大模型的智能处理器技术创新突破,研发覆盖不同类型大模型 ...
电声股份(300805) - 2025年9月19日投资者关系活动记录表
2025-09-19 18:38
财务业绩 - 2025年上半年营业收入12.20亿元,同比增长11.58% [3] - 归属于上市公司股东的净利润2,287.61万元,同比增长115.08% [3] - 扣除非经常性损益的净利润1,366.37万元,同比增长134.38% [3] - 销售费用和管理费用合计同比下降6.05% [3] - 经营活动现金流量净额-3,260.37万元,同比下降151.81% [5] 业务板块表现 - 消费电子行业营销服务收入同比增长13.46% [3] - 数字零售业务收入5.32亿元,同比增长32.16% [5] - 数字零售业务毛利率10.09%,同比下降0.24个百分点 [5] - B2C业务实现营业收入3.48亿元,同比增长63.46% [3] - 新能源汽车出行业务营收1,202.81万元,运营750台自营车辆 [6] 战略发展 - 积极拓展新行业新客户并开发新业务 [3] - 应用生成式AI、大模型、VR/AR、裸眼3D等新技术 [4][5] - 打造品牌产品矩阵并通过并购建设消费者品牌 [4] - 布局国际化发展包括品牌出海和跨境电商服务 [4] - 数字零售业务增长主要来自拼多多和生鲜电商平台 [5] 资金与投资 - 货币资金余额6.25亿元 [5] - 战略投资事项将按规履行信息披露义务 [5]
“无败绩”的罗永浩、下厨的刘强东、硬刚苹果的雷军...大佬们集体搞事为哪般?
搜狐财经· 2025-09-19 18:27
小米公司用户互动与危机管理 - 雷军创立小米时建立米粉论坛 每天与100名铁杆粉丝互动并采纳用户反馈 [8] - 小米建立MIUI论坛供用户提交问题报告和功能建议 公司积极回应有价值反馈 [8] - 针对用户试驾后投诉服务细节问题 雷军亲自道歉并立即安排改进 成功化解舆论危机并登上热搜 [8] 西贝餐饮与罗永浩预制菜争议 - 罗永浩质疑西贝菜品为预制菜 贾国龙回应称西贝没有预制菜且5人15道菜消费830元"真不贵" [8] - 西贝宣布全国门店上线"罗永浩菜单" 承诺"不好吃不要钱"并开放后厨参观 [9] - 罗永浩悬赏10万元征集法律证据 争议焦点上升到餐饮安全和消费者知情权问题 [9] 京东七鲜小厨战略布局 - 刘强东推出京东自建中央厨房七鲜小厨 与中粮、正大等头部供应商建立战略合作 [11] - 金融分析师认为七鲜小厨战略旨在通过高频餐饮需求提升客户粘性 目标成为本地生活超级平台 [11] - 计划实施10000家七鲜小厨 可能对外卖行业产生深远影响 主要对手为美团和饿了么 [11] 苹果与小米市场竞争 - 苹果亟需硬件大提升为iPhone 17赢得喘息时间 被视为悬崖边的绝地求生 [13] - 雷军预判苹果动作用互联网营销化解负面舆情 将"Are you OK"鬼畜视频转化为品牌资产 [13] - 小米凭借营销策略获取苹果新品发布流量 外界关注小米17系列实际市场表现 [13] 特斯拉中美市场战略分化 - 特斯拉在中国以卖车为重心稳固造车地位 在美国转向Robotaxi和人形机器人人工智能叙事 [15] - 自动驾驶系统FSD存在多重不确定性:能否超越人类驾驶水平、算法隐性缺陷、监管批准等问题 [15] - 中国作为最大汽车销售市场 销售业绩直接关系到为高成本研发输血 公司仍依赖汽车业务运转 [16] 蔚来汽车产品与销售策略 - 蔚来通过低价策略和增配降价方式 从高低两个维度建立规模效应 李斌因此被称为"斌神" [19] - 新产品L90和新ES8形成两架马车 推动公司进入销量爆发期 第四季度目标月均销量5万台 [19] - 公司初步解决销售问题 聚焦盈利任务 若第四季度达成目标将进入新发展逻辑轨迹 [19] 娃哈哈战略调整与宏胜系布局 - 娃哈哈今年关停18家工厂 包括沈阳、南京、天津等地多家食品饮料公司 [22] - 同时布局18条高速水线 所属11家项目公司多为宏胜系企业 如成都宏胜恒枫、广州恒枫饮料 [22] - 宗馥莉推动向宏胜系战略转移 法律上宏胜饮料集团与娃哈哈无股权关系 [22] 段永平投资观点与市场判断 - 认为大模型市场九死一生 10年后存活率不超过10% 预测Gemini可能成为主流因Google已觉醒 [25] - 表示加关税实质是给老百姓加税 对拼多多等企业影响有限 并表达对特朗普的好感 [25]
活动|福布斯中国正式推出“2025数字贸易系列评选”,并即将举办“数字贸易和投资对话”活动
搜狐财经· 2025-09-19 17:31
在全球数字经济加速发展的当下,数字贸易已成为推动国际经贸合作和经济增长的重要引擎。伴随数据要素市场化配置的深化、"一带一路"数 字经济合作的拓展,以及人工智能的广泛应用,中国数字贸易正迎来前所未有的机遇。 政策层面,数字贸易已被纳入国家战略重点。2024年,《关于数字贸易改革创新发展的若干意见》发布,明确表示分阶段提升数字化交付服务 贸易比重,推动数字产品、数字服务、数字技术、数字订购等多维度发展;2025年4月,国家发展改革委和国家数据局联合发布《2025年数字 经济发展工作要点》,提出加快发展数字贸易、建设海外智慧物流平台、拓展"丝路电商",并探索数据跨境流动管理新模式。与此同时,今年 的政府工作报告将数字贸易列为新增长点。 产业趋势上,新技术成为了数字贸易创新的核心驱动力。具身智能等前沿成果正推动跨境电商仓储、物流和服务环节的自动化,重塑全球供应 链效率;大模型应用加速了跨境服务的智能化与个性化,数据要素市场化配置催生出全链条生态的新交易模式;文化与数字技术的深度融合, 则让潮玩、游戏、影视等成为全球文化交流与数字消费的新兴领域。数字贸易的内涵正从传统的"货物+服务",延伸至"技术+数据+文化"的全 价 ...