Workflow
大模型
icon
搜索文档
阶跃星辰发布新一代基模 Step 3,原生多模态推理模型,性能达到开源 SOTA
Founder Park· 2025-07-26 12:53
新一代基模Step 3发布 - 阶跃星辰在WAIC 2025期间发布新一代基础大模型Step 3,该模型兼顾智能与效率,旨在面向推理时代打造最适合应用的模型 [3] - Step 3将于7月31日面向全球企业和开发者开源,为开源世界贡献最强多模态推理模型 [3][20] - Step 3是阶跃星辰首个全尺寸、原生多模态推理模型,采用MoE架构,总参数量321B,激活参数量38B [9] Step 3技术特性 - Step 3具备强智能、低成本、可开源和多模态四个特征,专为追求性能与成本极致均衡的企业和开发者设计 [8] - 模型拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析 [9] - 在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench等榜单上取得开源多模态推理模型的SOTA成绩 [16] 推理效率与成本优化 - Step 3通过系统架构创新实现行业领先的推理解码效率,在国产芯片上的推理效率最高可达DeepSeek-R1的300% [18] - 在NVIDIA Hopper架构芯片上进行分布式推理时,实测Step 3相较于DeepSeek-R1的吞吐量提升超70% [18] - 模型已授权国内多家芯片公司并完成适配,同时将通过开源技术报告分享降低推理成本的系统架构创新 [20] 模芯生态创新联盟 - 阶跃星辰联合近10家芯片及基础设施厂商发起"模芯生态创新联盟",首批成员包括华为昇腾、沐曦、壁仞科技等 [22] - 联盟致力于打通芯片、模型和平台全链路技术,提升大模型适配性和算力效率 [22] - 华为昇腾芯片已实现Step 3的搭载和运行,沐曦、天数智芯和燧原等也已初步实现运行Step 3 [22] 战略合作与应用落地 - 阶跃星辰与上海国有资本投资有限公司达成深度战略合作,将围绕资本链接、生态建设等方面进行全面合作 [6][22] - 公司战略性聚焦智能终端Agent方向,已覆盖国内超过一半头部国产手机厂商,并与吉利联合推出AI智能座舱 [23] - 积极拓展金融财经、内容创作、零售等垂直行业应用,与行业头部公司深度合作打造面向C端的场景化应用体验 [23] 1+N模型矩阵 - 阶跃星辰构建"1+N"的Step系列大模型矩阵,"1"指Step 3基础大模型,"N"为多模态大模型矩阵 [20] - 在WAIC期间升级多模态模型,包括多模理解生成一体化模型Step 3o Vision和第二代端到端语音大模型Step-Audio 2 [21] - 所有模型可在"阶跃AI"官网和App进行体验 [21]
直击WAIC 2025|2025世界人工智能大会上海开幕:百余款新品首发首秀,规模创历史之最
每日经济新闻· 2025-07-26 12:00
大会概况 - 2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)于7月26日在上海开幕 主题为"智能时代 同球共济" [1] - 大会设置会议论坛 展览展示 赛事评奖 应用体验 创新孵化五大板块 全面展现AI技术前沿与产业趋势 [1] - 首次聚焦"学术突破 软硬结合 全球治理"三大核心亮点 瞄准AI基础设施 科学智能 智能终端等十大重点板块 [1] - 采用"1+1+2+10+N"架构 包括开幕式及主论坛 全球治理高级别会议 两场全体会议 十余场部委论坛及N场生态论坛 [1] 参会阵容 - 首创"数学质问 模型质问 科学质问"三问机制 吸引30多国超1200位嘉宾参会 [2] - 参会者包括12位图灵奖/诺贝尔奖得主 超80位中外院士 国际顶尖实验室代表 知识共创阵容为历届之最 [2] 展览规模 - 展览面积首次突破7万平方米 吸引超800家企业参展 [3] - 展出超3000项前沿展品 包括40款以上大模型 50款以上AI终端产品 60款以上智能机器人 上百款"全球首发"或"中国首秀"新品 [3] - 设置核心技术馆 行业应用馆 智能终端馆与全域链接馆四大展馆 构建"AI能力走廊" [3] 青年参与 - 聚焦年轻化 升级"SAIL"奖和青年优秀论文奖 表彰青年科技力量 [3] - 推出多层次赛事平台 青年菁英交流会 思辨会 围绕大模型进化 具身智能等热点话题开展思想交锋 [3] 主办单位 - 由外交部 国家发展改革委 教育部等10个部委及上海市人民政府共同主办 [3]
四大“上海英伟达”CEO罕见聚首,阶跃星辰获融资且年营收目标10亿
钛媒体APP· 2025-07-26 11:23
2025世界人工智能大会(WAIC)概况 - 大会主题为"智能时代 同球共济",吸引30余国1200余位嘉宾,包括12位顶级奖项得主和80余位中外院士 [2] - 展览面积首次突破7万平米,800余家企业参展,发布3000余项展品,含40余款大模型和100余款首发新品 [2] 阶跃星辰Step 3大模型技术突破 - 发布全尺寸原生多模态推理模型Step 3,总参数量3210亿,激活参数380亿,采用MoE架构 [2] - 包含多模理解生成一体化模型Step 3o Vision和端到端语音大模型Step-Audio 2 [2] - 在MMMU等榜单取得开源多模态推理模型SOTA成绩,具备跨领域复杂知识理解和视觉分析能力 [3] - 国产芯片推理效率达DeepSeek-R1的300%,英伟达Hopper架构吞吐量提升超70% [3] 商业化战略与融资进展 - 2025年收入目标10亿元人民币,上半年已实现数亿元合同收入 [5] - 聚焦2B2C和ToC产品级收入,超50%头部国产手机品牌接入多模态能力 [5] - 上海国投生态体系将参与最新轮融资,预计总融资额超5亿美元(约35.77亿元) [3] 技术生态与合作 - 联合近10家芯片厂商发起"模芯生态创新联盟",华为昇腾等已实现Step 3搭载运行 [6] - 模型架构优先适配国产芯片访存比特性,解决计算瓶颈问题 [7] - 视频生成团队转向"多模理解生成一体化"技术组,探索智能涌现和AGI路径 [6] 行业趋势与国产化进程 - 大模型进入强化学习范式2.0阶段,行业淘汰加速 [4] - 国产芯片面临高端制造和生态两座大山,燧原产品性价比可达英伟达2-3倍 [11] - 国内大模型发展水平接近国外,但对芯片设计提出前瞻性需求 [11][12] 国产芯片企业动态 - 沐曦、天数智芯、燧原科技、壁仞科技四家CEO同台,被称为"上海英伟达" [8] - 芯片企业强调需通过模型与芯片深度优化实现商业化闭环 [10][11]
特斯拉是赢了,但不是真相的全部
虎嗅APP· 2025-07-26 11:09
懂车帝智驾大测试背景 - 懂车帝近期推出"36车智驾大测试",测试结果被马斯克转发并引发行业热议[1] - 测试包含6个高速场景和9个城市场景,涵盖消失前车、高速施工、事故车等边缘案例[5][24] - 测试采用真实道路,海南儋州测试场地封路10天,涉及G98环岛高速等主干道[29] 测试方法与公允性分析 - 智驾测试难以实现完全标准化控制,因缺乏专业测试装置且依赖人工操作[14] - 对比耗资5亿的碰撞测试场地,智驾测试在变量控制上存在客观技术限制[11][13] - 测试装置无法模拟极高加速度场景,导致无法完全复制真实条件[15] 特斯拉与中国车企表现差异 - 特斯拉FSD未使用中国本地数据训练,基于美国道路逻辑开发[17] - 中国道路复杂性显著高于美国,存在基建随意性和电动车博弈等独特场景[17] - 中国车企智驾模型侧重城市NOA场景,强化"博弈能力"但牺牲高速反应速度[19][20] - 特斯拉在美国简单道路训练的模型在高速场景反应更快,表现更优[22] 测试结果与行业影响 - 高速场景测试显示中国车企智驾水平出现倒退[15] - 城市场景测试中,国产智驾系统表现提升,多款车型仅未通过2-4个项目[26] - 测试由官方推动,公安部、科技部同日发布智驾相关政策和伦理指引[28][29] - 官方意图通过测试破除消费者对智驾的盲目信任,明确技术边界和责任归属[32][33] 行业政策动态 - 公安部要求车企明确智驾系统边界,禁止夸大宣传并强化用户培训[31] - 科技部发布《驾驶自动化技术研发伦理指引》,规范技术研发与应用[29] - 官方将持续开展安全警示活动,平衡技术发展与风险控制[33]
讯飞星火 X1升级,幻觉治理领先业界主流模型
齐鲁晚报· 2025-07-26 10:46
科大讯飞星火X1大模型升级 - 讯飞星火X1在事实性幻觉治理和忠实性幻觉治理方面取得显著突破,大幅提升生成内容的可靠性和行业应用价值 [1] - 新版本综合能力对标OpenAI o3等国际一流大模型,多语言能力扩展至130余种,并在翻译、推理、文本生成等核心能力上表现突出 [1] - 基于多路径采样验证及事实性约束强化学习的原创技术,有效降低慢思考下的幻觉率,提升通用常识和专业知识回复的可靠性 [2] 技术性能与数据对比 - 在基础能力测试中,星火X1文本生成准确率达90.43%,数学能力90.16%,均优于或接近OpenAI o3和DeepSeek竞品 [3] - 公开测试集表现亮眼:AMC-2024准确率88%,MMLU-Pro 83.95%,SuperGPQA 59.26%,部分指标领先国际对手 [3] - 幻觉专项测试中,事实性幻觉率仅9.52(越低越好),显著优于OpenAI o3的11.11和DeepSeek的12.80 [3] 行业应用落地 - 语音同传首字响应速度快至2秒,综合翻译质量提升20%,流畅度接近母语交流水平 [8] - 教育领域实现作业批改、个性化推荐、答疑辅学等能力升级,巩固行业领先优势 [8] - 医疗大模型覆盖全科辅助诊断至专科诊疗链条,在华西医院等顶级医疗机构试点效果行业领先 [9] 战略地位与政策支持 - 公司董事长两度出席国家高规格企业家座谈会,成为人工智能领域唯一代表,凸显国家级战略背书 [4] - 公司担任国家人工智能标准化总体组大模型专题组联合组长等多项核心职务,主导智能语音国家级技术标准创新基地筹建 [4] 技术创新路径 - 开创性采用人类专家数据反写技术,解决高质量SFT数据获取难题,提升主观任务文笔和风格化水平 [3] - 将评语模型与细粒度反馈强化学习结合,通过文本指导优化数学推理训练效率,突破传统数值奖励局限 [8]
“算得快又吃得少” 端边AI芯片助力大模型装进PC、手机
新华财经· 2025-07-26 10:30
公司动态 - 后摩智能发布端边大模型AI芯片M50及配套硬件组合 包括力擎系列M2卡 力谋系列加速卡及计算盒子 形成覆盖移动终端与边缘场景的完整产品矩阵 [1] - M50芯片典型功耗仅10W 支持1.5B到70B参数的本地大模型运行 具备高算力 低功耗 即插即用特性 [1] - 公司依托存算一体技术优势 将计算和存储单元集成 解决传统芯片数据传输慢 功耗高问题 满足端边设备算力需求 [2] - 产品矩阵可应用于PAD PC 智能语音设备 机器人等移动终端 以及一体机 计算盒子 工作站等边缘设备 [2] - 解决方案支持消费终端 智能办公 智能工业等领域的离线全流程本地处理 保障数据隐私安全 [3] - 公司成立于2020年 已获得中国移动产业链发展基金 北京市人工智能基金等多家机构投资 [3] 行业趋势 - 大模型加速落地各类人机交互终端 包括PC 手机 机器人 眼镜 耳机 手表等 端侧大模型具备隐私保护强 响应速度快优势 [1] - 全球端侧AI市场规模预计从2025年3219亿元增长至2029年1.2万亿元 复合年增长率达39.6% [1] - 市场对适配端侧大模型的算力需求持续提升 需满足高算力 高带宽 低功耗三大指标 [2]
特斯拉是赢了,但不是真相的全部
虎嗅· 2025-07-26 08:13
特斯拉与中国车企智驾表现对比 - 特斯拉在中国没有使用本地训练数据的情况下取得最高成绩 凸显其基于美国数据训练的智驾系统在高速场景的优势[1][18] - 中国车企智驾系统在高速NOA场景表现出现倒退 主要因专注于城市复杂路况的"强博弈"能力开发[17][23] - 中美道路差异显著 中国道路基建随意性大 存在大量电动车和外卖骑手等美国没有的交通参与者[19][20] 智驾测试方法论与局限性 - 完全精准的车辆测试耗资巨大 某碰撞测试场地耗资5亿 智驾测试难以做到完全控制变量[13][15] - 当前智驾测试装置无法实现极高加速度 难以完全复制场景 测试公允性存在挑战[16] - 懂车帝测试已属不易 虽不完美但足以揭示行业现状[17] 中美智驾系统技术路线差异 - 中国智驾系统专注于城市NOA场景 开发"强博弈"能力以应对复杂路况[23][24] - "强博弈"能力使系统更倾向于老司机思维 在突发情况下选择绕行而非急刹[25] - 这种设计在高速场景反而降低安全系数 表现为决策犹豫和反应时间延长[26][27][28] 未发布的城市场景测试预期 - 懂车帝测试包含15个场景 已发布6个高速场景 还有9个城市场景待发布[30] - 城市场景包括转盘汇出、儿童过马路等极端复杂情况 预计中国智驾系统将反超特斯拉[31][32][33] 测试背后的政策导向 - 测试由官方推动 三个不同部门同日发声 显示顶层设计意图[34][35][37] - 目的是破除消费者对智驾的盲目信任 推动行业健康发展[38][39] - 这是国家级安全警示教育活动 将持续开展以确保智驾推广风险可控[40]
龙岗百企行⑩|评论:从“排忧解难”到“添薪续力”,龙岗给出服务企业新方案
搜狐财经· 2025-07-26 04:25
龙岗区企业服务成效 - 龙岗区企业数量逆势增长,净增2.6万家企业,增量全市第一 [1] - 华为在手机电脑新品和鸿蒙生态取得历史性突破 [1] - 比亚迪巴西工厂首车下线,新能源汽车加速拓展欧洲市场 [1] - 领益智造进军具身智能机器人领域,多家企业上线大模型和新技术 [1] - 深圳御光新材料打破国外热固液晶薄膜技术垄断 [1] 政府服务举措 - 挂点干部走访服务企业2.6万家次,"龙i企"平台诉求办成率超95% [2] - 科技成果供需对接平台收录5000余条需求,促成100多项合作 [2] - 实施"零租、免租、减租"空间政策,成立8支总规模204亿元产业基金 [2] - 推出"园区贷""种子贷""信易贷"等金融产品 [2] 人工智能产业布局 - 龙岗将"All in AI"纳入战略蓝图,举办500场场景对接活动 [2] - 促成企业合作超20亿元,打造11个应用场景示范点 [2] - 政府投资项目为AI和机器人产品预留份额 [2] - 大运天地、机套人街区等成为企业创新实验场 [2] 长期服务承诺 - 龙岗提出"当好企业战略合伙人"的长期服务理念 [3] - 强调服务企业是"长久之诺"而非短期行为 [3]
如果不是这个消息传出,很多人还被蒙在鼓里,原来外媒说的真的
新浪财经· 2025-07-26 02:48
阿里技术实力突破 - 阿里开源编程模型Qwen3-Coder刷新开源领域纪录,直接挑战GPT-4.1、Claude4等商业巨头的地位 [1] - Qwen3-Coder使初级程序员借助AI能在几天内完成资深程序员一个月的工作量,展现接近人类顶尖开发者的专业性 [1] - 模型在代码生成、漏洞修复、复杂系统架构设计等方面实现AI对编程逻辑的深度理解 [1] 阿里技术积累与生态布局 - 今年以来阿里密集开源多款先进模型,形成覆盖全尺寸、全类型的模型矩阵 [3] - 阿里云作为中国最大、亚太第一的云计算平台提供算力支撑,通义千问通过300多款开源模型和4亿次累计下载量构建全球AI生态 [3] - 开源策略形成"全球协同+场景落地"模式,通过开放模型权重和训练方法吸引开发者共同优化 [3] 阿里科技布局的广度与深度 - 阿里云连续多年位居全球前三,支撑中国一半以上的科技公司 [4] - 在AI领域除大模型外,机器翻译、图像识别等基础技术长期保持国际领先 [4] - 科技实力已融入双11算力调度、物流网络智能规划、支付系统风险识别等商业场景 [4] 行业影响与生产力变革 - Qwen3-Coder可能缩短软件开发周期、降低技术门槛和创新成本,引发数字化基础设施领域连锁反应 [4] - 中小企业可借助AI工具以少数人完成过去需专业团队的系统开发 [5] - 将加速数字化转型普惠化,让更多企业享受技术红利 [5] 中国科技企业角色转变 - 阿里从"技术跟随"到"创新引领",成为重塑全球产业格局的重要力量 [7] - 开源生态持续壮大推动更多类似Qwen3-Coder的模型涌现 [7] - 云和AI深度融合将带来更多技术突破,推动社会效率升级 [7]
建了个抱团取暖的求职交流群~
自动驾驶之心· 2025-07-25 18:47
微信扫码添加小助理邀请进群,备注自驾+昵称+求职; 最近和很多准备校招的小伙伴接触,发现大家都在焦虑。在校不让实习、实验室没算力、传统规控想转行却不 知如何下手。也有不少工作多年的小伙伴表示也在看机会,感知转大模型、规则想转具身。但其实背后都是大 家想更进一步,都想去争取一个更好的未来~ 大家都感觉到自动驾驶技术栈开始趋同,以前大大小小几十个方向都需要算法工程师,现在one model、 VLM、VLA,统一方案的背后其实是更高的技术壁垒。博主一直在鼓励大家坚持、多多交流,但归根结底个 人的力量是有限的。我们希望共建一个大的社群和大家一起成长,真正能够帮助到一些有需要的小伙伴,成为 一个汇集全行业人才的综合型平台。所以我们也开始正式运营求职与行业相关的社群。社群内部主要讨论相关 产业、公司、产品研发、求职与跳槽相关内容。如果您想结交更多同行业的朋友,第一时间了解产业。欢迎加 入我们! ...