大模型

搜索文档
冲上热搜!中国科技“敢”!
中国基金报· 2025-07-26 17:51
2025世界人工智能大会核心亮点 - 大会主题为"智能时代 同球共济",汇聚30余个国家和地区、12位图灵奖得主、80余位中外院士参与[1] - 800余家企业参展,包括华为、腾讯、阿里、百度、宇树科技、科大讯飞等AI龙头企业[1] - 展出3000余项前沿展品,含40余款大模型、50余款AI终端产品、60余款智能机器人及100余款"全球首发"新品[1] 技术前沿突破 - 大模型向垂直领域与低成本方向演进,40余款新型大模型亮相[5] - 具身智能取得突破,60余款智能机器人展示高精度操作能力,智元机器人量产超千台,年底产能或达万台[5] - 算力与终端协同创新,新华三发布支持万卡级异构算力集群的UniPoD超节点产品[5] 企业创新成果 - 华为首次线下展出昇腾384超节点真机,展示昇腾软硬件能力及11大行业解决方案[6] - MiniMax推出首款全栈通用智能体MiniMax Agent,能完成长程复杂任务[6] - 科大讯飞展示基于全国产化算力底座训练的讯飞星火大模型和讯飞星火X1深度推理大模型[6] - 阿里发布首款自研旗舰AI眼镜及三大AItoC核心产品[3][9] - 沐曦首次实物展出覆盖芯片到超节点的全链路技术方案[10] AI芯片与算力发展 - 华为发布CloudMatrix 384超节点高性能计算架构,通过通信与软件创新满足AI算力需求[8] - 中国半导体产业将保持中长期高增速,突破制裁后有望重塑全球科技产业链利润分配格局[8] - 拥有充足算力后,AI应用将在中国庞大消费与制造场景中爆发[9] AI大模型与机器人 - 全球大模型预训练加速迭代,OpenAI等公司建设数十万卡集群将推动能力阶跃式突破[14] - 人形机器人从主题投资过渡到景气投资阶段,具身智能产业链布局价值凸显[14] - 云深处科技全球首发轮足机器人山猫M20,展示行业巡检方案[12] AI医疗应用 - 傅利叶人形机器人带来"具身智能康复港"首秀及GR-3新品[15] - AI将推动医疗优质服务下沉、高端设备更新与国产替代,改变未来医疗生态[17] - 手术机器人分为操作型和定位型两类,面临商业化落地挑战但应用前景广阔[17] 行业投资机遇 - AI算力基建包括存算一体芯片、先进封装、HBM存储等[19] - 具身智能涵盖人形机器人、仓储物流机器人等领域[19] - 生成式AI垂直深化在医疗、工业等场景具有发展潜力[19] - AI Agent生态将从单任务工具向自主完成任务智能体演进[19] - AI智能终端如手机、眼镜等可穿戴产品市场空间广阔[19]
冲上热搜!中国科技“敢”!
中国基金报· 2025-07-26 17:41
2025世界人工智能大会核心亮点 - 大会以"智能时代 同球共济"为主题 汇聚30余个国家和地区 12位图灵奖得主 80余位中外院士 800余家企业参展 规模创历届之最 [1][3] - 展出3000余项前沿展品 包括40余款大模型 50余款AI终端 60余款智能机器人及100余款"全球首发""中国首秀"新品 [3] - 华为 腾讯 阿里 百度 宇树科技 科大讯飞等全球知名企业集中展示技术突破成果 [1][3] 技术前沿突破 - **大模型深化**:40余款新型大模型聚焦垂直领域与低成本方向 重点突破行业专用场景 [9] - **具身智能**:60余款机器人展示高精度操作能力 智元机器人量产超千台 年底产能或达万台 [9] - **算力协同创新**:新华三发布UniPoD超节点支持万卡级异构算力集群 破解大模型训练瓶颈 [9] 企业重磅产品发布 - **华为**:首次线下展出昇腾384超节点真机 展示11大行业解决方案实践 [7][12] - **阿里巴巴**:推出首款自研旗舰AI眼镜及三大AItoC核心产品(天猫精灵|哇哦 夸克 通义APP) [5][21] - **MiniMax**:发布全栈通用智能体MiniMax Agent 可完成长程复杂任务 [14] - **科大讯飞**:展示基于全国产化算力底座的讯飞星火大模型及X1深度推理大模型 [16] - **沐曦**:首次实物展出全链路GPU技术方案 覆盖芯片至超节点完整产品线 [25] AI芯片与算力进展 - 华为CloudMatrix 384超节点架构通过通信与软件创新满足海量算力需求 标志中国芯片"deepseek时刻" [18] - 中国半导体产业将迎井喷式爆发 华为创新型计算架构有望突破海外算力限制 [18][19] - 未来数十年中国半导体或保持高速增长 重塑全球科技产业链利润分配格局 [18][19] 机器人领域突破 - **云深处科技**:全球首秀轮足机器人山猫M20 展示行业巡检解决方案 [27] - **傅利叶智能**:推出GR-3人形机器人 创新硬件设计与交互功能 [31] - 人形机器人从"0到1"主题投资转向"1到N"景气投资 成为物理世界交互关键载体 [29] AI医疗应用 - 傅利叶"具身智能康复港"首秀 GR-3机器人实现专业康复操人机互动 [31] - 手术机器人加速国产替代 操作型与定位型产品同步发展 远程手术技术兴起 [31] - AI+医疗将推动服务下沉与设备更新 生物医药或成新经济增长引擎 [31] 投资机遇展望 - **AI算力基建**:存算一体芯片 先进封装 HBM存储 CPO光模块等 [36] - **具身智能**:人形机器人 仓储物流机器人 家庭服务机器人等 [36] - **生成式AI垂直深化**:医疗生物制药 工业3D设计生成 工程文档自动化等 [36] - **AI Agent生态**:企业级与消费级智能体应用爆发 [36] - **AI智能终端**:AI手机 眼镜等可穿戴产品创新 [36]
【WAIC2025】阶跃星辰发布基座大模型Step 3 与多家国产芯片厂商实现联合开发
经济观察网· 2025-07-26 13:14
公司动态 - 上海阶跃星辰智能科技有限公司发布首个全尺寸、原生多模态推理模型Step3,将于7月31日面向全球企业和开发者开源 [1] - Step3采用MoE架构,总参数量321B(3210亿),激活参数量38B(380亿),在推理解码效率下实现成本优化 [2] - Step3拥有视觉感知和复杂推理能力,能完成跨领域复杂知识理解、数学与视觉信息交叉分析,解决日常视觉分析问题 [2] - 公司联合近10家芯片及基础设施厂商组建模芯生态创新联盟,提升大模型适配性和算力效率 [2] - 公司宣布与上海国有资本投资有限公司战略合作,获得新融资后计划向全年10亿元人民币收入目标冲刺 [3] 技术表现 - Step3在英伟达H800芯片上分布式推理时,吞吐量较DeepSeek-R1提升超70% [2] - Step3在国产芯片上推理效率最高达DeepSeek-R1的300% [2] - 华为昇腾芯片首先实现Step3搭载和运行,沐曦、天数智芯和燧原科技等也初步实现运行 [3] 商业化进展 - 公司2025年上半年已实现数亿元合同收入且毛利水平较高 [3] - 公司与国内超一半手机厂商合作打造Agent,与吉利共建智能座舱,在金融、零售等领域探索C端场景化应用 [4] 行业观点 - 大模型产业过渡至2.0时代后,不少公司放弃模型训练转向商业化,但公司坚持超级模型加超级应用的路径 [1] - 最适合实际应用的大模型需满足强智能、低成本、可开源和多模态四个特征 [1] - 国产AI芯片厂商面临高端芯片制造和生态两座大山,模型和芯片合作可解决生态问题 [3]
阶跃星辰发布新一代基模 Step 3,原生多模态推理模型,性能达到开源 SOTA
Founder Park· 2025-07-26 12:53
新一代基模Step 3发布 - 阶跃星辰在WAIC 2025期间发布新一代基础大模型Step 3,该模型兼顾智能与效率,旨在面向推理时代打造最适合应用的模型 [3] - Step 3将于7月31日面向全球企业和开发者开源,为开源世界贡献最强多模态推理模型 [3][20] - Step 3是阶跃星辰首个全尺寸、原生多模态推理模型,采用MoE架构,总参数量321B,激活参数量38B [9] Step 3技术特性 - Step 3具备强智能、低成本、可开源和多模态四个特征,专为追求性能与成本极致均衡的企业和开发者设计 [8] - 模型拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析 [9] - 在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench等榜单上取得开源多模态推理模型的SOTA成绩 [16] 推理效率与成本优化 - Step 3通过系统架构创新实现行业领先的推理解码效率,在国产芯片上的推理效率最高可达DeepSeek-R1的300% [18] - 在NVIDIA Hopper架构芯片上进行分布式推理时,实测Step 3相较于DeepSeek-R1的吞吐量提升超70% [18] - 模型已授权国内多家芯片公司并完成适配,同时将通过开源技术报告分享降低推理成本的系统架构创新 [20] 模芯生态创新联盟 - 阶跃星辰联合近10家芯片及基础设施厂商发起"模芯生态创新联盟",首批成员包括华为昇腾、沐曦、壁仞科技等 [22] - 联盟致力于打通芯片、模型和平台全链路技术,提升大模型适配性和算力效率 [22] - 华为昇腾芯片已实现Step 3的搭载和运行,沐曦、天数智芯和燧原等也已初步实现运行Step 3 [22] 战略合作与应用落地 - 阶跃星辰与上海国有资本投资有限公司达成深度战略合作,将围绕资本链接、生态建设等方面进行全面合作 [6][22] - 公司战略性聚焦智能终端Agent方向,已覆盖国内超过一半头部国产手机厂商,并与吉利联合推出AI智能座舱 [23] - 积极拓展金融财经、内容创作、零售等垂直行业应用,与行业头部公司深度合作打造面向C端的场景化应用体验 [23] 1+N模型矩阵 - 阶跃星辰构建"1+N"的Step系列大模型矩阵,"1"指Step 3基础大模型,"N"为多模态大模型矩阵 [20] - 在WAIC期间升级多模态模型,包括多模理解生成一体化模型Step 3o Vision和第二代端到端语音大模型Step-Audio 2 [21] - 所有模型可在"阶跃AI"官网和App进行体验 [21]
直击WAIC 2025|2025世界人工智能大会上海开幕:百余款新品首发首秀,规模创历史之最
每日经济新闻· 2025-07-26 12:00
大会概况 - 2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)于7月26日在上海开幕 主题为"智能时代 同球共济" [1] - 大会设置会议论坛 展览展示 赛事评奖 应用体验 创新孵化五大板块 全面展现AI技术前沿与产业趋势 [1] - 首次聚焦"学术突破 软硬结合 全球治理"三大核心亮点 瞄准AI基础设施 科学智能 智能终端等十大重点板块 [1] - 采用"1+1+2+10+N"架构 包括开幕式及主论坛 全球治理高级别会议 两场全体会议 十余场部委论坛及N场生态论坛 [1] 参会阵容 - 首创"数学质问 模型质问 科学质问"三问机制 吸引30多国超1200位嘉宾参会 [2] - 参会者包括12位图灵奖/诺贝尔奖得主 超80位中外院士 国际顶尖实验室代表 知识共创阵容为历届之最 [2] 展览规模 - 展览面积首次突破7万平方米 吸引超800家企业参展 [3] - 展出超3000项前沿展品 包括40款以上大模型 50款以上AI终端产品 60款以上智能机器人 上百款"全球首发"或"中国首秀"新品 [3] - 设置核心技术馆 行业应用馆 智能终端馆与全域链接馆四大展馆 构建"AI能力走廊" [3] 青年参与 - 聚焦年轻化 升级"SAIL"奖和青年优秀论文奖 表彰青年科技力量 [3] - 推出多层次赛事平台 青年菁英交流会 思辨会 围绕大模型进化 具身智能等热点话题开展思想交锋 [3] 主办单位 - 由外交部 国家发展改革委 教育部等10个部委及上海市人民政府共同主办 [3]
四大“上海英伟达”CEO罕见聚首,阶跃星辰获融资且年营收目标10亿
钛媒体APP· 2025-07-26 11:23
2025世界人工智能大会(WAIC)概况 - 大会主题为"智能时代 同球共济",吸引30余国1200余位嘉宾,包括12位顶级奖项得主和80余位中外院士 [2] - 展览面积首次突破7万平米,800余家企业参展,发布3000余项展品,含40余款大模型和100余款首发新品 [2] 阶跃星辰Step 3大模型技术突破 - 发布全尺寸原生多模态推理模型Step 3,总参数量3210亿,激活参数380亿,采用MoE架构 [2] - 包含多模理解生成一体化模型Step 3o Vision和端到端语音大模型Step-Audio 2 [2] - 在MMMU等榜单取得开源多模态推理模型SOTA成绩,具备跨领域复杂知识理解和视觉分析能力 [3] - 国产芯片推理效率达DeepSeek-R1的300%,英伟达Hopper架构吞吐量提升超70% [3] 商业化战略与融资进展 - 2025年收入目标10亿元人民币,上半年已实现数亿元合同收入 [5] - 聚焦2B2C和ToC产品级收入,超50%头部国产手机品牌接入多模态能力 [5] - 上海国投生态体系将参与最新轮融资,预计总融资额超5亿美元(约35.77亿元) [3] 技术生态与合作 - 联合近10家芯片厂商发起"模芯生态创新联盟",华为昇腾等已实现Step 3搭载运行 [6] - 模型架构优先适配国产芯片访存比特性,解决计算瓶颈问题 [7] - 视频生成团队转向"多模理解生成一体化"技术组,探索智能涌现和AGI路径 [6] 行业趋势与国产化进程 - 大模型进入强化学习范式2.0阶段,行业淘汰加速 [4] - 国产芯片面临高端制造和生态两座大山,燧原产品性价比可达英伟达2-3倍 [11] - 国内大模型发展水平接近国外,但对芯片设计提出前瞻性需求 [11][12] 国产芯片企业动态 - 沐曦、天数智芯、燧原科技、壁仞科技四家CEO同台,被称为"上海英伟达" [8] - 芯片企业强调需通过模型与芯片深度优化实现商业化闭环 [10][11]
特斯拉是赢了,但不是真相的全部
虎嗅APP· 2025-07-26 11:09
懂车帝智驾大测试背景 - 懂车帝近期推出"36车智驾大测试",测试结果被马斯克转发并引发行业热议[1] - 测试包含6个高速场景和9个城市场景,涵盖消失前车、高速施工、事故车等边缘案例[5][24] - 测试采用真实道路,海南儋州测试场地封路10天,涉及G98环岛高速等主干道[29] 测试方法与公允性分析 - 智驾测试难以实现完全标准化控制,因缺乏专业测试装置且依赖人工操作[14] - 对比耗资5亿的碰撞测试场地,智驾测试在变量控制上存在客观技术限制[11][13] - 测试装置无法模拟极高加速度场景,导致无法完全复制真实条件[15] 特斯拉与中国车企表现差异 - 特斯拉FSD未使用中国本地数据训练,基于美国道路逻辑开发[17] - 中国道路复杂性显著高于美国,存在基建随意性和电动车博弈等独特场景[17] - 中国车企智驾模型侧重城市NOA场景,强化"博弈能力"但牺牲高速反应速度[19][20] - 特斯拉在美国简单道路训练的模型在高速场景反应更快,表现更优[22] 测试结果与行业影响 - 高速场景测试显示中国车企智驾水平出现倒退[15] - 城市场景测试中,国产智驾系统表现提升,多款车型仅未通过2-4个项目[26] - 测试由官方推动,公安部、科技部同日发布智驾相关政策和伦理指引[28][29] - 官方意图通过测试破除消费者对智驾的盲目信任,明确技术边界和责任归属[32][33] 行业政策动态 - 公安部要求车企明确智驾系统边界,禁止夸大宣传并强化用户培训[31] - 科技部发布《驾驶自动化技术研发伦理指引》,规范技术研发与应用[29] - 官方将持续开展安全警示活动,平衡技术发展与风险控制[33]
讯飞星火 X1升级,幻觉治理领先业界主流模型
齐鲁晚报· 2025-07-26 10:46
科大讯飞星火X1大模型升级 - 讯飞星火X1在事实性幻觉治理和忠实性幻觉治理方面取得显著突破,大幅提升生成内容的可靠性和行业应用价值 [1] - 新版本综合能力对标OpenAI o3等国际一流大模型,多语言能力扩展至130余种,并在翻译、推理、文本生成等核心能力上表现突出 [1] - 基于多路径采样验证及事实性约束强化学习的原创技术,有效降低慢思考下的幻觉率,提升通用常识和专业知识回复的可靠性 [2] 技术性能与数据对比 - 在基础能力测试中,星火X1文本生成准确率达90.43%,数学能力90.16%,均优于或接近OpenAI o3和DeepSeek竞品 [3] - 公开测试集表现亮眼:AMC-2024准确率88%,MMLU-Pro 83.95%,SuperGPQA 59.26%,部分指标领先国际对手 [3] - 幻觉专项测试中,事实性幻觉率仅9.52(越低越好),显著优于OpenAI o3的11.11和DeepSeek的12.80 [3] 行业应用落地 - 语音同传首字响应速度快至2秒,综合翻译质量提升20%,流畅度接近母语交流水平 [8] - 教育领域实现作业批改、个性化推荐、答疑辅学等能力升级,巩固行业领先优势 [8] - 医疗大模型覆盖全科辅助诊断至专科诊疗链条,在华西医院等顶级医疗机构试点效果行业领先 [9] 战略地位与政策支持 - 公司董事长两度出席国家高规格企业家座谈会,成为人工智能领域唯一代表,凸显国家级战略背书 [4] - 公司担任国家人工智能标准化总体组大模型专题组联合组长等多项核心职务,主导智能语音国家级技术标准创新基地筹建 [4] 技术创新路径 - 开创性采用人类专家数据反写技术,解决高质量SFT数据获取难题,提升主观任务文笔和风格化水平 [3] - 将评语模型与细粒度反馈强化学习结合,通过文本指导优化数学推理训练效率,突破传统数值奖励局限 [8]
“算得快又吃得少” 端边AI芯片助力大模型装进PC、手机
新华财经· 2025-07-26 10:30
公司动态 - 后摩智能发布端边大模型AI芯片M50及配套硬件组合 包括力擎系列M2卡 力谋系列加速卡及计算盒子 形成覆盖移动终端与边缘场景的完整产品矩阵 [1] - M50芯片典型功耗仅10W 支持1.5B到70B参数的本地大模型运行 具备高算力 低功耗 即插即用特性 [1] - 公司依托存算一体技术优势 将计算和存储单元集成 解决传统芯片数据传输慢 功耗高问题 满足端边设备算力需求 [2] - 产品矩阵可应用于PAD PC 智能语音设备 机器人等移动终端 以及一体机 计算盒子 工作站等边缘设备 [2] - 解决方案支持消费终端 智能办公 智能工业等领域的离线全流程本地处理 保障数据隐私安全 [3] - 公司成立于2020年 已获得中国移动产业链发展基金 北京市人工智能基金等多家机构投资 [3] 行业趋势 - 大模型加速落地各类人机交互终端 包括PC 手机 机器人 眼镜 耳机 手表等 端侧大模型具备隐私保护强 响应速度快优势 [1] - 全球端侧AI市场规模预计从2025年3219亿元增长至2029年1.2万亿元 复合年增长率达39.6% [1] - 市场对适配端侧大模型的算力需求持续提升 需满足高算力 高带宽 低功耗三大指标 [2]
特斯拉是赢了,但不是真相的全部
虎嗅· 2025-07-26 08:13
特斯拉与中国车企智驾表现对比 - 特斯拉在中国没有使用本地训练数据的情况下取得最高成绩 凸显其基于美国数据训练的智驾系统在高速场景的优势[1][18] - 中国车企智驾系统在高速NOA场景表现出现倒退 主要因专注于城市复杂路况的"强博弈"能力开发[17][23] - 中美道路差异显著 中国道路基建随意性大 存在大量电动车和外卖骑手等美国没有的交通参与者[19][20] 智驾测试方法论与局限性 - 完全精准的车辆测试耗资巨大 某碰撞测试场地耗资5亿 智驾测试难以做到完全控制变量[13][15] - 当前智驾测试装置无法实现极高加速度 难以完全复制场景 测试公允性存在挑战[16] - 懂车帝测试已属不易 虽不完美但足以揭示行业现状[17] 中美智驾系统技术路线差异 - 中国智驾系统专注于城市NOA场景 开发"强博弈"能力以应对复杂路况[23][24] - "强博弈"能力使系统更倾向于老司机思维 在突发情况下选择绕行而非急刹[25] - 这种设计在高速场景反而降低安全系数 表现为决策犹豫和反应时间延长[26][27][28] 未发布的城市场景测试预期 - 懂车帝测试包含15个场景 已发布6个高速场景 还有9个城市场景待发布[30] - 城市场景包括转盘汇出、儿童过马路等极端复杂情况 预计中国智驾系统将反超特斯拉[31][32][33] 测试背后的政策导向 - 测试由官方推动 三个不同部门同日发声 显示顶层设计意图[34][35][37] - 目的是破除消费者对智驾的盲目信任 推动行业健康发展[38][39] - 这是国家级安全警示教育活动 将持续开展以确保智驾推广风险可控[40]