开源模型
搜索文档
乌克兰多地遭空袭,已致4死80余伤;连锁餐饮企业监管新规出台;万达知情人士回应王健林被限高;受贿2.68亿!唐仁健一审被判死缓丨每经早参
每日经济新闻· 2025-09-29 06:03
有色金属行业政策 - 八部门印发《有色金属行业稳增长工作方案(2025—2026年)》,目标为2025-2026年行业增加值年均增长5%左右,十种有色金属产量年均增长1.5%左右 [5] - 方案提出铜、铝、锂等国内资源开发需取得积极进展,再生金属产量突破2000万吨,并提升高端产品供给能力及绿色低碳、数字化发展水平 [5] 民营经济发展 - 国家发展改革委主任郑栅洁主持召开民营企业座谈会,就“十五五”时期扩大有效投资听取意见建议 [6] - 国家发展改革委计划在扩大准入、打通堵点、强化保障等方面实施举措,加强产业、投资、财政、金融政策协同以激发民间投资活力 [6] 汽车行业动态 - 东风汽车正联手华为针对猛士品牌进行建店探索,双方合作有望形成更强战力的渠道体系 [14] - 华为智能汽车解决方案BU CEO靳玉志表示,L3级自动驾驶将在2027年规模放量,汽车产业正经历电动化、智能化到自动化的三波浪潮变革 [15] - 商务部办公厅发布关于做好2026年度汽车和摩托车出口许可申报工作的通知,线上申报系统将于2025年9月29日开通 [7] 企业融资与投资 - 星河动力航天完成D轮融资,融资总额共计24亿元,资金将用于加快可重复使用液体运载火箭及中型固体运载火箭的研制与能力建设 [22] - 万达集团及其法定代表人王健林被限制高消费,执行标的为1.86亿元,据称系下属项目公司经济纠纷导致 [18][19] 企业合作与产品发布 - 腾讯开源原生多模态生图模型“混元图像3.0”,参数规模达80B,为首个开源工业级原生多模态生图模型 [20] - 首个国产四价HPV疫苗(爱薇佳)正式获国家药监局批准上市,由国药集团中国生物所属研究所联合研发 [21] - 零跑汽车董事长朱江明回应被“限高”事件,表示已解除并称将提升团队能力 [17] 企业资本运作 - 多家公司发布资本运作相关公告,包括道生天台发行价格5.98元 [24],以及武汉控股、国星光电、博融等公司的定增、H股上市申请获接收、发行可转债等计划 [25] - 多家公司披露减持计划,包括博股份中标国家电网项目 [26],以及威腾电气、长江通信、科力尔等公司的股东拟减持信息 [26][27] - 部分公司进行收购及资产交易,如新大正拟收购嘉信立恒75.1%股权 [28],冠中生态拟收购杭州精算家股权 [29],光明乳业下属子公司处理新西兰北岛资产 [30]
宇树科技王兴兴谈机器人现状:最大挑战在哪里?为什么坚持开源?
机器人圈· 2025-09-26 17:29
人形机器人技术发展路线图 - 通信连接的创新对人形机器人发展至关重要,机器人对芯片算力和功耗控制有严苛要求[1] - 行业需要更开放的合作和共同创新以推动具身智能发展到下一阶段[1] - 2025年上半年机器人学习人类舞蹈武术动作的丝滑程度和效果已远好于此前[1] - 下一阶段目标是让机器人能实时生成任何动作,预计快则2025年慢则2026年上半年实现[1] - 2026年底前目标让人形机器人在不熟悉场景中通过指令自然运作,例如自主找水,预计快则2026年慢则2027年实现[1] 机器人行业面临的技术挑战 - 在线束方面,工业机器人故障率和寿命的影响因素中60%~70%与线缆故障相关[2] - 降低线缆数量对提升机器人性能和可靠性尤为重要,团队会为降低一根电线重量花费大量时间精力[2] - 未来人形机器人形态目标是在主控大脑和四肢间仅用一根线缆连接[2] 开源模型与行业合作 - 发展相应大模型能力是让机器人实现更好通用能力的关键[3] - 公司呼吁推动开源模型发展,类似OpenAI早期将ChatGPT1~2代开源以吸引产业界共同推进[4] - 公司于9月15日官宣开源UnifoLM-WMA-0模型,专为通用机器人学习设计,核心是理解机器人与环境交互物理规律的世界模型[4] - 公司彻底开源了该模型的数据集、训练源代码、部署源代码,倡导硬件行业公司学者将能开源的内容尽量开源以加速行业发展[4] 行业宏观数据与动态 - 75家机器人上市公司2025半年报显示总营收5821亿元,盈利301亿元[4]
宇树科技王兴兴谈人形机器人最大挑战
21世纪经济报道· 2025-09-24 23:13
人形机器人发展路线图 - 通信连接创新对人形机器人发展至关重要 机器人移动性和空间限制对芯片算力和功耗控制有更严苛要求[1] - 具身智能未来需要产业更开放合作和共同创新 推动行业加速发展到下一阶段[1] - 2025年上半年机器人学习人类舞蹈武术动作的丝滑程度和效果已远好于此前[1] 技术发展阶段 - 下一阶段目标是实现机器人实时生成任意动作 随便下达指令即可开始工作[1] - 快则2025年慢则2026年上半年 基本实现人形机器人任意实时生成各种动作[1] - 2026年底前目标让机器人在不熟悉场景中通过任意指令自然运作 例如在新场景自主找水交给客人[1] 行业技术挑战 - 线束是机器人行业发展重要挑战 工业机器人故障率和寿命60%-70%与线缆故障相关[2] - 降低电线重量需要花费大量时间和精力 降低线缆数量对提升机器人性能和可靠性尤其重要[2] - 未来理想形态是主控大脑和四肢之间只用一根线缆连接[2] 模型开源策略 - 发展大模型能力是实现机器人更好通用能力的关键[3] - 呼吁产业界开放合作 类似OpenAI早期开源ChatGPT1-2代推动产业发展[3] - 宇树科技9月15日开源UnifoLM-WMA-0模型 包含数据集训练源代码部署源代码[3] - 彻底开源旨在加速行业迈入下一阶段 使整个市场规模扩大[3]
宇树科技王兴兴谈人形机器人最大挑战
21世纪经济报道· 2025-09-24 23:12
人形机器人技术发展路线 - 通信连接创新对机器人发展至关重要 机器人移动性和空间限制对芯片算力和功耗控制提出严苛要求 [1] - 具身智能未来需要产业更开放合作和共同创新 以推动行业加速发展到下一阶段 [1] - 2025年上半年机器人学习人类舞蹈武术动作的丝滑程度和效果已远好于此前 [1] 动作生成技术进展 - 下一阶段目标为实现机器人实时生成任意动作 通过指令即可开始工作 [1] - 预计快则2024年慢则2025年上半年可实现人形机器人任意实时生成各种动作 [1] - 2025年底前目标让机器人在陌生场景中通过指令自然运作 例如自主找水交给客人 [1] 线缆技术挑战 - 工业机器人故障率和寿命影响因素中60%-70%与线缆故障相关 [2] - 降低线缆数量对提升机器人性能和可靠性尤为重要 团队曾为降低一根电线重量投入大量精力 [2] - 未来目标为主控大脑与四肢间仅用一根线缆连接 [2] 开源模型战略 - 发展大模型能力是实现机器人通用能力的关键 [2] - 呼吁行业采取开放态度推进开源模型发展 类似OpenAI早期开源ChatGPT1-2代推动产业进步 [2] - 宇树科技于9月15日开源UnifoLM-WMA-0模型 包含数据集训练源代码和部署源代码 [3]
宇树科技王兴兴谈机器人现状:最大挑战在哪里?为什么坚持开源?
21世纪经济报道· 2025-09-24 22:13
人形机器人发展路线图 - 通信连接创新对行业发展至关重要 机器人移动性和空间限制对芯片算力和功耗控制有更严苛要求[1] - 2025年上半年机器人学习人类舞蹈武术动作的丝滑程度和效果远好于此前 但按固定序列做动作仍不足够[1] - 下一阶段目标是实时生成任意动作 预计快则2024年慢则2025年上半年实现 让机器人可开始工作[1] - 2025年底前目标是在陌生场景中通过任意指令自然运作 例如自主找水递给客人 快则2025年慢则2026年实现[1] 行业技术挑战 - 线缆故障占工业机器人故障率和寿命因素的60%-70% 降低线缆数量对提升性能和可靠性尤为重要[3] - 团队为降低一根电线重量会花费大量时间精力 未来理想形态是主控大脑与四肢间仅用一根线缆连接[3] 开源合作与创新 - 呼吁产业开放合作共同创新 类似OpenAI早期开源ChatGPT1-2代推动产业发展[4] - 宇树科技9月15日开源UnifoLM-WMA-0模型 包含数据集训练源代码部署源代码 专为通用机器人学习设计[4] - 硬件行业公司和学者应开放开源以加速行业进入下一阶段 市场蛋糕将大幅扩大[4] 相关ETF数据 - 食品饮料ETF(515170)近五日跌2.84% 市盈率20.37倍 份额87.0亿份增2700.0万份 资金净流入147.6万元 估值分位19.42%[7] - 游戏ETF(159869)近五日跌1.25% 市盈率45.91倍 份额58.5亿份增1.0亿份 资金净流入1.2亿元 估值分位67.86%[7] - 科创半导体ETF(588170)近五日涨18.18% 份额8.1亿份增400.0万份 资金净流出1.2亿元[7] - 云计算50ETF(516630)近五日涨1.94% 市盈率123.26倍 份额3.6亿份增600.0万份 资金净流出6.3万元 估值分位91.53%[8]
吴泳铭的两个新判断,和加倍激进投入的阿里云
36氪· 2025-09-24 21:11
阿里云AI战略与愿景 - 公司提出超级人工智能(ASI)发展目标,超越AGI成为新方向 [4] - 公司CEO吴泳铭定义大模型为下一代操作系统,将吞噬软件并允许自然语言创造无限应用 [3] - 超级AI云被定义为下一代计算机,公司目标建立全球智能算力网络 [3] 技术产品发布 - 推出七款新模型包括旗舰模型Qwen3-Max(预训练数据36T tokens/超万亿参数)、Qwen3-Next(80B参数/仅激活3B)、Qwen3-VL(视觉编程能力)、Qwen3-Coder(代码生成)、Qwen3-Omni(多模态)、Wan2.5-preview(文生视频)和通义百聆(语音合成) [6] - Qwen3-Next训练成本较密集模型下降超90% [6] - 旗舰模型Qwen3-Max在LMArena排行榜位列全球前三 [9] 开源生态与市场地位 - 通义大模型全球下载量突破6亿次,衍生模型超17万个 [10] - 公司为国内开源最激进巨头,模型生态建设获实际回报 [9] - 中国AI云市场2025年上半年规模达223亿元,公司占比35.8%位列第一 [12] 基础设施与投入计划 - 宣布3800亿AI基础设施建设三年计划 [3] - 全球数据中心能耗规模到2032年较2022年提升10倍 [3] - 阿里云季度收入同比大涨26%,AI相关收入连续8季度三位数增长 [12] 行业竞争与发展趋势 - 全球AI累计投入预计超4万亿美元(未来五年) [13] - 行业进入Agent应用爆发阶段,公司百炼平台模型日均调用量增长15倍 [12] - 技术路线分歧减少,竞争重点转向系统级能力 [13][14]
阿里一口气发了N款新模型,让我们向源神致敬。
数字生命卡兹克· 2025-09-24 13:28
阿里云栖大会AI模型发布概览 - 阿里在云栖大会上密集发布多个AI模型 涵盖文本、视觉、音频、视频全模态领域 展示其全面的AI技术布局 [1][68] - 发布会期间公司股价出现显著上涨 反映市场对此次技术发布的积极态度 [1][2] Qwen3-Max模型性能 - Qwen3-Max为万亿参数MoE模型 使用36万亿tokens预训练 支持100万token上下文 直接对标GPT-5和Claude Opus 4等顶尖模型 [3][6][8] - 在LMArena全球权威模型对战平台排名前三 评分1430分 超越GPT-5-Chat的1430分 [4][5] - Instruct版本在专业测试集表现卓越:AIME2025领先 LiveCodeBench v6泛化能力突出 τ²-Bench以74.8分超越Claude Opus 4 SWE-Bench获69.6分居世界第一梯队 [9][11] - Thinking版本在AIME 25和HMMT数学推理竞赛获满分100分 与GPT-5 Pro持平 目前尚未开放体验 [13][15] Wan2.5视频生成突破 - 支持1080P分辨率和10秒时长生成 新增"音画同出"能力 可上传图片+音频直接生成带角色音频的视频 [23][25][27] - 解决音色一致性问题 支持音频驱动 显著增强数字人和人物表演能力 为AI短剧提供技术基础 [32] - 已上线通义万相平台供用户体验 [28] Qwen3-VL视觉语言模型 - 支持256K token上下文 可扩展至100万token(约2小时视频) 今日凌晨已开源 [33][34] - 235B-A22B版本在多项评测超越Gemini2.5 Pro 具备视觉Agent能力 可理解按钮和调用工具完成PC/手机端任务 [37][40] - 在复杂表格推理测试中一次性正确解析包含31省市8年经济数据的多维表格 [42][43] Qwen3-Omni全模态模型 - 端到端支持文本、图像、音频、视频输入 支持119种文本语言交互和19种语音理解语言 [48] - 语音对话延迟仅211毫秒 集成function call和MCP工具调用能力 [49][50] 其他模型技术亮点 - Qwen3-Coder-Plus提升推理速度并增强代码安全性 [54] - Qwen3-Next采用80B参数仅激活3B 性能媲美235B模型 训练成本降超90% 长文本推理吞吐量提升10倍 [54] - 通义百聆语音模型家族包含Fun-ASR(支持10+种语言实时处理)和Fun-CosyVoice(百种预制音色) [55][57][58] - 实时多模态翻译Qwen3-LiveTranslate-Flas延迟仅3秒 安全审核模型Qwen3Guard支持RL奖励建模 [59][60] 战略意义与行业影响 - 阿里通过此次发布会构建从底层模型到上层应用的全模态AI生态 展现其技术储备和产业化能力 [65][68] - 大规模开源行为旨在推动AI生态繁荣 强化行业影响力 [63][67]
谈超级人工智能之路,吴泳铭称阿里目标是打造AI时代的操作系统
第一财经· 2025-09-24 11:29
AI发展路径与阶段 - AI将经历三个阶段最终成长为超级人工智能:智能涌现阶段AI学习人 自主行动阶段AI辅助人 自我迭代阶段AI超越人[1] - 行业认为AGI具备人类通用认知能力已是确定性事件 AI的行业渗透率将超过历史上所有技术[1] - 跨越到自我迭代阶段需要两个要素:AI连接几乎物理世界所有场景和数据 模型通过与真实世界持续交互实现自我学习与智能升级[1] 大模型的未来角色 - 大模型将是下一代操作系统 在未来物理世界与数字世界交互中扮演核心地位[2] - 各行各业所有用户都将通过大模型相关工具执行任务 自然语言可能成为AI时代的编程语言[2] - 公司坚持开源路线打造AI时代操作系统 未来开源模型创造价值和渗透场景将远超大语言模型[2] AI计算范式变革 - 算力正从CPU为核心计算加速转向GPU为核心、大模型驱动的AI计算[2] - 新计算范式需要更稠密算力 更高效网络 更大集群规模 依赖超大规模基础设施和全栈基础积累[2] - 未来全世界可能只存在5到6个超级云计算平台[2] 公司战略与投入 - 公司通过通义千问开源生态建设 全栈AI能力建设 三年投入3800亿用于云和AI基础设施[2] - 对比2022年生成式AI元年 到2032年公司全球数据中心能耗规模将提升十倍[2] - 公司相信以饱和式投入能够推动超级人工智能时代到来[2] 行业数据趋势 - 公司观察到token消耗量每两三个月翻一番[1]
阿里云CTO周靖人:通义千问已开源300+模型,累计下载量超6亿
新浪科技· 2025-09-24 10:59
开源模型进展 - 通义千问累计开放超过300个开源模型,覆盖全尺寸和全模态 [1] - 开源模型总下载量已突破6亿次 [1] 新产品发布与生成成果 - 公司在2025云栖大会上新发布了包括Qwen3-VL在内的多款模型 [1] - 通义万象模型已生成超过3.9亿张图片 [1] - 通义万象模型已生成超过7000万个视频 [1]
为 OpenAI 秘密提供模型测试, OpenRouter 给 LLMs 做了套“网关系统”
海外独角兽· 2025-09-23 15:52
公司概况与市场定位 - OpenRouter是一家成立于2023年初的模型路由平台,为用户提供统一的API Key来调用各类大语言模型[6] - 公司定位为大语言模型的聚合器和市场,可被视为Stripe与Cloudflare的结合体,提供统一的控制面板来编排、发现和优化所有智能需求[31] - 截至2025年8月,平台已接入超过470个模型,用户可通过OpenRouter管理所有模型的账单[31] - 2025年6月,公司完成4000万美元融资,投后估值达5亿美元,投资者包括a16z和Menlo Ventures[6] 业务模式与核心价值 - 核心业务是模型路由,根据用户的提示词自动或按指定条件(如价格、时延)将请求路由至最合适的模型和供应商[6] - 解决了API调用的三大痛点:缺少统一市场与接口、API不稳定、成本与性能难以平衡[7][9] - 通过接入大量模型(包括同一开源模型的多个供应商)实现自动故障转移,增强了API稳定性[9] - 可将简单任务分配给低成本模型,复杂任务交给高性能模型,帮助用户实现成本与性能的最佳平衡[9] 运营数据与增长表现 - 平台token用量经历高速增长,从2025年初的4050亿增长到8月的32100亿,增长约8倍[6] - 周请求量从年初的4050亿tokens增长到9月的49000亿,增长超过12倍[2] - 闭源模型在平台上占据主导地位,消耗了约70%–80%的token[48] - 开源模型是增长最快的类别,常承担“优化最后一公里”的角色,用户为降低成本或优化特定场景会从闭源转向开源[50] 技术优势与运营策略 - 通过智能负载均衡将请求发送到最适合的供应商,使模型运行时间比直接连接供应商平均提升5%到10%[37] - 整个路由过程仅增加约20到25毫秒的延迟,所有服务部署在离用户服务器很近的边缘节点[37] - 采用token作为核心衡量单位,避免了因模型价格快速下降对排名产生的干扰,并能体现时间维度和实际使用价值[38][40] - 创建了各种路由通道,让用户对模型访问方式保持完全控制,同时提供大量分析数据帮助用户发现有效模型[34][37] 行业影响力与合作伙伴 - 发布的模型用量报告在业内和社交媒体上引发广泛讨论,成为开发者和投资人群体的必读内容[3][10] - 马斯克曾多次引用OpenRouter数据宣传Grok Code,称其调用量突破1万亿次,为平台带来巨大曝光[15] - OpenAI在模型正式发布前会用其他名字在OpenRouter上秘密上线,用于收集开发者反馈,例如GPT-4.1曾以Quasar Alpha名称测试[40][41] - 拥有专门运行开源基准测试的社区,积累了大量小众但有价值的基准测试,为模型提供商提供真实、客观的反馈[43][46] 未来发展方向 - 战略目标是成为智能体(Agent)的最佳推理层,为所有模型添加记忆、网页搜索等有状态的智能体能力[3][57] - 致力于避免供应商锁定,让开发者始终拥有选择权,可以自由切换到更智能的模型[60] - 计划在个人账户层面实现三大功能:开箱即用的记忆功能、更智能的模型选择建议、更深入的响应分析[55][56][57] - 未来可能与其他公司合作或自行构建工具,确保开发者不会感到被束缚,保持对智能体运作方式的控制[57][60]