Qwen系列

搜索文档
“2025年全球百大影响力企业”:台积电、华为等入选!
搜狐财经· 2025-06-30 21:53
6月30日消息,美国《时代》(TIME)周刊近日公布了"2025年全球百大影响力企业"名单,台积电、华 为、阿里巴巴、比亚迪、字节跳动、DeepSeek、宇树机器人(Unitree Robotics)等中国科技企业成功入 选(还有蜜雪冰城、泡泡玛特等非科技类企业),台积电则是唯一上榜的晶圆代工企业。此外,亚马 逊、Meta、Arm、ASML、OpenAI等海外科技巨头也成功入选。 不过,令人意外的是,人工智能(AI)芯片巨头英伟达(NVIDIA)、韩国半导体巨头三星电子并未上 榜,这也也引发了业界热议。英伟达近年因AI芯片需求激增,高居全球市值第一,但它并未入选该榜 单,可能是因《时代杂志》评选标准更注重多元影响力,而非单纯财务表现。 三星则面临特朗普政府 美国优先政策压力,对美国投资与在晶圆代工市场竞争中所面临的挑战或影响其评选表现。 据了解,"2025年全球百大影响力企业"名单涵盖了105家企业,分为创新者(Innovators)、颠覆者 (Disruptors)、领导者(Leaders)、巨擘(Titans)及先锋(Pioneers)五大类,而台积电和华为被归 类为"巨擘",与伯克希尔·哈撒韦公司(Be ...
阿里自曝被DeepSeek逼急了,春节加班搞研发;曝中金系高管加盟蔚来,或将负责融资找钱;Temu美区全托管7月底将全面恢复运营
雷峰网· 2025-06-13 08:43
要闻提示 NEWS REMIND 1.曝"中金系"高管安国邦加盟蔚来出任副总裁,或将负责融资找钱 2.阿里自曝:被DeepSeek逼急了,工程师春节睡办公室搞研发 3.哪吒汽车通知员工居家办公!声明称正式进入重整程序 4.多位奔驰车主爆料:一觉醒来车机崩了,导航、音乐全不能用 5.曝某厂SM8850新机采用"横向大矩阵全尺寸副屏DECO",预计为小米旗下 6.广汽首款量产飞行汽车预售价不超168万,小鹏、吉利等车企加速布局低空经济 7.Temu美区全托管将在7月底全面恢复运营 8.英伟达、三星联手投资AI机器人公司Skild AI,估值达45亿美元 今日头条 HEADLINE NEWS 曝"中金系"高管安国邦加盟蔚来出任副总裁,或将负责融资找钱 据媒体报道,6月11日,蔚来董事长、CEO李斌向公司内部发布欢迎信,宣布Bagrin Angelov(安国邦) 将担任蔚来资本市场副总裁,向首席财务官曲玉汇报。这是蔚来迎来的又一位"中金系"高管。李斌在欢迎 信中对其给予高度评价,称其在资本市场交易、企业发展战略和企业增长方面拥有超20年全球经验,曾在 中东和欧洲担任管理职务,在跨境交易、企业合资、融资和合作方面业绩出 ...
阿里自曝被DeepSeek逼急了,春节加班搞研发;曝中金系高管加盟蔚来,或将负责融资找钱;Temu美区全托管7月底将全面恢复运营
雷峰网· 2025-06-13 08:40
要闻提示 NEWS REMIND 1.曝"中金系"高管安国邦加盟蔚来出任副总裁,或将负责融资找钱 2.阿里自曝:被DeepSeek逼急了,工程师春节睡办公室搞研发 3.哪吒汽车通知员工居家办公!声明称正式进入重整程序 4.多位奔驰车主爆料:一觉醒来车机崩了,导航、音乐全不能用 5.曝某厂SM8850新机采用"横向大矩阵全尺寸副屏DECO",预计为小米旗下 6.广汽首款量产飞行汽车预售价不超168万,小鹏、吉利等车企加速布局低空经济 7.Temu美区全托管将在7月底全面恢复运营 8.英伟达、三星联手投资AI机器人公司Skild AI,估值达45亿美元 今日头条 HEADLINE NEWS 曝"中金系"高管安国邦加盟蔚来出任副总裁,或将负责融资找钱 据媒体报道,6月11日,蔚来董事长、CEO李斌向公司内部发布欢迎信,宣布Bagrin Angelov(安国邦) 将担任蔚来资本市场副总裁,向首席财务官曲玉汇报。这是蔚来迎来的又一位"中金系"高管。李斌在欢迎 信中对其给予高度评价,称其在资本市场交易、企业发展战略和企业增长方面拥有超20年全球经验,曾在 中东和欧洲担任管理职务,在跨境交易、企业合资、融资和合作方面业绩出 ...
蔡崇信:DeepSeek取得突破后,阿里巴巴工程师春节无休全力追赶AI浪潮
华尔街见闻· 2025-06-12 18:42
媒体报道,DeepSeek今年1月推出的低成本、功能强大的人工智能模型震惊了全球科技行业后,阿里 巴巴集团的工程师们取消了假期,在春节假期期间继续工作,奋起直追,连夜加班赶进度。 阿里巴巴董事会主席蔡崇信(Joe Tsai)周三在巴黎举行的VivaTech科技大会上表示,中国充满活力的 消费互联网环境,加上本地工程师之间激烈的竞争文化,正不断推动中国在AI领域的创新。 他透露,阿里巴巴是在DeepSeek发布R1模型之后,才意识到自己在AI领域已经落后了。他举例说明了 中国科技行业竞争的激烈程度: "我们看了那篇论文,心想:'天啊,怎么我们落后了?我们之前也在做这些事情啊,'结果就是,我们 的工程主管决定说:'取消春节假期,所有人都留在公司,加班睡办公室,我们要加速开发进度。'几周 之内,我们就推出了自己的版本,也就是Qwen系列模型。它非常具有竞争力"。 作为与马云共同创办阿里巴巴的创始成员之一,尽管蔡崇信近来开始更加坦率地谈论公司所经历的困 难,但同时也表达了对未来发展的乐观态度。上个月在澳门举办的一场科技大会上,他曾提到阿里巴巴 经历了一系列挫折,但也强调公司"正走在一条非常好的路上"。 ⭐星标华尔街见 ...
蔡崇信:DeepSeek取得突破后,阿里巴巴工程师春节无休全力追赶AI浪潮
硬AI· 2025-06-12 15:04
阿里巴巴AI战略与竞争态势 - 公司在DeepSeek发布R1模型后意识到AI领域落后,工程团队取消春节假期加速开发,几周内推出Qwen系列模型[1][2][3] - Qwen系列模型成为全球最受欢迎的开源大型语言模型之一,公司全面转向聚焦通用人工智能(AGI)[3] - 未来三年将投入超过3800亿元人民币(约530亿美元)建设AI基础设施,包括数据中心[3] 开源策略与云计算协同 - 选择开源Qwen系列模型以推动AI应用普及,带动训练和推理需求增长,从而促进云计算业务发展[3][4] - 开源策略已与苹果公司建立合作,为iPhone提供AI技术支持[4] 公司经营现状与挑战 - 2024年第一季度销售额仅同比增长7%,AI领域大规模投资的回报仍不确定[4] - 2023年公司经历"巨大考验时期",存在扩张过快、方向迷失等问题[4] - 尽管面临挑战,管理层对未来发展保持乐观态度,认为公司"正走在一条非常好的路上"[4] 中国AI行业竞争特点 - 中国消费互联网环境充满活力,工程师群体存在激烈竞争文化,持续推动AI领域创新[2][3] - 行业竞争表现为快速响应机制,如阿里巴巴在竞品发布后迅速调整资源推出对标产品[1][2][3]
多模态推理新基准!最强Gemini 2.5 Pro仅得60分,复旦港中文上海AILab等出品
量子位· 2025-06-06 21:45
MME团队 投稿 量子位 | 公众号 QbitAI 逻辑推理是人类智能的核心能力,也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现,研 究人员开始探索如何将推理能力引入多模态大模型(MLLMs)。 然而,现有的benchmark大多缺乏对逻辑推理类型的明确分类,以及对逻辑推理的理解不够清晰,常将感知能力或知识广度与推理能力混 淆。 在此背景下,复旦大学及香港中文大学MMLab联合上海人工智能实验室等多家单位,提出了MME-Reasoning,旨在全面的评估多模态大模 型的推理能力。 结果显示,最优模型得分仅60%左右。 MME-Reasoning:全面评估多模态推理能力 根据Charles Sanders Peirce的分类标准,推理分为三类:演绎推理 (Deductive)、归纳推理 (Inductive) 以及溯因推理 (Abductive)。 MME-Reasoning以此分类作为标准来全面的测评多模态大模型的推理能力。 演绎推理 (Deductive reasoning) 使用规则和前提来推导出结论。 归纳推理 (Inductive reas ...
超越GPT-4o!华人团队新框架让Qwen跨领域推理提升10%,刷新12项基准测试
量子位· 2025-06-04 08:17
General-Reasoner团队 投稿 量子位 | 公众号 QbitAI 一项新的强化学习方法,直接让Qwen性能大增,GPT-4o被赶超! 来自加拿大滑铁卢大学与TikTok新加坡,M-A-P的华人团队提出了一种全新训练框架: General- Reasoner 。 结果直接让Qwen系列大模型的跨领域推理准确率提升近10%,在多个基准测试中甚至超越GPT-4o。 上图显示出General-Reasoner在多项跨领域评测中显著提升基础模型推理能力。 当前,强化学习(RL)被视为提升模型推理能力的关键手段。其中,Zero-RL方法通过直接训练基础 模型,已在数学和编程等结构化任务上展现出强大效果。 问题是,这些方法往往局限于数据丰富、答案结构清晰的领域,在面对物理、金融或人文社科等更广 泛的领域时,模型难以有效泛化。 接下来看看研究团队是如何解决这些推理难题的? 相较现有方法的关键革新 目前的Zero-RL框架如SimpleRL通常聚焦于单一领域数据,采用简单的规则式答案验证,存在以下不 足: 数据单一 多为数学竞赛或代码任务,泛化能力有限; 验证方式僵化 仅能识别明确结构化答案,无法灵活处理多样化的答 ...
最新必读,互联网女皇340页AI报告解读:AI岗位暴涨,这些职业面临最大危机
36氪· 2025-06-03 21:32
AI行业趋势 - ChatGPT仅用2个月达到1亿用户,17个月后月活增至8亿,订阅用户超2000万,年营收近40亿美元,成为商业化速度最快的AI产品[5][6] - 2024年AI相关资本支出达2120亿美元,同比增长63%,为十年内最高[6][11] - AI模型训练成本8年内暴涨2400倍,单个模型训练成本可能在2025年达10亿美元,未来或突破100亿美元[6][20] - 开源模型如DeepSeek、Qwen等在推理和编程能力上已逼近顶级闭源模型[36][37] 基础设施投资 - 苹果、英伟达、微软、Google、亚马逊、Meta等科技巨头2024年AI相关资本支出达2120亿美元[11] - 英伟达占据数据中心投资预算的25%,成为AI浪潮最大受益者[12] - 英伟达GPU推理单个Token能耗10年间下降约105000倍,有利于规模化部署[27] 技术发展 - AI在图灵测试中表现超越人类,GPT-4.5被73%测试者误认为人类[43][46] - Midjourney图像生成质量从v1到v7显著提升,达到商品级水平[50] - ElevenLabs语音克隆技术月访问量从0飙升至2000万,音色克隆+实时翻译趋近商用级别[57] 应用场景 - Waymo自动驾驶出租车在旧金山市场份额已达1/3[59] - AI相关岗位2018-2025年增长448%,传统IT岗位需求下降9%[67][69] - AI Agent成为新型数字劳动力,能执行多步骤任务如在线购物、界面导航等[72][74] 区域发展 - 美国发布超100个训练计算量超10²³ FLOPs的大语言模型,中国紧随其后不断缩小差距[40] - ChatGPT北美之外用户普及率超90%,呈现全球同步爆发特征[9]
2025Q1人工智能现状分析:中国
搜狐财经· 2025-05-25 11:21
中国人工智能实验室发展 - 中国人工智能实验室在数量和质量上均有显著提升 正逐步缩小与美国实验室的差距 [1] - DeepSeek的R1模型和阿里巴巴的Qwen系列已接近OpenAI的o1级智能水平 性能表现突出 [1] - 多家中国实验室推出高性能推理模型 该类模型在回答前进行"思考" 提升了文本理解和生成能力 [9] 大型科技公司动态 - 阿里云、腾讯、百度等公司利用资金和技术优势 快速推出前沿模型如Qwen 2.5和豆宝1.5 Pro [2] - 阿里巴巴的Qwen系列和DeepSeek的R1模型开放权重 促进技术共享和生态发展 [1] 行业挑战与应对 - 美国对NVIDIA H100/A100等高端GPU的出口管制对中国AI硬件供应造成压力 [2] - 中国公司积极开发国产芯片或使用合规硬件作为替代方案 [2] 初创企业表现 - MiniMax、智浦等初创公司在医疗、自动驾驶等垂直领域推出创新模型 获得市场认可 [2] 技术竞争格局 - 2024年末中国顶尖实验室密集发布高性能模型 智能水平差距从85缩小至80(基于Artificial Analysis基准测试) [9] - 美国实验室中Google Gemini 2.0和Meta模型正快速逼近OpenAI的GPT-4 Turbo [9] - OpenAI的o3模型在2024年引领GPT-4之外的智能飞跃 推理模型和数据质量成为性能提升关键杠杆 [9] 市场趋势 - 中国AI领域投入持续增加 大型企业和初创公司共同推动技术进步 [3] - 行业预计未来几年中国将在部分AI细分领域实现超越 带来新的商业机会 [3]
首个AI翻译实战榜单出炉!GPT-4o稳坐天花板,文化方面Qwen系列一马当先丨开源
量子位· 2025-05-23 08:24
这是首次针对行业的细分领域构建评测数据和评测方法。这些指标均来自真实场景的使用反馈,由此来测评大模型是否符合大规模应用的标 准。 目前, TransBench评测方法与数据集已全面开源 ,也已发布了首期测评结果。 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI AI替咱打工搞翻译,到底谁家最好用? 终于,有人来统一翻译江湖的标准了: 首个应用型AI翻译测评榜单TransBench在OpenCompass上线 。 它由阿里国际AI Business团队联合上海人工智能实验室、北京语言大学共同发布。 与传统的翻译测评体系相比,TransBench 增加了幻觉率、文化禁忌词、敬语规范等指标 ,专门针对大模型翻译最容易出错的关键问题进行 实战考核。 比如: 欢迎各个AI翻译机构去打榜,一较高下~ GPT-4o稳坐"翻译AI天花板" 官网表示,TransBench数据集中涵盖中、英、法、日、韩、西班牙等多种语言。 此外,还在不断持续更新海量小语种。 TransBench评测体系中的数据集,根据"通用标准""电商文化""文化特性"三个大类,整理了不同的数据集。 目前,TransBench多语言翻译评测榜单首期已经出 ...