Workflow
通义千问(Qwen)
icon
搜索文档
OpenAI推出开源模型gpt-oss抗衡中企
日经中文网· 2025-08-07 16:00
OpenAI发布开源模型gpt-oss - OpenAI于8月5日宣布提供名为gpt-oss的开源AI模型 允许开发者免费使用和修改 这是自2019年11月GPT-2以来时隔5年9个月再次开源大规模语言模型 [2] - 公司准备了两种规模不同的模型 相比ChatGPT所用模型 新模型能以更少计算资源高效运行 小型模型甚至适用于笔记本电脑和智能手机 [4] - CEO山姆·奥特曼宣称这是"世界最优秀且最好用的开源模型" 新模型在数学和编程等需要逻辑思维的领域表现优异 [4] 开源战略背景 - OpenAI创立初期采用开源模式 但随着行业竞争加剧逐渐减少信息公开 [5] - 中国企业的崛起成为重要转折点 特别是DeepSeek在1月开源逻辑思维模型R1 被认为能以低成本实现高性能 [5] - 中国企业如阿里巴巴通义千问和Moonshot AI等新兴公司相继发布开源模型 在开源领域形成强劲势头 [5] 行业竞争态势 - OpenAI此次开源被视为抗衡中国AI企业如DeepSeek的策略 [2] - 开源模型领域正成为中美科技企业竞争的新战场 中国企业近期表现活跃 [5]
DeepSeek终于把OpenAI逼急了
OpenAI发布开源模型GPT-OSS - OpenAI突然发布首个开源语言模型GPT-OSS,包括gpt-oss-120b和gpt-oss-20b两个版本 [5][6][9] - gpt-oss-120b采用MoE架构,拥有1170亿参数,激活参数约51亿,可在单张80GB GPU上运行,性能接近闭源o4-mini [10] - gpt-oss-20b基于MoE架构,有210亿参数,激活参数约36亿,可在16GB内存设备上流畅运行,性能接近o3-mini [11] - 模型训练数据涵盖多语种多领域,且可免费用于商业用途 [14] OpenAI战略转向 - 此前OpenAI一直坚持"闭源+收费"路线,GPT-4和GPT-4o核心模型均未开放 [12] - GPT-OSS的发布标志着公司从闭源独占转向开放协作的模型生态 [16] - 这一战略调整被认为是深思熟虑的结果,而非一时冲动 [16] 中国开源模型的快速发展 - 中国开源模型发展迅猛,DeepSeek凭借R1模型引发行业关注,其V2模型通过结构创新大幅降低成本 [18] - 阿里通义千问(Qwen)近三个月密集迭代,发布6波更新,新增55个以上模型版本 [20] - 中国开源生态蓬勃发展,涌现出Kimi K2、智谱GLM-4.5、腾讯混元HunyuanWorld-1等有影响力的开源模型 [20] - 中国开源模型在编程、数学、多语言等领域正逼近甚至超越OpenAI闭源模型 [20] 行业竞争格局变化 - 中国开源模型的爆发式发展触动了OpenAI和硅谷的神经 [22] - Meta正酝酿策略转向,可能放弃开源策略转而开发闭源模型 [22] - OpenAI与Meta的竞争加剧,OpenAI采取员工信息保护等措施应对 [22]
英伟达创始人兼CEO黄仁勋答上证报 中国市场令人难以置信且独一无二
上海证券报· 2025-07-18 02:13
英伟达对中国市场的评价 - 中国是英伟达全球最大市场之一 被描述为"神奇且具有活力"的市场 [2] - 阿里巴巴等中国客户拥有雄厚计算机科学实力 能利用英伟达产品创造独特服务 [2] - 中国市场被CEO黄仁勋称为"令人难以置信且独一无二" [2] 人工智能发展趋势 - AI发展呈现加速态势 每3-5年就有重大突破 [2] - AI在问题解决能力方面即将超越人类水平 [2] - 下一阶段将发展物理型人工智能 将生成式AI能力应用于机器人等物理机械 [2] - 算力进步被视为近年最重大技术变革 是AI发展的基础 [2] 中国在AI领域的表现 - 中国在开源工程方面表现突出 DeepSeek-R1、通义千问、Kimi等模型全球领先 [3] - 中国研究人员在arXiv平台论文发表量全球第一 [3] - 开源模式被认为能提高研究质量与安全性 是推动发展的最安全方式 [3] 硅技术发展前景 - 硅技术将持续进步 主要体现在三方面:三维晶体管结构、面板级封装、高密度模块互联 [3] - 未来单个芯片尺寸可能达到桌子大小 [3] 对年轻人的建议 - 建议尽早接触和使用AI 培养与AI有效互动的能力 [4] - 当代年轻人将成为"AI原住民" 需要学会与AI共同成长 [4]
英伟达CEO黄仁勋媒体会实录:中国AI生态充满活力,我们必须持续投资
凤凰网· 2025-07-17 08:20
中国AI生态系统 - 中国在AI领域的进步速度令人难以置信,分为计算基础设施、模型层和应用层三个层面 [2] - 在模型层,DeepSeek、阿里巴巴的通义千问和月之暗面拥有卓越技术,其中DeepSeek是全球首个开源推理模型 [2] - 在应用层,中国速度更快,得益于激烈的市场竞争环境和强大的教育体系,全球约50%的AI研究人员base在中国 [2] 地缘政治应对策略 - 公司必须遵守每个国家的国家安全和贸易政策,提供教育和信息但最终遵守规则 [3] - 关税是必须适应的商业环境一部分,公司供应链必须适应并找到新方法 [4][5] - 为维持市场地位必须持续投资,因为市场竞争激烈所有竞争对手都在大力投资 [5] 产品战略 - H20芯片系统内存带宽出色效率高,针对中国市场创新架构模型适配性好 [6][7] - RTX Pro是为数字工厂、数字孪生和机器人设计的系统,拥有计算机图形和光线追踪能力 [7] - 选择在中国国际供应链促进博览会期间发布RTX Pro是完美时机 [7] 竞争与合作 - 华为拥有深厚卓越传统,在芯片设计、系统工程和网络工程能力出色 [8] - 与小米等中国公司有长期合作历史,中国计算机科学和软件能力是世界级 [8] - 中国企业硬件和云端软件两方面卓越实力非常罕见 [8] AI技术发展 - AI正从"感知"进入"推理"时代,推理让AI能处理新问题 [9] - 后训练时代AI通过持续计算进行思考练习和想象,需要海量算力 [9] - 在不需要颠覆性技术突破情况下可能很快实现定义下的AGI [9] 人形机器人前景 - 全球劳动力短缺、自动化提高GDP、技术成熟是人形机器人三大发展动力 [10] - 中国在发展机器人方面拥有AI技术、机电工程能力和制造业基础三大优势 [11] 公司发展历程 - 公司60多年来首次重塑计算并创造名为AI的全新产业 [12] - 公司价值曾精确为零并长期保持低位,现成为全球市值最高科技公司之一 [11][12]
算力催生数据中心向智算发展,推动PCB向高阶升级迭代,看好相关产业链投资机会
长城证券· 2025-07-09 14:37
报告核心观点 - 算力催生数据中心向智算发展,推动 PCB 向高阶升级迭代,看好相关产业链投资机会 [1] - 持续看好 AIDC 产业链和 PCB 未来产业发展 [2][6] 行业观点 市场表现 - 本周通信(申万)指数下跌 0.10%,沪深 300 指数上涨 1.54%,行业跑输大盘 1.64pct [11] - 通信本周涨幅在 TMT 各子板块中居第三位,通信板块最新估值市盈率为 21.35,位于 TMT 各行业第四位 [12][13] 本周策略观点 OpenAI 向甲骨文租赁数据中心算力,看好未来 AIDC 产业链投资机会 - OpenAI 以每年约 300 亿美元租 4.5GW 计算能力,交易超甲骨文云基础设施业务规模 [15] - 甲骨文将多地开发数据中心,花 400 亿美元买英伟达芯片为 OpenAI 新建数据中心供算力 [22][25] - 阿里云扩张数据中心,阿里未来三年投超 530 亿美元建云计算和 AI 基础设施 [16] - 2023 年中国智算中心市场投资规模 879 亿,同比增 90%以上,预计 2028 年达 2886 亿元 [17] 算力需求催生 PCB 升级,持续看好未来 PCB 产业发展 - AI 服务器算力增强带动电源发展,其电源用 PCB 在多方面升级 [18] - 2023 年全球 AI/HPC 服务器系统 PCB 市场规模近 8 亿美元,预计 2024 年达 19 亿美元,2028 年达 31.7 亿美元 [18] - AI 端侧设备性能提升使 PCB 需同步升级,如 HDI 板阶数、材料升级等 [19] - 2024 年全球可穿戴设备出货量预计 5.6 亿台,同比增 10.5%,预计 2028 年底达 6.5 亿台 [19] 建议关注组合 - 涉及运营商/国资云、主设备商&服务器、光模块等多个领域众多标的 [20][21] 本周专题解析 OpenAI 向甲骨文租赁数据中心算力,看好未来 AIDC 产业链投资机会 - OpenAI 与甲骨文交易及甲骨文数据中心建设情况同策略观点 [22] - 我国阿里云数据中心扩张及阿里投资计划同策略观点 [26] - 智算中心产业链涵盖设计制造、设施建设、服务提供和模型研发应用等环节 [26] - 国家出台多项政策促 IDC 行业发展,数据中心用电量和碳排放增长,建设低碳化进程有望加快 [30][31] 算力需求催生 PCB 升级,持续看好未来 PCB 产业发展 AI 服务器算力增强推动 HDI 等高端板增长 - AI 服务器算力及电源情况和 PCB 升级同策略观点 [38] - PCB 嵌入功率模块技术有性能潜力,AI 服务器相关 HDI 需求增速快 [43][46] AI 端侧设备性能不断提升,PCB 技术持续提升 - 小米推出首款 AI 眼镜,AI 端侧设备性能提升使 PCB 技术需同步提升 [48][54] - 不同应用领域对覆铜板性能有不同需求,未来智能可穿戴设备市场前景广阔 [56][55] 通信行业动态 行业动态新闻 - 百度、华为开源大模型,多家公司有采购、业务进展及产品发布等动态 [59][60][61] 上市公司动态 - 视源股份、四会富仕、三花智控发布股份回购、可转债转股等进展公告 [62]
模型训练最重要的依然是 Scaling —— 对话阿里通义千问 Qwen 多语言负责人杨宝嵩 | Open AGI Forum
AI科技大本营· 2025-06-25 14:49
通义千问多语言战略 - 通义千问(Qwen)从项目启动就将国际化作为核心战略,优先考虑多语言数据优化以服务全球用户[2][9] - 模型支持全球119种语言,在Hugging Face平台下载量位居前列,衍生模型数超过10万个[2][6] - 英语社区用户量最大,中文用户仅排第三或第四,体现其国际化影响力[8][9] 多语言技术突破 - 建立覆盖上千细粒度分类的文化标注体系,解决不同语言文化禁忌与安全合规问题[3][13] - 采用"英语内部推理+目标语言输出"的折中方案应对多语言混杂难题,提升小语种稳定性[16] - 通过数据合成与人工审核结合提升低资源语言数据质量,文化对齐投入占研发重要比重[14][16] 模型能力演进方向 - 提出"知识密度"概念,4B参数小模型性能已超越早期70B大模型,反映数据质量优化成效[19][20] - 持续探索Scaling Law延续路径,重点布局合成数据两大方向:创造新知识与提升数据纯度[21][22] - 针对"数据回流"现象采取混合比例控制,保留人类数据多样性避免模型风格趋同[25] 产品生态布局 - 采取大小模型并行策略,4B级小模型适配终端设备部署需求,已应用于车载、穿戴设备场景[26][28] - 与硬件厂商合作开发Mobile-Agent系统,实现视觉操作手机等基础功能,复杂场景仍需技术突破[30][31] - 规划将语音翻译、文字识别等能力深度集成至操作系统,但涉及安全的核心功能保持审慎[32][34] 行业趋势展望 - 多语言技术面临三大挑战:文化多样性对齐、小语种生成流畅度、多模态融合[39][41][43] - 合成数据与跨模态迁移被视为解决小语种数据匮乏的关键路径,需社区共建高质量数据集[42][45] - AI技术替代催生新职业形态,如AI编程师、Prompt工程师等协同型岗位将成就业增长点[37][38]
阿里的AI转型与进化
硬AI· 2025-05-15 23:04
科技巨头AI战略转型 - 亚马逊CEO强调AWS增长源于AI需求,认为AI将成为未来几十年最大业务之一 [2] - Meta将AI列为核心战略,驱动广告业务精准度和效率提升 [2] - 行业共识形成,AI从"实验性探索"进入"经营杠杆"阶段,顶尖科技公司年投入达"百亿美金"级别 [2] - 阿里巴巴战略重心向AI倾斜,市场认知转变为具有全球竞争力的科技企业 [2] 阿里巴巴科技业务表现 - 2025年Q4集团剔除大润发和银泰外整体收入同比增长10%,云智能业务收入同比增长18% [5] - AI相关产品收入连续7个季度保持三位数增长,科技业务成为新增长引擎 [5] - 未来三年将投入超过3800亿元Capex用于云计算和AI基础设施,超过去十年总和 [5] - 本季度Capex达246亿元,客户对云和AI需求持续增长被视为10-20年历史性机会 [6] - 大摩预计阿里云收入增速将在2026财年加速至25% [6] 技术实力与开源战略 - 通义千问Qwen-3模型参数量仅为DeepSeek-R1三分之一但性能全面领先,登顶全球开源模型排行榜 [9] - 开源战略是追求AGI的核心路径,通过汇聚全球智慧加速技术迭代 [9] - 截至2025年4月底,基于通义开源模型的衍生模型超10万个,全球累计下载量突破3亿次 [10] - 开源生态可催生超越单一组织的创新,加速模型向更通用、更强大的AGI方向进化 [11] AI产业落地进展 - AI应用从模型训练转向推理部署阶段,云计算需求呈指数级增长 [13] - AI产品行业渗透率加速扩大,从互联网、金融延展至养殖业、传统制造业等 [13] - 与宝马、小鹏、蔚来等车企合作,深度参与汽车智能化浪潮 [13] - 与中国移动、中国联通合作构建AI产业新生态,推动AI与5G等技术融合 [14] - 中国工商银行选择阿里云PolarDB数据库,反映顶级企业对技术能力的认可 [15] - 与苹果公司合作进展显示AI在各行业开花落地,被大摩称为中国最佳AI"赋能者" [15]
最狠的是这两句话
信息平权· 2025-05-13 22:37
BIS新规核心内容 - BIS废除拜登AI扩散规则 市场风险偏好改善 AI叙事重新主导市场 [1] - 新规核心思想包括两点:全球范围内使用华为昇腾芯片均违反出口管制 使用美国芯片训练推理中国AI模型将面临警告 [1] 新规潜在影响分析 - 中国本地使用昇腾芯片可能违反美国出口管制 涉及BAT等公司的合规挑战 [1] - 使用美国芯片(如NV)训练推理中国模型将受警告 但跨国监督执行难度大 开源模型套壳可能规避监管 [1] - 海外云服务商托管中国开源模型(如Qwen/deepseek)将面临警告 但缺乏进一步制裁措施实际约束力有限 [1] 行业竞争格局变化 - 新规结构性利好NVDA 消除AI扩散风险并抑制华为全球竞争 NV股价已上涨5%回归交易中枢 [2] - 华为昇腾芯片在全球市场的拓展受到直接限制 中国境内使用也可能面临美国长臂管辖争议 [1] - NVDA H20芯片持续阉割背景下 中国AI公司可能面临芯片供应双重限制(禁用昇腾+限制NV使用) [1] 政策执行可行性 - 对中国境内使用昇腾芯片及NV卡推理中国模型的管制存在过度长臂管辖特征 实际执法难度较大 [1] - 警告机制(黄牌)缺乏配套制裁措施 政策威慑效果存疑 需等待后续细则出台 [1][2]
OpenAI全球扩展计划揭秘:表面推广“民主AI”,暗里为巩固自己地位
36氪· 2025-05-08 15:56
OpenAI的全球扩张计划 - OpenAI宣布"星际之门"项目,计划在美国本土建设数据中心,投资规模达5000亿美元 [2] - 推出"OpenAI国家计划",旨在建设全球性AI基础设施,推广"民主AI"理念 [2] - 计划在海外建设数据中心,推出本地化ChatGPT,设立国家级创业基金 [3] - 目标在10个美国盟国推进至少10个项目,海外项目由"定制化合作伙伴"提供资金 [6] 美国AI战略与地缘政治 - OpenAI计划与美国政府密切合作,推广"民主AI"作为最佳方式 [2] - 特朗普政府推行"不惜一切代价赢得AI竞赛"策略,保护美国经济利益 [3] - 美国政策制定者担忧中国在全球推动数字基础设施建设,如DeepSeek R1和通义千问等开放模型 [3][4] - 白宫支持通过AI技术商业化增强外交影响力与国际联盟 [4] 技术竞争与市场格局 - 中国AI模型采用开放架构,市场扩展势头迅猛,如DeepSeek R1和通义千问 [4] - OpenAI计划今夏发布自有开源AI模型,开放权重参数与DeepSeek等竞争 [5] - 策略类似AWS等云服务扩展方式,通过免费额度实现"平台绑定" [6] - 基础层研究资金不足,"星际之门"或催生研发中心,实现"收购式招聘" [7] 潜在影响与战略意图 - 参与国家可能需配合美国政策换取技术接入,影响数据主权与技术独立性 [7] - OpenAI深层战略可能是推进AGI开发,弥补基础研究技术空白 [7] - 计划将进一步巩固OpenAI全球核心地位 [8] - 特朗普政府计划放宽部分出口管制,回应英伟达等公司反对意见 [6]
阿里“通义千问”成为日本AI开发基础
日经中文网· 2025-05-07 10:45
阿里云通义千问模型在日本市场表现 - 通义千问在日经4月发布的"AI模型评分"榜中位列第6,超过中国DeepSeek模型,在113个模型中表现突出[1][3] - 作为开源模型,通义千问被日本新兴企业广泛采用,包括ABEJA、ELYZA、Lightblue和Axcxept等公司[1][4] - 基于通义千问开发的"ABEJA-Qwen2.5-32B"模型在日本企业中排名最高,总体排名第21位[3] 通义千问技术性能 - "Qwen2.5-Max"模型在逻辑推理和数学方面表现优异,基础语言能力和综合评分位居前列[3] - 开源版本"Qwen2.5-32B"排名第26位,超过谷歌的Gemma-3-27B(第32位)和Meta的Llama-3-70B-Instruct(第57位)[3] - 最新发布的Qwen3模型数据Token数量达36万亿,是Qwen2.5的两倍,支持119种语言和方言[6] 日本市场应用与扩展 - 通义千问因能以较少数据集实现高精度,在日语能力指标上获得高度评价[4] - 阿里云计划在日本提供本地化部署服务,确保数据不转移至海外[5] - 公司目标3年内将在日本使用通义千问的项目增加到1000个以上[6] 全球影响力与行业地位 - 在Hugging Face平台上已有超过10万个通义千问派生模型[5] - 中国开放模型整体性能紧追美国企业如OpenAI,形成持续竞争态势[6] - 深度求索等中国新兴企业的开放模型也在行政、汽车、金融等行业广泛应用[6]