Workflow
通义千问(Qwen)
icon
搜索文档
网易:已接入通义千问,游戏开发提效50%
证券时报网· 2025-09-24 14:48
公司技术合作 - 网易接入通义千问(Qwen)打造游戏自动测试系统 [1] - 该系统帮助游戏研发提效50% [1] 行业活动 - 相关消息在2025云栖大会上披露 [1]
等不来DeepSeek-R2的246天:梁文锋的“三重困境”与“三重挑战”
36氪· 2025-09-23 18:13
核心观点 - DeepSeek-V3.1-Terminus版本发布 主要针对用户反馈问题改进 提升模型稳定性与一致性 [1] - 市场对DeepSeek-R2模型发布预期持续落空 自R1发布后246天内出现至少10次发布传言 反映公司面临技术、战略与市场竞争的多重压力 [2][5][6] - 公司通过开源策略推动技术普惠 开源包括通用模型V3.0324、多模态文生图模型Janus-Pro及底层工具链 但核心产品R2延迟暴露生态短板 [8][9][15] 技术更新与产品迭代 - DeepSeek-V3.1-Terminus版本更新 非例行迭代 重点改进用户反馈问题 提升稳定性与一致性 [1] - 开源通用模型DeepSeek-V3.0324 API成本为GPT-4的1/14 大幅降低使用成本 [8] - 开源多模态文生图模型Janus-Pro 但未在行业掀起波浪 [13][14] - 开源工具链包括FlashMLA解码内核、DeepGEMM矩阵运算库 推理速度提升约30% 并支持华为昇腾平台 [9] 市场预期与竞争环境 - 市场对DeepSeek-R2预期高涨 自2025年2月起多次传言发布 包括5月初、3月17日等 但均未实现 [5][6] - 竞争对手阿里巴巴通义千问、百度文心大模型已完成多轮功能迭代和模型升级 [6] - 公司估值因R1成功水涨船高 但R2延迟发布消耗用户耐心 导致市场预期管理失焦 [5][6][11] 技术挑战与算力限制 - R2延迟因技术突破难度大 需实现碾压级优势 但内部测试未达颠覆性提升 [6][11] - 算力供应问题突出 尝试迁移至华为昇腾芯片遇性能瓶颈和不稳定 被迫切回NVIDIA平台 [11] - 模型面临"幻觉"问题 在创意和事实性内容上表现不佳 影响用户信任 [15] 战略布局与生态构建 - 公司构建全栈开源技术体系 覆盖底层模型到上层工具链 推动国产AI算力落地 [8][9] - 缺乏内容生态优势 依赖外部数据集 无法像百度、字节跳动那样通过自有平台产生实时数据 [15] - 多模态能力缺位 技术路线单一 主要集中在文本和代码领域 限制商业化想象空间 [13][14] 行业影响与公司定位 - DeepSeek-R1开源策略降低AI技术应用成本 打破海外厂商垄断 推动行业创新 [17] - 公司面临创新者窘境 需在技术极致与市场时机间权衡 R2发布决策复杂化 [16] - 当前困境反映国内AI公司普遍挑战 包括技术瓶颈、战略短板和激烈竞争 [17]
中国科技股继续"狂飙"?AI加速驱动下,恒科今年大幅跑赢纳斯达克
美股IPO· 2025-09-21 20:52
指数表现对比 - 恒生科技指数今年大涨41% 远超纳斯达克指数17%的涨幅[1][4] - 中国科技股表现显著优于美国同行[3] AI技术突破驱动因素 - DeepSeek人工智能年初突破成为关键转折点 9月份涨势进一步加速[1][6] - 阿里巴巴"通义千问"、腾讯"元宝"和百度"文心一言X1.1"获分析师好评 行业基准测试名列前茅[7] - 百度自研高端芯片取得进展 AI基础设施支出增加支撑涨势[7] 个股表现 - 阿里巴巴股价上涨96% 腾讯上涨55% 百度上涨59%[8] - 仅过去一个月阿里巴巴上涨31% 百度上涨48%[8] 行业扩散效应 - CSI人工智能指数回报率超过61% 恒生生物科技指数上涨98%[8] - 乐观情绪延伸至寒武纪等芯片制造商及生物科技公司[8] 资金流向变化 - 最初由中国内地投资者推动 全球投资者因技术进步和估值优势开始重新关注[8] - 外国投资者正在重建对中国敞口[8]
中国科技股“狂飙“:AI加速驱动下,恒科今年大幅跑赢纳斯达克
智通财经网· 2025-09-21 16:45
市场表现 - 恒生科技指数年内飙升41%,远超纳斯达克指数17%的涨幅 [1] - 阿里巴巴、腾讯、百度股价分别上涨96%、55%和59% [4] - 过去一个月阿里巴巴和百度股价分别上涨31%和48% [4] 行业驱动因素 - DeepSeek人工智能突破成为关键转折点,推动涨势自年初启动并在9月加速 [3] - 阿里巴巴"通义千问"、腾讯"元宝"、百度"文心一言X1.1"等大模型获分析师好评且行业基准测试领先 [3] - AI算力瓶颈突破引发市场对技术商业化及生产力提升的乐观预期 [3] - 百度等公司在自研高端芯片取得进展,AI基础设施支出增加支撑涨势 [3] 资金流向 - 内地投资者初期主导买入,全球投资者因技术进步和估值优势逐步回流 [4] - CSI人工智能指数回报率超61%,恒生生物科技指数上涨98% [4] - 外资重新建立对中国科技股的风险敞口 [4] 行业影响 - 乐观情绪从互联网巨头延伸至寒武纪等芯片制造商及生物科技公司 [4] - AI技术被认定为第四次工业革命,正改变人机交互及社会运作模式 [4]
海内外算力需求持续火热,我国大模型及芯片进展不断,持续看好算力产业链投资机会
长城证券· 2025-09-15 15:32
行业投资评级 - 通信行业评级为“强于大市”(维持评级)[3] 核心观点 - 海内外算力需求持续火热,我国大模型及芯片进展不断,持续看好算力产业链投资机会[1] - 甲骨文云端基础设施业务表现强劲,当季收入达33亿美元,同比增长55%,未确认履约义务同比激增359%至4550亿美元,未来四年收入目标分别为320亿、730亿、1140亿和1440亿美元,实现八倍增长[2][16][23] - 阿里巴巴未来三年将投入超过530亿美元用于推进云计算和AI基础设施建设,2023年中国智算中心市场投资规模达879亿元,同比增长90%以上,预计2028年达到2886亿元[4][17][37] - 阿里发布下一代基础模型架构Qwen3-Next,并开源基于该架构的Qwen3-Next-80B-A3B系列模型,训练成本仅为Qwen3-32B的十分之一不到,国产AI芯片在推理场景下能效比提升40%[6][19][41] - DeepSeek-V3.1正式发布,使用UE8M0 FP8参数精度,国产芯片在推理场景下能效比提升40%,单位算力成本较H100降低35%,推理延迟缩短至8ms以内[7][20][51] 行业走势 - 本周通信(申万)指数上涨3.00%,沪深300指数上涨1.38%,行业跑输大盘1.62个百分点[8][12] - 通信板块最新估值(市盈率)为24.35,位于TMT各行业第四位[14][15] 重点推荐公司 - 覆盖公司包括沪电股份、美格智能、中际旭创、天孚通信、鸿日达、中国移动、工业富联、中国电信、新亚电子、鼎通科技等,投资评级均为“买入”[1] - 重点推荐组合包括运营商/国资云、主设备商&服务器、光模块、IDC、云计算&大数据、工业互联网、卫星互联网、物联网/车联网、域控制器、操作系统/软件、PCB/载板、掩膜版、AI、数据服务、数据安全、基础软件、智能终端、量子通信等细分领域公司[21][22] 行业动态 - 全球光传输市场在2025年第二季度同比增长9%,达到38亿美元,云服务和数据中心运营商引领复苏[57] - 全球企业级WLAN市场收入同比增长16%,连续第二个季度实现两位数增长[57] - 我国已建成全球规模最大5G网络,5G基站459.8万个,千兆端口数达3053.2万个,算力设施达1085万标准机架,智能算力规模达788EFLOPS[57] - 2025年上半年中国AI云市场规模达223亿元,阿里云占比35.8%,位列第一[57] - 吉利星座第五个轨道面成功发射,以一箭11星方式进入预定轨道[57] - 苹果发布全新iPhone Air,取消实体卡槽,全面转向eSIM,搭载A19 Pro芯片和自研C1X 5G基带芯片[59] - 亚马逊计划2026年末至2027年初推出消费级AR眼镜“Jayhawk”,并面向送货司机推出专用AR眼镜“Amelia”[59]
赛道Hyper | 通义千问万亿模型的战略突围解析
华尔街见闻· 2025-09-06 09:40
模型发布与技术特性 - 阿里巴巴旗下通义千问发布Qwen3-Max-Preview模型 参数量超过1万亿 定位为Qwen3系列中最大且面向指令任务的模型 [1][2] - 模型核心优化目标为指令遵循与工具调用 并减少知识幻觉现象 提升输出可信度和企业级应用可靠性 [1][3] - 模型通过混合密集与MoE架构实现可控思考预算机制 支持模式切换和多模态兼容 使万亿参数规模下能灵活适应实际任务 [3][4] 产品化与商业化路径 - 模型通过Qwen Chat与阿里云平台开放试用及API调用 强调可用性与生态接入 推动模型即服务化 [1][2][4] - 商业价值聚焦平台长期黏性与增值服务 包括检索 定制化fine-tune 工具链托管和合规治理 而非单笔模型销售 [6] - 阿里依托电商 金融 企业服务等场景落地 通过低成本工程化支撑将技术优势转化为生态优势 [6][7] 行业竞争与战略定位 - 国内外厂商如Moonshot DeepSeek Anthropic均推出超大规模或AI Agent模型 但在架构 激活参数及生态策略上存在差异 [4][7] - 阿里采取开源策略积累社区生态 与完全闭源竞品形成差异化 直接影响二次创新速度与开发者接入 [5][7] - 行业竞争从单一模型转向整体系统 需平衡合规 工程化 生态与成本 最终优胜者取决于企业场景稳定性与成本效益验证 [7][8]
阿里加码AI投资三倍,云业务能否接棒电商?
日经中文网· 2025-09-02 16:00
公司战略与投资 - 阿里巴巴2025年4~6月资本支出达386亿元 为去年同期32倍 [2][6] - 公司宣布3年内向AI和云业务投入3800亿元 [6] - 计划在电商领域投资500亿元以应对竞争 [9] 财务表现 - 2025年4~6月销售额2476亿元 同比增长2% [4] - 同期净利润431亿元 同比增长78% [4] - 云业务销售额333亿元 同比增长26% [4] - 云业务调整后EBITA达29亿元 同比增长26% [4] 云与AI业务发展 - 生成式AI基础模型"通义千问"系列下载量超4亿次 [6] - 开发自有AI芯片以应对美国出口管制 [7] - 在泰国等亚洲国家增设数据中心 墨西哥新建基础设施 [6] - 云业务已成为公司第二大增长支柱 [2] 市场竞争态势 - 阿里巴巴云业务资本支出为腾讯2倍(腾讯同期191亿元) [2][6] - 公司为中国云计算市场最大企业 计划持续扩大市场份额 [6] - 电商业务面临京东竞争 后者进入餐饮外卖和秒送领域 [9] 行业环境与政策 - 中国政府推动"AI+"在各领域落地 [7] - 经济放缓背景下政府重视民营企业增长动能 [7] - 公司股价较2024年底上涨60%以上 [9] 挑战与展望 - 公司总市值仅为峰值时期40% 相当于腾讯一半 [2][9] - 需平衡AI/云业务增长与电商盈利能力改善 [9] - 双线作战:新兴业务扩张与核心业务防守 [9]
DeepSeek悄然发布开源版GPT-5竞品,定价更低
财富FORTUNE· 2025-08-26 21:04
深度求索新模型V3.1的技术突破与市场策略 - 新模型V3.1在部分基准测试中表现与GPT-5相媲美 且定价低于OpenAI的GPT-5 [2] - 模型参数规模达6850亿 采用混合专家架构 仅需激活部分参数以降低开发者计算成本 [6] - 首次在单一系统中同时实现快速应答与逐步推理功能 此前需分开处理 [6] 中国AI战略与国产化进程 - 深度求索是中国推进先进AI系统研发、部署与管控战略的关键一环 新模型专门针对国产芯片优化以实现卓越性能 [2] - 公司展现出应对美国出口管制的韧性 并减少对英伟达芯片的依赖 [5] - 中国AI生态包括阿里巴巴通义千问、月之暗面Kimi、百度文心一言等多模型体系 [3] 国际竞争与行业影响 - OpenAI首席执行官承认中国开源模型的竞争影响其开源决策 担忧全球技术生态可能主要依托中国开源模型构建 [4] - 深度求索模型已在中国广泛应用 并逐渐在全球普及 部分美国企业已基于其R1推理模型开发应用程序 [2] - 美国批准英伟达和AMD向中国出口专用AI芯片(包括H20芯片)但要求将销售收入的15%上缴美国政府 [4] 技术演进与行业评价 - 新模型虽未达R1模型的突破性水平 但持续实现实质性改进 被评价为"令人印象深刻" [7] - 成为少数具备同时实现快速应答与推理能力的开源权重模型之一 技术亮点被分析师称为"最大亮点" [6] - 开发者认为深度求索模型在生产应用部署上较OpenAI版本更复杂 后者部署相对便捷 [7]
OpenAI推出开源模型gpt-oss抗衡中企
日经中文网· 2025-08-07 16:00
OpenAI发布开源模型gpt-oss - OpenAI于8月5日宣布提供名为gpt-oss的开源AI模型 允许开发者免费使用和修改 这是自2019年11月GPT-2以来时隔5年9个月再次开源大规模语言模型 [2] - 公司准备了两种规模不同的模型 相比ChatGPT所用模型 新模型能以更少计算资源高效运行 小型模型甚至适用于笔记本电脑和智能手机 [4] - CEO山姆·奥特曼宣称这是"世界最优秀且最好用的开源模型" 新模型在数学和编程等需要逻辑思维的领域表现优异 [4] 开源战略背景 - OpenAI创立初期采用开源模式 但随着行业竞争加剧逐渐减少信息公开 [5] - 中国企业的崛起成为重要转折点 特别是DeepSeek在1月开源逻辑思维模型R1 被认为能以低成本实现高性能 [5] - 中国企业如阿里巴巴通义千问和Moonshot AI等新兴公司相继发布开源模型 在开源领域形成强劲势头 [5] 行业竞争态势 - OpenAI此次开源被视为抗衡中国AI企业如DeepSeek的策略 [2] - 开源模型领域正成为中美科技企业竞争的新战场 中国企业近期表现活跃 [5]
DeepSeek终于把OpenAI逼急了
OpenAI发布开源模型GPT-OSS - OpenAI突然发布首个开源语言模型GPT-OSS,包括gpt-oss-120b和gpt-oss-20b两个版本 [5][6][9] - gpt-oss-120b采用MoE架构,拥有1170亿参数,激活参数约51亿,可在单张80GB GPU上运行,性能接近闭源o4-mini [10] - gpt-oss-20b基于MoE架构,有210亿参数,激活参数约36亿,可在16GB内存设备上流畅运行,性能接近o3-mini [11] - 模型训练数据涵盖多语种多领域,且可免费用于商业用途 [14] OpenAI战略转向 - 此前OpenAI一直坚持"闭源+收费"路线,GPT-4和GPT-4o核心模型均未开放 [12] - GPT-OSS的发布标志着公司从闭源独占转向开放协作的模型生态 [16] - 这一战略调整被认为是深思熟虑的结果,而非一时冲动 [16] 中国开源模型的快速发展 - 中国开源模型发展迅猛,DeepSeek凭借R1模型引发行业关注,其V2模型通过结构创新大幅降低成本 [18] - 阿里通义千问(Qwen)近三个月密集迭代,发布6波更新,新增55个以上模型版本 [20] - 中国开源生态蓬勃发展,涌现出Kimi K2、智谱GLM-4.5、腾讯混元HunyuanWorld-1等有影响力的开源模型 [20] - 中国开源模型在编程、数学、多语言等领域正逼近甚至超越OpenAI闭源模型 [20] 行业竞争格局变化 - 中国开源模型的爆发式发展触动了OpenAI和硅谷的神经 [22] - Meta正酝酿策略转向,可能放弃开源策略转而开发闭源模型 [22] - OpenAI与Meta的竞争加剧,OpenAI采取员工信息保护等措施应对 [22]