Workflow
开源大模型
icon
搜索文档
Qwen3真香!通义App满血接入,一手实测在此
量子位· 2025-04-30 12:10
开源大模型Qwen3发布 - 开源大模型Qwen3发布后引发全球关注,被称为"开源界新王者"[1][6] - 模型包含8款混合推理模型,参数量从0.6B到235B全面覆盖[11] - 32B模型性能超越OpenAI o1和DeepSeek R1,在编程基准测评中超过Gemini 2.5 Pro[11] - 支持119种语言和方言,加强对MCP支持[11][56] 模型性能表现 - 在代码生成测试中,Qwen3-235B模型用时1分钟生成100多行代码[19] - 逻辑推理测试中,Qwen3正确解答经典过河问题[42][43] - 解答普特南数学竞赛难题用时5分38秒,快于Grok 3的8分钟[50][53] - 多语言能力测试显示可翻译莎士比亚作品,参考优秀译本避免侵权[58][59] 应用场景拓展 - 通义App集成Qwen3后支持多种智能体玩法[10][14] - 可实现旅游规划、购物比价、AI写歌等功能[64][69][71] - 开发者社区反应热烈,Reddit等平台讨论热度高[80][81] - 模型生成速度快,体验丝滑,擅长推理和代码实现[75] 技术发展历程 - Qwen系列5个月内快速迭代,从QwQ到Qwen3实现技术突破[82] - 采用Apache 2.0协议,更加开放和商用友好[83] - 代表中国开源力量的发展速度,与DeepSeek形成行业格局变化[81][82] 实测数据对比 - 代码能力测试中Qwen3-235B得分为95.6,优于Grok 3 Beta Think的96.4[24] - 在AIME'25测试中Qwen3-235B得分为81.5,高于OpenAl-o1的70.2[24] - CodeForces Elo Rating显示Qwen3-235B为2056,接近Gemini2.5-Pro的2001[24] - 32B密集模型在AIME'24测试中得分为81.4,优于OpenAl-o1的74.3[7]
Qwen 3 发布,开源正成为中国大模型公司破局的「最优解」
Founder Park· 2025-04-29 20:33
阿里Qwen 3大模型发布 - Qwen3-235B-A22B评测成绩与DeepSeek R1、Grok-3、Gemini-2.5-Pro相当,支持混合推理和增强Agent能力 [1] - 全系列模型实现全参数(0.6B-235B)和全模态覆盖,成为HuggingFace最受欢迎开源模型,衍生模型数量突破10万超越Llama系列 [16][17][23] - 采用"思考模式/非思考模式"无缝切换技术,优化MCP工具调用成功率,官方明确从"训练模型"转向"训练Agent"的战略方向 [5][6][7] 中国开源模型全球竞争格局 - DeepSeek+Qwen形成开源"双子星"格局,取代Llama+Mistral成为全球主流开源生态 [1][13] - 开源策略突破地缘政治壁垒:模型权重和训练细节全公开,开发者可自托管定制,建立全球开发者社区信任 [10][12][15] - 两种差异化商业模式:DeepSeek通过技术突破提供低价API服务(成本降低80%),Qwen通过开源带动阿里云商业闭环 [19][20][21] MaaS模式创新 - 阿里云构建"模型-云-行业应用"飞轮:Qwen开源降低AI创业门槛,百炼平台提供MCP服务接入 [2][24] - 实际案例显示Claude+Qwen2.5组合成为创业公司主流方案,混合使用闭源与开源模型平衡成本能力 [25][27][30] - 行业专用模型在医疗、金融等高壁垒领域仍具优势,但需结合本地化服务和数据闭环 [14] AI创业者实践洞察 - 模型选择策略:ToB企业倾向Qwen32B微调(单卡可部署),ToC企业采用API组合(Gemini+DeepSeek) [27][45] - 四大核心挑战:长文本处理衰减(播客场景)、多模态情感理解(心理场景)、国产芯片适配(机器人场景)、并发稳定性(服务场景) [36][40][41] - 创业方法论验证:70%成功案例遵循"X+AI"而非"AI+X"模式,留存率取决于真实需求解决而非技术指标 [48][50] 开源模型技术趋势 - 能力差距持续存在但应用门槛降低:2025年开源模型已满足PMF验证需求,微调价值向窄领域迁移 [25][43] - 三大技术方向:混合推理架构(成本控制)、Agent工具调用(实用化)、多模态融合(场景适配) [5][7][23] - 社区驱动创新:Qwen生态含完整工具链(vLLM/SGLang),DeepSeek聚焦前沿技术(MoE/多模态) [32][49]
致远互联入选中国信通院“开源大模型+”软件创新应用典型案例
证券时报网· 2025-04-25 12:12
行业认可与标杆地位 - 公司凭借AI-COP数智化协同运营平台及全价值链产品的技术突破与场景创新,入选中国信通院《"开源大模型+"软件创新应用典型案例(2025年第一期)》,成为该领域示范标杆 [1] - 案例征集聚焦人工智能技术场景化落地,围绕DeepSeek、通义千问等主流开源大模型,从技术突破性、场景创新性、生态协同性三大维度遴选标杆 [3] - 公司以"大模型+垂直领域模型+场景智能体"深度融合的实践成果,成功打造可复制、可推广的行业范式 [3] 技术架构与产品创新 - 公司以AI为核心战略,推出新一代智能体产品家族"CoMi Family",采用"大模型+协同运营领域模型+场景+智能体+知识库"策略 [4] - CoMi整合主流AI大模型(如DeepSeek、通义千问等)和自研协同运营垂直领域模型,从单一流程工具升级为多任务AI Agent [4] - 开放定制能力,伙伴和客户可基于行业经验创建专属Agent,形成应用场景丰富的智能体生态,支持独立运行或嵌入其他系统 [4] 场景应用与商业价值 - CoMi Family已推出十余款垂直场景智能体Agent,包括企业智能问数、协同工作助理、企业知识问答、组织效能专家、合同风险助理等 [5] - 企业智能问数场景下,智能体精准洞察用户意图,提供即时准确的查询与分析结果,加速企业数据决策流程 [5] - 合同风险助理场景中,智能体融合深度学习与自然语言处理技术,深度剖析合同文本,精准定位潜在风险并提供专业建议 [5] - 推出致慧泉一站式企业AI普及服务平台,整合50余个主流大模型,支持私有化部署与信创适配,覆盖金融、制造等行业 [5] - 形成"大模型+场景"应用,包括AI综合门户、智能文档、智能会议、智能数据分析等,覆盖综合执法、智能检测及合规管理等多个场景 [6]
中国AI模型全面爆发,AI大模型技术体系综合开源影响力榜单重磅发布!
AI科技大本营· 2025-04-18 13:53
大模型技术体系概述 - 大模型不仅是单一程序,而是由模型、数据、系统、评测平台等多要素构成的"技术共同体",需依赖大规模高质量数据、先进模型架构、训练策略及底层系统能力[1] - 开源大模型正崛起为AI普惠化的重要力量,但需解决选型难题并理解不同技术体系的优劣势[1] 榜单评估框架 - 评估覆盖模型、数据、系统、评测四大维度,设置53项核心指标,包括模型使用量、模态覆盖度、芯片适配数量、贡献者活跃度等[4] - 数据采集覆盖全球17个主流开源平台的11673个链接,统计周期为2025年1-4月,采用标准化方法确保可比性[6] - 模型指标筛选标准:仅统计月下载量>50的Transformer架构模型,排除参数量<500M的语言模型[7][8] - 系统指标侧重异构训练支持、芯片厂商接入、生命周期管理能力[11] - 评测平台指标要求公开可查且持续更新,排除临时性榜单[11] 分榜单核心发现 百亿参数大语言模型 - DeepSeek表现突出,R1模型以954万次下载量居首,前十名中独占四席[12] - 百亿级模型因性能与成本平衡成为产业焦点,国内机构加速追赶[12] 模型分榜单 - Meta连续四个月蝉联榜首,阿里巴巴稳居第二,DeepSeek凭借V3/R1等新模型跃居第四[16] - 评估维度包括下载量、开源数量、多模态覆盖(语言/视觉/语音等)及社区活跃度[15] 数据分榜单 - Ai2凭借C4数据集登顶,该数据集是多个主流语言模型的训练基础[19][20] - Google在语音数据集表现突出,Hugging Face通过FineWeb保持活跃[23] - 国内BAAI布局CCI语言数据集和Infinity多模态数据集,上海AI Lab聚焦视觉/多模态领域[24] - 多模态数据加速发展,具身感知类交互数据集受关注[25] 系统分榜单 - 智源研究院在通信库和AI编译器领域差异化领先,百度/华为跻身十强[26] - 六家机构覆盖四项关键技术:智源、百度、华为、Google、OpenAI、微软[26] - Meta和Google在算子库和并行训练框架上优势显著[26] 评测平台分榜单 - 上海AI Lab、Hugging Face、智源研究院领跑,Hugging Face评测模型达4576个[29] - BAAI的FlagEval平台评测覆盖能力紧随Hugging Face[29] 综合影响力总榜 - Meta因LLaMA系列模型和PyTorch生态位居第一,Google凭借Gemma 3和TensorFlow/JAX工具链排名第二[35][36] - 四家中国机构进入Top 10:BAAI(第三)、阿里巴巴(第四)、DeepSeek(第九)、上海AI Lab[32][36] - BAAI打造FlagOpen开源体系,目标成为大模型领域的"Linux"[36] - DeepSeek通过MoE架构创新和完整开源策略快速崛起[36] - OpenAI因"有限开源"策略排名第十,早期开放的GPT-2/Whisper仍被广泛应用[36] 行业动态与未来方向 - 多模态技术扩展推动评估体系优化,将引入动态权重调整机制适应具身智能等新趋势[37] - 《人工智能大模型技术体系开源影响力评估方法》白皮书将于2025年5月发布[37] - 评估框架已在GitHub/GitCode开源,鼓励生态共建[38]
传媒行业周观察:阿里云AI势能大会召开 分众传媒收购新潮梯媒行业格局改善 关注传媒内需文娱方向
新浪财经· 2025-04-14 08:34
文章核心观点 - 传媒板块应兼顾锐度和配置,看好中国开源大模型爆发及应用格局重塑,港股恒生科技仍值得配置,关税冲击下传媒互联网板块影响相对中性,给出多领域投资建议 [1][2][3] 市场表现 - 上周传媒(申万)指数整体下跌6.78%,跑输沪深300指数3.91%,位列所有板块第28位 [1] - 上周恒生科技指数下跌7.77% [1] 传媒板块投资逻辑 - 明线为AI应用起势,暗线为哪吒带来的文化自信 [1] - 2023年是闭源通用大模型爆发之年,看好今年成为中国开源大模型爆发及应用格局重塑之年,分三步发展,第一步公有云价值重塑+产业重回增长,第二步有平台有用户有场景但缺大模型能力赋能或此前未下定决心的公司,第三步C端场景不断落地 [1] 关税对传媒互联网板块影响 - 虚拟服务商品不受影响,传媒互联网公司出口大多为数字内容,仅少数为实体货物,数字内容出口免征关税,几乎无eps影响,玩具出口、跨境电商可能存在压力 [2] 各领域投资建议 游戏 - 建议关注华通、恺英、巨人、电魂、完美、吉比特、盛天、富春等 [1] - 关注产品周期驱动的完美世界、ST华通,配置方向关注恺英、泰岳、巨人 [2] - 游戏侧关注恺英网络、巨人网络、神州泰岳、网易、电魂网络、心动、盛天、电魂 [3] - 关注恺英网络、巨人网络、神州泰岳、吉比特、完美世界、电魂网络、富春股份等 [4] 港股互联网 - 关注腾讯、阿里、美团、快手、阅文、腾讯音乐、哔哩哔哩、网易等 [1][5] 能被大模型改造的成熟应用场景 - 关注互联网巨头腾讯控股,电商场景的阿里巴巴、焦点科技、值得买、光云科技、微盟,教育场景的世纪天鸿、南方传媒 [3] 基于AI强互动能力衍生出的娱乐类软件与终端硬件 - 端侧AI玩具关注奥飞娱乐、实丰文化、上海电影 [3] IDC产业链 - 关注浙数文化、顺网科技、ST华通等 [3] IP衍生品 - 关注广博股份、奥飞娱乐、实丰文化、姚记科技、上海电影、中文在线 [3] 出版 - 关注南方、中南、凤凰、长江、中原等 [2] 影视 - 关注万达、上影、光线、横店、芒果、猫眼等 [2] 分众传媒 - 韧性基本盘+大比例分红,顺周期弹性展现,Q3业绩符合预期,以旧换新等政策有望支撑Q4预算,梯媒行业竞争格局稳固,公司有望保持经营韧性、巩固优化市占率并展现弹性 [5] 教育 - 港美股关注新东方、好未来、卓越、思考乐,A股关注学大、昂立,关注高教板块红利属性 [5]
后DeepSeek时代:六小虎向左,BAT向右
投中网· 2025-04-09 10:27
国内大模型竞争格局变化 - DeepSeek开源大模型DeepSeek-R1以性能比肩GPT-4o、成本仅为十分之一的优势改写行业规则,引发技术门槛崩塌与B端客户分流[4][7] - 政企市场快速转向DeepSeek,45%央企已完成部署,传统IT服务商(如联想、中兴)抢占订单,部分订单明确要求支持DeepSeek接口[9] - 开源模型推动国产芯片替代趋势,DeepSeek代码库显示其对英伟达CUDA框架的适配性可能加速这一进程[11] AI六小虎现状与分化 - 智谱10天内融资15亿人民币,但团队规模从高峰期1000余人收缩,多名高管离职(如李惠子、张阔)[5][7] - 百川智能转向垂类医疗领域,联合创始人焦可离职;零一万物放弃超大模型训练,拆分业务寻求融资[11] - 月之暗面调整Kimi投流策略,暂停部分安卓渠道投放;阶跃星辰成为六小虎中唯一未现高管离职的企业[11] 互联网大厂应对策略 - 腾讯全线接入DeepSeek,微信、腾讯文档等产品倒戈;百度云、阿里云等春节加班上线DeepSeek版本[13] - 大厂云服务价格战加剧,DeepSeek-V3训练成本仅4070万人民币(Llama 3的7%),采用阉割版H800芯片[13] - 字节旗下豆包坚持未融合DeepSeek,周活用户1845万仅次于DeepSeek,显示流量优势的差异化竞争[14] 商业化与市场影响 - 智谱2024年商业化收入增长超100%,中标32个ToB/ToG项目(金额1.3亿元),但DeepSeek冲击其私有化部署市场[7][9] - 行业从狂热转向理性,开源成为生存必需,商业化需扎根真实场景而非依赖政府订单或资本泡沫[14]
后DeepSeek时代:六小虎向左,BAT向右
36氪· 2025-03-25 19:23
后DeepSeek时代:六小虎向左,BAT向右 DeepSeek犹如一颗投入平静湖面的巨石,在AI行业掀起了滔天的波澜,甚至可以夸张点说,其直接改写了国内大模型的竞争规则。 DeepSeek给AI大模型行业,免费赠送了一波国民级别的市场教育,却也平等地在先行者们头上,悬起了一把达摩克利斯之剑。 其中,AI"六小虎"之中的智谱就是一个缩影,智谱脱胎于清华大学知识工程研究室,素来有"国家队"之称。然而就在最近开始频频出现融资动作,10天之 内补充弹药达15亿人民币;可与此同时,组织震荡颇有加剧之势,从一线团队到高管大牛皆有波及。冰火两重天的态势,可谓是目前除了DeepSeek之 外,大多数大模型从业者们,真实写照的一个缩影。 2024年底,智谱曾以200亿元的估值,完成一轮30亿元人民币的融资,在这之后,包括杭州城投、上乘资本、华发集团等国资背景的资方快马加鞭地赶到 为其注资。 不过,也有风投人士对「新熵」分析,DeepSeek的横空出世还是对智谱的估值造成了一定负面影响,快速拿钱也可能是为了抢下已经出现上涨瓶颈的相 对高价。 与大开现金粮仓之门形成反差的是,智谱在团队规模和对外投资上呈现出收缩之势。高峰期阶段的 ...
大模型全开源了,那到底咋挣钱啊?
虎嗅APP· 2025-03-18 17:51
文章核心观点 - 开源大模型虽成市场主流,但外界对其盈利存争议,实际上有多种盈利途径,但当前行业谈赚钱尚早,企业当务之急是获关注、有用户和活下去 [5][7][42] 开源大模型盈利争议 - 闭源大模型会员费难维持自身,开源大模型技术免费取用,外界质疑其盈利 [5][6] - 盈利是企业经营要义,开源模式有多种赚钱途径 [8] 开源大模型盈利途径 部分模型使用权收费 - 开源不一定完全开源,很多企业只开源某层技术或早期、小参数量模型,或开发免费开源应用同时开发收费模型 [13][14][16] - Red Hat提供免费基础版Linux发行版系统,也有面向B端的收费系统,大模型可做B端定制化付费模型部署 [18][19] 卖算力 - DeepSeek通过tokens收费,理论上一天利润47万美元,利润率545%,但多数企业难达此理想状态,收入规模有限 [22][23][27] 服务收费 - 开源是商业化桥梁,生态是护城河,企业可通过服务收费盈利 [28][30] - 纽交所用Red Hat免费Linux系统,处理器更新时多选择购买其订阅服务,大模型企业可提供定制化模型及后续系统维护和升级服务 [30][31][33] 硬件设备及配套服务 - 云厂商可借开源大模型带动相关硬件设备及配套服务销售,如阿里云因千问大模型收入同比增长7%,达296亿 [36][38][39] 开源大模型盈利现状及挑战 - 行业激烈变化,谈赚钱为时尚早,开源界成功商业模式复刻难,需企业产品获认可、扩大开源社区影响力并建立生态 [42][43] - 大模型开发财力消耗高,资金链易断裂,2023年AI公司在英伟达GPU花费500亿美元,收入仅30亿美元,部分开源AI公司亏损严重 [44][45] 企业开源原因 - 企业抢着开源是为制造动静,让市场了解自身及产品,避免掉队失去市场机会 [47]
杭州豪宅售楼处里,又能看见阿里员工了
阿尔法工场研究院· 2025-03-02 19:42
阿里巴巴股价表现及影响因素 - 港股股价从2025年1月13日77.35港元涨至2月28日124.2港元 涨幅达60% [3] - 市值从约1.6万亿港元增至2.36万亿港元 增量近8000亿港元 [3] - DeepSeek开源大模型推动阿里云业务价值重估 [4] - 高性能GPU集群需求增加云计算基础设施需求 [5] - 开源模型整合增强云计算竞争优势 [5] 员工股权激励及财富效应 - P7级以上员工年收入80万-150万元 股票分红占重要比例 [7] - P9级以上管理层年收入可达数百万 高额股权激励 [7] - 2025年增发6592万股用于员工激励 总价值约41.6亿元人民币 [8] - 10年P8职级员工持有6000美股 按143美元/股计算资产达640万人民币 [15] - 段永平年初至今获利2.4亿美元(超17亿元人民币) [6] 杭州高端房地产市场反应 - 阿里员工关注余杭区郡西山墅 总价2000万起步 最高达半个小目标 [12] - 拱墅区绿城润百合叠墅产品总价1600万-2200万 [13] - 未来科技城1月成交价环比大涨4.81% [17] - 未科三兄弟楼盘曾单价冲上8万 三年后价格腰斩 [21] - 2024年区域成交均价3.56万/平 较峰值跌幅29.9% [22] 区域经济联动效应 - 阿里巴巴集团员工总数约19.4万人 杭州总部约2万人 [25] - 阿里系企业在杭员工总数超10万人 [25] - 杭州房价2025年1月环比微涨0.3% [16] - 未来科技城均价2015年破万 2017年破两万 2019年破四万 [18] - DeepSeek技术突破带动杭州房地产价值重估预期 [26]