Workflow
英伟达OCR系列模型
icon
搜索文档
DeepSeek和李飞飞之后,英伟达也看上阿里千问?
新浪财经· 2025-05-14 09:07
开源大模型生态 - 阿里通义千问成为全球开源大模型生态圈的核心焦点,英伟达、DeepSeek、李飞飞团队等顶级机构均基于其模型进行开发 [2][4] - 英伟达开源OCR系列模型(7B/14B/32B)均采用通义千问基础模型,其中OCR-Qwen-32B-Instruct在LiveCodeBench评测中pass@1达61.8%,超越OpenAI闭源模型O3-Mini和O1 [5] - 李飞飞团队基于Qwen2.5-32B-Instruct训练的s1-32B模型,数学及编码能力对标OpenAI o1和DeepSeek R1 [5] 模型性能与成本优势 - 千问3在AIME25奥数测评获81.5分(开源纪录)、LiveCodeBench突破70分超越Grok3、ArenaHard测评95.6分超越OpenAI-o1 [10] - 千问3部署成本为同类模型的1/3,推理成本不足DeepSeek-R1三成、Claude3.7的二十分之一 [11] - 中美模型性能差距从2023年17.5%缩至0.3%,阿里6大模型入选《2025 AI指数报告》,贡献度全球第三、中国第一 [6] 开源生态与开发者支持 - 千问全球下载量超3亿,HuggingFace社区占比超30%,衍生模型数量突破10万,超越Llama成全球第一开源模型 [8] - 提供200多款全模态/全尺寸开源模型(0.5B-235B),覆盖文本/视觉/语音/视频等,支持119种语言 [13][15] - 千问3获SGLang/vLLM/Ollama等主流平台适配,英特尔/高通/华为昇腾等产业链企业连夜接入 [18][19] 阿里AI战略布局 - 未来三年将投入3800亿元建设云和AI基础设施,超过去十年总和 [21] - 千问3在BFCL评测中Agent能力达70.8分,原生支持MCP协议和工具调用功能,降低Agent开发门槛 [21] - 阿里云百炼推出全生命周期MCP服务,魔搭社区上线MCP广场,计划开放AI Agent Store生态 [22][23]
DeepSeek和李飞飞之后,英伟达也看上阿里千问?
新浪科技· 2025-05-13 15:01
阿里通义千问大模型生态 核心观点 - 阿里通义千问大模型成为全球开源生态的核心标杆,吸引英伟达、DeepSeek、李飞飞团队等顶级机构合作,衍生模型超10万,下载量超3亿,HuggingFace占比超30% [2][4][6] - 千问3性能全面超越OpenAI、DeepSeek等闭源模型,成本仅为竞品1/3至1/20,同时提供全模态、全尺寸开源选项 [8][9][11] - 阿里宣布未来三年投入3800亿元加码AI基础设施,推动千问成为Agent开发标准,并整合淘宝、高德等业务场景加速落地 [16][17][18] 技术性能与成本优势 - 千问3在AIME25测评获81.5分(开源纪录)、LiveCodeBench突破70分超越Grok3、ArenaHard以95.6分领先OpenAI-o1 [8][9] - 英伟达基于千问2.5开发的OCR-Qwen-32B-Instruct模型在LiveCodeBench pass@1测试达61.8%,超越OpenAI闭源模型 [4][5] - 部署成本为竞品1/3,推理成本不到DeepSeek-R1三成,Claude3.7的二十分之一 [9][11] 开源生态布局 - 提供200多款开源模型覆盖文本、视觉、语音等全模态,尺寸从0.5B至235B全覆盖,支持119种语言 [11][12][13] - 千问3获SGLang、vLLM、苹果MXL等主流平台适配,英特尔、高通等芯片厂商连夜接入,形成事实上的行业标准 [15] - HuggingFace开源榜单前十均为千问衍生模型,魔搭社区推出MCP广场加速Agent应用创新 [6][15][17] 战略投入与行业影响 - 阿里三年3800亿元投资聚焦云与AI硬件,计划将AI融入所有业务环节 [16] - 千问3原生支持MCP协议,BFCL评测70.8分超越Gemini2.5-Pro,降低Agent开发门槛 [17] - 淘宝、高德等业务场景为模型提供实战训练场,AI Agent Store计划开放生态伙伴能力 [18]