Workflow
混元大语言模型
icon
搜索文档
大摩中国AI 60强榜单曝光!未来6至12个月将是中国AI企业的关键期
智通财经网· 2025-05-18 10:05
中国AI战略与全球定位 - 中国长期战略目标是成为人工智能技术全球领导者,自上而下的人才、创新、数据和基础设施生态系统为AI发展创造有利环境[1] - 中国AI研究更倾向于商业应用如自动驾驶、智能制造、智能客服和数字人,与美国侧重消费应用形成对比[1] - 中国AI发展路径强调效率驱动,通过开源模型如DeepSeek-R1降低成本,而非资本密集型高性能模型[2] 基础设施层 - 中国AI GPU自给率预计从2024年34%提升至2027年82%,华为Ascend系列芯片和寒武纪创新推动硬件发展[5] - 联想三大业务受AI驱动:IDG推动AIPC/AI手机换机潮,ISG算力需求2024Q4同比增60%,SSG助力企业数智转型[6] - 数据中心新预订量预计从2024年2.1吉瓦增至2025年3.7吉瓦(+76%),华北市场由阿里、腾讯、字节跳动主导[7][8] 平台层 - 中国IaaS/PaaS市场因AI应用加速增长,阿里云运营最大模型即服务社区,通义千问3在编码和数学评估中领先[9] - 腾讯混元大模型应用于微信生态提升广告定向与内容创作,云业务资源转向外部客户将推动2025Q2收入加速[9] - 开源LLM生态如DeepSeek降低企业应用门槛,促进跨行业AI创新[10] 应用层 - 2C领域超级应用(如微信)集成AI功能提升用户体验和商业价值,电商、社交、娱乐企业迎机遇[11] - 2B领域应用速度超公有云周期,订阅模式用于文本生成、在线会议等专业场景[11] - L2+自动驾驶渗透率2025年预计达25%,比亚迪、吉利引入DeepSeek升级智能驾驶与座舱[12] - 人形机器人全球TAM预计2050年达5万亿美元,中国2030年库存或占全球30%[12] 支持性行业 - AI数据中心电力需求2035年或占中国总电力10%,"东数西算"政策促进绿色能源应用[14] - 中国量子计算突破:祖冲之三号105比特原型机计算速度超超级计算机,京沪干线建成1200英里QKD网络[14] - 中国半导体公司加速创新以弥补GPU限制,推动硬件效率提升[15]
腾讯、华为、微软、阿里专家齐聚一堂,共谈推理优化实践 | AICon
AI前线· 2025-04-23 15:28
在人工智能快速演进的浪潮下,大模型正加速重构各行业的技术底座,而 推理性能优化 正成为应对算力挑战、内存瓶颈与通信压力的关键突破口。 当前,大模型推理性能优化主要围绕 模型优化、推理加速与工程优化 在即将于 5 月 23 日 -24 日举办的 AICon 全球人工智能开发与应用大会·上海站 中,我们特别策划了《大模型推理性能优化策略》专题论坛,由阿里云公共云大模型技术服务负责人 王德山 担任专题出品人,现已确认多位业内实践者参与分享。以下为嘉宾阵容及即将带来的精彩议题简介~ 向乾彪 – 腾讯推理架构师 向乾彪在 GPU 推理加速拥有丰富经验。他的技术专长覆盖高性能异构计算及深度性能优化,并在实 践中不断突破前沿技术瓶颈。目前,向乾彪带领团队负责混元大语言模型的推理加速框架 【AngelHCF】 三大方向展开:通过模型量化、剪枝与蒸馏等手段降低计算复杂度、提升推理效率,例如 DeepSeek-R1-Distill-Qwen-32B 采用蒸馏策略,在保持高性能的同时显著压缩资源开销;依托 SGLang、vLLM 等高效推理引擎提升生成速度与系统吞吐能力;同时结合实际业务场景,合理规划 并发策略、优化 GPU 配置 ...