模型即服务

搜索文档
阿里魔搭:7万模型汇聚1600万开发者,共筑中国AI开源新生态
搜狐财经· 2025-07-02 11:42
周靖人还强调了工具链完备性对于模型能力发展的重要性。魔搭社区不仅提供模型托管服务,还覆盖模型生命周期的各个方面,包括数据准备、模型开 发、模型应用以及经验分享等。为了方便开发者使用模型,社区还提供部分免费算力支持。 魔搭社区的快速发展离不开其开放、中立、非盈利的组织定位。社区致力于让AI技术更加普惠,鼓励更多开发者和企业共同贡献。今年,MCP广场登陆 魔搭社区,提供了数千款MCP服务和托管服务,同时开放接口供第三方平台集成。LOGO开发环境、推理工具链等也在不断完善中。 魔搭社区如今已成为一个综合性的AI平台,支持开发者体验、下载、调优、训练、推理和部署模型。其覆盖领域广泛,包括LLM、对话系统、语音识 别、文生图、图生视频以及AI作曲等。社区的快速发展和广泛影响力,使其"中国最大AI开源社区"的称号名副其实。 今年以来,DeepSeek、Qwen等系列开源模型的相继推出,进一步证明了开源在AI领域技术创新中的重要地位。过去,国内开源模型往往依赖于GitHub等 平台,而现在,魔搭社区等本土模型开源社区正逐渐成为开发者的首选。例如,DeepSeek系列模型就选择在魔搭社区首发。 在大会的主题演讲后,阿里云CT ...
国产AI眼镜现状,这里有份沙龙实录|量子位AI沙龙
量子位· 2025-07-02 10:02
AI眼镜行业现状与挑战 - 行业普遍认为AI眼镜正处于"iPhone时刻",但关键挑战才刚开始显现 [1][2] - 主要技术瓶颈包括:每天需充电2-3次的续航问题、常在线能力不足、国内厂商易被Meta带偏技术路线 [3][7] - 行业平均电池容量仅300毫安,单SOC模式下续航问题更突出 [10] - 用户期望的即时响应、持续感知与续航存在根本性矛盾 [10] 技术解决方案 - 小米Vela推出异构双芯融合系统,分为内核层、服务框架层和应用层 [10] - 任务卸载技术覆盖显示/音频/连接模块,显示功耗节省90%,音频节省75%,蓝牙节省60% [12] - 快应用框架启动时间400毫秒,单应用内存占用仅450KB,覆盖设备超15亿台 [12] - 百度智能云构建云脑框架,端侧SDK仅300KB,音频延迟1.3秒,视觉处理2秒内 [23][24] 市场格局与产品定位 - 市场参与者分为三类:音频耳机厂商、整备型企业和营销渠道企业 [20] - 语音摄像及轻交互路线是未来2-3年主流方案,目标替代手机20-30%场景 [18] - Ray-Ban Meta系列销量已达400多万副,年底目标1000万副 [15] - 国内AI眼镜用户接受度比去年提升3-5倍,影目GO2销量同比翻5倍 [56][57] 创业公司差异化路径 - 李未可转向音频眼镜市场,构建ZeroAgent智能体系统实现多模型路由 [30][32] - 影目科技推出全球首款1080p一体式智能眼镜INMO AIR3 [40] - 虚拟名片系统实现AI社交,AI导览打造"实体元宇宙"场景 [41][43] - 创业公司需在硬件设计领先3-5个月,深度理解大模型软硬结合 [68] 价格与市场预测 - 专家预测AI眼镜3年内可实现全民标配 [60] - 大众市场定价需在2000元以内,音频眼镜走量可能比摄像头产品多一个数量级 [107][110] - 眼镜市场将呈现高度差异化,不会出现手机行业的同质化竞争 [71][73] - 中国眼镜年替代量达2.8亿副,存在巨大存量市场机会 [106] 内容生态与开发者机遇 - 2024年是内容开发者最佳入局节点,影目拨5000万孵化AI+AR原生内容 [119][120] - 未来应用形态将转向分布式网络服务,而非具体APP [19] - 百度智能云将搜索/地图等服务打包为MCP协议开放能力 [127] - 服务变现路径更短,海外已出现高收入小型工具案例 [130]
美团、金山办公、喜马拉雅、360等头部企业接入华为云MaaS平台
快讯· 2025-06-20 16:44
华为云ModelArts Studio大模型即服务平台接入情况 - 美团、金山办公、喜马拉雅、360等国内多家头部企业已接入华为云ModelArts Studio大模型即服务平台(MaaS)[1]
2025年大模型云市场探析:如何重构企业智能化路径,开启大模型产业新浪潮?
头豹研究院· 2025-06-10 20:20
报告行业投资评级 未提及 报告核心观点 - 中国大模型与云计算市场深度协同发展,大模型云成为企业智能化转型核心基础设施,未来市场有MaaS渗透率提升、行业垂直模型爆发、边缘计算与大模型融合三大趋势,但面临算力成本和合规风险挑战 [7][8] - 大模型云围绕大规模模型生命周期管理构建一体化基础设施体系,形成从底层算力服务到上层行业应用的全栈商业模式闭环 [9][10] - 大模型因参数规模增长、技术本质、数据密集型特征高度依赖云计算,云平台成为其关键运行底座 [12][14] - 开源与闭源模型双轮驱动企业“全面用云”,云服务是不可替代的承载平台 [20][21] - 大模型驱动企业业务与职能双轮协同转型,重塑企业智能化路径,未来智能演进将构建以大模型为核心的智能中枢系统 [28] 各目录总结 大模型云市场发展现状 - 中国大模型与云计算市场协同发展,云计算市场从2021年的3229亿元以36.7%的年复合增长率预计扩张至2027年的21404亿元,大模型市场从2023年的147亿元增至2027年的672亿元,两者增长曲线同步,呈现双向赋能关系 [7] - 未来市场有MaaS渗透率提升、行业垂直模型爆发、边缘计算与大模型融合三大趋势,但云服务商需降本并构建全链路安全体系应对挑战 [8] 大模型云服务模式 - 大模型云形成从底层算力服务到上层行业应用的全栈商业模式闭环,包括IaaS、PaaS、MaaS、SaaS四层服务模式,各层有不同核心内容和主要价值 [9] - IaaS为大模型构建AI原生计算底座,PaaS构建大模型全生命周期管理平台,MaaS将大模型能力封装为标准化接口,SaaS是大模型与行业知识融合的最终形态 [10][11] 大模型高度依赖云计算 - 大模型参数规模迈入万亿时代,计算图复杂度指数级增长,训练成本高昂,对云计算的依赖将随模型复杂度上升而强化 [12] - 云计算可降低大模型训练成本,在推理环节满足低延迟与高吞吐需求,通过MaaS模式降低企业AI应用门槛,两者形成共生关系 [13] 大模型数据密集型特征 - 数据安全合规推动“数据不动,模型来动”的云上范式,云端可实现模型在“数据原地”训练 [16] - 大模型训练数据体量庞大,多节点训练对数据读写和交换需求高,本地基础设施难以满足,云平台成为支撑分布式并行训练的唯一可行方案 [17][18][19] 从模型演进到业务重构 - 开源模型因性能逼近闭源、定制能力强、数据安全可控等优势受企业青睐,云推理是其落地的现实选择,云服务是不可替代的承载平台 [20][21] - 闭源模型因技术壁垒和产品封装天然依赖云端,MaaS模式绑定企业核心系统,推动企业基础架构云化升级 [22][23] 大模型重塑企业智能化路径 - 企业智能化从“业务为主”单轮驱动演变为业务与职能双轮协同转型,大模型在各行业形成典型应用场景,未来智能演进将构建以大模型为核心的智能中枢系统 [28] - 企业智能化转型经历自动化、数字化、智能化三个阶段,大模型应用分初级、中级、高级三个级别 [25][27]
AI服务架构的范式跃迁:从“模型即服务”到“Agent即服务”
36氪· 2025-05-19 20:04
AI Agent技术演进 - AI服务架构正从"模型即服务"向"Agent即服务"跃迁 2025年被视为AI Agent"元年" [1] - AI Agent基于目标驱动 具备环境感知 自主决策 任务执行和学习能力 以大语言模型为核心大脑 [2] - 主流分类包括基于规则 传统机器学习和LLM-based三种技术路径 [3][4] AI Agent功能分类 - 按功能分为信息获取 任务自动化 个人助理 决策支持 创作生成和娱乐交互六大类 [6][7] - 应用场景覆盖客户服务 金融 教育 医疗 零售 内容创作 软件开发和智能制造八大领域 [8][9] AI Agent产业链 - 底层基础设施包括算力 数据和网络存储三大要素 [11] - 核心层由大语言模型和规划 记忆等算法构成 [12] - 中间层提供组件化和平台化服务 终端层分为通用型 垂直行业和嵌入式三类产品 [13][14] 行业发展历程 - 萌芽于20世纪50年代的理论探索 80年代进入符号主义与连接主义发展期 [16][17] - 2000年代机器学习与互联网推动应用落地 2020年后大语言模型驱动爆发式增长 [18][19][20] 中国出海企业案例 - HeyGen专注AI视频生成 海外ARR达3500万美元 估值5亿美元 [22][23][24] - 来也科技提供RPA+AI解决方案 累计融资超1.6亿美元 [26][27][29] - 波形智能开发长文本生成工具 布局多语言市场 [30][31][32] 行业痛点与解决方案 - 面临算力成本高 供给不足和能耗大三大挑战 [33] - 通过算法优化 专用芯片 边缘计算和绿色算力等路径应对 [34]
2024年中国MaaS市场规模同比增长215.7%
快讯· 2025-05-07 21:26
中国MaaS及AI大模型解决方案市场增长 - 2024年中国MaaS市场规模达7 1亿元 同比增长215 7% [1] - AI大模型解决方案市场规模达34 9亿元 同比增长126 4% [1] - 企业对AI模型应用需求增长推动市场扩张 [1] 市场竞争格局 - 百度智能云以26%市场份额位居2024年下半年中国MaaS市场第一 [1]
Qwen 3 发布,开源正成为中国大模型公司破局的「最优解」
Founder Park· 2025-04-29 20:33
阿里Qwen 3大模型发布 - Qwen3-235B-A22B评测成绩与DeepSeek R1、Grok-3、Gemini-2.5-Pro相当,支持混合推理和增强Agent能力 [1] - 全系列模型实现全参数(0.6B-235B)和全模态覆盖,成为HuggingFace最受欢迎开源模型,衍生模型数量突破10万超越Llama系列 [16][17][23] - 采用"思考模式/非思考模式"无缝切换技术,优化MCP工具调用成功率,官方明确从"训练模型"转向"训练Agent"的战略方向 [5][6][7] 中国开源模型全球竞争格局 - DeepSeek+Qwen形成开源"双子星"格局,取代Llama+Mistral成为全球主流开源生态 [1][13] - 开源策略突破地缘政治壁垒:模型权重和训练细节全公开,开发者可自托管定制,建立全球开发者社区信任 [10][12][15] - 两种差异化商业模式:DeepSeek通过技术突破提供低价API服务(成本降低80%),Qwen通过开源带动阿里云商业闭环 [19][20][21] MaaS模式创新 - 阿里云构建"模型-云-行业应用"飞轮:Qwen开源降低AI创业门槛,百炼平台提供MCP服务接入 [2][24] - 实际案例显示Claude+Qwen2.5组合成为创业公司主流方案,混合使用闭源与开源模型平衡成本能力 [25][27][30] - 行业专用模型在医疗、金融等高壁垒领域仍具优势,但需结合本地化服务和数据闭环 [14] AI创业者实践洞察 - 模型选择策略:ToB企业倾向Qwen32B微调(单卡可部署),ToC企业采用API组合(Gemini+DeepSeek) [27][45] - 四大核心挑战:长文本处理衰减(播客场景)、多模态情感理解(心理场景)、国产芯片适配(机器人场景)、并发稳定性(服务场景) [36][40][41] - 创业方法论验证:70%成功案例遵循"X+AI"而非"AI+X"模式,留存率取决于真实需求解决而非技术指标 [48][50] 开源模型技术趋势 - 能力差距持续存在但应用门槛降低:2025年开源模型已满足PMF验证需求,微调价值向窄领域迁移 [25][43] - 三大技术方向:混合推理架构(成本控制)、Agent工具调用(实用化)、多模态融合(场景适配) [5][7][23] - 社区驱动创新:Qwen生态含完整工具链(vLLM/SGLang),DeepSeek聚焦前沿技术(MoE/多模态) [32][49]
DeepSeek 545%利润率谁能做到?
新财富· 2025-03-07 15:55
1 接入De epSe ek,云计算的福报还是成本灾难? 本文约 4 5 0 0 字,推荐阅读时长 2 0 分钟,欢迎关注新财富公众号。 近期,硅基流动创始人袁进辉与潞晨科技创始人尤洋在知乎上演了一波隔空对峙。 事件的起因是尤洋在社交媒体发表《De e pSe e k Ma aS成本解析》和《坑人的硅基流动》两篇文章,直指AI I n fr a 厂商部署De e pSe e k成本过高和 硅基流动不正当行为破坏市场的问题。 抛开两家公司间商业"互撕"不谈,二人讨论围绕的中心,本质上是对接入 De e pSe e k 后的商业合理性上争论。 尤洋认为,De e pSe e k官网服务频繁掉线,并不是一款合格的产品。而云厂商要接入 De e pSe e k 保证服务稳定,则需要承担高额的服务器成本, 基本就是"赔本赚吆喝"。 争议发酵之后,De e pSe e k 火速在知乎建号,甩出一篇《De e pSe e k -V3 /R1推理系统概览》并以5 4 5%的理论成本利润率回击:接入De e pSe e k API亏本是友商技术不够好,不要乱甩锅。 此文发布后,吃瓜网友们纷纷将矛头再次指向潞晨科技。 尤洋在承认 ...
超10亿元!杭州国资,投了一家AI“六小虎”!
证券时报· 2025-03-03 12:27
杭州AI产业布局 - 杭州近期在人工智能领域有大动作,重金押注AI"六小虎"之一的智谱,完成超10亿元人民币战略融资,投资方包括杭州城投产业基金、上城资本等国资背景机构[1][4] - 杭州已培育出以DeepSeek、宇树科技、游戏科学等为代表的"六小龙"科技初创公司,成为当地科创实力的代表[3] - 智谱2023年已在杭州成立浙江智谱华章科技,2024年2月又新设浙江智谱新篇科技,注册资本4.5亿元,由北京智谱全资持股[1] 智谱公司概况 - 智谱是国内AI"六小虎"之一,最早突破200亿元估值的AI独角兽,已完成超10轮融资[6] - 公司GLM系列大模型已应用于金融、医疗、教育等多个行业,与地方国资合作将推动杭州及浙江人工智能产业布局[4] - 智谱2024年商业化收入相比2023年逆势增长100%以上,MaaS平台API年收入同比增长超30倍,日均Tokens消耗量增长150倍[10] 杭州选择智谱的核心原因 - 技术全面性:智谱是国内唯一全面对标OpenAI的企业,在基座模型、对话模型、多模态模型等均有完整布局,而DeepSeek等竞争对手在部分领域存在短板[7] - 智能体领先优势:智谱是国内最早探索AI智能体的公司之一,推出全球首个面向公众的电脑智能体GLM-PC,并率先提出Phone Use概念,与三星手机展开合作[8] - 商业化能力突出:构建MaaS平台服务70余万企业开发者,私有化部署覆盖20多个行业万余家单位,形成规模化应用[9] 智谱未来规划 - 2025年定位为开源年,将发布包括基座模型、推理模型等在内的全新大模型并全部开源[10] - 公司预测2025年是AI智能体爆发年,其自主Agentic LLM技术具有领先优势[7]