Workflow
CogView4
icon
搜索文档
AI第一股双雄竞速,MiniMax与智谱清言谁能率先突围?
36氪· 2025-11-26 08:46
行业竞争格局 - 人工智能大模型领域的竞争已从纯粹的技术角逐扩展为资本、商业模式与生态构建的全方位较量[1] - 国内已形成以智谱AI、MiniMax、阶跃星辰、百川智能、月之暗面和零一万物为代表的“创业六小强”第一梯队[1] - MiniMax与智谱清言均传出上市动作被视为“AI大模型第一股”的有力竞争者[1] MiniMax技术优势 - 2025年10月正式开源并推出新一代模型MiniMax M2主打“端到端开发工作流”在代码生成、工具调用等任务中表现优秀[2] - MiniMax M2发布仅三天便登上OpenRouter平台全球调用量第四、编程场景第一在第三方评测机构测试中以61分获开源模型第一名全球第五[2] - 相比M1模型M2采用“全注意力机制 + MoE 架构”总参数量达230B每次激活参数只有10B[2] MiniMax商业化策略 - M2模型API定价为每百万Token输入0.3美元、输出1.2美元只有同类模型Claude Sonnet 4.5价格的8%而推理速度快近一倍[3] - 视频生成模型“海螺02”在Artificial Analysis Video Arena Leaderboard图像生视频项目中位列全球第二[3] - 海螺2.3视频模型在性能大幅提升的同时维持与“海螺02”相同定价海螺2.3 Fast版本能为批量创作场景最高降低50%成本[4] MiniMax多模态布局 - 语音生成模型Speech2.5新增14种小众语种总覆盖语种达40个字错率降低30%[4] - MiniMax Speech语音模型已在全球范围内获得广泛采用覆盖从Agent平台到各类AI应用的关键场景[5] - 公司正致力于构建一个既服务于C端创作者又赋能B端企业的高可用、低成本大模型生态[5] MiniMax面临挑战 - 大模型的持续研发与迭代需投入巨额资金以OpenAI动辄数千亿美元的资本支出为参照长期融资能力面临严峻考验[6] - 品牌在大众层面知名度有限核心用户群体集中在科技圈和二次元圈子国内市场用户付费能力和意愿不理想[7] - 2025年9月遭迪士尼、环球、华纳三大娱乐巨头起诉指控其未经授权生成知名角色图像暴露出海外扩张的合规风险[8] 智谱清言资本化进程 - 母公司智谱华章已于2025年4月15日完成公开发行辅导备案辅导计划为期七个月最快将在2025年底前提交IPO招股说明书[10] - 公司发展路径清晰反映“技术驱动、全栈布局”的战略思路产品布局涵盖代码、多模态、Agent等多个方向[10] 智谱清言技术产品体系 - 产品核心竞争力源于自研完整模型家族包括GLM系列基础模型、ChatGLM对话模型、CodeGeeX代码模型和CogView多模态模型[10] - 2024年7月发布全球前三的代码模型CodeGeeX4同期推出视频生成模型“智谱清影”[11] - 2025年发布支持汉字生成的开源文生图模型CogView4及具备更强复杂问题处理能力的“沉思大模型”和推理大模型Z1[11] 智谱清言商业模式 - 探索了To C、ToB、ToG三种服务模式业务包括开放平台 API、云端私有化、本地私有化部署以及软硬一体机[12] - 保持独特的“科研+市场”双轮驱动模式通过运营AMiner学术平台和推进前沿模型研发形成差异化风格[11] 智谱清言发展瓶颈 - 产品线迭代快但尚未成功孵化出真正明星产品如AutoGLM因操作复杂和应用场景有限陷入“叫好不叫座”困境[13] - 2024年已披露融资金额共计接近70亿元但仍需进一步补充资本并积极推动上市进程[13] - 2025年5月因超范围收集用户敏感信息被国家网信办通报并下架整改2025年10月据报道公司调整减员近百人[13][14] 行业发展趋势 - OpenAI从单一模型提供商向覆盖文本、语音、视频、推理、工具链及算力平台的“操作系统级”生态转型截至2025年ChatGPT用户已超8亿[15] - 中国AI行业走出“务实主义”路径不盲目追求参数规模而是通过工程优化、训练方法创新实现效率最大化[15] - 行业洗牌加速企业需在技术、市场、资本与合规之间找到最佳平衡点才能实现从“技术追赶”到“商业共赢”的跨越[16]
坚守与变阵:IPO曙光下的大模型“六小虎”
上海证券报· 2025-07-01 03:10
行业现状 - 中国AI大模型初创企业"六小虎"(智谱、月之暗面、百川智能、MiniMax、阶跃星辰和零一万物)面临融资退潮、巨头挤压与战略分化等多重考验 [2] - 证监会宣布在上交所科创板设置科创成长层,允许尚未盈利的高研发投入AI企业申请IPO [2] - "六小虎"在商业路径上分化为"转型派"和"坚守派" [2] - "六小虎"市场关注度持续下降,不复昔日"AI明星"之姿 [4] 公司动态 坚守派 - 智谱2025年为开源年,已开源CogView4和GLM模型系列,并签署上市辅导协议 [4] - MiniMax发布混合架构推理模型M1、视频生成模型Hailuo 02和通用智能体产品MiniMax Agent,拟计划港股上市 [5] - 月之暗面暂缓投放但未停止基座模型预训练 [5] - 阶跃星辰坚持基础模型研发 [5] 转型派 - 百川智能"All in"医疗,聚焦百小应、AI儿科、AI全科、精准医疗四个方向 [6] - 零一万物不再投入万亿参数基模,转向中规模高性价比模型,推出企业级DeepSeek部署定制解决方案 [6] 行业挑战 - 基座大模型商业模式存在先天缺陷 [8] - 预训练成本极高,研发人员占比60%-70% [9] - 估值高企使融资难度陡增,融资资金消耗快 [10] - C端市场被大厂和DeepSeek占据,MAU前五均为大厂产品 [12] - B端面临成本与技术领先性劣势 [13] 潜在出路 - 短期内IPO是有效解决方案 [14] - 长期需找到可行商业化路径,机会在B端垂直领域 [15] - 垂类应用场景需形成服务闭环产品体验 [15] - 收缩预训练规模,投入小模型或智能体可节省60%-70%成本 [16] - 选择开放的垂直行业利基市场,需具备行业洞察、产品能力和成本效率 [17][18]
智谱今年获北京、杭州等地国资累计20亿元投资,开源生态建设提速
21世纪经济报道· 2025-04-18 19:16
公司近期融资与资本动态 - 北京市人工智能产业投资基金在去年投资基础上,追加投资公司2亿元人民币,用于支持开源模型研发与开源社区生态建设 [1] - 公司宣布其Z基金将出资3亿元人民币,支持全球范围内的AI开源社区发展,任何基于开源模型(不限于公司开源模型)的创业项目均可申请 [1] - 2025年3月,公司先后获得来自杭州、珠海、成都等地国资的战略投资,累计金额达18亿元人民币 [2] - 加上北京市的追加投资,公司2025年已获得地方国资累计投资达20亿元人民币 [2] - 公司已正式提交IPO辅导备案,由中金公司担任辅导机构,最快可能于2026年登陆A股市场 [4] - 公司被北京市人工智能产业投资基金描述为其成立以来投资的第一家AI大模型企业,也是目前成长最快的企业 [3] 公司开源战略与生态建设 - 公司宣布2025年为“开源年”,并于4月14日开源了32B/9B系列GLM模型,包括基座、推理和沉思模型,所有模型采用宽松的MIT许可协议,可免费用于商业用途和自由分发 [1] - 公司早在2023年就开源了国内第一个Chat大模型ChatGLM-6B,短时间内吸引超过千万次下载 [6] - 成立近六年来,公司已开源超过55款模型,在国际开源社区的累计下载量接近4000万次 [6] - 2025年,公司还开源了首个支持生成汉字的开源文生图模型CogView4 [6] - GLM-4开源仓库在GitHub上已获得超过6000颗星,最新模型上线公司开放平台后,当天就有超过6000家企业和开发者申请接入,模型调用Tokens的增幅每天超过100% [6] - 包括华为昇腾、硅基流动、UCloud、值得买、瓜子二手车等众多云服务伙伴和企业已第一时间部署或接入了公司的模型 [6] 公司技术能力与市场地位 - 公司在包括文本、推理、语音、图像、视频、代码等在内的模型能力上有全面积累 [3] - 公司商业化布局完善,拥有超过百万规模的开发者社区和企业用户 [3] - 公司被早期投资人描述为“六小虎”中起步最早、家底最厚的一家,也是其中真正在持续做基座大模型技术研发的企业 [3] - 在DeepSeek引发行业竞争格局变化的背景下,公司是少数仍获得投资人加码投资的大模型创业企业 [2] 行业开源发展趋势与政策环境 - 随着DeepSeek以开源模式引发行业变革,百度、字节跳动等大厂也纷纷加速了大模型的开源步伐 [5] - 开源已成为全球技术和产业创新的主导模式之一,全球97%的软件开发者和99%的企业都在使用开源软件 [7] - 在人工智能等新兴领域,开源已成为主要开发模式,TensorFlow、PyTorch等开源框架是推动技术发展与创新应用的核心力量 [7] - 北京市积极打造“全球开源之都”,优化开源基础设施布局,建设开源项目孵化平台,营造开源开放创新生态 [7] - 在模型开发方面,除公司外,智源研究院开源了BGE向量模型,面壁智能开源了MiniCPM端侧模型 [7] - 在芯片方面,开源芯片研究院开源了高性能RISC-V处理器核“香山”,成为国际RISC-V社区最活跃项目 [7] - 开源已深入汽车、机器人等行业,例如理想汽车将自研车载操作系统理想星环OS开源 [8] - 开放原子开源基金会、开源中国等平台正打造北京国际开源社区,旨在营造开放、多元、繁荣的开源生态 [8] - 北京市后续将持续深化开源战略,组织开源RISC-V处理器核、数据集及系列大模型,并积极打造中国版“Hugging Face” [8]
智谱获北京市人工智能产业投资基金追加投资,Z基金出资3亿支持开源社区
IPO早知道· 2025-04-18 11:12
投资动态 - 北京市人工智能产业投资基金追加投资智谱2亿元人民币 支持开源模型研发与开源社区生态建设 [2] - 智谱是北京市人工智能产业投资基金成立以来投资的第一家AI大模型企业 也是目前成长最快的企业 [2] - 智谱Z基金出资3亿元支持全球范围内的AI开源社区发展 任何基于开源模型的创业项目均可申请 [3] 公司技术能力 - 智谱在文本 推理 语音 图像 视频 代码等模型能力上有全面积累 [2] - 智谱开源32B/9B系列GLM模型 涵盖基座 推理 沉思模型 遵循MIT许可协议 [3] - 推理模型GLM-Z1-32B-0414性能媲美DeepSeek-R1等顶尖模型 推理速度达200 Tokens/秒 为国内商业模型中速度最快 价格仅为DeepSeek-R1的1/30 [3] 开源生态贡献 - 智谱宣布2025为开源年 已开源首个支持生成汉字的开源文生图模型CogView4和32B/9B系列GLM模型 [2] - 智谱2023年开源国内第一个Chat大模型ChatGLM-6B 短时间内吸引超千万次下载 [3] - 成立近六年来 智谱已开源55余款模型 国际开源社区累计下载量近4000万次 [3] 商业化与市场表现 - 智谱拥有超百万规模的开发者社区和企业用户 [2] - 智谱于2024年3月31日同中金公司签署辅导协议 正式启动A股IPO进程 成为大模型创业公司中第一家启动上市流程的企业 [3]
文生图功能升级 ChatGPT追击
北京商报· 2025-03-26 23:08
OpenAI GPT-4o图像生成功能升级 - OpenAI在3月25日宣布其最新多模态模型GPT-4o正式集成“迄今为止最先进的图像生成器”并开放免费使用,此举被业界视为对同日谷歌发布的Gemini 2.5 Pro Experimental模型的直接狙击,标志着生成式AI竞赛进入白热化阶段 [3] - GPT-4o的图像生成功能擅长准确呈现文本并精准遵循提示词,其知识库和聊天上下文可作为灵感来源,该功能供ChatGPT Plus、Pro、Team和免费用户使用,并计划随后向企业、教育和API使用者推出 [4] - 该功能攻克了“生成图像中的文字”这一行业历史难题,在示例中能按要求生成包含复杂场景和文字的图像,并在连续修改指令时保持图像中人物身形、发型和板上文字的连贯一致性 [4] GPT-4o图像生成功能的技术特点与限制 - 在训练上,OpenAI使用网络上的图像和文本训练模型,使其学习图像与文字、图像与图像之间的关系,从而具备视觉流畅性,生成有用且具备上下文连贯性的图片 [5] - 功能特点包括:用户可通过自然对话要求模型改进图像,并保持图像中人物等要素的一致性;可同时处理10到20个不同的对象,以便图像中各要素呈现相关性,而其他系统通常只能同时处理5到8个对象 [5] - 该功能也存在一些限制,例如存在幻觉、难以呈现太多依赖知识库的图像要素(如元素周期表)、图表准确性不足、呈现非拉丁语言时易出现幻觉、以及难以精准编辑图像中的错别字 [6] - 有从业者评价,GPT-4o图像生成功能虽强大,但完全替代UI设计师尚早,创意和细节仍需人力,并比喻其为“88分的设计流,剩下12分才是设计师的真正价值” [6] OpenAI的GPT-5发展路线图与挑战 - OpenAI在更新GPT-4o后,更大的产品更新将是推出GPT-5,公司首席执行官山姆·奥尔特曼在2月表示,GPT-5将集成公司多项技术,包括推理模型o3的技术,并可能在未来几个月内推出 [6] - 奥尔特曼突然官宣GPT路线图,或许是因为OpenAI面临用户流失的压力,其本人表示,DeepSeek让OpenAI的领先优势不会像前几年那么大,并承认公司在开源策略上可能站在了历史的错误一边 [6] - 据《华尔街日报》报道,OpenAI内部代号为“猎户座”的GPT-5项目开发已持续近两年,目前面临严峻挑战,原计划2024年年中完成,但进度已严重滞后 [7] - 项目已进行至少两次大型训练,每次需数月处理大量数据,目标是让GPT-5在某些任务上达到博士水平,而GPT-4仅相当于优秀高中生,但训练每次都会出现新问题,软件达不到研究人员预期 [7] - 东吴证券研报判断,OpenAI对大模型产品线预期进行过调整,GPT-5的发布时间或提前,可能是由于DeepSeek近期的重磅更新和亮眼表现对OpenAI产品版图构成威胁,进而希望加快产品迭代步伐 [7] 外部竞争:谷歌发布Gemini 2.5 - 在OpenAI宣布更新前约一小时,谷歌正式推出了新一代AI模型Gemini 2.5,该模型基于多模态大语言框架升级,显著增强了推理能力、多语言支持及长文本处理能力 [8] - 谷歌将Gemini 2.5定义为公司迄今为止“最智能的AI模型”,其Gemini 2.5 Pro实验版本在多项基准测试中全面超越OpenAI o3-mini、Claude3.7 Sonnet、Grok-3和DeepSeek-R1 [8] - 通过优化算法架构,Gemini 2.5将响应速度提升40%,能耗降低25%,在关键指标测试中,其复杂逻辑任务完成度较前代提升65%,尤其在医疗诊断辅助、法律文书生成等垂直领域展现出更高精度 [8] - Gemini 2.5 Pro支持文本、图像、音频、视频及代码的多模态输入,上下文窗口达100万token(约75万单词),可解析完整《指环王》系列文本,未来将升级至200万token [8] - 该模型一经发布便在各大基准测试中全面领先,在所有测试中都稳居第一,包括常见的编程、数学和科学基准测试 [9] - 在推理能力方面,Gemini 2.5 Pro在一系列需要高级推理的基准测试中都处于领先地位,在“人类最后考试”中,它在未使用工具的模型中也获得了18.8%的最高分数,这是目前最先进的成绩 [9] 行业趋势与展望 - AI图像生成领域持续发展,国内厂商如豆包在去年升级文生图能力支持一键生成指定文本,智谱AI在今年3月发布了首个支持生成汉字的开源文生图模型CogView4 [5] - 研究机构Gartner预测,到2026年,多模态生成模型的商业价值将占AI市场的45% [10] - 随着谷歌与微软等巨头持续加码,生成式AI正从通用工具向产业基础设施演变,但其社会伦理、监管框架的完善也有待各方共同探索 [10]
智谱再获3亿元战略投资,四川接入GLM打造首个省级基座大模型
IPO早知道· 2025-03-19 21:16
核心观点 - 智谱华章获得成都高新区3亿元战略投资,将共同打造四川省基座大模型"智谱诸葛大模型",并建设AI基础设施,计划5年内赋能超1000家企业AI+转型,孵化20家以上生态企业 [2] - 智谱诸葛大模型基于国产GLM预训练架构,实现核心模块自主可控,在政策、民生、消费等领域提供高可信服务,幻觉率仅1.3% [2][5] - 该模型覆盖文旅、民生、政务、教育、金融五大场景,通过智能体开发平台「智谱清流」构建多样化AI应用 [2][3] - 公司近期连续完成多笔融资,包括杭州城投产业基金10亿元、珠海华发集团5亿元战略投资,并与上海张江集团达成合作 [7] 技术优势 - GLM-4-Plus基座模型技术实力世界领先,尤其在Agentic LLM方向率先提出Phone Use概念并推出AutoGLM、GLM-PC等产品,与全球车企、PC及手机厂商深度合作 [7] - 公司推出首个支持生成汉字的开源文生图模型CogView4,在DPG-Bench基准测试中综合评分排名第一,并计划陆续开源基础模型、推理模型等多类模型 [8][9] 行业影响 - 智谱诸葛大模型落地标志着四川省将AI作为城市治理、民生服务与产业发展的核心支撑,推动区域人工智能进入高速发展期 [1][7] - 公司以MaaS模式构建的开放平台bigmodel.cn持续赋能千行百业,结合开源战略进一步促进AI生态繁荣 [7][9] 应用场景 - 文旅场景:整合四川全域旅游资源,提供AI视频导览,融合三星堆、川剧变脸等文化元素的AIGC生成 [3] - 民生场景:开发四川方言智能体问答,提升政务与市民服务体验 [3] - 教育场景:通过定制化教学资源生成助力偏远地区教育公平 [3]
智谱再获珠海华发集团5亿元战略投资,10天前刚宣布杭州国资超10亿元投资
IPO早知道· 2025-03-13 13:06
战略融资与合作 - 智谱获得珠海华发集团5亿元战略投资,用于推进GLM大模型技术创新与生态发展[2] - 10天前公司刚完成超10亿元人民币战略融资,投资方包括杭州城投产业基金、上城资本等[3] - 珠海高新区、华发集团与智谱签署协议,联合搭建首个城市级GLM大模型空间"智谱+珠海华发空间"[2] 技术能力与产品布局 - GLM大模型平台已服务近百万企业开发者,覆盖金融、医疗等20+行业,落地超万家企事业单位[2] - 最新基座模型GLM-4-Plus技术实力位居世界领先梯队,在Agentic LLM方向优势明显[3] - 推出首个支持生成汉字的开源文生图模型CogView4,在DPG-Bench基准测试中综合评分排名第一[3] 市场拓展与生态建设 - 智谱智能体已进入101等十余所北京学校完成AI智能体接入[3] - 公司以MaaS理念构建开放平台bigmodel.cn,推动千行百业AI创新变革[3] - 2025年将陆续开源基础模型、推理模型、多模态模型、Agent模型等[4] 行业影响与定位 - 智谱是我国最早研发大模型的企业,具备从预训练到自学习的全栈自主能力[2] - 公司通过城市级合作模式加速打造人工智能产业高地,如珠海项目[2] - Agentic GLM已与全球车企、PC及手机厂商展开深度合作,推动大模型从Chat走向Act[3]
传媒行业周报:Manus引发关注,心动公司业绩亮眼-2025-03-13
国元证券· 2025-03-13 07:30
报告行业投资评级 - 推荐|维持 [5] 报告的核心观点 - 2025.3.3-2025.3.9传媒行业(申万)上涨5.16% ,排名子行业第5名 ,各子板块普涨 ,心动公司业绩超预期 [1][12] 根据相关目录分别进行总结 行情回顾 - 2025.3.3-2025.3.9传媒行业(申万)上涨5.16% ,排名子行业第5 ,同期沪深300涨1.39% ,上证指数涨1.56% ,创业板涨1.61% ,恒生科技指数涨8.47% [1][12] - 细分板块中广告营销板块领涨 ,涨幅6.73% ,其次游戏板块涨幅6.66% ,数字媒体板块涨5.34% ,影视院线涨1.61% ,出版涨1.24% [12] - 个股方面 ,蓝色光标等涨幅居前 ,紫天科技等跌幅居前 ,港股恒生科技成分股中快手 - W等表现领先 [17] 行业重点数据 AI应用数据 - 2月Chatgpt月活破4亿 ,豆包月活国内第一 ,Deepseek紧随其后且月活环比增83% [21] - 字节豆包免费榜排名重回第二 ,腾讯元宝下载量环比微降 [26] 游戏数据 - 周畅销榜前三为《王者荣耀》《穿越火线:枪战王者》《和平精英》 ,新游《英雄没有闪》霸榜角色扮演类免费榜第一 ,3.9排名畅销榜第6 ,《龙之谷世界》排名稳定在前20 [31] - 2025年2月35个中国厂商入围全球手游发行商收入榜TOP100 ,占本期全球TOP100手游发行商收入37% [33] - 春节期间网易旗下游戏IP联动 ,《蛋仔派对》2月收入增22% ,网易成2月发行商收入榜第二名 ,《无尽冬日》2月收入环比增4% ,带动点点互动收入提升 ,成发行商收入榜第3名 [33] - 2月微信小游戏畅销榜前十有《无尽冬日》等 ,新入榜或重新入榜产品数量比1月增长37% ,《英雄冒险团》等表现较好 [39] - 未来一周(2025.3.10 - 2025.3.16)有5款游戏将上线 [42] 电影数据 - 2025.3.3 - 2025.3.9国内总票房5.94亿元 ,《哪吒之魔童闹海》《唐探1900》《天堂旅行团》为周度票房前三 [3][42] - 周度票房冠军《哪吒之魔童闹海》票房3.73亿元 ,占比62.6% ,截至3.12国内累积票房达146.93亿元 [45] - 最新一周有10部影片待映 ,《疾速追杀4》和《真爱营业》期待值较高 ,猫眼想看人数分别突破6万和7万 [48] 行业重点事件及公告 - 3月3日字节跳动发布“中国首个AI IDE”Trae国内版 ,具备多种功能 ,官网已上线 [52] - 3月3日讯飞星火重大升级 ,星火X1升级 ,首发星火医疗大模型X1 ,赋能相关助手升级 ,联合华为升级星火一体机 ,发布AI学习机T30系列 [52] - 3月4日智谱发布并开源图像生成模型CogView4 ,3月13日将上线智谱清言 [52] - Claude公司再融35亿美元 ,估值提升至615亿美元 ,计划开发更强大AI系统 [52] - 3月4日心动公司发布业绩预告 ,预计2024财年收入49.6 - 50.4亿元 ,净利润8.6 - 9.4亿元 ,扭亏为盈 [54] - Monica.im推出全球首款通用型Al Agent Manus ,处内测阶段 [54] - 腾讯混元发布并开源图生视频模型 ,上线多种玩法 ,开源后热度高 [54]
120万年薪!华为小米砸钱抢AI大模型研发人才;我国AI人才缺口达500万人,在校生仅4万人,清华拟扩招150名本科生丨AI周报
创业邦· 2025-03-09 11:27
国内AI动态 - 中国团队发布通用型AI Agent产品Manus,在GAIA基准测试中取得SOTA成绩,性能超越OpenAI同层次大模型,其邀请码被炒至5万元[4][5] - 腾讯混元上线并开源新图生视频模型,用户可通过图片生成5秒短片,模型已在腾讯云上线并提供API接口[6] - 腾讯元宝APP超越DeepSeek登顶苹果中国区免费APP下载排行榜,引发行业对"资源驱动"与"技术驱动"模式的讨论[6][7] - DeepSeek披露V3/R1推理系统理论日利润高达346万元人民币,理论成本利润率545%,但实际收入远低于理论值[8][9][10][11] - 阿里推出QwQ-32B大语言模型,仅具DeepSeek-R1 1/20参数量即可媲美后者性能[14] - 字节跳动发布国内首个AI原生IDE工具Trae,支持切换DeepSeek R1&V3模型[19] - 我国AI人才缺口达500万人,而人工智能专业在校生仅约4万人,清华大学拟扩招150名本科生重点培养AI人才[20][21] 海外AI动态 - OpenAI计划推出月费2万美元的博士水平AI Agent,并宣布GPT-4.5向所有Plus用户开放[22] - 亚马逊进军推理AI模型领域,或于6月推出Nova品牌下的新产品,AWS成立新团队专注于Agentic AI[25][26] - OpenAI拟将视频生成工具Sora整合进ChatGPT,并正在开发Sora Turbo升级版[26] - 软银洽谈融资160亿美元专门投资人工智能项目,此前已完成185亿美元借款[28] - 微软对OpenAI的130亿美元投资获得英国监管机构批准[28] - 富士康计划在墨西哥投资9亿美元建设全球最大AI服务器组装工厂,产品将使用英伟达GB200芯片[28] AI投融资概况 - 本周全球披露AI融资事件12个,总融资规模274.82亿元人民币,平均融资金额39.26亿元[33] - 融资阶段分布:早期7个、成长期2个、后期2个[34] - 国内融资集中在上海(4起)、北京(3起)、广东(2起),总额26.39亿元[35][37] - 海外融资总额248.43亿元,最大单笔为Anthropic完成的35亿美元E轮融资[40][41] 技术突破与产品创新 - 上海人工智能实验室发布全球首个人形机器人自主站立控制算法[20] - 全球首个人形机器人半程马拉松将于4月在北京亦庄举行[20] - 智谱发布业界首个能生成汉字的开源文生图模型CogView4,支持中英双语输入[14] - 亚马逊推出新型量子计算芯片Ocelot,可使量子纠错成本最高降低90%[30]
智谱发布首个支持生成汉字的开源文生图模型CogView4,性能达到SOTA
IPO早知道· 2025-03-04 23:02
智谱发布CogView4模型 - 智谱于3月4日发布「智谱2025开源年」首个模型CogView4,这是首个支持生成汉字的开源文生图模型,遵循Apache 2.0协议 [2] - CogView4在DPG-Bench基准测试中综合评分排名第一,在开源文生图模型中达到SOTA水平 [2][4] - 该模型具备复杂语义对齐和指令跟随能力,支持任意长度中英双语输入,可生成任意分辨率图像并具备较强文字生成能力 [2] CogView4技术优势 - 支持中英双语提示词输入,是首个能在画面中生成汉字的开源文生图模型,满足广告、短视频等领域创意需求 [7] - 采用GLM-4 encoder替换纯英文T5 encoder,通过中英双语图文对训练实现双语提示词输入能力 [7] - 支持输入任意长度提示词,可生成范围内任意分辨率图像,提升用户创作自由度和训练效率 [7] 模型发展规划 - 实现任意长度文本描述和任意分辨率图像的混合训练范式 [8] - 后续将增加ControlNet、ComfyUI等生态支持,全套微调工具包即将推出 [8] - CogView4-6B-0304版本将于3月13日上线智谱清言平台 [8] - 作为国内最早的开源大模型公司,智谱将继续开源基础模型、推理模型、多模态模型、Agent模型等 [8]