Seed1.6

搜索文档
AI应用货币化先锋:GPT5前瞻之多模态
民生证券· 2025-07-29 14:41
报告行业投资评级 - 推荐 维持评级 [4] 报告的核心观点 - 当前全球多模态AI正朝"多模态通才"转变,智能化水平与能力范围不断扩大,多模态AI应用或成AI大模型商业化变现前锋 [3][59] - 美图、快手等多模态AI产品体现出较强AI货币化能力,建议关注多模态AI相关标的以及受益于多模态AI发展的AI应用、AI算力等相关标的 [3][59] 根据相关目录分别进行总结 1 GPT5发布在即,有望挑战多模态AI新高度 1.1 多模态AI的新基准:"多模态通才" - 2025年5月,十所顶尖高校联合发布General - Level评估框架和General - Bench基准数据集,用五级分类制明确多模态通才模型能力标准 [9] - General - Level建立五个层级评价水平,当前全球多模态模型仍处于L4阶段,考察体系分四个方向:模态理解和同时进行多模态理解和生成、支持更广泛的模态、支持各种任务和范式、多模态智能体与多模态基础模型 [12] - L1 - L5评价分别要求:L1为专家型模型;L2为支持多任务的通才;L3为出现任务级协同的通才;L4为范式级协同的通才;L5为模态级全协同的通才,目前多数多模态通用智能体受架构限制,要达L5需实现所有模态间协同 [15][16] 1.2 科技巨头纷纷押注多模态AI - 腾讯混元3D世界模型是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,核心是语意层次化3D场景表征及生成算法,还披露一系列开源计划 [18] - 通义万相文生视频和图生视频模型是业界首个用MoE架构的视频生成模型,总参数量27B,激活参数14B,首创电影美学控制系统,2.2版本在多方面有显著提升,节省约50%计算资源消耗 [21] - 截至2025年3月31日,Figma全球有45万付费客户,总留存率96%,净美元留存率132%,年度付费超1万美元的付费客户达11107家,2025年有望推出Figma Make、Figma Draw、Figma Sites和Figma Buzz四款全新AI产品 [24][25][28] - 字节在Seed1.6模型系列探索Adaptive CoT技术,取得模型效果和推理性能平衡,Seed1.6 - Thinking在复杂文本场景推理能力和视觉推理能力提升 [26] 2 重点公司多模态AI业务梳理 2.1 美图:RoboNeo定义AIGC Agent新范式 - 美图推出RoboNeo,是集多种功能于一体的智能AI Agent,具备美学审美与落地执行力,可免费使用,覆盖品牌设计到电商物料输出全流程,支持一站式网页搭建 [29][31] 2.2 快手:可灵AI货币化进程亮眼 - 快手可灵2.0模型在多维度保持全球领先,发布全新交互理念Multi - modal Visual Language(MVL) [34] - 可灵在2025Q1实现1亿美元ARR,伴随AI功能上新和全球创作者计划,有望迎来付费用户增长和ARUP提升,加快AI货币化进度 [35] 2.3 万兴科技:天幕2.0+超媒Agent切入蓝海市场 - 万兴天幕2.0大模型在华为云加持下由千人团队打造,实现音视频垂类原子能力跃升,秉持"创意平权"理念,助力创作者生成音视频内容 [37] - 万兴超媒Agent依托天幕2.0打造,解决传统创作模式问题,具备全链路视频编辑能力、行业Know - How知识库沉淀、大模型与工具链深度耦合三大特点 [40] 2.4 合合信息:扫描全能王的能力范围加速扩展 - 合合信息"AI鉴伪"技术实现从静态图像到多模态信息鉴伪跨越,人脸鉴伪模型、AIGC图像鉴别技术、TextIn通用篡改检测平台有相应优势 [42] - 合合信息推出业内首个AI Agent跨平台云资源智能管理终端Chaterm,核心代码全面开源 [44] 2.5 福昕软件:智能文档解决方案加速落地 - 福昕提出"大模型+领域知识+工程方法"融合路径,构建"人工智能+政法"应用范式,智能文档技术让检察官聚焦核心价值环节 [48] - 福昕智能文档解决方案构建全链条能力,为检察机关提供数据治理能力,研发三大核心产品,与北京市人民检察院合作打造解决方案 [51] 2.6 其他多模态AI应用 - 北森AI面试官依靠人才评估与面试方法论沉淀和AI技术融合,有"专业评估逻辑 + 大模型能力"双重优势,岗位胜任力模型和AI技术与场景结合方面有特点 [53] - 粉笔AI面试点评是融合AI技术的智能化面试学习工具,提供沉浸式模拟训练、精准智能点评及个性化答题优化 [55] 3 投资建议 - 建议关注多模态AI相关标的:美图、快手、万兴科技、合合信息、福昕软件等;同时关注受益于多模态AI发展的AI应用、AI算力等相关标的 [3][59]
人类的考试,考验不了AI了
创业邦· 2025-07-21 11:34
AI技术发展现状 - 马斯克发布的Grok-4大模型在多项高难度考试中表现卓越,SAT和GRE接近满分,GPQA准确率88.9%,AIME25准确率100%,USAMO25准确率61.9% [8] - "人类最后的考试"(HLM)包含3000个高难度问题,覆盖100+学科,简答题占比80%,数学题占比42%,普通人类仅能答对5%,此前大模型最高得分不超过10% [10][12][15] - 上海交大联合深势科技团队使用DeepSeek-R1-0528模型在HLM考试中取得32.1%的准确率,创国内大模型新纪录 [17] 大模型在高考场景的表现 - 字节跳动Seed1.6模型在模拟山东高考中理科648分(全省4005名)、文科683分(全省211名),理科可冲击武汉大学,文科有把握冲击清北 [20] - 腾讯元宝(混元T1)在辽宁高考模拟测试中文科总分667.5分(全省第11名),理科632.5分,文科成绩达到清北录取线 [21][22] - DeepSeek-R1-0528模型高考模拟成绩615分(理科)和631分(文科),处于985/211院校录取区间 [20][22] 行业竞争格局 - 国际大模型Grok-4在HLM考试中领先国内DeepSeek模型近40个百分点,显示技术代际差距 [22] - 国内大模型呈现分层竞争:Seed1.6和混元T1处于第一梯队(清北水平),DeepSeek处于第二梯队(985水平),文心一言、通义千问等处于第三梯队 [21][22] 技术演进趋势 - AI在围棋领域的绝对优势已使人类失去对比兴趣,预计高考等考试将很快呈现AI的全面碾压 [23] - 未来评估重点可能转向AI间横向对比或实际应用价值创造,而非与人类能力对标 [24] - 数学能力成为大模型核心差异点,Grok-4在数学竞赛题(AIME25)实现100%准确率,国内模型数学单科最高分149分(腾讯混元T1) [8][21]