多模态
搜索文档
大模型六小龙底牌对决
第一财经· 2025-07-28 11:33
行业格局与竞争态势 - AI领域将存在多个玩家长期共存 不同公司价值观塑造模型差异化特点 开源模型影响力提升且逼近闭源模型性能 [1] - 2024年成为基座模型分水岭 市场玩家数量收缩至个位数 头部大厂与少数创业公司留存 幸存需具备AGI使命感/高人才密度/强融资能力 [2] - 国内大模型技术差异度不足 产品切换成本低导致竞争惨烈 兼容OpenAI API标准加剧同质化 [7] 企业动态与战略分化 - 智谱即将发布GLM-4.5多模态模型 同步推出C端陪伴型AI产品 软硬件均规划付费业务 推进A股+港股双上市 [4][8] - 月之暗面发布K2基座模型后 将推出同规模推理模型 技术重点转向智能体任务调度 港股上市面临仲裁风险 [5][8] - 阶跃星辰展示端到端语音大模型车载应用 成立"模芯生态创新联盟"联合国产芯片厂商 预估年营收10亿人民币 [5][8][15] - MiniMax侧重To C应用而非纯基础模型 同步筹备A+H股上市 百川智能转型医疗 零一万物聚焦B端产业落地 [8][11] 技术演进与AGI路径 - 大模型进入1.0模仿学习→2.0强化学习阶段 技术迭代导致部分公司掉队 [9] - AGI发展存在两大路径争议:单一超级智能系统 vs 多模型多代理架构 MainFunc指出专业模型+Agent组合是关键 [13] - 多模态成为AGI必由之路 智谱采用MoE结构 阶跃星辰发布Step-3多模态模型 强调基础研发与商业化分层融合 [15] 商业化与生态建设 - 创业公司差异化路径包括To C出海/To B服务/产业资源对接/多模态发展 头部企业启动上市筹备 [8] - 行业尚未建立稳固竞争壁垒 技术窗口期需转化为数据闭环护城河 阶跃星辰强调应用落地形成数据飞轮 [16] - 投资热点从基础模型转向具身智能 宇树机器人等硬件厂商关注度超越大模型展台 [5]
WAIC2025前沿聚焦(3):商汤日日新6.5重塑AI生产力
海通国际证券· 2025-07-28 07:33
行业投资评级 - 报告未明确提及对商汤科技或AI行业的投资评级 [1][2][3][4][5] 核心观点 - 商汤科技CEO徐立系统回顾AI技术发展的三大阶段:视觉AI爆发、自然语言处理、多模态和生成式AI时代 [1][2] - 当前AI发展核心命题是"智能从哪里来",从依赖人工标注数据转向多模态数据融合 [2][13] - 多模态思维链通过结合视觉感知与自然语言处理,显著提升AI推理能力和现实世界理解力 [2][13] 技术突破 - 日日新SenseNova 6.5模型实现"多模态长思维链"构造能力,80%通过自动化数据飞轮生成 [3][14] - 新模型预训练数据量增加20%,推理吞吐量提升35%,推理成本降至原先30%,综合性价比提升3倍以上 [3][14] - 模型能模拟人类复杂问题解决路径(如识别图中球员需多步骤分析),自动调用图像检测等外部工具 [3][14] 商业化创新 - 突破"工具陷阱":从生产力工具转向直接产出结果的生产力,用户为结果付费而非过程 [4][15] - "小浣熊"智能助手实现端到端复杂任务处理:解析混合Excel/PDF/视频截图,生成结构化PPT/文档 [4][15] - 行业专属版本覆盖金融、教育等领域,定位为可独立完成任务的"数字员工" [1][12] 战略布局 - 推出"悟能"具身智能平台,整合视觉感知、导航和智能交互能力赋能机器人产业 [5][16] - 平台特点:端侧芯片实时识别复杂场景,适配自动驾驶技术实现机器人精准导航 [5][16] - 推动机器人从"交互工具"升级为"交互伙伴",具备任务理解、内容生成和幽默互动能力 [5][16]
晚报 | 7月28日主题前瞻
选股宝· 2025-07-27 22:45
无人驾驶 - 上汽智己汽车和上汽友道智途获颁上海市新一批智能网联汽车示范运营牌照,上汽集团成为行业唯一一家获得乘用车和商用车领域"双牌照"的企业[1] - 新牌照落地将推动L4级自动驾驶技术大规模商业化应用,国内中高阶智驾渗透率2025年有望翻倍,带动350亿增量市场[1] - 智能化路侧基础设施主要包括路侧通信单元、路侧计算单元、路侧感知设备等,车路云一体化智能网联汽车产业聚焦四大领域[1] 多模态 - OpenAI计划8月推出GPT-5,包含O3推理能力并整合多模态技术,可能引入视频等新输入形式[2] - GPT-5将提升自然语言处理精度与效率,推动国内厂商如百度文心、阿里通义加速技术迭代[2] 农产品 - 十部门联合印发《促进农产品消费实施方案》,提出"百名主播+千个乡村+万种产品"公益助农促销等活动[3] - 预计2030年农产品消费市场规模突破8.5万亿元,深加工产品占比达38%,冷链物流损耗率降至8%以内[3] 锰 - 内蒙古、宁夏、山西锰系铁合金企业达成共识:高、中、低、微碳锰铁节能减排30%,硅锰合金节能减排40%[4] - 加纳锰矿5-7月发运分别减少47%、58%、43%,雨季影响将持续到11月,锰硅主力合约大涨[4] 光学器 - 加州大学伯克利分校团队开发光学张量处理器HITOP,运算速度达每秒数万亿次,吞吐量0.98TOPS[5] - HITOP单位操作能耗比传统电子计算降低超100倍,解决光学计算系统可扩展性问题[5] 宏观行业 - 财政部数据显示2025年上半年证券交易印花税785亿元,增长54.1%[8] - 中国农药工业协会开展"正风治卷"三年行动,抵制低价无序竞争[8] 主题复盘 - 国产芯片板块涉及海立股份、阿石创等公司,清华团队开发出理想EUV光刻胶材料[11] - 东数西算/算力板块包括直真科技、延华智能等公司,人工智能大模型涉及新华传媒、汉王科技[11][12] - 雅江电站概念股因雅鲁藏布江下游水电工程开工(总投资1.2万亿)受关注,涉及西藏天路、西宁特钢等[12]
中信智库报告:AI大模型呈现推理深化、智能体爆发格局
新华财经· 2025-07-27 22:18
AI大模型发展趋势 - AI大模型向更强、更高效、更可靠方向发展,呈现推理模型深化、智能体模型爆发的格局 [1] - 2025年是AI应用加速落地之年,本轮AI渗透较互联网时代大幅提速,B端落地进程或超预期 [1] - AI Agent将成为2025年AI发展的重要方向,具备数据优势、生态体系构建的企业更具发展潜力 [1] 多模态商业化进展 - 中国互联网企业在多媒体领域具有全球影响力,游戏、电影、短剧、短视频等领域是多模态落地的第一阶段 [1] - 随后在自动化装备、机器人、自动驾驶等产业也将快速渗透 [1] - 多模态商业化进展很快,B端应用落地进程或将远超预期 [1] 具身智能与人形机器人 - 具身智能大模型目前存在数据集不够、思考跟不上运动、缺乏生态等痛点,但未来将通过合成数据使用、模型迭代解决 [2] - 大模型快速迭代和供应链降本将加速人形机器人商业化落地 [2] - 人形机器人市场规模预计远超汽车、3C行业,带动丝杠、减速器、传感器、电机等相关产业链需求 [2] AI算力需求 - 推理需求将带动算力需求爆发,国内算力自主可控趋势凸显 [1] - AI算力消耗开始从训练走向推理,将带来显著的算力增量 [2]
具身智能迎来实力派!十年多模态打底,世界模型开路,商汤「悟能」来了
量子位· 2025-07-27 19:57
商汤科技具身智能平台发布 - 公司在WAIC 2025论坛正式发布「悟能」具身智能平台 标志着其入局具身智能领域[1][2] - 该平台是公司从感知视觉、多模态走向物理世界交互的必然结果 依托超过十年的行业落地经验积累[13] - 平台架构包含感知、决策与行动等多个层次 支持自动驾驶、机器人等具身场景的功能实现[27] 日日新V6.5多模态模型 - 新模型独创图文交错思维链 使图像以本体形式参与推理 跨模态精度显著提升[4][6] - 在MathVista等数据集上超越Gemini 2.5 Pro 如MathVista得分83.1 vs Gemini的80.9[8][9] - 相比6.0版本性能提升6.99% 推理成本降至30% 性价比提升5倍[10] 开悟世界模型技术特点 - 包含10万3D资产 支持多视角视频生成 最多11个摄像头角度并保持150秒时空一致性[16] - 支持参数化编辑 可一键变换天气、光照等环境要素[20] - 同时处理人、物、场信息 构建4D真实世界 融合第一与第三视角[21][23][25] 具身智能商业化路径 - 采取"软硬协同"路线 已与人形机器人、物流搬运等厂商达成合作预装模型[29] - 通过硬件销售积累视觉、语音和操作数据 形成正向数据飞轮[30] - 验证"通用大脑+场景闭环"双轮路径 多模态大模型与垂直应用相互促进[39] 行业痛点解决方案 - 通过虚拟环境合成99%数据 配合1%真机样本解决数据稀缺问题[32][33] - 同步生成并标定第一和第三视角数据 确保时空一致性 缩短仿真与现实落差[35] - 感知层多传感输入 决策层LLM+世界模型协同 行动层端到端控制形成闭环[34]
自动保存草稿 - 2025-07-27 13:54:52
36氪· 2025-07-27 13:59
腾讯AI战略升级 - 公司在世界人工智能大会(WAIC)上重点展示AI智能体技术 构建覆盖14亿用户的"数字好友"生态 [1] - 发布"AI全家桶"产品组合 包括自研大模型和智能体等多款新品 [1] - 技术路线从短期记忆演进到长期记忆 探索多智能体协同技术 [1] 技术路线演进 - 从2023年聚焦"行业大模型"转向多模态和具身智能方向 [2][3] - 发布国内首个模块化具身智能开放平台Tairos 面向机器人行业开放 [3][4] - 混元3D世界模型1.0实现文字/图片输入生成可漫游3D场景 大幅缩短建模时间 [5][8] 产品布局 - To B侧: 发布混元世界模型1.0 应用于VR/游戏开发等场景 计划开源多个小体量模型 [5][7] - To C侧: 推出10+生活场景智能体 如旅游规划Agent实现一站式服务 [7][12] - 平台层面: 发布智能体开发平台等5大平台 降低AI应用门槛 [7][13] 技术突破 - 3D资产生成效率提升 从数周缩短至几分钟 但数据量仅千万级 与图片数据存在数量级差距 [9] - 混元3D系列模型社区下载量超230万 成为全球最受欢迎3D开源模型 [10] - 多模态理解模型混元-large-vision在LMArena Vision榜单国内第一 [10] 商业化落地 - 将AI能力嵌入QQ浏览器/QQ音乐等应用 覆盖搜索/创作/娱乐等场景 [12] - 通过智能体开发平台降低企业应用门槛 解决行业大模型落地难题 [13] - 智能体与行业大模型协同 前者解决前端场景问题 后者沉淀行业Know-how [13]
直击WAIC2025 | 首日探馆:大模型丰产下的共舞时代 具身智能与AI终端齐飞
每日经济新闻· 2025-07-27 07:36
人工智能全球治理高级别会议 - 2025世界人工智能大会暨人工智能全球治理高级别会议在上海开幕 [1] - 大会探讨AI能否真正嵌入产业与社会并创造可验证的真实价值 [2] - 现场展示智能机器人在调酒、叠衣服、打鼓、写字、煮串等实际应用场景 [2] 大模型技术发展 - 大模型技术迈向推理时代,需满足强智能、低成本、可开源和多模态特征 [7] - 阶跃星辰Step 3大模型在国产芯片上推理效率最高可达DeepSeek-R1的300% [7] - 多模态矩阵已覆盖语音、视觉理解、图像编辑、图像和视频生成、音乐等领域 [7] - 大模型落地需要模型、芯片、平台到应用的全产业链协同创新 [9] - 星环科技转型为AI Infra供应商,提供AI就绪数据平台解决数据孤岛问题 [9] 行业应用落地 - 垂类大模型通过场景共创与数据耦合重塑产业效率曲线与创新范式 [9] - 金融领域投研应用可理解业务语言、掌握领域知识并保证内容输出准确性 [10] - 企业AI部署仍以单点场景应用为主,受限于数据治理前期投入 [10] 具身智能与人形机器人 - 宇树科技G1人形机器人展示仿生科技的敏捷性,完成拳击比赛 [11] - 智元机器人启元通用具身大模型获大会最高奖项SAIL奖 [14] - 灵犀X2人形机器人展示本体+运动/交互/作业智能的超预期表现 [14] AI终端设备 - AI眼镜实现实时翻译、内容检索、AI照相、演讲提词等功能 [18] - 端侧大模型技术驱动智能手机、智能眼镜、个人电脑等设备智能化 [16] - AI终端面临能耗与算力瓶颈、功能与需求偏差、生态碎片化等挑战 [19]
实探|今日看点,上海这场会AI含量拉满、机器人成分爆表!
证券时报· 2025-07-26 23:42
2025世界人工智能大会展示亮点 - 网易有道推出全球首个虚拟人口语私教,具备实时互动和个性化答疑功能,可生成专属回答案例 [1] - 网易有道发布AI答疑笔SpaceOne,采用多模态视觉技术突破题库限制,能解析图形题和实验现象等复杂内容 [1] - 无问芯穹发布全规模AI效能跃升方案,包括三大操作系统级产品:无穹AI云、无界智算平台和无垠终端智能解决方案 [2] - 无问芯穹联合创始人提出AI算力建设需要适应小而广泛的应用企业,满足敏捷生产需求 [2] - 中昊芯英展示自研"刹那"TPU芯片和"泰则"服务器,芯片能耗仅为传统GPU的70%,单位算力成本为海外领先GPU的50% [2] AI技术发展趋势 - 浪潮集团强调AI发展进入"经济可行性"周期,提出企业需要复合AI能力(判别式+生成式AI) [3] - 数据治理成为AI落地关键,高质量数据决定应用上限,行业竞争进入数据战阶段 [3] - AI与企业应用间存在工具链断层,需构建数智底座支撑 [3] - 企业软件优化迎来智能体时刻,安全可信是AI落地基础 [3] 行业应用场景 - 展会展示机器人广泛应用于零售、制造、维修等劳动场景 [1] - 无问芯穹生态企业展示AI视频创意、语音建模、角色互动、人像美化等多样化应用 [2] - 人工智能正快速融入具身智能、多模态、智能体、APP和科研等领域 [3]
这家国产大模型公司年收入破10 亿了?
虎嗅· 2025-07-26 21:56
WAIC大会与行业动态 - WAIC世界人工智能大会在上海举办,规格高且产业界和投资圈高度关注[2] - 参展商数量众多,社群群友超200人参会[3] - 大会前后多家AI公司发布重要消息[4] 阶跃星辰商业化表现 - 公司预计2025年全年收入近10亿人民币,商业化半年增长迅猛[5][7] - 合作领域覆盖手机厂商、新能源汽车厂商、金融、通信等多个场景[5] - 对比同行,智谱去年收入2-3亿,Minimax曾创造千万美金收入但近期不确定[9][10] - 上一代AI公司需3-4年突破10亿收入,阶跃仅用2年实现[11] 公司技术优势 - 定位"开源世界最强多模态推理模型",主力模型Step 3参数量达321B并取得SOTA成绩[24] - Step系列模型覆盖文字、语音、图像、视频、3D、音乐等多模态能力[25] - 在国产芯片上推理效率达DeepSeek-R1的300%,并成立"模芯生态创新联盟"优化国产芯片适配[34][35] - 联合华为昇腾、沐曦等近10家芯片厂商推动国产AI生态[35][37] 商业化落地场景 - 多模态调用量环比增长超800%,终端应用覆盖汽车、手机、具身智能等领域[48] - 合作案例包括吉利银河M9的AI语音、Top10手机厂商旗舰机型、人形机器人等[42][43][44] - 提出"强智能、低成本、可开源、多模态"四大商业化特征[30] 行业趋势展望 - 多模态能力正成为终端标配,推动"万物智能"发展[48][49] - 国产大模型与芯片的协同优化提升性价比,形成生态闭环[38][39] - 10亿营收或成行业新门槛,预示国产大模型商业化能力初步验证[12][52]
这家国产大模型公司年收入破10 亿了??
佩妮Penny的世界· 2025-07-26 20:42
WAIC世界人工智能大会概况 - 2024年WAIC世界人工智能大会在上海举办,规格高且产业界和投资圈高度关注,总理出席开幕式并致辞 [1] - 参展商数量庞大,社群群友有200多人参会 [1] - 大会期间多家AI公司发布重要消息 [2] 阶跃星辰商业化表现 - 国产大模型公司阶跃星辰预计2025年全年收入近10亿元,商业化半年增长迅猛 [3] - 公司成立仅两年,去年收入仅几千万元,增速显著 [5] - 与手机厂商、新能源汽车厂商在AI助手方面合作,覆盖金融、通信等多个场景 [3] - 对比同行:智谱去年收入2-3亿元,Minimax海外应用曾创千万美金收入但24年末下架,Kimi和Deepseek不以2B服务为重 [7] - 上一代AI公司需3-4年才能突破10亿元收入,阶跃增速远超行业平均水平 [7] 公司技术实力与战略 - 阶跃星辰定位为"多模态卷王",专注于基础模型研究而非应用出海 [6][9] - 创始人姜大昕提出"通往AGI的路径方向"战略图,涵盖多模理解、生成、具身智能等方向 [10] - 最新基座模型Step 3总参数量321B,在多个榜单取得SOTA成绩 [11] - Step系列模型涵盖文字、语音、图像、视频生成、3D、音乐等多模态能力,覆盖场景广泛 [11] - 在国产芯片上推理效率最高可达DeepSeek-R1的300%,并对各类芯片友好 [15] - 联合近10家芯片厂商成立"模芯生态创新联盟",包括华为昇腾、沐曦等 [15] 商业化成功因素 - 团队重视真实应用场景需求,提出"强智能、低成本、可开源、多模态"四大特征 [13][15] - 针对中端和国产芯片进行系统优化,提升性价比 [15] - 客户覆盖汽车、手机、具身智能、零售、IoT等领域 [20][21] - 智能终端多模态模型调用次数和调用量较去年下半年环比增长均超800% [23] - 具体合作案例:吉利银河M9搭载AI语音大模型,国内Top10手机厂商过半接入 [20][21] 行业趋势与前景 - 国产大模型商业化能力初步验证,10亿元营收或成行业新门槛 [7] - 多模态能力逐渐成为终端标配,"万物智能"趋势显现 [23] - 国产大模型与芯片厂商相互优化,提升国产芯片性价比 [17][18] - 行业对比:国产大模型水平已接近国外,但国产芯片仍有差距 [17]