Workflow
多模态大模型
icon
搜索文档
从Figma到中国垂类应用全球崛起
格隆汇APP· 2025-08-01 13:27
美股科技股年内最大IPO之一:Figma - Figma成立于2012年,以22亿美元的前端设计软件市场为起点,目标扩展至330亿美元的全流程产品开发生态 [2] - 核心产品Figma平台凭借轻量化、社区繁殖和协同办公三大优势在全球设计工具市场占据重要地位 [2] - 借助AI编程能力,Figma切入程序员协同办公场景,未来有望向"无人开发"方向拓展 [4] 全球AI应用发展的奇点将至 - 多模态大型语言模型(MLLM)的诞生解决了单模态局限,成为场景扩张的关键 [5][6] - 多模态应用的变现能力显著优于纯文本产品,如Midjourney年收入5亿美元,Runway付费用户超百万,付费转化率比纯文本Chatbot高2-3倍 [7] 中国视频生成:全球化商业化的突围样本 - 国内厂商在视频生成领域实现全球化突破,美图、快手、睿琪软件年化收入超1亿美元 [8] - 美图AI设计工具在东南亚电商渗透率达25%,快手可灵视频生成工具上线10个月ARR破1亿美元 [8] - 多模态能力在短视频、电商、内容创作等高频场景中成为打开付费意愿的关键 [8] 投资逻辑:中美共振下的价值重构 - 海外用户AI付费意愿显著高于国内,如可灵海外订阅转化率8.7%,是国内的3倍,美图海外ARPU较国内高40% [9] - Figma通过覆盖全流程构建生态优势,国内企业需在垂直领域建立"AI+行业know-how"双重壁垒,如美图AI功能将商拍成本降低60% [10] - 中国政府发布《数字中国建设2025年行动方案》,支持AI应用发展,同时整治技术滥用 [10] 结语:从工具革命到产业重构 - Figma的崛起与多模态大模型的爆发代表生产力工具的范式迁移,需要底层架构创新与垂直场景深度解构 [12] - 中美AI商业化共振下,能将技术优势转化为全球市场份额的公司将创造新的商业传奇 [12]
邝子平对话印奇:商业模式闭环才能持续推动技术进步,AI时代硬件机会巨大
IPO早知道· 2025-08-01 12:12
论坛背景 - 启明创投连续第三年主办世界人工智能大会分论坛,聚焦AI技术与应用共振周期[2] - 论坛邀请重磅嘉宾分享创新、创业和创投主题,旨在为AI产业提供有价值信息[2] - 启明创投是中国AI领域最早布局的投资机构之一,与旷视科技有12-13年投资渊源[3] AI终端发展趋势 - 未来3年将是AI+终端关键发展期,汽车和手机成为最核心的终端载体[6] - 中国智能驾驶进入第十年,未来3年将迎来自动驾驶格局的本质性变化[6] - 手机与AI结合存在巨大探索空间,可能出现杀手级应用或软硬结合创新[7] - 新的人机交互场景如智能座舱可能在未来5年超越智驾成为讨论焦点[7] AI模型技术演进 - 模型是驱动AI产业演进的最重要底层力量[10] - 学习范式演进分为三个阶段:模仿学习→强化学习→自主学习,18-24个月完成一次迭代[12] - 信息处理形态沿语言→多模态→世界模型纵向发展[13] - 强化学习将成为未来6-9个月的技术重点,多模态模型将实现理解生成一体化[14] - 中美模型技术差距约6个月,但算力投入差距正在扩大[15] 商业模式思考 - 商业闭环是AI企业可持续发展的关键要素,不能闭环的商业模式无法推动技术进步[18] - 基础大模型公司需验证商业模式能否支撑每年20-30亿人民币的算力投入[19] - C端产品可通过快速验证假设建立商业飞轮,而基础模型需要更大投入和更长回报周期[18] 硬件领域机会 - 硬件领域存在巨大机会,特别是汽车和手机终端[20] - AI终端未来将实现服务、操作系统与硬件的一体化,硬件形态将服务化[22] - 华为和小米生态展示"人车家"布局,手机仍是核心但穿戴设备等子品类有发展空间[25] - 智能家居可能成为具身AI的核心场景,但需要5年以上发展周期[25] - 年出货量100-500万台的垂直硬件领域存在优质创业机会[26]
三天,我看清楚了未来AI将如何介入我们的生活
36氪· 2025-08-01 07:23
大会概况 - 2025年世界人工智能大会(WAIC)在上海举办 为期3天 吸引70多个国家和地区1500多位专家及800多家企业参与 展览面积首次突破7万平方米 参观人数预计达35万[1] - 海外厂商参与度较低 除谷歌和特斯拉外缺乏国际巨头 同时由于与世界机器人大赛(WRC)时间冲突 部分厂商选择保留重磅新品[1] 生成式AI应用拓展 - 生成式AI渗透至工业 医疗 交通等硬核领域 从文本 图像生成向多模态任务执行演进[3][4] - 阶跃星辰发布3210亿参数MoE架构模型Step 3 激活参数38亿 实现多模态推理并在国产芯片上提升解码效率[4] - MiniMax推出全栈智能体MiniMax Agent 可分解任务并调用API 演示中单句指令生成数据看板或搭建电商网站 一个月内迭代12次[4] - 合合信息展示AI鉴伪技术 毫秒级识别深度伪造 适用于金融票据篡改等高危场景[5] - 百度推出GenFlow 2.0多智能体调度系统及秒哒平台 3分钟生成可运行应用 数字人Nova升级版提升直播场景拟真度[5] - 声网发布对话式AI引擎 新增声纹识别与视觉理解能力 互动宠物"芙崽"实现嘈杂环境语音响应及拟人化反馈[7] - 阿里云发布云端AI Agents平台无影AgentBay 支持多系统无缝切换 三行代码接入 同时展示从芯片到平台的全栈能力[8] 算力基础设施升级 - 国产GPU厂商集中展示芯片架构与智算方案 竞争焦点从单卡性能转向全链路效率与成本优化[9][14] - 华为昇腾AI云服务采用CloudMatrix 384超节点 整合384颗NPU与192颗CPU 算力达300 PFlops 突破跨机通信瓶颈[9][11] - 沐曦科技发布曦云C600 GPU 支持多精度混合算力 内置安全模块瞄准金融政务场景[11] - 摩尔线程推出全功能GPU产品线 覆盖云端训练卡MTT S4000(48GB显存/768GB/s带宽) 云渲染卡及消费级显卡[12] - 燧原科技展示燧原S60推理卡商业化应用 覆盖聊天机器人 广告投放等场景 并公布多地智算中心部署案例[14] 具身智能突破 - 机器人运动控制与交互能力显著提升 从基础行走扩展到复杂任务执行与情绪表达[3][15][21] - 千寻智能人形机器人Moz1搭载Spirit v1 VLA模型 完成太空步 S型压弯等高难度动作 并演示饮料递送 衣物折叠等泛化任务[15] - 傅利叶智能交互陪伴机器人GR-3结合康养场景 提供导诊 认知康复等多维服务 外骨骼设备实现远程康复协同[16] - 智元机器人灵犀X2-N实现双足与轮式模式切换 在开幕式中完成灯光表演[18] - 优艾智合工业模型MAIC实现多机器人协同调度 完成搬运 拣选等流水线作业[18] - 宇树科技人形机器人G1(29关节/35公斤)展示格斗动作及击倒快速起身 工业四足机器人B2负重120公斤 消费级Go2售价低于1万元[18][20] - 云深处科技四足机器人绝影X30在电力巡检场景实现1000小时无故障运行 支持自主充电及AR手势操控[20] 自动驾驶商业化推进 - Robotaxi开展城市道路体验活动 覆盖浦东30公里路网 延伸至机场与迪士尼区间 实现L4级跨区域接驳[22][24] - 小马智行Robotaxi覆盖北上广深 集成大模型优化乘客交互 支持语音添加临时需求如顺路购咖啡[24] - 斑马智行基于高通8295平台推出端侧智能座舱 支持离线90%功能闭环 并根据驾驶员情绪推荐内容[24] - 蘑菇车联推出城市级交通模型MogoMind 聚合多源数据实现智能调度与拥堵预测[25] - 上海发布自动驾驶行动方案 目标2027年L4载客600万人次 载货80万TEU 开放道路超5000公里[27]
中国工程院发布“人工智能新兴技术备选清单” 提出近300项热点
新华社· 2025-07-31 20:34
技术类别与分布 - 清单围绕三个类别提出近300项技术[1] - 信息工程科技领域技术创新包含163项技术 包括6G技术 多模态大模型 超级通用智能体等[1] - 传统产业改造升级和学科交叉融合包含122项技术 包括计算神经科学 智能可穿戴设备 AI辅助药物设计等[1] - 民生相关AI热点技术包含12项 包括大模型技术 具身智能 智能无人系统等[1] 研究背景与价值 - 清单由中国工程院信息与电子工程学部与中国信息与电子工程科技发展战略研究中心联合发布[1] - 研究时间跨度覆盖未来5至10年[1] - 汇集数十名院士和数百名专家的智慧成果[1] - 旨在为人工智能发展顶层设计和战略谋划提供参考依据[1]
商汤-W(00020.HK)完成配售新B类股份
格隆汇· 2025-07-31 19:54
交易完成情况 - 认购协议和配售协议的所有条件均已达成并于2025年7月31日完成 [1] - 以每股1.50港元认购1,666,667,000股认购股份 [1] - 认购股份相当于完成前已发行B类股份约4.58%及总股份约4.50% [1] - 经扩大后相当于B类股份约4.38%及总股份约4.31% [1] 资金用途规划 - 认购事项获得净额约24.98亿港元 [2] - 资金主要用于发展AI云和扩大人工智能基础设施商汤大装置 [2] - 支持生成式AI研发及多模态大模型衍生产品开发落地 [2] - 重点推进智能硬件等垂直场景商业化应用 [2] - 探索人工智能在具身智能机器人、区块链、RWA、数字资产等创新领域 [2] - 扩展人工智能大模型在数字金融风控及结算应用 [2] - 部分资金用作一般营运资金 [2]
人形机器人从舞台“动起来”向工厂“用起来” 提“智”向“新”点燃智能经济新引擎
央视网· 2025-07-30 14:36
行业定义与特点 - 保姆机器人是一种具备自主性与具身性的智能系统 可执行护理辅助 健康监测和社交陪伴等任务 [9] - 技术发展将推动保姆机器人进化出多源感知 自主决策 人机协同和自进化等显著特点 [10] 市场驱动因素 - 中国60岁及以上老年人口达3.1亿 占总人口22% 预计2035年突破4亿 占比超30% [12] - 人口老龄化加速使居家照护和生活辅助刚性需求持续增长 [14] - 人工智能终端产品层出不穷 包括AI手机 AI电脑和AI眼镜等 [31] 应用场景 - 主要覆盖智慧康养 智能家居 家庭教育和社区管家四大垂类赛道 [5] - 人形机器人应用扩展至工业制造 物流运输 零售 娱乐产业及教育领域 [29] - 具体应用包括街头交通协管 生产线作业和饮料供应等服务 [29] 成本与普及预期 - 保姆机器人成本将以每年15%-20%幅度降低 [15] - 预计5年内普通家庭花费5万元可购买基本功能机型 [18] - 使用5年成本仅为住家保姆成本的七分之一 [18] 技术发展现状 - 人形机器人实现站得住 走得稳 跑得快 从实验室迈向规模化量产 [21] - 宇树科技G1格斗机器人可流畅完成拳击动作 [24] - 百度推出具备决策能力的"数字人" 其虚拟主播带货表现优于真人 [24] 产业规模预测 - 中国机器人产业规模在"十五五"时期将增长至4000亿元左右 [21] - 智能经济有望推动全球GDP年增长率提高一个百分点 [31] 创新成果展示 - 2025世界人工智能大会展示3000余项前沿展品及100余款首发新品 [22] - 上海人工智能实验室发布十项"AI+科学"成果 覆盖量子计算 生命科学和材料科学等领域 [27]
AI驱动下,通信云行业的全球化变革
艾瑞咨询· 2025-07-30 09:18
行业投资评级 - 全球互联网通信云市场规模2024年约68亿美元 预计未来2-3年将迎来新一轮增长 [3] - AI在云通信市场的渗透率约15% 中国5G+AI渗透率达5.6% [16] - 未来3-5年厂商将围绕"多模态大模型×场景化服务"构建竞争壁垒 [5] 核心观点 技术演进方向 - 开发者需求向安全合规(82%国家已建立数据隐私法规)、智能(生成式AI应用占比54%)、开放(跨平台兼容)三大方向收束 [4][6][31] - 量子加密(QKD)、区块链存证等新技术提升跨境数据传输安全性 [39][43][45] - 通信云与AI协同进化 从辅助工具向沉浸式人机交互进阶 短期聚焦低准确性/低实时性场景 [51][52] 市场竞争格局 - 中国市场IM PaaS TOP3市占率90% 融云在TOP1000 APP中份额达56% [64][65] - RTC PaaS市场集中度CR3约70% 头部厂商转向差异化服务竞争 [66][67] - 典型企业技术路线: - 融云:安全合规底座+50+大模型API开放 [70][80] - Sendbird:全渠道AI Agent客服平台 [75] - 声网:VAD技术实现650ms超低延迟硬件交互 [85] 分章节要点 AI时代基础设施 - 通信云从传输管道升级为AI交互中枢 需满足多模态(文本/音频/视频融合)、高可靠、低时延需求 [10][11] - 2024年增速放缓至4% 主因AI场景成熟度不足及宏观经济影响 [15] - 中国市场进入存量竞争 开发者需求聚焦通信稳定(56%厂商设备支持量)、数据价值挖掘、跨平台开发效率 [20][22] 技术演进 安全升级 - 欧美通过GDPR等立法强化数据本地化 中东/东南亚加速本地化法规建设 [31][32] - 政企办公场景需硬件加密+传输协议+权限管理全链路可控 [34][36] 智能升级 - 全球TOP50 GenAI应用中聊天/角色扮演类占36% 通信云厂商通过开放第三方模型接入满足需求 [46][48] - 技术落地路径:IM场景侧重上下文数据分析 RTC场景需平衡ASR/LLM/TTS时延 [49] 开放升级 - 产品开放体现为API接口标准化 生态开放包括Flutter/uni-app等跨平台框架支持 [54][56] - 社交/游戏/教育等场景存在支付集成、内容审核、AI模型自定义等复合需求 [55] 竞争格局 - 产业链上游依赖IT基础设施厂商 下游连接ISV/SI及终端用户 [60] - 融云案例: - 安全方案:量子加密通信+中东本地化部署(JACO直播) [71] - 开放架构:支持Dify/扣子等AI平台+MCP接口标准化 [88][89] 发展趋势 - 技术层面:轻量级模型推动端侧落地 业务数据融合催生AI Agent类应用 [93][94] - 商业层面: - 智能眼镜/玩具等穿戴设备市场CAGR超10% 成新增长点 [96] - 多模态交互需求推动通信云向"神经中枢"升级 [95]
VLA上限更高,为何博世坚持“一段式端到端”,力赞特斯拉?
观察者网· 2025-07-28 17:35
技术路径分析 - 智能辅助驾驶两大主流技术路径为世界模型和一段式端到端模型 [3] - 世界模型是一种融合视觉、语言和操作决策的多模态大模型,具备强大的场景推理和语言理解能力,理论上能适应复杂交通环境并理解如“潮汐车道”等指示牌 [3] - 一段式端到端模型将所有功能整合为一个神经网络,直接从传感器数据输出行驶轨迹或控制命令,架构更为简洁 [3] - 世界模型短期内难以落地,主要挑战包括多模态特征对齐困难、多模态数据获取训练困难,以及当前智能辅助驾驶芯片无法支持部署7B或10B规模的大模型 [4][6] - 当前所有智能辅助驾驶芯片均非为大模型设计,存储带宽较小,无法满足实时控车所需的高响应速度,预计需3至5年后芯片才能支持世界模型部署 [6] 公司战略与竞争格局 - 博世坚定选择一段式端到端技术路径,并与文远知行合作开发相关系统 [6][12] - 合作开发的一段式端到端智能辅助驾驶系统基于英伟达Orin-Y芯片,算力为200TOPS,计划于今年8月底在奇瑞高端车型上批量生产 [12] - 特斯拉的一段式端到端方案在算法水平、数据量和算力上均领先于所有智能辅助驾驶方案 [9] - 华为的ADS智能辅助驾驶在技术水平上与特斯拉并驾齐驱,但在数据或算力上存在一定差距 [9] 行业未来展望 - 智能辅助驾驶未来将像安全带、安全气囊一样成为车辆标配,无法形成主机厂卖车的差异化竞争优势 [12] - 在国家强法规监管下,主机厂可能在四五年后放弃全栈自研智能辅助驾驶 [12] - 主机厂未来的差异化竞争亮点将聚焦于智能座舱,旨在打破当前高度同质化的被动式交互现状 [12][14] - 未来技术演进方向为“舱驾一体”,整车将从几百个控制器整合为几十个,最终形成一个中央大脑,座舱算力可能达到1000TOPS或2000TOPS [14] 公司市场表现与定位 - 博世智能出行集团是博世集团在华最大业务板块,2024年在华销售额增长4%,达到1166亿元人民币 [14] - 博世在中国获得的未来五年新业务中,有65%与智能化及电气化解决方案相关 [14] - 博世高层表态“过去中国需要博世,现在博世需要中国”,凸显中国市场对公司的重要性 [1][14]
2025年AI驱动下通信云行业的全球化变革
艾瑞咨询· 2025-07-28 17:04
市场规模与增长 - 2024年全球互联网通信云市场规模约68亿美元,未来2-3年将迎来新一轮增长 [1] - AI在云通信市场的渗透率仅约15%,未来3-5年有望回暖,主要驱动因素包括AI陪伴、AI助理等新场景拓展 [7] - 市场需求放缓主因包括大模型AIGC落地场景观望期及宏观经济下行,中东、拉美等新兴市场增长较快但规模较小 [7] 技术焦点 - 开发者需求向安全、智能、开放收束:数据主权和隐私保护成为出海刚需,需明确数据所有权归属并加密敏感数据 [2] - 通信云向AI交互中枢进化,开放第三方大模型接口、提供低代码智能体创建工具成为基础套件 [2] - 跨平台开发兼容与AI能力开放整合是厂商主要竞争力之一 [3] 发展趋势 - GenAI推动文本、语音、视频融合交互,未来3-5年厂商将围绕"多模态大模型×场景化服务"构建壁垒 [3] - 通信云从基础管道升级为沉浸式AI交互基础设施,满足可靠性、实时性和多模态需求 [4] - 短期优先落地低准确性、低实时性场景,长期将深入游戏、教育、办公等高价值领域 [26] 国内市场特征 - 中国进入存量竞争阶段,企业通过精细化运营提升竞争力,聚焦通信稳定性、数据支撑业务和跨平台开发效率 [11] - IM PaaS市场TOP3占比90%,RTC PaaS市场TOP3占比70%,融云在第三方厂商中份额达56% [36] - AI原生应用尚未出现爆款,当前以"模型即应用"为主流 [11] 国际市场特征 - 欧美市场重视数据隐私与合规性,新兴市场聚焦本土化适配与场景创新 [14] - 社交娱乐领域,欧美偏好AI虚拟恋人等新玩法,新兴市场需适配本地语言和操作系统 [14] - 全球82%国家和地区已建立或正在制定数据隐私法规,欧美或出台更严苛跨境数据流动限制 [17] 安全升级 - 各国对自主可控通信平台需求提升,政企办公场景需硬件加密、传输协议全流程闭环 [19] - 运用QKD、MAF和BC技术提升数据传输链路安全性是未来趋势 [22] - 欧美通过立法强化数据本地化,中东偏好数据加密与高性能服务,拉美非洲跟进性价比方案 [17] 智能升级 - 通信云厂商聚焦核心通信能力建设,开放接入第三方AI模型,IM PaaS侧重个性化交互,RTC PaaS需平衡生成质量与时间 [24] - 由辅助工具向沉浸式人机交互进阶,短期优先突破低准确性、低实时性场景 [26] 开放升级 - 产品开放通过API接口实现功能定制,生态开放构建开发者社区支持技术交流与孵化 [29] - 跨平台兼容性成为开发者选型重要考量因素,未来将加强多设备和系统支持 [29] 产业链与竞争格局 - 头部厂商通过封装全栈大模型能力优化交互体验,主权明晰、防篡改服务成为出海竞争力关键 [36] - 厂商加速大模型、安全技术融合与属地化生态合作,适配本地合规要求 [33] 技术趋势 - AI向多模态、云端协同发展,通信云厂商将强化上下文数据分析,打造千人千面交互体验 [40] - 业务数据融合助力AI应用从辅助工具迈向具备自主决策能力的AI Agent [40] 商业趋势 - 多模态大模型+穿戴式硬件是未来3-5年主要发力场景,社交娱乐领域加速涌现AI复合型玩法 [43] - 通信云升级为商业基座,数据价值挖掘与商业化应用成为发展核心议题 [43]
“AI六小虎”战局升级:阶跃星辰冲刺10亿元营收,大模型进入商业化比拼时代|聚焦2025WAIC
华夏时报· 2025-07-28 12:19
公司战略与目标 - 公司宣布2025年冲刺10亿元年收入目标,为"AI六小虎"中公开的最高目标 [2] - 商业化聚焦智能终端Agent方向,重点布局汽车、手机、IoT设备等场景 [2] - 坚持"超级模型+超级应用"战略,模型能力决定应用上限,应用提供场景和数据 [6] 商业化进展 - 2025年上半年已签订数亿元合同,毛利健康,下半年旺季有望实现10亿元确认收入 [3] - 终端市场覆盖超一半国内头部手机厂商,与吉利合作推出AI智能座舱并实现端到端语音大模型首次量产上车 [3] - 垂直行业拓展金融财经、内容创作、零售等领域,与行业头部公司合作打造C端场景化应用 [3] 技术研发与产品 - 发布新一代全尺寸原生多模态推理模型Step 3,性能提升且适配国产芯片优化成本 [2][7] - Step 3在国产芯片推理效率达DeepSeek-R1的300%,对所有芯片友好 [7] - 多模态布局涵盖3D、图像、视频、语音、音乐等,被称为"多模态卷王" [6] 融资与资本动态 - 上海国有资本投资有限公司生态体系将参与最新一轮融资 [4] - 上一轮融资为2023年12月B轮,投资方包括上海国有资本 [4] - 若融资进展快,公司或成"AI六小虎"中第三家公开新融资企业 [4] 行业竞争与趋势 - AI领域资本转向应用层投资,基础大模型热度降低 [4] - 多模态大模型被视为关键突破,可解决数据局限并赋能多元应用 [7] - 公司联合华为昇腾、沐曦等近10家芯片厂商发起"模芯生态创新联盟" [7] 财务与盈利 - 公司坦言暂未盈利,但模型通用性增强将扩大未来盈利空间 [2][4] - 行业现状显示尚无纯AI企业实现盈利 [3] 技术合作与生态 - 与千里科技、吉利汽车联合开发智能座舱Agent OS预览版,展示自然交互能力 [6] - 未排斥英伟达体系,Step 3在NVIDIA Hopper架构芯片上推理吞吐量提升超70% [8][9]