多模态
搜索文档
打造人工智能产业高地!上海AI产业规模上半年同比增长12.3%
证券时报网· 2025-09-26 21:11
产业规模与增长 - 2024年上海人工智能产业规模突破4500亿元,今年上半年同比增长12.3%,已提前完成"十四五"目标 [1] 政策支持与发展方向 - 上海正着力打造人工智能"上海高地",坚持高质量发展导向,持续优化政策环境,夯实算力基础设施,强化模型与算法创新,构建开放协同的产业生态 [1] - 上海将进一步推动人工智能在更多场景实现规模化、商业化落地,为经济提质增效注入强大动力 [1] - 政策举措包括降低智能算力使用成本、扩大人工智能大模型应用、支持采购高质量语料等 [1] 技术前沿与生态建设 - 多模态被视为未来大模型发展的重要方向 [2] - 具身智能是人工智能发展的必然趋势,人形机器人是其重要载体 [2] - 华为将持续开放昇腾AI的基础软硬件平台,与运营商及产业链伙伴协同,共同推动智算服务高质量发展 [2] - 上海市已形成技术迭代、应用示范与产业升级相互促进的良性格局,并将继续推动人工智能与千行百业的深度融合 [2]
量子位「MEET2026智能未来大会」启动!
36氪· 2025-09-18 18:19
人工智能技术发展现状 - 人工智能技术已从工具发展为深度理解人类需求的智能伙伴 渗透进生产和生活 跨越软件 硬件 机器人等不同形态[1] - 多模态 AR/VR 空间计算等新兴技术涌现 数字世界与物理世界的界限正在逐步模糊并融合[1] - 人工智能正成为基础设施的一部分 重塑人类未来的工作 生活和社会运作模式 推动产业深度变革[3] MEET智能未来大会概况 - MEET2026智能未来大会以"共生无界 智启未来"为主题 将于2025年12月在北京举办[3][16] - 大会已举办七年 是年度影响力科技商业峰会 每年吸引上千名科技从业者参与 百万观众线上围观 近百家合作媒体联合曝光[6][9] - 大会将聚焦人工智能+ AI Infra 智能终端 智能驾驶 低空经济 能源电力等前沿科技话题[11] 参会嘉宾阵容 - 往届嘉宾包括李开复博士 张亚勤教授等产业领袖 倪光南院士 谭建荣院士等学术领路人[6] - 科技行业领军企业代表来自百度 阿里 腾讯 华为 京东 美团 小米 商汤等公司[6] 大会核心内容 - 将发布《2025年度AI十大趋势报告》 提名正在释放巨大潜力的十大AI趋势 并进行深入分析[14] - 报告将结合技术成熟度 落地现状 潜在价值等因素 提名代表机构和最佳案例[14] - 探讨方向包括人机共生 虚实结合 产业共生 AI不再局限于单一个体而是贯通产业链催生新业态[11]
量子位「MEET2026智能未来大会」启动!年度榜单征集中
量子位· 2025-09-18 16:00
技术发展趋势 - 人工智能正从工具演变为能深度理解人类需求的智能伙伴,跨越软件、硬件、机器人等形态 [2] - 多模态、AR/VR、空间计算等新兴技术正推动数字世界与物理世界的融合,界限逐步模糊 [4] - 智能技术已突破特定领域限制,跨越产业、学科和场景边界,催生全新生态和机遇 [3] 行业影响与变革 - 人工智能正成为基础设施的一部分,重塑人类未来的工作、生活和社会运作模式 [7] - 企业、技术与社会之间的连接与共生成为推动发展的核心动力 [5] - 技术不再局限于单一环节,而是贯通产业链,催生新业态和新生态 [14] MEET2026智能未来大会 - 大会主题为“共生无界,智启未来”,将于2025年12月在北京举办 [7][14][24] - 作为第七届年度科技商业峰会,将汇聚科技、产业、学术领域领军人物,探讨AI+、AI Infra、智能终端等前沿话题 [9][13] - 往届大会吸引上千名科技从业者现场参与,百万观众线上围观,近百家合作媒体联合曝光 [12] 2025人工智能年度榜单 - 榜单从公司、产品、人物三大维度评选五类奖项,包括领航企业、潜力创业公司、杰出产品等 [16][17][18] - 评选结果将在MEET2026大会上公布,报名截至2025年11月17日 [20] 2025年度AI十大趋势报告 - 量子位智库将在MEET2026大会上发布报告,提名十大释放巨大潜力的AI趋势 [22] - 报告将结合技术成熟度、落地现状和潜在价值,对趋势进行深入分析并提名代表机构 [22]
可感知 可交互 可延伸 文旅新消费 “玩”出科技感
中国青年报· 2025-09-16 09:01
行业核心观点 - 数字技术正深刻重塑文旅产业形态,科技创新成为破解发展痛点、激发消费活力的核心动力 [1] - 文旅消费正实现三大转向:从“走马观花”走向“深度沉浸”,从“单点服务”迈向“全域智能”,从“线下局限”跨入“跨域联动” [1] - 人工智能、虚拟现实、超高清、多模态等新技术作为“体验重构者”、“需求激活者”和“边界拓展者”,为旅游新消费注入强劲动能 [1] 沉浸式体验重构 - 超高清、VR、数字光影Mapping等技术构建“可进入、可互动、可感知”的沉浸式场景,将游客从“旁观者”变为“参与者”,带动门票、二次消费及复游率提升 [2] - 国家大剧院“第二现场”利用4K超高清技术覆盖全国31个省级行政区,联动200余家影剧院和高校,汇集超6万观众,打破演艺消费时空限制 [2] - 798超维视界·VR院线通过VR技术将“一次性体验”变为“可持续消费”,降低内容在不同场馆的适配和发行成本,实现内容跨空间、跨设备快速复制 [2] - 京东大溶洞应用数字光影Mapping与雷达交互技术,使岩壁成为“可对话”屏幕,游客挥手可触发地质演变动画,将游览时长从2小时延长至3小时 [3] - VITURE ONE的XR智能眼镜结合AI算法,将平面文旅纪录片转化为立体鲜活视觉效果,为文旅内容传播和景区数字展示提供新硬件解决方案 [3] 智能化服务渗透 - 人工智能、大数据技术打造“千人千面”的智能服务体系,将服务从“满足消费”升级为“激活消费” [4] - 科大讯飞“星火伴游”产品依托“三层知识架构”(目的地数据库+行业模型+通用大模型),在保证知识准确性的同时动态调整讲解策略,满足个性化深度了解需求 [4] - 猎户星空“豹小秘2”机器人在北京艺术中心部署3台,每月交互量达8000人次,公司共有超6万台机器人运行,日均交互量超1700万次,总服务人次达5.5亿 [4] - 中国联通为国家博物馆打造“中华文明云展”,对700多件文物进行数字化处理(其中600多件完成高精度扫描,60多件实现3D建模),并推出两位数智人提供全流程陪同讲解服务 [5] 跨域融合突破 - 新科技推动文旅与交通、游戏、内容创作等领域深度融合,形成“旅游消费+”新生态,使消费从“单点付费”延伸至“全链条买单” [5] - 中国旅游集团在“文旅+交通”实践中,依托列车数字运营系统和大数据技术推出“车票+X”组合(如景区门票、酒店套票),以一张车票串联多元主题旅行方式 [6] - 瀚翔科技通过自研游戏《逆境突破》实践“文旅+游戏”,在玩家密集地点通过动态广告牌展示长城、故宫等景点,玩家可主动互动并领取游戏装备折扣,将广告从干扰转变为价值点 [6] - 追星迹公司研发的360度球幕以东南亚为核心市场,球幕内部以超过1.9米的半球全面覆盖画面,实现真正意义上的360度环绕影像,推动旅游消费场景走向全球 [6]
一线投资人热议AI:三大赛道仍处风口,不完美创业者受青睐
证券时报网· 2025-09-14 12:38
核心观点 - AI产业处于技术奇点与商业爆发交汇口 重点关注大模型向多模态、智能体及具身智能的跃迁 [1] - 中国AI应用走在国际前列 多个全球"首个智能体"来自中国 受益于过去20年互联网及移动互联网积累的产品经理能力与技术快速迭代 [4] - 未来全球最顶尖的智能体中三分之二将来自中国创业团队 [6] 细分赛道投资风口 - 算力、Agent和"AI+产业"三大细分赛道仍是投资风口 [2] - 蚂蚁集团过去两三年在算力层公司出手较多 关注未来Token消耗及能源支撑问题 [2] - 明势创投在智能体领域已布局6家成长较快Agent中的3-4家 [2] - 经纬创投重点关注AI与消费电子、机器人、工业及零售行业的融合 [2] 智能体投资策略 - 智能体分为通用和垂类两种 前者天花板高但风险高 后者超额回报空间有限 [3] - 蚂蚁集团投资以垂类智能体为主 选择标准包括市场空间大、付费意愿强及能构建护城河 [3] - 智能体创业需避开大模型能力迭代主赛道 否则可能被大公司版本升级冲击 [3] - 创世伙伴创投采用"哑铃策略":投资与复杂工作流结合的To B应用及天花板更高的通用方向 [3] 创业者特征偏好 - 新一代创业者比上一代年轻10岁且呈年轻化趋势 已出现00后创业者 [4] - 创业团队需对模型等技术有深刻理解 创业门槛高于移动互联网时代 [4] - 青睐对技术有独到认知、具备商业敏感度及快速迭代能力的团队 [5] - 偏好拥有非共识的超级产品经理特质 如理想汽车李想 [5] - 认可"不完美的创始人能做出伟大产品" 有激情但不够理性者更具潜力 [5] - 谨慎对待AI经验超过3年的创业者 因其可能无法区分新旧AI技术差异 [5] 行业发展前景 - 中国通过实际应用场景与环境互动获得真实应用数据 该路径在机器人领域被特别看好 [3] - 需对年轻创始人保持耐心与宽容 允许其保留个性化风格而非严格遵循CEO标准 [6] - 即便当前最优秀Agent在许多领域仅能达到30-40分水平 在细分领域做到50-60分即有大量用户付费 [2]
投资人热议Agent投资:通用与垂类智能体的路径权衡
国际金融报· 2025-09-13 21:09
技术发展与产业前景 - 技术正从大模型向多模态、AI Agent与具身智能跃迁,产业处在技术奇点与商业爆发的交汇口 [1] - 智能体正于金融、医疗、教育等垂直领域快速渗透,下一代智能硬件的竞争焦点是“会做事、总在场、有记忆、能进化” [3] - 随着世界模型的建立,智能体终将从数字世界走向物理世界,实现自主学习甚至与人类共同发现新物理规律 [3] 智能体落地现状与挑战 - 业界对智能的期待已远超“检索+简单工作流”,AI智能体在高容忍度场景如线下中介、情感陪伴等领域将优先落地 [3] - 智能体在金融等场景容错率极低,需过技术关、信任关和合规关,需平衡时效性、准确性和成本 [4] - 市场对智能体交付完成度的要求越来越高,创业者调试优化的时间已经不多 [4] 中国AI应用与创业机遇 - 中国AI应用走在国际前列,多个全球“首个智能体”来自中国,得益于过去20年在互联网、移动互联网积累的产品经理能力以及对技术的快速跟进 [3] - 预测未来全球最顶尖的智能体中将有三分之二来自中国创业团队 [3] - 中国创业者在AI竞争中资源相对较少,应避免同质化竞争,转向合作以产出高质量成果 [4] 投资策略与逻辑 - 智能体公司估值尚未锚定,商业化处于早期,当前智能体可分为通用和垂类两种,前者天花板高但风险高,后者超额回报想象空间有限 [5] - 投资选择垂类智能体的关键在于市场空间大、付费意愿强,且能在一定阶段构建护城河,同时对算力等底层基础设施持续关注 [5] - 建议采取“哑铃策略”投资:一端投资与复杂工作流紧密结合的To B应用以抵御技术风险,另一端投资风险高但天花板更高的通用方向作为未来押注 [6] 产品构建与竞争策略 - AI时代产品的增长由创新驱动而非流量驱动,应优先于模型能力构建产品,使应用随模型能力水涨船高 [4] - 智能体创业需避开大模型能力迭代的主赛道,以免受大模型公司版本升级的冲击,应基于核心能力定义具体服务领域 [5] - 新一代Agent产品应是“天生全球化”的,认知领先与极致执行至关重要 [4]
可灵VS即梦:初探“多模态”
钛媒体APP· 2025-09-11 13:33
AI视频生成平台技术路线 - 国内AI视频生成领域以可灵和即梦为主要平台 [1] - 文生图+图生视频路线具有更高可控性 而文生视频路线能提供更强动态感 [3] - 多数用户选择可控性优先的技术路径 [4] AI内容生成能力评估 - AI编剧能力表现突出 Gemini 2 5 Pro能生成专业级分镜头脚本 [7][8] - 文生图能力存在局限 腾讯混元模型部分生成结果不符合指令要求 [13][15] - 图生视频指令系统成熟 涵盖场景 动作 运镜 风格等专业要素 [9] 视频生成技术缺陷 - 指令遵循度不足 平台经常偏离用户输入的明确指令 [20][22] - 物理逻辑错误频发 包括穿模现象和不合理运动轨迹 [24][25][28] - 时间一致性差 5秒内视频主体可能出现显著变化 [32][34] 平台性能对比分析 - 可灵平台优势体现在物理模拟真实性和动态感表现 [36] - 可灵具备深度概念理解能力和艺术诠释能力 [36] - 可灵掌握复杂镜头语言 能完成推拉变焦等专业运镜 [37] - 即梦平台优势在于图像保真度和稳定性 [43][44] - 即梦对复杂构图指令执行更可靠 但物理真实感不足 [46][47] - 即梦镜头语言能力较弱 难以完成复杂电影运镜 [48] 行业技术瓶颈 - 视频时长限制显著 主流平台仅支持5-10秒视频生成 [52] - 保真度与创意性存在技术路线博弈 尚未实现兼顾 [50] - 长时长连贯视频生成仍是重大技术挑战 [53] 商业化成本结构 - 基础生成成本较高 即梦平台最低配置为1元/5秒视频 [59] - 可灵平台标准模式定价为2元/5秒视频 [59] - 高质量视频需要多次调试 实际使用成本持续增加 [60] - 本地部署和模型微调成本超出一般用户承受能力 [57]
中信证券:巨头持续布局的AI浏览器以及情感陪伴类应用潜力值得关注
新浪财经· 2025-09-08 08:44
AI行业数据处理量增长 - 谷歌7月Token处理量达980万亿 较5月翻倍[1] - 微软Azure AI Foundry第二季度Token处理量达310万亿 环比增长210%[1] AI应用收入表现 - 海外前100名AI应用7月年度经常性收入总额达393亿美元 较5月增长17.3%[1] - ChatGPT和Claude等头部应用带动收入持续兑现[1] 热门应用方向 - AI编程和多模态技术成为最火热发展方向[1] - Lovable、Replit、Pixverse、Nano Banana等产品陆续出圈[1] - 科技巨头持续布局AI浏览器领域[1] - 情感陪伴类应用展现出显著发展潜力[1]
九章云极COO尚明栋:算力利用率不足30%,根源在于「堆硬件」而非「重运营」丨智算想象力十人谈
雷峰网· 2025-09-02 18:09
行业现状与挑战 - 行业内平均算力使用率不足30%,大量算力闲置浪费 [3] - 算力闲置主要由于供大于求以及裸金属租赁模式锁定时间与资源边界 [3] - 裸金属租赁模式仅适合少数拥有大规模模型训练需求的厂商,市场需求易饱和 [3] - 推理算力需求迎来爆发,但厂商难以应对零散而弹性的算力需求 [3] 算力运营模式创新 - 算力作为基础设施本质是运营型生意,核心价值在于持续被使用和消纳 [4] - 智算中心操作系统需统筹硬件、定义软件、孵化生态,优化成本和效率 [5] - 九章云极推出Alaya NeW智算中心操作系统,定义"一度算力"标准化单位 [6] - 按实际消耗计算量计费模式打破对算力时间和资源边界的锁定 [16] 算力普惠与成本优化 - 实现算力普惠需降低使用成本和技术门槛 [9] - 按算量计费模式确保客户只为真正使用的算力付费,避免资源闲置浪费 [15] - 九章云极按算量计费单位算力单价高于裸金属租赁,但通过提高使用效率降低客户总成本 [16] - 裸金属租赁模式适合技术能力强、能保持高GPU利用率进行大规模训练的客户 [17] 算力资源池与组网方案 - 九章云极采用多元化算力资源池构建策略,与战略投资伙伴合作 [20] - 组网方案需满足专业架构设计,简单裸金属链接组网难以达到云化服务要求 [21] - 九章云极当前只运营自建智算中心,因第三方集群改造消耗专业团队 [21] 竞争格局与生态建设 - 智算云竞争力体现在性价比和生态化规模 [23] - AWS在2011-2013年间每年降价12次,体现云服务性价比竞争重要性 [22] - 数据迁移成本与上层工具链绑定形成用户粘性,带来可持续收入 [23] - 智算云平台价值在于解决传统云计算AI任务算力调度低效、弹性不足问题 [24] 推理算力发展趋势 - 推理算力占比快速上升,增速和规模潜力远超训练算力 [26] - 算力利用效率需从不足30%提升至40%、50%甚至更高 [27] - 国产芯片厂商优先发力推理芯片市场,带来异构计算挑战与机遇 [27] - 人工智能技术从单一模态走向多模态融合与感知 [28]
谷歌NanoBanana出圈
华福证券· 2025-08-31 13:19
行业投资评级 - 多模态向更高能力突破 看好多模态领域的爆发 [6] 核心观点 - 谷歌 Nano Banana 成为最先进的图像生成与编辑模型 在图像编辑领域模型榜单中以1362分位列第一 大幅领先第二名flux(1191分)和GPT-image-1(1170分)[3] - 谷歌 Veo3 成为视频生成领域排名第一大模型 在lmarena平台图生视频和文生视频排行榜均排名第一 [5] - 海外平台迅速接入Nano Banana 包括Adobe、Poe、WPP、Freepik、Leonardo.ai、Figma等 并验证生产力提升 [4] 技术优势 - Nano Banana具备四大核心能力:跨图一致性、多图融合、对话式/指令式精细编辑、借助Gemini世界知识的更强常识/语义理解 [3] - 定价保持高性价比 每百万token 30美元 折合约0.039美元/张图 [3] - Veo3具备原生音频生成、强提示遵循、创作控制能力 支持API级8秒/720p稳定参数 [5] 应用场景 - 设计类工作生成和编辑:品牌内容、电商营销领域的海报生成与处理、商品图制作、多元素拼贴 [4] - 创意设计与社媒内容:四格漫画生成、真人手办制作、产品内部结构拆图、游戏UI设计 [4] - 图像修复与内容改写:图片打光处理、局部PS处理 [4] - 与外部工具结合:应用于AI视频生成、AI 3D生成 [4] 投资建议 - 关注谷歌Veo3与YouTube的版权产业链:阜博集团 [6] - 关注AI图片应用公司:A股万兴科技、港股美图公司 [8] - 关注AI视频应用公司:快手、哔哩哔哩 [8] - 关注IP平台:阅文集团 [8] - 关注游戏平台:心动公司、吉比特 [8]