多模态
搜索文档
B端战场的AI叙事:一场极致的效率和场景争夺战|AI观察系列策划②
每日经济新闻· 2025-10-09 19:05
AI投资与商业化趋势 - AI领域投资重点转向B端项目,核心考量商业化闭环和变现能力[1] - Token调用量成为衡量AI公司实际采用规模与增长潜力的核心标尺,如同互联网时代的用户数[1] - 大模型调用场景发生显著变化,从离线的打标和娱乐性场景,转向在线任务大幅上升,互联网公司和消费电子企业的大部分交互已开始由大模型取代[1] Token消耗规模与增长 - 中国日均Token消耗量从2024年初的1000亿增长至2025年6月底的突破30万亿,一年半时间增长超过300倍[2][4] - 2025年上半年中国企业级大模型日均调用量较2024下半年大增363%,已超过10万亿Tokens[4] - 大模型企业级市场呈爆发式增长,调用量最大的公司是互联网和消费电子企业,其次制造业、传统企业、政府部门和金融机构的调用量也有增长[4] 大模型市场竞争格局 - 中国大模型市场前三名份额合计超40%,其中阿里通义占比17.7%,字节豆包占比14.1%,DeepSeek占比10.3%[4] - 企业正从追求单一最强模型,转向为特定业务场景寻求最优解,对不同模态、尺寸和落地场景匹配的需求将爆发[4] - 模型供给呈现丰俭由人态势,快速匹配多元化市场需求[5] 行业应用与AI Agent发展 - 中国AI应用以生产力工具为主导,垂类行业的B端需求强劲,AI+工业的政策空间和应用空间较大[5] - 企业基于业务需要和成本考量,更倾向选择适配自身需求的底层大模型,而非一味追求大尺寸和强性能[6] - AI Agent被视为有望替代原有SaaS系统的技术,企业正加大布局,中基宁波集团计划在内部搭建100个有效智能体[5][6][7] 企业选型考量与模型趋势 - 企业在模型侧的选择主要考量五个方面:稳定性、效率、成本、服务响应和易用性[6] - 模型小型化成为未来几年的关键趋势,务实和好用成为B端企业调用大模型的基本原则[6] - 对于需要快速识别的场景使用小模型以降低Token消耗成本,对于深度推理则使用满血版模型[6] SaaS行业变革与商业模式 - SaaS行业长期面临用户付费意愿低、企业盈利难的问题,AI浪潮下有望改善边际,通过帮客户创造新价值来分得更多利润[7] - 钉钉颠覆SaaS商业模式,推行按结果付费,发布十余款AI产品,强调商业结果可交付[9] - AI应用的竞争最终将回到行业认知、模型工程能力以及实际应用效果,用户只会为效果买单[11] 技术演进与未来挑战 - AI技术从单一的大语言模型向多模态演进,从Copilot切换到Agent,从纯软件端向软硬件一体摸索[1] - AI Agent在稳定性方面有严格要求,不同企业对智能体的算力部署方式会提出严格要求,能力还需不断迭代[6][10] - 垂类行业应用中,知识库和数据库的沉淀积累将成为AI Agent企业的护城河,从数据到语料的处理是主要挑战,50%至70%的客户指导时间用于处理此关系[8][12]
算法小垃圾跳槽日记 2024&2025版
自动驾驶之心· 2025-10-06 12:05
行业技术趋势 - 计算机视觉领域传统算法需求锐减,检测、分割等已被归类为传统算法,类似SVM、SIFT的地位 [8] - 市场需求高度集中于大模型、多模态、文生图/视频以及自动驾驶端到端大模型等前沿方向 [8] - 自动驾驶公司的感知岗位是计算机视觉领域内少数仍有需求的领域 [8] 企业招聘动态 - 2024年求职机会相比2021年显著增多,各大厂及知名中小厂均能提供较多面试机会 [8] - 面试流程密集,存在单日进行多达8场面试的情况,反映出招聘活动活跃 [4] - 企业招聘考核标准趋严,几乎所有公司都要求手写LeetCode代码题,高频题目包括实现NMS、MultiHeadSelfAttention、MLP的前向和反向、岛屿数量等 [9][11] 业务部门价值 - 公司中台部门业务价值受到质疑,缺乏自有业务,主要承接其他部门已深度优化的算法任务,难以形成系统性业务积累 [6] - 行业出现去中台化趋势,中台部门对求职者吸引力较低 [6] - 相比中台,拥有稳定业务的部门(如内容安全)更具吸引力 [6]
东方证券:维持快手-W(01024)“买入”评级 目标价99.07港元
智通财经网· 2025-10-02 16:39
财务预测与估值 - 东方证券预测快手25至27年经调整归母净利润分别为196亿元、230亿元和259亿元 [1] - 基于可比公司给予公司26年17倍市盈率估值,对应合理价值为3911亿元人民币,折合4281亿港元 [1] - 目标股价定为99.07港元/股,维持"买入"评级 [1] 多模态AI业务发展 - 快手可灵通过底模迭代保持领先优势 [1] - 2.5 Turbo版本采取性能升级与降价30%的组合策略,有望进一步带动用户增长和流水上行 [1] 核心主业AI赋能 - AI技术持续推动核心主业提效 [1] - 内容推荐系统OneRec为社区生态健康度提供支撑 [1] - 商业化系统的AI重构为主业稳健增长带来长效动能 [1]
XTransfer 发布自研外贸金融大模型 TradePilot 2.0,技术架构全面升级
AI前线· 2025-09-29 12:28
TradePilot 2.0 技术架构升级 - 技术架构进行系统性革新,通过稀疏激活、门控单元等技术提升计算与存储效率 [4] - 训练算法结合强化学习与对抗训练,增强模型稳定性并提升对低频长尾任务的处理能力 [4] - 采用高效并行计算架构,整合混合精度训练、分布式数据并行等策略,训练效率较上一版本显著提升 [4] - 采用训练-推理一体化设计,在训练阶段融入推理优化逻辑,使模型能以更低计算消耗实现更高处理吞吐量 [4] 数据体系构建 - 打造全流程自主数据生产体系,涵盖采集、清洗、增强等环节形成闭环 [5] - 数据来源涵盖外贸知识库、外贸金融数据、行业公开数据等,构建多模态数据池 [5] - 清洗环节结合自动化筛选与人工审核剔除低质量数据,增强阶段利用主动学习、数据合成技术扩大规模并优化分布 [6] 多模态能力与应用拓展 - 多模态能力实现质的飞跃,能高效识别和解析商品图片、发票、报关单、物流单据及合同文件等贸易相关视觉信息 [9] - 在反洗钱风控领域构建更严密的风险识别体系,依托强大的上下文推理和自然语言处理能力对交易信息进行深度解析 [9] - 采用多模态信息抽取技术,在企业客户认证阶段精准提取证件信息,在收款创建订单阶段自动化识别PI单据信息 [10] - 深度嵌入智能客服体系,实现语义识别和理解能力的飞跃,智能客服解答率从原本的13%大幅跃升至90% [10] 行业趋势洞察 - 专业化分叉是大模型演化的重要趋势,金融等高合规行业正构建针对具体任务的行业/专业大模型 [10] - 多模态跃迁正推动大模型迈向新阶段,从文本到视频与高精度传感器的多模态输入让模型能够"看见过程" [11] - 未来系统形态为"边缘感知+云端认知",企业的差异化优势将体现在感知侧覆盖、数据治理与端云协同能力上 [11]
量子位「MEET2026智能未来大会」启动!
36氪· 2025-09-18 18:19
人工智能技术发展现状 - 人工智能技术已从工具发展为深度理解人类需求的智能伙伴 渗透进生产和生活 跨越软件 硬件 机器人等不同形态[1] - 多模态 AR/VR 空间计算等新兴技术涌现 数字世界与物理世界的界限正在逐步模糊并融合[1] - 人工智能正成为基础设施的一部分 重塑人类未来的工作 生活和社会运作模式 推动产业深度变革[3] MEET智能未来大会概况 - MEET2026智能未来大会以"共生无界 智启未来"为主题 将于2025年12月在北京举办[3][16] - 大会已举办七年 是年度影响力科技商业峰会 每年吸引上千名科技从业者参与 百万观众线上围观 近百家合作媒体联合曝光[6][9] - 大会将聚焦人工智能+ AI Infra 智能终端 智能驾驶 低空经济 能源电力等前沿科技话题[11] 参会嘉宾阵容 - 往届嘉宾包括李开复博士 张亚勤教授等产业领袖 倪光南院士 谭建荣院士等学术领路人[6] - 科技行业领军企业代表来自百度 阿里 腾讯 华为 京东 美团 小米 商汤等公司[6] 大会核心内容 - 将发布《2025年度AI十大趋势报告》 提名正在释放巨大潜力的十大AI趋势 并进行深入分析[14] - 报告将结合技术成熟度 落地现状 潜在价值等因素 提名代表机构和最佳案例[14] - 探讨方向包括人机共生 虚实结合 产业共生 AI不再局限于单一个体而是贯通产业链催生新业态[11]
量子位「MEET2026智能未来大会」启动!年度榜单征集中
量子位· 2025-09-18 16:00
技术发展趋势 - 人工智能正从工具演变为能深度理解人类需求的智能伙伴,跨越软件、硬件、机器人等形态 [2] - 多模态、AR/VR、空间计算等新兴技术正推动数字世界与物理世界的融合,界限逐步模糊 [4] - 智能技术已突破特定领域限制,跨越产业、学科和场景边界,催生全新生态和机遇 [3] 行业影响与变革 - 人工智能正成为基础设施的一部分,重塑人类未来的工作、生活和社会运作模式 [7] - 企业、技术与社会之间的连接与共生成为推动发展的核心动力 [5] - 技术不再局限于单一环节,而是贯通产业链,催生新业态和新生态 [14] MEET2026智能未来大会 - 大会主题为“共生无界,智启未来”,将于2025年12月在北京举办 [7][14][24] - 作为第七届年度科技商业峰会,将汇聚科技、产业、学术领域领军人物,探讨AI+、AI Infra、智能终端等前沿话题 [9][13] - 往届大会吸引上千名科技从业者现场参与,百万观众线上围观,近百家合作媒体联合曝光 [12] 2025人工智能年度榜单 - 榜单从公司、产品、人物三大维度评选五类奖项,包括领航企业、潜力创业公司、杰出产品等 [16][17][18] - 评选结果将在MEET2026大会上公布,报名截至2025年11月17日 [20] 2025年度AI十大趋势报告 - 量子位智库将在MEET2026大会上发布报告,提名十大释放巨大潜力的AI趋势 [22] - 报告将结合技术成熟度、落地现状和潜在价值,对趋势进行深入分析并提名代表机构 [22]
可感知 可交互 可延伸 文旅新消费 “玩”出科技感
中国青年报· 2025-09-16 09:01
行业核心观点 - 数字技术正深刻重塑文旅产业形态,科技创新成为破解发展痛点、激发消费活力的核心动力 [1] - 文旅消费正实现三大转向:从“走马观花”走向“深度沉浸”,从“单点服务”迈向“全域智能”,从“线下局限”跨入“跨域联动” [1] - 人工智能、虚拟现实、超高清、多模态等新技术作为“体验重构者”、“需求激活者”和“边界拓展者”,为旅游新消费注入强劲动能 [1] 沉浸式体验重构 - 超高清、VR、数字光影Mapping等技术构建“可进入、可互动、可感知”的沉浸式场景,将游客从“旁观者”变为“参与者”,带动门票、二次消费及复游率提升 [2] - 国家大剧院“第二现场”利用4K超高清技术覆盖全国31个省级行政区,联动200余家影剧院和高校,汇集超6万观众,打破演艺消费时空限制 [2] - 798超维视界·VR院线通过VR技术将“一次性体验”变为“可持续消费”,降低内容在不同场馆的适配和发行成本,实现内容跨空间、跨设备快速复制 [2] - 京东大溶洞应用数字光影Mapping与雷达交互技术,使岩壁成为“可对话”屏幕,游客挥手可触发地质演变动画,将游览时长从2小时延长至3小时 [3] - VITURE ONE的XR智能眼镜结合AI算法,将平面文旅纪录片转化为立体鲜活视觉效果,为文旅内容传播和景区数字展示提供新硬件解决方案 [3] 智能化服务渗透 - 人工智能、大数据技术打造“千人千面”的智能服务体系,将服务从“满足消费”升级为“激活消费” [4] - 科大讯飞“星火伴游”产品依托“三层知识架构”(目的地数据库+行业模型+通用大模型),在保证知识准确性的同时动态调整讲解策略,满足个性化深度了解需求 [4] - 猎户星空“豹小秘2”机器人在北京艺术中心部署3台,每月交互量达8000人次,公司共有超6万台机器人运行,日均交互量超1700万次,总服务人次达5.5亿 [4] - 中国联通为国家博物馆打造“中华文明云展”,对700多件文物进行数字化处理(其中600多件完成高精度扫描,60多件实现3D建模),并推出两位数智人提供全流程陪同讲解服务 [5] 跨域融合突破 - 新科技推动文旅与交通、游戏、内容创作等领域深度融合,形成“旅游消费+”新生态,使消费从“单点付费”延伸至“全链条买单” [5] - 中国旅游集团在“文旅+交通”实践中,依托列车数字运营系统和大数据技术推出“车票+X”组合(如景区门票、酒店套票),以一张车票串联多元主题旅行方式 [6] - 瀚翔科技通过自研游戏《逆境突破》实践“文旅+游戏”,在玩家密集地点通过动态广告牌展示长城、故宫等景点,玩家可主动互动并领取游戏装备折扣,将广告从干扰转变为价值点 [6] - 追星迹公司研发的360度球幕以东南亚为核心市场,球幕内部以超过1.9米的半球全面覆盖画面,实现真正意义上的360度环绕影像,推动旅游消费场景走向全球 [6]
投资人热议Agent投资:通用与垂类智能体的路径权衡
国际金融报· 2025-09-13 21:09
技术发展与产业前景 - 技术正从大模型向多模态、AI Agent与具身智能跃迁,产业处在技术奇点与商业爆发的交汇口 [1] - 智能体正于金融、医疗、教育等垂直领域快速渗透,下一代智能硬件的竞争焦点是“会做事、总在场、有记忆、能进化” [3] - 随着世界模型的建立,智能体终将从数字世界走向物理世界,实现自主学习甚至与人类共同发现新物理规律 [3] 智能体落地现状与挑战 - 业界对智能的期待已远超“检索+简单工作流”,AI智能体在高容忍度场景如线下中介、情感陪伴等领域将优先落地 [3] - 智能体在金融等场景容错率极低,需过技术关、信任关和合规关,需平衡时效性、准确性和成本 [4] - 市场对智能体交付完成度的要求越来越高,创业者调试优化的时间已经不多 [4] 中国AI应用与创业机遇 - 中国AI应用走在国际前列,多个全球“首个智能体”来自中国,得益于过去20年在互联网、移动互联网积累的产品经理能力以及对技术的快速跟进 [3] - 预测未来全球最顶尖的智能体中将有三分之二来自中国创业团队 [3] - 中国创业者在AI竞争中资源相对较少,应避免同质化竞争,转向合作以产出高质量成果 [4] 投资策略与逻辑 - 智能体公司估值尚未锚定,商业化处于早期,当前智能体可分为通用和垂类两种,前者天花板高但风险高,后者超额回报想象空间有限 [5] - 投资选择垂类智能体的关键在于市场空间大、付费意愿强,且能在一定阶段构建护城河,同时对算力等底层基础设施持续关注 [5] - 建议采取“哑铃策略”投资:一端投资与复杂工作流紧密结合的To B应用以抵御技术风险,另一端投资风险高但天花板更高的通用方向作为未来押注 [6] 产品构建与竞争策略 - AI时代产品的增长由创新驱动而非流量驱动,应优先于模型能力构建产品,使应用随模型能力水涨船高 [4] - 智能体创业需避开大模型能力迭代的主赛道,以免受大模型公司版本升级的冲击,应基于核心能力定义具体服务领域 [5] - 新一代Agent产品应是“天生全球化”的,认知领先与极致执行至关重要 [4]
可灵VS即梦:初探“多模态”
钛媒体APP· 2025-09-11 13:33
AI视频生成平台技术路线 - 国内AI视频生成领域以可灵和即梦为主要平台 [1] - 文生图+图生视频路线具有更高可控性 而文生视频路线能提供更强动态感 [3] - 多数用户选择可控性优先的技术路径 [4] AI内容生成能力评估 - AI编剧能力表现突出 Gemini 2 5 Pro能生成专业级分镜头脚本 [7][8] - 文生图能力存在局限 腾讯混元模型部分生成结果不符合指令要求 [13][15] - 图生视频指令系统成熟 涵盖场景 动作 运镜 风格等专业要素 [9] 视频生成技术缺陷 - 指令遵循度不足 平台经常偏离用户输入的明确指令 [20][22] - 物理逻辑错误频发 包括穿模现象和不合理运动轨迹 [24][25][28] - 时间一致性差 5秒内视频主体可能出现显著变化 [32][34] 平台性能对比分析 - 可灵平台优势体现在物理模拟真实性和动态感表现 [36] - 可灵具备深度概念理解能力和艺术诠释能力 [36] - 可灵掌握复杂镜头语言 能完成推拉变焦等专业运镜 [37] - 即梦平台优势在于图像保真度和稳定性 [43][44] - 即梦对复杂构图指令执行更可靠 但物理真实感不足 [46][47] - 即梦镜头语言能力较弱 难以完成复杂电影运镜 [48] 行业技术瓶颈 - 视频时长限制显著 主流平台仅支持5-10秒视频生成 [52] - 保真度与创意性存在技术路线博弈 尚未实现兼顾 [50] - 长时长连贯视频生成仍是重大技术挑战 [53] 商业化成本结构 - 基础生成成本较高 即梦平台最低配置为1元/5秒视频 [59] - 可灵平台标准模式定价为2元/5秒视频 [59] - 高质量视频需要多次调试 实际使用成本持续增加 [60] - 本地部署和模型微调成本超出一般用户承受能力 [57]
中信证券:巨头持续布局的AI浏览器以及情感陪伴类应用潜力值得关注
新浪财经· 2025-09-08 08:44
AI行业数据处理量增长 - 谷歌7月Token处理量达980万亿 较5月翻倍[1] - 微软Azure AI Foundry第二季度Token处理量达310万亿 环比增长210%[1] AI应用收入表现 - 海外前100名AI应用7月年度经常性收入总额达393亿美元 较5月增长17.3%[1] - ChatGPT和Claude等头部应用带动收入持续兑现[1] 热门应用方向 - AI编程和多模态技术成为最火热发展方向[1] - Lovable、Replit、Pixverse、Nano Banana等产品陆续出圈[1] - 科技巨头持续布局AI浏览器领域[1] - 情感陪伴类应用展现出显著发展潜力[1]