Workflow
多模态大模型
icon
搜索文档
重金研发“拥抱”AI时代,安防龙头海康威视市值迈向3000亿元
每日经济新闻· 2025-08-03 15:41
每经记者|刘明涛 每经编辑|彭水萍 凭借周五大涨3.59%,安防龙头海康威视8月实现"开门红"!收盘后,海康威视公布2025年半年报,公司 上半年实现营业收入418.18亿元,同比增长1.48%;归母净利润56.57亿元,同比增长11.71%。在积极把 握AI大模型技术突破带来的发展机遇,业绩重回上升通道的同时,海康威视市值也正重新迈向3000亿 元大关。 | 复权 極加 多股 | 统计 | 画线 | F10 | 标记 +自选 返回 | | | 8002415 海康威视 | | | --- | --- | --- | --- | --- | --- | --- | --- | --- | | | | | | ○ ○ | | 二四 | 10.15% 李芳 | 1356 | | | | | | | 65.00 | 实力 | 29.15 | 1871 | | | | | | | | | 29.14 | 843 | | | | | | | | | 29.13 | 426 | | | | | | | | | 29.12 | 1273 | | | | | | | 55 01 | | 29.11 | 1290 | | | ...
智元机器人罗剑岚老师专访!具身智能的数采、仿真、场景与工程化~
自动驾驶之心· 2025-08-02 00:03
具身智能数据讨论 - 公司与多家传感器供应商合作,重点研发视觉触觉与高密度传感器,并构建跨平台数据采集API以实现标准化数据输入[2] - 机器人应用需达到95%成功率才能满足家庭场景需求,当前性能优化是主要门槛[2] - 仿真数据用于模型迭代但大模型训练100%使用真机真实数据,仿真流水线在扩展性上存在瓶颈[2][3] - 合成数据仅用于工程迭代与模型调试,发布与部署阶段完全依赖真实场景数据[3][4] - 真实数据成本核心在于缺乏标准化机制,公司尝试通过远程摇操、自动部署机器人等方式建立自动化数据采集闭环[6] - 机器人数据瓶颈与自动驾驶不同,需解决数据稀缺、性能优化及工程伦理等多方面挑战[7] 具身大模型评估 - 行业缺乏通用benchmark,公司计划搭建统一真机测试场供不同模型评估[8][9] - 评估维度包括具身技术路线与性能表现,当前从Demo炫技转向产业闭环但仍面临工程复杂性等挑战[9] - 公司世界模型基于统一平台,能生成视频、评测模型并训练策略,处理复杂场景能力较强[10] - VLA路线需结合大模型与优化策略,机器人执行要求远高于ChatGPT的50%-60%准确率[11] - 中美差异:美国重算法创新与开源生态,中国在工程集成与规模部署上更具优势[12] 遥操作vs自主决策 - 自主决策需机器人理解世界、生成策略并执行任务,关键技术门槛在于多模态信息融合与高成功率[13][14] - 当前"失控"问题源于软件设计不完善而非机器人意识,公司通过模拟测试与安全机制确保安全[14] - 数据积累路径从垂直场景逐步过渡到通用场景,无法直接实现通用能力[15] 具身智能应用场景与落地 - 场景部署流程分为任务建模、场景迁移、场景适配与安全验证四步,强调软硬件协同与人机安全[17][18] - 工业结构化环境更易落地,需满足近乎100%的性能要求,家庭场景因复杂性长期市场更大[20][21] - 工业场景中VLA需结合大模型与优化策略,相比传统方案具备更强泛化能力与更低调试成本[23] - 人形机器人技术路线未收敛,公司同时依赖外部厂商与自研技术探索模块化标准[23] - 家庭环境异质性带来工程挑战,需通过垂直场景数据积累逐步演化通用能力[23] - 执行速度慢源于模仿学习局限,需引入专门优化训练而非仅模仿原始操作[24] 具身未来展望 - 追求DeepSeek moment即高成功率+泛化能力+速度的统一提升,而非ChatGPT式低成功率泛化[26] - 数据驱动成为科学范式,通过大规模数据与统计验证建立结论[27] - 未来架构可能超越Transformer,类脑架构更贴近生物大脑处理模型[28] - 传感器选择关键在"对的传感器"而非数量,方法论与算法架构更重要[28] 具身软硬件协同 - 公司构建平台化操作系统(类似"机器人Android")为硬件与传感器提供统一接口[30] - 行业需开放合作共建生态,单靠操作系统无法推动性能级模型创新[31][32]
从Figma到中国垂类应用全球崛起
格隆汇APP· 2025-08-01 13:27
美股科技股年内最大IPO之一:Figma - Figma成立于2012年,以22亿美元的前端设计软件市场为起点,目标扩展至330亿美元的全流程产品开发生态 [2] - 核心产品Figma平台凭借轻量化、社区繁殖和协同办公三大优势在全球设计工具市场占据重要地位 [2] - 借助AI编程能力,Figma切入程序员协同办公场景,未来有望向"无人开发"方向拓展 [4] 全球AI应用发展的奇点将至 - 多模态大型语言模型(MLLM)的诞生解决了单模态局限,成为场景扩张的关键 [5][6] - 多模态应用的变现能力显著优于纯文本产品,如Midjourney年收入5亿美元,Runway付费用户超百万,付费转化率比纯文本Chatbot高2-3倍 [7] 中国视频生成:全球化商业化的突围样本 - 国内厂商在视频生成领域实现全球化突破,美图、快手、睿琪软件年化收入超1亿美元 [8] - 美图AI设计工具在东南亚电商渗透率达25%,快手可灵视频生成工具上线10个月ARR破1亿美元 [8] - 多模态能力在短视频、电商、内容创作等高频场景中成为打开付费意愿的关键 [8] 投资逻辑:中美共振下的价值重构 - 海外用户AI付费意愿显著高于国内,如可灵海外订阅转化率8.7%,是国内的3倍,美图海外ARPU较国内高40% [9] - Figma通过覆盖全流程构建生态优势,国内企业需在垂直领域建立"AI+行业know-how"双重壁垒,如美图AI功能将商拍成本降低60% [10] - 中国政府发布《数字中国建设2025年行动方案》,支持AI应用发展,同时整治技术滥用 [10] 结语:从工具革命到产业重构 - Figma的崛起与多模态大模型的爆发代表生产力工具的范式迁移,需要底层架构创新与垂直场景深度解构 [12] - 中美AI商业化共振下,能将技术优势转化为全球市场份额的公司将创造新的商业传奇 [12]
邝子平对话印奇:商业模式闭环才能持续推动技术进步,AI时代硬件机会巨大
IPO早知道· 2025-08-01 12:12
启明创投希望通过举办有特色的分论坛,给业界乃至整个人工智能产业带来一些好的、有 用的信息。 本文为IPO早知道原创 作者| Stone Jin 微信公众号|ipozaozhidao 据 IPO早知道消息, 由启明创投主办的 2025世界人工智能大会(WAIC)"启明创投·创业与投资 论坛——创业投资开启AI技术与应用共振周期" 于 7月28日 在上海世博中心蓝厅成功举办。 在对话环节中, 千里科技董事长 印奇 和邝子平围绕《 "AI+终端"进化论:大模型赋能终端进化与 产业重构》展开专题对话。 事实上,启明创投是旷视科技最早的机构投资方之一,邝子平与印奇因 AI 相识已十二、三年。 在本次对话中, 印奇 分享了其认为的 AI终端领域未来将呈现 的 两个核心趋势 ,以及对两段创业 经历的思考。 以下系对话节选: 未来 3年是AI+终端非常有意思的3年 邝子平:我们是因 AI而认识,今天还是因AI这个话题同台,一晃十几年过去了,你现在是千里科技 的董事长,也在做很多其他的AI领域的事情,要不聊一下最近在忙什么事情。 启明创投创始主管合伙人邝子平 在 欢迎 致辞中 表示,作为中国在 AI领域最早投资且布局最丰富的 ...
AI驱动下,通信云行业的全球化变革
艾瑞咨询· 2025-07-30 09:18
行业投资评级 - 全球互联网通信云市场规模2024年约68亿美元 预计未来2-3年将迎来新一轮增长 [3] - AI在云通信市场的渗透率约15% 中国5G+AI渗透率达5.6% [16] - 未来3-5年厂商将围绕"多模态大模型×场景化服务"构建竞争壁垒 [5] 核心观点 技术演进方向 - 开发者需求向安全合规(82%国家已建立数据隐私法规)、智能(生成式AI应用占比54%)、开放(跨平台兼容)三大方向收束 [4][6][31] - 量子加密(QKD)、区块链存证等新技术提升跨境数据传输安全性 [39][43][45] - 通信云与AI协同进化 从辅助工具向沉浸式人机交互进阶 短期聚焦低准确性/低实时性场景 [51][52] 市场竞争格局 - 中国市场IM PaaS TOP3市占率90% 融云在TOP1000 APP中份额达56% [64][65] - RTC PaaS市场集中度CR3约70% 头部厂商转向差异化服务竞争 [66][67] - 典型企业技术路线: - 融云:安全合规底座+50+大模型API开放 [70][80] - Sendbird:全渠道AI Agent客服平台 [75] - 声网:VAD技术实现650ms超低延迟硬件交互 [85] 分章节要点 AI时代基础设施 - 通信云从传输管道升级为AI交互中枢 需满足多模态(文本/音频/视频融合)、高可靠、低时延需求 [10][11] - 2024年增速放缓至4% 主因AI场景成熟度不足及宏观经济影响 [15] - 中国市场进入存量竞争 开发者需求聚焦通信稳定(56%厂商设备支持量)、数据价值挖掘、跨平台开发效率 [20][22] 技术演进 安全升级 - 欧美通过GDPR等立法强化数据本地化 中东/东南亚加速本地化法规建设 [31][32] - 政企办公场景需硬件加密+传输协议+权限管理全链路可控 [34][36] 智能升级 - 全球TOP50 GenAI应用中聊天/角色扮演类占36% 通信云厂商通过开放第三方模型接入满足需求 [46][48] - 技术落地路径:IM场景侧重上下文数据分析 RTC场景需平衡ASR/LLM/TTS时延 [49] 开放升级 - 产品开放体现为API接口标准化 生态开放包括Flutter/uni-app等跨平台框架支持 [54][56] - 社交/游戏/教育等场景存在支付集成、内容审核、AI模型自定义等复合需求 [55] 竞争格局 - 产业链上游依赖IT基础设施厂商 下游连接ISV/SI及终端用户 [60] - 融云案例: - 安全方案:量子加密通信+中东本地化部署(JACO直播) [71] - 开放架构:支持Dify/扣子等AI平台+MCP接口标准化 [88][89] 发展趋势 - 技术层面:轻量级模型推动端侧落地 业务数据融合催生AI Agent类应用 [93][94] - 商业层面: - 智能眼镜/玩具等穿戴设备市场CAGR超10% 成新增长点 [96] - 多模态交互需求推动通信云向"神经中枢"升级 [95]
2025年AI驱动下通信云行业的全球化变革
艾瑞咨询· 2025-07-28 17:04
市场规模与增长 - 2024年全球互联网通信云市场规模约68亿美元,未来2-3年将迎来新一轮增长 [1] - AI在云通信市场的渗透率仅约15%,未来3-5年有望回暖,主要驱动因素包括AI陪伴、AI助理等新场景拓展 [7] - 市场需求放缓主因包括大模型AIGC落地场景观望期及宏观经济下行,中东、拉美等新兴市场增长较快但规模较小 [7] 技术焦点 - 开发者需求向安全、智能、开放收束:数据主权和隐私保护成为出海刚需,需明确数据所有权归属并加密敏感数据 [2] - 通信云向AI交互中枢进化,开放第三方大模型接口、提供低代码智能体创建工具成为基础套件 [2] - 跨平台开发兼容与AI能力开放整合是厂商主要竞争力之一 [3] 发展趋势 - GenAI推动文本、语音、视频融合交互,未来3-5年厂商将围绕"多模态大模型×场景化服务"构建壁垒 [3] - 通信云从基础管道升级为沉浸式AI交互基础设施,满足可靠性、实时性和多模态需求 [4] - 短期优先落地低准确性、低实时性场景,长期将深入游戏、教育、办公等高价值领域 [26] 国内市场特征 - 中国进入存量竞争阶段,企业通过精细化运营提升竞争力,聚焦通信稳定性、数据支撑业务和跨平台开发效率 [11] - IM PaaS市场TOP3占比90%,RTC PaaS市场TOP3占比70%,融云在第三方厂商中份额达56% [36] - AI原生应用尚未出现爆款,当前以"模型即应用"为主流 [11] 国际市场特征 - 欧美市场重视数据隐私与合规性,新兴市场聚焦本土化适配与场景创新 [14] - 社交娱乐领域,欧美偏好AI虚拟恋人等新玩法,新兴市场需适配本地语言和操作系统 [14] - 全球82%国家和地区已建立或正在制定数据隐私法规,欧美或出台更严苛跨境数据流动限制 [17] 安全升级 - 各国对自主可控通信平台需求提升,政企办公场景需硬件加密、传输协议全流程闭环 [19] - 运用QKD、MAF和BC技术提升数据传输链路安全性是未来趋势 [22] - 欧美通过立法强化数据本地化,中东偏好数据加密与高性能服务,拉美非洲跟进性价比方案 [17] 智能升级 - 通信云厂商聚焦核心通信能力建设,开放接入第三方AI模型,IM PaaS侧重个性化交互,RTC PaaS需平衡生成质量与时间 [24] - 由辅助工具向沉浸式人机交互进阶,短期优先突破低准确性、低实时性场景 [26] 开放升级 - 产品开放通过API接口实现功能定制,生态开放构建开发者社区支持技术交流与孵化 [29] - 跨平台兼容性成为开发者选型重要考量因素,未来将加强多设备和系统支持 [29] 产业链与竞争格局 - 头部厂商通过封装全栈大模型能力优化交互体验,主权明晰、防篡改服务成为出海竞争力关键 [36] - 厂商加速大模型、安全技术融合与属地化生态合作,适配本地合规要求 [33] 技术趋势 - AI向多模态、云端协同发展,通信云厂商将强化上下文数据分析,打造千人千面交互体验 [40] - 业务数据融合助力AI应用从辅助工具迈向具备自主决策能力的AI Agent [40] 商业趋势 - 多模态大模型+穿戴式硬件是未来3-5年主要发力场景,社交娱乐领域加速涌现AI复合型玩法 [43] - 通信云升级为商业基座,数据价值挖掘与商业化应用成为发展核心议题 [43]
“AI六小虎”战局升级:阶跃星辰冲刺10亿元营收,大模型进入商业化比拼时代|聚焦2025WAIC
华夏时报· 2025-07-28 12:19
公司战略与目标 - 公司宣布2025年冲刺10亿元年收入目标,为"AI六小虎"中公开的最高目标 [2] - 商业化聚焦智能终端Agent方向,重点布局汽车、手机、IoT设备等场景 [2] - 坚持"超级模型+超级应用"战略,模型能力决定应用上限,应用提供场景和数据 [6] 商业化进展 - 2025年上半年已签订数亿元合同,毛利健康,下半年旺季有望实现10亿元确认收入 [3] - 终端市场覆盖超一半国内头部手机厂商,与吉利合作推出AI智能座舱并实现端到端语音大模型首次量产上车 [3] - 垂直行业拓展金融财经、内容创作、零售等领域,与行业头部公司合作打造C端场景化应用 [3] 技术研发与产品 - 发布新一代全尺寸原生多模态推理模型Step 3,性能提升且适配国产芯片优化成本 [2][7] - Step 3在国产芯片推理效率达DeepSeek-R1的300%,对所有芯片友好 [7] - 多模态布局涵盖3D、图像、视频、语音、音乐等,被称为"多模态卷王" [6] 融资与资本动态 - 上海国有资本投资有限公司生态体系将参与最新一轮融资 [4] - 上一轮融资为2023年12月B轮,投资方包括上海国有资本 [4] - 若融资进展快,公司或成"AI六小虎"中第三家公开新融资企业 [4] 行业竞争与趋势 - AI领域资本转向应用层投资,基础大模型热度降低 [4] - 多模态大模型被视为关键突破,可解决数据局限并赋能多元应用 [7] - 公司联合华为昇腾、沐曦等近10家芯片厂商发起"模芯生态创新联盟" [7] 财务与盈利 - 公司坦言暂未盈利,但模型通用性增强将扩大未来盈利空间 [2][4] - 行业现状显示尚无纯AI企业实现盈利 [3] 技术合作与生态 - 与千里科技、吉利汽车联合开发智能座舱Agent OS预览版,展示自然交互能力 [6] - 未排斥英伟达体系,Step 3在NVIDIA Hopper架构芯片上推理吞吐量提升超70% [8][9]
全球约八成医疗机构正在部署或设点生成式AI工具 人工智能正重构医疗健康全产业链
上海证券报· 2025-07-28 02:48
AI在医疗健康领域的应用趋势 - 人工智能正以前所未有的深度与广度重塑全球医疗健康产业链,覆盖临床诊疗、药械研发、医院管理等环节 [1] - AI技术为医疗健康产业打开新的发展空间和产业机遇,催生智能化、精准化、个性化的医学新范式 [1] - 全球约80%的医疗机构正在部署或设点生成式AI工具,这些系统被整合进运营、临床、行政等医疗工作流程中 [2] AI技术的具体应用 - AI技术在医疗健康领域的应用包括癌症早筛的智能诊断系统、阿尔茨海默症的AI预测模型、高效缩短新药研发周期的生成式AI以及高精度智能手术机器人 [1] - 从AlphaFold破解生命密码到大模型驱动诊疗效率革命,再到具身智能、生命纤维引领的医疗健康新可能,AI成为医药健康产业跨越式发展的核心引擎 [2] - AI技术呈现出从科研实验室走向临床医疗、卫生政策和医院管理体系的趋势 [2] AI在医疗健康领域的挑战 - AI在医疗健康领域的应用面临数据壁垒、监管伦理和技术标准等多重挑战 [3] - AI模型在医疗健康领域存在模型幻觉、逻辑不一致、缺乏可追溯性等具体问题 [3] - 信任危机与算法"黑箱"成为AI应用于医疗健康领域的最大障碍 [3] 行业应对措施 - 为确保AI医疗发展的安全性和有效性,需建立透明、包容和公平的制度,并加强机构合作 [3] - 推动数据安全网建设,加快制定医疗健康数据应用相关实施方案,完善数据分级分类管理体系,创新"数据可用不可见"的安全共享机制 [3]
AI教父辛顿尖峰对话:各国应大量研究并分享让AI善良的技术
21世纪经济报道· 2025-07-27 14:30
人工智能意识与主观体验 - 多模态聊天机器人已具备意识 当今的多模态聊天机器人已经具有意识 这取决于如何定义"主观体验"或"意识" [4][5] - 人类对意识的理解存在根本性错误 几乎每个人都对"主观体验"这类术语有着根深蒂固但完全错误的理论 这与人们对"水平"和"垂直"等日常词汇的错误理解类似 [4][5] - 智能体可从自身经验学习 一旦出现像机器人这样的在世界中的智能体 它们可以从自己的经验中学习 最终学到的会比人类多得多 [6] AI训练与安全 - 训练AI聪明与善良需不同技术 如何训练AI变得聪明和如何训练它变得善良是不同的问题 这是同一个AI但会通过不同的技术来实现 [6][7] - 各国应分享AI善良技术 各个国家应该分享让AI善良的技术 即便他们不愿意分享让AI聪明的技术 [6][7] - AI善良技术需随智能水平调整 随着系统变得更加智能 让它变得善良的技术也会发生变化 现在需要对其进行大量研究 [8] AI与科学进步 - AI在科学领域已有显著成就 在预测蛋白质如何折叠方面 AI可以做得更好 这是一个早期信号 预示着AI将在众多科学领域带来进步 [8] - AI在气象预测表现优异 在预测台风登陆地点和天气预报方面 人工智能可以做得比基于PDE的传统物理模型更好 [8][9] 科研方法论 - 寻找"所有人都搞错了"的领域 如果想做出真正原创的研究 就要寻找那些"所有人都搞错了"的领域 [10] - 坚持新思路直至验证 不要因为导师说"这个方法很蠢"就放弃 忽略导师的建议 坚持你笃信的 直到你自己弄懂 [10] - 重大突破来自坚持 偶尔你会发现你的信仰其实是正确的 重大突破正是由此而来 它们从不属于轻易放弃之人 [10]
AI教父Hinton对话上海AI Lab周伯文:多模态聊天机器人已经具有意识,让AI聪明和让AI善良是两件事
量子位· 2025-07-26 23:56
允中 发自 凹非寺 量子位 | 公众号 QbitAI AI圈众所周知,家族渊源与中国颇深的 Geoffrey Hinton 因为患有严重的背疾几乎无法长 途旅行,只在去年因为领取诺奖才勉强"带伤"飞抵瑞典。所以当本周的一张他与上海市领导 会面照片出现在国内互联网络的时候,立刻引爆了朋友圈——终于可以在中国一睹教父真 容。 △ 图片来自"上海发布" 不过 Hinton此次的中国上海之行,参与的基本都是闭门以及定向邀请研讨,7月26日下午, 他与 上海人工智能实验室主任 周伯文 的对话此次中国行程里的唯一一场面向AI和科学前沿 研究者的公开对话活动,这也是他中 国之行的最后一天,这场浓缩高密度智慧的尖峰对话, 将Hinton的上海之行推向新高潮。 77岁的Geoffrey Hinton第一次飞越重洋踏上了中国,当他步入会场时,全场起立鼓掌,观 众们高举手机长达数分钟,直播画面中一度无法看到台上的嘉宾。 在17分钟的对话中,两位科学家谈及AI多模态大模型前沿、"主观体验"和"意识"、如何训 练"善良"的超级智能、AI与科学发现,以及给年轻科学家的建议。 在对话前,周伯文代表上海人工智能实验室做了《无尽的前沿: AG ...