人工智能

搜索文档
商汤林达华万字长文回答AGI:4层破壁,3大挑战
量子位· 2025-08-12 17:35
核心观点 - 多模态智能是当前AI发展的关键趋势,商汤科技通过"原生多模态"技术路线和"四次破壁"演进框架,推动通用人工智能(AGI)的发展 [1][2][4][6] - 商汤科技发布的日日新6.5模型实现了"图文交错思维"突破,标志着多模态推理能力的显著提升 [16][21] - 公司通过统一融合模型架构、优化数据生产体系和创新组织模式,在多模态领域保持领先优势 [12][25][40][41] 多模态智能的重要性 - 智能的核心是与外界进行自主交互的能力,而世界是以多元形态存在的,仅依赖文本数据的语言模型无法构建真正的AGI [7][8] - 多模态模型必须能够处理和理解图像、声音、视频等多种模态的信息,才能具备通用性 [8] - 商汤将多模态锚定为技术主轴,从日日新6.0开始只发布多模态模型,这在国内大模型厂商中独树一帜 [12] 技术路径选择 - 实现多模态模型主要有两种技术路径:适应训练(嫁接模式)和原生训练(融合模式) [11] - 商汤通过大规模对比实验确立了"原生多模态"技术路线,采用从预训练阶段就混合多种模态数据的融合模式 [10][11] - 实验证明,在合适的数据配比下,一个原生多模态融合模型在纯文本和图文任务上的表现都优于各自独立的专门模型 [23] 四次破壁演进框架 - 第一次破壁:Transformer实现长序列建模,为大语言模型奠定基础 [14] - 第二次破壁:语言与视觉会合形成多模态理解,模型学会跨模态关联 [15] - 第三次破壁:突破逻辑与形象思维边界,实现多模态推理,日日新6.5引入"图文交错思维链" [16] - 第四次破壁:突破与物理空间边界,实现与真实世界交互,即具身智能 [22][24] 数据体系构建 - 多模态训练最关键的数据是强关联的"图文对",商汤通过大规模自动化构造解决了稀缺问题 [26][27] - 建立"续训验证"机制确保数据质量,只有能带来性能增益的数据才会被准入 [28][29] - 采用"人写种子+自动扩展+强化学习"三段式方法获取高阶专业数据 [31][32][33][34] 模型架构优化 - 模型架构设计的核心是效率,而非单纯追求更大参数规模 [36] - 日日新6.5推动视觉编码器轻量化(参数量从60亿减至10亿),同时使MLLM主干网络更深更窄 [38] - 架构调整结合数据优化使模型效率提升超过3倍,实现比肩顶级模型的效费比 [38][39] 创新力源泉 - 计算机视觉起家的技术基因使公司对多模态价值有更早更深刻的理解 [40] - 重构研究组织实现资源统一调度,设立专项创新小组探索高风险高回报方向 [41] - 构建"基础设施-模型-应用"三位一体的正向循环,使技术理想与商业价值相互促进 [42][43]
论坛| 未可知 x 腾云AI: AI 投资与GEO对商业生态的重构
未可知人工智能研究院· 2025-08-12 17:02
全球AI格局与中国挑战 - 中美企业在生成式AI应用层布局接近持平,但中国AI融资占比持续收缩,头部企业估值仅为美国企业的2% [3] - 中国AI产业面临严峻算力瓶颈,受美国出口管制影响 [3] DeepSeek的崛起与开源战略 - DeepSeek以全栈开源策略突破,仅用600万美元、2000块H800 GPU完成训练,成本仅为GPT-4的6% [4] - 上线20天日活用户数突破2000万,刷新互联网获客纪录 [4] - 与微信生态深度整合,形成"超级平台+开源模型"新范式,重构广告、电商与企业服务生态 [4] GEO生态与流量变革 - GEO成为企业流量命脉,微信11亿日活用户接入DeepSeek R1推理引擎,搜索行为进化为"对话式需求表达" [6] - 传统SEO失效,AI成为全新搜索入口,未可知研究院推出GEO智能广告服务,抢占"答案话语权" [6] - 未来70%用户决策依赖AI推荐时,GEO将成为新时代的黄金广告位 [11] 2025年AI投资赛道 - 通用智能体(Agentic AI)、具身智能与人形机器人、小型AI硬件革命、AI for Science是重点赛道 [8] 未可知研究院的定位与服务 - 聚焦AI前沿趋势、商业落地与人才发展,致力于成为"AI时代的认知基础设施" [12] - 提供"趋势预判-技术拆解-商业落地"全链条服务,连接技术方与场景方 [11] - 参与工信部AIGC标准制定,为政府和企业提供赛道筛选与投资风险评估服务 [11]
我愿称之为目前最强的金融投研AI Agent
佩妮Penny的世界· 2025-08-12 16:56
产品定位与优势 - 国内第一款专注金融领域的自主Agent产品 在投研场景表现显著优于通用型LLM [1][5][6] - 依托创始人金融+技术复合背景(清华+嘉实基金)及8年行业深耕 服务中金、华夏等头部机构 [8] - 拥有独家专业数据源 包括投行券商一手调研纪要、深度报告等 显著提升信息可信度 [9][11] - 已接入22个投研类MCP工具 涵盖研报查询、财务分析、估值建模等专业场景 [23] 核心技术能力 - 采用任务拆解机制 将复杂问题分解为递进式子问题并生成工作笔记 [13][15] - 报告生成耗时5-30分钟 支持Markdown格式输出及全流程可视化回放 [16][17] - 在自有数据集测试中排名第一 达到中级分析师水平 [21][35] - 显著降低AI幻觉 专业场景可用性大幅提升 [19] 典型应用案例 - 宏观策略分析:完成A股/港股差异分析及配置建议 含6-12个月仓位策略 [16] - 数据整理:梳理全球AI巨头资本开支 生成含527亿美元(亚马逊2022年)等精确数据的对比表格 [20] - 公司研究:覆盖宇树科技等案例 提供完整分析框架 [25] - 行业对比:完成Coinbase、Robinhood等数字货币相关美股横向分析 [27] - 赛道研究:涉及半导体等基础行业分析 [33] 产品迭代进展 - 从"实习生"级别进阶至中级分析师水平 实现长思维链和初级推理能力 [35] - 2023年接入R1模型 投入30+GPU卡提升算力 [35] - 新增报告回放功能 支持用户查看完整分析过程 [16][25][27][33] 用户价值体现 - 单个任务消耗约200积分 初始赠送2400积分 [2][3] - 效率优势明显:数据整理类工作较人工节省半天以上时间 [21] - 专业表达严谨 引用源均为持牌机构报告 [11][19] - 提供Ultra版本会员及1000积分内测福利 [39]
北京“十五五”规划建言热:细分机器人赛道,支持国资成耐心资本
新京报· 2025-08-12 15:53
北京市"十五五"规划公众建言征集活动 - 活动自6月30日启动以来已收集大量意见建议,民生保障、城市治理、科技创新、生态环境保护、城乡区域协调发展领域建言合计占比超91% [1] - 建言人中企业员工、专业技术人员、企业管理者占比超77% [1] - 征集活动将持续到8月底,市民可通过网站、微信、电子邮件、信件等多种渠道进行建言 [7][8] 人形机器人产业发展 - 人形机器人已成为全球科技竞争新赛道,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品 [2] - 北京人形机器人产业存在"研发强、但产业化不够"的瓶颈 [2] - 建议重点布局医疗机器人、特种机器人等高价值细分赛道,设立"医疗机器人创新发展专项" [2] - 建议建立"临床需求-技术攻关-产品验证"快速通道,缩短审批周期 [2] - 力争"十五五"主导2-3项国际标准的制定 [2] 国企投资模式优化 - 目前外资和民营机构对科技企业投资热情下降,国企投资模式调整将有利于填补此空白 [3] - 国企投资初创期、专精特新等新质生产力企业的主要障碍是发展前景不确定性较大 [3] - 建议适度放宽考核要求,支持国资成为长期资本、耐心资本 [3][4] - 对国有资本作为"耐心资本"的考核优化将促进科技创新 [4] 国际科技合作 - 大兴国际氢能示范区已对接13个国家氢能资源,形成"研发-市场"国际合作网络 [5] - 北京在AI等领域科研实力突出,但国际合作面临数据标准、隐私伦理、知识产权法规差异等挑战 [6] - 国际科技合作项目缺乏具体有效、可操作性强的落地举措 [6] - 建议通过五大路径构建全球科技合作枢纽:优化合作网络、激活创新生态、深耕新兴领域、促进人才流动、提升平台能级 [6] - 建议利用华侨华人和留学生群体作为桥梁促进科技合作 [7] - 鼓励社会资本参与中外科技合作项目,提供资金支持 [7] - 建议建设联合实验室、国际创新合作基地等高水平国际科技合作平台 [7]
AI重磅!华为“黑科技”来了
中国基金报· 2025-08-12 15:37
华为AI推理技术UCM发布 - 华为正式发布AI推理"黑科技"UCM(推理记忆数据管理器),旨在解决AI推理效率与用户体验难题 [2] - UCM是一款以KV Cache为中心的推理加速套件,融合多类型缓存加速算法工具,可分级管理推理过程中产生的KV Cache记忆数据 [7] - UCM通过动态KV逐层卸载、位置编码扩展等组合技术,实现10倍级推理上下文窗口扩展 [8] AI推理行业发展趋势 - AI产业已从"追求模型能力极限"转向"追求推理体验最优化",推理体验成为衡量AI模型价值的关键指标 [4] - 随着AI应用向各类实际场景深度渗透,用户规模和请求量急剧攀升,模型分析和生成的Token数呈现指数级增长态势 [11] - 国外主流AI大模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国主流AI大模型的单用户输出速度普遍小于60 Tokens/s(时延50至100ms) [11] UCM技术优势 - UCM可根据记忆热度在HBM、DRAM、SSD等存储介质中实现按需流动,融合多种稀疏注意力算法实现存算深度协同 [11] - 在长序列场景下,UCM可使TPS(每秒处理token数)提升2至22倍,从而降低每个Token的推理成本 [11] - UCM支持用户输入超过17万Tokens的超长序列推理,避免超长序列模型推不动的问题 [15] 商业化应用进展 - 华为计划在9月开源UCM,将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区 [5] - 华为AI推理加速方案结合UCM与华为AI存储技术,与中国银联开展智慧金融AI推理加速应用试点 [12] - 三大落地业务场景分别是客户之声、营销策划、办公助手 [12]
商汤王晓刚:世界模型将加快AI从数字空间进入物理世界,「悟能」想做那个桥梁
机器之心· 2025-08-12 15:34
具身智能与世界模型 - 具身智能「大脑」以「世界模型」为内核,成为AI下一阶段竞争焦点 [1] - 世界模型被视为通往「类人智能」的解法,业界形成新共识 [1] - 2025年下半年具身智能「大脑」成为全球AI领域焦点 [1] - 世界模型技术研究曲线与具身智能产业发展路径交汇,引发行业争夺战 [2] 行业动态与厂商布局 - 谷歌推出具身智能RT-2模型,AI教母李飞飞聚焦具身智能创业 [3] - 国内厂商密集发布具身智能平台:智源研究院RoboBrain、华为云CloudRobo、字节跳动GR-3、京东JoyInside、商汤「悟能」、腾讯Tairos [3] - 商汤优势在于计算机视觉起家、多模态大模型打磨经验、智能驾驶沉淀、大装置算力支持 [3] - 商汤通过「悟能」平台将多年积累赋能行业 [3] 技术突破与挑战 - 大模型带来导航、人机交互、VLA端到端操作三方面技术突破 [7][8] - 自动驾驶技术进步使机器人导航功能提升 [9] - 多模态大模型带来全新人机交互方式 [10] - 世界模型通过学习物理规律和交通法则实现更高层次智能 [12] - 硬件质量和数据缺乏是主要挑战,尤其是规模化数据生产困难 [13] - 仿真数据与现实差距大,计算机视觉技术可带来新动能 [14] 商汤的技术布局 - 「开悟」世界模型应用于智能汽车,衍生出「悟能」具身智能平台 [5] - 平台包含10万3D资产,支持多视角学习,保持150秒时空一致性 [5] - 世界模型三大技术优势:时空一致性(11摄像头同步)、内容可编辑、反应速度实时 [21][23][24] - 「悟能」平台提供第一视角和第三视角数据,推动端到端VLA实现 [27][29] - 与机器人厂商合作形式为提供SDK软件功能API调用 [33] 应用场景与未来展望 - 机器狗可实现陪伴守护,家庭机器人建立情感连接 [30] - 具身智能成熟后将形成人机社交网络,机器人可完成多项家庭功能 [36] - 每项功能突破都将带来巨大市场想象空间 [37] - 商汤规划提供包含视觉、交互、导航、操作的「机器人大脑」 [39]
卫星互联网建设持续提速,GPT5正式发布,持续看好相关产业投资机会
长城证券· 2025-08-12 14:10
行业投资评级 - 通信行业维持"强于大市"评级 [4] 核心观点 - 卫星互联网建设持续提速,进入密集组网期,2025-2026年主要星座将迈入发射加速阶段 [6][20][21] - GPT5正式发布,在长文本处理、编程能力和计算效率方面较前代有明显提升 [2][3][18] - 持续看好算力产业链和商业航天相关投资机会 [6][19][21] 行业动态 - 通信(申万)指数本周上涨1.30%,跑赢沪深300指数0.07个百分点 [13] - 在TMT子板块中,通信板块涨跌幅居第三位,最新市盈率为21.84倍 [14][15] - 重点推荐组合包括中国移动、中际旭创、天孚通信等20余家公司 [8][22] GPT5技术进展 - 推出4个版本,包括GPT-5、GPT-5 mini、GPT-5 nano和GPT-5 Pro [2][17] - 在解决复杂问题时token消耗减少50%-80%,计算效率显著提升 [2][18][29] - 上下文能力提升至400k,大海捞针测试准确率比o3提升近一倍 [3][18][36] - 编程能力较前代有明显提升,但与Claude 4.1 Opus差距仅0.3% [3][32] 卫星互联网进展 - 7月27日至8月4日完成三次发射任务,将三组低轨卫星送入太空 [40][41][42] - GW星座规划发射12992颗卫星,已完成多个批次发射 [44][46] - 蓝箭航天启动科创板IPO辅导,规划10000颗卫星星座 [7][48][53] - 朱雀二号2025年预计交付6发,朱雀三号计划执行3次发射任务 [21][50][53]
大模型接连更新,AI再迎新浪潮?
新浪基金· 2025-08-12 13:53
7月12日,中国某AI公司发布的Kimi K2开源模型成为关注焦点,在国际上获得了"又一个DeepSeek时 刻"的评价。随后,8月7日,OpenAI发布GPT-5,引发了海内外的广泛讨论。AI大模型接连更新,对投 资而言意味着什么?(资料参考:财通证券研究《财通计算机·中美AI百花齐放,开启AI新时代》, 2025.7.21) 新发布的大模型有哪些核心优势? 在技术层面,Kimi K2的总参数达1万亿(1T),是当前大模型参数量的天花板。从多个基准测试成绩 来看,此次Kimi K2超过了DeepSeek-V3-0324、Qwen3-235B-A22B等开源模型,成为开源模型新SOTA (当前最高水平)。(资料参考:青橙财经《抢先DeepSeek R2,开源万亿参数Kimi K2:月之暗面生死 突围》,2025.7.21:机器之心《深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?》, 2025.7.12) 2.控价开源:高性价比策略吸引用户 价格上,Kimi K2延续了"高性价比"策略:每百万输入tokens收费4元,每百万输出tokens收费16元。综 合来看,API调用成本与DeepS ...
新华视点丨新能源转型、新产业升级、新技术革命——2025夏季达沃斯论坛热点扫描
新华网· 2025-08-12 13:49
新能源转型 - 夏季达沃斯论坛实现全绿电供应,聚焦"新能源与材料"议题,讨论包括能源转型现状、新能源+治沙、产业集群推动转型等[2] - 光伏转换效率从十年前的15%提升至当前25%,预计十年后有望达到35%[4] - 全球风电和光伏发电项目平均度电成本大幅下降,中国贡献显著[5] - 中国新能源汽车产量预计同比增长40%以上,能源转型走在世界前列[5] - 全球能源创新企业面临融资成本上升和政策不确定性挑战,新兴经济体需加大投资维持转型势头[5] - 新能源发电高精度预测、电力供需灵活平衡等技术正在探索解决现有问题[5] 新产业升级 - 人工智能是论坛最受关注的热词,相关议题包括"AI+时代"、"生成式AI加速临床研发"等[6] - 施耐德电气中国区供应链生产效率逐年提升,相比2019年能耗降低15.9%,数字化技术和精益管理成效显著[7][8] - 帕西尼感知科技展出首款"多维触觉+AI视觉"双模态仿生灵巧手,搭载1140个触觉传感单元和800万像素相机,可执行高难度操作[10] - 科大讯飞虚拟人智能交互机实现语音识别、语义理解和语音合成,支持与虚拟人物"面对面"交流[10] - 人工智能推动数字化、绿色化协同转型被视为实现可持续发展的重要途径[10] 新技术革命 - 论坛发布2025年度十大新兴技术,涵盖信任与安全、可持续产业、人类健康和能源-材料融合四大领域[11] - 仿生灵巧手、虚拟人智能交互、全息成像等新兴技术吸引广泛关注[13] - 天津瀚海星云展示全息成像智能空显大屏交互系统,支持空中立体成像和手势交互[13] - "协同感知"技术入选十大新兴技术,为前沿领域发展提供方向[13] - 企业家、创新和技术被视为未来增长的核心[11]
人工智能ETF科创(588760)午后拉升涨超3%,跟踪指数第一大权重股寒武纪20cm涨停,市值突破3500亿元
新浪财经· 2025-08-12 13:44
市场表现 - 上证科创板人工智能指数(950180)强势上涨2 99% 成分股寒武纪(688256)20cm涨停 市值突破3500亿元 芯原股份(688521)上涨8 30% 云天励飞(688343)上涨2 96% 优刻得(688158) 石头科技(688169)等个股跟涨 [1] - 人工智能ETF科创(588760)上涨3 15% 盘中换手17 57% 成交2 58亿元 近1周日均成交1 76亿元 居可比基金前2 [1] - 人工智能ETF科创近1周规模增长6737 45万元 新增规模位居可比基金前3 份额增长1 02亿份 新增份额位居可比基金前2 近5个交易日合计"吸金"6424 98万元 [1] 指数构成 - 上证科创板人工智能指数从科创板市场选取30只市值较大的人工智能相关上市公司证券 前十大权重股合计占比67 36% 包括寒武纪 金山办公 澜起科技 石头科技 芯原股份等 [2] 行业动态 - OpenAI发布GPT-5 其高效智能模型 深度推理模型和实时路由器组成的技术体系进一步巩固AI大模型应用落地的市场预期 将显著催化人工智能产业对算力基础设施的资本开支 [2] - 海外CSP云厂商上修资本支出 整体算力景气度有望延续 国内海光等持续释放业绩 国内设备公司签单和业绩表现向好 海外TI表示大部分终端市场复苏 国内模拟公司25Q2营收多数同环比改善 [3] 投资机会 - 建议关注自主化加速叠加业绩向好的设备/算力/代工等板块 景气周期边际复苏的存储/模拟等板块 [3] - 人工智能ETF科创(588760)一键布局科创板30家人工智能企业龙头 行业兼顾软硬件 更符合当下AI发展趋势 [3] 收益能力 - 人工智能ETF科创自成立以来最高单月回报为15 47% 最长连涨月数为2个月 最长连涨涨幅为19 04% 上涨月份平均收益率为9 14% [1]