Workflow
多模态大语言模型
icon
搜索文档
新股消息 | 合合信息(688615.SH)二次递表港交所
智通财经网· 2025-12-29 21:13
智通财经APP获悉,据港交所12月29日披露,上海合合信息科技股份有限公司(688615.SH)向港交所主 板提交上市申请,中金公司为其独家保荐人。该公司曾于今年6月26日向港交所递交过上市申请。 据招股书,自成立以来,合合信息始终致力以AI技术创新赋能,向全球亿级用户及多元化行业企业客 户提供产品。凭借超过18年的人工智能研究与应用实践积累,合合信息已成为全球文本智能技术领域的 领军者,其核心驱动力来自多模态大语言模型。该模型能够同步处理文本、图像、视频等多种形式的数 据输入,并生成多样化的输出模态,从而实现信息抽取、文档解析与修复、图像增强等多元化的AI功 能。该公司的业务已覆盖全球超过200个国家和地区。 根据灼识咨询,在2024年全球C端效率类AI产品MAU(月活跃用户数)上亿的企业中,按相应产品的收入 计,合合信息位居中国第一名、全球第五名,并保持强劲的增长态势。 ...
新股消息 | 合合信息二次递表港交所
智通财经· 2025-12-29 21:11
智通财经APP获悉,据港交所12月29日披露,上海合合信息科技股份有限公司(688615.SH)向港交所主 板提交上市申请,中金公司为其独家保荐人。该公司曾于今年6月26日向港交所递交过上市申请。 据招股书,自成立以来,合合信息始终致力以AI技术创新赋能,向全球亿级用户及多元化行业企业客 户提供产品。凭借超过18年的人工智能研究与应用实践积累,合合信息已成为全球文本智能技术领域的 领军者,其核心驱动力来自多模态大语言模型。该模型能够同步处理文本、图像、视频等多种形式的数 据输入,并生成多样化的输出模态,从而实现信息抽取、文档解析与修复、图像增强等多元化的AI功 能。该公司的业务已覆盖全球超过200个国家和地区。 根据灼识咨询,在2024年全球C端效率类AI产品MAU(月活跃用户数)上亿的企业中,按相应产品的收入 计,合合信息位居中国第一名、全球第五名,并保持强劲的增长态势。 ...
智驾芯片算法专家交流
2025-08-07 23:03
行业与公司 * 行业涉及自动驾驶芯片与算法领域 公司为华为及其汽车相关业务[1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18][19][20][21][22][23][24][25][26][27][28][29][30][31][32] 核心观点与论据 芯片硬件发展 * 华为新一代MDG1,000芯片提供500-800 TOPS算力版本 采用单芯片方案替代双芯片 解决特征层传输局限性 预计价格在一万多美元 低于双芯片方案的13000-14000美元[1][2][4] * 当前芯片为7纳米工艺 未来将精进至5纳米工艺 带宽从目前100 GB/s提升至200-280 GB/s NPU算力从200K DMUS升级到400K DMUS[2] * 车端芯片架构基于达芬奇架构 偏向整形运算(如INT8) 与云端服务器的浮点运算需求不同 成本差异显著(云端浮点计算卡需十几万美元)[5][6] * 华为未转向GPGPU方向 而是优化ASIC架构 推进存算一体化 提高数据吞吐效率[1][7] 算法架构演进 * 华为自动驾驶算法从IDS3.1/3.3的两段式结构向端云协同Vivo框架转变 通过云侧世界引擎模型生成训练数据 蒸馏出MOE多专家原生基模型 提高对复杂场景的泛化能力[1][13] * 当前多模态大语言模型参数量约1.几个B(十亿) 低于特斯拉(几十B)和理想(4B)[14] * 车端多模态大语言框架可实现100毫秒内出结果(相当于10帧) 全链路200毫秒 融合感知、后处理、预测、规划及控制 通过注意力机制提高效率[19] * 系统基于盘古大模型 并结合开源资源(如OpenAI或Lambda)进行自主创新[20] 自动驾驶级别与功能 * L3级自动驾驶功能预计2025年底或2026年初推出 但法规尚未完全支持 保险公司目前仍按L2标准赔付[28][31] * L4级别自动驾驶技术预计2026年底进行小范围试点 将优先应用于百万级别豪华车型(如尊界MPV) 再逐步推广至六七十万价位车型[11][32] * 自动驾驶版本接管率存在差异: 2.0版本城区每5公里一次接管 高速500公里以上 3.0版本城区提升至20公里一次 高速突破1000公里 4.0版本高速设计目标为10000公里一次[22] 传感器与融合方案 * 多传感器融合方案是主流方向 包括摄像头、毫米波雷达、超声波和激光雷达 尚未考虑纯视觉方案[22][23] * 激光雷达在算法架构中起到全融合定位作用 从目标级融合发展到数据级融合 提高学习效果和精度[22][23] * 华为推出单激光、双激光(前后固态补盲)、三激光(前主激光加侧面补盲)及四激光雷达方案[22] * 第五代激光雷达将在2025年推出 应用于VL4解决方案 已上市车型(如问界M9、S800)可通过OTA升级支持[29][30] 数据与训练 * 数据质量对训练效果至关重要 高质量数据标注和工程是提升体验的关键 通过仿真生成高质量场景训练端侧模型[16] * 特斯拉采用极简式一段式训练方法 优势在于快速数据闭环(如使用1000万个CLIP实现良好效果)[17] * 高质量基础模型结合垂直领域数据积累可显著提升整体表现[18] 车型与配置 * 2025年主要搭载500 TOPS算力芯片 800 TOPS芯片尚未上车 今年上车的大部分是810型号(400 TOPS左右) 真正达到500 TOPS要到2026年[12] * 2025年发布的SE、Pro、Max、Ultra类别中 只有Ultra使用下一代芯片平台 Max仍使用610型号(MDC810) 配置包括主激光雷达、侧面补光激光雷达、6只毫米波雷达及12只摄像头[12] * 摄像头加激光雷达融合模组用于DMS(驾驶员监测系统)和OMS(乘客监测系统)[26] 线控技术 * 当前转向技术属于半线控转向 保留机械部件 未来全线控转向将完全依赖电子控制 与L4级自动驾驶密切相关[27] * EMB(电子机械制动)已实现双冗余、互冗余制动控制 将在L4阶段更广泛应用 目前主流是EHB(电子液压制动)[27] 其他重要内容 * 车端硬件受限于算力和带宽 运行1.5B-2B模型需40GB/s带宽 运行77B模型需150GB/s带宽[14] * 晚上行车时视觉系统有效距离存在差异 有些公司只能看到50米 华为可达100米以上[24] * IDS3.0系统可升级到多个版本(如M5、M7、R47) 4.0版本也能升级到IDS Pro的M7车型 但硬件配置不同导致体验差异[25] * 英伟达客户群体广泛 需求多样化 华为更加专注特定领域 制程问题敏感 未来5纳米工艺可能限制高端车型使用最新技术[9][10]
新技术带来发展新优势(一周科技观察)
人民日报· 2025-06-16 05:42
新能源与材料技术 - 杭州纤纳光电科技股份有限公司联合高校团队实现平方米级钙钛矿组件稳定量产 研究成果发表于《科学》期刊[1] - 民营企业科研人员作为第一作者在顶级期刊发表论文现象增多 部分领域已进入技术"无人区"[1] - 宁德时代计划年内实现所有电池工厂碳中和 目前760艘电动船舶搭载其电池 4吨级电动飞机通过AS9100认证[1] 农业与生物技术创新 - 华南农业大学联合浪潮信息应用AI加速育种 "华航香银针"水稻育种周期从传统8-10年缩短至4年[2] - 国际团队研发纳米粒子载体药物输送系统 精度达发丝千分之一 可精准靶向肺部病灶[2] 人工智能与机器人技术 - 中科院团队证实多模态大语言模型可形成类人概念表征系统 为构建具身智能提供理论框架[2] - 北京大学等机构开发"全手触觉机器人仿生手" 实现触觉反馈驱动的精确操作[3] - 具身智能理论推动机器人向通用人工智能发展 强调环境交互对智能决策的影响[3]
以多模态数智技术助力高等教育改革
新华日报· 2025-05-30 08:00
新质生产力与高等教育数字化转型 - 新质生产力以科技创新为核心驱动,具有高科技含量、高运行效能和高质量发展特征,高等教育是其培育的关键场域[1] - 《教育强国建设规划纲要(2024-2035年)》明确以教育数字化为突破口,推动教育理念、模式和治理的整体性变革[1] - 多模态数智技术通过整合文本、图像、音视频等多元数据,融合多感官信息,为教育数字化转型提供技术支持[1] 多模态智慧学习空间构建 - 建构主义学习理论强调学习者通过多模态交互实现知识建构,需数字化学习空间支撑[2] - 多模态大语言模型等技术突破正在重塑学习资源形态与认知交互模式[2] - 多模块学习环境包含双重维度:多感官通道构建沉浸式体验,智能传感器数据综合分析提升教学效果[2] 生成式AI在教育中的应用 - Stable Diffusion、Midjourney、DALL-E等AI模型实现教学资源的智能生成,支持跨模态创作[3] - 教师可将抽象概念转化为具象化多模态素材(如化学反应动态视频),学生可开展跨模态创作[3] - 生成式AI符合建构主义"情境—协作—意义建构"理论,为创新人才培养提供认知技术支持[3] 教育神经科学技术突破 - 教育神经科学融合认知神经科学、心理学与教育学,构建多模态数据采集技术体系[4] - 研究工具涵盖生理监测系统、眼动追踪、脑电采集等,形成数据采集链[4] - 技术突破包括:突破主观报告局限、实现毫秒级动态监测(脑电达1000Hz)、解锁内隐认知维度[5] 生成式AI驱动的学习评价创新 - 生成式AI提供从反馈诊断到预测干预的全链条解决方案,解决传统评价滞后性和片面性问题[6] - ChatGPT等AI可实现比人工更精准的论文评阅、代码诊断和语言纠错[6] - 多智能体系统具备自主规划能力,可动态生成个性化学习路径和进行事前评价[7] 新质生产力与高等教育的双向赋能 - 新质生产力通过理论、政策、资源和数智基建支撑教育数字化转型[8] - 高等教育通过多模态体系在人才培养、科研创新、技术产业化等方面反哺生产力发展[8] - 形成"教育培育人才—人才驱动创新—创新赋能产业"的价值创造链[8]