Workflow
多模态模型
icon
搜索文档
半年 ARR 增 10 倍达数千万美金,非结构化数据结构化的需求正在爆发
投资实习所· 2025-12-26 13:49
文章核心观点 - 生成式AI,特别是多模态模型,正在彻底改变企业处理非结构化数据的方式,使其从难以利用的“数字工件”转变为可对话、可分析、可自动化的“数字内存”,这代表了企业信息处理方式的根本性转变 [1][2][5] - 企业内非结构化数据(如文档、合同、音视频)占比高达90%,而传统可处理的结构化数据仅占10%,AI解锁非结构化数据的价值将成为企业最宝贵的资源之一 [2][6] - 这一趋势正在催生巨大的市场机会,涌现出专注于企业级非结构化数据处理和自动化的成功创业公司,并在财务上表现出惊人的增长 [10][11][14] 行业趋势与市场洞察 - AI最大的价值点在于对非结构化数据的处理,这是海外B端创业者的深刻共识 [1] - 企业信息中,非结构化数据占据了约90%,而结构化数据仅占10%左右 [2] - 生成式AI首次实现了与非结构化数据的对话,并能以无限的规模和速度执行人类任务,完全改变了游戏规则 [5] - 会议语音是尚未被充分利用的数据金矿,是知识工作者实践的黑洞 [9] - 企业CEO和高管正在寻找安全、可靠、贴合公司业务背景的ChatGPT企业版本 [10] 代表性公司及产品分析 - **Box**:其创始人指出,AI正在引发企业信息处理方法上前所未有的巨大转变 [2] - **Otter**:作为AI笔记转录产品,其已成为首个年度经常性收入超过1亿美元的产品,证明了处理非结构化语音数据的市场价值 [9][14] - **Glean**:其年度经常性收入已突破2亿美元,核心是将类似ChatGPT的能力安全地融入企业环境,解决AI不了解企业内部业务背景的挑战 [10][14] - **NotebookLM**:有观点认为,此类产品的出现可能使所有结构化的CRM公司失去未来 [7] - **a16z投资的金融领域产品及通用Infra产品**:一家专注于金融非结构化数据处理,另一家通用基础设施产品在约半年内从0增长至超过100万美元年度经常性收入,随后半年多时间年度经常性收入又呈10倍级增长,超过1000万美元 [11]
北京跑出“全球大模型第一股”!CFO职位空缺,董秘负责财务管理
搜狐财经· 2025-12-22 19:08
公司上市进程与行业意义 - 智谱已于2024年12月19日披露港交所聆讯后资料集,由中金公司担任独家保荐人,即将成为港股与全球AI领域的“大模型第一股” [4][5] - 作为中国大模型“六小虎”中首家启动IPO的企业,其上市将为长期缺乏公开市场估值参照的大模型行业提供市盈率、市销率等可量化的估值锚点,填补“无公开标的”的行业空白 [5] - 从全球竞争格局看,智谱的上市将使中国AI企业首次在资本市场节奏上领先于OpenAI、Anthropic等美国巨头,标志着中国大模型产业从“技术竞赛”进入“资本验证”的新阶段 [5] 融资历史与股东背景 - 自2019年成立以来,公司累计完成8轮融资,筹资总额超过83亿元人民币,IPO前估值已达243.8亿元人民币 [5] - 融资吸引了高瓴资本、启明创投、君联资本等知名机构,以及美团、腾讯、小米、蚂蚁等互联网巨头 [5] - 仅在2024年12月以来的半年内,公司就密集完成了超50亿元人民币的融资 [5] - 根据招股书披露的融资表格,公司估值从2021年天使轮后的约4.07亿元人民币,增长至B5轮融资后的超百亿元人民币 [6] 业务概况与市场地位 - 公司是中国领先的人工智能公司,致力于开发先进的通用大模型,其业务是为机构客户和个人用户提供通用大模型服务 [6][7] - 根据弗若斯特沙利文的资料,按2024年收入计,智谱在中国独立通用大模型开发商中位列第一,在所有通用大模型开发商中位列第二,市场份额为6.6% [7] - 截至2025年6月30日,公司的模型已为逾八千家机构客户提供支持;截至最后实际可行日期,已为约8000万台设备提供支持 [7] 财务表现 - 公司收入实现显著增长:2022年、2023年及2024年收入分别为5740万元、1.25亿元及3.12亿元人民币,复合年增长率超过130% [7] - 截至2024年及2025年6月30日止六个月,公司收入分别为4490万元及1.91亿元人民币,显示持续高速增长 [7] - 公司目前处于亏损状态:2022年、2023年、2024年以及截至2024年及2025年6月30日止六个月,分别录得年内亏损1.44亿元、7.88亿元、29.58亿元、12.36亿元及23.58亿元人民币 [7] - 亏损主要源于对研发的重大投资:研发开支从2022年的8440万元增至2023年的5.29亿元,并进一步增至2024年的21.95亿元人民币 [8] - 研发开支由截至2024年6月30日止六个月的8.59亿元增加85.6%至2025年6月30日的15.95亿元人民币 [8] 产品与技术平台 - 公司围绕一体化MaaS平台组织产品供应,主要提供四类模型:语言模型、多模态模型、智能体模型及代码模型,以及用于模型微调、部署及智能体开发的集成工具 [8] - 公司的AI模型旨在赋予AI三种核心人类能力:深度思考、认知世界及工具使用,并据此开发了反思及沉思模型、多模态模型、智能体模型及代码模型 [9] - 具体模型包括GLM-Z1、CogView、GLM-4.5V、CogVideoX、AutoGLM、CodeGeeX等 [10] - 截至最后实际可行日期,公司在中国拥有86项注册专利(其中84项为发明专利)、234项专利申请、160项著作权、314个商标及58个域名 [10] 募资用途 - 本次香港IPO募资金额拟用于以下用途:约70.0%用于持续增强公司在通用AI大模型方面的研发能力;约10.0%用于优化公司的MaaS平台;约10.0%用于发展业务合作伙伴网络及进行战略投资;约10.0%用于营运资金及其他一般企业用途 [15] 公司治理与高管信息 - 公司联合创始人张鹏博士(46岁)担任执行董事、首席执行官兼总经理,负责业务发展、研发以及日常运营及管理 [14] - 公司联合创始人王绍兰先生(52岁)担任首席运营官,负责业务发展、融资以及日常运营及管理 [14] - 公司原CFO彭建标已于2025年5月离职 [11][13] - 目前,公司董事会秘书肖磊先生(37岁)负责集团企业管治及财务营运,其于2025年10月30日加入集团,并于2025年12月18日获委任为高级管理层 [14][15]
计算机ETF(512720)连续4日迎净流入,智谱、MiniMax通过港交所聆讯
每日经济新闻· 2025-12-22 14:25
公司动态 - 智谱于12月17日通过港交所上市聆讯 标志着港股将首次迎来以“基座模型”为核心的上市公司 [1] - MiniMax于同日通过港交所上市聆讯 该公司聚焦于多模态模型领域 [1] - 以基座模型和多模态模型为主要赛道的AI大模型公司 正式进入港股IPO冲刺阶段 预计2026年初登陆资本市场 [1] 行业与产品 - 计算机ETF(512720)跟踪的是CS计算机指数(930651) [1] - CS计算机指数从A股市场中选取涉及软件开发、IT服务、硬件制造等业务的上市公司证券作为指数样本 [1] - 该指数旨在反映计算机行业相关上市公司证券的整体表现 [1] - 该指数具有显著的成长性和技术导向性特征 能够较为全面地体现计算机行业的市场动态和发展趋势 [1]
AI重塑量化投资新范式 行业洞见技术边界与未来
中国证券报· 2025-11-29 04:25
AI重塑量化投资底层逻辑 - 人工智能大规模应用推动量化行业呈现前所未有的跃迁 投研体系与技术能力产生化学反应[1] - 行业变化体现为数据边界急剧拓宽 从结构化财务数据扩展到公告文本、舆情信息、论坛评论、图像材料甚至音视频内容等多模态数据源[2] - 中国量化行业十年前系统性引入机器学习模型 AI大模型出现让策略研发边界进一步外延 深度模型带来收益空间成为全球量化共识[2] 技术应用与策略重塑 - 机器学习一定程度上摆脱对经验丰富"老师傅"的依赖 以高效方式重新定义研究范式[2] - 在短周期策略中 行业不再只专注可解释性 深度模型虽不一定可解释但确实更有效[2] - 人工智能标志性突破为2016年谷歌AlphaGo及后续AlphaZero 显示机器在复杂决策任务中超越人类[2] AI应用挑战与局限性 - AI在回测环境表现惊人 实盘需解决解释性不够、样本外波动大、极端行情易失灵等问题[3] - 大模型本质是文字接龙概率游戏 无法天然具备因果逻辑 相关性不能预测未来 因果律才是投资核心[3] - 模型稳定性面临不可重复性和过拟合两大挑战 需将先验知识与经验嵌入模型 通过专业人员为模型加护栏减少黑箱效应[3] - AI模型存在容易过拟合、可解释性弱、过度依赖数据等问题 反对盲目跟风热点的替代式创新 强调基于既有研究优势的增量式创新路径[3] 行业发展趋势与人机协同 - 技术演进速度非常快 大模型相关知识几乎以每年一代速度更新 人才结构呈现加速年轻化趋势[3] - 收益持续守正 量化AI用奇 在稳健基础上探索技术创新 坚持价值投资理念 运用AI技术提升决策质量而非替代决策本身[4][5] - AI策略代表电脑 人工策略代表人脑 兼容并蓄的人机协同是更优资源配置思路[5] - 大模型不会只是工具 将逐渐成为投研流程的基础架构之一 从拥抱到融入AI变成投研底座能力[5] - 人机协作边界将更清晰 把已知交给机器 把未知留给人 人类在认知、判断与风险管理中承担更重要角色[5]
宇树科技王兴兴:今年像做梦,明后年机器人领域惊喜更多
21世纪经济报道· 2025-11-07 18:19
公司动态与战略 - 京东计划建设全球首个全无人配送站 [1] - 宇树科技正与国内外公司合作探索机器人领域的具身模型和多模态模型 [2] 行业趋势与技术展望 - 机器人领域在最近一年取得突破性进展,许多科幻场景已成为现实 [1] - 机器人具身智能AI领域相较于其他前沿技术突破相对容易实现 [1] - 多模态模型和视频生成模型自去年至今取得天翻地覆的进步,已能生成接近电影级别或以假乱真的视频 [1] - 机器人领域的通用模型被视为实现AGI(通用人工智能)最可能的路径 [2] 管理层预期 - 宇树科技创始人王兴兴预计未来一至两年机器人领域将带来比今年更多的惊喜 [1]
易鑫张磊:以全栈AI能力构建汽车金融“中国式方案” 推动行业迈向Agent智能时代
智通财经· 2025-08-31 00:46
公司AI技术投入与能力 - 公司累计在研发与AI领域投入超20亿元 年交易规模达700亿元[3] - 自研大模型是汽车金融行业唯一通过国家备案的模型 并实现DeepSeek-V3本地化部署与全面应用[3] - 构建覆盖预训练 后训练及多尺寸领域的全栈AI能力体系[3] AI技术融合业务场景演进 - AI技术融合分为三阶段:1.0判别式AI时期"人主AI辅" 2.0深层次AI阶段大模型参与判断 3.0 Agent AI代表"机主人数"动态业务流程[3] - 公司已实现从模型训练到业务应用的全链路AI产品化布局[3] - 产品布局包括自研AI原生话务系统 多模态模型 机器人平台和新媒体创作平台[3] AI在汽车金融全流程应用 - 融资前通过AI自动生成渠道分析报告和多模态资料提取[5] - 融资中依托端到端风控模型直接处理原始信息 减少人工干预[5] - 融资后借助语音情感分析预判客诉风险 制定个性化资产管理策略[5] Agent化业务重构与双轮驱动 - 公司以AI Agent业务面和风控智能链双轮驱动推进Agent化业务重构[7] - 外呼助手 IM助手 审批助手三类智能体通过协同与实时交互在零人工介入下完成全流程操作[7] - 智能体协同显著提升链路效率与决策精度[7] 技术竞争力与行业影响 - AI技术能力在国内市场获得验证 在全球范围展现出竞争力[7] - 中国在AI技术与场景结合的深度上具有独特优势[7] - 公司依托全栈AI能力和成熟业务验证模型持续输出汽车金融领域中国式方案[7]
易鑫(02858)张磊:以全栈AI能力构建汽车金融“中国式方案” 推动行业迈向Agent智能时代
智通财经网· 2025-08-29 19:44
公司AI战略与投入 - 公司作为国内领先金融科技上市企业 以AI为核心驱动力 累计研发与AI领域投入超20亿元 年交易规模达700亿元 [3] - 公司自研大模型是汽车金融行业唯一通过国家备案模型 并实现DeepSeek-V3本地化部署与全面应用 构建覆盖预训练 后训练及多尺寸领域的全栈AI能力体系 [3] AI技术演进路径 - AI技术与业务场景融合分为三阶段:1.0判别式AI时期人主AI辅 2.0深层次AI阶段大模型参与判断 3.0 Agent AI阶段机主人数动态业务流程 [3] - 公司已实现从模型训练到业务应用的全链路AI产品化布局 包括自研AI原生话务系统 多模态模型 机器人平台和新媒体创作平台 [3] 汽车金融业务应用 - AI能力深度嵌入融资前-中-后全流程:融资前通过AI自动生成渠道分析报告和多模态资料提取 融资中依托端到端风控模型直接处理原始信息减少人工干预 融资后借助语音情感分析预判客诉风险并制定个性化资产管理策略 [3] - 公司以AI Agent业务面与风控智能链双轮驱动推进Agent化业务重构 在进件预审批环节通过外呼助手 IM助手 审批助手三类智能体协同实现零人工介入全流程操作 [5] 行业竞争力与全球影响 - 公司AI技术能力在国内市场获得验证 并在全球范围展现竞争力 中国在AI技术与场景结合深度上具有独特优势 [5] - 公司依托全栈AI能力和成熟业务验证模型 持续输出汽车金融领域中国式方案 为AI时代金融科技的服务创新与全球竞争提供重要实践路径 [5]
中信建投阐述2025年AI投资策略:AIPC具备爆款应用诞生的可能性
智通财经网· 2025-07-29 16:30
大模型发展趋势 - 大模型向更强大、更高效、更可靠方向发展,呈现推理模型深化和智能体模型爆发格局[1] - 模型规模和数据量持续突破,大模型展现出显著"涌现能力",实现从量变积累到质变突破[1] - 更强大体现为Scaling Law跨域延伸、推理能力自主进化、多模态深度融合等六方面[1] - 更高效依托MOE架构优化、FP8低精度应用、Mamba新型架构探索及计算效率提升[1] - 更可靠通过Scaling Law降幻觉、实时事实验证、思维链等方法实现[1] 中美AI竞争格局 - 中美两国自研大模型数量占全球80%以上,中国大模型数量接近100款[2] - 中美顶级AI模型能力差距从20%缩小至0.3%,DeepSeek-R1迈出中国AI全面追赶关键一步[2] - 中国企业在算力受限情况下,在更高效方面做到全球领先[2] - 国产模型呈现百花齐放局面,包括豆包Seed1.6、阿里通义千问、KimiK2等[2] - 2025年是世界认知中国人工智能潜力第一年,未来有望走出国门[2] 商业化进展与收入 - OpenAI已实现百亿美金ARR,月度CAGR保持10%环比增速[2] - Claude4 ARR半年时间从10亿美金奔向30亿美金,月度CAGR超过20%环比增速[2] - 截至1Q25,34%美国成年人已采用ChatGPT,相当于PC互联网2003-04年渗透率水平[2] - AI应用下载量达14亿次,占据全球所有应用下载量约1.0%,付费比例超过下载比例[2] - AI应用内购收入占据整体应用(剔除游戏)比例约1.73%[2] 应用渗透趋势 - AI大模型对产业渗透速度超过此前互联网革命,商业化潜力和付费意愿超过传统应用[2] - 落地顺序由容错率与复杂度决定,从高容错、单一任务场景到低容错、高复杂度场景[1] - 本轮AI渗透较互联网时代大幅提速,B端落地进程或超预期[1] - 从行业限制角度看,生产环境与法规限制较少产业会快于限制较多产业[2] AI Agent发展 - AI Agent将成为2025年AI发展重要方向,正进入技术突破与商业化加速阶段[2] - Agent将大模型能力从"做题"延伸到"工作"中,执行任务准确率大幅提高[2][3] - 多智能体集群将带来AI群体智能涌现,进一步提升大模型性能[2] - Agent执行一次任务平均消耗token达到10万量级,大幅超过AI搜索单次问答消耗[3] - Agent发展依赖于数据和生态,具备数据优势、生态体系构建企业更具发展潜力[2] 多模态进展 - 多模态模型历经三阶段发展,当前以"语言为统一交互工具"实现跨模态对齐[3] - 25年上半年全球有超30款多模态模型更新或发布,其中超75%为国产模型[3] - 国产模型在时长上达2分钟,效果多次登顶全球榜单,多端可用且价格更低[3] - 多模态应用C端聚焦社交娱乐,B端侧重营销素材与商品图创作,专业领域降本增效显著[3] - 一分钟视频生成token消耗在10万token至百万token量级[3] 算力需求变化 - AI算力消耗从训练转向推理,带来显著增量需求[1][3] - 增量需求主要来自四方面:互联网大厂AI与业务结合、Agent推理、多模态商业化、主权AI[3] - 谷歌搜索AI模式将带来日均27万亿token消耗,超过其Gemini模型目前日均16万亿token消耗[3] - 超过50%广告主在生成创意内容时使用AIGC,AI营销内容占比超过10%[3] - 快手可灵四五月连续两月付费金额超过1亿,多模态加速渗透带来算力需求提升[3] 算力基础设施投资 - 推理占比提升带动云计算厂商投入产出比清晰化,超卖率有望继续提升[4] - 散热成为AI算力领域核心技术升级方向,单卡功耗从700瓦迭代至2000瓦+[4] - 铜连接在短距数据传输成熟度更高,448G等新技术路线逐步面世[4] - 电源领域高功率带动单W价值提升,5.5KW电源已进入量产阶段[4] - PCB持续升级带动产业链上游升级,覆铜板从M6/M7升级到M8/M9[4] 光模块与先进封装 - 800G光模块2023年开始放量,2024-2026年保持高速增长[4] - 1.6T光模块2025年开始出货,2026年有望放量,产业链迎来量价齐升[4] - Chiplet设计+异构先进封装成为性能与成本平衡最佳方案[4] - 台积电CoWoS封装技术实现计算核心与HBM通过2.5D封装互连[4] - 先进封装市场快速增长,成为国内晶圆代工厂商与封测厂商新成长驱动力[4] 国内算力链发展 - 美国BIS政策持续收紧,国产芯片占比提升是必然趋势[4] - 国内算力消耗快速增长,字节跳动每三个月token消耗接近翻一倍[4] - 5月底字节跳动token消耗为16.4万亿token,预计30万亿token时出现算力紧张[4] - 国内增速斜率更陡峭,国产芯片今年将迎来发展大年[4] C端应用发展 - AI应用普及程度相当于美国PC互联网2003-04年水平,且增速迅猛[5] - AI原生应用以AI为架构核心,软件开发范式从代码、权重到提示词转变[5] - 海外AI应用数量自2023年1月起每月新增超1000款,2024年超4000款[5] - 内容创作工具商业化进度领先,通用助手、垂直领域智能体等多类应用并存[5] B端应用渗透 - 美国企业采用AI技术比例为9.2%,低于C端,大型企业采用率最高[5] - 容错率与复杂度决定B端各场景AI应用落地顺序[5] - 模型推理能力决定复杂任务场景突破速度,模型幻觉率决定容错率场景突破进度[5] - 从AI+搜索/AI+编程场景到具身智能/AI+制药场景尚需一定时间周期[5] 教育领域应用 - 教育因场景清晰性、数据丰富性和需求刚性,成为AI技术落地黄金赛道[5] - AI+教育软件通过算法分析学情数据、动态定制学习路径,实现教学流程智能化重构[5] 医疗制药领域应用 - AI算法在临床前药物发现阶段有深入应用,完全由AI研发新药有望在1-2年内上市[5] - 海外头部临床CRO公司在临床试验中已布局AI多年[5] - AI有望重塑药物发现模式,为制药行业带来降本增效[5] - AI医疗在医疗器械功能、检查检验结果解读、辅助临床决策等多个领域应用价值较大[5] 工业领域应用 - AI+工业沿两条主线突进:增量市场构建AI原生工厂,存量改造解决关键瓶颈[5] - 新能源汽车、光伏等新兴制造领域从零构建AI原生工厂[5] - 传统重工业通过渐进式部署解决关键瓶颈,如钢铁企业用参数优化模型降低能耗[5] - 当AI将分散专家经验凝练为可复用工业智能,传统制造效率边界被重新定义[5] 军事领域应用 - AI正加速落地,广泛用于无人作战系统与战场决策支持[5] - 美军构建三层级作战架构,实现从感知到打击的闭环式智能决策[5] - 系统性赋能无人系统、网络攻防、战场感知、战争推演与后勤保障等五大领域[5] - 未来军事竞争重点关注低轨卫星、AI平台与边缘智能、智能无人系统三大方向[5] 机器人发展 - 机器人大模型训练方式向端到端大模型+世界模型发展[6] - Gemini Robotics已实现视觉-语言-动作三模态深度融合[6] - 具身智能大模型存在数据集不够、思考跟不上运动、缺乏生态等痛点[6] - 多家人形机器人产品已在下游工业客户展开实训[6] - 预计人形机器人市场规模将远超汽车、3C行业,带动相关产业链旺盛需求[6] 智能驾驶进展 - 特斯拉FSD Beta V12.3为第一个使用端到端神经网络版本[6] - 端到端大模型具有数据驱动、上限高、计算效率提升、驾驶体验逼近人类四大优势[6] - VLA通过融合视觉、语言等多模态数据构建"多模态世界模型"[6] - 2025年成上车元年,元戎启行、理想等车企加速布局低速场景试点[6] - 比亚迪将高阶智驾下沉至10万级,带动城市NOA渗透率提升[6] 端侧AI发展 - 端侧硬件多元化高度契合人工智能技术交互需求[6] - 模型分级分工是当前端侧AI阶段性特色,无法承载千亿参数规模大模型[6] - 不同场景下端侧硬件展现不同技术需求:AI眼镜追求轻薄高续航,AI手机追求隐私高效[6] - 技术路线呈现容量更大、电量更足、模型更强、声光屏交互更便捷发展趋势[6] AI PC发展 - AI PC是AI终端重要落地应用场景,产业龙头已明晰新一代AI PC标准[6] - 处理器包含NPU模块的电脑即为AI PC,多数任务能够在PC本地运行[6] - 联想推出ThinkPad X1 Carbon Aura AI元启版,AI算力高达120TOPS[7] - 联想推出全球首款部署Deepseek端侧大模型AI PC,实现70亿参数端侧模型流畅运行[7] - 边缘AI应用示例已从去年1-2个增长至数百个,预计2024年将达到上千个[7]
21对话|联汇科技CEO赵天成:具身智能演进方向的“非常答”
搜狐财经· 2025-07-28 12:37
行业趋势 - 2025世界人工智能大会(WAIC)异常火爆 一票难求 反映出行业热度持续攀升 [1] - 行业周期变化明显:2023年大模型最热门 2024年机器人最热门 2025年进入技术融合后AI落地应用百花齐放的阶段 [1] - 具身智能成为2025年最大热点之一 技术正从实验室走向物理世界实际应用 [1] 公司技术 - 联汇科技是全国最早研发多模态模型的企业 2022年获得工信部大模型检测001号证书 [1] - 多模态模型已从2021年第一代迭代至第五代 迭代速度约为一年一迭代 [2] - 发布全球首个"万物具身"智能体平台OmAgent 面向物理世界 可控制无人机、机器人等硬件载体 [1] - OmAgent具备两大核心能力:基于纯视觉的空间感知能力 以及基于任务的决策能力 [1] - 当前多模态模型技术特点:实时性要求高 低幻觉高准确率 能做深度视觉思考 [2] 技术发展路径 - 具身智能不限于人形 任何有智能的硬件载体都属具身智能 [2] - 不同载体发展阶段不同:人形机器人可能处于L1-L2 四足狗可能进入L3 摄像头/无人机可能达L3-L4 [2] - 具身智能将分载体成熟度、分阶段、分批次落地 [2] 公司战略布局 - 将国际总部落户上海张江 看重其智能终端与具身机器人产业聚集优势 [2] - 选择张江原因:能对接更多供应链企业 且物流/码头/工业制造等领域提供丰富应用场景 [2] - 多模态模型最佳应用场景是赋能智能终端 使硬件具备自主意识和任务完成能力 [1]
师兄自己发了篇自动驾大模型,申博去TOP2了。。。
自动驾驶之心· 2025-07-09 20:56
大模型在自动驾驶领域的应用趋势 - 大模型在自动驾驶功能上的落地逐渐清晰化,理想、华为等公司开始推行VLA、VLM方案 [2] - 下一代大模型需关注轻量化与硬件适配、知识蒸馏与量化加速、高效微调等方向 [2] - CoT方案和VLA+强化学习等高级推理范式成为行业重点 [2] 大模型优化技术研究方向 - 参数高效计算:研究剪枝稀疏化和量化加速等轻量化方法 [3] - 知识动态扩展:探索检索增强生成(RAG)和参数高效微调(PEFT)技术 [3] - 复杂推理优化:研究链式思维(CoT)和强化学习优化(GRPO)等范式 [3] 课程核心内容 - 系统探讨大模型前沿优化方法,包括参数压缩、知识扩展和推理优化 [3] - 关键技术涵盖结构化剪枝、低比特量化、动态检索、多跳推理等 [3] - 实验平台使用主流大模型如LLaMA、GPT,结合理论讲解与实践 [3] 课程目标与收获 - 帮助学员系统掌握大模型优化理论,形成清晰知识体系 [8] - 提升Coding能力,实现论文复现与模型开发 [8] - 提供论文写作方法论、修稿指导与投稿建议 [8] 课程招生与要求 - 招生对象:大模型方向本硕博、申硕申博、AI领域从业者 [9] - 招生人数:6人/期,至多8人 [5] - 要求:具备深度学习基础,熟悉Python和PyTorch,有研究热情 [10] 课程大纲与时间安排 - 12周在线科研+2周论文指导+10周论文维护期 [9] - 每周主题涵盖大模型剪枝、量化加速、PEFT、多智能体协作等 [20] - 最终产出论文初稿,具备投稿潜力 [9] 实验与资源支持 - 提供Baseline代码,涵盖剪枝、量化、多模态推理等方向 [19] - 数据集采用公开资源或垂类自定义数据 [17] - 硬件要求最低2张4090显卡,建议4张或租赁云服务器 [15] 学术支持与成果预期 - 导师提供定制化研究idea,目标SCI 1~4区或CCF A/B/C级别论文 [22] - 课程交付价值包括科研流程、写作方法、论文初稿 [22] - 答疑周期为6个月,确保后续研究支持 [22]