Workflow
多模态模型
icon
搜索文档
21对话|联汇科技CEO赵天成:具身智能演进方向的“非常答”
搜狐财经· 2025-07-28 12:37
行业趋势 - 2025世界人工智能大会(WAIC)异常火爆 一票难求 反映出行业热度持续攀升 [1] - 行业周期变化明显:2023年大模型最热门 2024年机器人最热门 2025年进入技术融合后AI落地应用百花齐放的阶段 [1] - 具身智能成为2025年最大热点之一 技术正从实验室走向物理世界实际应用 [1] 公司技术 - 联汇科技是全国最早研发多模态模型的企业 2022年获得工信部大模型检测001号证书 [1] - 多模态模型已从2021年第一代迭代至第五代 迭代速度约为一年一迭代 [2] - 发布全球首个"万物具身"智能体平台OmAgent 面向物理世界 可控制无人机、机器人等硬件载体 [1] - OmAgent具备两大核心能力:基于纯视觉的空间感知能力 以及基于任务的决策能力 [1] - 当前多模态模型技术特点:实时性要求高 低幻觉高准确率 能做深度视觉思考 [2] 技术发展路径 - 具身智能不限于人形 任何有智能的硬件载体都属具身智能 [2] - 不同载体发展阶段不同:人形机器人可能处于L1-L2 四足狗可能进入L3 摄像头/无人机可能达L3-L4 [2] - 具身智能将分载体成熟度、分阶段、分批次落地 [2] 公司战略布局 - 将国际总部落户上海张江 看重其智能终端与具身机器人产业聚集优势 [2] - 选择张江原因:能对接更多供应链企业 且物流/码头/工业制造等领域提供丰富应用场景 [2] - 多模态模型最佳应用场景是赋能智能终端 使硬件具备自主意识和任务完成能力 [1]
师兄自己发了篇自动驾大模型,申博去TOP2了。。。
自动驾驶之心· 2025-07-09 20:56
大模型在自动驾驶领域的应用趋势 - 大模型在自动驾驶功能上的落地逐渐清晰化,理想、华为等公司开始推行VLA、VLM方案 [2] - 下一代大模型需关注轻量化与硬件适配、知识蒸馏与量化加速、高效微调等方向 [2] - CoT方案和VLA+强化学习等高级推理范式成为行业重点 [2] 大模型优化技术研究方向 - 参数高效计算:研究剪枝稀疏化和量化加速等轻量化方法 [3] - 知识动态扩展:探索检索增强生成(RAG)和参数高效微调(PEFT)技术 [3] - 复杂推理优化:研究链式思维(CoT)和强化学习优化(GRPO)等范式 [3] 课程核心内容 - 系统探讨大模型前沿优化方法,包括参数压缩、知识扩展和推理优化 [3] - 关键技术涵盖结构化剪枝、低比特量化、动态检索、多跳推理等 [3] - 实验平台使用主流大模型如LLaMA、GPT,结合理论讲解与实践 [3] 课程目标与收获 - 帮助学员系统掌握大模型优化理论,形成清晰知识体系 [8] - 提升Coding能力,实现论文复现与模型开发 [8] - 提供论文写作方法论、修稿指导与投稿建议 [8] 课程招生与要求 - 招生对象:大模型方向本硕博、申硕申博、AI领域从业者 [9] - 招生人数:6人/期,至多8人 [5] - 要求:具备深度学习基础,熟悉Python和PyTorch,有研究热情 [10] 课程大纲与时间安排 - 12周在线科研+2周论文指导+10周论文维护期 [9] - 每周主题涵盖大模型剪枝、量化加速、PEFT、多智能体协作等 [20] - 最终产出论文初稿,具备投稿潜力 [9] 实验与资源支持 - 提供Baseline代码,涵盖剪枝、量化、多模态推理等方向 [19] - 数据集采用公开资源或垂类自定义数据 [17] - 硬件要求最低2张4090显卡,建议4张或租赁云服务器 [15] 学术支持与成果预期 - 导师提供定制化研究idea,目标SCI 1~4区或CCF A/B/C级别论文 [22] - 课程交付价值包括科研流程、写作方法、论文初稿 [22] - 答疑周期为6个月,确保后续研究支持 [22]
[大模型实践] 卡比人贵时代的深度学习经验
自动驾驶之心· 2025-06-20 22:06
大模型实验方法论 - 选准关键指标指导迭代方向,避免盲目追求表面指标而忽略真正区分SoTA能力的核心指标[1][4] - 识别实验真瓶颈,通过文献阅读和同行讨论排除低效调参,聚焦验证强假设而非网格搜索[1][5] - 平衡大小实验组合:大实验(10B-100B规模)用于发现问题,小实验快速筛选有效想法[1][6] 实验设计与效率优化 - 定性实验需揭示新现象(如长链思维o1/R1的应用突破),而非仅追求定量指标提升[4] - 自动化评测工具可提升效率,公司内部采用多榜单自动测试机制以发现潜在问题[4] - 避免低性价比实验,超参数微调或数据配比研究对大规模模型效果有限[5] 团队协作与资源整合 - 明确团队比较优势分工:卡资源充足者可主导大规模验证,资源有限者聚焦前期idea验证[8] - 通过高频交流与实验记录共享提升协作效率,优化资源分配(如卡调度)[8] - 大模型研发需跨角色协作,需结合社区定位调整团队研究方向[8] 行业技术动态 - 自动驾驶领域技术覆盖30+方向(BEV感知、多传感器融合、轨迹预测等),社区规模达4000+成员[9] - 前沿技术布局包括端到端自动驾驶、世界模型、大模型应用等,产学研结合紧密[9][11]
启明创投周志峰:AI的性能和成本已达到临界点,AI应用将在今年爆发
IPO早知道· 2025-04-29 11:01
AI行业投资框架 - AI行业投资分为三个层次:基础设施层、模型层、应用层 [7] - 基础设施层包括工具链、数据软件、AI安全、训练推理加速技术以及AI芯片和云算力平台等硬件基础 [7] - 模型层公司现阶段通过底层技术创新实现差异化,最终都将转型为应用企业 [7] - 应用层企业将占据AI市场主体地位,预计99%的企业属于应用层,捕获70%-80%的行业价值 [7] AI技术发展阶段 - 2025年将成为AI应用全面落地的关键年份,性能与成本将达到临界点 [4][7][8] - 科技浪潮发展规律显示,底层基础技术成熟后应用才会爆发,AI技术已临近这一阶段 [8] - 过去半年AI模型性能取得突破性进展,最新模型智能水平接近人类天才级别 [10] - 成本优化与性能突破同等重要,行业已进入"普惠成本"时代 [10][11] 启明创投AI布局 - 已投资14家大语言模型、多模态模型、具身智能模型或端到端智驾模型的领军企业,数量在亚洲位居前列 [5] - 协助管理规模达100亿元的北京市人工智能产业投资基金 [6] - 在模型层已布局10余个具备模型开发与创新能力的公司,覆盖大语言模型、3D模型生成、语音生成等新兴领域 [11] - 应用层重点布局AI硬件、AI教育、AI医疗、企业级AI、AI内容平台、具身智能等细分领域 [11] AI商业化路径 - AI商业化将遵循与互联网相似的发展路径,从单一工具向平台性产品转型 [10] - AI技术不仅创造全新产品形态,也能在传统产品中创造巨大价值 [11] - AI应用将渐进式改变生活,而非突然颠覆 [11]