多模态大模型

搜索文档
独家|孵化中国版“GPT-4o”的无界方舟连续完成亿元级融资,基于自研多模态大模型,打造AI应用的“最强大脑”
Z Potentials· 2025-07-16 11:24
融资情况 - 公司完成Pre-A & Pre-A+轮亿元级别融资,Pre-A轮由BAce Capital、小饭桌创投联合领投,英诺天使基金、珠海科技集团、吴中金控跟投,Pre-A+轮由柏睿资本独家投资 [1] - 新一轮融资正在紧密推进中 [9] 公司背景与团队 - 公司成立仅一年半,凭借底层多模态大模型研发到软硬一体Agent应用的完整闭环能力,迅速成为中国AI赛道黑马 [1] - 创始人曾晓东博士是人工智能领域国际权威学者,拥有15年算法研发及产业化经验,主导研发阿里巴巴第一代机器翻译系统,联合创立蚂蚁技术实验室,获MIT TR35殊荣 [2] - 联合创始人具备深厚互联网大厂产品与设计管理背景,屡获红点奖、iF设计奖等国际顶级奖项 [2] - 核心成员来自字节跳动、阿里巴巴、蚂蚁集团等头部科技企业及国内外顶尖高校,专业能力覆盖AI全产业链 [2] 核心技术 - 自研端到端多模态大模型EVA,对标OpenAI的GPT-4o,解决多模态商业化致命瓶颈,为AI应用赋予"超级感官"与"真大脑" [3] - 模型通过中央网信办双备案,核心数据资产获广东省首张人工智能模型数据产权登记证书,估值达3.8142亿元,创全国单笔大模型数据资产最高纪录 [3] - 四大核心优势: - "高智商":EVA-1模型在视觉理解、听觉推理和跨模态逻辑推断上表现卓越,比肩GPT-4o [6] - "真人般交互":多模态交互延迟约350毫秒,内置48类细粒度情绪引擎,支持21种主流语言 [6] - 全自动多模态数据合成引擎AutoFusion 4D,每月可生成超10万小时高精度情感多模态数据,成本仅为人工的1/50 [6] - 支持大规模商用落地,多模态调用成本降低95%,单机H20本地部署支持数百并发推理 [6] 产品落地与商业化 - 创立第一年即实现商业化,服务生物医药、金融等行业标杆企业,取得近千万营收 [4] - 国内首家推出对标GPT-4o的自研多模态模型,领先国内大厂半年 [4] - 2024年9月推出AI硬件产品demo"阿奇",实现端到端音视频实时互动、350ms极低延迟反馈、多语种交流与情绪表达 [4] - 首款智能硬件产品将于Q3量产上市,搭载新一代自研多模态大模型 [5] - 计划开源多模态Agent平台,支持开发者低成本创建实时多模态交互的AI Agent软硬件产品 [5] 投资人观点 - 投资人认为公司全栈核心技术自研及产品整合能力独特,成功打通从模型、Agent到终端产品的完整链路 [8] - 多模态模型的先发落地优势显著,极低延迟、精准情绪识别和表达推动人机共处未来愿景 [8] - 商业化进展迅速,已在生物医药、金融、教育及生活娱乐等多个领域落地行业标杆客户 [8] - 融资将用于多模态模型与Agent技术研发升级、重点场景应用落地、产业链上下游集成及市场拓展 [8]
东海证券晨会纪要-20250715
东海证券· 2025-07-15 12:53
报告核心观点 报告对银行业、机械设备、食品饮料、医药生物、电子等行业进行分析,指出银行业信贷与货币同步改善,各行业有不同发展态势和投资机会,如机械设备关注国产机器人等公司,食品饮料关注高端酒和区域龙头等,建议投资者关注各行业投资主线和相关个股[6][15][20]。 各行业报告总结 银行业 - 6月金融数据显示信贷与货币同步改善,社融增速8.9%,M2与M1同比分别增长8.3%与4.6%,企业和个人新发放贷款加权平均利率同比下降[6]。 - 旺季信贷投放边际改善,企业中长贷、短贷增加,票据贴现减少,居民中长贷、短贷增加,企业债券延续改善[7]。 - 政府融资靠前发力,6月新增政府债券13548亿元,支撑社融较快增长,后续信贷将聚焦优化结构[8][9]。 - 资金下沉使货币供应改善,存贷同步降息,息差压力趋缓,预计2025年息差下行压力小于2024年[9][10]。 - 建议关注稳定分红与复苏潜力投资主线,关注国有大行及头部中小银行[11]。 机械设备行业 - 智元机器人展示工业现场常态化作业能力,A2 - W机器人可高效完成任务并自主纠错[12]。 - 上海智元恒岳要约收购上纬新材部分股份,华测检测和巨星科技预计上半年归母净利润同比增长[13][14]。 - 出口链龙头有望把握机遇,建议关注国产机器人、检测行业、产能出海相关公司[15]。 食品饮料行业 - 上周食品饮料板块上涨0.84%,白酒和保健品表现较好,白酒板块情绪边际修复,茅台上半年完成经营任务[16][17]。 - 啤酒需求边际改善,成本下行释放利润弹性;零食板块高景气,餐饮供应链有望回暖,乳制品供需格局逐步改善[18][19]。 - 建议关注高端酒和区域龙头、经营稳健的啤酒企业、高景气零食企业、餐饮供应链企业和乳制品企业[20]。 医药生物行业 - 上周医药生物板块上涨1.82%,跑赢沪深300指数1个百分点,CXO板块及个股表现活跃[22]。 - 药明康德和博腾股份发布2025年半年度业绩预告,业绩超预期,建议关注CXO等细分板块及个股投资机会[23][24]。 电子行业 - 2025半年度业绩预告显示,端侧AI厂商业绩亮眼,乐鑫科技和瑞芯微营收和净利润大幅增长[27][28]。 - 多模态大模型Grok 4发布,推理能力提升10倍,HLE成绩打破记录,本周电子行业跑赢大盘[29][30]。 - 建议关注AIOT、AI驱动、设备材料、消费电子周期筑底板块投资主线[31]。 财经新闻 - 7月15日央行开展14000亿元买断式逆回购操作,3月和6月期限分别实现1000亿净投放[32]。 - 央行副行长邹澜等介绍上半年金融统计数据,提及人民币汇率稳定,中小银行增持债券应平衡收益和风险[32]。 - 6月末M2余额330.29万亿元,同比增长8.3%,M1余额113.95万亿元,同比增长4.6%,上半年社融增量22.83万亿元[33]。 A股市场评述 - 上交易日上证指数震荡收红,涨幅0.27%,深成指、创业板回落,主要指数分化,短线指数有震荡预期[34]。 - 上证指数周线呈星状K线,虽无趋势性回落风险,但震荡可能性提高,深成指、创业板分钟线指标走弱[35]。 - 上交易日贵金属等板块涨幅居前,多元金融等板块回落居前,微盘股指数表现活跃但指标走弱[36]。 市场数据 展示了2025年7月14日融资余额、逆回购、国内外利率、股市、外汇、国内外商品等市场数据及变化情况[40]。
汽车圈有水军恶意抹黑小米和华为?微博CEO:或有第三方暗中撺掇;曝阿里将推出「超级星期六」外卖计划;MiniMax获3亿美元融资
雷峰网· 2025-07-15 08:31
汽车行业动态 - 微博CEO指出汽车圈存在第三方水军恶意抹黑小米和华为的现象,涉及近20个博主被禁言[4] - 理想汽车调整组织架构,新设算力资源部门由龙开文负责,整合原系统运营和智能云部门,目标支撑自研大模型部署[7][8][9] - 雷军与黄仁勋时隔12年再次同框合影,引发关于小米SU7 Ultra与英伟达潜在合作的猜测[9][10] - 理想i8内饰遭提前泄露,涉事者或面临千万索赔,该车型将于7月29日上市[20][21] - 华为尚界汽车瞄准20万级市场,首款车型H5已吸引超1000家经销商,搭载HUAWEI ADS 4系统[16] 科技与AI融资 - MiniMax完成3亿美元融资,投后估值超40亿美元,成为国内估值最高的大模型公司之一[6][7] - 马斯克预测AI将在5年内超越全人类智能总和,xAI公司因强制安装员工监控软件引发争议[28][37][38] - 黄仁勋称中国已具备足够计算能力,全球约50%AI开发者在中国,回应美国芯片出口限制[31] - Intel下一代Nova Lake-S处理器采用台积电2nm工艺,最高配置52核心,预计2026年上市[33] 电商与消费 - 阿里将推出"超级星期六"外卖促销计划,未来100天每周六发放188元红包[12][13] - 淘宝闪购日订单突破8000万,新注册商家超24万,众包骑手月均收入达12500元[13] - 顺丰高管变动:徐本松卸任CMO,由CIO耿艳坤接任,近期因运费问题与拼多多终止合作[15] 智能硬件与穿戴 - 华为穿戴设备总发货量突破2亿只,GT系列超5200万只,GT2曾创千万台销量[23][24] - iPhone 17 Pro系列曝光:新增深蓝色和橙色,采用一体化铝合金机身及横向矩阵摄像头设计[32] 企业战略调整 - 威马汽车计划9月复产,目标2025年产销1万辆,新投资人翔飞汽车披露三步走发展规划[24][25] - 字节跳动通过沐瞳科技收购杭州心光流美团队,加强游戏领域布局[17] - 索尼手机业务撤出芬兰市场,Xperia 1 VII在欧洲多国官网下架[35]
ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制:仅5%注意力头负责多模态视觉理解
机器之心· 2025-07-14 19:33
多模态大模型视觉头研究 - 研究发现多模态大模型中仅有不到5%的注意力头专门负责视觉理解任务,这些"视觉头"能有效聚焦并提取图片关键信息,而大多数注意力头主要关注文本信息或其他辅助特征[2] - 视觉头稀疏性现象表明模型的视觉理解能力高度依赖于极少数专门化的注意力头,这一发现为模型结构优化和资源分配提供了理论依据[2][8] - 提出基于OCR任务的无训练方法量化每个注意力头对视觉内容的关注程度,通过字符与视觉区域映射关系计算视觉得分[14][16] SparseMM方法设计 - 提出三部分KV-Cache分配机制:固定窗口大小的局部缓存、均匀分配的保底缓存、按视觉得分优先分配的关键视觉头缓存[18][20] - 差异化缓存策略在DocVQA等OCR-rich数据集上表现优异,在10%缓存预算下仍保持全缓存配置性能,显著优于AdaKV等方法[22][23] - 方法在通用视觉任务中展现强泛化能力,GQA和VQAv2等复杂视觉推理任务性能下降幅度控制在1%以内[25] 性能与效率提升 - 在32K输入长度下实现最高1.87倍解码加速,峰值显存占用减少约15GB,Qwen2-VL-7B模型显存减少2GB[27] - 可视化分析显示视觉头能准确定位图中物体或文字,而非视觉头往往关注错误区域,验证了差异化分配的科学性[28] - 方法为高分辨率图像和长上下文任务提供高效解决方案,显著提升多模态大模型部署效率[27][31] 技术实现路径 - 通过OCR任务标注建立字符与视觉区域映射关系,精确计算每个注意力头的视觉得分[14][16] - 采用注意力头级别缓存分配机制,对视觉头分配更多缓存预算以保留视觉信息,非视觉头仅分配必要缓存[9][17] - 方法开源提供完整论文、代码和项目地址,便于行业应用和研究参考[4]
电子行业周报:端侧AI厂商中报业绩亮眼,多模态大模型Grok4正式发布-20250714
东海证券· 2025-07-14 17:28
报告行业投资评级 - 标配 [1] 报告的核心观点 - 2025半年度业绩预告密集释出,端侧AI厂商业绩亮眼,多模态大模型Grok 4正式发布,推理能力较前代提升10倍,HLE成绩打破历史记录 当前电子行业需求处于温和复苏阶段,建议关注AIOT、AI驱动、设备材料、消费电子周期筑底板块四大投资主线 [5] - 行业需求在缓慢复苏,价格有所回暖;海外压力下自主可控力度依然在不断加大,可逢低缓慢布局 [5] 根据相关目录分别进行总结 行业新闻 - Grok 4发布,多模态能力或打开新应用场景,该模型在专业学科和复杂任务上的推理能力显著提升,展现其在长流程专业工作中的应用潜力 [11] - 海光C86新一代移动工作站及工作站首发,十余家主流整机厂商共同推出数十款C86终端新品,标志着国产终端从关键行业替代向全行业场景替代突围 [11] - 存储芯片龙头长鑫科技启动IPO,由中金、中信建投担任辅导机构 [11] - 台积电6月环比下滑17.7%,上半年营收同比增长40%,受汇率损失影响,6月营收较5月环比减少,但较2024年同期仍保持增长 [11] - 屹唐股份登陆科创板,主要从事集成电路制造过程中所需晶圆加工设备的研发、生产和销售 [12] - 三星Galaxy全球新品发布会召开,发布最新款大折叠Z Fold7和Galaxy Z Flip7,两款手机在外观、硬件配置等方面有明显升级 [12] - 华大九天宣布终止收购芯和半导体 [13] - JEDEC发布全新LPDDR6标准,以提高移动和AI内存性能,该标准代表了内存技术的重大进步 [13] - 华为海思Cat.1物联芯片Hi2131正式上市,采用超轻量芯片架构与极简休眠管理,功耗显著优化 [14] - 中国团队推出全球首款可编程全光信号处理芯片 [14] 上市公告重要公告 上市公司重要公告 - 弘信电子本次解除限售股份的数量为0.19亿股,占公司总股本的3.94%,其中实际可上市流通的股份数量为0.12亿股,占公司总股本的2.49%,上市流通日期为2025年7月11日 [16] - 奥比中光已累计回购股份40.36万股,占公司目前总股本的0.10%,回购成交的最高价为53.50元/股,最低价为41.63元/股,回购均价为49.62元/股,支付的资金总额为人民币0.2亿元 [16] - 共达电声已将1000万元的出资款实缴到位,浙江豪晨完成股权转让相关的工商变更,共达电声持有该公司42.67%股权,为浙江豪晨控股股东 [16] - 立讯精密已通过新加坡汇聚和新加坡立讯分别足额支付Leoni AG 100%股权和50.1%股权的交易款项,并完成股权所有权变更或收到相应股份过户的证明文件 [16] - 易天股份2025年第一次临时股东会同意公司以自有资金人民币1元收购深圳市易天半导体设备有限公司少数股东黄招凤持有的易天半导体40%股权,对应注册资本400万元,并承担本次收购股权对应的认缴而尚未实缴部分360万元注册资本的实缴义务,收购完成后,公司对易天半导体的持股比例将由60%增加至100% [16] - 奥尼电子本激励计划所涉及的标的股票数量为200.00万股,公司全部在有效期内的激励计划所涉及的标的股票数量为500.00万股,约占本激励计划草案公布日公司股本总额1.16亿股的4.30% [16] - 博通集成近日收到政府补助937.08万元,属于与收益相关的政府补助,占最近一年经审计的归属于上市公司股东净利润绝对值的比例为37.90% [16] - 路维光电可转换公司债券发行量为6.15亿元,上市地点为上海证券交易所,上市时间为2025年7月10日 [16] - 麦捷科技本轮投资方按照协议约定以人民币3200万元合计溢价认购公司人民币6.15亿元的新增注册资本,合计对应本轮投资后29.091%的公司股权 [16] - 秋田微拟以自有资金通过公司与全资子公司秋田微电子国际有限公司按照出资比例等比例向秋田微(泰国)有限公司增资2000万美元,增资完成后,泰国秋田微的注册资本由5500万泰铢增加至7.43亿泰铢 [16] 上市公司2025年半年度业绩预告 - 澜起科技2025年上半年预计实现营收26.33亿元,同比增长约58.17%;实现归母净利润11.00 - 12.00亿元,同比增长85.50% - 102.36%;实现归母扣非净利润10.30 - 11.20亿元,同比增长89.17% - 105.71% [18] - 全志科技2025年上半年预计实现归母净利润1.56 - 1.71亿元,同比增长31.02% - 43.62%;实现扣非净利润1.30 - 1.40亿元,同比增长59.94% - 72.25% [18] - 乐鑫科技2025年上半年预计实现营收12.20 - 12.50亿元,同比增长33.00% - 36.00%;实现归母净利润2.50 - 2.70亿元,同比增长65.00% - 78.00%;实现归母扣非净利润2.30 - 2.50亿元,同比增长58.00% - 72.00% [18] - 瑞芯微2025年上半年预计实现营收约20.45亿元,同比增长约64.00%;实现归母净利润为5.20 - 5.40亿元,同比增长185.00% - 195.00%;实现归母扣非净利润为5.05 - 5.25亿元,同比增长186.00% - 197.00% [18] - 工业富联2025年上半年预计实现归母净利润119.58 - 121.58亿元,同比增长36.84% - 39.12%;实现归母扣非净利润115.97 - 117.97亿元,同比增长35.91% - 38.25% [18] - 沪电股份2025年上半年预计实现归母净利润16.50 - 17.50亿元,同比增长44.63% - 53.40%;实现扣非净利润16.10 - 17.10亿元,同比增长44.85% - 53.85% [18] 行情回顾 - 本周沪深300指数上涨0.82%,申万电子指数上涨0.93%,行业整体跑赢沪深300指数0.11个百分点,涨跌幅在申万一级行业中排第24位,PE(TTM)53.20倍 [19] - 截止7月11日,申万电子二级子板块涨跌:半导体(+1.07%)、电子元器件(+0.27%)、光学光电子(+1.34%)、消费电子(+0.89%)、电子化学品(+0.72%)、其他电子(+0.11%),海外方面,台湾电子指数上涨1.63%,费城半导体指数上涨0.87% [21] - 本周半导体细分板块涨跌幅分别为:品牌消费电子(+0.33%)、消费电子零部件及组装(+0.96%)、半导体设备(+0.19%)、面板(+1.52%)、被动元件(-1.01%)、LED(+0.79%)、数字芯片设计(+0.78%)、模拟芯片设计(+0.76%)、印制电路板(+0.62%)、电子化学品Ⅲ(+0.72%)、光学元件(+1.48%)、半导体材料(+1.77%)、其他电子Ⅲ(+0.11%)、集成电路封测(+0.96%)、分立器件(+3.10%) [26] - 选取的较有代表性的部分美股科技股中,本周涨幅较大的为超微半导体(+6.17%)、安森美半导体(+5.53%)和英特尔(+4.18%),海外科技股即将密集发布二季度财报 [31] 行业数据追踪 - 存储芯片价格自2023年下半年以来小幅度反弹,自2024年9月起,DRAM现货价格略有承压,部分DRAM细分产品价格自2025年2月中旬开始有所回升,波动上涨至6月,其中6月整体涨幅较大,DDR4价格已升至2022年的前期高点,7月价格顶部震荡;NAND Flash合约价格在大幅下滑后于2025年1月有所回升,涨势已延续至5月 [33] - TV面板价格小幅回升后企稳,近期有所下跌,IT面板价格逐渐稳定 [39]
端侧AI厂商中报业绩亮眼,多模态大模型Grok 4正式发布 | 投研报告
中国能源网· 2025-07-14 17:24
电子行业核心观点 - 电子行业需求处于温和复苏阶段,建议关注AIOT、AI驱动、设备材料、消费电子周期筑底板块四大投资主线 [1][2] - 2025半年度业绩预告密集释出,端侧AI厂商业绩亮眼,受益于AIOT等下游需求持续旺盛和公司产品渗透加速 [1][2][3] - 多模态大模型Grok4正式发布,推理能力较前代提升10倍,HLE成绩打破历史记录 [1][2][4] 端侧AI厂商表现 - 乐鑫科技预计2025年半年度实现营业收入12.2-12.5亿元,同比增加33%-36%;归母净利润2.5-2.7亿元,同比增加65%-78%;归母扣非净利润2.3-2.5亿元,同比增加58%-72% [3] - 乐鑫科技营收增长主要来自无线SoC解决方案在智能家居等领域加速渗透,能源管理、工业控制等维持较好增速,AI玩具、音乐教育、智慧农业等新兴领域开始萌芽 [3] - 乐鑫科技首款支持Wi-Fi6E的无线通信芯片已完成工程样片测试,计划2025年下半年量产;6月携手火山引擎扣子大模型团队推出智能AI开发套件EchoEar [3] - 瑞芯微预计2025年半年度实现营业收入约20.45亿元,同比增长约64%;归母净利润5.2-5.4亿元,同比增长185%-195%;归母扣非净利润5.05-5.25亿元,同比增长186%-197% [3] - 瑞芯微AIoT产品线保持高速增长,在汽车、工业控制、机器视觉及各类机器人等重点领域持续扩张 [3] AI技术进展 - Grok4拥有25.6万token的上下文窗口,推理能力较Grok3提升10倍,支持文本、图像、视频及更复杂交互形式 [4] - Grok4在HLE测试中取得45%的成绩,相比此前冠军Google Gemini2.5Pro(21%)翻倍以上,性能预计与GPT-5和Claude4Opus媲美 [5] - Grok4采用订阅制,$30/月起;xAI同时发布专为编程打造的模型Grok4Code,9月将推出多模态智能体版本,10月将推出视频模型 [5] 行业表现 - 本周申万电子指数上涨0.93%,跑赢沪深300指数0.11个百分点,PE(TTM)53.20倍 [5] - 申万电子二级子板块涨跌:半导体(+1.07%)、光学光电子(+1.34%)、消费电子(+0.89%)、电子化学品(+0.72%)、电子元器件(+0.27%)、其他电子(+0.11%) [5] 投资建议 - 建议关注受益海内外需求强劲的AIOT领域公司:乐鑫科技、恒玄科技、瑞芯微 [6] - 建议关注AI创新驱动板块:算力芯片关注寒武纪、海光信息;光器件关注源杰科技、中际旭创、新易盛、光迅科技、天孚通信 [6] - 建议关注上游供应链国产替代预期的半导体设备、零组件、材料产业:北方华创、中微公司、拓荆科技、华海清科、富创精密等 [6] - 建议关注汽车电子受益于新能源车高增长与国产化机遇的板块:功率板块、MCU市场、CIS、存储、模拟芯片等 [6]
多模态大模型崛起:华泰证券预测应用奇点即将到来
搜狐财经· 2025-07-14 07:44
多模态大模型发展趋势 - 多模态大模型正迅速接近关键转折点,是大语言模型(LLM)演进的必然趋势 [1][5][6] - 原生多模态架构(MLLM)因全模态同步训练在性能、延时、部署上优势显著,但算力要求严苛,OpenAI和Google处于领先地位 [1][6] - 技术迭代推动图像生成转向易用性,视频生成在时长、清晰度、一致性持续突破,语音、音乐、3D领域同步拓展 [2][4] 商业化进展 - 全球商业化呈现三大趋势:海外快于国内、一级市场公司快于二级市场、多模态产品快于文本产品 [1][7] - 海外Chatbot类产品(如OpenAI、Anthropic)年化收入(ARR)超10亿美元,国内Chatbot商业化仍较初期 [1][7] - 国内年收入超1亿美元的AI公司(美图、快手、睿琪软件)均聚焦多模态产品 [1][7] 视频生成赛道表现 - 国内厂商在视频生成赛道全球化与商业化最成熟,字节Seedance 1.0、快手可灵(Kling)、MiniMax Hailuo 02位列全球榜单前列 [8] - 快手可灵上线10个月ARR突破1亿美元,标志国内视频生成从单点突破进入多点突破阶段 [2][8] 投资机会 - 算力侧:原生多模态模型及视频推理需求激增,视频Agent落地进一步催生算力需求 [9] - 应用侧:广告、零售、创作等领域AI化需求释放,国内视频生成模型领先 [9] - 推荐标的包括国产算力链(沪电股份、生益科技)及应用产业链(微软、奥多比、金山办公等) [9][14] 行业共识与未来方向 - 多模态大模型将成为行业核心发展方向,融合图像、视频、语音数据以拓宽AI应用场景 [4][15] - 原生多模态架构主流化及一级市场公司进展需重点关注,与市场认知存在差异 [5][7]
面试了很多端到端候选人,发现还是有很多人搞不清楚。。。
自动驾驶之心· 2025-07-13 21:18
端到端自动驾驶技术概述 - 端到端自动驾驶分为一段式端到端和二段式端到端两大技术方向 是当前薪资最高的算法岗位之一 3-5年经验可达百万年薪 [2] - 端到端系统实现从传感器输入到车辆规划/控制信息的直接建模 避免模块化方法间的误差累积 BEV感知打通模块化壁垒 UniAD统一感知和规划任务 [2] - 学术界和工业界聚焦端到端技术 衍生出多种算法流派 UniAD并非最终解 新算法不断涌现 [2] 端到端技术发展现状 - 技术方向包括多模态大模型 BEV感知 强化学习 视觉Transformer 扩散模型等 学习路径复杂 论文数量繁多 知识碎片化 [4] - 高质量文档缺乏 提高入门难度 学习目标驱动导航需结合实战 但缺乏系统指导 难以从理论过渡到实践 [4] - 最新技术流派包括:PLUTO为代表的二段式端到端 UniAD为代表的基于感知的一段式端到端 OccWorld为代表的基于世界模型的一段式端到端 DiffusionDrive为代表的基于扩散模型的一段式端到端 [9] 端到端课程体系 - 课程特点:直击痛点快速入门 构建领域框架提升研究能力 理论结合实践学以致用 [5][6][7] - 课程大纲:端到端算法介绍 背景知识 二段式端到端 一段式端到端与VLA 课程大作业 [11][12][13][15] - 重点章节:一段式端到端与VLA为课程精华 涵盖基于感知/世界模型/扩散模型/VLA的四大子领域 [13] 技术深度解析 - 二段式端到端:分析PLUTO CarPlanner Plan-R1等经典与前沿工作 对比一段式优缺点 [12] - 一段式端到端:UniAD和VAD为奠基作 PARA-Drive为最新进展 世界模型应用广泛 扩散模型实现多模轨迹预测 VLA为当前技术皇冠 [13] - 关键技术:Transformer CLIP LLAVA BEV感知 扩散模型 RLHF GRPO等构成完整技术栈 [14] 课程实施细节 - 开课时间8月15日 三个月完成 采用离线视频教学+VIP群答疑+三次线上答疑模式 [20] - 学员需自备4090及以上GPU 具备自动驾驶基础 熟悉Transformer 强化学习 BEV感知等技术概念 [22] - 预期成果:达到1年经验算法工程师水平 掌握端到端技术框架 可复现主流算法 应用于实际项目 [22]
通信行业周报(20250707-20250713):博通管理层会议指引积极,Grok4正式发布,建议关注海外算力链景气度机遇-20250713
华创证券· 2025-07-13 16:33
报告行业投资评级 - 推荐(维持),预期未来 3 - 6 个月内该行业指数涨幅超过基准指数 5%以上 [1][27] 报告的核心观点 - 博通管理层会议释放 AI 推理需求快速放量信号,或推动公司利润结构与产业产能重估,非 AI 业务现复苏迹象;xAI 发布 Grok 4 模型,性能达通用大模型前列水平;建议关注海外算力链景气度机遇及相关标的 [1][5][13] 根据相关目录分别进行总结 本周行情回顾(2025/7/7 - 2025/7/13) - 通信板块整体行情走势:本周通信行业(申万)涨 2.13%,跑赢沪深 300 指数 1.31 个百分点,跑输创业板指数 0.23 个百分点;今年以来涨 9.54%,跑赢沪深 300 指数 7.51 个百分点,跑赢创业板指数 6.48 个百分点;本周涨幅在所有一级行业中排第 11,全年涨幅排第 10 [6][7] - 个股表现:本周通信板块涨幅前五为三川智慧(+27.91%)、国源科技(+27.72%)、博创科技(+19.84%)、仕佳光子(+14.85%)、中新赛克(+12.46%);跌幅前五为有方科技(-18.52%)、瑞斯康达(-13.48%)、旋极信息(-7.31%)、合众思壮(-5.09%)、润泽科技(-4.10%) [10] 博通管理层会议要点整理 - AI 推理需求显著超预期:近两月推理侧需求急剧上升,超现有产能,未计入 2027 年市场规模预测,预示盈利上修可能 [13] - 芯片开发:正与四个 AI 客户合作开发第一代定制 AI XPU 芯片,预计今年完成两个客户流片;推进 2nm、3.5D 封装的 AI XPU 芯片开发,预计今年完成流片 [13] - 网络产品:AI 推理负载对网络要求提高,公司网络产品营收占比持续提升,计算与网络设备支出比例约为 3:1;纵向扩展网络产品价值高于横向扩展网络 5 - 10 倍 [14] - 新技术:评估共封装光学(CPO)方案在数据中心落地路径,光学器件 5% - 8%的故障率可能制约其规模化部署 [14] - 非 AI 业务:非 AI 业务出现“U 型”复苏迹象,订单回暖或推动明年 EPS 积极修正;VMware 平台预计至 2026 - 2027 年年化收入达 200 亿美元,之后回归中高个位数增长 [14] Grok 4 发布 - 性能表现:在多项通用基准测试中刷新历史成绩,整体性能达当前通用大模型前列水平 [17] - 功能特点:支持多模态输入,具备实时接入 X 平台数据能力;新增 Eve 语音模型,实现自然语言生成与情绪表达,秒级响应;能在真实复杂任务中独立完成工作链条 [17] - 技术路线与定价:基于 Grok 3 训练,使用 10 倍规模强化学习策略;Grok 4 Heavy 版本实现多智能体架构;8 月将发布面向编程的模型,9 月上线多模态智能体架构,10 月推出视频生成模型;当前模型上下文长度为 256K,API 已开放;Super Grok 版本 30 美元/月,Grok 4 Heavy 版本 300 美元/月 [18] 投资建议 - 运营商:重点推荐中国移动、中国电信、中国联通 [21] - 光模块光器件光芯片:重点推荐新易盛、天孚通信、中际旭创,建议关注源杰科技、仕佳光子 [21] - 军工/卫星通信:重点推荐海格通信、上海瀚讯、七一二,建议关注臻镭科技、震有科技 [21] - 设备商:推荐共进股份,建议关注紫光股份、中兴通讯、锐捷网络 [21] - 光纤光缆:建议关注长飞光纤、亨通光电、中天科技 [21] - AIDC:推荐润泽科技,建议关注奥飞数据、光环新网、科华数据 [21] - 物联网模组:重点推荐广和通,建议关注美格智能 [21] - 控制器:重点推荐拓邦股份、和而泰 [21] - 算力芯片:重点推荐盛科通信 [21] - 射频器件:建议关注灿勤科技 [21]
头部互联网具身实验室招募:多模态大模型、机器人多模态交互、强化学习等算法岗位
具身智能之心· 2025-07-13 13:03
招聘岗位概述 - 头部大型互联网具身实验室正在招聘具身多模态大模型、机器人多模态交互、强化学习等方向的研究员 岗位base北京 薪资open [1] 具身多模态大模型研究员 职位描述 - 主导具身智能大模型的核心算法研发 包括多模态感知(视觉、语言、动作)、强化学习策略优化、世界模型构建等方向 [1] - 研究传统仿真与生成式仿真相结合的数据合成方案 构建机器人及具身智能领域的新型数据范式 [1] - 跟踪学术界与工业界最新进展(如VLA、具身智能等) 保持技术领先性并推动团队技术迭代 [1] - 推动模型在机器人场景的落地 解决实际应用中的挑战 [1] 职位要求 - 计算机科学、人工智能、数学、机器人学等相关专业 博士学位优先 5年左右大模型相关工作经验 [2] - 熟悉机器人学、强化学习、多模态融合(VLA)等技术 具备学术敏感度与工程化思维 [2] - 对具身智能、通用机器人方向有浓厚兴趣 具备优秀的逻辑表达与跨团队沟通能力 [2] - 在顶会(CVPR、ICLR、ICRA等)发表过相关论文或主导过开源项目 [2] 机器人多模态交互算法研究员 职位描述 - 研究多模态智能体、多模态推理规划、流式音视频对话模型等前沿技术 推动机器人交互技术创新 [3] - 探索多模态大模型、强化学习算法、大模型Agent在机器人上的创新应用 参与研发下一代智能机器人系统 [3] 职位要求 - 硕士研究生及以上学历 具备优秀的代码能力、数据结构和基础算法功底 [4] - 在大模型、多模态、NLP、CV、强化学习等领域有一定研究基础或项目经验 [4] - 主导过相关重要项目或在顶会(CVPR、ACL、NeurIPS等)发表过论文者优先 [4] - 具备良好的沟通协作能力 能够与团队紧密合作推进项目 [4] 强化学习研究员 职位描述 - 探索多模态大模型、VLA等前沿技术方向 [5] - 推动世界模型、强化学习在具身智能的应用 参与研发下一代智能机器人 [5] 职位要求 - 计算机、自动化、电子等相关专业 [6] - 扎实的机器学习、深度学习、强化学习基础 [6] - 在具身智能、多模态、大模型等领域有研究基础或项目经验 在顶会发表过论文 [6] - 具备良好的沟通协作能力 能推进技术进步 [6] 加分项 - 动手能力和代码能力强 ACM、ICPC等比赛获奖者优先 [9] - 对机器人技术有浓厚兴趣 参加过机器人比赛者优先 [9] - 熟悉物理仿真和常见的虚拟仿真环境 [9]