多模态大模型
搜索文档
我们正在寻找自动驾驶领域的合伙人...
自动驾驶之心· 2025-10-12 00:03
业务拓展计划 - 公司计划在2024年向国内外招募10名业务合伙人 [2] - 合伙人将负责自动驾驶相关课程研发、论文辅导业务开发以及硬件研发 [2] 重点技术方向 - 公司重点关注大模型与多模态大模型、扩散模型、视觉语言动作模型、端到端自动驾驶等前沿技术方向 [3] - 其他关键方向包括具身交互、联合预测、同步定位与地图构建、3D目标检测、世界模型等 [3] - 技术应用领域涵盖闭环仿真3D高斯泼溅以及大模型部署与量化感知推理 [3] 人才招聘标准 - 合伙人岗位要求候选人毕业于QS世界大学排名前200以内的高校 [4] - 优先考虑拥有硕士及以上学历且在顶级学术会议发表过论文的资深人士 [4] 合伙人待遇与激励 - 提供自动驾驶领域的资源共享,包括求职、读博及出国留学推荐等机会 [5] - 合伙人将获得丰厚的现金激励 [5] - 提供创业项目合作与推荐机会 [5] 合作咨询方式 - 有意向者可通过添加微信进行进一步咨询 [6] - 咨询时需备注“机构/公司 + 自动驾驶合作咨询” [6]
武汉长江通信产业集团股份有限公司 关于使用部分闲置募集资金进行现金管理到期赎回的公告
搜狐财经· 2025-10-10 17:18
募集资金现金管理 - 公司董事会批准使用最高不超过人民币58,600万元的闲置募集资金进行现金管理,投资于安全性高、流动性好的保本型产品 [1] - 公司子公司迪爱斯完成两笔定期存款赎回,收回本金合计12,600万元,并获得收益总计91.5万元 [2] - 截至公告日,公司最近十二个月使用募集资金购买现金管理产品7笔,金额合计7.22亿元,其中已赎回2.67亿元,尚未到期4.55亿元 [3] 2025年上半年经营业绩 - 2025年上半年公司实现营业收入2.90亿元,同比增长6.04% [8] - 公司持续围绕主营业务加大研发投入,上半年研发费用占营业总收入21%,同比去年增加21%左右 [7] 研发投入与技术方向 - 研发费用主要投入于产品线整合升级、布局人工智能和公共安全领域专用大模型等平台型技术 [7] - 公司深度融合DeepSeek等前沿大模型技术,将人工智能技术融入智能指挥、风险预警、分析研判等关键业务场景 [7] - 低轨卫星通信是公司重点开拓的新行业,已研发低轨卫星测运控平台软件、一体化信关站等产品 [7] - 未来公司将加大战新产业研发投入,聚焦下一代信息技术、人工智能、低轨卫星、低空经济、多模态大模型等技术的应用创新 [7][8] 主营业务与战略规划 - 公司主营业务为信息技术服务业,深耕以公安和消防为代表的智慧应急行业 [8] - 通过收购迪爱斯100%股权,公司主营业务增加了智慧应急、智慧城运等业务,主营业务收入规模逐年增长 [9] - 未来公司将加强市场拓展,巩固智慧公安、智慧消防市场,并积极拓展卫星互联网、低空经济、智慧司法、国央企数字化等行业客户 [10] - 公司采用"借船出海"策略拓展海外市场,探寻更多销售平台,提高海外市场开拓及项目交付能力 [10]
具身智能之心1v1论文辅导来啦~
具身智能之心· 2025-10-10 11:14
还在为论文选题抓耳挠腮?被数据建模折磨到头秃?面对导师批注手足无措?别慌!具身智能之心,资深导师 团队在线 "救援",一站式解决你的论文烦恼! 论文辅导上线了 【具身智能之心论文辅导重磅上线!多模态大模型/VLA/强化学习/VLN/数据采集/机器人仿真/端到端/diffusion 等顶会方向1V1定制化辅导】 CCF-A到CCF-C SCI一区到四区 EI/中文核心/毕业论文/申博等 具身智能体泛化(跨任务迁移、零样本适应、仿真环境构建) 3D高斯泼溅(3DGS)(实时渲染、动态场景建模、SLAM结合) 端到端具身智能体(决策闭环、多模态传感器融合) 具身合成数据生成(自动标注、域适应、数据增强) 为什么选择我们? ✅ 顶会/顶刊导师团队:来自CMU、Stanford、MIT等国内外名校的PhD及大厂研究员,覆盖ICML、ICLR、 CoRL、ICRA、NeurIPS、CVPR等顶级会议审稿经验。 你是否正在研究以下前沿领域却苦于突破瓶颈? 多模态大模型(视觉-语言预训练、跨模态推理) 视觉语言动作(VLA)(端到端、分层等) 视觉语言导航(VLN)(Embodied QA、指令跟随、场景理解) 机器人抓取与 ...
东吴证券晨会纪要-20251010
东吴证券· 2025-10-10 09:17
宏观策略 - 国庆假期海外市场由美国政府停摆和日本高市早苗当选自民党总裁两大事件主导,避险情绪升温及对美联储“盲降利率”预期推动黄金和比特币续创历史新高,黄金突破3960美元/盎司,比特币突破15万美元[1][17] - 全球政治右翼化与宽财政、宽货币趋势加剧地缘摩擦不确定性和政府债务不可持续性,经济从软着陆走向温和过热概率加大,大类资产中期表现预计为金>铜>股[1][17] - 美股在政府停摆期间因经济数据暂停发布呈现“没消息就是没消息”交易逻辑,标普500指数录得7连涨,日经225指数因高市早苗胜选上涨6.4%创历史新高[17] 固收市场 - 二级资本债周成交量合计约2299亿元,较上周增加521亿元,绿色债券新发行23只合计规模309.74亿元,周成交额703亿元较上周增加99亿元[2][3][23][25] - 银行业债券投资实际收益2025年上半年合计约1.42万亿元,较2024年同期1.37万亿元增长3.82%,但票息收入面临利率下行压力,投资收益成为主要增长动力[4][26][29] - 国有大行债券投资压力相对可控,股份行、城商行和农商行因金融资产体量及负债端稳定性较弱更易受债市逆风影响,或转向权益市场寻求收益[4][29] 电力设备与新能源 - 储能需求超预期,国内容量补偿电价出台推动大储增长,今明年预计30-40%增速,全球储能装机2025-2028年复合增长率达30-50%,电池供应紧张或延续至2026年年中[8][32] - 锂电板块9月排产略超预期,10月排产进一步提升10%,储能电池价格已上涨1-3分/wh,Q4仍有提升空间,材料环节产能打满且涨价诉求强烈[8][32] - 固态电池中试线2025年下半年密集落地,人形机器人领域特斯拉Gen3将于10-11月定型,2026年初量产,2030年预期100万台,产业链进展提速[8][32] 汽车行业 - 9月第4周乘用车销量环比增长26.7%,国内主流15家新能源车企9月交付87.7万辆同比增长15%,小鹏、小米、长城新能源首次突破4万辆[10] - 汽车行业进入电动化红利尾声与智能化黎明阶段,AI智能车主线聚焦Robotaxi/Robovan及C端卖车,供应链关注芯片、域控制器、传感器等环节[10] - 特斯拉三季度交付49.7万辆同比增长29.4%,发布FSD V14版本,美国市场推出降配降价版Model 3和Model Y以应对补贴下降[10] 电子与算力 - 国产算力投资逻辑从供给侧转向需求侧,多模态大模型如DeepSeek-V3.2、GLM-4.6实现与寒武纪、海光等国产芯片首日适配,推动算力内生增长[11][12] - OpenAI通过模型、应用与投资升级重塑AI产业格局,驱动算力、存储及高速互联需求指数级扩张,AI服务器代工、光通信等环节景气度跃升[13] - 芯原股份2025年Q3营收12.84亿元环比增长119.74%,新签订单15.93亿元同比增长145.80%,AI算力相关订单占比约65%[16] 个股聚焦 - 裕太微-U在网通以太网芯片领域实现2.5G PHY芯片收入超1.4亿元,车载以太网芯片已覆盖主流车厂,首款TSN交换机芯片标志技术深化[14] - 特海国际作为海底捞海外平台,预计2025-2027年门店数达130/140/149家,归母净利润复合增速50%,对应2025年PE为31倍[15] - 先导智能预计2025-2027年归母净利润15/20/25亿元,动态PE分别为64/48/39倍,发行限制性股票激励强化龙头地位[16]
国泰海通:Sora2加快推动AI视频发展 PGC、UGC应用多元创新加速
智通财经网· 2025-10-09 11:21
产品发布与性能 - OpenAI于9月30日正式发布最新视频生成模型Sora 2及同名IOS社交应用"Sora" [2] - Sora 2在视频真实性、音频同步和精细控制上实现重大突破,支持生成10秒的沉浸式内容 [2] - Sora 2 Pro版本生成时长提升到15秒,画面分辨率更高,质感更接近电影 [2] - Sora App已成功登顶苹果美国"热门免费应用"榜单,目前采用邀请制,优先在美加开放 [1][2][3] 技术特点与行业趋势 - 多模态视频生成逐步走向全局生成,通过文字、图片、视频作为提示词进行凭空生成,不依赖外部素材 [2] - 视频生成模型整体在稳定性、可控性、丰富度、生成时长方面持续提升 [1][2] - 该技术可应用于视频制作各环节,对内容制作整体呈现有效的降本增效,尤其在动画内容方面 [2] 应用场景与商业模式创新 - AI短视频能在社交、电商营销、教育等场景实现广泛应用,可根据提示词在创意视频、品牌广告等领域创造价值 [1][3] - Sora App通过创新"Cameo"功能将用户肖像无缝融入生成场景,重新定义社交互动与内容创作 [2] - OpenAI探索收费模式,Sora将提供控制选项让角色版权方自主决定是否允许用户使用其角色进行二次创作,未来可能形成"创作者+ IP方+平台"的分账生态 [3] 投资机会 - 平台和模型公司领域推荐美图公司 [4] - IP资源公司领域推荐上海电影,关注中文在线、掌阅科技、中信出版、果麦文化、新经典 [4] - 内容多元创新公司领域推荐慈文传媒、光线传媒、博纳影业、华策影视、百纳千成,关注欢瑞世纪、捷成股份 [4] - 其他多元应用公司领域,电商营销类推荐易点天下、浙文互联、值得买,教育类推荐南方传媒,关注豆神教育 [4]
我们正在找具身领域的合伙人......
具身智能之心· 2025-10-08 10:49
最近收到越来越多合作伙伴和中小公司的诉求,期望具身智能之心团队能够在方案和数采、技术升级、 企业培训等多个方向上赋能。 岗位说明 主要面向具身课程开发、方案研发、硬件研发、培训合作(B端主要面向企业和高校、研究院所培训,C 端面向较多学生、求职类人群)。 联系我们 感兴趣的可以添加微信oooops-life做进一步咨询。 虽然从上半年开始,我们一直在筹办相关事宜。但众人拾柴火焰高,要推动大的行业进步,需要更多优 秀的伙伴加入我们。 现面向全球的具身领域从业者发出邀请函,具身智能之心期望能够和您在技术服务、培训、课程开发与 科研辅导等多个领域展开合作。 我们将提供高额的酬金与丰富的行业资源。 主要方向 包括但不限于:VLA、VLN、Diffusion Policy、强化学习、VLA+RL、遥操作、动捕、sim2real、多模态 大模型、仿真、运动控制、端到端、3D感知等多个方向。 ...
AI需求侧核心逻辑正式向多模态大模型延展-国产算力认知强化!Tokens消耗 | 投研报告
中国能源网· 2025-10-08 10:01
海外多模态大模型进展 - OpenAI于10月1日上线Sora2/Pro App,支持最长15秒文生视频,物理运动更精准并支持用户客串生成内容,发布三天后登上美区App Store第一名 [1][1] - OpenAI在10月7日开发者大会上宣布ChatGPT可直接调用第三方应用,并推出GPT-5Pro、Sora2 API等开发者工具,标志其从单一对话工具向AI应用及社交平台转型 [1] - xAI于10月6日推出视觉生成模块Imagine,可从文字生成高质量图像与视频,Grok由问答助手升级为多模态创作AI,构建社交+搜索+创作一体化平台 [1] - Anthropic于9月30日发布Claude Sonnet 4.5编程模型,强调构建生产就绪级AI Agent能力,推动智能体从原型验证迈向实际部署 [1] - 多模态理解与生成技术已突破具备商业化价值临界点,AI生成视频动作可控性与内容观赏度显著提升,用户主动创作与付费意愿大幅提升 [1] 国内多模态能力发展 - 快手可灵2.5 Turbo于10月2日在全球视频生成模型榜单中登顶图生视频与文生视频双榜首,体现其视频生成与内容质量的国际领先水平 [2] - 字节跳动于10月2日与UCLA推出Self-Forcing++视频生成技术,可生成4分15秒高清视频,视觉稳定性提升至2.6倍 [2] - 字节跳动旗下豆包1.6-Vision模型于9月30日更新,通过工具调用将图像融入思维链,提升视觉理解精度 [2] - 腾讯于9月28日推出并开源混元图像3.0,作为业界首个开源工业级原生多模态生成模型,快速登顶Hugging Face热榜并保持领先 [2] - AI应用落地竞争核心从单一语言智能转向多模态生成与理解能力,国内头部厂商正快速补齐该关键环节并在国际基准测试中崭露头角 [2] 国产算力投资逻辑演变 - DeepSeek于9月30日发布DeepSeek-V3.2-Exp,DSA架构使得推理成本更低且支持更长上下文,模型支持国产开发生态tilelang语言,并实现与寒武纪、海光、昇腾等芯片的首日适配 [3] - 智谱于9月30日开源GLM-4.6,在Agentic Coding等关键能力上显著提升,代码生成性能已对齐Claude Sonnet 4,并完成与国产GPU的联合优化 [3] - 阿里巴巴于10月4日发布并开源Qwen3-VL系列多模态模型,实现昇腾芯片的0Day适配,加速国产硬件生态落地 [3] - 投资逻辑从因H20限售驱动的供给侧替代逻辑,演进为多模态能力突破带来的需求侧拉动,AI应用自身增长牵引形成国产算力原生成长路径 [3] - 随着多模态生成与实时推理场景不断丰富,国产算力有望进入内生驱动的新一轮成长周期 [3]
自动驾驶之心招募合伙人啦!4D标注/世界模型/模型部署等方向
自动驾驶之心· 2025-10-04 12:04
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 业务合伙人 自动驾驶之心业务合伙人招募来啦!我们团队今年计划向国内外招募10名优秀的合伙人,负责自动驾驶相 关课程研发、论文辅导业务开发、硬件研发; 主要方向 如果您是大模型/多模态大模型、扩散模型、VLA、端到端、具身交互、联合预测、SLAM、3D目标检测、 世界模型、闭环仿真3DGS、大模型部署与量化感知推理等方向,欢迎加入我们; 待遇说明 自动驾驶资源共享(求职、读博、出国留学推荐等); 丰厚的现金激励; 创业项目合作与推荐; 联系我们 更多欢迎添加微信咨询,备注" 机构/公司 + 自动驾驶合作咨询 "。 岗位要求 QS200以内高校,硕士及以上学历,手握顶会的大佬优先。 ...
用两个简单模块实现分割理解双重SOTA!华科大白翔团队等推出多模态新框架
量子位· 2025-10-03 12:19
这主要源于现有模型在物体属性理解上的不足,以及细粒度感知能力的局限。 为缓解上述问题,华中科技大学团队和金山办公团队联合提出了两个核心模块: 语义增强特征提取器 (SEFE) 和 交错局部视觉耦合 (ILVC) 。 前者融合语义特征与像素级特征,提升物体属性推理能力,从而获得更精确的分割结果。 后者基于分割掩码提取局部特征后,自回归生成局部描述,为模型提供细粒度监督,从而有效减少理解幻觉。 最终,研究团队 构建了在分割和理解两项任务上均取得SOTA的多模态大模型LIRA 。 LIRA团队 投稿 量子位 | 公众号 QbitAI 多模态大模型需要干的活,已经从最初的文生图,扩展到了像素级任务 (图像分割) 。 不过,无论是OMG-LLaVA,还是提出了embedding-as-mask范式的LISA (CVPR 2024) ,都还存在分割结果不够精确,以及理解过程中 出现幻觉两大痛点。 与InternVL2相比,LIRA在保持理解性能的同时,额外支持图像分割任务;与OMG-LLaVA相比,LIRA在图像分割任务上平均提升8.5%,在 MMBench上提升33.2%。 目前,LIRA项目已被ICCV 2025录用 ...
2025年AI驱动下通信云行业的全球化变革
艾瑞咨询· 2025-10-03 08:03
行业市场规模与增长前景 - 2024年全球互联网通信云市场规模约为68亿美元,同比增速放缓 [1][7] - 市场增速放缓主要受AI场景化落地处于观望期及宏观经济环境震荡影响 [1][7] - AI在当前云通信市场的渗透率仅约15%,未来2-3年有望迎来新一轮增长 [7] - 未来3-5年,随着AI陪伴、AI助理等新场景拓展,市场有望出现回暖 [7] 技术发展趋势 - 通信云从基础信息传输管道向AI交互中枢进化,聚焦场景化赋能与数据价值挖掘 [2][39] - 生成式AI推动文本、语音、视频融合交互,驱动厂商优化多模态传输效果 [3][39] - 厂商聚焦核心通信能力建设,通过开放接口接入第三方大模型满足GenAI需求 [25] - 未来技术将向多模态大模型与穿戴式硬件融合方向发展,构建新型交互基础设施 [42] 开发者与市场需求焦点 - 开发者对通信云的需求向安全、智能和开放三个方向收束 [2][13] - 智能方面,开放第三方大模型接口、提供低代码智能体创建工具成为基础套件 [2][30] - 开放方面,跨平台开发兼容与AI能力整合成为厂商主要竞争力之一 [2][30] - 企业客户在存量竞争时代更倾向于通过精细化运营提升产品竞争力 [10] 全球区域市场特征 - 全球市场呈现区域需求分化,受政策环境、基础设施及用户行为差异影响 [13] - 欧美成熟市场将数据隐私与合规性作为首要诉求,对AI新玩法接受度高 [13] - 新兴市场如东南亚、中东、拉美非洲更关注本土化适配与场景创新 [13] - 全球已有超过82%的国家和地区已建立或正在建立数据隐私法规 [16] 安全与合规升级 - 数据主权和隐私保护成为出海刚需,需明确数据所有权归属及加密传输 [2][18] - 地缘政治紧张推动各国对自主可控通信平台的需求,从技术选项升级为国家安全基石 [18] - 未来将运用QKD等更严格加密技术从底层重塑安全架构,构建可追溯的安全生态 [21] - 在出海服务中,与安全厂商的技术合作及强化属地化生态合作成为关注点 [32] 竞争格局与厂商策略 - 市场进入存量竞争阶段,IM PaaS市场TOP3厂商占比约90%,RTC PaaS市场TOP3占比近70% [35] - 厂商竞争焦点从基础通信能力转向差异化服务效能,如提供全栈大模型能力 [35] - 头部厂商通过封装从模型调用到场景组件的全栈AI能力优化交互体验 [35] - 为突破同质化,主权明晰、防篡改、可溯源的通信云服务成为全球竞争力关键 [35] 未来应用场景与商业化 - 短期将优先锚定低准确性、低实时性要求的价值场景实现突破 [27] - 长期将深入游戏、教育、办公、金融等场景,打造高沉浸式AI应用 [27][42] - 多模态大模型与穿戴式硬件的融合被视为未来3-5年的主要发力场景 [42] - 通信云角色从技术支撑层向商业基座升级,成为连接用户、设备与服务的神经中枢 [42]