Workflow
多模态大模型
icon
搜索文档
火山引擎成为2026年春晚独家AI云合作伙伴
新京报· 2025-12-29 15:49
公司与重要合作伙伴关系 - 火山引擎成为2026年中央广播电视总台春节联欢晚会独家AI云合作伙伴 [1] - 公司将深度参与春晚节目、线上互动和视频直播 [1] - 公司过去5年为抖音的春晚直播提供技术支撑 [1] - 公司曾支持抖音在2021年总台春晚实现703亿次红包互动 [1] 公司市场地位与业务架构 - 公司是字节跳动旗下的云和AI服务平台 [1] - 公司构建以大模型为核心的AI云原生架构 [1] - 公司是中国公有云大模型市场份额最高的AI云服务商 [1] 核心产品数据与客户覆盖 - 公司豆包大模型最新的日均调用量达到63万亿Tokens [1] - 公司服务了国内九成主流汽车品牌 [1] - 公司服务了国内八成头部券商 [1] - 公司服务了国内八成系统重要性银行 [1] - 公司服务了国内八成头部咖啡茶饮品牌 [1] - 公司服务了国内七成985高校 [1] - 公司服务了9家全球出货排名前十的手机厂商 [1]
今晚8点吴晓波科技人文秀,四大亮点剧透
吴晓波频道· 2025-12-28 08:29
本想"放过自己",宣布结束十年"年终秀"的吴老师,由此开启了一段新的征程。 还是厦门,还是厦门国际博览中心,面朝大海。 文 /巴九灵(微信公众号:吴晓波频道) "既然AI不放过我,我也不放过AI。" " 今晚 8 点, 'AI 闪耀中国 ' 吴晓波科技人文秀正式开幕。 " 点击按钮▲预约直播 无论是科技大公司还是制造业工厂,抑或是以义乌和华强北为代表的零售批发市场,算起来,他今年共调研了65家企业,每一家都在聊AI,还有 身边的人,政府官员、企业家也好,相关学者、媒体也好,每个人都在询问:吴老师,你怎么看待AI。 这既是提问,也是诱惑,直捣人心,令人很难"躺平"。 "AI正以星期的速度进化。我听到在我身后非常急促的脚步声,它越来越近。" 就这样,他再度跃跃欲试,试图用一年的调研,结合多年来对中国企业、产业乃至宏观经济的观察,回答一个看起来宏大且永远没有尽头的问题: 大到国运,AI如何改变中国,改变每个产业;小到个体,AI如何影响我们每一个人的职业选择和工作方式? 白天,看碧蓝的海面在微醺的阳光下波光粼粼,感受带有鲜橙味的暖风拂面。 晚上八点,跟着吴老师,沉浸式投入由他精心准备的全新形式的年度演讲: "AI闪耀 ...
智谱等2家企业完成境外上市备案
搜狐财经· 2025-12-23 14:15
上市进展与监管确认 - 中国证监会于12月22日晚确认智谱与MiniMax两家境内企业境外发行上市 两家公司均为赴港上市备案[1] - 智谱已于12月19日通过港交所上市聆讯[3] - MiniMax已于12月21日通过港交所上市聆讯[4] 智谱公司概况 - 公司专注于认知智能大模型的研发 核心业务围绕通用大模型的开发、服务提供及技术开源展开 包括通用语言模型和智能体模型的构建[3] - 截至2025年9月 其GLM模型已赋能全球12000家企业客户和逾8000万台终端设备[3] - 公司拟发行不超过43,032,400股境外上市普通股并在香港联合交易所上市[3] 智谱财务数据 - 2022年至2024年及2025年前六个月 公司营收分别为0.57亿元、1.25亿元、3.12亿元、1.91亿元[3] - 同期 公司净亏损分别为1.44亿元、7.88亿元、29.58亿元、23.58亿元[3] MiniMax公司概况 - 公司从事多模态大模型的研发与商业化应用 业务覆盖文本生成、语音合成、视频生成、虚拟角色、智能体以及全模态交互平台等多个方向[4] - 截至2025年9月30日 公司已有超过200个国家及地区的逾2.12亿名个人用户以及超过100个国家的13万企业客户[4] - 公司拟发行不超过33,577,240股境外上市普通股并在香港联合交易所上市[3] MiniMax财务数据 - 2022年至2024年及2025年前九个月 公司营收分别为0美元、346万美元、3052万美元、5344万美元[4] - 同期 公司净亏损分别为0.74亿美元、2.69亿美元、4.65亿美元、5.12亿美元[4]
优必选子公司优奇与字节跳动旗下火山引擎达成具身智能合作 加速“AI+机器人”技术的产业化落地
证券时报网· 2025-12-23 08:39
合作主体与协议签署 - 优必选旗下智慧物流子公司UQI优奇与字节跳动旗下云和AI服务平台火山引擎正式签署合作协议 [1] - 合作协议在FORCE原动力大会上签署 [1] 合作技术领域与目标 - 双方将在多模态大模型、VLA模型、豆包生态交互、AI云原生基础设施等方面展开深入合作 [1] - 合作旨在为人形机器人、无人物流车、工业移动机器人等实体机器人在工业及物流垂直领域的AI应用提供技术动能 [1] 合作实施路径 - 双方将从算法联合研究、产品及工程开发合作、数据中心及工具链共建三个领域展开深度协同 [1] - 合作将形成具体的落地路径 [1]
上海复兴岛“全球创客岛”启动暨2025上海量子城市年度大会举行
中国经济网· 2025-12-19 13:46
复兴岛战略定位与发展规划 - 复兴岛正着眼打造"全球创客岛",其战略留白空间的存量工业建筑正被改造为共享实验室、概念验证中心、中试基地等全周期创新空间,旨在为全球创客提供低成本、开放式、多元化的创新创业环境 [1] - 复兴岛曾是上海重要的工业基地和仓储区,岛上保留着大量工业遗存,全岛绿化覆盖率超过60% [1] - 随着上海黄浦江沿岸开发延伸,以复兴岛为中心的滨江中北段成为重要的战略发展空间,去年12月复兴岛成为量子城市时空创新先行实验区,开启转型 [1] - 下一步复兴岛将围绕"数字智能岛、设计艺术岛、人民城市岛"定位,推出更多量子城市应用系列场景,全力打造全球创客岛,着力构建未来城市实验区、创新创业和人才集聚区、时空智能创新先行区 [3] 政策与产业支持措施 - 杨浦区将为复兴岛创新创业集聚区构建全链条的政策支持体系,包括为创新主体提供阶段性房租减免,发放新质秀带创新券,降低企业智能算力成本 [1] - 在孵化品牌方面,将有序推动复兴岛未来产业载体改造建设,对引进的国内外知名孵化机构加大运营补贴力度,加强对孵化机构的引育奖励 [1] - 杨浦区正在全球范围寻找具备全球视野与国际声誉、拥有成熟生态构建能力、对前沿科技有深度理解的"顶级园丁" [2] 产业生态与合作伙伴 - 会上发布了上海量子城市复兴岛实验基地规划愿景行动、上海复兴岛—全球创客岛实施行动以及2025上海量子城市空间智能建设年度成果 [3] - 12家国内外知名孵化器、首批14家创新创业企业正式入驻复兴岛 [3] - PNP璞跃中国作为全球开放式创新平台,通过"投孵联动"模式,依托生态资源筛选早期硬科技项目,推动技术验证、业务合作与资本闭环 [2] - 英国EGG孵化器全球联席董事围绕破界、融合、生长,提出海外硬科技归国落地系统性解决方案 [2] 技术创新与应用场景 - 复兴岛是一个量子城市的创新范本,拥有全息智慧与自我进化能力,打造了"数字孪生+AI原生"的生命体城市治理新模式 [3] - 多模态大模型充当了城市物理世界与数字空间融合的"超级认知引擎",复兴岛空间智能体依托大模型底座能力,通过多模态数据融合、智能化调用、自我进化等能力,为复兴岛打造高效、灵活、可持续的智慧化底座 [3] - 复旦大学现代物理研究所特聘教授以《聚变能源——从星辰之火到未来之光》为题进行了分享 [2] - 全国青联委员分享了山海青年用科技赋能社会创新的实践探索 [2]
赛道分化加剧,2026年人工智能最强风口来袭
36氪· 2025-12-03 16:57
文章核心观点 - 2026年将成为人工智能发展的关键分水岭,AI将从“AI+”的修补模式,演进为AI原生重构系统底层逻辑、物理AI打通虚拟与现实、多模态技术融合以及世界模型实现规律预判的深度变革阶段 [1] AI原生引发系统应用底层革命 - AI原生意味着以AI为系统设计的底层逻辑与能力中枢,驱动从技术架构、业务流程、组织角色到价值创造方式的全方位重塑,是AI未来发展的关键方向 [3] - AI原生架构与传统“AI+”架构存在根本差异:设计起点从现有业务流程转向AI能力边界;数据流向从业务系统抽取数据给AI模型,转变为数据实时流入AI中枢驱动业务;系统角色从“辅助工具”转变为“决策引擎”;迭代速度从月级提升至天级 [4] - 真正的AI原生系统具备三个显著特征:以自然语言交互为基础,实现GUI与LUI混合;具备自主学习和适应能力,能根据上下文和环境变化调整输出;具备基于大语言模型和知识库自主完成任务的能力,实现端到端闭环 [4][5] - AI原生开发平台趋势明确,低代码/无代码工具催生大量“一人公司”模式,巨头正将AI智能体深度嵌入办公套件实现端到端闭环 [8] - AI原生应用大规模普及的前提是具备完善的工具和框架体系,如部署管理大模型的Hub平台、自动化微调工具、知识图谱管理工具等,产品化工具的积累是其快速普及的关键 [8] - 在办公场景,AI原生应用可将知识工作者的重复劳动时间减少40%以上,2026年AI原生是To C端最确定的增量市场,其核心竞争力在于对用户习惯的重构 [8] - AI原生应用的技术架构、工具产品及方法论将在1~2年内演进并达到可大规模复用的成熟度,之后全面爆发,短期内“AI原生应用”与“传统应用+AI”将共存 [9] 物理AI向现实世界全面渗透 - 2026年的AI将以物理实体形态渗透到城市、工厂、医院、家庭等场景,实现从“感知”到“行动”的跨越,即物理AI [10] - AI发展经历三阶段:感知AI(理解图像、文字、声音)、生成式AI(创造文本、图像、声音),现在正进入物理AI时代,AI能够进行推理、计划和行动 [10][11] - 物理AI的技术基础建立在三个关键组件之上:世界模型(构建对三维空间及物理定律的理解)、物理仿真引擎(实时计算复杂物理交互)、具身智能控制器(生成具体控制指令) [11][12] - 物理AI成为主流趋势的原因:一是机器人、无人系统等智能设备的物理交互需求驱动,要求AI具备在真实环境中稳定、泛化的感知、理解与执行能力;二是AI技术演进加速赋能物理实体 [14] - IDC预测,到2026年,AI模型、视觉系统及边缘计算的进步将使机器人可实现的应用场景数量增加3倍,并在制造、物流、医疗、服务等多个领域广泛部署 [14] 多模态将成为AI基础能力 - 2025年,多模态大模型以强大的跨模态理解和推理能力,成为推动产业智能化升级和社会数字化转型的中坚力量 [15] - 多模态大模型能同时处理文本、图像、音频、视频、3D模型等多种数据类型,实现信息的深度融合与推理 [15] - 其能力体系围绕“跨模态理解”与“跨模态生成”两大核心构建:理解方面包括语义匹配、文档智能解析、多模态内容深层解读;生成方面可实现文本、图像、音频、视频等不同模态内容的相互生成 [15][16] - 多模态大模型还展现出多模态思维链和上下文学习等高级认知能力,为构建更接近人类认知方式的AI系统奠定了基础 [16] - 原生多模态技术路线成为重要进化方向,即在训练之初就将多种模态数据嵌入同一个共享的向量表示空间,实现不同模态间的自然对齐与无缝切换,无需文本中转 [16] - 2026年,多模态大模型将以前所未有的速度重塑各行各业,已在文物保护、安防、智能驾驶、内容创作、工业质检、政务服务等领域展现出巨大价值,正从实验探索迈向实际应用 [17] - 技术案例如Sora 2在视频与音频生成上实现物理逼真、镜头控制、音效同步等突破;Nano Banana Pro在图像生成与编辑方面支持多图融合、4K输出等 [17] 世界模型引爆AI新一轮增长 - 世界模型让AI从“数据驱动”转向“规律驱动”,通过构建虚拟世界模型模拟物理规则实现前瞻性决策,是2026年最具颠覆性和挑战性的领域 [19][21] - 世界模型的价值在于“泛化能力”,能够将已知场景的认知迁移到未知场景,例如让自动驾驶系统在未见过道路上基于物理规律理解安全行驶 [22] - 世界模型是一种能够对现实世界环境进行仿真,并基于多模态输入数据生成视频、预测未来状态的生成式AI模型,是AI系统对现实世界的“内在理解”和“心理模拟” [22] - 与大语言模型相比,世界模型的主要数据是感知数据、模拟数据和遥测数据;架构是编码器加潜在动态的混合架构;目标是预测环境状态以支持决策;训练范式是自监督或强化学习;应用集中于机器人、控制、模拟等领域;认知基础是物理性和因果性 [24] - 世界模型具有三大核心特点:内在表征与预测,能将高维观测数据编码为低维潜在状态并预测未来状态;物理认知与因果关系,能理解和模拟重力、摩擦力等物理规律;反事实推理能力,能进行假设性思考 [24][25] - 技术层面关键包括因果推理、场景重建时空一致性、多模数据物理规则描述等,全球主流模型有谷歌Genie3、英伟达COSMOS,国内有华为盘古、蔚来NWM等 [25] - 在自动驾驶领域,世界模型可生成高动态、高不确定性场景解决长尾问题,通过闭环反馈机制降低成本、提升效率,案例如蘑菇车联MogoMind实现实时数字孪生与深度理解服务 [25] - 在具身智能中,世界模型能提供大规模高质量合成数据解决数据缺口,并重塑开发范式,未来将构建“物理+心智”双轨建模架构 [26]
简历直推!小马智行多模态大模型实习生招聘
自动驾驶之心· 2025-11-30 10:02
公司技术发展方向 - 基于视觉-语言模型开发场景描述与自然语言指令驱动的感知能力提升方案[2] - 跟进并探索视觉-语言模型等多模态前沿技术,研究其在感知、语义理解与跨模态对齐中的应用[6] - 负责基于Camera、LiDAR及多模态融合的感知算法开发与优化,工作方向包括目标检测、语义/实例分割、目标跟踪与三维重建等[6] 行业人才需求与招聘趋势 - 招聘要求计算机或相关专业本科以上学历,熟练掌握深度学习及计算机视觉相关基本算法[6] - 优先考虑在自动驾驶行业有实习经验的候选人[3] - 优先考虑能实习6个月及以上的候选人[3] - 优先考虑熟悉PyTorch等深度学习框架、对深度学习有深入了解的候选人[6] - 优先考虑熟悉并行计算或CUDA编程、或具有图像处理方面经验的候选人[6]
精准锁定「硬骨头」:难样本筛选破局SFT依赖,GRPO-only斩获感知推理双最优
量子位· 2025-11-28 12:11
文章核心观点 - 多模态大模型后训练中,样本难度比训练范式更为关键,仅使用强化学习策略(GRPO-only)进行优化是可行且有效的,无需监督微调(SFT)作为前置步骤 [2][3][36][37] - 研究提出了两种可量化的样本难度评估策略(PISM和CMAB),并基于此设计了分层训练框架,在多个基准测试上取得了显著性能提升 [6][7][36] 研究方法与创新 - 提出渐进式图像语义掩码(PISM)策略,通过模拟不同程度的视觉信息损失来量化样本对视觉细节的依赖程度,从而划分样本难度 [10][14][15][16][17] - 提出跨模态注意力平衡(CMAB)策略,通过分析模型生成响应时对文本和图像的注意力之比,评估跨模态交互复杂度以划分样本难度 [19][20][21][22] - 设计了两种后训练范式进行对比:GRPO-only范式(直接对中高难度样本应用强化学习)和SFT+GRPO范式(先进行监督微调再进行强化学习) [23][24][25] 实验结果与分析 - 在视觉推理任务上,GRPO-only(中等+困难样本)范式在MathVista达到68.3分,OCRBench达到77.8分,MMMU提升0.107,MMStar提升0.083,全面超越传统SFT+GRPO范式 [28][29] - 在视觉感知任务上,GRPO-only(中等+困难样本)范式在MathVista达到68.3分,MMVet达到50.367分,MMMU达到0.550分,MMStar达到0.629分,尤其在需要跨模态深度融合的任务中优势明显 [33][34] - 实验表明SFT阶段并未带来性能增益,甚至可能因引入“伪思维链”而限制模型真实推理能力,所有SFT+GRPO范式的性能均低于GRPO-only范式 [29][36] 行业影响与未来方向 - 该研究为多模态大模型性能提升提供了全新技术路径,推翻了“SFT是RL后训练必要前提”的传统认知,极大简化了训练流程 [3][37] - 未来研究方向包括动态难度调整、多策略融合以及在百亿参数级大模型上验证方法的泛化性 [38] - 研究代码已开源,为后续研究提供可复现的技术基础,有望推动多模态AI在医疗、教育、自动驾驶等领域的实际应用 [39][40]
“两翼齐飞”助推文化和科技深度融合
中国青年报· 2025-11-23 08:38
政策导向与战略机遇 - 国家层面明确将激发文化创新创造活力与繁荣发展社会主义文化作为战略任务,强调文化和科技融合催生新业态、新应用、新载体[1] - 抓住以人工智能为代表的科技革命机遇是决定我国文化能否在国际竞争中胜出的关键因素[1] - 教育部、科技部等七部门联合发布《关于加强中小学科技教育的意见》,显示政策支持已延伸至基础教育层面[1] 科技与文化融合的具体路径 - 在文化生产环节,应促进AI与科普创作深度融合,将人工智能作为创意伙伴,辅助将复杂原理转化为通俗表达并开发兼具科学性与艺术性的文化产品[5] - 在文化传播层面,需构建智能精准的科普传播网络,通过算法优化实现精准推送、借助智能翻译推动成果走向世界、利用沉浸式技术打造学习体验[7] - 在文化消费领域,要丰富优质科普资源供给,大力发展数字博物馆、云端科技馆、智慧图书馆等新型文化设施,推动科研资源科普化、数字化、可视化[7] 技术应用与产业赋能 - 人工智能技术如智能推荐、AIGC、虚拟现实、元宇宙体验正在重塑文化发展生态,为文化生产和传播开辟新天地[5] - 应充分发挥多模态大模型、智能翻译、虚拟现实等技术优势,创新中国故事的讲述方式,传播中华文化并分享科技创新成就[4] - 科学文化建设不仅关乎国民素质提升,也将为文化产业注入新的发展动能[7] 国际视野与品牌建设 - 要积极参与全球科技治理体系改革,在人工智能伦理、数字鸿沟治理等全球性议题上提出中国方案,增强国际话语权和影响力[9] - 需打造具有国际影响力的科技文化品牌,支持科技期刊、科普产品、科技影视作品"走出去",培育一批具有国际竞争力的科技文化企业[9] - 通过联合科研、学术交流、科普合作等形式,向世界展示中国科技的创新成就和科学文化的独特魅力[9]
我在珠海挺好:沃土之上,梦想花开
南方都市报· 2025-11-21 12:01
活动概况 - 活动主题为“我在珠海挺好”特区创业者风采荟,于11月20日晚在珠海大剧院举办 [1] - 活动旨在展现珠海新时代创业者的精神追求,营造创新创业浓厚氛围,彰显珠海吸引全球优秀青年人才的诚意 [1] - 活动通过《我在珠海·潮》《我在珠海·跃》《我在珠海·创》三个篇章,结合创业故事展播和文艺演出,再现创业情怀 [3] 创业者与行业代表 - 18位创业者成为舞台主角,来自人工智能、低空经济、生物医药、新能源、乡村振兴等领域 [1] - 纳金科技创始人雷震在珠海实现纳米银元器件全球独家规模化量产,成功打破国外新型透明导电材料技术垄断 [6] - 无界方舟智能技术有限公司创始人曾晓东研发的多模态大模型日处理数据超10亿Token,应用于智能机器人、眼镜、手环等硬件 [6] - 冰都食品创始人马迪亚(意大利)的企业已成长为中国意大利食品领域的重要参考企业 [6] - 低空经济领域代表朱启政运营全国首条无人驾驶载人载物融合航线 [7] - 其他代表包括推动“体育+文旅+农业”融合发展的世界冠军李咏珊、打造年出栏120万只乳鸽养殖基地的退伍军人伍浩、带领女性灵活就业的“妈妈岗”孵化者张露曦 [7] 珠海营商环境与政策支持 - 截至今年10月,珠海及横琴粤澳深度合作区的经营主体已超过46万户,个体工商户超过24万户 [4] - 《珠海市创新创业团队服务管理办法》自2021年实施以来,已立项支持80多个创新创业团队,支持资金近9亿元 [4] - 珠海的战略位置、不断改善的交通以及政府部门高效的公共管理服务被提及为企业发展的有利条件 [6]