Workflow
多模态
icon
搜索文档
2.4万亿参数,创意写作全球第一!百度这次真站起来了?
观察者网· 2025-11-13 14:23
文心5.0大模型技术突破 - 新一代基座大模型文心5.0正式亮相,参数量高达2.4万亿,采用原生多模态融合技术 [1] - 模型采用超稀疏混合专家架构,激活参数比例低于3%,在保持强大能力的同时有效提升推理效率 [7] - 在LMArena排行榜上,其预览版本位列全球第8,创意写作能力排行全球并列第一 [1] - 采用统一的自回归架构进行原生全模态建模,从训练开始便融合语言、图像、视频、音频等多模态数据,实现理解与生成一体化 [7] 智能体“伐谋”与产业应用 - 发布全球首个自我演化智能体“伐谋”,在相关全球公开测试中实现全榜单SOTA成绩 [2] - 该智能体结合大型语言模型的推理能力和大规模进化搜索,旨在寻找“全局最优”解决方案,应用于交通管理、金融风控等复杂产业场景 [8] - 在海上风电平台设计场景中,相比传统人工设计,能快速产出高质量优化方案,节省大量成本并缩短近一周工期 [10] - 在交通信号灯控制场景中,赋能百度智能云SaaS信控平台,实现算法自主迭代,使车均延误降低13%,并进一步再降低50% [11] 数字人与智能体产品进展 - 慧播星数字人技术向全行业开放,本次双11期间GMV同比提升91%,开播直播间数同比增长119%,83%的开播主播使用过数字人 [12] - 发布新一代“实时互动型数字人”,可实现实时响应、声情并茂,未来将应用于法律咨询、情感咨询等高信任度服务场景 [12] - 无代码编程智能体“秒哒”升级至2.0版本,并推出海外版MeDo,荣登全球产品榜Product Hunt榜首 [12] - 文库网盘GenFlow升级至3.0版本,拥有2000万用户,成为全球最大的通用Agent [13] 搜索引擎与自动驾驶业务 - 百度搜索绝大部分结果由AI生成,首条结果的富媒体覆盖率达70% [13] - 萝卜快跑每周订单量超25万单,且100%为全无人订单,累计全球订单超过1700万单 [13] - 萝卜快跑自动驾驶总里程已超过2.4亿公里,其中全无人驾驶里程突破1.4亿公里 [13] 昆仑芯与算力基础设施 - 发布新一代昆仑芯M100和M300,分别针对大规模推理和超大规模多模态模型训练,计划于2026年及2027年上市 [15] - 天池超节点升级至256与512版本,单个天池512超节点能完成万亿参数模型训练,将于明年上市 [3][15] - 预告2030年推出百万卡昆仑芯单集群,昆仑芯已累计完成数万卡部署,成为关键AI底座 [15][16] - 百度智能云凭借全栈AI云能力,已连续六年位列中国AI云服务市场份额第一 [16]
学习机进化论:穿过内容舒适区,驶入AI深水区
21世纪经济报道· 2025-11-11 15:52
学习机市场概况 - 2025年学习机市场特点是通过创新抢占市场并继续创新巩固优势 [1] - 2024年三季度学习平板市场全渠道销量为180.6万台,同比增长3.5% [2] - 教育企业在2024年超越传统电教和科技企业,占据市场绝对份额,优质内容是其核心竞争力 [3] 竞争格局演变 - 教育企业从供给优质内容转向深度探索AI老师,以此构建更高壁垒 [4] - 学而思学习机内置课程总量达1600万分钟,上市后新增400万分钟课程、85万套真题和7亿道题目 [5] - 学而思独家合作小托福考试,引入RAZ、5·3等权威教育资源,提供一站式学习服务 [5] - 好品牌是好内容的基础,例如学而思学习机视频课源自二十多年口碑的名师课程 [6] AI老师的驱动因素 - 学生自学场景需要交互和指导,而非单向输出,真人服务受限于无法同时实现个性化、高质量和大规模 [7][8] - 好内容与好AI相辅相成,用户使用内容沉淀的学情数据构成高质量数据集,为AI老师开发提供基础 [8] - 大语言模型具备深度推理能力是AI老师诞生的技术基础 [9] AI老师的能力分级与发展 - AI老师能力分级参考自动驾驶L1至L5,学而思学习机AI老师已初步具备L3级别能力 [10] - L2阶段AI老师是独立模块,如批改助手、讲题助手,能完成任务但谈不上真正教学 [11] - L3阶段AI老师是多种能力组合闭环,能拆解复杂问题、引导思考并实时批改,真正扮演老师角色 [11][12] - 学而思小思AI老师从1.0语音助手演进至3.0版本,实现低延迟、多模态、沉浸式、深度个性化教学 [13][14][15][16] - 小思AI 1对1于2024年8月通过中国信通院教育智能体评估,获最高4+级评级 [16] AI老师的核心特征与技术实现 - L3阶段AI老师核心特征是"软硬一体",内嵌于学习机,面向做题自学高频场景,目标替代书桌旁辅导老师 [18][19] - 三大核心特征为沉浸式、多模态和深度个性化,小思3.0通过硬件常驻实现全局copilot角色,便捷唤醒 [20][21] - 多模态能力实现"纸屏互动",AI老师可实时识别纸上作答步骤并指导,技术难度高需自研解决方案 [21][22] - 学习机未来竞争是AI竞争,AI老师核心功能是提供学习路径解决方案,成为核心竞争力 [22]
学习机进化论:穿过内容舒适区,驶入AI深水区
21世纪经济报道· 2025-11-11 15:47
学习机市场概况与竞争格局 - 2025年学习机市场的鲜明特点是通过创新抢占市场并继续创新巩固优势[1] - 今年三季度学习平板市场全渠道销量180.6万台,同比增长3.5%[2] - 以学而思为代表的教育企业在2024年全面超越传统电教和科技企业,占据学习机市场绝对份额[2] 教育企业的核心竞争力演变 - 优质内容是教育公司后来居上的核心竞争力,构成切入学习机市场的降维打击[2] - 学而思学习机内置课程总量达1600万分钟,上市至今新增400万分钟课程、85万套真题和7亿道题目[2] - 2025年教育企业深度探索AI老师,这是比优质内容更高的壁垒[2] AI老师的必要性与技术基础 - 交互和指导是学生自学场景的深度需求,AI老师是解决个性化、高质量、大规模服务的最直接有效形式[3] - 好内容与好AI不是割裂的,用户使用内容时沉淀的海量数据构成AI老师的"血肉"和"骨干"[3] - 大语言模型具备深度推理能力是AI老师诞生的技术基础[4] AI老师的能力分级与发展阶段 - AI老师发展可类比L1向L5进阶的自动驾驶,目前学而思学习机AI老师已初步具备L3级别能力[4] - L2阶段AI老师是独立模块,能完成任务但谈不上真正教学[7] - L3阶段AI老师是多种能力组合闭环,能拆解复杂问题、引导学生思考并实时批改[7] 小思AI老师的迭代历程 - 2023年11月小思1.0诞生,是接入自研儿童百科RAG的语音助手[7] - 2024年5月小思2.0基于大模型Agent技术构建智能理解与决策能力,配备记忆系统、情感系统[7] - 2024年5月小思3.0&AI 1对1版本亮相,实现低延迟、多模态、沉浸式、深度个性化教学[7] L3阶段AI老师的核心特征 - L3阶段AI老师具备三大核心特征:沉浸式、多模态和深度个性化[9] - 小思3.0采用苏格拉底式讲题方式,能对题目分步骤讲解,引导用户自主书写解题步骤并实时识别批改[9] - 小思AI 1对1于今年8月通过中国信通院教育智能体评估,获得最高4+级评级[9] 多模态技术的应用与价值 - 小思3.0内置于摄像头而非屏幕上,用户拍一拍就能唤醒,实现硬件常驻[10] - 多模态能力使AI老师能与用户"纸屏互动",实时识别纸上作答并作出判断[11] - 纸屏互动技术难度高,需要掌握高质量数据且具备高水平研发实力的公司自研[13] 学习机市场未来竞争方向 - 学习机市场未来竞争将是AI的竞争,出色产品需同时提供好资源和好解决方案[13] - AI老师的功能是告诉孩子用什么路径学习内容,这将成为一个核心竞争力[13]
智源研究院智星计划:海外招聘(具身智能/多模态/类脑模型等)
具身智能之心· 2025-11-08 08:03
智星计划-海外招聘项目概述 - 项目是北京智源人工智能研究院面向全球顶尖高校应届毕业生的战略性人才招募项目 专注于引进培养海外高水平人工智能研究人才 [2] - 入选者将受邀赴北京开展6个月及以上的科研访问 与国际一流团队攻关前沿课题 并进入智源人才生态体系 [2] 项目核心优势 - 提供直通研究院全职录用机会 表现优异者可优先获得PI 研究员或博士后职位 [5] - 开放智源前沿课题与超算资源 与领域内领军研究者共同工作 [5] - 配备学术导师和行政导员 提供科研与生活全方位支持 包括长期学术发展与资源支持 [7] 福利待遇 - 提供国际旅费 科研补助 住宿 医疗和生活津贴等全方位保障 [8] 招募对象与要求 - 面向顶尖高校及实验室在读华人博士 博士后及正式科研人员 [9] - 研究方向涵盖类脑模型 智慧心脏 具身智能 多模态和AI4S等领域 [9] - 申请者需已在NeurIPS ICML ICLR CVPR ACL等顶会以第一作者发表论文≥3篇 或展现出卓越科研潜力 [9] 申请流程 - 全年接收申请 滚动评审 录满即止 [11] - 流程包括联合意向 材料准备 学术评估 面试评审和正式邀请等环节 [9][10] 项目愿景 - 旨在与入选者共同开展具有世界影响力的研究课题 在全球AI创新浪潮中成就卓越 [12] - 构建长期深入合作关系 与智源研究员共同制定实施研究计划 访学结束需提交研究成果报告 [12]
量子位「MEET2026智能未来大会」已启动!年度AI榜单 & 趋势报告正在征集中
量子位· 2025-11-05 10:08
大会核心主题与背景 - 行业正迈入由人工智能重塑一切的新时代,智能技术已从工具发展为能深度理解人类需求的智能伙伴[1][2] - 智能技术跨越产业、学科和场景边界,催生出全新生态和机遇,数字世界与物理世界的界限正逐步模糊融合[3][4] - 大会以“共生无界,智启未来”为主题,探讨人工智能作为基础设施如何重塑工作、生活和社会运作模式,其本质是连接、共生、重塑与跃迁[5][7][14] 大会影响力与参与方 - MEET智能未来大会是年度影响力科技商业峰会,今年是第七届,每年吸引上千名科技从业者参与,百万观众线上围观,近百家合作媒体联合曝光[9][12] - 过往嘉宾包括李开复博士、张亚勤教授等产业领袖,倪光南院士等多位学术领路人,以及百度、阿里、腾讯、华为、京东、美团、小米、商汤等科技行业领军企业代表[9] 大会核心议题 - 大会将聚焦人工智能+、AI Infra、智能终端、智能驾驶、低空经济、能源电力等前沿科技话题[13] - 重点探讨人机共生、虚实结合、产业共生等趋势,关注AI如何理解人类意图并进行协同合作,以及多模态、AR/VR、空间计算等技术融合[14] 2025人工智能年度榜单 - 量子位发起的「人工智能年度榜单」是AI行业最具影响力榜单之一,旨在发现引领变革的探索者[16] - 评选从公司、产品、人物三大维度设置五类奖项,包括年度领航企业、潜力创业公司、杰出产品、杰出解决方案和焦点人物[17][18][19] - 评选报名从即日起至2025年11月17日截止[20] 2025年度AI十大趋势报告 - 量子位智库将在MEET2026大会上发布《2025年度AI十大趋势报告》,提名释放巨大潜力的十大AI趋势[23][24] - 报告将结合技术成熟度、落地现状和潜在价值进行深入分析,并提名代表机构与最佳案例[24] 大会基本信息 - MEET2026智能未来大会地点设在中国北京,参会报名通道即将开启[26] - 大会正积极筹备,并寻求与优秀企业、媒体、研究机构、投资机构、技术社区等潜在合作伙伴共商盛事[27]
全新创作平台SkyReels来了!一张画布+一个对话框包办AI视频创作全流程
量子位· 2025-11-04 09:56
产品核心定位与优势 - 产品是昆仑万维旗下的全新AI视频创作工具SkyReels,旨在通过一体化画布简化多模态内容创作流程[1] - 核心优势在于将图像生成、音频配乐、视频剪辑等多个独立功能整合进一张可无限延展的画布,用户无需在不同工具和网站间切换,避免了频繁导入导出文件的操作[3][4][5] - 该设计让创作者能更专注于内容创意本身,而非技术实现流程,提升了创作效率[44][45][46] 多模态模型集成与功能 - 平台内置了众多海内外主流大模型,包括近期热门的Sora2、Veo3.1、NanoBanana等,用户可根据需求灵活选用[7] - 支持图生视频功能,用户只需将图片拖入视频功能区并输入提示词,即可让静态图片动态化,例如将黏土风拍立得照片转化为动态视频[9][11][13] - 具备音乐生视频能力,可先让AI生成一段特定风格的音乐,再根据音乐氛围自动生成匹配剧情的视频,展示了其理解情绪和自导自演的能力[15][16][17] - 支持风格迁移功能,能够用一张图的风格去影响另一张图,例如将肯德基老爷爷与上海外滩场景结合生成新图片[17][19] 智能代理系统 - 平台设有一个Super Agent作为总协作者,可随时响应用户需求,进行聊天、补全脚本、生成分镜等操作[21][22] - 提供28个Expert Agent专家代理,覆盖广告大片、故事书绘本、高质量海报等专业领域,能为特定需求提供深度且可直接使用的解决方案[24][26] - 专家代理能生成具有商业大片质感的内容,例如耳机产品广告图、毛毡风动画片段、咖啡店品牌视觉设计等[26][28][29] 模板化创作与数字人技术 - 平台内置近10个大类、150多种创作模板,涵盖AI数字人口播、产品功能演示、高阶创意广告等场景,用户选择模板即可快速生成内容[31][32] - 数字人技术是业内首个支持单镜头多人多轮对话的模型,能实现最长4分钟的连续嘴型同步,并支持32种运镜与Prompt控制,使多角色互动自然流畅[36] - 数字人示例展示了其精准的嘴型同步和细节处理能力,如双人对话场景和角色语速节奏控制[36] 视频后期处理能力 - 支持视频延长功能,可将短视频延长并智能补充新镜头,例如将2秒的猫咪打哈欠视频延长至6秒并添加俯视远景镜头,画面过渡顺滑[36][38] - 具备视频风格化处理功能,可对长达30秒的视频进行风格转换,在保留原动作的基础上套用剪纸、辛普森、像素风、梵高画风等多种视觉风格[40][42]
昆仑万维单季扭亏毛利率达69.9% 深化全球布局海外收入占超九成
长江商报· 2025-11-04 08:14
核心财务表现 - 2025年第三季度营业收入20.72亿元,同比增长56.16% [1] - 2025年第三季度归母净利润1.90亿元,上年同期亏损2.37亿元,同比增长180.13% [1][2] - 2025年前三季度营业收入58.05亿元,同比增长51.63% [1] - 公司整体毛利率达69.9%,保持在较高水平 [1][2] AI业务发展 - AI相关业务收入同比大幅增长,是业绩增长的主要驱动力 [1] - 公司自2023年初确立“All in AGI与AIGC”战略,全面向人工智能公司转型 [2] - 已构建涵盖AI大模型、AI智能助手、AI音乐、AI视频、AI社交等在内的业务矩阵 [2] - 近期发布或开源多款人工智能模型,包括多模态推理模型Skywork-R1V3.0、多模态统一模型SkyworkUniPic和3D世界生成模型Matrix-3D等 [2] - “天工”大模型迭代至4.0版本,采用MoE架构,参数规模达4000亿,是全球最大的开源MoE模型之一 [4] 全球化战略与海外业务 - 2025年前三季度海外业务收入54.1亿元,同比增长58% [1][3] - 海外收入占比达93.3%,同比提升3.6个百分点 [1][3] - 全球月活跃用户稳定在近4亿,业务覆盖全球100多个国家和地区 [3] - 信息分发与元宇宙平台Opera是海外市场重要抓手,通过“AI Feature Drops”计划优化AI功能 [3] 研发投入与技术突破 - 2020年至2024年研发费用持续增长,分别为5.11亿元、5.96亿元、6.90亿元、9.68亿元、15.43亿元 [3] - 截至2025年前三季度,研发费用达12.11亿元,同比增长5.83% [3] - 研发投入带来了技术突破,支撑了AI大模型和多元AI业务矩阵的构建 [3][4] 投资业务与其他 - 第三季度投资业务表现显著改善,受益于资本市场回暖 [2] - 参投项目如小马智行、爱奇艺等持续贡献收益 [2]
量子位「MEET2026智能未来大会」已启动!年度AI榜单 & 趋势报告正在征集中
量子位· 2025-11-02 10:00
大会核心主题与背景 - 行业正迈入一个由人工智能重塑一切的新时代,智能技术已从工具发展为能深度理解人类需求的智能伙伴[1][2] - 智能技术跨越产业、学科和场景的边界,多模态、AR/VR、空间计算等技术正推动数字世界与物理世界的融合[3][4] - 企业、技术与社会之间的连接与共生成为推动发展的核心动力,人工智能逐步成为基础设施,重塑工作、生活和社会运作模式[5][7] MEET2026智能未来大会概况 - 大会以“共生无界,智启未来”为主题,是MEET系列第七届年度科技商业峰会,旨在探讨人工智能+、AI Infra、智能终端等前沿话题[7][13][14] - 过往大会吸引上千名科技从业者现场参与,百万观众线上围观,并有近百家合作媒体联合曝光[12] - 大会汇聚科技、产业与学术领域领军人物,包括李开复博士、张亚勤教授等产业人士,以及百度、阿里、腾讯、华为等科技行业领军企业[9] 大会核心活动与发布 - 将在大会上重磅发布“2025人工智能年度榜单”,从公司、产品、人物三大维度评选五类奖项,包括领航企业、潜力创业公司等[16][17][18] - 榜单评选报名从即日起至2025年11月17日,结果于MEET2026大会正式公布[20] - 依照惯例,量子位智库将在大会上发布《2025年度AI十大趋势报告》,提名并深入分析十大AI趋势[23][24] 大会参与信息 - 大会地点设在中国北京,参会报名通道即将开启[26] - 大会筹备方欢迎优秀企业、媒体、研究机构等潜在合作伙伴通过指定邮箱进行商务合作探讨[27][28]
量子位「MEET2026智能未来大会」已启动!年度AI榜单 & 趋势报告正在征集中
量子位· 2025-11-01 09:35
人工智能时代背景 - 行业正迈入由人工智能重塑一切的新时代 [1] - 智能技术已深刻渗透生产和生活,从工具发展为能深度理解人类需求的智能伙伴 [2] - 智能技术跨越产业、学科和场景边界,催生全新生态和机遇 [3] - 多模态、AR/VR、空间计算等技术使数字世界与物理世界界限模糊融合 [4] - 企业、技术与社会之间的连接与共生成为推动发展的核心动力 [5] MEET2026智能未来大会 - 大会主题为“共生无界,智启未来”,聚焦AI穿透产业、学科与场景边界 [7][14] - 大会已举办至第七年,是年度影响力科技商业峰会 [9] - 过往嘉宾包括李开复、张亚勤等产业领袖,倪光南、谭建荣等多位院士,以及百度、阿里、腾讯、华为、京东、美团、小米、商汤等科技行业领军企业代表 [9] - 每年大会吸引上千名科技从业者参与,百万观众线上围观,近百家合作媒体联合曝光 [12] - 本届大会将探讨人工智能+、AI Infra、智能终端、智能驾驶、低空经济、能源电力等前沿话题 [13] - 大会地点设在中国北京,报名通道即将开启 [26] 2025人工智能年度榜单 - 量子位发起的“人工智能年度榜单”已成为AI行业最具影响力榜单之一 [16] - 榜单从公司、产品、人物三大维度评选五类奖项,包括年度领航企业、潜力创业公司、杰出产品、杰出解决方案和焦点人物 [17][18][19] - 评选报名从即日起截至2025年11月17日 [20] 2025年度AI十大趋势报告 - 量子位智库将在MEET2026大会上发布《2025年度AI十大趋势报告》 [23] - 报告将结合技术成熟度、落地现状和潜在价值,提名十大AI趋势并深入分析,包括代表机构和最佳案例 [24]
量子位「MEET2026智能未来大会」已启动!年度AI榜单 & 趋势报告正在征集中
量子位· 2025-10-31 08:58
大会主题与背景 - 当前正迈入人工智能重塑一切的新时代,智能技术已从工具发展为能深度理解人类需求的智能伙伴 [1][2] - 智能技术跨越产业、学科和场景边界,催生出全新生态和机遇,数字世界与物理世界的界限正逐步模糊融合 [3][4] - 企业、技术与社会之间的连接与共生成为推动发展的核心动力,人工智能正逐步成为基础设施的一部分 [5][7] MEET2026智能未来大会概况 - 大会以“共生无界,智启未来”为主题,聚焦AI+、AI Infra、智能终端、智能驾驶、低空经济、能源电力等前沿科技话题 [13][14] - 本届大会为第七届,是年度影响力科技商业峰会,每年吸引上千名科技从业者参与,百万观众线上围观,近百家合作媒体联合曝光 [9][12] - 大会地点设在中国北京,报名通道即将开启 [26] 与会嘉宾与行业影响 - 过往嘉宾包括李开复博士、张亚勤教授等产业领袖,倪光南院士等多位学术领路人,以及百度、阿里、腾讯、华为、京东等科技行业领军企业代表 [9] - 大会已成为智能科技行业的年度风向标,通过领袖分享独到观点,推动行业变革 [12][14] 2025人工智能年度榜单 - 量子位发起的该榜单是AI行业最具影响力榜单之一,旨在发现引领变革的探索者与实践者 [16] - 榜单从公司、产品、人物三大维度评选五类奖项,包括年度领航企业、潜力创业公司、杰出产品、杰出解决方案和焦点人物 [17][18][19] - 评选报名从即日起至2025年11月17日,结果将在MEET2026大会上发布 [17][20] 2025年度AI十大趋势报告 - 量子位智库将在MEET2026大会上发布《2025年度AI十大趋势报告》,提名释放巨大潜力的十大AI趋势 [23][24] - 报告将结合技术成熟度、落地现状和潜在价值等因素,对趋势进行深入分析并提名代表机构及最佳案例 [24]