Workflow
大模型
icon
搜索文档
300亿独角兽,补齐上市前的关键一环
投中网· 2025-11-04 15:04
中国大模型行业动态 - 国内大模型领域重新活跃,首批企业如智谱和MiniMax正向IPO发起冲刺,而其他企业则在寻求新融资或调整战略 [2] - 行业技术迭代速度极快,模型技术领先优势窗口期从半年缩短至3个月,头部厂商正以季度为节奏推动技术突破 [7][9] - 商业化落地能力成为支撑估值的关键变量,企业市场份额因模型垂直能力而快速变化,例如Anthropic凭借代码生成能力市场份额从12%跃升至32% [11][18] MiniMax公司战略与进展 - MiniMax专注于在效果、价格和推理速度之间取得平衡,其新模型M2的API定价为每百万Token输入0.3美元,输出1.2美元,是竞品Claude Sonnet 4.5价格的8%,且推理速度快近一倍 [6][12] - 公司在4个月内实现了视觉与语言模型的双线登顶,其自研多模态模型及AI原生应用已累计服务超过1.57亿个人用户及50,000余名企业客户与开发者 [7][15] - MiniMax的估值增长领跑同行,最新估值近300亿,其优势在于更市场化的营收、健康的现金流以及对AI商业化的独到理解,已正式递表港交所 [15][18] MiniMax-M2模型技术成就 - MiniMax-M2在海外发布后表现强劲,在全球权威测评榜单AA上总分进入全球前五、开源第一,是首个进入全球文本模型第一梯队的中国模型 [4][5] - 模型上线5天内,在API整合平台OpenRouter上的实时调用token量已排到全球第三,在编程场景中排名全球第三,并在HuggingFace Trending榜单排名第一 [5][13] - M2模型专为Agent和Coding场景打造,标志着公司杀回文本模型领域,旨在构建一个让C端和B端用户都能用得起的大模型生态 [5][6][19]
夸克 AI 眼镜成阿里 AI To C 船票,马云看走眼了吗?
钛媒体APP· 2025-11-04 13:09
行业AI投资趋势 - 英伟达市值持续飙升,反映出“All in AI”已成为行业共识 [1] - 2025年上半年中国智能眼镜厂商出货量突破100万副,同比增长64.2%,预计全年出货量将超过200万副 [7] - 第三季度中国AI应用9月MAU(月活跃用户)突破4.6亿,季度增长率为7.17% [17] 阿里巴巴AI战略 - 公司宣布未来三年投入3800亿元建设AI基础设施,并将大模型定位为下一代操作系统 [1] - 公司CEO吴泳铭在2025云栖大会上宣布通义千问选择开放路线,旨在打造AI时代的Android [1] - 创始人马云低调现身阿里西溪园区C区,显示出公司对AI to C业务的高度重视 [1] 夸克AI眼镜S1产品详情 - 产品在双11期间开启预售,售价3999元起,88VIP会员价格为3699元起,淘宝/天猫页面显示已售出4000+副 [3][7] - 硬件配置包括双目Micro-LED+衍射光波导显示、高通骁龙AR1+恒玄2800双处理器、1200万像素摄像头(索尼IMX681) [4] - 采用可换电池设计,电池位于眼镜腿末端,可拆卸以实现“无限续航” [5] - 应用功能依赖Qwen闭源模型,支持实时翻译、高德近眼导航、识物询价、支付宝“看一看”支付等 [5] 夸克App产品定位与功能 - 夸克App既是浏览器也是搜索引擎,具备较强的互联网工具属性,新版本在搜索框下方新增“助手”按钮,切换为问答模式 [9][10] - 采用Qwen最新闭源模型,在测试中表现优于百度App和豆包,例如在识别图片中鸡翅数量时更接近准确答案(十块) [12] - 夸克团队训练了医疗、教育、法律、金融等多个垂直领域模型,以提升用户体验 [14] 市场竞争格局 - 在国内AI应用App端,豆包以2.2亿MAU登顶,夸克MAU约为9610万,通义App月活数仅为696万 [17] - 2025年9月国内AI Web端MAU总计为1.37亿,Top 10占据77.6%份额,夸克仅位列第22位,且呈环比下降趋势 [18] - 竞品Rokid Gllasses天猫售价为2969元起,低于夸克AI眼镜的3999元起售价 [7] 市场推广与盈利模式 - 2025年1-7月,夸克投放金额均超1亿元,其中3-7月超4亿元,投流对MAU提升效果显著 [18] - 中国AI应用在C端基本免费,企业主要通过为B端用户提供大模型API调用、出售Token盈利 [19] - AI to C的意义在于庞大的用户群,可拓展增值服务(如会员、网盘)、吸引广告投放,并通过用户数据完善大模型算法 [20] 公司战略挑战与机遇 - 公司因“电商基因”浓厚,缺乏具有粘性的通用型互联网入口,历史上多次尝试寻找新入口均未成功 [21] - 夸克AI化是公司目前最好且为数不多的选择,旨在撬动非电商C端用户,支撑从电商向AI企业转型 [21] - 夸克本质上缺乏微信的不可替代性,投流不可持续,AI眼镜的成功与否可能成为其未来发展的转折点 [21]
我MiniMax,用实习生处理数据,照样屠榜开源大模型
量子位· 2025-11-04 13:06
注意力机制选择 - 公司从Linear Attention回归到Full Attention,原因是经过测试发现Efficient Attention机制在长上下文任务中性能大幅下降,而Full Attention在稳定性和可靠性方面表现更优[11][12][13] - 团队测试了多种Efficient Attention变体包括GDN和Mamba2,但实际表现均不及Full Attention[14][15] - 当前评测系统不完善,常用榜单无法有效区分Efficient Attention与Full Attention的性能差异,但在多跳推理或长链逻辑等复杂任务中Efficient Attention劣势明显[21][22] 数据处理策略 - 公司通过雇佣实习生处理数据来证明其数据处理流程的成熟度,即使缺乏经验的人员也能达到预期效果[24][27] - 数据质量衡量标准聚焦于思维链和Response两个维度,其中思维链要求逻辑完整且表述简洁,Response部分则刻意引入格式多样性以避免对特定榜单格式的过拟合[31][32][34][35] - 公司构建了基于规则和大模型判断的数据清洗流程,专门针对典型bad case进行清理,以消除模型幻觉和指令未遵循等问题[37][38] 模型思考模式创新 - 公司提出"交错式思维链"策略,使思考过程在显式推理与工具调用之间交替进行,形成"计划→行动→反思"循环,显著提升长链任务容错率和环境扰动适应能力[45][46][47][48] - 为解决模型工具调用能力泛化不足的问题,公司设计覆盖全轨迹扰动的数据链路,模拟工具变化、系统提示语调整、环境参数异常等多种真实场景,增强模型在不确定性中的任务完成能力[50][51][52] 技术发展路径 - 公司技术决策以工程理性为导向,优先考虑模型在真实任务中的稳定性与可用性,而非盲目追求算力节省,这一思路在MoE架构探索阶段已得到验证[53][54][55] - 模型定位强调实用性,旨在为开发者提供落地工具,注重解释逻辑和系统性迭代,而非参数堆叠的"炫技模型"[56][57]
65k×19薪,去京东造车了!
猿大侠· 2025-11-04 12:07
京东造车战略 - 京东联合广汽集团、宁德时代推出国民好车,定位为生态整合者[1] - 通过机器学习模型(如DIN、MMoE)挖掘消费者偏好,精准定义车型配置与定价策略,优化购车流程[1] - 探索大模型(如LLaMA、GPT)在客服、风控等场景应用,提升后市场服务智能化水平[1] - 近半年京东汽车零售事业部发布大量算法工程师岗位,年薪可达123万元(35k-65k,19薪)[1] AI算法人才市场需求 - 大厂大力扩充AI岗位,吸收AI人才,算法岗薪资比往年提高40%[4] - 算法工程师培养计划承诺在校应届生就业薪资不低于29万元,在职人员最低薪资涨幅40%-50%[4][72] - 已有上千位学员通过培养计划拿到offer,平均薪资达到35万元以上,最高月薪85k[4][57] - 往期学员90%拿到国内外名企AI、算法岗位offer,最新一期最高月薪75k[57] AI算法工程师培养课程内容 - 课程由20位一线大厂顶级专家研发,涵盖传统机器学习到预训练模型演进(TF-IDF、SVM、TextCNN、LSTM、BERT、Qwen)[6][8] - 项目实战包括意图识别、RAG与大模型智能客服、信息抽取与图谱问答、Dify智能开发、多模态内容理解、ChatBI智能分析、PDF智能公式、Agent自动化工作流、领域LLM高效微调[12][13][18][23][27][32][37][46] - 学员掌握从数据采集、模型训练调优到部署落地的全流程实战能力,具备工业项目动手能力[12][17][22][26][31][36][39][45][54] 学员转型成果 - 王同学4年Java开发转型算法岗,年薪从25万元涨到42万元,涨幅68%[58] - 谢同学后端开发5年转型图像算法岗位,月薪48k,年薪72万元[60][61] - 刘同学应届生拿下百度大模型算法岗offer,年薪48万元[63] - 曹同学本科电子信息专业转型AI算法岗,综合年薪50万元[66] - 车同学被内推到腾讯NLP算法岗,薪资从13.5k跃升到27k*16薪,年薪翻近3倍[68][69]
工信部推动大模型与智能网联新能源汽车深度融合,产业进入新发展阶段,新能车ETF(515700)震荡蓄势
新浪财经· 2025-11-04 10:11
政策导向与行业趋势 - 工信部推动实施“人工智能+制造”,加速AI手机、AI电脑等消费终端换代,并加快人形机器人、脑机接口等新一代智能终端研发与应用 [1] - 政策推动大模型与智能网联新能源汽车、数控机床等深度融合,加快智能体设计、开发、测试和部署,探索多智能体协同生态 [1] - 智能网联新能源汽车的发展有望驱动智能化接替电动化,成为新能源汽车产业链发展的新动能 [1] 新能源汽车产业指数与新能车ETF - 新能车ETF紧密跟踪中证新能源汽车产业指数,该指数选取50只业务涉及新能源整车、电机电控、锂电设备等领域的上市公司证券作为样本 [1] - 中证新能源汽车产业指数成分股权重分布为:电池51.4%、能源金属14.4%、整车8.8%、自动化设备7.6% [1] - 新能车ETF有望受益于锂电行业景气度回升与估值中枢上行 [1] 指数权重股构成 - 截至2025年10月31日,中证新能源汽车产业指数前十大权重股合计占比53.56% [2] - 前十大权重股包括宁德时代、汇川技术、三花智控、比亚迪、亿纬锂能、华友钴业、赣锋锂业、先导智能、长安汽车、天齐锂业 [2]
360“视力”大模型押注具身智能赛道
中国经营报· 2025-11-04 10:09
公司动态 - 360公司对FG-CLIP2模型进行了开源 该模型主要针对AI"视力"方向 [2] - FG-CLIP2模型以对图像细节的极致理解 在视觉语言模型的多项测试中超越了谷歌 Meta同类产品 [2] - FG-CLIP2的核心突破在于解决了"细粒度识别"问题 [4] 技术应用与行业影响 - FG-CLIP2对于正处风口的具身智能和商业智能化至关重要 [4] - 该模型让机器人对世界的理解从"大概"变为"精确" 为真正的实用化AI奠定了基础 [4] - 人形机器人的硬件从5年前就已不是障碍 目前真正制约发展的是软件能力 即专门用于控制机器的大模型的进化 [4] 市场前景与政策支持 - 2025年"具身智能"首次被写入《政府工作报告》 标志着该领域正式上升为国家战略 成为未来产业培育的重点方向 [4] - 多地政府在2024年也陆续出台配套政策 推动各地方具身智能产业发展 [4] - 2045年后我国人形机器人或超过1亿台 整机市场规模可能达到约10万亿元级别 [4] - 2025年全球人形机器人市场预计达到29.2亿美元 并将在2030年增长至152.6亿美元 年复合增长率为39.2% [4]
人工智能与北京对外文化传播研讨会召开
环球网· 2025-11-04 08:10
会议概况 - 会议主题为“人工智能与北京对外文化传播”,旨在探讨人工智能技术如何为北京对外文化传播提供新路径和关键技术支撑 [1] - 会议由北京第二外国语学院科研处主办,其首都对外文化传播研究院和北京对外文化传播研究基地承办,邀请了学界、政府、企业、媒体等各界人士参与 [1] - 会议分为上午场和下午场,由首都对外文化传播研究院院长曲茹教授主持 [1] 文化机构的AI应用与实践 - 故宫博物院提出“四个故宫”建设体系,其中“数字故宫”已完成超过藏品总量半数的文物数字化采集,并构建了数字文物库等平台实现文物资源的智能化管理 [5] - 新华社应用AI实践包括数字主播“新小萌”和“采编助手”等 [13] - 北京市台办融媒体中心“京彩台湾”积极探索跨界融合,利用AI技术助力内容生产,如出版音像图书、推出广播剧和微短剧 [15] - 中央广电总台国际在线总裁建议利用人工智能助力分析文化差异,并在文化内容生产外注重单向传播转变为双向交流 [23] AI技术能力与行业应用前景 - 大模型具备三大核心能力:语言与多模态内容生成、复杂问题推理能力,以及任务规划与调度执行能力 [7] - AIGC已实现多语言翻译、文生图、虚拟主播、短视频与音乐生成等功能,大幅提升内容生产与传播效率 [17] - AI技术可实现传播内容的自动编码、情感分析与多语种处理,北京第二外国语学院人工智能学院重点开展多语种机器翻译评测,并构建高质量语料库 [18] - 人工智能可从挖掘文物内涵、精准定位受众、丰富IP形态、降低语言门槛四方面为北京文化对外传播提供助力 [13] 对外传播策略与建议 - 建议在对外传播中注重价值观对齐,通过技术手段传递中国文化的真实内涵,并强调“知识+检索增强”是实现可控生成的关键路径 [7] - 提出AI赋能超大都市全球传播2.0的思考,建议提高政治站位让AI服务于高品质内容建设,并加强战略传播的区域规划,聚焦重点区域 [9] - 国际传播工作需加强受众群体研究,增强传播的接近性与实用性,并通过人工智能赋能提升多语种内容生产能力与传播效率 [11] - 建议在文化传播中寻找中外受众的共同语言,音乐、游戏等可成为重要载体,并需打造优质长效文化符号以提升传播质量与效力 [35][37] 产学研结合与资源整合 - 建议基地以制度建设为根基,建立专家顾问团形成机制化保障,并实行项目制运作,同时可立足大平台联合发布研究成果,追踪公共热点扩大影响 [25] - 呼吁加快AI工具在实际场景中的落地,以科技赋能中华文化的高效传播与国际影响力提升,并强调AI在舆情监测、用户画像、互动评估等方面的潜力 [17] - 建议实验室需聚焦国家战略需求,在纯学术研究之外关注实用性,通过数据实验、用户画像、心理测量等技术优化传播内容,并进行效果评估 [31] - 北京第二外国语学院人工智能学院与芒果TV合作开发包含17个小语种的影视翻译大模型,并与科大讯飞合作特定语言模型以服务文化传播在地化及文化语境问题 [40] 行业趋势与挑战 - 指出国际传播领域出现三大变化:传播领域从相对冷门专业变为一门显学、中国企业出海潮产生真实品牌传播需求、全国各地国家传播专门单位纷纷建立并走向普及 [33] - 分析当前文化传播面临的挑战包括预设传播效果与实际效果之间存在偏差、年轻受众偏好出现新变化、以及过去文化传播中存在持续性不足和伪文化泛滥等问题 [37] - 认为目前尚未形成广泛的“世界北京情结”,与纽约、巴黎等城市的文化传播存在差距,需依托北京的科技优势与新兴文化资源,借助现有对外传播矩阵提升国家软实力 [27]
突发!arXiv CS新规:未经同行评审,一律不收
具身智能之心· 2025-11-04 08:05
arXiv政策变革背景 - arXiv对计算机科学板块的"综述/调研"和"立场"类论文实施新规,要求必须通过同行评审后才能收录[2][7] - 生成式AI和大模型技术导致论文撰写变得轻而易举,特别是那些不包含新研究成果的论文[20] - arXiv所有分类都出现提交量大幅增长,但在计算机科学领域尤为显著[21] - 目前arXiv每月收到数百篇综述文章,其中90%被描述为"带注释的文献清单",缺乏实质性价值[5][32] 新规具体内容 - "综述"和"立场"论文需被期刊或顶会接收并完成同行评审后,才能提交至arXiv[8] - 作者提交时必须提供经同行评审的期刊引用及DOI元数据[9] - 若论文因"未完成同行评审"被拒,后续通过严格评审后可按指引申诉并二次投稿[49] - 研究科学技术对社会影响的论文(如cs.CY或physics.soc-ph分类)不受此政策影响[50] 学术界反应 - MIT EECS副教授Phillip Isola认为此举偏离了arXiv作为"科研界GitHub"的定位[10][11] - 前谷歌DeepMind专家Ahmad Beirami担忧新规会误杀优质内容并拖慢成果发布速度[39] - 艾伦研究所ML专家Nathan Lambert对政策实施效果持保留态度[40] - 研究员Gavin Crooks指出arXiv正从预印本服务器转向"后印本"平台[41] 政策实施目标 - 帮助读者更轻松地找到由领域专家撰写的高质量综述和立场文件[28] - 让审稿人集中精力处理arXiv正式接纳的内容类型,缩短稿件积压时间[28] - 保持arXiv快速、自由分享研究论文的核心宗旨,促进科学发现[23] - 如果其他分类也遭遇AI生成论文泛滥,未来将效仿计算机科学板块调整审核政策[51]
大模型专题:2025年中国大模型行业发展研究报告
搜狐财经· 2025-11-04 00:20
大模型行业发展概况 - 大模型是新一代人工智能发展的战略核心与关键引擎,可从应用广度、部署形态和技术路径三个维度进行分类,包括通用与行业模型、云端与端侧模型、闭源与开源模型 [15][16] - 2024年中国大模型市场规模约294.16亿元,预计2026年将突破700亿元,行业处于爆发式发展阶段 [26][27] - 多模态融合与智能体演进成为竞争焦点,2024年中国多模态大模型市场规模达156.3亿元,主要应用场景包括数字人(占比24%)、游戏(13%)、广告商拍(13%)等 [26][27] - 全球大模型行业正从技术竞速转向生态竞合,中国凭借完备产业链与广阔应用场景稳居全球发展第一梯队,厂商已从技术跟随转向并行乃至部分引领 [18] - 中国人工智能政策体系形成"创新驱动、基础强化、场景牵引、安全治理"四位一体格局,2025年《关于深入实施"人工智能 + "行动的意见》推动AI赋能千行百业 [20][21][22][23] 大模型生态新范式与企业竞争力 - CBDG四维生态模型(消费者Consumer、企业Business、设备Device、政府Government)成为中国大模型发展新范式,四者通过深度耦合形成相互作用与赋能的有机整体 [42][43] - 消费者(C端)是应用创新的活力源泉与商业模式验证的试金石,其快速反馈驱动模型迭代 [43] - 企业(B端)是价值创造与落地核心,驱动大模型技术与行业Know-how深度融合,催生面向特定场景的深度解决方案 [43] - 企业竞争力体现在生态构建、技术研发、行业赋能、商业变现、创新拓展五大能力,竞争从技术和产品单点对决转向全方位的体系化竞争 [8] 大模型企业典型案例分析 - 科大讯飞深耕G/B端,2024年央国企大模型解决方案市场份额居首,2025年Q3中标数量和金额双第一,并通过"机器人超脑"平台布局具身智能 [7][38][39] - 字节跳动依托C端流量与数据飞轮构建生态闭环 [7] - 阿里以夸克转型AI工具集提升用户粘性,实现差异化突围 [7] 大模型行业未来发展趋势 - 技术向多模态融合、智能体化、具身智能突破,大模型凭借涌现性特征驱动具身智能系统自我进化,成为连接虚拟与物理世界的核心枢纽 [8][36][37] - 产业竞争转向生态协同,价值向应用服务层聚集 [8] - 大模型应用正从试点验证迈向规模化深耕,B端与G端成为价值实现的主阵地,截止到2025年3月中国AI原生应用月活用户已突破2.7亿 [33] - 据预测,到2030年中国具身智能市场规模预计达到4,000亿元,2035年有望突破万亿元,应用主要集中在机器人(占比约56%)和自动驾驶(占比约44%)两大领域 [35][36]
美团AI大动作,防守还是进攻?
第一财经· 2025-11-03 21:12
美团AI大模型战略动态 - 公司在2023年收购光年之外后曾暂停大模型追逐,但在2024年突然加快动作 [3] - 公司于2024年9月推出大模型LongCat-Flash-Chat,随后陆续推出推理模型LongCat-Flash-Thinking及视频生成模型LongCat-Video [3] - 公司于2024年11月3日发布并开源多模态大模型LongCat-Flash-Omni,同时上线LongCat官方App,该App目前支持联网搜索和语音通话等功能 [3] 行业竞争格局与AI应用 - 2024年几大本地生活平台在AI领域多有暗战,例如高德在9月推出的“高德扫街榜”包含AI功能如“卫星求救”,京东在JDD大会上官宣了电商创新AI架构体系Oxygen [3] - 公司在阿里推出高德扫街榜的同一天宣布大众点评“重启”品质外卖服务,通过B端自研大模型以“AI+真实高分”为用户提供决策 [4] - 行业专家认为平台之争的战火已逐步烧到AI能力比拼上,公司推出大模型既是防守也是进攻,旨在构建本地生活业务护城河并应对抖音、京东、阿里等平台的合攻 [4] 美团AI战略的驱动因素与前景 - 公司发展大模型主要意图是从外卖抽佣转向中小企业服务,利用其下游大量服务业商家资源,使大模型能在多种业务场景落地,例如商家可用AI大模型修饰菜品图片 [4] - 通过AI将“人找服务”转变为“智能服务匹配人”,使业务更顺畅,并对C端和B端赋能以盘活整个生态效率 [4] - 尽管与其他互联网公司相比布局速度落后,但公司作为商家平台触达商家用户的能力很强,AI的关键在于使用而非技术,重点是如何将外卖客户转变为AI客户 [4]