Workflow
大模型
icon
搜索文档
AI数据服务爆发,打造大模型背后的数据引擎丨热门赛道
创业邦· 2025-07-02 08:11
AI数据服务行业概述 - AI数据服务涵盖数据采集、清洗、标注、增强、质量控制及交付全流程,是AI模型从实验转向商业应用的关键推动力[3] - 行业开发范式从模型优化转向数据质量提升,以减少数据与模型割裂,抑制幻觉并改善输出[3] - 服务应用场景包括大语言模型训练、自动驾驶、金融风控及医疗图像识别等[3] 技术演进与服务模式 - 早期依赖人工采集与标注,目前向智能化与平台化跃升,采用自动标注、弱监督学习及数据合成技术降低成本[5] - 编程式标注(如Snorkel AI)通过标签函数和自动推理提升效率,替代传统人工贴标签方式[6] - 三种主流服务模式对比: - **自动化标注**:算法驱动,效率高但准确率中等,代表公司Snorkel AI、Labelbox[7] - **专业数据采标**:人工为主,高精度需求场景适用,代表公司Appen、iMerit[7] - **全栈式服务**:自动+人工结合,覆盖数据全生命周期,代表公司Scale AI、Sama[7] 产业链结构 - **上游**:数据采集设备、标注工具及合规接口供应商(如Snorkel、Label Studio)[8] - **中游**:核心服务环节,提供定制化数据处理(如医疗影像去标识化、自动驾驶多模态标注)[8] - **下游**:应用领域包括自动驾驶、医疗AI、金融风控等,推动中游服务专业化与自动化[9] 行业融资与趋势 - 2020年融资事件达33起高峰,2021年后波动趋稳,显示行业进入成熟期[9] - 近期大额投资动态: - Meta拟148亿美元收购Scale AI 49%股份[22] - 亚马逊5年投200亿澳元(129.7亿美元)扩建澳大利亚AI基础设施[21] 代表企业分析 尚跃智能 - 成立于2022年,聚焦自动驾驶、医疗等领域,构建结构化超声影像数据集[10] - 2025年完成Pre-A2轮融资(未披露金额),投资方为汉口基金[12] 博登智能 - 成立于2019年,提供自动驾驶、人脸识别数据全流程服务,BASE平台支持多模态数据处理[13] - 2025年完成亿元A轮融资,由上海国际集团独家投资[15][17] 文德数慧 - 成立于2023年,主推AutoConnect AI数据服务平台,覆盖自动驾驶多模态标注[18] - 2025年完成天使+轮融资(未披露金额),投资方为宜宾产城科创[19][21] 技术热点与生态动态 - 阿里云发布Data Agent系列产品,整合AI与数据工具智能化能力[23] - IBM推出非结构化数据解决方案,拟收购DataStax增强矢量搜索功能[26] - Crusoe Energy与Redwood合作推出全球最大二手电池供电数据中心(2000块GPU)[27]
金融业拓展深化大模型应用
经济日报· 2025-07-02 06:23
人工智能在银行业的应用现状 - 中国银行业在大模型落地应用方面走在前列 应用范围已从国有大行 股份制银行扩展到头部区域性银行 [1] - 国有大行和股份制银行已全面启动大模型应用建设 并在前台 中台 后台均有正式投产的应用案例 [1] - 人工智能在银行业的应用场景不断拓展 从前台业务(智能投顾 产品咨询智能客服)到中后台业务(智能反洗钱 智能监管) [1] 银行业AI应用的发展趋势 - 2025年预计将看到更多银行积极拥抱AI 探索其在多个领域的应用潜力 [1] - 银行业需要构建完善的治理框架和风险防范机制 确保技术应用的安全合规与可持续发展 [1] - 银行业应深入研究不同业务场景的实际需求 针对财富管理 投资策略等重要领域探索AI与行业专家结合的模式 [2] 当前AI应用的局限性 - 大模型实际效果与用户期望存在差距 如AI智能客服的"答非所问"和"已读乱回"问题 [2] - 在财富管理 投资策略等银行重点领域 大模型应用仍存在局限性 与核心业务尚未深度融合 [2] - 大模型存在"广而不精"现象 需要从"可用"迈向"优用" 从"大而全"转向"专而精" [2] 银行业AI应用的优化方向 - 根据实际需要对大模型进行优化调整 推动银行业数字化转型 降低运营成本 [2] - 建立健全用户反馈响应机制 通过用户交互数据优化算法 提升语义理解与精准回答能力 [2] - 银行需要持续资源投入 推动模型本地化优化 保障数据质量 提升应用成效 [3] AI在银行业的潜在应用领域 - 大模型在客户营销 业务创新 风险管理 机构运营等方面都具有持续开发潜力 [3] - 开源大模型的出现和推广降低了银行的成本投入 但需要从"可用"迈向"优用" [3]
MiniMax 进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 22:00
大模型行业趋势 - 大模型技术以常规技术乘十的速度进化,颠覆互联网时代的生态护城河、资金壁垒和规模效应,使创业公司也能站上世界舞台中心 [1] - 行业生存法则已转变为"创新至上",传统互联网玩法彻底失效,淘汰周期缩短至季度为单位 [2][3] - 百模大战后,Open AI、Anthropic、MiniMax、DeepSeek等创业公司占据SOTA榜单大半,巨头优势被灵活创新机制瓦解 [10] MiniMax技术突破 视频模型Hailuo 02 - 参数量较前代增长3倍,分辨率达原生1080P,支持10秒高清内容生成,涵盖复杂物理交互与专业级运镜 [6] - 在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅其1/9 [7] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [9] 大模型M1 - 4560亿参数,原生支持100万token输入(DeepSeek R1的8倍)和8万token输出(超Gemini 2.5 Pro) [11] - 采用混合注意力机制(1/8自注意力+7/8线性注意力),实现长上下文窗口技术突破 [16] - CISPO算法使强化训练仅需3周+512块H800 GPU(成本53万美元),推理算力为DeepSeek R1的25% [17][19] 商业化与生态构建 Agent应用创新 - Hailuo Video Agent支持超百种视频模板,实现创意构思到成片的全链路生产,连续6个月全球视频生成AI榜首 [21][23] - 通用Agent可完成长程复杂任务(如网页搭建、PPT制作),内部使用率达50%,具备跨模态理解与生成能力 [24] - 基座模型与Agent形成技术闭环,性能优化与成本控制优势显著 [25] 公司发展路径 - 2022年初成立并提前布局MoE模型,2024年推出国内首个MoE大模型 [26] - 开源Lightning Attention技术,突破Transformer架构限制 [26] - 创新驱动战略使M1半年内登顶开源模型全球第二,通用Agent解决跨模态长距离任务难题 [27][28]
MiniMax进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 21:54
大模型行业特征 - 大模型技术发展速度极快,3年时间从默默无闻到改变世界,具备工业革命特质 [2] - 行业竞争激烈,头部玩家快速更迭,百亿资本投入可能迅速沉寂 [2] - 传统互联网的护城河、资金壁垒、规模效应失效,创业公司有机会站上世界舞台 [2] - 行业生存法则为创新至上,淘汰周期以季度为单位 [3][4] MiniMax的技术突破 - Hailuo 02模型参数较Hailuo 01增长3倍,视频分辨率提升至原生1080P,支持10秒高清内容生成 [9] - Hailuo 02在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅1/9 [10][11] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [12] - M1模型支持100万token输入长度,是DeepSeek R1的8倍,输出token达8万个打破Gemini 2.5 Pro记录 [16] - M1在工具使用场景(TAU-bench)中领跑所有开源权重模型,30多轮长链路任务稳定性极高 [18] 创新架构与训练方法 - 早期探索MoE架构和混合注意力机制,1/8用自注意力,7/8用自创Lightning Attention [20] - CISPO算法替代传统PPO/GRPO,仅用3周时间、512块H800 GPU完成强化学习训练,成本53万美元 [21][23] - 生成10万token时推理算力仅需DeepSeek R1的25%,数学和编程任务效率更高 [23] Agent应用创新 - Hailuo Video Agent支持超百种视频模板,涵盖艺术片、广告片等体裁,打通完整视频生产链路 [28] - MiniMax Agent具备长期任务规划能力,内部使用60天,50%员工用于PPT制作、网页搭建等 [31] - Agent能生成复杂跳转逻辑网页,支持多模态理解与生成,完成动画、广告片等任务 [31] 公司发展历程 - 2022年初成立,早于ChatGPT引爆全球的时间 [33] - 2023年将80%算力投入MoE开发,2024年初推出国内首个MoE大模型 [34] - 2024年1月开源Lightning Attention技术,6月M1模型拿下开源模型全球第二 [34] - 持续探索更高智能水平,创新驱动发展 [35][36]
智能体洗牌“六小虎”,模型厂商如何转型?
虎嗅· 2025-07-01 20:04
智能体技术发展现状 - 智能体从内容生成进化到任务执行,代表AI从"生成内容"到"完成任务"的转变[4][5] - 智能体是指能感知环境、做出判断并采取行动实现目标的智能系统[4] - 智能体制造门槛大幅降低,普通用户可通过"美图秀秀"式轻工具制作,专业开发者则使用"Photoshop"级工具开发深度业务场景应用[6][7] 行业竞争格局 - 基础大模型层将形成高度集中格局,类似云计算行业最终仅剩少数头部厂商[12] - 模型微调层和智能体构建层将成为差异化竞争的主要空间[13] - 第一梯队模型厂商正向MaaS平台和智能体平台延伸,提供完整能力包[9] - 第二梯队厂商正转向垂直行业应用、C端应用和海外市场[11] 商业化挑战 - 全球大模型公司尚未找到有效盈利模式,70%收入被GPU厂商获取[30] - C端聊天类工具变现困难,国内外订阅模式均面临挑战[24] - 智能体虽增加tokens调用量,但未能显著提升模型厂商利润[30] - 企业需求聚焦明确ROI,关注降本增效和新产品开发[58][61] 技术演进方向 - 智能体可能成为新型操作系统,通过终端设备抢占入口[41][43] - 企业系统互通仍面临挑战,45岁以上CTO退休后可能迎来变革[40] - 大模型可能突破传统规则引擎,形成新的业务处理范式[50][51] - 工业领域存在"外挂式"和"替换式"两种智能化路径[49] 行业应用现状 - 企业AI应用集中在智能客服、知识库等低风险场景[65] - 制造业头部企业自建算力平台,但实际应用限于广告内容生成[52] - 咨询行业基础分析工作可能被替代,但高端咨询服务仍依赖人际互动[71] - 代码模型已显著提升软件开发效率,改变软件行业工作模式[68]
1.8万个核心岗位,京东抢夺顶尖AI人才来势汹汹!
21世纪经济报道· 2025-07-01 18:59
人才战略与招聘 - 公司推出TGT顶尖青年技术天才项目,面向全球高校本硕博在校生、应届生及毕业两年内的技术人才开放招募,覆盖多模态大模型与应用、机器学习等8类方向及80余个前沿课题 [1] - 人才布局呈现"金字塔"结构:顶尖领军人物引领方向,中腰部技术骨干通过TGT项目吸纳顶尖硕博,形成"资深leader+高潜校招生"的协同研发模式 [1] - 公司为2025届毕业生提供1 8万个核心岗位 [1] AI基础设施建设 - AI基础设施建设以业务需求为导向,形成"业务定义模型-模型驱动基建"的闭环 [1] - 在硬件层面积极拥抱国产化,通过与国产硬件厂商深度联合共建、引入高校产学研合作,推动开源生态建设,目标成为国产AI生态的重要引领者 [1] - 通过软件优化弥补硬件短板,自研xLLM端云一体大模型推理架构已在内部应用,相比开源框架性能提升30%-40% [2] 大模型应用与技术创新 - 搜推业务通过三种方式推进大模型应用:重构传统多阶段搜推流程、引入生成式模型提升系统扩展性、探索大模型原生应用如智能导购等工具 [2] - 大模型调用量相较去年"双11"上升130%,超过1 4万个AI智能体在内部运行,超过1 7万品牌商家使用数字人直播带货,超过5000万人次使用智能导购助手 [3] - 大模型推动电商从"关键词匹配"向"语义理解+多模态交互"升级,用户可通过图片上传精准定位商品 [3] 实战场景与技术挑战 - 算法优化需直面"618大促千万单履约调度"等真实业务场景挑战 [2] - 产业级压力挑战带来的成长密度远超论文写作,需要解决大规模高并发系统场景的实际问题 [2] - 校招生在大模型应用项目中的占比已显著高于传统业务,因其具备前沿视野 [3]
Kimi和Minimax,争夺“下一个DeepSeek”心智
36氪· 2025-07-01 16:41
行业格局演变 - 中国大模型行业格局从"六小龙"演变为"基模五强",DeepSeek的崛起显著改变竞争态势[1] - Kimi和Minimax近期分别推出Kimi-Dev编程模型/Minimax-M1推理模型,通过技术突破寻求差异化竞争[1][7][11] - 行业竞争焦点从早期用户争夺转向技术前沿突破,更适合以技术为核心的创业团队[6] Kimi战略与产品 - 聚焦Agent赛道推出Kimi-Researcher,专攻金融/学术等垂类场景,平均生成万字报告并引用26个可溯源信源[7][8] - 采用端到端自主强化学习技术,单任务平均进行23步推理,筛选前3.2%高质量信息,在低幻觉垂类赛道获积极反馈[7][8] - 技术路线与DeepSeek多次"撞车",包括注意力机制优化等基础研究,显示其技术实力仍处第一梯队[17][18] Minimax技术突破 - 推出4560亿参数推理模型M1,支持100万token输入/80k token输出,长上下文能力全球前二[11] - 采用MoE架构创新,训练成本性价比显著,性能超越多数开源模型及Claude 4 Opus,仅次于Gemini 2.5 Pro[11] - 2023年即押注MoE路线,早于行业转向,但市场影响力未达预期[20] 竞争策略差异 - Kimi选择垂直Agent路线,通过深度研究功能切割专业场景,避开大厂主战场[3][29] - Minimax坚持全栈布局,通过多模态技术(如AI语音合成)展示全场景渗透能力[13][29] - 两家公司均试图打破"参数比拼"的初级竞争模式,转向用户心智占领[27] 创始团队特质 - Kimi创始人杨植麟兼具顶尖学术背景(CMU/苹果AI导师)和企业级AI落地经验,融资能力突出[16] - Minimax创始人闫俊杰技术预判精准,早期All in MoE路线但商业化节奏滞后[20] - 投资方认为团队技术预判能力(如长文本/MoE布局)仍是核心竞争优势[22][29] 行业趋势观察 - AI应用加速渗透生活场景,从工具转向收益驱动的商业化阶段[25] - 通用Agent市场被大模型公司主导,创业公司需聚焦垂直领域构建壁垒[25] - 技术突破与市场定位的精准耦合成为重塑行业认知的关键,参考DeepSeek崛起路径[27][29]
淘宝:上线百亿参数大模型RecGPT,“猜你喜欢”基于AIGR技术全面升级
新浪科技· 2025-07-01 11:56
公司技术升级 - 淘天集团自研的百亿参数推荐大模型RecGPT正式上线,将应用于手机淘宝首页"猜你喜欢"信息流 [1] - RecGPT基于淘宝星辰LLM大模型,具备更强的电商领域推理能力,能分析用户超过十年的消费行为 [1] - 该模型通过多模态认知技术整合数亿级商品图文信息,并结合世界知识生成个性化推荐序列 [1] 技术效果 - 测试数据显示,搭载RecGPT的推荐信息流实现用户点击量两位数的增长 [1] - 用户加购次数和停留时长均提升超5% [1] - 相比传统算法,新模型进一步平衡了转化效率和用户体验,能预判用户潜在需求 [1] 技术应用场景 - RecGPT会生成个性化商品推荐理由以增强用户互动性 [1] - 此次升级是淘宝AIGR(生成式推荐)技术的落地应用 [2] - 淘天集团已构建AIGX技术体系,覆盖电商商业经营全场景(如AIGI、AIGB、AIGC等) [2] 技术体系 - AIGX技术体系包含基础研究、应用开发和产业化完整链条 [2] - 该体系已在淘宝天猫众多业务中实现落地价值 [2]
快讯|千寻智能发布全力控人形机器人Moz1;字节Seed团队密集招募机器人相关“一号位”;百度开源文心大模型4.5系列
机器人大讲堂· 2025-07-01 10:39
字节Seed团队机器人业务布局 - 字节Seed团队正在大规模招募机器人相关"一号位",涵盖产品、工程技术及具身智能大模型负责人[1] - 团队计划打造一整套可落地应用的智能系统,2025年可能推出首个机器人产品面向C端或产业端[1] - 截至2024年底团队规模突破200人,预计2025年末超300人,在国内AI行业体量罕见[1] - 张一鸣从去年下半年起定期参加Seed核心技术团队复盘讨论会[1] 百度文心大模型4.5系列开源 - 百度开源文心大模型4.5系列,推出10款模型,涵盖多种参数类型,预训练权重和推理代码完全开源[4] - 模型在飞桨星河社区、Hugging Face等平台开放下载部署,开源模型API服务登陆百度智能云千帆大模型平台[4] - 文心大模型4.5是百度自研新一代原生多模态基础大模型,在多个文本和多模态基准测试中达SOTA水平[4] - 中小参数版本适合内存受限配置,部分模型性能可与竞品媲美[4] ForSight Robotics眼科手术机器人融资进展 - ForSight Robotics完成1.25亿美元B轮融资,由Eclipse Ventures领投[6] - 资金将用于推进ORYOM™眼科手术机器人系统首次人体临床试验,加速白内障、青光眼等适应症技术拓展[6] - ORYOM™是全球首个基于AI的眼科手术机器人系统,已在猪眼模型完成多阶段术式验证[6] - 公司预计2025年启动人体试验,若顺利2026年获监管初步批准,2027年前后商业化[6] 越疆科技人形机器人量产交付 - 越疆科技在日本名古屋举办新品发布会,面向全球开启人形机器人批量交付[9] - 发布的人形机器人Atom是全球首款兼具"灵巧操作+直膝行走"的全尺寸具身智能人形机器人,具备工业级精度[9] - 同时发布行业最快大负载高速协作机器人CR 30H,刷新大负载协作机器人性能记录[9] - 越疆全球出货量超八万台,服务超80家世界500强企业[9] 千寻智能全力控人形机器人Moz1 - 千寻智能推出全力控人形机器人Moz1,构型上具26个自由度[12] - 配备全球功率密度最高的自研一体化力控关节,负载自重比达1:1,是国内首个高性能全身力控机器人[12] - 拥有国内领先的高精高速WBC系统,具备零延时遥操作特性,全身操作丝滑柔顺[12] - 商用可做整理、接待、导览等工作,家庭场景能提供陪伴、互动等服务[12]
AI下半场,大模型要少说话,多做事
虎嗅· 2025-07-01 09:33
大模型性能与竞争格局 - DeepSeek模型性能快速提升 2024年4月排名靠后 8月进入TOP10 12月成为基础能力第一的开源模型[1] - 基础模型TOP10中中国占6个 美国占4个 包括通义千问 豆包 混元 文心等[3] - 模型排名轮动加速 GPT-4o曾保持200天第一 现在十几天就会变化[7] - 训练成本高企 每次至少几百万美元 保鲜期短导致玩家减少[8] 模型训练技术趋势 - 预训练与后训练并存 预训练提升基础能力 强化学习从实战中学习潜力大[14] - 下游企业减少参与训练 转向提示词工程 检索增强 工作流等工程化方法[9] - 智谱AI坚持预训练路线 技术团队实力和资源储备是关键[12] Agent发展与应用 - Agent成为运行在大模型上的软件 自主规划能力显著提升[21] - 提示词仍重要 精心设计的系统提示词可充分激发模型能力[22] - Agent可能不是单一产品 而是多功能集合 开发平台将成关键[29] - 未来或形成个位数基座模型+垂直行业应用平台的格局[30] 基准测试体系价值 - "方升"测试体系包含700万条数据 聚焦产业实战应用[1][44] - 测试方法标准化 题目非开源 每次抽取1-2万题后作废[47][48] - 基准测试是指挥棒 定义方向 中美差距缩小因目标一致[51] 技术路线与产业方向 - 谷歌DeepMind强化学习路线被低估 在生物 材料等领域价值巨大[34][37] - 当前模型缺乏世界模型能力 需突破空间关系 物理定律等[38] - AI下半场需减少信息过载 增强意图理解 任务规划等能力[52]