豆蔻妇科大模型 - 财报，业绩电话会，研报，新闻

豆蔻妇科大模型

搜索文档

钉钉CTO朱鸿：未来的工作方式是人辅助AI工作，钉钉要成为行业模型和企业智能体工厂

新浪科技· 2025-09-24 22:07

公司战略与愿景 - AI变革的本质是人机协同关系的进化未来的工作方式是人辅助AI工作 AI将成为具备认知与决策能力的智能体主动驱动流程连接设备响应环境 [1] - 钉钉致力于成为行业模型和企业智能体工厂让每一家企业都能低成本高效率地构建和应用自己的专属大模型 [1] - 钉钉致力于构建一个开放智能以人为本的协同工作平台开启人机协同双向赋能的共生时代 [2] 产品与服务 - 公司已建立AI生产力平台能够从数据标注模型训练效果评测到API部署一站式帮助企业完成专属模型训练并深度集成到业务场景中 [1] - 公司首创AI按效果付费模式先用后付让企业敢用能用用得起AI [2] - 公司积极布局更多行业大模型携手行业先锋探索AI技术在垂直领域的深度应用 [2] 应用案例与成果 - 公司帮助合作伙伴训练了国内首个达到主任医师专业水准的垂直医疗大模型——豆蔻妇科大模型 [2] - 通过与顾家家居通义实验室合作公司打造了听得懂行话的行业语音大模型帮助客户实现AI销售助理 AI服务质检和AI智能洞察 [2]

AI时代的人机协同

行业模型和企业智能体

Software and Services

Software and Services

钛媒体APP· 2025-09-18 13:24

文章核心观点 - 2025年是企业级AI应用从试点走向规模化落地的关键转折点 AI正从效率工具升级为企业经营中需量化价值的核心能力但企业在战略制定、技术实施和人才培养等方面仍面临系统性挑战 [1] - 2025 ITValue Summit数字价值年会聚焦AI落地"十大核心问题" 通过行业领先企业的实战案例分享为企业提供可借鉴的解决方案推动AI从概念验证走向生产级应用 [1][3][5] AI战略共识构建 - 企业面临从技术试点到战略重构的关键转折管理者和执行者之间存在认知落差 90%的AI项目未能实现预期 70%的高管认为效果不佳 [8][16] - 瑞幸咖啡通过AI驱动价值链重构以数字化底座支撑用户、产品、门店三大支柱实现爆品预测准确率85% 租金占比降至8%以下以9.9元定价策略颠覆行业格局 [12] - 企业需重新定位AI与人的关系 AI应作为提供策略的"顾问"和鼓励执行的"教练" 而非单纯工具人机协同需遵循"334框架"：30%人类智能定战略 30%人工智能做分析 40%执行系统保交付 [16][18] 技术可靠性与可解释性 - AI幻觉和决策黑箱问题成为证券行业深度应用的关键瓶颈金融业务要求输出内容必须可靠可解释且严禁未经许可的投资建议 [21][24] - 国泰海通构建千亿参数多模态证券垂类模型采用"可信知识库+小模型校验"双重保障机制通过180多个业务方法库实现分析过程可追溯满足监管合规要求 [23][26][28] - 业务部门深度参与是保障AI可靠性的关键国泰海通技术团队与业务人员共同设计场景业务人员占比远高于技术团队 [29] 数据基础与治理 - 数据质量贯穿全生命周期香港医管局30年积累近60亿条高质量医疗数据通过一体化数字平台实现医疗信息高效互通诊疗时可实时调阅患者全病程记录 [33][35][36] - 数据困境主要源于信息割裂和标准不一香港赛马会面临跨国数据整合挑战海外赛马数据缺少标准化采集单场比赛视频分析需20个GPU集群处理成本极高 [38][40] - 数据使用成本决定应用有效性随着算力效率提升和成本下降当前数据挑战将成阶段性现象医疗行业需推进数据资源资产化、服务产品化和生态空间化 [41][50] 应用场景选择 - 企业应避免"技术优先"误区易鑫集团年交易规模700亿人民币 80%用户来自三线以下城市通过自研AI大模型实现获客、风控、路由匹配全流程智能化帮助三农群体获得金融服务 [46][48] - 医疗领域强调"数据-AI能力-行业Know-how"黄金三角业务人员参与开发对成功落地至关重要医生通过接触AI大模型提升诊疗水平但需平衡AI建议与专业诊断的关系 [49] - 医药行业AI应用处于早期阶段需确保数据质量和数量进行全新流程设计中国药品审评改革深化 CDE筹划AI辅助审评将促进行业发展 [50][51] 模型选型策略 - 仅40%的POC项目能走向生产失败主因包括业务评估不足、数据准备不充分等而非模型选择错误企业焦点应从"选哪个模型"转向如何避免POC陷阱 [56][58] - ROI衡量需关注新业务模式创新亚马逊Ring智能摄像头通过增加AI功能推出视频回看订阅服务创造新增长点单纯运营效率提升反居次要位置 [60] - 模型选型需综合考虑数据持续投入能力、工程化水平和Agent范式把握企业竞争力体现在系统化生产部署能力而非模型选择 [60] 行业模型落地 - 行业小模型比通用大模型更具优势通用模型训练使用65万亿数据而行业内部沉睡着170万亿未利用数据医疗领域豆蔻妇科模型问诊准确率达90.2% 通过妇科主任级考试得分64.94超越GPT-5的52.5分 [64][66] - 行业模型需具备复杂推理和专业数据生产能力航旅纵横强调行业大模型是系统工程需建立"数据-模型-数据"闭环保持持续进化 [71][73] - 酒店行业通过AI数字经理实现收益优化五一期间杭州门店通过实时商圈流量分析在店长经验判断与AI建议冲突后执行降价策略最终入住率提升8.3% RevPAR实现增长 [73][74] 知识库体系建设 - 企业42%知识留存人脑 26%以文档存储仅12%进入可检索知识库东航员工每天花1.2-2.7小时跨系统检索知识 [80][81] - 东航通过RAG技术构建涵盖300多本公司手册的知识库服务超1万名一线员工地服人员询问"大提琴托运"可迅速返回精准规定减少70%的旅客投诉 [83] - 知识管理目标是无缝嵌入生产过程东航已有400多个部门级智能体投入运行新开航线智能体可快速生成覆盖经济效益、飞行条件的分析报告 [83][84] 人机协同实践 - 美的荆州工厂14个智能体覆盖38个核心生产场景由"工厂大脑"统一协同计划、供应链、物流和生产上半年实现财务认可提效2.83亿元节省490.4万小时 [89][91] - 一线员工参与智能体开发美的内部涌现9000多个"民间智能体" 由业务人员自主开发解决实际痛点 [91] - 云迹科技机器人完成超5亿次任务服务3万多家酒店行走2033万公里具备学习力、适应力等六维能力在酒店场景中能通过电话温柔提醒客人取物为盲人开启无障碍服务 [91][93] 人才战略调整 - AI岗位需求量同比翻倍但人岗适配率仅20% 企业需从"花钱买人才"转向"主动造人才" 将人才战略与业务战略同步推进 [99][100] - 传统制造企业案例显示基于战略明确人才画像后对业务人员开展系统技术培训同时在关键岗位引入外部专家可搭建完整人才体系 [102] - 需构建"全职员工+外包/独立顾问+数字员工"多元用工模式 AI原生国企从10人团队快速成长为近200人的明星企业得益于灵活用工形态 [102] 安全合规管理 - 财务领域数据合规是"生死线" 2020-2024年受处罚上市公司财务人员从60人升至137人年复合增长率23% 70%-80%处罚集中在虚假财务报告和未及时披露信息 [108][109] - AI在财务合规的应用包括智能票据处理、现金流预测、欺诈检测等智能报销平台可通过语音指令自动完成票据整理与填报提升效率并保障合规性 [110][111] - 需警惕AI生成技术带来的风险 Nano Banana能零成本在十几秒内篡改电子原始凭证对财务数据合规构成巨大挑战 [113]

钉钉重注AI：成立行业专属模型团队，向CTO汇报｜智能涌现独家

36氪· 2025-08-20 17:58

公司战略与组织调整 - 钉钉近期成立新业务线"行业专属模型"作为独立团队向钉钉CTO朱鸿汇报[1] - 该团队成立后已与多家行业客户接触已有多个行业/企业专属模型在推进中[1] - 钉钉创始人无招回归后将产品体验和AI创新作为首要优先级从4月开始主导产品设计、排查和整改[1] 技术产品发展进程 - 钉钉自2023年8月开放智能化底座AI PaaS给生态伙伴和客户 2024年1月发布具备感知、记忆、规划和行动能力的AI助理[1] - 钉钉目前服务超过2500万企业组织其中超220万家企业在钉钉使用AI 覆盖制造、医疗、金融、零售等20个一级行业[1] - 豆蔻妇科大模型作为医疗领域垂类模型将妇科六大症状诊断准确率从77.1%提升至90.2%[2] 行业专属模型定位 - 行业专属模型主要面向钉钉平台上的企业客户和第三方合作伙伴[2] - 针对缺乏AI人才的中小企业钉钉提供全流程模型训练和数据工程服务包括数据打标、清洗和模型调优[2] - 行业专属模型由钉钉与企业业务人员共创沉淀行业know-how 相比开发者平台更贴近业务场景[2] 生态建设与商业化 - 钉钉在2024年4月上线AI Agent Store 无招回归后重新构造Agent市场逻辑[3] - 钉钉未来将开放能力给更多ISV和企业帮助企业打造Agent应用并通过钉钉实现商业化闭环[3] - 大厂竞争聚焦Agent领域阿里云百炼、字节跳动扣子、百度文心智能体、腾讯元器件等平台均已推出[3]

行业专属模型

Artificial Intelligence

Artificial Intelligence

豆蔻妇科大模型再突破：钉钉行业训练平台+精标数据SFT ，准确率从 77.1%上升至 90.2%

钛媒体APP· 2025-07-10 15:49

医疗AI模型优化 - 通用大语言模型在医疗临床场景中表现欠佳，可能给出不准确或错误建议[1] - 监督微调(SFT)是解决医疗AI模型专业性的关键方案，但需要高质量数据集和迭代优化过程[1] - 豆蔻妇科大模型通过SFT优化，准确率从77.1%提升至90.2%[3] 数据集构建与质量控制 - 数据清理重点关注推理与结果一致性，剔除逻辑链条不完整或违背医学原理的数据[2] - 数据蒸馏校准确保思维链(COT)数据质量，诊断优先级需有明确医学依据支撑[5] - 数据集需覆盖全生命周期病例和常见病与罕见病比例，避免诊断偏好[6] 模型训练优化过程 - 第一阶段(2025年4月)使用1300条精标中文妇科问诊数据，构建基础模型[3] - 第二阶段(2025年6月)通过合成症状数据、重新蒸馏标注COT等优化策略提升性能[3] - 采用"训练-评测-筛选-再训练"循环，持续监控关键指标如测试集准确率和罕见病例识别率[10] 评估体系 - 构建自动化评测和人工审核双重评估体系，采用10分制标准评分[11] - 自动化评测系统基于高性能语言模型，支持批量处理和标准化评分框架[11] - 医生修正反馈机制对边缘案例进行人工审核，形成闭环迭代优化[13] 训练平台与技术 - 使用钉钉企业专属AI平台进行训练调优，覆盖SFT/RFT两种训练方法[17] - 平台提供分布式训练、多Lora部署等加速优化手段，训练时长从26小时缩短至7小时[17] - 未来将探索SFT+RL协同训练范式，结合结构化医学知识和临床直觉[18] 经验与挑战 - 初期过度依赖人工标注导致效率低下，后期调整为"机器蒸馏→专家审核→训练后评估"体系[14] - 训练数据集过度集中常见病导致罕见病识别不足，采用平衡采样策略改进[15] - 医疗大模型需具备多维思考模式，在低容错率环境下提供专业诊断建议[16]

钉钉上跑出的第一个行业专属大模型落地：准确率超 90% 的妇科专业大模型

AI前线· 2025-07-10 15:41

豆蔻妇科大模型 - 钉钉企业专属AI平台成功训练出首个高准确度专业领域大模型"豆蔻妇科大模型"，诊断准确率达90.2% [1] - 该模型由壹生检康研发，基于开源大模型训练，初始版本准确率77.1%，经钉钉平台优化后提升至90.2% [2][3] - 模型功能覆盖主诊断、潜在诊断、检查建议、处置方案等全流程，响应时间从传统问诊30分钟缩短至数秒 [3] 行业应用价值 - 妇科大模型可缓解专业医生资源不足问题，尤其惠及职场女性和偏远地区用户 [2][3] - 模型落地标志着钉钉生态从SaaS/服务商扩展到AI创业者领域 [1][6] - 未来计划扩展至皮肤科等更多垂直医疗领域，提供居家健康指导 [4] 技术实现路径 - 钉钉提供全流程支持：数据标注、算力调度、模型调优等关键环节 [2][5] - 需解决数据安全、行业知识差异、工作流程定制等专业领域挑战 [5] - 采用"基础模型+行业数据"训练模式，实现从通用到专精的转化 [2][5] 钉钉生态战略 - 首个垂类大模型案例展示钉钉全链路行业大模型构建能力 [5] - 重构生态体系：新增AI创业者板块，开放平台支持开发者从零构建行业模型 [6] - 提供AI解决方案咨询、人才培训等配套服务，瞄准中小企业智能化需求 [6] 行业趋势 - 垂直行业大模型被视为AI技术落地下一个趋势，需解决行业特异性问题 [5] - 通用大模型(Qwen/DeepSeek/GPT)逐渐基础设施化，企业转向专属模型开发 [5]

四个理工男“硬刚”妇科诊断推理大模型，更小参数量实现更高准确率

钛媒体APP· 2025-04-29 10:22

AI行业竞争格局 - 大厂聚焦参数升级的"军备竞赛"，中小创业者深耕大厂无暇顾及的细分赛道[1] - 医疗行业被视为"数字化攻坚的最难阵地"，通用大模型难以满足其高准确性和严谨性需求[1] - 越来越多的AI企业意识到细分赛道重要性，加大垂直领域行业大模型投入[1] 医疗垂直大模型必要性 - AI在医疗场景应用需专业算法和高质量数据才能达到80分以上水平[1] - 通用大模型如医学生具备广泛医学认知但缺乏临床实战经验[1] - 垂直大模型需上万例临床实践和持续学习才能成为专家级诊疗能力[2] 公司实践案例 - 壹生检康专注女性健康3年，积累丰富行业经验和庞大用户群体[4] - 通用大模型存在"幻觉"问题，特定场景无法控制其自由发挥[4] - 公司选择32B参数模型在计算资源和回复效果间取得最佳平衡[5] 模型训练过程 - 第一轮使用1400例蒸馏数据训练准确率仅50%[5] - 第二轮经医生标注后准确率提升至60%[6] - 补充600例数据解决数据失衡问题，最终准确率达77.1%[6] 模型性能对比 - 豆蔻妇科大模型整体准确率77.1%，高出DeepSeek 7%[13] - 在下腹包块诊断中准确率优势达17.1%[14] - 在月经推迟诊断中更全面考虑激素类药物影响[15] 成本优化措施 - 仅使用一张英伟达4090 GPU进行训练[16] - 最终模型参数量仅为DeepSeek R1的1/20[17] - 选择INT8量化版本对准确率影响可忽略不计[17] 应用场景规划 - toC端解决女性健康问题描述困难和病耻感问题[17] - toB端赋能基层诊所和大健康机构弥补专业资源不足[18] - 模型设计带推理过程便于专业人员评估其正确性[18] 未来发展方向 - 强化学习可使模型从垂直领域拓展到全医学领域[19] - 强化学习让模型具备解决通用问题和泛化能力[19] - 目标使模型成为既优秀又全面的医生[19]