大语言模型

搜索文档
极光预计2025年第一季度营收显著高于预期指引
格隆汇· 2025-05-19 15:56
营收指引上调 - 公司预计2025年第一季度收入在8,700万元人民币至9,000万元人民币之间,同比增长35%至40% [1] - 此前收入指引为7,400万元人民币至7,750万元人民币 [1] 业务表现 - EngageLab业务收入同比增长超过120%,带动海外业务持续增长 [2] - 金融风险管理业务因客户需求激增实现收入大幅提升 [2] - AI平台GPTBots.ai为企业提供无代码构建AI Bots技术,助力智能化转型 [2] 财务数据 - 预计经调整净亏损在100万元人民币至200万元人民币之间,2024年同期净亏损为260万元人民币 [3] - 截至2025年3月31日现金及现金等价物和受限资金预计在1.130亿元人民币至1.140亿元人民币之间,2024年12月31日为1.195亿元人民币 [3] 战略与市场 - 公司“出海 + AI 赋能”双轮驱动战略成效显著,EngageLab和GPTBots.ai协同发力 [2] - 大语言模型研发公司客户发布开源模型R1 LLM,带来显著收入增长 [2]
开立医疗副总裁陈刚: “设备+AI”战略驱动创新 多维布局谋发展
中国证券报· 2025-05-19 04:35
公司战略与产品布局 - 公司依托"设备+AI"核心战略,通过高强度研发投入实现多产品线技术突破,多款搭载AI的高端医疗设备陆续上市 [1] - 产品覆盖超声医学影像、消化与呼吸内镜、微创外科产品以及心血管介入产品四大板块 [1] - 外科产品成为新增长点,技术迭代从多镜联合升级至4K荧光 [2] - 心血管介入领域作为唯一参与制定血管内超声通用技术标准的企业,将迎来快速发展期 [2] 政策机遇与市场表现 - 国务院《推动大规模设备更新和消费品以旧换新行动方案》提出2027年医疗等领域设备投资规模较2023年增长25%以上 [1] - 公司在四川、石家庄等地中标高端设备订单超百台,短期市场份额提升显著 [1] - 集采项目单次采购量达数百台,部分项目单笔高端设备中标量创历史新高 [2] - "设备更新"政策下价格降幅低于药品和耗材,通过以价换量实现销售总额稳步增长,利润影响可控 [2] 研发与技术创新 - 深化AI与医疗设备融合,拓展医学影像AI和大语言模型应用 [1] - 持续加大研发投入提升内镜产品品质,消化内镜领域作为国内第一品牌将充分把握政策机遇 [2] - 耗材研发取得进展,新产品将陆续推向市场 [2] 海外市场拓展 - 海外市场凭借三维推进策略实现稳健增长 [1] - 公司目标通过创新驱动实现高质量发展,持续向全球领先品牌迈进 [1]
AI医疗进入精准化“深水区” :OpenAI医疗评估基准落地、大模型加速变革|AI医疗浪潮㉑
21世纪经济报道· 2025-05-17 13:05
HealthBench开源基准测试 - OpenAI推出HealthBench开源基准测试,用于衡量大语言模型在医疗健康领域的性能表现与安全可靠性 [1] - HealthBench由262位来自60个国家/地区的医生共同参与构建,整合了5000段真实的医疗对话数据 [1] - 通过48562个独特的医生编写的评分标准进行开放式评估,涵盖多个健康背景和行为维度 [1] - HealthBench的测试样本分为7个主题和5个评估维度,7个主题包括紧急转诊、专业沟通定制等,5个评估维度包含准确性、沟通质量等 [3] - OpenAI还推出HealthBench Consensus(共识版)和HealthBench Hard(困难版),共识版包含34个经医生共识验证的评估维度,困难版最高得分仅为o3模型的32% [4] - HealthBench Consensus的元评估表明,7个评估领域中的6个领域,模型打分结果与医生评分的中位数水平高度一致 [4] 大模型在医疗领域的表现 - 2023年推出的GPT-3.5Turbo得分为16%,2024年5月推出的GPT-4o得分达到32%,2024年12月推出的o3模型得分达到60% [5] - 较小规模的模型进步显著,GPT-4.1nano的表现超过GPT-4o,且成本仅为GPT-4o的1/25 [5] - 大模型在医疗领域的应用正迅速发展,评估工具和模型本身都在持续优化 [6] - 大模型的多模态能力解决了早期AI医疗存在的信息割裂和数据孤岛等问题,通过"预训练+微调"架构处理多模态医疗数据 [6] - AI可以实现跨模态数据的理解和动态时序建模,使得AI诊疗与医生的诊疗水平更加接近 [6] AI医疗市场前景 - 预计2024年—2032年,AI医疗市场将以每年43%的速度增长,市场规模有望达到4910亿美元 [6] - AI可以扩展医疗服务可及性,应用于诊断前、诊治及诊断后阶段,解决医疗人员短缺和缺乏有效分流等问题 [6] - AI辅助医生诊疗有望降低误诊率,在部分疑难杂症诊疗方面发挥协同作用 [6] 医药行业AI应用趋势 - 模型即产品:医药行业高度专业性的场景对模型适配性要求更高,未来将更多直接针对医药行业训练的模型被广泛应用 [7] - 本地与端侧部署:专业中小模型的本地部署在成本可控性、数据安全等要求更高的场景下提供极大赋能 [7] - 研发端AI应用快速拓展:随着特定场景专业模型训练的普及,研发阶段AI应用的壁垒有望被逐一消解 [8]
小VC“活着”指南
FOFWEEKLY· 2025-05-15 17:59
资本市场与创新趋势 - 资本市场存在阶段性泡沫但创新持续受到鼓励[2] - 硬科技赛道从"卡脖子"到"产能过剩"的演变反映行业周期变化[3] - AI赛道热度显著提升为创投市场注入活力[4] 创投市场资金格局 - 头部机构资金充足但面临投资压力腰部机构逐渐消失尾部机构寻求抱团[6] - VC领域竞争内卷且处于低谷周期与创业者困境高度相似[6] AI赛道发展现状 - AI浪潮催生四类受益群体:互联网巨头、产业链服务商、知识变现者、高薪从业者[8] - Deepseek出现引发一级市场头部AI项目估值重估与创新范式冲击[9] - 具身智能赛道重现大模型竞争泡沫特征三流选手亦可融资[11][12] AI投资范式演变 - 大语言模型成熟推动AI应用层创业窗口开启[14][15] - 优秀AI项目需具备爆发潜力、技术/商业化验证点、组织优势及反叛精神[17] - AI Native应用类项目数量增加商业化能力提升[19] 创业与投资误区 - 创业方向误区:过早定位平台型机会忽视细分市场或破坏性创新[20] - 创业者画像偏差:研究型人才商业化能力不足产品吸引力弱于独立开发者[21] - VC投资需警惕技术型创业者宣称"技术第一""行业唯一"等关键词[22] AI创业者分类 - 富婆暴发户型:商业嗅觉敏锐但失败率高[27] - 钢铁直男型:技术基因强但易陷高估值陷阱[28][29] - 富家小姐型:商业模式清晰但天花板有限[30][31] - 技术吃软饭型:服务导向强缺乏颠覆勇气[32] VC行业本质 - VC是无限博弈游戏需保持牌桌位置捕捉贝塔机会[36] - 核心三命题:上桌资格、筹码来源、风险下限[37] - 超额收益源于覆盖广度而非决策暴击率[40][41] 历史启示与行业展望 - 早期汽车竞赛启示:粗糙开端可推动产业革命[43][44] - AI行业仍处早期阶段历史性机会持续存在[45][46]
Anthropic联创克拉克最新专访:AI可能具备某种“外星人意识”
36氪· 2025-05-15 17:30
5月15日消息,近日Anthropic联合创始人杰克·克拉克(Jack Clark)做客乔治梅森大学经济学教授泰勒·考恩(Tyler Cowen)的播客,分享 了对AI未来的独到见解。他们探讨了AGI对经济的潜在影响、大模型竞争格局,以及监管和治理方面的挑战等问题。 克拉克认为,园艺、电工等高技能工艺领域的岗位将最晚被AGI取代,因为人们不仅为其技术买单,更为工匠的审美与声誉付费。 对于国家之间的AI竞争,克拉克认为多数国家最终会接纳强AI。虽然可能有少数国家拒绝大型AI系统,但在全球化趋势下,大多数国家 最终会融入这一体系,难以独立于AI技术发展之外。 不过,克拉克表示在全球范围内达成全面的AI治理协议"非常困难",但中美之间可能会就某些危险技术形成有限的共识,类似"核不扩 散"协议。他不认为这会是"合作",而更可能是出于共同防范风险的现实主义考量。 以下为克拉克专访精华内容: 01 手工业或创意性工作会被AGI最后取代 问:你觉得哪些工作会受到AGI的最后影响? 克拉克:我认为,那些依赖手工技能、经验判断和个人风格的工作,可能是AGI最晚才会替代的。像电工、修水管的管道工,或者园丁 这样的技术工种,有很多 ...
字节最新大模型秘籍:只挑能有推理潜力的数据训练!1.3B模型无需标签自动挑选
量子位· 2025-05-15 14:26
核心观点 - 字节Seed团队提出AttentionInfluence方法,利用预训练语言模型中的注意力机制选择高质量训练数据,无需人工标注或额外训练 [1][2] - 该方法通过屏蔽重要注意力头创建"弱"模型,计算损失差异来评估数据对推理能力的影响,筛选出高推理强度的样本 [6][13] - 实验显示使用该方法选择的数据训练7B模型,在MMLU、GSM8K等基准测试中性能提升1.4-3.5个百分点 [8][27] 技术原理 - 核心机制:识别与检索推理强相关的注意力头(前5%),通过损失差异计算AttentionInfluence分数 [14][19][20] - 关键步骤:构建800样本合成测试集评估检索能力,使用1.3B模型计算注意力头重要性 [15][17][19] - 数据筛选:选择SmolLM语料库中AttentionInfluence分数前20%的样本(73.1B tokens) [27] 实验结果 - 性能提升:7B模型在MMLU-Pro(+2.7pp)、AGIEval-en(+1.8pp)、GSM8K(+2.7pp)、HumanEval(+3.5pp)等任务显著超越基线 [8][29] - 规模效应:7B模型选择的数据质量优于1.3B模型,在数学/代码任务表现更优(MATH从10.8%提升至11.75%) [30][32] - 数据质量:AttentionInfluence样本推理分数达0.88(OpenWebMath),长度是传统方法的2倍(Python-Edu样本820 vs 414 tokens) [33][34] 方法优势 - 无监督:摆脱人工标注依赖,避免领域偏见 [3] - 可扩展:与FineWeb-Edu分类器结合可同时提升事实性知识和推理能力 [38] - 高效性:训练早期(100B tokens前)即显现性能优势,且持续至学习率衰减阶段 [29]
华东空管局技术保障中心上线智能体系统 空管通导业务迈入AI时代
中国民航网· 2025-05-15 12:28
系统概述 - 华东空管局技术保障中心推出面向空管通导业务的智能体系统,标志着业务转型升级迈出关键一步 [1] - 系统深度融合空管领域专业知识与业务流程,通过本地化部署和多模型协同实现智能解析、故障推演及运维辅助决策 [1] 技术突破 - 系统基于先进大语言模型与推理技术构建,能深度理解空管领域知识、流程与规范,精准对接复杂业务需求 [2] - 系统拥有多维度知识与专业模型库,覆盖监视、通信、动力等专业领域,通过业务规则智能解析、日志故障关联智能推演等自动生成运维建议 [2] 应用场景 - 资质排查类应用将新员工知识学习问答平台的资料检索平均耗时从10分钟以上缩短至1分钟左右,效率提升90% [1] - 岗位日志类应用通过自动化解析与向量库构建实现历史记录的快速检索与事件追溯 [3] - 手册快速问答功能即时调取技术文档和操作指南,辅助生成标准化报表 [3] - 应急排故助手通过关联历史故障案例与处置流程为突发问题提供处置决策参考意见 [3] 技术底座 - 选用Dify平台进行系统研发,支持自然语言指令定义智能体,集成多模型混合调度能力,允许灵活调用Qwen、DeepSeek等 [4] - 采用vLLM推理框架进行虚拟化部署,实现高并发处理与低延迟响应,优化长文本生成效率 [4] - Dify平台以低代码开发模式为核心,简化AI应用的构建与迭代流程,通过可视化画布与预置组件库设计复杂工作流 [4] 未来规划 - 将持续深化技术应用,让AI成为安全保障与效率提升的核心引擎 [5] - 以多模态能力扩展为核心方向,集成语音、图像与视频识别功能,强化智能体的多源感知能力 [5]
10万美元成本训练的小模型,在特定任务超越GPT-4o,延迟低99倍
36氪· 2025-05-14 17:45
公司概况 - Fastino是一家专注于开发"任务特定语言模型"(TLMs)的早期初创公司,由连续创业者Ash Lewis和George Hurn-Maloney共同创立[4] - 公司技术团队来自谷歌DeepMind、斯坦福大学、卡内基梅隆大学及苹果等知名机构[6] - 已累计获得近2500万美元融资,包括1750万美元种子轮和700万美元前种子轮[3] 技术方案 - 采用低端游戏GPU训练TLM模型,平均成本不到10万美元[3] - TLM模型在特定任务上性能媲美大型语言模型,推理速度比GPT-4o快99倍(100ms vs 4000ms)[8] - 基准测试显示TLM模型的F1分数比GPT-4o高出17%[9] - 模型架构基于Transformer但引入任务专精优化,消除参数冗余和架构低效[8] 产品特点 - 首批模型覆盖文本摘要、函数调用、文本转JSON等企业核心需求[10] - 提供PII屏蔽、文本分类、脏话过滤、信息提取等具体功能[17] - 支持部署在虚拟私有云、本地数据中心或边缘设备[13] - 已在金融、医疗、电子商务等行业应用,获得财富500强企业采用[13] 商业模式 - 采用订阅制收费而非用量定价,个人开发者每月1万次免费请求[11] - Pro用户每月10万次请求收费45美元,团队用户300万次请求收费1275美元[11] - 极低的模型运行成本支撑其定价策略[13] 行业趋势 - 大语言模型训练成本高达数千万美元,部署和推理成本同样高昂[7] - 小模型在成本、推理时延和特定任务性能上具有显著优势[14] - 类似企业包括Cohere、Mistral、阿里云Qwen3和Writer的Palmyra系列[14] - 对于高并发、低延迟要求的应用场景,小模型更具经济性[14]
微软华人AI团队核心成员被曝加入腾讯混元,知情人称与裁员无关|独家
AI前线· 2025-05-14 16:12
核心事件 - WizardLM团队核心成员Can Xu已从微软离职并加入腾讯混元事业部[1] - 知情人士透露WizardLM团队主力成员大部分已离开微软[2] - 团队采用远程办公方式协同工作,成员独立负责各自研发部分[3] 团队背景 - WizardLM团队成立于2023年初,专注高级大语言模型开发[4] - 团队在HuggingFace显示有6位主要成员[4] - 核心成员Qingfeng Sun和Can Xu均为微软前AI研究科学家,拥有北京大学硕士学位[5] - Can Xu领导开发了WizardLM系列模型,发表40多篇顶级会议论文,Google Scholar引用超3300次[5] 技术成果 - 团队与北大合作提出Evol-Instruct方法,机器生成指令质量优于人工指令[6] - WizardLM-30B在Evol-Instruct测试集取得97.8% ChatGPT分数占比[10] - 在2023年UC伯克利LLM排位赛中位列全球第四,是华人团队开源模型第一名[13] - WizardLM-13B在AlpacaEval和Evol-Instruct测试集的GPT-4评估中分别获得87%和89% ChatGPT能力占比[11] 模型表现 - WizardLM-2系列于2024年4月发布,包含8x22B/70B/7B三个版本[15][17] - WizardLM-2 8x22B在MT-Bench得分为9.12,接近Claude 3 Opus(9.43)和GPT-4-1106-Preview(9.32)[18] - WizardLM-2 70B和7B在MT-Bench分别获得8.92和8.28分[18] 腾讯布局 - 腾讯重组混元AI架构,新设大型语言模型和多模态模型团队[24] - 计划2025年投入900亿元人民币(124.9亿美元)用于AI业务发展[26] - AI业务为腾讯2025年Q1贡献8%的增长[26] 行业影响 - WizardLM-2模型因未完成毒性测试被微软撤回,但用户已重新上传[19][20] - Hugging Face CEO批评微软此举损害开源社区利益[21] - WizardLM模型月均下载量超10万次[23]
原微软WizardLM项目团队加入腾讯混元
快讯· 2025-05-14 14:27
公司动态 - WizardLM项目创建者徐灿及其团队离开微软,加入腾讯AI开发组织混元(Hunyuan) [1] - 团队表示将继续推动LLM培训技术发展并构建更好的AI模型 [1] - 团队6名主力成员大部分已离开微软 [1] 行业动向 - 腾讯通过吸纳WizardLM团队加强AI领域布局,显示行业人才竞争加剧 [1] - 大语言模型开发领域出现核心团队跨公司流动现象 [1]