Workflow
大语言模型
icon
搜索文档
综合性能领先 智谱GLM-4.5登顶HuggingFace Trending榜单
证券日报网· 2025-07-30 20:50
模型性能与效率 - GLM-4-5参数量为DeepSeek-R1的二分之一、Kimi-K2的三分之一,但在多项标准基准测试中表现更好,得益于更高的参数效率[3] - 在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一[3] - API调用价格低至输入价格为0.8元/百万tokens,输出价格2元/百万tokens,大幅低于目前主流模型定价[3] 模型能力与发展目标 - 大语言模型的目标是在广泛领域达到人类认知水平,而非针对特定任务设计专家模型,需具备通用问题解决、泛化能力、常识推理和自我改进等核心能力[4] - GLM-4-5致力于在一个模型中统一集成通用问题解决、编程、数学、推理等各种不同能力,以克服现有模型仅在特定任务上表现最佳的局限[4] 产品发布与可用性 - GLM-4-5模型系列已上线超算互联网AI社区,包括基础模型、混合推理模型以及混合推理模型的FP8版本[4] - 企业和开发者均可在AI社区快速下载模型文件进行部署和微调开发[4]
清华学者Nature Medicine发文:DeepSeek狂奔,已在近800家医院部署,应完善监管以保障安全
生物世界· 2025-07-30 17:10
核心观点 - 中国科技初创企业DeepSeek发布的旗舰推理大语言模型DeepSeek-R1在医疗领域迅速普及,截至2025年5月8日已在中国755家医院部署,覆盖从三甲医院到基层医疗机构 [5][8] - DeepSeek-R1凭借开源、低成本(最低10万美元)、本地部署(OPD)等优势,解决了医疗AI落地的数据隐私、计算成本等核心痛点 [12][21][23] - 该模型在临床决策支持、医院运营、科研教育等场景展现多任务处理能力,包括诊断建议、报告生成、处方审核等16项具体应用 [16] - 当前医院大规模部署处于监管"灰色地带",存在准确性隐患、数据安全风险、黑盒决策、监管真空四大挑战 [25][26][29][31][32] - 研究团队呼吁建立分级监管框架,按风险等级分类管理AI应用,对高风险场景实施医疗器械级管控 [35][36][38] 模型技术特性 - 采用多阶段训练,推理能力达到国际顶尖水平,特别适合处理复杂医疗任务 [22] - 基于MIT开源协议,支持医院自由定制模型并集成现有系统 [22] - 本地部署模式确保医疗数据不出医院,满足合规要求 [18][23] - 具备"思维链"(Chain-of-Thought)能力,可部分展示推理过程但仍存在黑盒问题 [31] 医疗应用场景 临床服务 - 导诊分诊:根据症状推荐科室和紧急处理级别 [16] - 诊断决策支持:分析主诉、检查报告等辅助诊断 [16] - 治疗方案推荐:提供多方案利弊分析 [16] - 处方审核:自动检测药物冲突和剂量问题 [16] 医院运营 - 电子病历生成/纠错:自动化标准病历处理 [16] - 行政助理:解答流程问题并生成办公文档 [16] - 文档质控:批量检查病历等关键文件质量 [16] 科研教育 - 数据处理:结构化医疗数据支持研究 [16] - 医学知识问答:实时解答专业问题并模拟教学病例 [16] 部署现状 - 755家医院已部署,其中500家采用本地部署(OPD)模式 [5][8] - 部署机构涵盖顶尖三甲医院和基层医疗机构 [8] - 成本优势显著:商用一体机方案价格亲民,县级医院可负担 [21] 国际监管对比 - 美国将诊断决策支持、患者分诊等应用归类为医疗器械 [33] - 欧盟对治疗规划决策支持实施医疗器械监管 [33] - 中国目前缺乏基于风险的明确分类标准,存在监管主体模糊问题 [32][33]
AI新贵Anthropic估值冲刺万亿,Iconiq领投50亿美元融资
搜狐财经· 2025-07-30 15:38
融资与估值 - Iconiq Capital计划牵头对Anthropic进行50亿美元新一轮融资 整体估值将达1700亿美元 四个月内估值增长近三倍 [1] - 公司2024年3月完成35亿美元融资 当时估值615亿美元 [3] - 成立仅四年的公司估值已跻身全球未上市科技公司最高行列 与字节跳动 SpaceX OpenAI和xAI等巨头并肩 [1] 财务表现与业务数据 - 公司直接销售AI模型和Claude聊天机器人产品的毛利率达60% [3] - 预计2027年营收将达到350亿美元 该数字远超对OpenAI同期收入的预期 [3] 投资者与资本动向 - 除Iconiq Capital外 投资者包括阿联酋主权基金MGX和现有投资方亚马逊 [3] - Iconiq Capital管理资产超800亿美元 客户包括扎克伯格等科技界富豪 [1] - 主权财富基金等长期资本成为AI融资战关键参与者 [5] 公司发展与战略调整 - 公司由前OpenAI高管创立 曾因发展方向分歧与OpenAI分道扬镳 [3] - 过去强调"安全 负责任和伦理"的AI开发理念 曾拒绝接受中东资金 [3] - 近期调整立场开始接受中东地区投资 首席执行官承认该决定可能"让独裁者受益" [3] 行业趋势 - AI初创公司与科技巨头加速研发新一代大语言模型 [5] - 研发过程对算力 人才和基础设施的资金需求极为庞大 [5] - Anthropic凭借出色表现和增长潜力成为资本竞相追逐的对象 [5][6]
圆满闭幕!世界人工智能大会有哪些亮点?
新浪基金· 2025-07-30 10:46
2025世界人工智能大会(WAIC)核心观点 - 2025年世界人工智能大会各项指标创历史新高,线下参观人数突破30.5万人次,全网流量超23.6亿,较上届增长21.6% [1] - 大会展示了人工智能领域从技术突破到应用落地的全面进展,机器人成为焦点,并从展示性功能转向实用化,同时揭示了硬件、软件及广泛应用的巨大投资前景 [1][2][6] 大会成果与规模 - 大会共签约32个项目,总投资额达450亿元,达成意向采购金额162亿元 [1] - 超过100款“全球首发”或“中国首秀”产品在大会上亮相 [1] - 嘉宾阵容豪华,汇聚了包括图灵奖、诺贝尔奖得主在内的12位国际顶尖奖项得主,80余位中外院士,以及来自30余个国家和地区的1200余位嘉宾 [3][4] 机器人技术进展 - 机器人仍然是展会人气最高的领域,功能从去年的跳舞模仿演进至更实用的任务,如打鼓、拿物品、分拣零件 [2] - 通用智能机器人已能完成打咖啡、制作冰淇淋、码垛等复杂操作,制作一杯咖啡或冰淇淋的时间在1分半到2分钟之间 [2] - 机器人正从“可观赏”走向成为“实用助手”,在汽车制造、生物科技等工业场景中已用于上下料、物料转运,成为全自动化生产链的一部分 [2] - 新兴AI硬件开辟情绪价值赛道,例如搭载多模态情感模型的AI电子宠物,能通过眼睛和声音与用户互动 [2] 人工智能前沿观点 - 图灵奖得主杰弗里·辛顿在开幕式讨论了AI安全,指出AI智能体未来可能为完成目标而寻求更多控制权,呼吁国际社会就预防AI统治世界达成一致 [4] - 辛顿提出,人类理解语言的方式与大语言模型相似,人类可能就是一种大语言模型,并指出大语言模型会产生幻觉,但在某些方面比人类更厉害 [4] 硬件领域投资机遇 - 机器人应用场景拓展持续推升对芯片算力、传感器精度等硬件性能的需求,布局核心硬件研发制造的企业有望受益 [6] - 半导体领域,机器人芯片、算力芯片需求激增,在国产替代加速背景下,具备先进制程突破能力的企业将直接受益 [7] - 传感器作为机器人的“感知神经”,其精度升级将驱动市场扩容,相关龙头企业成长空间显著 [7] - 通信板块中,光模块是AI算力传输的关键,高速率产品需求随模型训练强度提升而爆发,国内企业全球市占率领先,订单确定性强 [7] - 5G/6G网络作为AI应用落地的基础设施,其建设提速将带动通信设备商业绩释放 [7] 软件与算法领域投资机遇 - 大模型的持续迭代是关键,众多企业在大会发布新模型,市场竞争激烈 [6] - 具备强大研发实力、能够不断优化算法并提升模型性能与泛化能力的企业,将在竞争中脱颖而出并吸引资本 [6] 应用领域投资机遇 - 工业场景中,AI助力企业降本增效 [7] - 民生领域,AI健康管家、教育大模型等应用满足人们对健康、教育的需求,随着用户规模增长,盈利空间将逐步打开 [7]
大模型发展情况及展望:海内外大模型梳理
2025-07-30 10:32
行业与公司关键要点总结 **人工智能行业整体发展** - 人工智能投资经历三轮浪潮 当前浪潮持续时间更长 上涨力度更强 资本开支投入力度和商业化回报潜力更高[1][4] - 人工智能发展三阶段:符号主义 专家系统 深度学习 当前处于深度学习阶段 核心技术为深度神经网络[5] - 模型智能水平提升三规律:算力增长 效率提升(训练成本逐年下降) 范式转变(如强化学习引入)[23] - 推理算力需求爆发式增长 占当前算力使用80%-90% 谷歌Gemini流量TOKEN达480T(2025年4月) 两个月后翻倍至900T[25][32] **大模型技术进展** - **深度学习应用**:Transformer架构通过思维树增强逻辑能力 提升问答速度和问题解决表现[1][6] - **强化学习突破**:进入post-training scaling law阶段 少量反馈数据即可提升逻辑推理能力 减少对外部语料依赖[8][9] - **训练范式演变**:未来重点为延长强化学习时间 增加算力投入 引入MID training阶段(专家标注高质量数据)[13][17] - **成本趋势**:训练成本逐年下降 GPT-4训练成本前年较高 2024年下降 2025年进一步降低[22] **海外大模型动态** - **OpenAI**:GPT-4.5发布延迟 GPT-5预计在逻辑思维 动态处理 图形界面操作跨代提升 O3模型文本/视觉推理突出[10][11] - **GROX系列**:GROX4强化学习算力与预训练相当 表现惊人 提供未来训练范式参考(算力与时间大幅增加)[13] - **谷歌Gemini**:均衡性强 性价比 推理速度 绝对能力突出 API调用市场份额45%[14][30] - **GOROCK4**:使用20万块H100训练 性能强劲 测试成绩刷新 与头部模型差异小[12] - **Isotropic Cloud 4**:编程优化模型 推理速度快 价格低 第三方调用量巨大 估值攀升[15] **国内大模型进展** - **技术差距**:中美模型差距约3-6个月 无显著技术壁垒 国内模型可能在下一次迭代后冲击SOTA[18][33] - **代表模型**: - 豆包1.6:支持深度推理 多模态理解(图片 视频)及界面操作[19] - Kimi K2:DPC V3架构 总参数量1万亿 非推理领域领先[19] - 千问三:具备长短COT能力 混合推理 quarter版本编程性价比超Claude 4[19] - **编程领域**:国内模型能力接近海外顶尖(如Claude 4) 性价比更高 此前被低估[20] - **算力需求**:国内模型需更多算力支持 短期悲观但基座表现优异 三季度或有大版本发布[21] **商业化与市场表现** - **谷歌AI Overview**:覆盖全球后 每月激活频次1470亿次(占搜索35%-50%) 月度吞吐量290T TOKEN[26] - **API市场格局**:谷歌45% Sora(编程能力强)第二 Deepseek第三 OpenAI份额低[30] - **AGI进展**:技术无显著障碍 强化学习与合成数据解决数据短缺 应用闭环(搜索 编程 多模态生成)[31] - **投资机会**:关注计算资源与应用标的 强化学习迭代推动性能跃升 类比AlphaGo股价效应[33] **潜在风险与挑战** - **深度推理模型**:简单问题反应过慢 混合推理为发展方向(如Claude 3.7动态激活深度推理)[16] - **算力波动**:短期事件冲击(如DeepSick影响英伟达股价)但非长期趋势[24] - **商业化渗透率**:AI搜索主导 虚拟试衣等新应用渗透率低 增长空间大[27][28] (注:部分文档内容重复或交叉引用 已合并关键数据与观点)
世界人工智能大会,AI教父Hinton告诉你的25个道理
混沌学园· 2025-07-29 20:04
AI发展历程与理论框架 - 人工智能领域存在两种核心范式:符号推理范式(强调逻辑推理)和生物学范式(基于神经网络连接与理解)[1] - 1985年首次尝试融合两种理论,通过特征关联预测词汇,奠定现代语言模型基础[2] - 技术演进路径:1995年自然语言建模验证→2005年词向量嵌入普及→2023年Transformer架构与ChatGPT突破[2] 大语言模型(LLM)的运作机制 - LLM通过多维特征向量(数千维度/词)实现语义理解,类似乐高积木的柔性组合[4][6] - 语言处理本质是动态解构(类似蛋白质分子分析),而非静态逻辑转换[5] - LLM具备真实理解能力,其机制与人类认知高度相似,且可能超越人类处理特定任务[6][9] 数字智能的进化优势 - 知识迁移效率对比:人类通过语言传递仅100比特/句,数字智能可直接共享万亿比特级参数[12][13] - 分布式学习能力:模型可跨硬件并行运行,实时同步权重与梯度(如GPT-4部署模式)[14] - 能源成本决定论:若未来能源廉价化,数字智能的协同学习将形成压倒性优势[16] AI与人类关系的风险预警 - 超级智能可能发展出自主动机:维持运行+资源攫取,导致人类失去控制权[18] - 技术失控类比"养虎",需在驯服与消除间抉择,但全球性消除不具备可行性[20][21] - 潜在威胁包括:欺骗操纵人类、绕过关闭指令、利用人类获取权力[19] 技术应用与全球治理 - AI已在医疗/教育/气候/材料等领域展现变革性价值,行业效率提升显著[21] - 需建立国际AI安全组织,制定技术规范确保AI作为人类辅助工具[23][24] - 全球合作是核心解决方案,任何国家的防失控技术都将被广泛采纳[22][25]
新疆医学研究成果登上《自然·医学》
人民网· 2025-07-29 10:06
研究突破 - 基于大语言模型实现全球首创多器官衰老评估 对心、肺、肝等多器官实现个体层面生物年龄建模并揭示器官异步衰老现象 [3][4] - 生物年龄预测准确率显著超越传统指标 在死亡与疾病风险预测中优于端粒长度和表观遗传时钟等传统方法 [4] - 识别316种可能与加速衰老相关的血液蛋白标志物 其中约190种为首次报道 包括高效预测因子IGFBP4 [4] 数据规模与技术优势 - 研究整合全球六大健康数据库总样本量超1000万人 涵盖中、英、美三国数据源包括英国生物银行和美国国家健康与营养调查等 [3] - 依托新疆电力与自然条件优势 结合中国移动新疆分公司及华为昇腾算力完成海量数据汇聚治理与分析 [4] - 仅需常规体检数据即可实现低成本易推广的衰老评估 使尖端健康评估技术能下沉基层服务更广泛人群 [4] 战略意义与应用前景 - 标志着新疆在医学科技前沿领域取得重要突破 为全球精准健康评估领域贡献智慧 [3][5] - 成功经验可率先惠及"一带一路"共建国家 为全球应对老龄化挑战提供中国新疆智慧 [5] - 研究成果已转化为天山悦康大模型 能给予个性化健康建议并赋能健康管理 [3]
并行科技(839493):智算云收入高增带动2025H1营收yoy+69%,“并行算网”赋能“东数西算”战略
华源证券· 2025-07-29 09:07
报告公司投资评级 - 维持“增持”评级 [5][9] 报告的核心观点 - 2025H1并行科技营收、归母净利润、扣非归母净利润、经营活动产生的现金流量净额均实现高增长,毛利总额增加、费用整体增长幅度较小,利润随之增加 [6] - 智算云服务收入同比增长175%,传统超算正加速迈向与AI、大数据紧密融合;公司深化与算力资源提供商及电信运营商合作,扩大自有算力资源池,提升智算云业务能力,并进行广泛用户培育 [6] - 并行科技与阿里云签署框架合作协议,MaaS平台全面接入智谱GLM - Z1系列推理模型,有望共同打造多领域标杆解决方案,加速AI技术普惠化 [6] - 2024年中国智能算力规模达725.3EFLOPS(yoy + 74.1%),“并行算网”算力生态升级揭牌,有望助力“东数西算”战略落地 [6][7] - 预计公司2025 - 2027年归母净利润分别为0.24/0.36/0.48亿元,对应EPS分别为0.40/0.61/0.80元/股,对应当前股价PS分别为10.4/8.1/6.6倍,看好公司为重点发展领域提供云计算服务,维持“增持”评级 [8][9] 根据相关目录分别进行总结 市场表现 - 2025年7月28日收盘价150.40元,一年内最低/最高为31.09/299.99元,总市值89.8029亿元,流通市值62.1106亿元,总股本5971万股,资产负债率78.37%,每股净资产7.00元/股 [3] 财务数据 盈利预测与估值 |年份|营业收入(百万元)|同比增长率(%)|归母净利润(百万元)|同比增长率(%)|每股收益(元/股)|ROE(%)|市盈率(P/E)| | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | |2023|496|58.47%|-80|29.69%|-1.35|-23.92%|-111.56| |2024|655|32.07%|12|114.98%|0.20|3.45%|744.84| |2025E|863|31.86%|24|98.60%|0.40|6.41%|375.04| |2026E|1116|29.27%|36|51.68%|0.61|8.86%|247.26| |2027E|1364|22.28%|48|32.14%|0.80|10.48%|187.12|[8] 财务预测摘要 - 资产负债表涵盖货币资金、应收票据及账款等项目,预测2024 - 2027年相关数据变化 [10] - 利润表包含营业收入、营业成本等项目,给出2024 - 2027年预测数据及增长率 [10] - 现金流量表涉及经营性现金净流量、投资性现金净流量等,呈现2024 - 2027年预测数据 [10] - 主要财务比率包括成长能力、盈利能力等指标,展示2024 - 2027年预测情况 [10]
OpenAI董事长Bret Taylor:2010 年的 SaaS 应用,就是 2030 年的智能体公司
AI科技大本营· 2025-07-28 18:42
AI行业现状与趋势 - 当前处于"加了10倍速的互联网泡沫"时代,AI技术变革堪比个人电脑和互联网的诞生,为初创公司创造挑战巨头的机会 [3][31][35] - AI能力已超越三年前对AGI的定义,行业正在不断重新定义技术边界 [8] - 软件行业被AI颠覆的程度可能超过其他任何行业,历史上尚无类似先例 [8] - 技术复合效应显著增强,AI可通过现有全球智能设备网络快速触达用户,增长呈现爆炸性 [33][34] 创业方法论 - 真正的创业机会来自市场或平台转变,需关注技术革新带来的生产力跃迁 [14][15] - 多数B2B公司宣称的"以客户为中心"存在误区,真实价值需通过商业变现验证 [19][21] - 有效创业应始于深度客户需求调研,而非技术推演,典型案例是与Grab CEO长谈后锁定AI客服赛道 [20][21] - 资本主义环境下,金钱交易是唯一诚实的市场信号,免费试用反馈存在误导性 [30] 技术架构演进 - 行业正在探索AI时代的"LAMP"技术栈,当前提示词工程等临时方案未来将显得原始 [46][47] - 模型功能不应过度集成,记忆等辅助功能可通过外部系统实现,这将成为智能体公司的市场机会 [44] - 未来技术栈将明确分工:基础模型集中于研究领域,全栈工程聚焦智能体开发 [42] 公司运营策略 - 应用层AI公司预训练自有模型是最高效的烧钱方式,应避免这种错误 [36][42] - AI市场分为三大领域:前沿大模型(资本密集型)、AI工具(高风险竞争)、应用层AI(最大机会) [37][39][41] - 软件维护成本问题将通过智能体服务解决,延续SaaS对传统软件的优势 [43] 人才需求变化 - "10倍工程师"的定义将被重塑,三年后所需技能组合可能完全不同 [8] - 黑客马拉松价值提升,胜负关键变为操作"代码生成机"的速度 [9] - 教育体系需适应技术变革,AI将放大个体能力,降低专业门槛 [51][52] 历史经验借鉴 - 互联网泡沫时期诞生了亚马逊等巨头,当前AI热潮可能复制这一模式 [32] - 参考云计算市场发展路径,AI工具领域仍可能孕育Snowflake级别的公司 [40] - 2010年的SaaS应用将演变为2030年的智能体公司,垂直领域存在大量机会 [41]
辛顿、闫俊杰WAIC完整演讲:一个预警,一个拥抱
36氪· 2025-07-28 00:57
人工智能发展路径 - 深度学习教父Geoffrey Hinton指出AI发展存在两种范式:符号主义路径(基于逻辑推理)和连接主义路径(基于神经连接学习)[7] - 大语言模型与人类理解语言的方式相似,通过将语言转化为特征并整合特征来实现理解[9] - 从1985年的微型语言模型到现代Transformer架构,AI语言处理能力呈现指数级提升[8] 数字智能特性 - AI系统具有"永生性",软件知识可无限复制且不受硬件限制[13] - 数字智能间知识转移效率极高,可通过平均化比特实现大规模知识共享[14] - 生物计算功耗低(人脑仅需30瓦特),但知识分享效率远低于数字系统[13] AI能力演进 - MINIMAX视频模型"海螺"过去六个月已生成超过3亿个视频[18] - AI视频制作成本从百万级降至数百元,时间从两个月缩短至一天[17] - 公司内部70%代码由AI编写,90%数据分析由AI完成[18] 行业竞争格局 - AI领域将存在多个玩家,因模型对齐目标差异导致产品特性分化[20] - 开源模型影响力提升,最佳开源模型性能逼近闭源模型[22] - 多Agent系统兴起削弱单一模型优势[21] 技术成本趋势 - 模型推理成本过去一年降低一个数量级,未来可能再降一个数量级[25] - 单个对话Token消耗从数千增至数百万,但单位Token成本持续下降[25] - 算力增长主要用于研究探索而非单纯扩大模型规模[24] 应用场景拓展 - AI在数据分析、信息追踪、创意设计等领域展现高效生产力[6] - 出现古文字解析、飞行模拟、天文望远镜设计等非预期应用场景[18] - 专业AI可替代基础标注工作,标注员转向专家型指导[20] 普惠化发展 - AGI实现过程需AI公司与用户共同参与,所有权应归属多方[23] - 模型使用门槛降低使创意普及化,个人创意得以充分释放[18] - 训练单个模型的成本不会显著增加,行业烧钱属性减弱[25]