大模型

搜索文档
OpenAI披露GPT系列新进展,微美全息(WIMI.US)正加速AI技术融合与产业变革
中国产业经济信息网· 2025-07-02 11:54
OpenAI最新动态 - OpenAI即将推出一款远超业界预期的开源模型 具备强大的本地运行能力 将推动AI技术普及与创新 [1][2] - GPT-5预计今年夏季面世 支持语音、图像、代码和视频等多模态输入 标志着AI技术进入全新发展阶段 [2] - GPT-3成本短期内大幅下降 使用成本持续降低趋势将延续 完全多模态模型将带来革命性计算机界面 [2] 大模型行业趋势 - 大模型正以前所未有的速度赋能千行百业 推动产业创新 开辟新应用场景 [3] - 行业细分趋势明显 垂类模型因成本低、精度高成为特定场景需求 通用大模型并非所有企业必需 [3] - 中金公司指出 多Agent构建与定制化Agent将成为趋势 企业数据整合治理重要性凸显 [3] 微美全息战略布局 - 微美全息聚焦AI全产业链布局 加速推进人工智能+大模型创新应用先导区建设 [4] - 公司打造「全息云」平台 开放模型代码、算力接口及工具链 推出覆盖文本生成、视频理解等场景的推理大模型 [4] - 支持开发者调用DeepSeek等通用大模型二次开发 持续深化多模态大模型以扩展AI+产业融合边界 [4] 行业前景展望 - 2025年将成为AI应用大规模落地元年 市场增长潜力惊人 [5]
独家丨对话云知声黄伟:撕掉博士标签,成为真正的CEO
创业邦· 2025-07-02 11:12
公司概况 - 云知声智能科技股份有限公司于2024年6月30日在港交所挂牌,成为"港股AGI第一股",IPO发行价每股205港元,募资总额3.2亿港元,首日收盘价296.4港元,较发行价上涨44.59%,市值约210亿港元[3] - 公司成立于2012年7月,由中科大博士黄伟与梁家恩联合创立,定位人工智能底层技术与应用研发,从语音识别演进至生成式AI,2024年收入近10亿元[5][7][8] - 成立至今完成至少10轮融资,累计融资额超20亿元,投资方包括挚信资本、启明创投、中网投、京东、360、高通创投等30多家机构[4] 商业模式与技术布局 - 采用"云端芯一体化"战略,将AI能力模块化实现快速场景适配,2023年提供约1300万颗消费级AI语音芯片,2024年芯片出货量达3600万颗[8][17] - 构建"一横一纵"业务矩阵:"一横"覆盖消费电子、汽车、家居等物联网场景,"一纵"深耕医疗知识密集型场景,2024年山海大模型收入达7420万元,客户65家[22] - 智慧生活业务为营收主力,2022-2024年收入从4.9亿元增至7.4亿元,占比超78%,客户涵盖大型保险集团、深圳地铁等[19] 医疗领域突破 - 2013年率先布局医疗AI,2022-2024年医疗业务收入从1.1亿元增至2.0亿元,占比提升至21.2%,服务北京协和医院等576家客户[12][14][9] - 通过AI语音技术将医生病历书写时间从3小时缩短至1小时,产品覆盖智能导诊、医学影像辅助诊断及医保支付管理等场景[12] - 医疗业务采用"标杆效应"策略,与协和医院深度合作积累临床经验,形成技术壁垒,2024年在医疗AI服务市场排名第四[12][14][9] 技术演进与行业地位 - 2016年建立Atlas人工智能基础设施,2017年推出基于BERT的大语言模型UniCore,2023年发布600亿参数的山海大模型[8] - 按2024年收入计,公司是中国第四大AI解决方案提供商,生活AI解决方案市场排名第三,医疗AI服务市场排名第四[9] - 坚持不卖模型只卖解决方案的策略,认为"卖模型是伪命题",专注基于山海大模型的产品化输出[26][27] 创始人特质与创业历程 - 创始人黄伟出身军人家庭,性格坚毅,拥有中科大语音方向博士学位,曾带领团队在NIST声纹识别评测中力压MIT、斯坦福等机构[6] - 2012年创业初期掏空积蓄并借款200万元,拒绝巨头收购,坚持13年将公司带至上市[7][8] - 强调创业者需忘掉博士标签,以商业组织CEO身份思考,将技术、产品、商业深度融合[29][31]
依米康:参编绿色数据中心新标准,铸就低碳未来核心竞争力
财富在线· 2025-07-02 09:37
行业趋势 - AI和大模型等新兴技术迅猛发展导致数据中心面临高密度算力需求与能耗挑战 [1] - 绿色节能技术从"选择题"转变为关乎可持续发展的"必答题" [1] - 全国一体化算力网络建设加快对数据中心绿色化、集约化、智能化提出更高要求 [5] 公司参与标准制定 - 公司是国家标准GB/T 44989-2024《绿色数据中心评价》重要参编单位 [2] - 该标准是我国首部系统性指导绿色数据中心建设与评估的国家级标准 [2] - 公司为关键指标设定、能效评估体系及绿色运维路径提供切实可行建议 [2] 技术创新 - 公司构建覆盖多种应用场景的绿色节能产品体系包括液冷系统、氟泵自然冷机组和双擎自然冷风墙 [4] - 液冷系统可实现PUE低至1.1以下大幅降低制冷能耗 [4] - 氟泵自然冷机组显著提升全年运行效率尤其适用于中高纬度地区 [4] - 智能监控平台集成AI算法实现设备状态、能耗数据实时监测与预测性维护 [4] 定制化解决方案 - 公司以"绿色+智能+高效"为核心理念打造定制化基础设施解决方案 [5] - 方案成功助力客户实现数据中心绿色转型与效能跃升 [5] - 未来将持续深化液冷、AI运维等前沿技术融合应用 [5]
AI数据服务爆发,打造大模型背后的数据引擎丨热门赛道
创业邦· 2025-07-02 08:11
AI数据服务行业概述 - AI数据服务涵盖数据采集、清洗、标注、增强、质量控制及交付全流程,是AI模型从实验转向商业应用的关键推动力[3] - 行业开发范式从模型优化转向数据质量提升,以减少数据与模型割裂,抑制幻觉并改善输出[3] - 服务应用场景包括大语言模型训练、自动驾驶、金融风控及医疗图像识别等[3] 技术演进与服务模式 - 早期依赖人工采集与标注,目前向智能化与平台化跃升,采用自动标注、弱监督学习及数据合成技术降低成本[5] - 编程式标注(如Snorkel AI)通过标签函数和自动推理提升效率,替代传统人工贴标签方式[6] - 三种主流服务模式对比: - **自动化标注**:算法驱动,效率高但准确率中等,代表公司Snorkel AI、Labelbox[7] - **专业数据采标**:人工为主,高精度需求场景适用,代表公司Appen、iMerit[7] - **全栈式服务**:自动+人工结合,覆盖数据全生命周期,代表公司Scale AI、Sama[7] 产业链结构 - **上游**:数据采集设备、标注工具及合规接口供应商(如Snorkel、Label Studio)[8] - **中游**:核心服务环节,提供定制化数据处理(如医疗影像去标识化、自动驾驶多模态标注)[8] - **下游**:应用领域包括自动驾驶、医疗AI、金融风控等,推动中游服务专业化与自动化[9] 行业融资与趋势 - 2020年融资事件达33起高峰,2021年后波动趋稳,显示行业进入成熟期[9] - 近期大额投资动态: - Meta拟148亿美元收购Scale AI 49%股份[22] - 亚马逊5年投200亿澳元(129.7亿美元)扩建澳大利亚AI基础设施[21] 代表企业分析 尚跃智能 - 成立于2022年,聚焦自动驾驶、医疗等领域,构建结构化超声影像数据集[10] - 2025年完成Pre-A2轮融资(未披露金额),投资方为汉口基金[12] 博登智能 - 成立于2019年,提供自动驾驶、人脸识别数据全流程服务,BASE平台支持多模态数据处理[13] - 2025年完成亿元A轮融资,由上海国际集团独家投资[15][17] 文德数慧 - 成立于2023年,主推AutoConnect AI数据服务平台,覆盖自动驾驶多模态标注[18] - 2025年完成天使+轮融资(未披露金额),投资方为宜宾产城科创[19][21] 技术热点与生态动态 - 阿里云发布Data Agent系列产品,整合AI与数据工具智能化能力[23] - IBM推出非结构化数据解决方案,拟收购DataStax增强矢量搜索功能[26] - Crusoe Energy与Redwood合作推出全球最大二手电池供电数据中心(2000块GPU)[27]
金融业拓展深化大模型应用
经济日报· 2025-07-02 06:23
人工智能在银行业的应用现状 - 中国银行业在大模型落地应用方面走在前列 应用范围已从国有大行 股份制银行扩展到头部区域性银行 [1] - 国有大行和股份制银行已全面启动大模型应用建设 并在前台 中台 后台均有正式投产的应用案例 [1] - 人工智能在银行业的应用场景不断拓展 从前台业务(智能投顾 产品咨询智能客服)到中后台业务(智能反洗钱 智能监管) [1] 银行业AI应用的发展趋势 - 2025年预计将看到更多银行积极拥抱AI 探索其在多个领域的应用潜力 [1] - 银行业需要构建完善的治理框架和风险防范机制 确保技术应用的安全合规与可持续发展 [1] - 银行业应深入研究不同业务场景的实际需求 针对财富管理 投资策略等重要领域探索AI与行业专家结合的模式 [2] 当前AI应用的局限性 - 大模型实际效果与用户期望存在差距 如AI智能客服的"答非所问"和"已读乱回"问题 [2] - 在财富管理 投资策略等银行重点领域 大模型应用仍存在局限性 与核心业务尚未深度融合 [2] - 大模型存在"广而不精"现象 需要从"可用"迈向"优用" 从"大而全"转向"专而精" [2] 银行业AI应用的优化方向 - 根据实际需要对大模型进行优化调整 推动银行业数字化转型 降低运营成本 [2] - 建立健全用户反馈响应机制 通过用户交互数据优化算法 提升语义理解与精准回答能力 [2] - 银行需要持续资源投入 推动模型本地化优化 保障数据质量 提升应用成效 [3] AI在银行业的潜在应用领域 - 大模型在客户营销 业务创新 风险管理 机构运营等方面都具有持续开发潜力 [3] - 开源大模型的出现和推广降低了银行的成本投入 但需要从"可用"迈向"优用" [3]
MiniMax 进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 22:00
大模型行业趋势 - 大模型技术以常规技术乘十的速度进化,颠覆互联网时代的生态护城河、资金壁垒和规模效应,使创业公司也能站上世界舞台中心 [1] - 行业生存法则已转变为"创新至上",传统互联网玩法彻底失效,淘汰周期缩短至季度为单位 [2][3] - 百模大战后,Open AI、Anthropic、MiniMax、DeepSeek等创业公司占据SOTA榜单大半,巨头优势被灵活创新机制瓦解 [10] MiniMax技术突破 视频模型Hailuo 02 - 参数量较前代增长3倍,分辨率达原生1080P,支持10秒高清内容生成,涵盖复杂物理交互与专业级运镜 [6] - 在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅其1/9 [7] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [9] 大模型M1 - 4560亿参数,原生支持100万token输入(DeepSeek R1的8倍)和8万token输出(超Gemini 2.5 Pro) [11] - 采用混合注意力机制(1/8自注意力+7/8线性注意力),实现长上下文窗口技术突破 [16] - CISPO算法使强化训练仅需3周+512块H800 GPU(成本53万美元),推理算力为DeepSeek R1的25% [17][19] 商业化与生态构建 Agent应用创新 - Hailuo Video Agent支持超百种视频模板,实现创意构思到成片的全链路生产,连续6个月全球视频生成AI榜首 [21][23] - 通用Agent可完成长程复杂任务(如网页搭建、PPT制作),内部使用率达50%,具备跨模态理解与生成能力 [24] - 基座模型与Agent形成技术闭环,性能优化与成本控制优势显著 [25] 公司发展路径 - 2022年初成立并提前布局MoE模型,2024年推出国内首个MoE大模型 [26] - 开源Lightning Attention技术,突破Transformer架构限制 [26] - 创新驱动战略使M1半年内登顶开源模型全球第二,通用Agent解决跨模态长距离任务难题 [27][28]
MiniMax进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 21:54
大模型行业特征 - 大模型技术发展速度极快,3年时间从默默无闻到改变世界,具备工业革命特质 [2] - 行业竞争激烈,头部玩家快速更迭,百亿资本投入可能迅速沉寂 [2] - 传统互联网的护城河、资金壁垒、规模效应失效,创业公司有机会站上世界舞台 [2] - 行业生存法则为创新至上,淘汰周期以季度为单位 [3][4] MiniMax的技术突破 - Hailuo 02模型参数较Hailuo 01增长3倍,视频分辨率提升至原生1080P,支持10秒高清内容生成 [9] - Hailuo 02在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅1/9 [10][11] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [12] - M1模型支持100万token输入长度,是DeepSeek R1的8倍,输出token达8万个打破Gemini 2.5 Pro记录 [16] - M1在工具使用场景(TAU-bench)中领跑所有开源权重模型,30多轮长链路任务稳定性极高 [18] 创新架构与训练方法 - 早期探索MoE架构和混合注意力机制,1/8用自注意力,7/8用自创Lightning Attention [20] - CISPO算法替代传统PPO/GRPO,仅用3周时间、512块H800 GPU完成强化学习训练,成本53万美元 [21][23] - 生成10万token时推理算力仅需DeepSeek R1的25%,数学和编程任务效率更高 [23] Agent应用创新 - Hailuo Video Agent支持超百种视频模板,涵盖艺术片、广告片等体裁,打通完整视频生产链路 [28] - MiniMax Agent具备长期任务规划能力,内部使用60天,50%员工用于PPT制作、网页搭建等 [31] - Agent能生成复杂跳转逻辑网页,支持多模态理解与生成,完成动画、广告片等任务 [31] 公司发展历程 - 2022年初成立,早于ChatGPT引爆全球的时间 [33] - 2023年将80%算力投入MoE开发,2024年初推出国内首个MoE大模型 [34] - 2024年1月开源Lightning Attention技术,6月M1模型拿下开源模型全球第二 [34] - 持续探索更高智能水平,创新驱动发展 [35][36]
智能体洗牌“六小虎”,模型厂商如何转型?
虎嗅· 2025-07-01 20:04
智能体技术发展现状 - 智能体从内容生成进化到任务执行,代表AI从"生成内容"到"完成任务"的转变[4][5] - 智能体是指能感知环境、做出判断并采取行动实现目标的智能系统[4] - 智能体制造门槛大幅降低,普通用户可通过"美图秀秀"式轻工具制作,专业开发者则使用"Photoshop"级工具开发深度业务场景应用[6][7] 行业竞争格局 - 基础大模型层将形成高度集中格局,类似云计算行业最终仅剩少数头部厂商[12] - 模型微调层和智能体构建层将成为差异化竞争的主要空间[13] - 第一梯队模型厂商正向MaaS平台和智能体平台延伸,提供完整能力包[9] - 第二梯队厂商正转向垂直行业应用、C端应用和海外市场[11] 商业化挑战 - 全球大模型公司尚未找到有效盈利模式,70%收入被GPU厂商获取[30] - C端聊天类工具变现困难,国内外订阅模式均面临挑战[24] - 智能体虽增加tokens调用量,但未能显著提升模型厂商利润[30] - 企业需求聚焦明确ROI,关注降本增效和新产品开发[58][61] 技术演进方向 - 智能体可能成为新型操作系统,通过终端设备抢占入口[41][43] - 企业系统互通仍面临挑战,45岁以上CTO退休后可能迎来变革[40] - 大模型可能突破传统规则引擎,形成新的业务处理范式[50][51] - 工业领域存在"外挂式"和"替换式"两种智能化路径[49] 行业应用现状 - 企业AI应用集中在智能客服、知识库等低风险场景[65] - 制造业头部企业自建算力平台,但实际应用限于广告内容生成[52] - 咨询行业基础分析工作可能被替代,但高端咨询服务仍依赖人际互动[71] - 代码模型已显著提升软件开发效率,改变软件行业工作模式[68]
1.8万个核心岗位,京东抢夺顶尖AI人才来势汹汹!
21世纪经济报道· 2025-07-01 18:59
人才战略与招聘 - 公司推出TGT顶尖青年技术天才项目,面向全球高校本硕博在校生、应届生及毕业两年内的技术人才开放招募,覆盖多模态大模型与应用、机器学习等8类方向及80余个前沿课题 [1] - 人才布局呈现"金字塔"结构:顶尖领军人物引领方向,中腰部技术骨干通过TGT项目吸纳顶尖硕博,形成"资深leader+高潜校招生"的协同研发模式 [1] - 公司为2025届毕业生提供1 8万个核心岗位 [1] AI基础设施建设 - AI基础设施建设以业务需求为导向,形成"业务定义模型-模型驱动基建"的闭环 [1] - 在硬件层面积极拥抱国产化,通过与国产硬件厂商深度联合共建、引入高校产学研合作,推动开源生态建设,目标成为国产AI生态的重要引领者 [1] - 通过软件优化弥补硬件短板,自研xLLM端云一体大模型推理架构已在内部应用,相比开源框架性能提升30%-40% [2] 大模型应用与技术创新 - 搜推业务通过三种方式推进大模型应用:重构传统多阶段搜推流程、引入生成式模型提升系统扩展性、探索大模型原生应用如智能导购等工具 [2] - 大模型调用量相较去年"双11"上升130%,超过1 4万个AI智能体在内部运行,超过1 7万品牌商家使用数字人直播带货,超过5000万人次使用智能导购助手 [3] - 大模型推动电商从"关键词匹配"向"语义理解+多模态交互"升级,用户可通过图片上传精准定位商品 [3] 实战场景与技术挑战 - 算法优化需直面"618大促千万单履约调度"等真实业务场景挑战 [2] - 产业级压力挑战带来的成长密度远超论文写作,需要解决大规模高并发系统场景的实际问题 [2] - 校招生在大模型应用项目中的占比已显著高于传统业务,因其具备前沿视野 [3]
Kimi和Minimax,争夺“下一个DeepSeek”心智
36氪· 2025-07-01 16:41
行业格局演变 - 中国大模型行业格局从"六小龙"演变为"基模五强",DeepSeek的崛起显著改变竞争态势[1] - Kimi和Minimax近期分别推出Kimi-Dev编程模型/Minimax-M1推理模型,通过技术突破寻求差异化竞争[1][7][11] - 行业竞争焦点从早期用户争夺转向技术前沿突破,更适合以技术为核心的创业团队[6] Kimi战略与产品 - 聚焦Agent赛道推出Kimi-Researcher,专攻金融/学术等垂类场景,平均生成万字报告并引用26个可溯源信源[7][8] - 采用端到端自主强化学习技术,单任务平均进行23步推理,筛选前3.2%高质量信息,在低幻觉垂类赛道获积极反馈[7][8] - 技术路线与DeepSeek多次"撞车",包括注意力机制优化等基础研究,显示其技术实力仍处第一梯队[17][18] Minimax技术突破 - 推出4560亿参数推理模型M1,支持100万token输入/80k token输出,长上下文能力全球前二[11] - 采用MoE架构创新,训练成本性价比显著,性能超越多数开源模型及Claude 4 Opus,仅次于Gemini 2.5 Pro[11] - 2023年即押注MoE路线,早于行业转向,但市场影响力未达预期[20] 竞争策略差异 - Kimi选择垂直Agent路线,通过深度研究功能切割专业场景,避开大厂主战场[3][29] - Minimax坚持全栈布局,通过多模态技术(如AI语音合成)展示全场景渗透能力[13][29] - 两家公司均试图打破"参数比拼"的初级竞争模式,转向用户心智占领[27] 创始团队特质 - Kimi创始人杨植麟兼具顶尖学术背景(CMU/苹果AI导师)和企业级AI落地经验,融资能力突出[16] - Minimax创始人闫俊杰技术预判精准,早期All in MoE路线但商业化节奏滞后[20] - 投资方认为团队技术预判能力(如长文本/MoE布局)仍是核心竞争优势[22][29] 行业趋势观察 - AI应用加速渗透生活场景,从工具转向收益驱动的商业化阶段[25] - 通用Agent市场被大模型公司主导,创业公司需聚焦垂直领域构建壁垒[25] - 技术突破与市场定位的精准耦合成为重塑行业认知的关键,参考DeepSeek崛起路径[27][29]