Workflow
多模态模型
icon
搜索文档
民营经济促进法获通过,一季度理财规模缩水 | 财经日日评
吴晓波频道· 2025-05-01 03:21
民营经济促进法 - 十四届全国人大常委会第十五次会议表决通过民营经济促进法 自2025年5月20日起施行 共9章78条 包括公平竞争 投资融资促进 科技创新等章节 [2] - 作为我国第一部专门关于民营经济发展的基础性法律 将进一步优化民营经济发展环境 保证各类经济组织公平参与市场竞争 [2] - 法律需要给予民营企业被保护的安全感 同时重视民企的实际经营需求 内容需随发展调整完善 [2] 制造业PMI数据 - 4月份制造业PMI为49% 比上月下降1.5% 非制造业商务活动指数为50.4% 比上月下降0.4% [3] - 构成制造业PMI的5个分类指数中 仅供应商配送时间指数高于临界点 高技术制造业PMI为51.5% [3] - 4月外贸摩擦影响显现 出口需求回落成为拖累PMI最大因素 内需修复对冲效果有限 [4][5] 贵州茅台业绩 - 一季度实现营业总收入514.43亿元 同比增长10.67% 归母净利润268.47亿元 同比增长11.56% [6] - 酱香系列酒营收70.22亿元 同比增长18.30% 海外市场营收11.19亿元 同比增长37.53% [6] - 3月末现金及现金等价物余额1765.48亿元 较年初增长3.87% [6] 腾讯AI布局 - 重构混元大模型研发体系 成立大语言模型部和多模态模型部 分别负责不同技术方向 [8] - 加强数据平台部和机器学习平台部建设 为AI模型训练提供全面高效的PaaS平台底座 [8] - 调整后研发体系以技术驱动 资源集中使用 提升训练效率 [8][9] 亚马逊关税争议 - 考虑在Haul平台显示关税附加费 直接向消费者展示特朗普关税政策影响 [10] - 该计划遭到特朗普政府猛烈抨击 亚马逊表示从未获得批准实施 [10] - 关税政策使美国企业面临两难境遇 政府施压加剧企业和消费者困境 [11] 外资券商发展 - 瑞银证券变更为外国法人独资 成为第五家外资全资控股券商 [12] - 瑞银集团持股比例由67%增至100% 多家外资券商加速布局中国市场 [12] - 金融对外开放步伐稳健 外资参与度提升有助于国内产业转型升级 [12][13] 理财市场动态 - 一季度末理财产品存续规模29.14万亿元 较2024年末减少约8100亿元 [14] - 4月第三周理财规模较前一周上升约3200亿元 呈现恢复态势 [14] - 一季度债市波动拖累理财产品收益 开放式固收类产品近1个月年化收益率平均2.24% [14] 股市行情 - 4月30日沪深两市成交额1.17万亿 较上个交易日放量1472亿 [16] - 全市场超3400只个股上涨 机器人 算力 华为概念股表现活跃 [16] - 银行板块调整 电力 钢铁 港口等板块跌幅居前 [16][17]
沃尔玛态度转变:恢复中国供应商出货,美国客户承担关税成本;传饿了么加入外卖大战;因未按时公示年报,引望公司被列为经营异常
雷峰网· 2025-04-30 08:30
中国半导体设备产业整合 - 中国计划将200多家半导体设备公司整合为10家大型企业,以提升产业竞争力应对美国制裁 [3] - 中国半导体自给率目前约为23%,产业整合旨在提高自给率 [3][5] - 北方华创已开始行动,以16.9亿元收购芯源微9.5%股份,并计划扩大持股以获得经营权 [3] 沃尔玛供应链调整 - 沃尔玛通知中国供应商恢复发货,并明确关税成本由美国客户承担 [7] - 此前沃尔玛曾要求中国供应商承受高达10%的降价幅度以转嫁20%关税成本 [7] - 包括塔吉特和家得宝在内的美国零售商也采取类似措施 [7] 腾讯AI业务重组 - 腾讯TEG成立大语言模型部和多模态模型部,探索AI前沿技术 [7] - 数据平台部调整为负责大模型数据全流程建设与管理 [7] - 机器学习平台部调整为负责统一的机器学习和大数据融合平台建设 [7] 英伟达中国业务传闻 - 传英伟达考虑在中国设立合资企业并可能拆分中国业务,以维护CUDA生态地位 [8] - 英伟达官方辟谣称传闻为假消息,相关说法无依据 [8] - 针对与DeepSeek合作开发定制芯片的传闻,英伟达也予以否认 [8] 饿了么外卖市场竞争 - 网传饿了么将加入外卖大战,正筹备百亿补贴活动 [8][10] - 有骑手群内消息证实此消息,并表示急需增加骑手 [8] - 饿了么研发团队近期高强度加班,疑似为新活动做准备 [8] 长城汽车超跑项目 - 长城CTO透露公司5年前已启动超跑项目,目标是打造惊艳产品 [10][11] - 项目遇到碳舱技术难题,已聘请欧洲纽伯格林赛道专家 [10] - 长城AI人才年薪最高可达400-500万现金,加上股票折现可达千万级别 [11] iPhone供应链现状 - iPhone包含2700个部件,由全球700多个生产基地生产 [15] - 仅30家苹果供应商完全在中国境外运营 [15] - 完全独立于中国的iPhone供应链几乎不可能实现 [15] OpenAI业务拓展 - ChatGPT新增购物功能,用户可通过自然语言搜索获取商品推荐 [16] - 功能覆盖时尚、美妆、家居和电子四大类,免费向所有用户开放 [16] - ChatGPT周搜索量已突破10亿次,公司正将其打造为超级应用 [16] 索尼业务重组 - 索尼考虑分拆半导体业务并推动独立上市,可能保留少数股权 [17] - 官方回应称目前无具体计划,但市场视为战略转型信号 [17] - 2023年索尼已宣布分拆金融服务子公司 [17] 特斯拉直销模式挑战 - 纽约州拟立法禁止特斯拉直销模式,该州电动车市场特斯拉占一半份额 [18] - 民主党议员称直销模式损害传统经销商利益 [18] - 分析指出直销模式是特斯拉核心竞争力之一 [18] 微软数据中心战略调整 - 微软冻结1.5GW自建数据中心计划,放弃超过2GW非约束性租赁合同 [18] - 仍持有超过5GW的约束性租赁合同,有效期至2028年 [18] - 加速自建数据中心布局,购置数万英亩土地 [18] AI人才流失问题 - OpenAI核心研究员Kai Chen因绿卡被拒离开美国,引发行业震动 [19] - 该研究员年薪62万至156万美元,是GPT-4.5核心开发者之一 [19] - OpenAI首席科学家警告美国正在驱逐最优秀AI人才 [19]
百度的后DeepSeek时代,一切为了应用
北京商报· 2025-04-27 17:50
百度AI开发者大会核心内容 - 百度创始人李彦宏强调大模型的终局是应用 提出"模型有很多 但统治这个世界的是应用"的观点 [2] - 百度发布从模型到应用 生态的"九件套" 包括性能提升价格下降的两款模型 数字人 智能体等 目的是降低模型成本提高能力并提供开发工具和平台 [2] - 2024年四季度有49个大模型发布 2025年一季度一周内行业共发布了8个模型 模型迭代速度极快 [2] 百度新发布的大模型 - 百度发布文心大模型X1 Turbo和4 5 Turbo 其中X1 Turbo是基于4 5 Turbo的深度思考模型 价格最高降了80% [3] - 两款模型都属于多模态 强推理 李彦宏判断"多模态将成为未来基础模型的标配 纯文本模型的市场会越变越小 多模态模型的市场会越来越大" [3] - 基础设施成本持续下降 创新的应用和产品才有可能出现 移动互联网已经证明了这一点 [3] 百度推出的应用开发工具 - 无代码编程工具秒哒向全社会开放 用户可以通过秒哒一句话生成应用 [4] - 通用智能体"心响"可以一站式解决用户复杂问题 以租房维权为例 会理清事件关键问题 寻找专家律师AI分身 提供专业建议并生成法律分析报告 [4] - 百度搜索宣布构建了MCP server的发现平台 可以索引全网市场上优质的server [4] 行业动态与趋势 - 阿里云百炼上线全生命周期MCP服务 腾讯云升级大模型知识引擎 支持调用MCP插件 [4] - 大模型出世之初 业界就提出所有应用重新做一遍 从基础设施到企业端应用端接受度来说 成熟度上了一个台阶 [4] - 科技大厂有多重身份 既是AI基础设施服务商 也是应用开发商 同时提供开发工具 跟开发商是竞合关系 [3]
GPU租赁价格调研
是说芯语· 2025-04-27 14:54
行业趋势总览 - AI与云计算产业形成紧密飞轮效应,核心逻辑为技术迭代、应用扩展和算力需求的正反馈循环[4] - AI大模型能力快速提升(如Qwen3、Llama4多模态升级与逻辑推理优化),推动AI从辅助工具向核心生产力渗透[4] - 云服务商通过硬件性能优化和规模效应降低成本,如阿里云第九代ECS实例算力提升20%而价格下降5%[4] - AI应用向企业级和消费级市场双向渗透,如谷歌Gemini 2.5 Pro在复杂推理任务中超越人类表现,阿里Qwen2.5-Omni实现手机端全模态交互[4] - 模型效率提升降低单次推理算力消耗,但用户规模与调用频次指数级增长导致整体算力需求激增,H100 GPU租赁价月涨22%,北美IDC租金涨幅超60%[4] 云服务商技术升级与竞争格局 - 头部厂商通过差异化技术路径构建护城河:阿里云以全栈能力覆盖为核心策略,第九代ECS实例通过AMX加速技术提升AI预处理效率20%,CPFS文件存储吞吐达40GB/s,PAI平台响应时间降低92%[5] - 阿里云"灵骏"集群故障自愈能力将万卡训练有效时长提升至93%,降价5%策略牺牲短期利润换取客户黏性[5] - 华为云聚焦架构创新与行业纵深,CloudMatrix 384超节点实现3倍于传统服务器的GPU密度,盘古大模型在400余个场景落地[5] - AWS等国际厂商H100调用价格两周内跳涨22%,反映全球算力供需失衡[5] AI模型进展与多模态突破 - AI模型迭代进入"多模态+深度思考"双轮驱动阶段,Qwen3与Llama4即将发布,补强逻辑推理与语音交互能力[7] - 阿里Qwen2.5-Omni以7B小参数量实现文本、图像、语音、视频四模态端到端处理,打破传统多模态模型对高算力依赖[7] - 谷歌Gemini 2.5 Pro"人类最后考试"得分18.8%,验证复杂推理能力在专业场景潜力[7] - GPT-4o图像生成精度提升瞄准企业级设计、营销等高频刚需[7] 算力需求激增与产业链价格传导 - 推理端对高性能计算的刚性需求与供给端结构性短缺矛盾驱动算力需求井喷,阿里、腾讯2024Q4资本开支同比增幅超250%[8] - AWS H100调用价格两周内跳涨22%,英伟达H20芯片8卡服务器单价从100万元飙升至110万元,涨幅10%[10] - 北美数据中心上架率超95%,IDC租金同比最高上涨60%[10] - 中国市场AI专用数据中心改造升级推高单位机柜成本,国产算力卡尚未完全填补英伟达断供缺口[12] - 算力租赁模式兴起,CoreWeave H100服务器租赁价格两年内上涨29%[13]
GPU租赁价格调研
傅里叶的猫· 2025-04-26 19:15
行业趋势总览 - AI与云计算产业形成紧密的飞轮效应,核心逻辑在于技术迭代、应用扩展和算力需求的正反馈循环 [3] - AI大模型能力快速提升(如Qwen3、Llama4的多模态升级与逻辑推理优化),推动AI从辅助工具向核心生产力渗透 [3] - 阿里云第九代ECS实例算力提升20%而价格下降5%,通过硬件性能优化和规模效应降低AI开发门槛 [3] - 谷歌Gemini 2.5 Pro在复杂推理任务中超越人类表现,阿里Qwen2.5-Omni实现手机端全模态交互,显示AI应用向企业级和消费级市场双向渗透 [3] 技术降本与需求扩张的矛盾 - 模型效率提升(如GPT-4o响应速度优化)降低单次推理算力消耗,但用户规模与调用频次指数级增长导致整体算力需求激增 [4] - H100 GPU租赁价月涨22%,北美IDC租金涨幅超60%,算力资源从过剩周期转入稀缺周期 [4] - 头部云厂商通过架构创新(如华为CloudMatrix超节点)和生态绑定(阿里"繁花计划")试图平衡供给缺口,但短期内供需错配仍将主导市场 [4] 云服务商技术升级与竞争格局 - 阿里云以全栈能力覆盖为核心策略,第九代ECS实例通过AMX加速技术提升AI预处理效率20%,CPFS文件存储吞吐达40GB/s,PAI平台响应时间降低92% [5] - 华为云聚焦架构创新与行业纵深,CloudMatrix 384超节点实现3倍于传统服务器的GPU密度,盘古大模型在400余个场景落地 [6] - AWS等厂商H100调用价格两周内跳涨22%,反映全球算力供需失衡,通用云服务商因架构灵活性不足面临溢价能力下降 [6] AI模型进展与多模态突破 - Qwen3与Llama4即将发布,补强逻辑推理与语音交互能力,阿里Qwen2.5-Omni以7B小参数量实现四模态端到端处理,打破传统多模态模型对高算力的依赖 [7] - 谷歌Gemini 2.5 Pro凭借18.8%的"人类最后考试"得分验证复杂推理能力,GPT-4o图像生成精度提升瞄准企业级设计、营销等高频刚需 [7] - 多模态模型数据处理复杂度激增导致训练成本指数上升,消费端付费意愿尚未匹配成本曲线,可能催生"轻量化多模态+垂直场景付费"的混合商业模式 [8] 算力需求激增与产业链价格传导 - 阿里、腾讯2024Q4单季度资本开支同比增幅超250%,数据中心硬件采购放量引发全链条价格上行 [10] - AWS H100调用价格两周内跳涨22%,英伟达H20芯片8卡服务器单价从100万元飙升至110万元,涨幅达10%,二手市场A100芯片价格上涨15% [11] - 北美数据中心上架率超95%,IDC租金同比最高上涨60%,中国市场AI专用数据中心改造升级推高单位机柜成本 [11][15] 算力租赁市场动态 - CoreWeave等专业厂商H100服务器租赁价格两年内上涨29%,NVIDIA HGX H100租赁价格为每小时49.24美元 [21] - 算力租赁模式可持续性依赖于下游应用端付费能力同步提升,若AI应用商业化滞后于算力成本攀升,租赁市场可能出现价格泡沫 [17]
540亿商汤,甩出一张新牌
21世纪经济报道· 2025-04-15 10:35
商汤科技发布日日新V6大模型 - 公司正式发布全新升级的"日日新SenseNova V6"大模型体系 以"多模态"为关键词 是今年AI产业的重头戏 [2] - 日日新V6是拥有超6000亿参数的MoE原生多模态通用大模型 凭借单一模型可完成文本、多模态等各类任务 [2] - 公司从去年5、6月开始探索多模态 9、10月技术路线基本跑通 专注多模态推理而非纯文本赛道竞争 [2] 技术能力突破 - 长思维链:超过200B高质量多模态长思维链数据 最长64K思维链 [3] - 数理能力:数据分析能力大幅领先GPT-4o [3] - 推理能力:多模态深度推理国内第一 对标OpenAI o1 [3] - 全局记忆:率先在国内突破长视频理解 支持10分钟视频理解及深度推理 计划2025年实现1小时视频理解 [3][4] 战略布局 - 公司提出"大装置-大模型-应用"三位一体战略 聚焦主业 边缘业务以生态方式孵化 [4] - 目标成为"最懂算力的大模型服务商"和"最懂大模型的算力服务商" 打造端到端竞争力 [4] - 截至4月14日收盘 公司市值超540亿港元 [4] 应用方向 - 提供生产力工具 切入金融、政务、企业等高价值业务环境 提升效率、优化流程、改善体验 [5] - 提供交互工具 包括智能陪伴、智能硬件交互、智能营销等 改善人机交互体验 增强用户粘性 [5] 行业趋势 - 开源模型与工具渐成主流 [5] - 性价比是所有大模型应用的生死线 [5] - 多模态成为最新技术焦点 将打开更多新应用场景和新硬件形态 [5]
Meta,最新发布!“多模态性最强模型”
券商中国· 2025-04-06 14:10
文章核心观点 Meta推出开源人工智能模型Llama 4,是应对新兴开源势力的“回击”,推动开源模型技术发展和生态完善,当前大模型竞争趋于白热化,行业进入推理强化和应用拓展阶段 [2][8] 大规模、多模态、长文本的Llama 4发布 - Meta于4月6日凌晨发布Llama 4系列首批模型,包括Llama 4 Scout、Llama 4 Maverick,还预览了Llama 4 Behemoth [3] - Llama 4是Llama系列中首批采用混合专家(MoE)架构的模型,与传统稠密模型相比,训练和推理计算效率更高 [3] - Llama 4参数规模大,Llama 4 Scout有1090亿参数、170亿激活参数量;Llama 4 Maverick有4000亿参数、170亿激活参数量;Llama 4 Behemoth总参数高达2万亿,有2880亿激活参数量 [4] - Llama 4多模态能力突出,采用早期融合技术,用无标签文本、图片和视频数据预训练,实现文本和视觉token无缝整合 [4] - Llama 4用图像和视频帧静止图像训练,支持多图像输入与文本提示交互,预训练最多用48张图像,后训练测试最多8张图像 [5] - Llama 4长文本能力有突破,Llama 4 Scout支持高达1000万token的上下文窗口,处理长文档等任务表现出色 [5] 大模型竞争趋于白热化 - Meta于2022年推出Llama系列模型,2023年开源Llama 2并可免费商用,2024年4月发布Llama 3,实现多模态处理能力 [6] - DeepSeek崛起冲击Meta在开源模型社区的领先地位,1月末有爆料称DeepSeek - V3让Llama模型相形见绌,Meta工程师分析其技术 [7] - 阿里通义千问系列开源大模型表现出色,Qwen2.5 - Omni登上Hugging Face大模型榜单总榜榜首,千问衍生模型数量超Llama系列 [7] - OpenAI计划几周后发布推理模型o3和基座模型o4 - mini,几个月后推出GPT - 5 [8] - DeepSeek与清华团队发布论文,成果被视为下一代推理模型R2的重要技术铺垫 [8] - 大模型竞争进入推理强化和应用拓展阶段,个人智能体潜力显现,开源开放成核心竞争力,大算力等成发展趋势 [8]
“计算机视觉被GPT-4o终结了”(狗头)
量子位· 2025-03-29 15:46
GPT-4o多模态图像生成技术突破 - GPT-4o原生多模态图像生成能力被开发出多种新玩法,包括将表情包转化为语义分割图和深度图[2][3][4] - 该技术对传统AI画图工具、设计师和计算机视觉研究领域产生颠覆性影响[6] - 在自动驾驶领域展现潜力,能识别特斯拉自动驾驶系统无法识别的伪装"隐形墙"[8] 技术实现路径争议 - 应用研究主管提出自动驾驶领域只需训练强大基础模型后微调即可实现[10] - 反对观点认为Stable Diffusion+ControlNet已具备同等能力[11] - 技术突破关键在于通过扩大基础模型规模实现意想不到的效果[12] 模型架构技术细节 - GPT-4o图像生成采用原生嵌入ChatGPT的自回归模型,与DALL·E的扩散模型不同[13][15] - 推测采用多尺度自回归组合技术,首先生成粗略图像再逐步填充细节[17] - 存在争议观点认为解码阶段可能仍使用扩散模型,参考Meta 24年8月论文提出的多模态模型同时预测token和扩散图像的方法[20][24] 行业活动信息 - 中国AIGC产业峰会将于4月16日在北京举行,汇聚百度、无问芯穹等AI领域企业[26]
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
量子位· 2025-03-25 08:59
西风 发自 凹非寺 量子位 | 公众号 QbitAI 就在DeepSeek-V3更新的同一夜,阿里通义千问Qwen又双叒叕一次梦幻联动了—— 发布 Qwen2.5-VL-32B-Instruct 。 此前开源家族视觉语言模型Qwen2.5-VL包括3B、7B和72B三种尺寸。 这一次的32B版本进一步兼顾尺寸和性能,可在本地运行。 同时经过强化学习优化,在三个方面改进显著: 对比近期开源的Mistral-Small-3.1-24B 、Gemma-3-27B-IT等, Qwen2.5-VL-32B在纯文本能力上也达到了同规模的SOTA表现。在多个基 准上,Qwen2.5-VL-32B甚至超过了72B。 举个栗子,比如根据一张交通指示牌照片,Qwen2.5-VL-32B就能做如下精细的图像理解和推理: 我正在这条路上驾驶一辆大卡车,现在12点了。我能在13点之前到达110公里远的地方吗? Qwen2.5-VL-32B首先对时间、距离、卡车限速进行分析,然后分步骤条理清晰推算出正确答案: 回答更符合人类偏好; 拥有更强的数学推理能力; 在图像解析、内容识别以及视觉逻辑推导等任务中,表现出更强的准确性和细粒度分析能力 ...
智谱上线GLM-4-Voice端到端情感语音模型:迈向AGI之路的最新一步
IPO早知道· 2024-10-26 10:12
智谱GLM-4-Voice模型发布 - 智谱于10月25日上线GLM-4-Voice端到端情感语音模型,具备情感表达、语速调节、多语言支持和随时打断等功能 [3] - 模型采用端到端架构,避免了传统"语音转文字再转语音"级联方案的信息损失和误差积累 [3] - 支持中英文及中国各地方言,尤其擅长粤语、重庆话、北京话等 [3] - 即将上线视频通话功能,实现"能看又能说"的AI助理 [3] - 这是智谱首个开源的端到端多模态模型,延续了"发布即开源"的风格 [2][3] GLM-4-Plus基座模型能力 - GLM-4-Voice的推出标志着智谱在迈向AGI道路上的最新进展 [4] - 背后依托新的基座模型GLM-4-Plus,其语言文本能力与GPT-4o及405B参数的Llama3.1相当 [4] - 基于GLM-4-Plus,智谱在多模态领域取得阶段性成果,使GLM多模态模型家族更加完整 [4] 模型功能特点 - 情感表达和共鸣:支持高兴、悲伤、生气、害怕等细腻情感变化 [3] - 实时交互能力:可随时打断并调整语音输出的内容和风格 [3] - 语速调节:在同一轮对话中可要求加快或放慢语速 [3]