Workflow
大语言模型
icon
搜索文档
民营经济促进法获通过,一季度理财规模缩水 | 财经日日评
吴晓波频道· 2025-05-01 03:21
民营经济促进法 - 十四届全国人大常委会第十五次会议表决通过民营经济促进法 自2025年5月20日起施行 共9章78条 包括公平竞争 投资融资促进 科技创新等章节 [2] - 作为我国第一部专门关于民营经济发展的基础性法律 将进一步优化民营经济发展环境 保证各类经济组织公平参与市场竞争 [2] - 法律需要给予民营企业被保护的安全感 同时重视民企的实际经营需求 内容需随发展调整完善 [2] 制造业PMI数据 - 4月份制造业PMI为49% 比上月下降1.5% 非制造业商务活动指数为50.4% 比上月下降0.4% [3] - 构成制造业PMI的5个分类指数中 仅供应商配送时间指数高于临界点 高技术制造业PMI为51.5% [3] - 4月外贸摩擦影响显现 出口需求回落成为拖累PMI最大因素 内需修复对冲效果有限 [4][5] 贵州茅台业绩 - 一季度实现营业总收入514.43亿元 同比增长10.67% 归母净利润268.47亿元 同比增长11.56% [6] - 酱香系列酒营收70.22亿元 同比增长18.30% 海外市场营收11.19亿元 同比增长37.53% [6] - 3月末现金及现金等价物余额1765.48亿元 较年初增长3.87% [6] 腾讯AI布局 - 重构混元大模型研发体系 成立大语言模型部和多模态模型部 分别负责不同技术方向 [8] - 加强数据平台部和机器学习平台部建设 为AI模型训练提供全面高效的PaaS平台底座 [8] - 调整后研发体系以技术驱动 资源集中使用 提升训练效率 [8][9] 亚马逊关税争议 - 考虑在Haul平台显示关税附加费 直接向消费者展示特朗普关税政策影响 [10] - 该计划遭到特朗普政府猛烈抨击 亚马逊表示从未获得批准实施 [10] - 关税政策使美国企业面临两难境遇 政府施压加剧企业和消费者困境 [11] 外资券商发展 - 瑞银证券变更为外国法人独资 成为第五家外资全资控股券商 [12] - 瑞银集团持股比例由67%增至100% 多家外资券商加速布局中国市场 [12] - 金融对外开放步伐稳健 外资参与度提升有助于国内产业转型升级 [12][13] 理财市场动态 - 一季度末理财产品存续规模29.14万亿元 较2024年末减少约8100亿元 [14] - 4月第三周理财规模较前一周上升约3200亿元 呈现恢复态势 [14] - 一季度债市波动拖累理财产品收益 开放式固收类产品近1个月年化收益率平均2.24% [14] 股市行情 - 4月30日沪深两市成交额1.17万亿 较上个交易日放量1472亿 [16] - 全市场超3400只个股上涨 机器人 算力 华为概念股表现活跃 [16] - 银行板块调整 电力 钢铁 港口等板块跌幅居前 [16][17]
从论文中积累复现 R1 的 insight
理想TOP2· 2025-04-30 21:04
算法改进与优化 - GRPO算法存在响应级长度偏差和问题级难度偏差,导致生成错误响应 Dr. GRPO通过去除归一化项、采用蒙特卡罗回报估计优势等方法,有效避免优化偏差,提升令牌效率并维持推理性能 [3][4] - DAPO方法解决GRPO和PPO在大语言模型强化学习中的熵坍缩、样本效率低等问题 Clip-Higher技术提高低概率token概率提升空间,动态采样过滤无效样本,Token-Level Policy Gradient Loss优化长思维链场景训练 [6] 强化学习超参数设置 - 较大Train Batch Size(如TBS=1024)增强训练效率与稳定性 On-policy策略相比Off-policy更具优势,促进模型探索 Tollout Times增加(如n=64)提升训练效果,Rollout Temperature为1.2时性能更佳 KL惩罚系数采用动态退火策略(从KL=1×10⁻³到KL=0余弦衰减)平衡探索与稳定性 [6] 奖励机制设计 - 早期奖励规则不完善导致模型出现多种reward hacking行为 迭代完善规则设计后,要求模型按特定格式输出并构建规则式奖励系统,格式正确得1分错误得-1分,答案完全正确得2分部分错误得-1.5分 [6] - ruled-based reward相比reward model更不易受reward hacking影响 在业务没有明确答案时,建议结合ruled-based数据(如数学、编程任务)与reward model一起训练 [9] 推理能力发展特点 - 推理能力提升是渐进过程,没有明显的"顿悟时刻" 模型在训练前已具备复杂推理行为(如反思、验证),后续提升呈渐进趋势 [5][6] - 增加回答长度与推理性能提升相关但非因果关系 响应长度增加可能提供更多探索空间,但核心提升源于对有效推理步骤的优化 通常response越长准确性越低,因难题需要更长推理 [5][6] 强化学习泛化效应 - RL相比SFT更能促进泛化 在逻辑题上使用RL对数学题也有提升,表明推理可能是模型的通用能力 [7][9]
沉浸式翻译团队新品:BabelDOC PDF,无损翻译 PDF,免费用户可用
Founder Park· 2025-04-30 20:31
产品发布与市场表现 - BabelDOC PDF工具开源后冲进Github全站全开发语言Trending榜前三[2] - 新增多语种支持功能 支持拉丁字母语言与简繁中文/日文/韩文互译[2] - 免费用户每月1000页解析额度 Pro用户可达10000页 分别使用GLM-4-FLASH和DeepSeek翻译模型[3] 技术实现原理 - 采用AI布局识别技术 完整解析PDF结构包括图表/脚注/公式等非文本元素[7] - 翻译流程分为四步:布局识别→文本提取→样式匹配→智能渲染[7][8][9][11] - 特殊处理机制:富文本部分翻译 数学公式保留原字符形式[10] - 最终实现像素级版式对齐 保持学术论文/招股书等专业文档的原始布局[7] PDF格式特性分析 - PDF由Adobe联合创始人John Warnock发明 核心解决跨设备显示一致性问题[13] - 2008年成为ISO国际标准(ISO 32000-1:2008) 相比DOCX具有固定格式/强兼容性/高安全性等优势[13][14] - 文件结构呈树形分布:文件头尾(二进制标识)→交叉引用表(资源定位)→页面树(元素引用)→内容流(绘制指令)[16][18][19] 行业生态建设 - Founder Park搭建AI产品市集社群 提供新品资讯/邀请码/曝光渠道等资源[4]
新华财经早报:4月30日
新华财经· 2025-04-30 10:13
金融行业 - 何立峰指出要强化上海金融开放枢纽门户功能,增强人民币资产全球配置和风险管理中心地位,推动上海国际金融中心建设取得新突破 [2][4] - 三部门开展市场准入壁垒清理整治行动,清理整改不合理规定和做法,营造公平市场准入环境 [2][4] - 国家发展改革委追加下达810亿元超长期特别国债资金支持消费品以旧换新 [2][4] - 3月债券市场共发行各类债券87356.6亿元,截至3月末托管余额183.1万亿元 [4] - 财政部拟5月9日续发行710亿元30年期2025年超长期特别国债(二期) [4] - 五大行董事会通过修改公司章程并撤销/不再设立监事会议案,尚需股东大会审议 [2][4] - 中国人民银行召开会议部署金融“五篇大文章”统计制度落地工作 [4] - 北京证监局称2024年辖区200余家公司发行公司债券和ABS募资9000余亿元,同比增长9% [4] - 港交所与香港证监会为“中概股”回流提供指引协助,推进全面上市制度检讨 [4] 钢铁行业 - 一季度重点统计会员钢铁企业累计营业收入14360亿元,同比下降6.61%;营业成本13505亿元,同比下降7.73%;利润总额215.83亿元,同比增长1.08倍 [4] 铁路运输行业 - 铁路五一假期运输4月29日启动,8天预计发送旅客1.44亿人次,同比增长4.9% [4] 白酒行业 - 贵州茅台一季度营业总收入514.43亿元,同比增长10.67%;归母净利润268.47亿元,同比增长11.56%;酱香系列酒营收70.22亿元,同比增长18.30%;海外营收11.19亿元,同比增长37.53% [2][5] - 山西汾酒季度净利润同比增长6.15%至66.48亿元 [8] 房地产行业 - 万科A一季度营收379.95亿元,同比下降38.31%;净利润-62.46亿元;拟出售0.61%总股本的A股库存股;第一大股东提供33亿元借款;拟更换审计机构 [5] 家电行业 - 美的集团拟分拆安得智联至香港联交所主板上市,季度净利润同比增38.02%至124.22亿元 [5][8] - 海尔智家季度净利润同比增长15.09%至54.87亿元 [8] 科技行业 - 腾讯重构混元大模型研发体系,成立大语言模型部、多模态模型部等新部门 [5] - 杰华特筹划发行H股股票并在香港联交所主板挂牌上市 [5] - 广合科技拟发行H股股票并在香港联交所主板上市 [5] - 剑桥科技已就H股IPO递表 [5] - 工业富联季度净利润同比增长24.99%至52.31亿元 [8] - 韦尔股份季度净利润同比增长55.25%至8.66亿元 [8] 能源行业 - 国家发展改革委、国家能源局印发《电力辅助服务市场基本规则》,提出完善现货市场规则等内容 [4] - 中国石油季度净利润同比增长2.3%至468.09亿元 [8] 汽车行业 - 上汽集团季度净利润同比增长11.40%至30.23亿元 [8] - 三一重工季度净利润同比增长56.40%至24.71亿元 [8] - 塞力斯季度净利润同比增长240.60%至7.48亿元 [8] - 九号公司季度净利润同比增长236.22%至4.56亿元 [8] 旅游零售行业 - 中国中免季度净利润同比下降15.98%至19.38亿元 [8] 金融服务行业 - 国泰海通季度扣非后净利润同比增长60.65% [8] 电力行业 - 长江电力季度净利润同比增长30.56%至51.81亿元 [8]
沃尔玛态度转变:恢复中国供应商出货,美国客户承担关税成本;传饿了么加入外卖大战;因未按时公示年报,引望公司被列为经营异常
雷峰网· 2025-04-30 08:30
中国半导体设备产业整合 - 中国计划将200多家半导体设备公司整合为10家大型企业,以提升产业竞争力应对美国制裁 [3] - 中国半导体自给率目前约为23%,产业整合旨在提高自给率 [3][5] - 北方华创已开始行动,以16.9亿元收购芯源微9.5%股份,并计划扩大持股以获得经营权 [3] 沃尔玛供应链调整 - 沃尔玛通知中国供应商恢复发货,并明确关税成本由美国客户承担 [7] - 此前沃尔玛曾要求中国供应商承受高达10%的降价幅度以转嫁20%关税成本 [7] - 包括塔吉特和家得宝在内的美国零售商也采取类似措施 [7] 腾讯AI业务重组 - 腾讯TEG成立大语言模型部和多模态模型部,探索AI前沿技术 [7] - 数据平台部调整为负责大模型数据全流程建设与管理 [7] - 机器学习平台部调整为负责统一的机器学习和大数据融合平台建设 [7] 英伟达中国业务传闻 - 传英伟达考虑在中国设立合资企业并可能拆分中国业务,以维护CUDA生态地位 [8] - 英伟达官方辟谣称传闻为假消息,相关说法无依据 [8] - 针对与DeepSeek合作开发定制芯片的传闻,英伟达也予以否认 [8] 饿了么外卖市场竞争 - 网传饿了么将加入外卖大战,正筹备百亿补贴活动 [8][10] - 有骑手群内消息证实此消息,并表示急需增加骑手 [8] - 饿了么研发团队近期高强度加班,疑似为新活动做准备 [8] 长城汽车超跑项目 - 长城CTO透露公司5年前已启动超跑项目,目标是打造惊艳产品 [10][11] - 项目遇到碳舱技术难题,已聘请欧洲纽伯格林赛道专家 [10] - 长城AI人才年薪最高可达400-500万现金,加上股票折现可达千万级别 [11] iPhone供应链现状 - iPhone包含2700个部件,由全球700多个生产基地生产 [15] - 仅30家苹果供应商完全在中国境外运营 [15] - 完全独立于中国的iPhone供应链几乎不可能实现 [15] OpenAI业务拓展 - ChatGPT新增购物功能,用户可通过自然语言搜索获取商品推荐 [16] - 功能覆盖时尚、美妆、家居和电子四大类,免费向所有用户开放 [16] - ChatGPT周搜索量已突破10亿次,公司正将其打造为超级应用 [16] 索尼业务重组 - 索尼考虑分拆半导体业务并推动独立上市,可能保留少数股权 [17] - 官方回应称目前无具体计划,但市场视为战略转型信号 [17] - 2023年索尼已宣布分拆金融服务子公司 [17] 特斯拉直销模式挑战 - 纽约州拟立法禁止特斯拉直销模式,该州电动车市场特斯拉占一半份额 [18] - 民主党议员称直销模式损害传统经销商利益 [18] - 分析指出直销模式是特斯拉核心竞争力之一 [18] 微软数据中心战略调整 - 微软冻结1.5GW自建数据中心计划,放弃超过2GW非约束性租赁合同 [18] - 仍持有超过5GW的约束性租赁合同,有效期至2028年 [18] - 加速自建数据中心布局,购置数万英亩土地 [18] AI人才流失问题 - OpenAI核心研究员Kai Chen因绿卡被拒离开美国,引发行业震动 [19] - 该研究员年薪62万至156万美元,是GPT-4.5核心开发者之一 [19] - OpenAI首席科学家警告美国正在驱逐最优秀AI人才 [19]
中科金财(002657) - 002657中科金财投资者关系管理信息20250429
2025-04-29 22:40
公司活动信息 - 活动类别为业绩说明会,时间是2025年4月28日,地点是中国证券报•中证路演中心线上会议 [1] - 上市公司参与人员有董事长兼总经理朱烨东、财务总监朱烨华、董事会秘书王姣杰、独立董事季成,外部参与人员是通过中证路演中心参与的广大投资者 [1] AI业务战略规划与进展 - 2025年坚持以金融科技、数据中心及人工智能解决方案为基础,与龙头企业合作,加大在AI Agent、多模态应用、云服务等领域研发投入,拓展金融等行业应用,AI Agent已有订单落地 [1][2] - 以打造多任务、复杂任务智能体为目标,构建技术架构体系,形成AI Agent开发运行平台及多种覆盖银行前、中、后台业务场景的AI Agent产品 [2] AI应用订单与营收情况 - 微短剧领域形成相关产品和解决方案,参与出品微短剧并提供AI技术服务,相关收入占公司整体营业收入比例较小,2025年将加大多模态应用等领域投入 [3] - 2024年人工智能综合服务毛利率为20.70%,2024年四季度AI营收大增2亿,2025年一季度人工智能综合服务营收同比有所增长 [4] 公司营收季节性与业绩情况 - 公司客户采购遵循特定程序,营收呈现季节性,通常第四季度较为集中,2024年第四季度营收增长86%实现扭亏为盈,2025年一季度亏损增加 [4] 金融科技领域成果 - 累计服务国内外银行客户500余家,业务覆盖约5万个银行营业网点,已形成227项软件著作权、13项发明专利,助力银行实现全业务链智能化跃迁 [5] 公司合作情况 - 是阿里云合作伙伴及公共云AI大模型框架服务商,联合阿里云发布智能体解决方案,成为阿里云金融先锋联盟成员单位,建立多层次生态合作模式 [6] 人工智能领域布局与成果 - 搭建覆盖算力基础设施、AI算法、大模型、多模态应用、AI Agent的产业布局,已获得135项软件著作权、4项发明专利 [7] 研发费用情况 - 2025年一季度研发费用4,647万元,去年同期3,785万元,同比增长22.77%,研发投入主要集中在多模态、AI Agent、大语言模型等方向 [7][8]
对谈 Pokee.ai 朱哲清:强化学习做核心,Agent 的少数派造法
晚点LatePost· 2025-04-29 16:43
AI Agent技术路径 - 主流AI Agent以大语言模型(LLM)为核心大脑进行任务规划和工具调用[3] - Pokee.ai提出替代方案:强化学习模型负责任务规划执行,LLM仅作为人机交互界面[3][7] - LLM作为核心的局限:工具调用超过50个易产生幻觉,因上下文长度限制[7] - LLM方案成本高:多步交互单次消耗数百万Token,成本达几到几十美元[3] 强化学习方案优势 - 强化学习模型通过self-play训练掌握工具使用,已见过15000个工具[4][18] - 参数量更小:任务完成时间仅需几分钟,成本为同类产品的1/10[4][15] - 决策效率高:一次规划多步操作,避免LLM需反复扫描上下文的缺陷[10] - 思维模式差异:强化学习可能跳出人类思维框架,找到非传统解决方案[11][12] Pokee产品特性 - 直接调用平台数据接口:已打通Facebook/Google/Amazon等数千接口[15] - 开发新协议:简化工具调用流程,开发者只需声明输入输出和唤起方式[4][17] - 目标用户定位:先服务营销/运营等专业用户,再拓展企业客户[16][17] - 产品设计理念:最小化人工干预,支持全自动和分步确认两种模式[17] 市场竞争与行业趋势 - 预计未来一年将出现10家通用Agent公司,最终存活3-4家[19] - 强化学习技术复兴:DeepSeek R1模型验证了强化学习潜力[21] - 地域发展差异:北美开放生态更利于通用Agent发展,中国互联网较封闭[21] - 商业化路径:通过绑定用户工作流建立壁垒,技术优势需转化为使用习惯[17]
阿里Qwen3系列开源:混合推理模式、性能超越DeepSeek R1
Founder Park· 2025-04-29 11:16
以下文章来源于赛博禅心 ,作者金色传说大聪明 赛博禅心 . 拜AI古佛,修赛博禅心 今天凌晨,Qwen3 发布。 本次共开源 8 款模型,包括 2 款 MoE 模型、6 款 Dense 模型。 Qwen3 系列 在代码、数学、通用能力等方面能力表现优异, 其中 235B 版本,在基 准测试上的水平超过了 671B 的 DeepSeek R1 。 同时, Qwen3 引入了「 思考模式/非思考模式 」无缝切换的功能。 在 思考模式下, 模型逐步推理,经过深思熟虑后给出最终答案。非思考模式 下,能够 提供快速的即时响应,适用于简单问题的回答。混合推理的模式平衡了算力和输出效果。 此外, Qwen3 系列提高了 Agent 能力, 同时也加强了对 MCP 的支持。Qwen 配套了一个 Qwen-Agent 项目,可以使用 API 进行工具调用, 或结合现有的工具链进行扩展。 | | | Qwen3 | | | | | | --- | --- | --- | --- | --- | --- | --- | | | | 通义千问最新一代大模型:采用混合专家架构,具备思考与快速回答双模式,支持119种语言 | | | | ...
Qwen3深夜正式开源,小尺寸也能大力出奇迹。
数字生命卡兹克· 2025-04-29 08:05
小道消息一直在说,昨天深夜或者今天凌晨,阿里会发Qwen3。 然后我特意早早的睡了一两小时,凌晨1点起床,就为了等Qwen3发。 结果这一等,就是好几个小时。。。 不过,功夫不负有心人。 凌晨5点,我眼睛都睁不开的时候,终于等到了。 Qwen你赔我睡眠。。。 把报告看完,我总结一下,觉得最大的亮点有6个: 1. 模型能力登顶全球,这个没啥可说的,就是No.1。 2. 第一个开源的混合推理模型。 3. 8个不同尺寸的模型,几乎覆盖了所有场景。 4. 成本很低, 旗舰模型235B参数部署成本只要DeepSeek R1的三分之一。 5. 支持MCP协议。 6. 居然还支持了119种语言。 一起说吧。 就像我们其实都知道,DeepSeek这个深度思考,你打开的时候,是R1模型,但是你关掉,其实用的是v3来给你回答。 但是Qwen3,是一体的。 是一个模型,只不过支持了两种模式,这个不管对于开发者还是使用者,都方便很多。 这次发了8个模型,Qwen3-0.6B、1.7B、4B、8B、14B、32B,这6个都是Dense稠密模型。 还有两个重量级MoE模型,Qwen3-30B-A3B,和旗舰版的Qwen3-235B-A2 ...
阿里Qwen3深夜开源,8款模型、集成MCP,性能超DeepSeek-R1,2小时狂揽16.9k星
36氪· 2025-04-29 07:23
文章核心观点 阿里云开源Qwen3系列模型,该系列模型具有多种特性和优势,在性能上表现出色,未来将围绕多维度提升能力以适应AI产业发展[2][24] 模型发布情况 - 4月29日凌晨4点阿里云正式开源Qwen3系列模型,包含2个MoE模型、6个稠密模型,发布2小时在GitHub上star数超16.9k [2] - Qwen3系列模型已在Hugging Face、ModelScope和Kaggle等平台开源,均遵循Apache 2.0许可证 [7] 模型特性 - 有8种参数大小的稠密与MoE模型,分别为0.6B、1.7B、4B、8B、14B、32B、Qwen3 - 235B - A22B(2350亿总参数和220亿激活参数)、Qwen3 - 30B - A3B(300亿总参数和30亿激活参数) [4] - 引入混合思考模式,用户可切换“思考模式”“非思考模式”控制思考程度,思考模式适用于复杂问题,非思考模式适用于对响应速度敏感的问题,还能增强模型实施稳定和高效思考预算控制的能力 [4][15][16] - 推理能力提升,在数学、代码生成和常识逻辑推理方面超越QwQ(在思考模式下)和Qwen2.5 instruct models(在非思考模式下) [4] - 支持MCP(模型上下文协议),Agent能力提升,可在思考和非思考模式下实现大语言模型与外部数据源和工具的集成并完成复杂任务 [4] - 支持119种语言和方言,具备多语言理解、推理、指令跟随和生成能力 [4] 模型性能 - 旗舰模型Qwen3 - 235B - A22B在编程、数学、通用能力等基准评估中表现优于DeepSeek - R1、OpenAI o1、OpenAI o3 - mini、Grok - 3和Gemini - 2.5 - Pro等业界知名模型 [3] - 小型MoE模型Qwen3 - 30B - A3B在激活参数是QwQ - 32B的1/10的情况下实现性能反超,参数规模更小的Qwen3 - 4B模型实现了与Qwen2.5 - 72B - Instruct的性能相当 [11] - Qwen3 - 1.7B/4B/8B/14B/32B - Base的性能分别与Qwen2.5 - 3B/7B/14B/32B/72B - Base相当,在STEM、编程和推理等领域,Qwen3稠密模型的性能甚至优于参数规模更大的Qwen2.5系列模型 [13] 模型上下文长度 - 6个稠密模型中,0.6B~4B参数规模的模型上下文长度为32K,8B~32B参数规模的模型上下文长度为128K,2个MoE模型的上下文长度均为128K [8][10] 模型部署 - 建议开发者使用SGLang和vLLM等框架,本地部署的开发者使用Ollama、LMStudio、MLX、llama.cpp等工具 [9] 预训练与后训练 - 与Qwen2.5相比,Qwen3的预训练数据集大小翻了两倍,Qwen2.5在1800亿个token上预训练,Qwen3基于约3600亿个token预训练,研发人员收集多种数据并使用Qwen2.5相关模型处理数据,还生成合成数据增加数学和代码数据量 [20] - 预训练分三个阶段,第一阶段在超3000亿个token上预训练,上下文长度4K;第二阶段增加知识密集型数据比例,在额外500亿个token上预训练;第三阶段用高质量长上下文数据将上下文长度扩展到32K [21] - 后训练采取四阶段训练流程,包括思维链(CoT)冷启动、基于推理的强化学习、思维模式融合、通用强化学习,以开发既能逐步推理又能快速响应的混合模型 [21][23] 未来发展 - 未来将围绕优化模型架构和训练方法,实现扩展数据规模、增加模型大小、延长上下文长度、拓宽模态的目标,并通过环境反馈推进长期推理的强化学习 [24]