Workflow
自然语言处理
icon
搜索文档
奥特曼和纳德拉,艰难重组后首次对谈:「我们是天作之合」
36氪· 2025-11-03 08:23
微软与OpenAI合作关系 - 双方庆祝达成一项里程碑式的深度合作协议,旨在重塑AI未来 [3] - 合作关系始于2019年微软对OpenAI的10亿美元投资和Azure云计算资源支持 [5] - 微软首席执行官纳德拉慧眼识珠,看到了自然语言处理技术的新曙光 [7] OpenAI公司重组与治理结构 - OpenAI完成重组,在非营利基金会下设立OpenAI集团公共利益公司作为营利实体 [8] - 非营利的OpenAI基金会持有价值高达1300亿美元的OpenAI股份,成为全球最大慈善基金之一 [10] - 基金会将首批动用250亿美元资金投向医疗健康和AI安全韧性两个领域 [10] 微软的投资与战略回报 - 微软目前持有OpenAI约32.5%的股份,价值约1350亿美元 [15] - 双方关系已成长为业界最成功的合作伙伴关系之一 [17] - OpenAI创始人希望微软能从这笔投资中赚到一万亿美元 [18] 产品与市场独家安排 - OpenAI最强大的通用人工智能模型API将在未来七年内独家部署在微软Azure云平台上 [19] - 此项独家安排将持续到2032年,除非OpenAI率先实现AGI [19] - 该策略使Azure成为AI开发者的“圣地”,直接推动微软云服务业务腾飞 [20] 财务业绩与增长前景 - 微软2025财年第一季度智能云部门收入同比大涨27%,Azure增速远超主要竞争对手 [20] - 微软商用云业务手握3920亿美元的未完成订单,同比增长51% [20] - 其中包括OpenAI与微软签下的2500亿美元Azure预购合同 [20] 算力供应与需求瓶颈 - 双方均表示面临严重的算力短缺问题,限制了业务增长 [24][25] - 微软上季度资本开支高达349亿美元,较前一季度猛增40%,主要用于数据中心和AI芯片 [26] - 未来两三年内AI算力仍将严重紧俏,出现“算力过剩”的概率几乎为零 [28][29] AI对软件行业的范式影响 - AI正在重塑软件形态,从App转向Agent,能理解自然语言指令并执行任务 [34] - 传统商业软件可能被多才多艺的AI助手重构,微软主动为Office注入AI推出Copilot [36] - 在消费互联网领域,AI对话式交互对传统搜索的流量和广告曝光构成分流风险 [37] AI驱动的生产力提升 - AI将开启生产力爆发,微软过去一年几乎零净增员工数,却实现营收两位数增长 [44][46] - 员工借助内部Copilot大幅提高效率,公司通过网络运维自动化替代了大量人力需求 [47][48] - 经过适应期,企业将迎来既增收又节支的局面,推动宏观经济劳动生产率和GDP增速提升 [51][52] AI对美国制造业的影响 - AI需求正吸引资本重新投入制造业和基建领域,为传统工业中心注入新活力 [55][57] - 微软在威斯康星州豪掷73亿美元兴建全球最大数据中心园区,带动本地就业和投资 [56] - 美国的云计算龙头公司在全球输出技术,帮助各国建设数字基础设施,占据产业制高点 [59] 合作关系的战略意义 - 合作结合了OpenAI的创新激情与微软的产业落地能力,迸发出惊人能量 [60] - 双方共同开发ChatGPT引爆全球AI热潮,并将深度学习技术带入寻常百姓家 [62] - 合作关系证明了理想主义与实用主义结合的可能性,既关乎利润更关乎人类福祉 [64]
报名|EMNLP×TalentAI50高能社交夜:不尬聊,只共振!
机器之心· 2025-10-29 19:02
活动概述 - 机器之心计划在EMNLP 2025会议期间举办一场名为「EMNLP 2025 TalentAI50 Meetup」的轻社交实验活动 [1] - 活动定位为自由交流、灵感碰撞的引力场,仅限50人参与,专属于中国自然语言处理青年力量 [1] - 活动形式打破传统模式,没有PPT分享和流程发布,核心是美酒、美食和自由对话 [5] 活动嘉宾 - 活动邀请到多位活跃在一线的青年学者和从业者,包括来自清华大学、香港中文大学、墨尔本皇家理工大学、上海人工智能实验室以及vivo AI研究院的代表 [3] - 此外还邀请到来自海外企业如Google、Meta等的论文作者 [4] - 嘉宾角色定位为分享者、倾听者以及经历过改稿、投稿、熬夜调参的同行者 [3] 活动日程与报名 - 活动定于北京时间11月6日18:00-21:00在苏州国际博览中心附近举行 [6] - 活动规模严格限制为50人,除定向邀请外,也面向EMNLP 2025论文作者开放报名通道 [5] - 具体日程包括17:30-18:00签到、18:00-18:10开场、18:10-18:30互动体验、18:30-21:00开餐与自由交流 [7] - 报名审核通过后,活动小助手将主动添加微信并发送入场通知或邀请函 [9] 系列计划与行业影响 - 该活动是机器之心发起的「TalentAI50 Meetup系列」计划的一部分,该计划聚焦AI学术顶会,旨在挖掘并连接每一场顶会最具成长性的50位AI华人青年人才 [10] - 计划此前已于IROS 2025期间首次线下落地,未来将持续覆盖更多学术顶会 [10] - 活动长期目标是让学术顶会上的参与者从陌生人转变为未来合作者,让论文生长出真实的人际网络,促进改变AI未来的年轻人彼此看见和互相成就 [12]
智慧树母公司获上市备案,教学数字化市场第二,市场份额3.4%
搜狐财经· 2025-10-22 01:03
公司上市备案与背景 - 中国证监会正式同意上海卓越睿新数码科技股份有限公司赴香港主板上市及境内未上市股份全流通 [1] - 公司是知名教育数字化品牌智慧树的母公司 成立于2008年 并于2013年推出智慧树品牌 [4] - 公司曾于2021年启动A股上市辅导 后于2024年4月终止 转而选择港股 并在2024年5月及12月两次向港交所递交招股书 [4] - 农银国际担任公司此次上市的独家保荐人 [4] 公司市场地位与业务 - 公司业务覆盖教 学 练 考 评 管全流程 [4] - 以3.4%的市场份额位列2023年中国高等教育教学数字化市场第二 [4] - 在细分的数字化教学内容制作市场中以6.2%的份额排名行业首位 [4] - 服务网络已渗透至全国多数高等院校 [4] 募资用途与战略方向 - 拟将上市募集资金主要投向AI技术 云计算及自然语言处理等前沿技术研发 [4] - 资金将用于提升全国范围内的客户服务及支持能力 [4] - 计划设立知识图谱开发中心 同时补充营运资金 [4] 行业格局与市场环境 - 高等教育数字化市场呈现高度分散格局 前五大企业总市场份额仅12.6% [5] - 证监会对企业境外上市呈现差异化导向 赴港上市通道基本处于放行状态 [4] - 2025年以来港股IPO募资额已重回全球第一 证监会截至4月底已完成242家境内企业境外上市备案 其中83家为科技企业 [5] - 监管层表示将持续为科技企业境外上市提供透明 高效 可预期的监管环境 [5] 行业影响与趋势 - 公司的上市尝试或将加速行业整合 [5] - 头部企业通过资本力量强化技术研发与服务能力 有望推动行业从内容供给向智慧教学生态构建升级 [5]
报名倒计时 | 量化洞察上海专场:从微观交易到宏观经济
Refinitiv路孚特· 2025-10-21 14:02
文章核心观点 - 金融市场中准确及时的宏观经济情报与微观交易数据是卖方研究与投资决策的关键驱动力 [1] - LSEG的解决方案结合宏观经济预测与市场微观结构分析 帮助专业人士在海量信息中精准识别信号并提升研究效率与投资回报 [1] - LSEG将举办量化专题活动"从微观交易到宏观经济:LSEG量化洞察上海交流会" 与行业专业人士共话数据驱动的投资未来 [1] LSEG量化解决方案 - LSEG与XTech联合推出预测模型 通过前沿指标提前洞察全球经济趋势并提供可操作的市场信号 [1] - 借助分钟级别股票交易数据和机器学习算法 投资者能实时识别聪明资金的建仓或减仓时机 [1] - LSEG文本分析解决方案运用自然语言处理和机器学习技术 将非结构化数据转化为可操作的洞察以发掘新的阿尔法收益机会 [13][14] - 新闻分析服务可量化企业情绪分析 文本相关性与新颖性 数据覆盖超过40,000家企业且可追溯至2003年 [19] - MarketPsych转录分析通过自然语言处理技术解析企业电话会议内容 洞察情绪倾向和相关企业 [20][21] 全球宏观预测服务 - LSEG携手Exponential Technology推出全球宏观预测服务 为机构投资者提供全球经济趋势洞察 [16] - 预测服务涵盖美国消费者物价指数CPI变动影响 美国零售销售数据 美国经济咨商局消费者信心指数及密歇根大学消费者信心指数等关键指标分析 [16] 活动与嘉宾信息 - 活动将于2025年11月6日在上海陆家嘴举行 包含主题分享 行业讨论和晚宴交流等环节 [3][4] - 主讲嘉宾包括LSEG亚太区Front Office解决方案总监Arman Sahovic博士 其负责高频交易 量化分析和人工智能等复杂解决方案 [8] - 行业讨论嘉宾包括锐天投资创始人徐晓波 其管理规模超过百亿 以及FFT Investment合伙人李怡康 拥有人工智能研究背景 [9][10] - LSEG量化和数据科学业务主管王旭东将参与活动 其擅长构建高效数据分析体系与复杂数据模型 [11]
国庆长假充电指南:Ilya Sutskever's Top 30 论文阅读清单
锦秋集· 2025-10-01 21:25
文章核心观点 - 文章推荐了一份由Ilya Sutskever精选的30篇AI领域前沿论文合集,该合集覆盖了近15年AI发展的里程碑成果,以"技术底层-能力突破-场景落地"为主线,串联了AI从感知智能到认知智能的关键跃迁 [4] - 该论文合集旨在帮助投资者、从业者与研究者系统梳理AI技术演进脉络,深刻理解当前AI产业落地的机遇与挑战,实现专业能力的高效提升 [1][5] - 合集内容不仅清晰拆解了残差映射、动态指针网络等专业术语的技术逻辑,还通过论文中的实验数据和架构设计,为从业者提供从理论到落地的参考路径 [5] 论文合集技术框架 - 合集涵盖奠定深度学习基础的CNN、RNN,重构自然语言处理领域的Transformer与自注意力机制,以及推动RAG、多步推理等前沿方向的核心研究 [4] - 每篇论文都是对应技术领域的奠基之作,直接关联当前AI产业落地的核心能力底座,包括《GPipe》中的并行训练方案如何降低大模型算力成本,《Retrieval-Augmented Generation》如何解决AI幻觉问题以适配金融、医疗等高精度场景 [4][5] 代表性论文技术要点 深度学习基础架构 - ImageNet Classification with Deep Convolutional Neural Networks论文提出的CNN架构包含5个卷积层和3个全连接层,在ILSVRC-2010数据集上top-5错误率为17.0%,显著优于此前方法 [48][52] - Deep Residual Learning for Image Recognition提出的残差网络通过残差块简化了深层网络训练,152层ResNets在ImageNet等数据集上性能优于VGG nets [73][77] - Recurrent Neural Network Regularization提出将dropout技术应用于LSTM的新方法,在Penn Tree Bank数据集上词级困惑度显著降低 [21][24] 注意力机制与Transformer - Attention is All You Need完全依赖自注意力机制提出Transformer架构,在WMT 2014 English-to-German翻译任务中BLEU分数达到28.4,比当时最先进模型高出2个多BLEU点 [105][117] - Neural Machine Translation by Jointly Learning to Align and Translate引入注意力机制解决固定长度向量瓶颈问题,在WMT '14 English-to-French翻译任务上BLEU分数显著提升 [119][126] 模型扩展与优化技术 - GPipe通过微批量流水线并行技术实现大型神经网络高效训练,支持训练包含60亿参数、128层的Transformer模型,在ImageNet-2012数据集上top-1准确率达到84.4% [62][72] - Scaling Laws for Neural Language Models发现模型性能与参数规模遵循幂律关系,更大规模模型具有更高样本效率,在固定计算预算下训练极大型模型是最优策略 [212][218] 特定应用领域突破 - Neural Message Passing for Quantum Chemistry提出的MPNNs框架在QM9数据集上13种性质中有11种达到化学精度,为分子性质预测提供强大工具 [94][101] - Deep Speech 2端到端语音识别模型在英语和普通话上均实现高准确率,在WSJ、LibriSpeech等基准测试中性能超过人类转录员 [203][209] - Pointer Networks提出新型神经架构解决输出词典大小可变问题,在计算平面凸包、德劳内三角剖分等几何问题上性能显著优于传统序列到序列模型 [37][45] 技术演进趋势 - 从传统神经网络到残差网络、注意力机制的演进表明,通过架构创新可有效解决梯度消失、长期依赖关系等核心挑战 [73][105] - 模型规模与性能关系研究为大规模神经网络训练提供理论指导,计算效率最优策略推动行业向极大型模型方向发展 [212][224] - 多令牌预测等新型训练方法重新定义LLMs处理文本方式,通过并行预测多个未来令牌提升模型效率和速度 [259][264]
所有知识型岗都要被AI “吞了!清华大学教授刘嘉:未来大学分化猛烈,软件公司靠 “几人 + Agent” 就够
AI前线· 2025-09-29 12:28
AI发展现状与趋势 - 2025年AI已进入几乎包围人类的时代,2024年诺贝尔物理学奖和图灵奖均授予AI领域,2025年初DeepSeek大模型和Manus完全自主AI引发广泛关注[5] - 大模型正从“你问我答”的对话模式向服务人类、与人类进行实体及工作层面交互转变,2025年是大模型走向实际应用的开端[10] - 人形机器人领域和智能体(Agent)领域是当前两大重要进展方向,代表AI向物理世界和虚拟世界的延伸[8] AI技术能力评估 - 2024年9月OpenAI推出o1推理大模型后,大模型已从单纯对话转向具备推理能力,能够模仿人类“慢思维”进行逻辑链思考[13] - 推理大模型的出现催生了智能体技术爆发,智能体核心是规划能力,能够调用各种工具完成实际任务[14] - 大模型在智商层面已经达到甚至超过人类顶尖水平,在国际奥林匹克数学竞赛中表现优异[14] - 但在感知和运动能力方面,当前基于Transformer架构的大模型存在串行加工缺陷,无法实现人类式的并行信息处理[33] AGI实现路径与挑战 - 真正的AGI需要具备两个关键能力:从0到1的颠覆式创新能力(OOD问题)以及完整的感知和运动能力[32][33] - 实现AGI的三条可能路径包括强化学习、脑模拟和自然语言处理,但目前都缺乏类似Transformer在NLP领域的突破性时刻[36] - AGI的实现可能需要向脑科学学习,开发受生物大脑启发的新架构,突破现有神经元模型的简单性限制[17][18][35] AI对行业的影响 - 垂直类Agent已在编程领域产生显著影响,如Cursor、Copilot等工具导致初级和中级程序员面临失业风险[24] - 通用类Agent如字节的“扣子”(Coze)具有广阔发展前景,未来将改变社会的工作方式和组织架构[24] - 所有知识密集型职业包括律师、程序员、会计、医生、教师等都会受到AI巨大冲击,传统教育模式面临根本性质疑[48] - 顶尖创意人才的价值反而会提升,如在AI生成音乐泛滥背景下,原创音乐人的客单价不降反升[49] 企业竞争格局 - AI发展具有不可阻挡的竞争特性,国与国、公司与公司之间的竞争使得暂停研发不切实际[40][41] - 类似核武器竞赛的格局正在形成,主要经济体都在加速AI研发以避免落后[41] 未来应用场景 - 物理世界机器人如马斯克的Optimus、OpenAI投资的Figure01重点关注“眼手合一”,用大模型驱动肢体适应环境[22] - 虚拟世界智能体将大模型与各类工具结合,能够完成购票、订房、行程规划等实际操作[23] - 未来手机可能不再需要多个APP,各种需求可通过大模型驱动的统一接口完成[23] 教育改革方向 - 大学教育必须从知识传授转向创造力培养和跨学科融合,推动通识教育发展[43][44] - “AI+学科”是所有学科的必然选择,但需要避免简单的“袋装土豆”式叠加,实现真正融合[45][46] - 未来大学分化将加剧,能够成功推行通识教育和跨学科融合的院校将占据优势[44] 个人应对策略 - 当前竞争是“会用AI的人”与“不会用AI的人”之间的差距,而非人与AI的直接竞争[53] - AI可作为助手、老师、批评者和情感支持伙伴,全方位提升个人能力[54] - 人类需要发挥零到一颠覆性创新的独特优势,这在相当长时间内仍是AI难以企及的[51]
中康科技“卓睦鸟医疗大模型”斩获MedBench 2025新榜医学语言理解单项榜首
格隆汇· 2025-09-29 11:09
公司产品表现 - 中康科技"卓睦鸟医疗大模型"在MedBench 2025年度测评中综合排名第2,医学语言理解单项排名第1 [1] - 模型参数量达700亿,通过大规模预训练与多阶段指令微调提升能力 [1] - 模型依托公司近二十年数据积累,训练资源覆盖百万级医学文献及千万级脱敏临床数据 [1] 产品技术基础 - 模型构建使用了高质量训练资源,包括公开语料和非结构化病历 [1] - 结合数据清洗、去重、增强等先进工艺,提升在真实医疗场景中的泛化能力与响应精度 [1] 行业应用方案 - 公司于2025年3月发布"医疗健康全场景智能体",依托天宫一号和卓睦鸟医疗中台两大引擎 [1] - 解决方案覆盖商用、医疗、药店、健康管理和研发多场景,实现智能决策、敏捷行动的业务闭环 [1] - 智能体旨在帮助医疗健康行业提升效率与服务质量 [1]
陈丹琦新作:大模型强化学习的第三条路,8B小模型超越GPT-4o
量子位· 2025-09-28 12:56
文章核心观点 - 提出一种名为RLMT(基于模型奖励思维的强化学习)的新方法,该方法结合了RLHF和RLVR的优点 [4] - RLMT方法能使参数量仅8B的小模型性能超越GPT-4o,并媲美Claude-3.7-Sonnet [1] - 该方法支持在基础模型上直接使用,无需经过监督微调(SFT),可大幅降低后训练成本 [6] 技术方法与原理 - RLMT要求模型在回答前先生成思维链(CoT),然后使用经人类偏好训练的奖励模型对输出进行评价 [5] - 训练流程为:给定用户提示x,模型生成推理轨迹z,基于推理生成最终回答y,奖励模型r(x, y)对结果打分 [14] - 数学优化目标是最大化期望奖励 [15][16] - 使用人类偏好奖励模型(如Skywork-v2)在流畅性、相关性、逻辑性、创意等维度进行评分 [17] - 在优化算法上,实验了DPO、PPO、GRPO,其中GRPO效果最佳 [17] 性能表现与基准测试 - 在Wildbench等基准测试上,经过RLMT优化的Qwen2.5-7B模型大幅领先其他模型 [13] - 具体数据显示,L3.1-8B-I-RLMT模型在综合评测(Avg)中得分为54.1,超越了GPT-4o的53.2和L3.1-70B-Instruct的32.1 [7] - 在CWv3评测项上,L3.1-8B-I-RLMT得分为22.9,虽低于Claude3.7-Sonnet的39.3和GPT-4o的32.1,但显著高于其他大模型 [7] - 消融实验表明,使用不同提示混合(Prompt mixture)和奖励模型(Reward Model)对最终效果有显著影响 [18] 训练方式与成本优势 - 提供两种训练方式:带SFT预热的Warm-start方式和无SFT直接训练的Zero方式 [21] - Zero方式可在基础模型上直接加入固定前缀提示,通过学习"思考+回答"结构,最终表现也能超过指令微调模型 [21] - 结果显示小模型经RLMT训练后可超越大模型,大幅简化后训练流程并降低成本 [22] - 训练数据来源于真实用户对话,避免了过度偏向数学/代码领域,提升了在开放任务上的泛化能力 [18] 对行业的影响与意义 - 该方法证明了RLVR范式在数学、代码等可验证领域之外的开放任务上同样有效 [11] - 对于非数学代码问题,模型能自然学会分步骤拆解,如回顾、综合、关键主题、核心准则、举例、结构化回答等人类思考方式 [12][19] - 网友认为该方法为通用强化学习设定了新基线,在后训练时代,谁定义了偏好,谁就掌握了新的评分标准 [8]
2025年9月荐书 | 三力协同 资本重估
第一财经· 2025-09-24 14:34
宏观投资环境 - 低利率环境持续,政府债务成本被经济增长动态稀释,为财政扩张提供自我偿付空间 [1][14] - 全球资本再配置推动风险溢价与治理溢价重估,资产边界随产业链地理重构而外移 [1] - 货币政策逼近零下限后,公共投资应主动补位,通过提升潜在产出率抬高中性利率 [14] 技术变革与投资机会 - 生成式人工智能可将非结构化文本即时转化为可计算因子,显著降低信息摩擦与策略开发门槛 [1] - 人工智能发展推动人类从石油驱动经济步入电力驱动经济时代,电力重要性将等同于过去的石油 [5] - 机器人普及将推动聚醚酮、镁合金、钛合金、碳纤维、钕铁硼磁材等高性能材料需求激增 [5] 资产配置与投资策略 - 全球资产轮动遵循货币、资源、人口、科技线索,资本流向等于财富流向 [3] - 在美元周期、地缘博弈与产业变迁中锁定稀缺标的,利用ETF等低门槛工具构建确定性组合 [3] - 投资需看清趋势转换过程中产生的巨大机会,原有力量与新生力量的重叠使转换过程显得模糊 [5][6] 金融科技应用 - 大语言模型是自然语言处理组成部分,可跨越计算机科学与语言学,用于理解和生成人类语言 [10] - 金融行业对高效处理大量自然语言数据需求增长,但中文的含蓄多义特性对机器处理构成挑战 [11] - 大模型技术可应用于投研、风控、监管等十二大金融场景,从文本中提炼金融决策信息 [9]
线下活动邀请 | 量化洞察上海专场:从微观交易到宏观经济
Refinitiv路孚特· 2025-09-18 14:03
文章核心观点 - LSEG通过结合宏观经济预测与市场微观结构分析,为卖方研究和投资决策提供关键驱动力,旨在帮助专业人士在海量信息中精准识别信号,提升研究效率与投资回报 [1] LSEG量化解决方案 - 解决方案将宏观预测与微观交易分析相结合,帮助投资者识别信号并规避噪音 [1] - 提供分钟级别的股票交易数据和机器学习算法,以实时识别聪明资金的建仓或减仓行为 [1] - 运用文本分析技术将非结构化数据转化为可操作的洞察,以发掘新的阿尔法收益机会 [7][8] - 文本分析解决方案融合自然语言处理、机器学习与新闻分析技术,提供企业情绪分析、文本相关性及新颖性评估等元数据 [8] 全球宏观预测服务 - LSEG与Exponential Technology合作推出全球宏观预测服务,为机构投资者提供全球经济趋势洞察 [9][10] - 预测服务涵盖美国CPI变动影响、零售销售数据、经济咨商局消费者信心指数及密歇根大学消费者信心指数等关键指标分析 [10] 新闻与转录分析 - 新闻分析服务采用自然语言处理技术,量化企业情绪、文本相关性与新颖性,增强量化策略的交易信号识别能力 [12] - 新闻分析数据覆盖股票、大宗商品与能源领域,数据可追溯至2003年,涵盖超过40,000家企业 [12] - MarketPsych转录分析运用自然语言处理技术解析企业电话会议内容,洞察情绪倾向、相关企业及提及话题 [13][14] - 转录分析专为机构及量化公司设计,为企业电话会议的深层含义提供数据驱动视角 [14] 专题活动信息 - LSEG将举办题为“从微观交易到宏观经济:LSEG量化洞察上海交流会”的量化专题活动 [1][2] - 活动将于2025年11月6日在上海陆家嘴举行,设有主题分享、行业讨论及交流环节 [2][3] - 主讲嘉宾包括LSEG亚太区Front Office解决方案总监Arman Sahovic博士、锐天投资创始人徐晓波以及FFT Investment合伙人李怡康 [2][5]