大语言模型

搜索文档
【广发金工】DeepSeek定量解析基金季报行业观点及行业轮动策略构建
广发金融工程研究· 2025-04-08 11:35
大语言模型在金融领域的应用 - 大语言模型(LLMs)凭借强大的文本理解、信息提取和推理预测能力,正在改变传统金融分析和决策方式,为投资管理、市场分析、风险控制等领域带来新机遇 [1][9] - LLMs能处理海量非结构化数据如新闻报道、社交媒体、企业财报等,帮助投资者更快获取关键信息,并具备情感分析能力识别市场情绪变化 [9] - DeepSeek系列模型基于Transformer架构,使用GQA和FlashAttention2技术优化,开发成本仅600万美元,每百万输入Tokens价格0.14美元,显著低于ChatGPT 4.0的2.50美元 [15] 基金季报行业观点定量解析方法 - 通过DeepSeekV3模型对约18000份主动型权益基金季报观点文本进行行业观点解析,样本筛选标准包括存续超5年、权益仓位超60%、规模超2亿等条件 [28] - 模型输入需加入特定提示词明确任务目标,输出格式设定为"行业名称:得分",单次计算平均耗时10秒,总耗时约50小时处理20M输入和3M输出tokens [35][36] - 行业观点统计显示电子(58.55%)、电力设备(65.25%)、计算机(55.98%)等行业提及率最高,机械设备看多比例达91.18%,房地产看空比例54.15% [44] 行业轮动策略构建与表现 - 构建14个行业观点指标,包括看多/看空比例、关注度及其环比变化等维度,指标间相关性分析显示关注度与看多比例呈正相关(0.92) [61][62] - 测试发现基于看空比例及其环比变化的策略在熊市表现优异,而看多比例策略仅在牛市阶段跑赢行业平均 [67][71] - 结合看多比例和关注度的组合策略中,"低比例关注+低比例看多"组合表现最佳,而"高比例关注+高比例看多"组合未跑赢行业平均 [77][80] 行业关注度动态变化特征 - TMT板块关注度在2023Q1(AI概念行情)和2024Q3显著上升,电子、计算机等行业长期保持高关注度 [47] - 消费板块中食品饮料、医药生物关注度较高但呈下降趋势,纺织服装、轻工制造平均提及率不足10% [49] - 上游周期板块2021年关注度短暂上升后回落,煤炭行业因红利风格保持相对高关注度 [51] - 中游制造板块电力设备、汽车行业关注度随新能源行情波动,机械设备行业关注度稳定 [54]
【广发金工】DeepSeek定量解析基金季报行业观点及行业轮动策略构建
广发金融工程研究· 2025-04-08 11:35
大语言模型在金融领域的应用 - 大语言模型(LLMs)凭借文本理解、信息提取及推理预测能力,正在改变传统金融分析和决策方式,为投资管理、市场分析、风险控制等领域带来新机遇 [1][7] - LLMs能处理海量非结构化数据(如新闻、财报、政策文件),识别市场情绪变化,辅助投资决策 [7] - DeepSeek-R1模型成本效益显著,开发成本低于600万美元,每百万Tokens输入价格0.14美元,远低于ChatGPT 4.0的2.50美元 [13] 基金季报行业观点定量解析方法 - 使用DeepSeekV3模型解析约18000份主动型权益基金季报观点文本,筛选标准包括存续超5年、权益仓位>60%、规模超2亿等 [26] - 通过特定提示词控制模型输出格式,统计看多/看空行业数量及占比,构建14个行业观点指标 [33][56] - 样本基金季报观点文本长度中位数约600字符,80%集中在300-1000字符范围 [26][27] 行业观点分布特征 - 电子、电力设备、计算机等行业关注度最高,提及频次超50%;纺织服饰、轻工制造等行业关注度不足10% [42] - 机械设备行业看多比例达91.18%,房地产行业看空比例达54.15% [42] - TMT板块关注度受AI概念驱动显著上升,如2023Q1 ChatGPT行情带动计算机等行业关注度提升 [45] 行业轮动策略构建与表现 - 策略基于看多比例、关注度及其环比变化构建8种组合,调仓频率为季频(1/4/7/10月末) [62][74] - "低比例关注+低比例看多"组合表现最佳,"高比例关注+高比例看多"组合未跑赢行业平均 [75] - 关注度下降且看多比例下降的行业组合在回测中表现优于市场平均水平 [76] 主动型权益基金行业配置效果 - 2025年偏股混合型基金指数累计收益率4.65%,跑赢中证800指数5%,行业配置贡献0.89%超额收益 [19][20] - 超额收益主要来自TMT板块配置比例上调,显示主动权益基金的行业配置观点具备参考价值 [19]
中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
量子位· 2025-04-07 12:19
KG-SFT团队 投稿 量子位 | 公众号 QbitAI 让大语言模型更懂特定领域知识,有新招了! 来自中国科学技术大学MIRA实验室的王杰教授团队提出了提出了一个创新的框架—— 知识图谱驱动的监督微调(KG-SFT) ,该框架通过 引入知识图谱(KG)来提升大语言模型(LLMs)在特定领域的知识理解和处理能力。 实验结果表明,其在多个领域和多种语言的数据集上取得了显著的效果, 成功入选ICLR 2025 。 截至目前,LLMs在常识问答方面表现越来越出色,但它们对领域知识的理解和推理能力仍然有限。 由于难以深入理解专业领域问答背后所蕴含的复杂知识和逻辑关系,因此在面对这类问题时,往往无法准确地给出正确的答案和详细的推理过 程,这极大地限制了其在专业领域的应用价值。 尤其是在数据稀少和知识密集型的场景中, 如何让LLMs更好地理解和操纵知识,成为了研究的关键 。 而中科大MIRA实验室的这项工作即围绕此展开。 KG-SFT是如何工作的 KG-SFT针对LLMs难以理解领域问答背后的知识和逻辑,导致 推理能力弱 的问题,提出 基于知识图谱增强的大语言模型监督微调 技术。 KG-SFT首先通过解析领域知识图谱中的 ...
速递|谷歌换帅Gemini:NotebookLM之父接棒,能否扭转流量仅为ChatGPT十分之一的困局?
Z Potentials· 2025-04-03 11:48
谷歌Gemini团队人事变动 - 谷歌于4月2日更换Gemini聊天机器人负责人 由实验室产品孵化器负责人乔希·伍德沃德接替原负责人萧茜茜 [1] - 萧茜茜长期任职于谷歌 此次调任新职 具体职责未披露 [1] - Gemini团队内部代号为Bard 此次调整旨在争夺OpenAI的ChatGPT市场份额 [1] Gemini与ChatGPT竞争态势 - Similarweb数据显示 Gemini网络流量仅为ChatGPT的十分之一 [1] - ChatGPT近期使用量激增 对谷歌形成明显竞争压力 [1] 伍德沃德领导的产品创新 - 其团队已开发AI Studio软件 帮助开发者基于Gemini大语言模型构建应用 [1] - 正在开发Project Mariner智能体产品 可在浏览器中执行操作 尚未发布 [1] - NotebookLM去年秋季引发关注 该产品能根据用户上传文档生成AI播客 [1]
对话科辉智药创始人:以AI驱动新药的差异化优势,需寻求软硬件与制药场景的更优协同
IPO早知道· 2025-04-03 11:33
大模型若要成为可信的研发工具,还要实现科学的ranking技术、可解释性提升等问题。 本文为IPO早知道原创 大模型 加速分子设计、优化,但可解释性仍然不够 科辉 AI 平台包含数据分析软件、分子设计软件,并且公司于 2024 年 11 月上线了内部大语言模 型。朱 振东 表示,大语言模型作为 AI 工具的一种,在药物研发的智能化升级、生物医学文献与知 识管理、基因组学与蛋白质组学的研究解读和临床诊疗与健康管理的革新等领域都带来了显著的效率 提升。 以药物研发的关键环节为例来看,首先在 疾病机制与靶点发现 方面,大语言模型可通过分析海量基 因组、转录组、蛋白质组、文献、专利和数据库,挖掘疾病相关基因的调控网络和信号通路,快速识 别潜在药物靶点(如蛋白质、基因),并预测其与疾病的关联性。 作者|罗宾 微信公众号|ipozaozhidao DeepSeek 等大语言模型( LLMs )在很多行业已经引领了智能化的变革,它们 在新药研发行业 是否已接近技术的拐点?人工智能正以多大程度推动药物研发的进步? IPO 早知道对话了科辉智药创始人、董事长 朱 振东博士 ,他分享了 AI 运用于制药行业中的成功经 验与 未来 ...
浩辰软件: 苏州浩辰软件股份有限公司2024年度独立董事述职报告(范玉顺)
证券之星· 2025-04-02 22:02
独立董事履职情况 - 独立董事范玉顺2024年度严格遵循《公司法》《证券法》等法律法规及公司章程,履行独立董事职责,维护公司和股东权益[1] - 范玉顺具备清华大学自动化专业博士学位,现任清华大学教授,2020年11月起担任公司独立董事,无影响独立性的情形[1] 会议参与情况 - 2024年度出席全部7次董事会会议(其中6次以通讯方式),无缺席或委托出席,参加2次股东大会[2] - 作为审计委员会成员出席6次会议,提名委员会成员出席3次会议,非战略委员会及薪酬与考核委员会成员[3] 专业履职与监督 - 独立董事审阅公司2023年报、2024年一季报及半年报,监督外部审计质量,与立信会计师事务所沟通审计意见[4] - 重点关注中小股东权益,通过股东大会交流及议案审议保障其利益[4] - 定期现场考察公司经营、财务及内控状况,提供专业建议[4] 技术交流与人才发展 - 独立董事与公司高层及技术骨干多次探讨CAD软件发展趋势,包括人工智能、大语言模型与CAD技术的结合应用[5] - 就技术人才培养、高层次人才激励等问题与公司深入交流[5] 重大事项审议 - 公司续聘立信会计师事务所为2024年度审计机构,独立董事认可其执业能力及历史表现[6][7] - 第六届董事会聘任胡立新为董事长、陆翔为总经理等高管,独立董事认为人员资质及程序合规[7][8] - 审议通过2024年限制性股票激励计划,向激励对象首次授予股票[9] 公司治理评价 - 独立董事认为公司财务报告及内控评价真实完整,符合会计准则,无重大违法违规[6] - 关联交易、承诺履行等事项合规,未发现损害股东利益的情形[5][6] 未来履职方向 - 独立董事将持续关注公司治理,提升董事会决策科学性,维护中小股东权益[9][10]
快手「生成」新商业
36氪· 2025-04-01 21:52
文章核心观点 - 生成式AI深度介入商业世界,快手在2025磁力大会展示AI重塑商业经营格局实践,其AI战略从单点赋能走向全链路整体重塑,通过技术、产品和商业价值布局,嵌入商业生态释放增量,构建双螺旋结构形成生态竞争优势,推动商业范式迁移 [2][4][32] 分组1:AI落地——从工具赋能到商业重塑 - 快手对AI布局走向商业全链路整体重塑,基于平台生态和AI能力,可在多方面全面重塑商业营销领域 [4][7] - 技术支撑上,快手围绕商业要素构建垂直领域模型集群,多模态模型协同突破信息茧房,达成“生成式匹配” [9] - 产品应用方面,快手有完整产品解决方案矩阵,AIGC内容生产和虚拟数字人直播解决传统痛点,AI投放Agent成决策主体,全站推广Agent撬动自然GMV增长 [10][14] - 商业价值上,“生成式匹配”使营销投放转向模拟推演,平台商业化生态运行规则转向机器决策实时调配 [15] 分组2:场景穿透——AI激发增量释放 - 技术需嵌入商业生态系统实现价值转化,快手要解决将重塑后的经营链路嵌入复杂商业生态的问题 [17][18] - 快手电商引入DeepSeek智能化应用,使需求预测进入因果推理阶段,对货和人有更精准理解 [22] - 2024年快手电商供需双侧底盘增长,月动销商家数同比增25%,中小商家GMV同比增156%,泛货架场交易额同比增61.3%等 [23] - 内容消费业务成新增长极,2024年Q4短剧商业化消耗同比增超300%,短剧和小游戏日消耗峰值分别突破3000万和1200万 [25] - 品牌营销和本地生活领域,AI应用取得成效,如本地线索行业商业意图用户增长超10%,线索大盘转化成本降低11% [25] 分组3:AI之争——生态致胜 - 快手构建“技术驱动商业进化,商业反哺技术迭代”双螺旋结构,形成生态系统级竞争优势 [28] - 快手的AI战略是生态竞争,其商业生态多元,各角色连接高效,探索帮助品牌构建长期价值 [31] - 快手的“生成新商业”是商业范式迁移和生态密度升维,正成为新商业生态探索者 [32]
对话时空壶田力:当AI遇上同传,建造跨语言沟通的巴别塔
乱翻书· 2025-04-01 12:35
品牌渊源与科幻DNA - 公司名称"时空壶"灵感来源于阿西莫夫科幻小说《永恒的终结》中的时间机器装置[4] - 会议室命名均采用科幻元素,如"三体"、"42实验室"(源自《银河系漫游指南》宇宙终极答案)[4] - 产品设计受《银河系漫游指南》巴别鱼和《星际迷航》宇宙翻译器两大科幻IP直接影响[6] 市场表现与行业地位 - 产品已覆盖全球170个国家,北美市场份额达40%,用户量突破百万[2] - 中国海关总署将W4 Pro同传翻译耳机列为"中国智造"转型代表产品[2] - 2024年CES展发布全球首个AI同声传译系统Babel OS,采用大语言模型底层技术[2] 技术突破与产品演进 - 攻克蓝牙耳机双向收音技术难题,实现无需唤醒词的语音识别系统[16][17] - W4 Pro采用三麦克风阵列算法,解决跨设备声音串扰问题[18][20][22] - 翻译技术分级对标自动驾驶:L3实现双向同传,L4将完成直译到意译的质变[42] - Babel OS系统实现端到端语音翻译(speech to speech),延迟控制在几百毫秒内[39][40] 产品应用场景 - 突破旅行翻译场景,应用于跨国恋爱、跨语言家庭交流等深度人际关系建立[31] - 宗教场景中实现多语言同步礼拜,呼应圣经巴别塔典故[29] - 教育场景支持家长与孩子进行沉浸式外语练习[29] 行业竞争壁垒 - 专注特定交流场景形成技术积累,牺牲音乐功能强化翻译专用性[25] - 解决大公司忽视的通信协议层问题,建立动态技术窗口期优势[25] - 在40种语言支持基础上,重点突破小语种识别准确率问题[34] 技术发展方向 - 推进端侧AI部署,解决网络延迟和隐私问题,计划2024年下半年发布相关产品[43] - 探索多模态翻译技术,未来将整合表情、语调等非语言信息[42] - 产品形态多元化布局,已推出X1翻译机等非耳机产品,规划眼镜等新载体[44] 行业生态与供应链 - 深圳产业集群优势显著:半小时车程内可触达大疆等硬件公司及东莞惠州工厂[14] - 本地方案商提供"拎包入驻"式支持,加速芯片选型与技术方案落地[14] - 中国AI基础设施进步使创业者能共享OpenAI等全球技术资源[13]
字节 AI 再创业:独立组织、全链条的饱和出击
晚点LatePost· 2025-03-31 19:58
字节跳动AI战略布局 - 公司面对AI机遇采取饱和式投入策略,至少5个团队同时开发不同智能体产品,包括对内工具[3] - 2023年年中决定自主开发AI后,公司在算力芯片层、云计算层、模型研发层、应用层实现全链条布局[3] - 产品矩阵覆盖聊天机器人、AI搜索、AI浏览器、Agent平台、AI陪伴社交、AI教育等主流方向,主力产品豆包在2024年底成为中国日活最多AI应用[4] - 2025年设定三大目标:探索智能上限、探索新UI交互形式、加强规模效应,由Flow/Seed/Stone三大板块近2500人团队支撑[17] 技术研发进展 - 模型迭代速度显著提升,2023年8月至2025年5月共发布12个版本,涵盖对话/视频生成/音乐/视觉理解等多领域[10] - 2025年1月发布豆包大模型1.5 Pro版本,多模态与推理能力全面提升[10] - 组建独立模型研发团队Seed,整合原有AI Lab资源,40%研究人员为近两年新增[15] - 引入Google Fellow吴永辉等顶尖人才,设立Seed Edge前沿研究计划瞄准AGI探索[21] 市场竞争态势 - 主力产品豆包被腾讯接入DeepSeek的元宝快速追赶,后者用十分之一时间达到豆包20%用户规模[5] - 错过中国ChatGPT时刻,因内部对复现OpenAI o1模型存在时间误判[10] - 面临DeepSeek开源模型冲击,该团队不足200人却实现技术突破[4][13] - 豆包2025年DAU目标超5000万,季度增长目标从30%调高至150%[22] 组织架构创新 - 建立独立AI组织Flow/Seed,与抖音/TikTok等业务平级,直接向创始人汇报[15] - 打破原有薪酬考核体系,为AI团队提供百万年薪及5年长周期评估机制[15] - 创始人张一鸣深度参与技术研究,每月召集核心团队复盘进展[16] - 采用"能力中台"模式,将模型能力模块化供产品团队调用[21] 资源投入规模 - 2023年GPU储备超10万张,上半年英伟达订单超10亿美元[22] - 2025年AI算力采购预算达900亿元人民币,优先保障大模型研发[22] - 通过收购补充技术能力,包括Oladance耳机品牌及存算一体硬件公司[15] - 调动全集团资源支持,曾阶段性限制非AI产品在抖音体系的广告投放[22]
GPU又赢了?苹果临阵倒戈!
半导体行业观察· 2025-03-28 09:00
核心观点 - 苹果向NVIDIA订购10亿美元的GB300 NVL72 GPU集群服务器系统,标志着其在AI战略上的重大转变,从依赖自研芯片转向商用GPU [1][3] - 这一决策反映了GPU在生成式AI领域的统治地位,以及NVIDIA在AI硬件生态中的不可替代性 [8][14] - 苹果的转向凸显了在AI竞赛中时间优先级的重要性,自研ASIC的开发周期无法满足当前市场需求 [16][19] - NVIDIA的财务表现和产品性能进一步巩固了其在AI硬件领域的领先地位 [8][11] - 尽管ASIC在特定场景下仍有优势,但在当前Gen AI浪潮中,GPU的通用性和生态成熟度使其成为首选解决方案 [16][19] 苹果的AI战略转变 - 苹果长期依赖自研芯片,但在生成式AI领域转向NVIDIA商用GPU,订购约250台NVL72服务器,每台成本370万至400万美元,总价近10亿美元 [3] - 这一转变可能源于自研芯片开发周期长、优化成本高,无法满足市场对高性能计算的迫切需求 [3][16] - 苹果可能采取混合策略:利用NVIDIA GPU进行模型训练,Apple Silicon专注于推理和边缘设备 [6][19] - Siri竞争力下降和生成式AI的快速发展是促使苹果调整AI战略的重要因素 [4][5] NVIDIA的统治地位 - NVIDIA的GPU搭配CUDA生态已成为训练大语言模型的事实标准 [8] - 在截至1月26日的第四季度,NVIDIA实现营收393亿美元,同比增长78%,毛利率高达70%以上 [8] - 约41%的收入来自微软、谷歌、亚马逊和Meta四大客户,这些公司表示GPU供应不足是构建AI数据中心的瓶颈 [9] - GB300 NVL72平台集成了72个Blackwell Ultra GPU和36个Grace CPU,与前代相比响应速度提升10倍,能效吞吐率提升5倍,整体AI产出能力跃升50倍 [11] GPU vs ASIC的技术路线之争 - GPU在通用性、灵活性和生态成熟度方面具有明显优势,特别适合快速迭代的AI市场 [16][17] - ASIC虽然在某些特定任务上效率更高,但开发周期长(通常需要数年),难以跟上AI领域的快速发展节奏 [16] - 博通和Marvell等ASIC厂商在AI训练领域的竞争力无法与NVIDIA抗衡 [17][18] - 时间窗口成为关键因素,在Gen AI竞争中速度比性能稍逊更为重要 [16][19] 行业趋势与市场动态 - 科技巨头在AI基础设施上的投入持续增加:Meta计划今年斥资650亿美元建设AI基础设施,全球九大科技公司预计2025年AI总支出达3710亿美元,同比增长44% [9] - 尽管有DeepSeek等初创公司尝试低成本AI方案,但这反而可能增加全球对AI服务和硬件的需求 [9][10] - Blackwell平台的需求强劲,NVIDIA预计2026财年第一季度营收达430亿美元 [14] - AI推理和训练的双轮驱动逻辑进一步强化了NVIDIA的增长势头 [14]