Workflow
大型语言模型
icon
搜索文档
垂直领域小型语言模型的优势
36氪· 2025-11-04 19:13
"您是否知道,许多'小型'人工智能模型在性能上优于较老、较大的模型——而且仅使用了一小部分资源?" 想象一下,直接在你的智能手机上运行强大的AI助手,无需访问云端,即可在几毫秒内处理你的请求。这并非科幻小说——小语言模型正在 将这一切变为现实,触手可及。 连续三年,人工智能界一直痴迷于一个简单的等式:越大越好。 科技巨头们投入数十亿美元构建庞大的语言模型,每一个模型都比上一个更大: • 据传拥有万亿个参数的 GPT-4 • 克劳德拥有数千亿 • Meta 的 LLaMA 突破极限,达到 700 亿 每一次突破似乎都遵循同样的模式——更多的参数、更大的功率、更多的可能性。 但2025年发生了一件意想不到的事情。 一 改变一切的剧情转折 随着企业人工智能部署从概念验证阶段过渡到生产阶段,一个令人惊讶的事实浮出水面: 越大并不总是越好。 英伟达一项突破性研究表明,40%至70%的企业级人工智能任务可以通过小型语言模型(SLM ) 更高效地处理——这些紧凑而强大的模型参 数少于100亿,具有以下特点: ✓ 速度比同类巨型设备快 10 倍 ✓ 部署和维护成本降低 5-20 倍 ✓ 更可靠,适用于特定业务任务 ✓ 设备端 ...
AI大模型投资比赛落幕,阿里通义千问 Qwen 以 22.32% 收益率夺冠
搜狐财经· 2025-11-04 11:46
IT之家 11 月 4 日消息,美国研究机构 Nof1 最近发起了一项实盘测试:他们将六大顶级 AI 大语言模型(LLM)分别注入 1 万美元作为起始资金,令其在真 实市场中自主交易。 今日,第一届 Alpha Arena 正式宣布结束,阿里旗下通义千问 Qwen3-Max 在最后关头保持领先,以 22.32% 收益率夺得投资冠军。 虽然 AI 模型可以完成指定任务,但研究者指出:在风险管理、交易行为、持仓时长、方向偏好等方面,模型表现出显著差异。 Alpha Arena 目标是在一个动态、竞争的真实环境里检验这些模型在"量化交易"领域的能力。 研究团队强调,这并不是为了"选出最强模型",而是为了推动 AI 研究从静态、考试式的基准测试转向对"真实世界"、"实时决策"的考察。 该项目试图回答一个基本问题:"大型语言模型在无特定微调、仅凭数值数据输入、在真实交易环境中,能否作为零样本(zero-shot)系统交易模型?" 通过该实验,Nof1 旨在促进 AI 研究转向"举办真实、动态、风险驱动的基准",而非仅仅静态数据集。 初步结果 报告指出,虽然每个模型都在同样结构下运作,但它们的交易风格、风险偏好、持仓时间 ...
三星加速追赶,台积电毫不在意
半导体芯闻· 2025-10-28 18:34
台积电技术领先性与竞争格局 - 和硕董事长童子贤认为台积电的2纳米和3纳米工艺仍然领先于三星和英特尔[2] - 尽管特斯拉将部分A15芯片订单交给三星德克萨斯工厂并将A16芯片转向三星2纳米工艺但台积电无需担心[2] - 童子贤承认美国可能想支持三星但否认存在危机并指出三星和芯片巨头仍需要台积电的帮助[2] 全球人工智能投资与供应链格局 - 美国目前在全球人工智能投资中处于领先地位其次是中国大陆[2] - 只有少数国家拥有构建大型人工智能模型的资金和人才中国台湾通过供应半导体等关键硬件已融入美国主导的AI供应链[3] - 美国现在严重依赖中国台湾的散热器主板和服务器机柜即使产能变化台湾在AI基础设施领域地位稳固[3] 中美科技竞争与AI技术发展 - 比技术竞争更大的问题是中美之间长期的科技竞争[3] - 2015至2017年间谷歌的研究塑造了现代AI OpenAI据此构建GPT谷歌随后推出Gemini美国目前拥有不足10个大型语言模型[3] - 中国最初模仿美国但现在正在打造自己的AI模式连接日本韩国和中国台湾的供应链虽未经过真正考验但在中美各自运营AI技术栈时至关重要[3]
赋予“灵魂”的教育机器人,AI数字伙伴如何破解个性化学习难题?
机器人大讲堂· 2025-10-19 12:03
教育机器人行业现状与挑战 - 教育机器人作为创新工具为传统课堂注入活力,在语言课和STEM教育中提升学习动机[1] - 行业面临设备数量有限导致学生轮流使用、互动时间受限以及高度同质化设计等问题[1] - 约60%的学生对教育机器人的兴趣仅能维持1-2个月,存在显著的短期兴趣衰减现象[1] AI个性化机器人框架创新 - 研究团队提出AI个性化机器人框架解决方案,为每个机器人配备拥有灵魂的AI数字伙伴[2] - 框架基于数字孪生技术和大型语言模型,实现物理实体与虚拟伙伴的持续连接及动态响应[3] - 核心架构采用分层设计,包含基础设施层、数据交互层和应用表现层,支持一个实体机器人对应多个虚拟伙伴的高效资源利用模式[4] 个性化学习机制设计 - 学习模型分为课外准备和课堂展示两个阶段,学生通过移动终端与数字伙伴持续互动[5] - 在课外阶段,学生通过完成学习任务获得虚拟货币,用于定制伙伴外观和行为模式,大型语言模型提供情境化反馈[5] - 在课堂阶段,数字伙伴的灵魂被转移到共享实体机器人上,增强学习认同感和成果展示[8] 实证研究结果分析 - 实验在某高校酒店管理专业开展,90名学生分为三组进行十周对比研究,每周课程100分钟[9] - 实验组A(AI个性化机器人)后测成绩显著优于其他两组,效应量达到0.21,表明个性化干预具有实质性教育价值[11] - 实验组A在主人翁意识得分和课外学习活动参与度方面显著更高,学习频率持续上升,证实框架对长期参与度的提升作用[12] 行业应用与推广价值 - AI个性化机器人框架通过数字伙伴加实体呈现的模式,为教育机器人规模化应用提供可行路径,适应有限预算下的普及需求[14] - 框架的模块化设计具备良好学科适应性,可通过调整学习脚本应用于语言学习、STEM教育和职业培训等领域[14] - 文章末尾列举了工业机器人、服务与特种机器人、医疗机器人、人形机器人等细分领域的企业名单,显示行业生态丰富[18][19][20][21][22][23][24]
美股异动|阿里巴巴连跌五日背后市场预期复杂 野村上调目标价却难挡颓势
新浪财经· 2025-10-10 06:49
股价表现与市场反应 - 公司股票在10月9日持续走低,跌幅达4.11% [1] - 公司股票已连续五个交易日下跌,累计跌幅达到8.27% [1] 机构评级与目标价调整 - 野村维持公司“买入”评级,并将目标价从170美元上调至215美元 [1] - 野村对阿里云估值提升持积极态度,支持了目标价上调 [1] - 中金公司维持“跑赢行业”评级,认为公司有超过11%的股价上涨空间 [1] 财务预测调整 - 野村将公司盈利预测下调了4.7%,主要归因于对大型语言模型投资增加导致部分业务部门亏损扩大 [1] - 中金公司下调了公司收入预测,并对非通用准则下的净利润预测进行了调整,主要由于闪购及其他业务亏损扩大 [1] 业务战略与投资布局 - 公司未来扩展大型语言模型用户基础的战略获得野村积极态度,尽管短期内货币化效果尚未明显 [1] - 公司SEO团队通过搜索引擎优化提高了自然流量获取能力,优化范围从传统站内方法扩展到全域SEO [2] - 技术优化降低了公司获客成本并加强了用户体验 [2] 估值方法与股东信心 - 中金公司采用SOTP估值法,给予电商业务和云业务不同的估值倍数,显示出对公司未来增长的信心 [1] - 公司大股东的惜售行为反映出对公司未来的信心 [2]
机器人「看片」自学新技能:NovaFlow从生成视频中提取动作流,实现零样本操控
机器之心· 2025-10-09 10:24
NovaFlow 框架概述 - 提出一种名为 NovaFlow 的全新自动操作框架,其核心目标是绕过机器人学习中的数据瓶颈,实现无需真实演示或训练的零样本复杂操控任务 [2] - 该框架的关键创新在于将任务理解与底层控制解耦,并利用大型视频生成模型中蕴含的常识知识,而非依赖昂贵的机器人亲身经历数据 [4] - 通过让机器人观看由视频模型生成的任务视频,并从中提炼出“可执行3D对象流”作为任务表征,指导机器人执行动作 [2] 核心技术:可执行3D对象流 - 引入核心中间表征“可执行3D对象流”,本质是目标物体在三维空间中运动轨迹的点云集合,只描述物体本身应如何移动 [5] - 这种以物体为中心的设计是实现跨不同机器人平台泛化的关键,使得方法与具体机器人形态无关 [5] - 该动作流作为抽象的任务表征,可被后续模块转化为针对刚性、关节体和可变形物体的具体机器人动作序列 [7][15] 动作流生成器工作流程 - 流程始于使用先进视频生成模型,根据初始场景RGB-D图像和文本指令生成一段任务教学视频 [9][12] - 通过单目视频深度估计算法将2D视频提升至3D空间,并利用第一帧真实深度图对估计深度进行校准,以解决系统性误差 [13] - 使用3D点追踪模型密集追踪场景运动,再通过开放词汇对象检测分割模型提取目标物体的运动轨迹,得到纯净的3D对象流 [14] - 为应对视频模型可能产生的“幻觉”,引入拒绝采样步骤,利用视觉语言模型评估并选择最合理的候选动作流 [14] 动作流执行器控制策略 - 针对刚性物体和铰接物体,通过分析动作流中关键点变化,计算物体在每个时间步的6D位姿,进而生成机械臂末端执行器的位姿序列和关节指令 [20] - 针对可变形物体,将3D动作流用作密集追踪目标,指导基于模型的规划器进行操作,通过粒子动力学模型预测形态变化并优化机器人动作以拟合理想状态 [20] 实验验证与性能表现 - 在Franka机械臂和波士顿动力Spot四足机器人上进行了广泛实验,任务涵盖刚性物体、铰接物体和可变形物体三大类 [16] - 实验结果显示,NovaFlow在所有零样本方法中表现最佳,其成功率甚至超过了使用10个和30个真实示教数据训练的模仿学习策略 [18][19] - 成功率的优势归因于其精确的3D动作表示,相比依赖2D光流的方法,具备更好的3D感知和长期一致性 [19] 挑战与未来方向 - 当前方法的主要局限性在于物理执行的“最后一公里”,如抓取失败或意外物理动态导致的执行偏差,暴露了开环规划系统的脆弱性 [23] - 未来的重要研究方向是开发闭环反馈系统,通过实时感知环境反馈来动态调整生成的动作流,以增强对现实世界不确定性和干扰的鲁棒性 [23]
美股异动丨IBM涨4%创新高 引入Anthropic旗下Claude模型
格隆汇· 2025-10-07 22:44
股价表现 - 公司股价盘中上涨4% 报收300.79美元 创下历史新高 [1] 战略合作 - 公司与Anthropic达成深度合作 将大型语言模型Claude系列集成至精选内部及外部开发工具与企业产品中 [1] - 合作旨在为客户提升生产力 [1] 产品与技术扩展 - 公司计划通过即将推出的watsonx Assistant for Z将人工智能功能扩展至大型机 [1] - 专用Z代理将理解对话上下文与自动化流程 在保障安全合规的前提下推动系统管理从被动故障排除向主动模式转型 [1]
田渊栋与Russell团队联手,证明Transformer能在训练中自然学会叠加推理
机器之心· 2025-10-07 11:57
连续思维链(Coconut)核心创新 - 提出将模型推理轨迹保存在连续隐空间中,而非离散的token空间,以解决长思维链带来的高计算成本难题 [1][2] - 关键优势在于模型能在“叠加”状态下进行推理,即可并行保留所有可能的推理路径,而非必须选择单一路径 [3] - 将一类推理任务抽象为有向图可达性问题,并证明一个两层Transformer经O(n)次连续思维解码即可有效解决该问题 [4][5] 叠加态涌现的训练动态 - 理论分析表明,在连续思维训练下,索引匹配logit在温和假设下保持有界,这与传统Transformer分析中logit呈对数增长无界的情况截然不同 [9] - 有界的索引匹配logit能在“探索”与“利用”之间维持动态平衡,使模型能为多条合理路径分配相近权重,自然形成叠加式推理 [10][34] - 实验观察到,一旦叠加态在早期训练阶段涌现,后续阶段能快速复用该机制,展现出长度泛化能力,即使模型未显式训练生成超过两个思维 [22] 实验设置与结果 - 实验使用GPT-2式解码器(两层Transformer,d_model=768, n_heads=8),从零开始训练,优化器为AdamW,学习率固定为1×10⁻⁴,全局batch size为256 [13] - 采用多阶段训练策略共350个epoch,最终模型在测试集上的准确度达到96.2% [14][15] - 在思维生成阶段,模型学会关注“前沿边”,logit差值在约125个epoch后稳定于60附近,与理论预测一致 [19] - 在答案预测阶段,残差信号和候选提升信号均迅速上升并在约5个epoch后趋于稳定,确保正确候选的logit最高 [27][29]
需求致行业价格普涨,AI端侧存储解决方案加速迭代 | 投研报告
中国能源网· 2025-09-25 11:35
行业整体趋势 - 2025年以来,生成式人工智能和大型语言模型商业模式日趋成熟,核心硬件需求持续提振,半导体存储行业稳步上行,有望迎来价量齐升 [1][2] - 维持行业强于大市的评级 [1][2] 需求驱动因素 - 国内互联网企业大力增加资本支出加码AI投入,阿里25Q2“AI+云”资本支出达386亿元,未来三年将在云和AI硬件基础设施上投入超3800亿元 [3] - 百度25Q2资本开支达38亿元,同比增速近80%,腾讯25Q2资本开支同比增长翻倍至191.07亿元 [3] - AI应用加速渗透,基础设施建设持续扩张,海量数据对存储需求与日俱增,企业级存储应用具备较高潜力 [3] DRAM市场动态 - 受DRAM原厂停产旧制程产品(EOL通知)影响,DDR4、LPDDR4X价格大幅上涨 [1][4] - 25H2 DRAM市场或迎来全面涨价,行业25Q4有望实现20%-50%季度环比涨幅 [1][4] - 南亚科25Q3合约价环比大涨70%,25Q4环比上涨50%,华邦电25Q3环比上涨60%,25Q4再涨20% [4] - 华邦电25Q4合约价相较于25Q2低谷,涨幅高达80%-90% [4] NAND与整体存储市场 - 企业级备货叠加手机新品需求,NAND涨价情绪日益高涨 [3] - CFM闪存市场预计25Q4存储市场或将迎来价格普涨行情,主要聚焦企业级和手机市场 [3] - 25Q4企业级存储价格或将实现个位数涨幅,手机嵌入式存储价格亦有望小幅上扬 [3] 利基与细分存储市场 - 2025年以来,台股三大利基存储厂商旺宏、华邦电、南亚科合计营收大体呈现逐月攀升 [5] - NOR Flash方面,AI数据中心需求增加及车用市场回暖使供需趋于健康,25Q4价格有望调升至双位数百分比,或延续至2026年 [5] - 利基DRAM方面,海外大厂淡出导致市场供不应求,产品价格持续上涨,紧缺预计持续全年 [5] - 定制化存储随着初代产品推出和落地正逐步发力,堆叠方案在端侧应用有望规模化 [5] 投资关注方向 - 建议关注利基存储相关公司:兆易创新、普冉股份、聚辰股份、东芯股份 [6] - 建议关注模组厂相关公司:开普云、江波龙、德明利、佰维存储、香农芯创 [6] - 建议关注存储配套芯片相关公司:澜起科技、联芸科技 [6]
中银晨会聚焦-20250924
中银国际· 2025-09-24 09:00
核心观点 - 半导体存储行业在生成式人工智能和大型语言模型发展的推动下稳步上行,预计迎来价量齐升行情,其中NAND和DRAM价格普涨,利基存储和定制化存储需求显著增长 [2][5] - 利尔化学2025年上半年业绩大幅改善,营收同比增长35.36%,归母净利润同比增长191.21%,主要受益于部分农药产品价格回暖和销量提升,外销收入表现亮眼 [2][9] 存储行业分析 - 企业级存储需求旺盛,国内互联网公司加大AI基础设施投入:阿里25Q2"AI+云"资本支出达386亿元,未来三年计划投入超3800亿元;百度25Q2资本开支同比增近80%至38亿元;腾讯25Q2资本开支同比翻倍至191.07亿元 [5] - NAND存储价格预计25Q4普涨,主要受企业级备货和手机新品需求推动,企业级存储价格预计个位数涨幅,手机嵌入式存储价格小幅上扬 [5] - DRAM市场景气度持续提升,DDR4和LPDDR4X价格因原厂停产旧制程产品大幅上涨,25Q4预计环比涨幅20%-50%:南亚科25Q3合约价环比涨70%,25Q4环比涨50%;华邦电25Q3环比涨60%,25Q4再涨20%,较25Q2低谷涨幅达80%-90% [6] - 利基存储市场供需格局改善:NOR Flash因AI数据中心和车用市场需求回暖,25Q4价格预计调涨双位数百分比并延续至2026年;利基DRAM因海外大厂淡出导致供不应求,涨价趋势预计持续全年 [7] - 端侧定制化存储需求崛起,堆叠方案在端侧应用逐步规模化,具备先发优势的公司有望受益 [7] 利尔化学业绩表现 - 2025年上半年营业总收入45.07亿元,同比增长35.36%;归母净利润2.71亿元,同比增长191.21%;扣非归母净利润2.72亿元,同比增长241.02% [9] - 第二季度营收24.21亿元,同比增长24.87%,环比增长16.05%;归母净利润1.18亿元,同比增长160.75%,环比下降23.22% [9] - 中期分红方案为每10股派现2元(含税),分红比率59.17% [9] - 农药原药业务收入同比增62.67%至27.57亿元,毛利率提升0.45个百分点至17.57%;农药制剂业务收入同比增12.49%至9.60亿元,毛利率提升3.17个百分点至20.54% [10] - 外销收入同比增69.43%至23.45亿元,内销收入同比增11.12%至21.62亿元 [10] - 整体毛利率18.53%,同比提升1.43个百分点;期间费用率优化,销售/管理/研发费用率分别下降0.21/1.79/1.37个百分点,财务费用率因汇兑收益减少上升0.40个百分点 [11] - 精草铵膦产能持续扩张,湖北利拓10000吨/年精草铵膦原药及配套工程项目稳步推进 [12] 市场指数表现 - 上证综指收盘3821.83点,跌0.18%;深证成指收盘13119.82点,跌0.29%;沪深300收盘4519.78点,跌0.06%;创业板指收盘3114.55点,涨0.21% [3] - 行业表现分化:银行涨1.52%、煤炭涨1.11%、电力设备涨0.43%;社会服务跌3.11%、商贸零售跌2.90%、计算机跌2.39% [4] 月度金股组合 - 9月金股组合包括京沪高铁、桐昆股份、雅克科技、宁德时代、恒瑞医药、三友医疗、北京人力、菲利华、兆易创新、鹏鼎控股 [4]