美团小美
搜索文档
进入2026年,AI开始显露残酷一面
36氪· 2026-02-11 07:37
AI行业未来生态格局展望 - 行业可能呈现三级生态格局:第一级是通用AI助手,提供基础能力;第二级是垂直领域的AI服务;第三级是提供个性化细分技能的庞大创造者群体 [1][7] - 2025年的AI硬件创新主要为“大脑和身体”构建物理载体,例如阿里的夸克AI眼镜、千问个人助手以及豆包AI手机 [7] - 2026年将见证更多AI硬件产品出现,不仅承载基础能力,还可能承载垂直领域的AI服务,如3D打印机、桌面机床、健康监测手表和戒指等 [9] 2025年行业趋势回顾与特征 - 2025年行业趋势快速诞生与轮换:年初DeepSeek引发全民AI热潮,上半年Agent创业火热,下半年Sora2、Gemini3、Kimi K2等模型轮番登场,年末有红包大战和Seedance2.0刷屏 [3] - 用户习惯迅速AI化:AI助手对传统搜索的替代加速,许多人已习惯向AI获取答案;入口与垂类Agent的组合正在蚕食传统“App+算法推荐”的领地 [4] - 明星产品生命周期短暂:承接DeepSeek红利的元宝经历短暂爆发后沉寂,Fellou和Youware也快速淡出舞台中心,行业变化极快 [5] - 部分趋势未完全验证:大模型发展未进入平台期,基础模型创新仍是重要变量;一人公司或超级个体时代尚未完全到来 [6] 2026年行业发展趋势预测 - 软硬件领域将出现创新尝试爆发,通过快速汰换寻找真正具备实用价值的产品市场匹配 [6] - 大厂更确定性的资源投入将加速某些赛道的淘汰进程,甚至奠定入口之争的最终格局 [6] - 非大厂赢得竞争的关键在于获得时间差,通过更前置的用户沟通和更定制化的迭代优化来建立高忠诚度用户圈子 [6] - AI工具的优化升级将带来更繁荣的创造生态,每个框架型AI产品都可能聚拢一个垂直的创造者生态 [6] 大厂战略布局与竞争态势 - 字节跳动在2025年全面释放AI转型力量:豆包日活破亿,豆包大模型日均Tokens使用量超63万亿,Seedance2.0和SeeDream4.0实现能力跃升 [10] - 阿里巴巴通过整合促发展:在to C领域进行AI化整合,推出夸克AI眼镜和千问,并以此支撑其参与入口决赛 [12] - 腾讯通过关键人物调整寻求突破:投入资源提升元宝市场占有率,并期待通过更新AI领军人物或微信找到拥抱AI时代的方式 [12] - 百度进行业务调整以维持牌桌地位:新设基础模型与应用模型研发部,合并文库和网盘成立个人超级智能事业群组,并在春节投入5亿元红包将用户迁移向文心助手 [12][13] - 2026年大厂竞争将更激烈,创始人表态成为关键风向标,各公司均强调AI业务的重要性 [13] 垂类AI服务与创业公司机会 - 垂类企业和创业公司聚焦AI服务生态第二级机会:京东、美团、滴滴等推出Agent化服务,如京东AI购、美团小美AI点外卖、滴滴出行Agent [14] - AI创业公司和超级个体在细分领域寻找机会:涵盖AI玩具、AI视频、AI眼镜等领域,例如Ropet、可豆陪陪、可灵、微光科技等 [14] - 成功的关键在于强化两种能力:搭建垂类服务框架的能力(如奇点灵智的多奇产品)以及习惯“Build in Public”(公开构建)的前置用户沟通能力 [15][17] - “Build in Public”模式通过社区沟通(如AMA)获取反馈,降低试错成本,快速验证需求,并构建用户忠诚度以应对大厂竞争 [17] AI赋能内容与创造者生态 - AI推动内容创作领域繁荣:可灵、Vidu等AI视频模型支撑AI漫剧发展,可灵3.0服务专业创作者,Seedance2.0提供面向C端的新视频体验 [18] - AI工具降低多领域创造门槛:线上,秒哒、灵光等产品允许用一句话生成轻应用;线下,AI 3D模型发展降低设计3D打印图的门槛 [19] - AI将催生庞大的第三级创造者群体:他们分散、非持续产出,负责用AI搭建满足极致细分个性化需求的技能或服务,其产出可能替代线上小程序的作用 [19] - AI带来的新创造工具让普通人拥有“爱迪生时刻”,创造力得到极大释放 [19]
阿里甩出王炸,千问打通电商外卖,流量格局要变天?
36氪· 2026-01-15 19:38
阿里巴巴千问App AI购物功能上线 - 千问App于1月15日宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,实现点外卖、购物、订机票等AI购物功能,并已面向所有用户开放测试 [1] - 该功能依托阿里生态,能够完成真实生活的复杂任务,被称为“全球首个能完成真实生活复杂任务的AI助手” [1] - 上线两个月,千问C端月度活跃用户已经突破1亿 [1] AI购物的核心功能与体验 - 用户可通过自然语言对话直接下单,例如点咖啡,千问会通过淘宝闪购提供服务,推荐附近商品,并自动匹配最大优惠,体验流畅 [2][5][6][7][8][11][12][15][16][17][18][19] - 千问App能根据用户真实需求(如“下周准备四姑娘山徒步,需要哪些装备”)生成包含具体商品的完整购物清单,并直接推荐优选商品(如凯乐石MT5登山鞋),实现从消费决策到交易的闭环 [22][23] - 对于模糊意图(如“想给爸妈家买个扫地机器人,预算2000-4000,家里还有只猫”),千问能精准推理出“防缠绕”、“高温杀菌”等隐含需求,并基于真实交易数据给出客观推荐 [23][24] - 在旅游领域,千问可自动拆解任务(如“规划全家老小7天6晚的三亚深度游”),调用淘宝/天猫、飞猪、高德等生态服务,生成完整方案 [25] - 在办公领域,千问能根据指令自动编写代码(如“做个抽奖小程序”),并能批量处理100张发票图片,自动识别、录入、统计并生成报销表格 [26] - 在教育领域,千问接入海量中小学真题库,可根据“城市-年级-科目-薄弱点”精准生成练习卷,并自动分析知识漏洞,生成“举一反三”的变式题 [27] - 千问具备超400项AI办事功能,将阿里巴巴的生态资源与AI的规划、理解、执行能力深度结合,处理的核心单元是“生活场景”而非单一“商品” [27] 行业趋势:从对话到交易 - 2025年至2026年,全球大模型厂商集体迈出从“对话”到“交易”的关键一步,通用大模型通过嵌入商品链接、推出即时结账功能,直接切入电商交易环节 [1] - AI与购物、生活服务打通,将对话能力直接转化为交易能力,已成为全球共识 [29] 海外主要厂商布局 - **OpenAI**:于2025年4月在ChatGPT引入商品推荐功能,9月推出“即时结账”功能,用户无需跳转即可在对话中直接购买Etsy和Shopify的商品 [29] - ChatGPT电商商业模式基于商品推荐的“自然相关性”排序,不收取广告费,仅在交易成功后从商家端抽取少量佣金 [29] - 数据显示,ChatGPT每周产生约7560万条商品相关对话,相当于一个年接收近40亿次查询的超级市场,流量转化效率被认为可以达到传统搜索引擎的4.4倍 [29] - **谷歌**:于2026年1月12日公布全新的通用商务协议,覆盖从商品发现到售后支持的全环节,旨在构建以自身AI和支付系统为核心的新生态,已吸引Shopify、沃尔玛、Visa、Stripe等伙伴 [30] - **亚马逊**:选择固守与深化战略,其购物助手Rufus深度集成于平台内部,核心目标是提升站内转化与用户停留,本质是对自家生态的AI化升级,同时极力防范外部AI对其商品数据的抓取 [30] - **Shopify**:持拥抱态度,通过为OpenAI等提供实时商品数据,使百万商户能接入新的AI流量入口,视其为引入增量需求的机遇 [30] 国内主要厂商布局与路线 - 国内大模型的电商探索根植于固有的“生态割据”,呈现出鲜明的平台内生性 [31] - **阿里巴巴(千问)**:是阿里整个生活服务生态的决策代理,能力根植于淘宝/天猫、飞猪、高德、支付宝等生态,实现从需求理解到支付履约的全流程闭环 [31] - **京东**:在2025年底内测独立App“京东AI购”,整合零售、外卖、超市、健康等业务,打造“对话即服务”的超级入口,将供应链与履约能力封装为统一的AI助手界面 [31] - **抖音(豆包)**:与抖音电商生态深度捆绑,用户对话中可直接生成抖音商城的商品卡片并完成购买,覆盖母婴、美妆、家居等高频品类,并接入本地生活团购,用AI对话重构抖音货架 [32] - **腾讯(元宝)**:在短暂尝试接入京东电商后,将功能收敛至微信生态内,仅支持跳转视频号小店等内容,反映了强化微信内部商业闭环的战略选择 [32] - **美团**:于2025年9月推出生活服务型AI“小美”独立App,功能包括一句话点咖啡、点外卖等,接入美团核心业务,结合实时数据推荐最优方案,旨在打造懂生活的智能助手 [32] - **其他模型(如Kimi、文小言)**:目前大多采取相对克制的“跳转链接”模式,仅为电商平台导流,自身不介入交易,属于浅层流量合作 [32] - 目前AI电商路线有两条主线:海外围绕开放协议与标准争夺下一代电商入口;国内则是互联网巨头在既有生态边界内利用AI强化控制、升级效率 [33] 行业影响与未来竞争格局 - 这场由技术驱动的变革,为高昂的模型研发成本找到了新的商业化路径,并可能冲击维持了数十年的电商流量分配与权力格局 [1] - 巨头的布局是争夺未来十年乃至更久的生活覆盖边界,争分夺秒地将核心业务嵌入由AI驱动的“生活操作系统”中 [33] - 对于小红书、拼多多、唯品会等平台,面临被“管道化”的风险,需决策是深度嵌入其他“管家”系统,还是利用AI将自身独特优势强化到极致,成为“管家”绕不开的“王牌专家” [33]
国信证券晨会纪要-20250923
国信证券· 2025-09-23 09:05
核心观点 - 数据中心电力设备板块普遍上涨,UPS、HVDC和BBU涨幅领先,科华数据、中恒电气和欣旺达表现突出[7] - 电网投资1-7月累计同比增长12.5%,特高压招标环比增加151%,中标金额13.0亿元[9] - 风电招标容量68.6GW同比下降13%,但1-7月新增装机53.67GW同比增长79.4%[12][13] - 人工智能领域多家公司推出新产品和模型,阿里开源DeepResearch模型,美团公测AI Agent"小美"[14][15] - 8月空调产销好于预期,内销增长1.2%,出口下降4.2%,家电出口额下降6.2%[17][18] - 8月规上工业发电量同比增长1.6%,广东发布新能源上网电价市场化改革方案[21] - 潼关黄金资源量55吨,2024年净利润2.11亿港元同比增长310%,与紫金矿业签署黄金流协议[23][24][25] 电新行业 - AIDC电力设备板块近两周涨幅前三为UPS(+21.0%)、HVDC(+20.7%)和BBU(+15.9%),科华数据(+34.6%)、中恒电气(+27.2%)和欣旺达(+24.3%)表现突出[7] - 2025年有望成为全球AIDC建设元年,800V HVDC和固态变压器有望逐步应用[7] - 变压器/开关柜业务公司包括金盘科技、明阳电气等,UPS/HVDC业务公司包括中恒电气、科士达等[8] - 2025年1-7月电网工程投资完成额3315亿元,同比增长12.5%[9] - 国网特高压项目第三次设备采购中标金额13.0亿元,特变电工中标4.0亿元占比30.5%[9] - 国网输变电设备第四次变电设备中标金额141.2亿元,同比增长16%[9] - 取向硅钢价格环比下跌3.7%,线缆级EVA价格上涨3.5%[10] - 电网设备板块涨幅前三为线缆部件及其他(+11.8%)、电网自动化设备(+5.1%)和输变电设备(+4.5%)[10] 风电行业 - 2025年至今风机累计公开招标容量68.6GW,同比下降13%,陆上风机平均中标价格1533元/kW[12] - 2025年1-7月新增风电装机53.67GW,同比增长79.4%,累计装机574.87GW占比15.7%[13] - 2025年1-8月风电整机制造商中标规模98.19GW,金风科技(17.43GW)、运达股份(15.35GW)和远景能源(14.97GW)领先[13] - 环氧树脂价格环比上涨9.9%[13] - 风电板块涨幅前三为轴承(+14.9%)、整机(+12.5%)和叶片(+11.7%),金雷股份(+20.1%)、五洲新春(+19.4%)和运达股份(+17.6%)表现突出[13] - "十五五"期间年均海风装机有望超20GW,25年陆风装机有望达100GW[13] 互联网与人工智能 - 百度AI搜索月活登顶国内第一,腾讯推出混元3D Studio,谷歌将Gemini添加到Chrome浏览器[14] - 可灵AI数字人支持1分钟视频生成,高德AI出行智能体月活突破4亿[14] - 美团首款AI Agent"小美"公测,搭载自研模型LongCat-Flash-Chat[14] - 阿里开源深度研究Agent模型DeepResearch,参数30B,在多个评测集取得SOTA成绩[15] - 字节跳动发布Seedream4.0图像创作模型,阿里开源动作生成模型Wan2.2-Animate[15] - 广东支持AI融合机器人开辟陪伴玩具新市场,四川将建"算力超市"[16] 家电行业 - 8月家用空调产量1288.1万台同比增长9.4%,总销量1302.3万台同比下降1.0%[17] - 内销773.7万台同比增长1.2%,出口528.7万台同比下降4.2%,实际产销好于排产预期[17] - 家电出口额同比下降6.2%,洗衣机、吸尘器增长超10%,冰箱出口增长4.4%,空调出口下降23.7%[18] - 美国家电零售额8月同比增长2.6%,电子家电店零售库存同比增长3.0%,库销比1.54[19] - LME铜、铝价格周环比分别下降0.9%和0.4%,冷轧价格周环比上涨3.5%[20] 公用环保行业 - 8月规上工业发电量9363亿千瓦时同比增长1.6%,1-8月累计64193亿千瓦时同比增长1.5%[21] - 广东新能源上网电价市场化改革方案规定存量项目电价0.453元/千瓦时,海风和光伏项目分别组织竞价[21] - 新型储能容量电价标准介于100至330元/千瓦·年之间,内蒙古和新疆采用基于放电量的补偿方式[22] - 推荐华电国际、上海电力、龙源电力、三峡能源等公用事业标的,以及光大环境、聚光科技等环保标的[22] 潼关黄金 - 公司保有金资源量55吨,平均品位8.26克/吨,2024年实现金矿产量2.5吨[23] - 2024年营业额16亿港元同比增长7%,净利润2.11亿港元同比增长310%[24] - 开采业务收入13亿港元占比81.2%,毛利5.2亿港元占比近100%[23] - 与紫金矿业签署黄金流协议,紫金预付2500万美元,公司承诺9年交付422公斤黄金[25] - 预计2025-2027年归母净利润7.8/10.5/12.6亿港元,同比增长269%/34%/21%[26] 市场数据 - 上证综指收盘3828.57点上涨0.22%,深证成指收盘13157.97点上涨0.66%,科创50收盘1408.64点上涨3.37%[2] - 道琼斯指数收盘33597.92点涨跌幅0%,纳斯达克指数收盘10961.46点下跌0.48%[4] - 欧元兑美元1.18上涨0.47%,美元兑人民币7.22下跌0.13%[4] - 黄金收盘价835.38上涨1.03%,白银收盘价10136.00上涨2.35%[27] - 11月PPI同比下降2.9%,CPI同比99.4,新增人民币贷款5216.0亿元[28]
人工智能周报(25年第38周):阿里开源深度研究 Agent 模型 Deep Research,美团首款 Agent 小美公测-20250922
国信证券· 2025-09-22 19:02
行业投资评级 - 行业评级为"优于大市" [1][4] 核心观点 - AI对互联网巨头广告业务、云计算场景和企业效率提升作用显著 腾讯广告Q2保持20%增长 阿里云增速环比提升至26% 腾讯、腾讯音乐、快手等公司利润端经营效率改善明显 [2] - 百度、阿里等互联网公司推出自研芯片 完成芯片、模型、应用全链条布局的云厂商有望持续提升市场份额 [2] - 建议继续聚焦AI主线 推荐腾讯控股、阿里巴巴、快手、百度集团、美图公司 以及与宏观经济关联度较低的腾讯音乐和网易云音乐 [2] 产品应用动态 - 百度AI搜索月活达3.65亿 居国内第一 [1][15] - 腾讯推出专业级AI 3D工作台混元3D Studio [1] - 谷歌将Gemini添加到Chrome浏览器支持AI搜索 [1] - 可灵AI数字人上线 支持最长1分钟1080p/48FPS视频生成 最低价0.12元/秒 [1][17] - 腾讯企点营销云三大升级 提升营销效率 [1][18] - 飞猪AI"问一问"推出拍照讲解功能 [1][18] - 腾讯元宝日提问量达年初月总量 IMA知识库文件突破1亿 QQ浏览器AI月活较4月增长17.8倍 [1][19] - 腾讯AI能力全面开放 适配主流国产芯片 [1][19] - 高德AI出行智能体"小高老师"月活突破4亿 日调用量达12亿次 [1][20] - 美团首款AI Agent"小美"公测 搭载自研模型LongCat-Flash-Chat 提供本地生活服务 [1][20] - Kimi-K2-0905模型在RooCode开源榜单排名第一 代码能力测评达94% [1][21] 底层技术进展 - 阿里开源深度研究Agent模型DeepResearch 参数30B(激活3B) 多个评测集SOTA [2][22] - 字节跳动发布Seedream4.0图像创作模型 支持文生图、图生图等功能 [2][22] - 阿里开源动作生成模型Wan2.2-Animate 支持照片动画化和角色替换 [2][23] - 阿里发布下一代基础模型架构Qwen3-Next 开源Qwen3-Next-80B-A3B系列模型 800亿参数激活30亿 训练成本仅为Qwen3-32B的十分之一 [2][24] 行业政策支持 - 广东支持AI融合机器人开辟陪伴玩具新市场 推动"AI+玩具+机器人"跨界融合 [2][25] - 四川将建"算力超市" 目标2027年算力总规模达40EFLOPS 智能算力占比不低于60% 综合利用率不低于70% [2][26] AI网站流量数据 - ChatGPT周访问量1375.00百万 环比增长1.03% [10] - Gemini周访问量257.00百万 环比增长24.27% [10] - 通义千间周访问量6.98百万 环比增长25.38% [10] - 文心一言周访问量1.47百万 环比下降11.99% [10] - 教育类AI网站访问量增长显著 Quizlet环比增长12.73% Duolingo环比增长7.51% [10] 重点公司估值 - 腾讯控股总市值5,886,901百万港元 2025E PE 21.9 [3] - 阿里巴巴总市值3,034,456百万港元 2025E PE 22.5 [3] - 美团总市值649,609百万港元 2026E PE 19.2 [3] - 百度集团总市值361,647百万港元 2025E PE 16.2 [3] - 快手总市值327,407百万港元 2025E PE 15.2 [3] - 腾讯音乐总市值38,338百万美元 2025E PE 31.6 [3] - 网易云音乐总市值59,949百万港元 2025E PE 17.8 [3] - 美图公司总市值42,374百万港元 2025E PE 54.5 [3]
淘宝、美团、支付宝都在做AI导购,能不能用你的消费数据?
21世纪经济报道· 2025-09-17 12:58
行业趋势:消费平台加速部署AI智能体 - 多家消费平台正在将AI智能体嵌入核心产品 淘宝内测AI助手实现多轮对话导购 美团推出独立App"小美"提供本地生活服务 支付宝推出国内首个"AI付"服务实现自动支付[1] 技术实现:AI导购的数据驱动机制 - AI导购系统高度依赖用户历史数据提升推荐准确性 美团"小美"通过对比用户历史订单推荐相似商品 淘宝"AI万能搜"根据浏览和购买记录生成个性化推荐[2] - 平台收集的数据类型包括浏览记录、搜索查询、加购数据、交易记录等敏感信息 美团收集浏览、搜索、点击、收藏、分享、评价数据 淘宝收集浏览记录、点击查看记录、搜索查询记录、收藏添加记录 瑞幸使用历史订单数据实现产品推荐[3] 合规要求:数据使用的双重监管框架 - 平台使用数据需通过合规文本和功能设计双重关卡 个人信息保护法要求明确告知并取得单独同意 算法推荐管理规定要求提供便捷关闭方式[5][6] - 当前平台已实施差异化合规方案 美团设置单独授权同意步骤 淘宝提供【购物偏好】实时开关功能 瑞幸需通过设置菜单统一关闭个性化推荐[6] 发展挑战:数据应用的风险与限制 - AI导购可能引发大数据杀熟和信息茧房问题 平台可能利用数据实施差异化定价 过度依赖AI推荐可能限制用户商品发现范围[9] - 多业务线接入增加数据安全管理复杂度 需防范越权访问和数据外泄风险 需确保跨生态参与方的数据分享获得用户充分授权[9]
腾讯研究院AI速递 20250915
腾讯研究院· 2025-09-15 00:01
OpenAI与微软合作及发展前景 - OpenAI与微软发布非约束性合作备忘录 涉及云服务托管 知识产权归属和AGI控制权等核心问题 但最终合作条约仍未确定[1] - OpenAI预计成立估值超1000亿美元的公益公司(PBC) 非营利机构将持有股权并保持控制权 成为全球资源最充足的慈善组织之一[1] - OpenAI面临巨大成本压力 预计2029年前烧掉1150亿美元 仅2030年就需花费1000亿美元租赁服务器 未来几年几乎没有容错空间[1] AI影视内容创作突破 - 前谷歌X团队创立全球首家AI原生影视工作室Utopai 两部电影项目已带来1.1亿美元收入 锁定戛纳电影节[2] - Utopai突破AI视频生成三大难题:一致性 可控性和叙事延续性 实现毫秒级精准对口型 模型内置物理规律的3D数据训练[2] - 公司定位为内容+AI而非纯工具供应商 已获好莱坞顶级资源支持 为电影《科尔特斯》邀请奥斯卡提名编剧 八集科幻剧《太空计划》成功预售欧洲市场[2] 音乐生成技术进展 - MiniMax发布新一代音乐生成模型Music 1.5 支持长达4分钟的完整歌曲创作 具备强控制力 人声自然饱满 编曲层次丰富和歌曲结构清晰四大突破[3] - 模型支持"16种风格×11种情绪×10个场景"自定义音乐特征 能生成不同声线唱腔 并支持中国民族乐器生成 真正实现Intro/Verse/Chorus段落分明[3] - 基于MiniMax多模态自研能力积累 同步面向全球开发者提供API 适用于专业音乐创作 影视游戏配乐 虚拟偶像单曲和企业品牌专属音频内容多种场景[3] 本地生活AI应用发展 - 美团首个AI Agent产品"小美"开启公测 通过自然语言指令点咖啡 找餐厅 规划早餐菜单 大幅简化点餐流程[4] - 小美基于美团自研Longcat模型(5600亿总参数) 能根据用户口味偏好和地理位置实现从选品到支付的全自动操作 并记忆用户习惯[4] - 与Agent热潮相呼应 但目前仍有局限性:无法处理复杂模糊需求 无法进行语音回复 未来将在个性化和主动服务能力上进一步优化[4] 语音合成技术创新 - 小红书智创音频技术团队发布新一代对话合成模型FireRedTTS-2 解决现有方案灵活性差 发音错误多 说话人切换不稳定和韵律不自然等问题[5] - 模型在数百万小时语音数据上训练 支持逐句生成与多说话人音色切换 能够通过一句语音样本模仿音色和说话习惯 流式解码可实时输出音频[6] - 在主客观评测中均达行业领先水平 开箱即用支持中文 英语 日语等多语言 是AI播客等对话合成应用的工业级解决方案 已开源代码与模型权重[6] 开源语音合成技术突破 - 哔哩哔哩开源新一代零样本语音合成模型IndexTTS2 实现毫秒级精准时长控制 让AI配音能严丝合缝对上口型[7] - 模型采用"通用且兼容自回归架构的语音时长控制方法" 达到0.02%的时长误差率 同时通过两阶段训练策略实现情感和说话人身份的"解耦"[7] - 系统由T2S(文本到语义) S2M(语义到梅尔频谱)及BigVGANv2声码器三大核心模块组成 支持用大白话控制情绪 在跨语言产业应用上具有重大意义[7] 小型高效模型发展 - Meta AI发布MobileLLM-R1系列小参数高效模型 包括140M/360M/950M三种规模 专为数学 编程和科学问题优化[8] - 最大的950M模型仅使用约2T高质量token预训练(总训练量不足5T) 性能却与使用36T token训练的Qwen3 0.6B相当或更佳[8] - 在MATH基准上比Olmo 1.24B高五倍 比SmolLM2 1.7B高两倍 Token效率和性价比极高 完全开源模型中创造新标杆[8] AI数学研究突破 - 名为"Gauss"的AI Agent仅用三周时间完成了陶哲轩团队18个月未能完成的数学挑战——在Lean中形式化强素数定理(PNT)[9] - 该Agent由Math公司开发 生成约25000行Lean代码包含上千个定理和定义[9] - Gauss能协助顶级数学家进行形式验证 突破了复分析核心难题 团队计划在未来12个月让形式化代码总量提升100到1000倍[9] AI产业格局演变 - OpenAI推出GPT-5 首次真正让人感觉与博士级专家对话 内置"思考"能力 统一模型取代复杂选择界面 显著减少幻觉[10] - 发布前其他玩家也纷纷推出战略性新品:Anthropic推出Claude Opus 4.1瞄准高风险企业场景 Google推出Gemini 2.5 Deep Think和Genie 3分别强化推理和模拟能力[10] - 新AI版图已重新排布:OpenAI同时占据开放与封闭AI生态主导地位 Anthropic专注企业级精准稳定 Google专注基础研究长期布局 Agentic AI 先进推理和端侧能力已成顶尖模型核心特性[11] 科研AI战略布局 - DeepMind科学团队只瞄准三类问题:具有变革性 公认5-10年内无人能解 但DeepMind有信心快速攻克的"不可能任务"[12] - 团队从专用模型到通用智能的进化:将AlphaProof等专用数学模型的能力成功转移到Gemini通用模型 使DeepThink实现IMO金牌水平[12] - 未来目标是打造"科学API" 让全球科学家共享AI能力 从AlphaFold数据库到AI Co-scientist 降低科研门槛 使普通人也能做出诺贝尔奖级贡献[12]
小而美的生活秘书!美团Agent落地生活服务
量子位· 2025-09-13 12:02
核心观点 - 美团推出AI应用"小美"作为智能生活秘书 通过自然语言交互简化生活服务操作流程 实现"动嘴点外卖"等便捷功能 [1][6][62] - 该应用基于美团自研大模型LongCat构建 结合平台实时数据与系统深度协同 在本地生活垂类实现高精度任务执行与个性化服务 [50][52][54] - 相比传统手机助手 小美突破图形界面限制 通过对话式交互减少操作跳转 并具备需求理解 智能拒绝和习惯学习能力 [7][13][61] 产品功能特性 - 核心服务覆盖外卖点单 餐厅推荐 订座管理等生活场景 支持语音/文字输入 自动填充地址 优惠券等订单信息 [4][16][22] - 支持模糊需求处理:可根据历史订单偏好推荐餐食 响应"三人从不同地点同时到达的火锅店"等复杂需求 [30][33][34] - 具备安全机制:对"羊肉过敏点羊肉串"等不合理要求主动拒绝并提供替代方案 [38][40] - 支持规律性事务管理:可设置每日咖啡配送等智能计划 并主动提醒调整 [44][45] 技术实现架构 - 搭载自研大模型LongCat:综合评分超80 支持256K超长上下文处理 在中文测评位列第一梯队 [51][53] - 数据体系整合:实时调用用户行为 商家服务 优惠变化 配送能力等多维度动态数据 [54][55][56] - 系统深度协同:模型响应直接转换为服务执行路径 通过流程调度系统自动补全缺失信息(如地址 时间) [58][59] 交互体验创新 - 全流程无界面跳转:从需求确认到支付均在对话界面完成 大幅降低操作门槛 [13][20][63] - 拟人化交互:通过语气调整 习惯学习形成"熟悉感" 如主动将冰美式调整为热美式接近用户需求 [15][64][65] - 异常处理能力:对未开通线上订座的商家提供联系方式 对无法修改的订单参数明确提示限制 [18][35] 行业应用意义 - 实现AI技术与本地生活服务(WAIMAI)深度结合 证明垂类场景可成为大模型落地的高价值方向 [5][52] - 重新定义人机交互范式:从"人适应工具"转变为"工具适应人" 通过自然对话替代传统图形界面操作 [62][63]
美团首款AI Agent产品“小美”公测;微信AI搜索入口优化:目前仍处于灰度测试期丨AIGC日报
创业邦· 2025-09-13 09:15
微信AI搜索功能优化 - 微信搜索框新增"深度思考"模式和图片文件上传功能 提供更精准智能的搜索结果 [2] - 新增"AI搜索"和"问元宝"入口 丰富用户智能搜索选择 [2] - 目前AI搜索功能仍处于灰度测试阶段 未覆盖用户可继续使用原有搜索功能 [2] 美团AI Agent产品进展 - 美团首款AI Agent产品"小美"App于9月12日正式开启公测 [2] 字节跳动图像模型技术突破 - 字节跳动Seedream 4.0模型登顶国际文生图及图像编辑排行榜榜首 超越谷歌Gemini 2.5 Flash [2] - 该模型集成文生图、图像编辑、多图融合等能力 支持4K分辨率图像生成 [2] - 模型已应用于豆包App、即梦AI、扣子等产品 并通过火山引擎向企业客户开放 [2] 小米语音合成技术创新 - 小米AI实验室发布基于Flow Matching架构的ZipVoice系列语音合成模型 [2] - ZipVoice解决零样本语音合成模型参数量大和合成速度慢的痛点 [2] - ZipVoice-Dialog突破现有对话语音合成模型在稳定性和推理速度上的瓶颈 [2] 行业创新活动与数据服务 - 创业邦开启"2025早期AI创新先锋50强"招募 入选者可直面200多家投资机构 [3] - 睿兽分析会员提供AI、汽车、智能制造等行业日报、图谱和报告等服务 [5] - 平台覆盖507家以上国家高新技术企业 包含33万条创投人物和10万条基金数据 [7]