Workflow
生成式AI
icon
搜索文档
推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本
机器之心· 2025-06-19 17:30
核心观点 - 推荐系统正经历由大型语言模型(LLM)驱动的生成式革命,端到端架构成为解决传统级联架构瓶颈的关键[2] - 快手提出的OneRec系统首次实现端到端生成式推荐全链路重构,在效果与成本上实现双赢[2][8] - OneRec已在快手双端应用,承接25% QPS,提升停留时长0.54%/1.24%,LT7显著增长[2][33] 技术架构创新 - **架构设计**:采用Encoder-Decoder框架,将推荐转化为序列生成任务,Encoder压缩用户行为序列,MoE架构Decoder实现参数扩展[6][11] - **多模态分词**:首创协同感知方案,融合视频标题、标签、语音转文字等多维信息,分层语义编码(RQ-Kmeans三层ID)[13][14] - **强化学习整合**:通过P-Score奖励模型(个性化融合目标预测值)和ECPO优化算法,提升用户停留时长而不损失曝光量[19][22][25] 性能与效率突破 - **算力利用率**:训练/推理MFU提升至23.7%/28.8%,较传统精排模型(4.6%/11.2%)提升3-5倍[27][31] - **成本优化**:OPEX降至传统方案的10.6%,关键算子数量压缩92%至1,200个[27][31] - **训练加速**:自研SKAI系统优化Embedding训练,UGMMU减少kernel数量,时间加权LFU算法提升缓存效率[36] 实验效果 - **短视频场景**:AB测试显示停留时长提升0.54%/1.24%,LT7增长0.05%/0.08%,交互指标全面正向[33] - **本地生活场景**:GMV增长21.01%,订单量提升17.89%,新客获取效率提高23.02%,已100%全量上线[34] - **Scaling Law验证**:参数规模从0.015B增至2.633B时,训练损失显著下降,符合大模型扩展规律[15] 未来方向 - **多模态桥接**:需构建用户行为与LLM/VLM的原生融合架构[38] - **奖励系统完善**:当前设计较初级,需强化对用户偏好和业务需求的引导[38] - **推理能力提升**:Infer阶段Scaling能力不足,需进一步优化[38]
2025亚马逊云科技中国峰会召开,合合信息AI智能终端助力高效管理云资源
格隆汇· 2025-06-19 15:24
云计算与AI技术融合趋势 - 云计算产业规模不断扩大,云资源管理成为行业难题,2025亚马逊云科技中国峰会聚焦云计算与生成式AI技术融合 [1] - 合合信息发布业内首个AI agent跨平台云资源智能管理终端Chaterm,通过对话式终端管理工具实现云资源智能化管理 [1] - Chaterm核心代码已全面开源,推动云资源管理领域透明可控 [1][6] AI Agent在云资源管理的创新应用 - 传统终端管理存在操作繁琐、效率低下问题,AI技术推动Vibe Coding实现对话式开发体验 [2] - Chaterm将AI Agent能力应用于云资源管理终端,支持自然语言交互实现精准调度 [2][4] - 产品提供"辅助驾驶"和"自动驾驶"两种模式,提升开发和管理效率,例如GPU集群环境构建时间从数小时缩短至十几分钟 [4] 大规模服务器管理的技术突破 - 程序员日常需管理数十至上千台服务器,传统部署方式耗时且低效 [5] - Chaterm具备批量管理远程服务器能力,支持个性化语法高亮和快捷命令,实现"一次配置,多端通用" [5] - 跨平台兼容性支持MAC、WINDOWS、LINUX系统,降低混合IT环境运维复杂度 [5] 数据安全与开源策略 - 合合信息全面开源Chaterm核心代码,允许开发者观察算法逻辑并进行定制化修改 [6] - 开源策略旨在实现云资源管理透明可控,同时保障用户隐私和数据安全 [6]
喝点VC|a16z最新行业分享:顶级初创公司的衡量标准改变,现在正是打造“应用层AI软件公司”的最佳时机
Z Potentials· 2025-06-19 11:54
增长标准的变化 - 生成式AI时代初创公司增长显著加速,顶级案例如Lovable六个月内实现5000万美元收入、Cursor首年1亿美元收入、Gamma在融资不足2500万美元时达成5000万美元收入 [2] - 传统企业级初创公司前12个月ARR标准为100万美元,消费类公司需积累数百万用户后通过广告盈利,而当前AI公司中位数首年ARR已达210万美元(企业级)和420万美元(消费级) [2][7][10] - 企业级AI初创公司增长分位数:底部25%首年ARR 120万美元,中位数210万美元,顶部25%达530万美元 [3][6] 融资与增长效率 - A轮融资时间大幅缩短:企业级中位数公司9个月内完成A轮(传统标准为12个月以上),消费级仅需8个月,顶部25%企业级公司仅需7个月 [3][7] - 融资效率反转:企业级AI公司A轮前融资中位数为400万美元,而消费级高达800万美元,但顶部25%消费级公司仅需310万美元 [3][7] - 速度成为护城河,初创公司需在种子轮到A轮间展示快速增长故事,即使未盈利也需突出交付和迭代速度 [10] 行业分化趋势 - 头部效应加剧:顶级企业级AI公司首年ARR达530万美元(中位数2.1倍),消费级顶部25%公司首年ARR 870万美元(中位数2.1倍) [3][7] - B2C模式突破:消费类AI公司营收指标超越B2B,部分公司通过自研模型实现阶跃式增长,新模型发布后收入激增 [12] - 用户行为差异:B2C转化率虽低于传统非AI产品,但付费用户留存率与传统持平,企业/消费者付费意愿均达历史高位 [13] 关键运营指标 - 后期融资中传统软件指标(活跃度、流失率)重要性上升,仅收入增长无法弥补用户参与不足或高流失问题 [11] - 消费级公司形态变革:1/3样本公司投入大额资金训练自有模型,收入增长呈现"发布-平台期-再发布"的周期性特征 [12] - 企业级公司首年ARR增长曲线显示,顶部25%公司在第12个月ARR达600万美元,较第6个月(200万美元)实现3倍增长 [6]
半导体ETF南方(159325)、科创芯片ETF南方(588890)盘中涨超1%,AI等新技术驱动,看好半导体三大投资机会!
搜狐财经· 2025-06-19 11:41
市场表现 - A股三大股指小幅低开 PCB概念和人形机器人概念股涨幅居前 [1] - 半导体ETF南方(159325)涨0.98% 科创芯片ETF南方(588890)涨0.73% [1] - 炬芯科技涨超12% 扬杰科技涨超5% 中科飞测涨超3% 中芯国际和寒武纪-U跟涨 [1] 政策动态 - 证监会发布意见 提出健全科创板投融资功能 丰富指数及ETF品类 将科创板ETF纳入基金投顾配置范围 [1] - 研究推出更多科创板ETF期权和期货期权 为中长期资金提供风险管理工具 [1] 行业观点 - 中金公司认为 上半年科创风格扩散 AI产业链相关的人工智能、机器人、半导体等领域表现较好 创新药、新能源车、国防军工等也有不错表现 [1] - 华泰证券看好三大半导体设备投资机会:生成式AI推动的先进工艺逻辑和封装需求 中国大陆先进工艺扩产 美国出口限制下中国设备份额"东升西降" [2] 投资工具 - 无股票账户投资者可通过科创芯片ETF南方(588890)连接基金(A:021607 C:021608)布局芯片板块 [2]
AI 破解 2025 年教育「不可能三角」
36氪· 2025-06-19 10:28
政策支持 - 国家层面构建覆盖人工智能教育全流程的制度框架,2017年国务院发布《新一代人工智能发展规划》,2025年5月教育部发布《中小学人工智能通识教育指南(2025年版)》和《中小学生成式人工智能使用指南(2025年版)》[4] - 地方层面积极探索AI与传统产业结合,如上海模速空间聚焦大模型创新企业需求,深圳发布《深圳市加快打造人工智能先锋城市行动计划(2025—2026年)》加快推进AI学科建设[5] - 政策推动形成学校-地方政府-各部门合力,AI人才培养逐步完善,技术应用广泛[6] 技术升级 - 生成式AI(如GPT、DeepSeek)成为教育智能化核心驱动力,在语言理解、逻辑推理等维度接近人类水平,赋能教育全流程[13] - DeepSeek大模型凭借强推理能力、开源特性和低成本优势成为行业技术升级转折点,众多教育企业争相接入[14] - 大模型自研+开源形成双向赋能路径,底层技术迭代推动教育多元场景落地[14] 产业链生态 - 上游以大模型厂商和云服务商为核心提供底层技术支持,中游聚焦教育场景落地实施,下游触达G/B/C端用户[6] - 教育科技机构可分为场景驱动的教育企业和AI技术企业两类,前者积极转型后者快速切入赛道[15] - 校园端、教企端、用户端多元发展,综合管理场景成为AI与教育深度融合重要阵地[17] 商业模式 - G端围绕政策驱动需求展开,B端提供机构定制化服务,C端满足个人学习需求,三者客户定位和产品形态差异明显[21] - 2025年中国AI+教育市场规模预计突破700亿元,2030年有望达3000亿元,复合增长率47%[22] - 国内企业正拓展海外市场,北美及东南亚需求旺盛,欧洲与中东潜力待开发[24] 企业动态 - 好未来、高途、网易有道等头部教育公司接入DeepSeek大模型,优化智能硬件、AI伴学助手等功能[14] - 教育科技机构如TAL好未来、猿力科技凭借教学数据优势训练完善模型,互联网公司如腾讯、百度通过流量和技术能力切入教育场景[8] - 硬件与软件结合解决方案在校内外广泛应用,校内提升教学效率校外提供个性化学习路径[19]
“中国版英伟达”摩尔线程完成上市辅导;MiniMax考虑赴港IPO丨新鲜早科技
21世纪经济报道· 2025-06-19 10:12
巨头动向 - OpenAI CEO Sam Altman透露GPT-5大概率将在2024年夏季发布,但可能因命名、安全测试或功能迭代延迟[2] - 苹果折叠屏iPhone预计2025年Q3末或Q4初由富士康启动生产,三星显示器2026年计划供应700-800万块折叠屏面板,苹果总订单量预计1500-2000万部[3] - 亚马逊CEO表示未来几年公司大量岗位将被AI替代,内部已使用生成式AI优化配送网络效率[6] - 马斯克旗下xAI每月烧钱达10亿美元,正寻求通过股权融资43亿美元及债务融资50亿美元[6] 技术突破 - MiniMax发布视频生成模型Hailuo 02,可生成1080p原生视频,训练效率提升2.5倍,参数量达上一代3倍[6][7] - 中国移动董事长杨杰预测硅基生命数量将超越人类,形成新的人口红利和360行[4] - 华为徐直军提出四大增长趋势:主播等高价值用户、高清视频、车联网、FTTR联接个体工商户[5] 半导体与硬件 - 英特尔计划裁减芯片制造部门15%-20%员工,全球裁员规模或超1万人[11] - 德州仪器宣布投资超600亿美元在美扩建半导体工厂,含得州两座新厂[12] - DDR4现货价6月涨幅超50%,8Gb颗粒从2.73美元涨至4.28美元,16Gb从6.1美元涨至9.5美元[16] - 太极实业子公司与SK海力士签署五年半导体后工序服务合同[14][15] 资本市场 - AI公司MiniMax考虑赴港IPO,2024年估值超25亿美元,获阿里领投6亿美元融资[17] - 摩尔线程完成IPO辅导验收,累计融资超45亿元[10] - 上海超导科创板IPO获受理,拟募资12亿元[17] - 中科昊芯完成Pre-B+轮融资,专注RISC-V架构DSP芯片[20] - 欧冶半导体完成B3轮融资,获舜宇产投等战略投资[21] 企业动态 - 京东宣布进军酒旅行业,推出三年0佣金酒店会员计划[8] - 奥比中光预计2025年1-5月净利润5500万元,同比增8643万元,营收增长117%[9] - 利扬芯片股东询价转让价定为15.59元/股,涉及658万股[13] - 华勤技术子公司2500万元认购半导体基金份额[18] - 日科化学合资成立智算公司,注资4000万元布局国产算力[19] 政策与产业 - 国家安排3000亿元特别国债支持以旧换新,已下达1620亿元[10]
苹果高管回忆芯片开发之路:自研是场豪赌 未来或用AI
凤凰网· 2025-06-19 09:59
苹果芯片战略 - 苹果硬件技术高级副总裁约翰尼·斯鲁吉透露公司计划利用生成式AI加速定制芯片设计 该技术对苹果设备至关重要 [1] - 苹果自2010年推出首款iPhone A4芯片后持续迭代 最新芯片已应用于Mac电脑和Vision Pro头显 [1] 芯片设计经验 - 公司强调必须采用最先进工具设计芯片 包括EDA行业巨头楷登电子和新思科技的最新AI驱动软件 [2] - 生成式AI技术被评估为具备显著提升生产力的潜力 可缩短设计周期并增加产出量 [2] - 2020年Mac转向自研芯片时采取"破釜沉舟"策略 未制定英特尔芯片备用方案 投入大量资源完成软件适配 [2] 行业合作动态 - 斯鲁吉在比利时接受半导体研发机构Imec颁奖 该机构与全球主要芯片制造商保持紧密合作关系 [1]
OpenAI发布Altman专访,首次大谈GPT-5、AGI;比尔·盖茨创办的核电公司完成新一轮融资,英伟达风投入局 | 全球科技早参
每日经济新闻· 2025-06-19 07:59
特斯拉Grok车载AI助手 - 特斯拉计划将AI助手Grok集成到车辆中 通过固件代码显示该功能将具备更逼真的交互体验 [2] - Grok将推出不同"个性"版本 完全可定制 根据驾驶员需求调整 [2] - 结合Robotaxi平台计划 Grok上线指日可待 [2] Meta智能眼镜 - Meta与依视路陆逊梯卡集团合作推出全新智能眼镜 涵盖Prada和Oakley等奢侈品牌 [3] - 眼镜搭载最新生成式AI技术 定价约360美元 [3] - 通过"Oakley|Meta"账号预告 6月20日正式揭晓 [3] Waymo Robotaxi - Waymo计划下个月重返纽约市 进行地图绘制与测试 [4] - 初始阶段配备人类驾驶员 因纽约州法律限制 [4] - 已申请自动驾驶许可 推动法律修改 [4] OpenAI产品动态 - GPT-5大概率今年夏天发布 可能因命名、安全测试等原因延迟 [5] - 提及o3模型、Deep Research智能体 对实现AGI至关重要 [5] - 其他创新产品包括Sora、DALL-E 3、ChatGPT Junior及5000亿美元"星际之门"项目 [5] 泰拉能源融资 - 完成新一轮6.5亿美元融资 累计私人融资超20亿美元 [6] - 英伟达旗下NVentures成为新股东 老股东盖茨、现代重工业继续投资 [6] - 获美国政府20亿美元拨款 用于建造美国首座商业化先进核电站 [7]
盘点生成式AI最豪“金主”:孙正义第一,一年投出840亿
36氪· 2025-06-19 07:44
生成式AI风投趋势 - 2022年Q1至2024年Q2期间,风投机构通过724轮交易向507家生成式AI初创企业融资850亿美元(约合人民币6103亿元)[2] - 2024年中期以来主导交易总额达524亿美元(约合人民币2762亿元),软银与Thrive Capital以200亿美元(约合人民币1436亿元)领跑[1][8] - 前九大机构过去一年74轮融资平均单轮规模达3.72亿美元(约合人民币26.7亿元),较2022-2024年中期的9600万美元(约合人民币6.9亿元)显著扩大[9] 头部风投机构表现 - 软银2022年以来牵头5轮交易总额120亿美元(约合人民币862亿元),2023年单年投资117亿美元(约合人民币841亿元)[5] - Thrive Capital同期牵头11轮89亿美元(约合人民币640亿元),2023年单年83亿美元(约合人民币597亿元)[5] - Andreessen Horowitz以48轮领投成为最活跃投资者,包括主导Scale AI 10亿美元(约合人民币72亿元)融资[1][9] 重点投资案例 - OpenAI获Thrive领投66亿美元(约合人民币474亿元)融资,估值1570亿美元(约合人民币1.2万亿元),软银后续追加100亿美元(约合人民币718亿元)投资[10] - Anthropic完成Lightspeed领投35亿美元(约合人民币251亿元)融资[10] - Greenoaks主导对Safe Superintelligence的20亿美元(约合人民币144亿元)早期投资[10] - Andreessen Horowitz连续三轮领投ElevenLabs,最新融资使其估值达33亿美元(约合人民币237亿元)[11] 行业投资特征 - 投资集中于生成式AI软件及服务领域,排除AI芯片和云服务提供商[3] - 资金明显向头部企业集中,OpenAI、Anthropic等大模型开发商获巨额融资[10] - Meta以143亿美元(约合人民币1028亿元)收购Scale AI 49%股份,提振投资者信心[12] - 市场呈现两极分化,头部企业持续融资而中小团队面临困难[13]
腾讯研究院AI速递 20250619
腾讯研究院· 2025-06-18 23:22
谷歌Gemini 2.5发布 - 谷歌发布Gemini 2.5全系列模型,其中Flash-Lite版本速度最快、性价比最高,输入仅0.1美元/百万token [1] - Gemini 2.5在玩宝可梦游戏时展现类人行为,生命值低时会"恐慌"导致推理能力下降 [1] - 2.5系列采用稀疏MoE架构,原生支持多模态和百万级token长文本,性能全面超越前代 [1] 微软三大算法突破 - 微软发布三大创新算法rStar-Math、LIPS和CPL,通过蒙特卡洛树搜索和代码增强CoT等方法突破大模型推理瓶颈 [2] - rStar-Math通过自我进化和Python代码验证提升数学推理质量,LIPS结合符号工具和大模型实现数学证明策略优化 [2] - CPL算法通过高层次抽象计划空间搜索和Step-APO学习关键步骤,显著提升模型跨任务泛化能力 [2] MiniMax视频模型海螺02 - MiniMax发布海螺02视频生成工具,可创建10秒1080P视频,在国际榜单图像生视频项目排名第2,超越谷歌Veo3 [3] - 海螺02实现逼真物理效果、精确物体交互和复杂杂技动作,支持多语言提示,10秒视频仅需一次生成 [3] - 国际视频生成榜单前五名中四家为中国厂商,展现中国在该领域的领先地位 [3] Meta智能眼镜战略 - Meta与意大利高端品牌Prada合作开发AI智能眼镜,拓展与EssilorLuxottica之外的时尚公司合作 [4] - Meta将于6月20日发布面向运动人群的Oakley智能眼镜,售价约360美元,具备更好的防风雨性能 [4] - 自2023年以来Meta与Luxottica已售出200万副Ray-Ban智能眼镜,计划到2026年底年产量提升至1000万副 [5] 罗永浩数字人直播 - 罗永浩数字人在百度电商首场直播吸引超1300万人次观看,GMV突破5500万元,部分品类超真人首秀数据 [6] - 百度慧播星技术实现"神形音容话"五维统一,通过剧本驱动多模协同,直播中AI调用知识库1.3万次 [6] - 百度计划追加10万个数字人名额和1亿元补贴,推动数字人直播产业规模化发展 [6] 大模型"六小龙"调整 - 大模型"六小龙"半年内22位高管密集离职,零一万物7位、百川智能和智谱AI各5位 [7] - DeepSeek低成本高性能冲击下,零一万物放弃训练大模型转向阿里云,百川智能基础模型进入静默期,阶跃星辰关闭冒泡鸭产品 [7] - 商业化成生存关键,六小龙需在开源大模型时代寻找差异化应用突围 [7] 港科广医学模型 - 港科大等发布首个医学世界模型MeWM,通过3D扩散模型模拟不同治疗方案下肿瘤形态演变,图灵测试准确率达79% [8] - 系统构建"策略生成-动态模拟-风险评估"闭环,在肝癌TACE治疗中F1-score达64.08%,接近专业医生水平 [8] - MeWM生存风险预测C-Index达0.752,融入医生决策可带来13%性能提升,实现从经验驱动到数据驱动的精准医疗转型 [8] Karpathy软件3.0观点 - Andrej Karpathy提出软件3.0(提示工程)时代正在取代1.0(代码编程)和2.0(神经网络),LLMs具备类似公用事业、晶圆厂和操作系统的多重属性 [10] - LLMs存在"锯齿状智能"(既能解决复杂问题又在简单任务失败)和"顺行性遗忘症"(缺乏长期记忆)两大缺陷,需要新的"系统提示学习"范式来存储问题解决策略 [10] - AI产品设计应采用"自主性调节滑块",通过控制生成-验证循环实现人机协作,同时强调为智能体而非人类构建工具,因为智能体是数字信息的新消费者类别 [10] Sam Altman AI预测 - Sam Altman预测未来5-10年AI将具备自主科研能力,真正发现新科学,o3推理能力已达博士水平,科学家效率提升3倍 [11] - OpenAI理想产品形态是"AI伴侣",通过多种界面融入生活,了解用户目标并主动提供帮助,而非局限于传统计算设备 [11] - 对Meta高薪挖人回应称其缺乏创新文化只会复制,认为人类会快速适应超级智能时代并创造新工作角色,AI不会造成严重就业威胁 [11] 斯坦福AI创业研究 - 斯坦福研究1500名员工和844项职业任务,发现41%的AI创业投资流向员工不需要的"红灯区"和"低优先区",投资与需求严重错配 [12] - 45.2%职业偏好"人机平等伙伴关系"模式,艺术设计领域仅17.1%任务欢迎自动化,员工最想自动化的是不享受且不担心失业的任务 [12] - AI时代价值技能发生倒置,"培训教授他人"从薪资第21位跃升至人类参与需求第2位,人际关系处理将比信息处理更有价值 [12]