Workflow
生成式AI
icon
搜索文档
硅谷的「十万大裁员」:Meta按代码量裁员
36氪· 2025-10-29 21:35
文章核心观点 - AI技术浪潮正驱动科技行业进行大规模职位版图重塑,其特点是“边裁边招”,即削减传统或支持性岗位的同时,积极招募AI相关高技能人才 [3][11][16][26][28][43][49][87][91][98][99] 科技巨头裁员与战略调整 - 2024年全球科技行业裁员人数超过15万,2025年已削减近10万个职位,AI普及和经济不确定性是主要推手 [12][13] - 谷歌调整组织架构,云部门裁撤超过100个设计岗位,资源倾斜至AI产品研发 [18][40][41] - Meta通过绩效评估淘汰5%员工,缩减Reality Labs约100个岗位,并裁撤AI基础设施部门约600人,但顶尖AI团队TBD Labs未受影响 [18] - Salesforce在2023年累计裁员约8000人,2024年裁减1000人,2025年旧金山总部再裁员262人;CEO称AI效率提升使客服需求减少4000个岗位 [20][21][22] - 微软在2023年裁员1万人后,2025年5月一次性裁减超过6500个岗位(占全球员工约3%),以投入资源发展生成式AI产品和Azure云服务 [32][33] - 亚马逊自2022年以来累计裁员约27000人,2025年重组Wondery(裁100人)及设备与服务部门(裁约100人),以聚焦核心业务并为AI项目腾出空间 [34][37][38] - 甲骨文在湾区裁员数百人(西雅图101人、旧金山254人、圣克拉拉101人),思科在加州裁撤221个岗位,资源转向云服务、网络安全等AI相关领域 [45][46][47] 初创与独角兽企业的AI转型 - 自由职业平台Fiverr裁员250人(占员工总数30%),旨在打造“AI原生”产品体系 [52] - 营销科技公司Yotpo裁员约200人(占团队34%),关停传统营销业务,集中开发AI驱动工具 [54] - 求职平台Indeed与Glassdoor合计裁撤1300个岗位,整合资源以利用AI提升招聘匹配效率 [56][57] - 数据标注独角兽Scale AI裁员200名员工并终止500名合同工合作,其在被Meta以约143亿美元收购后优化支出 [61][62] - xAI裁掉约500名数据标注员(占团队三分之一),由“AI专家”取代,转向专业化聊天机器人训练 [64][65] - 对话式AI初创公司Gupshup两轮裁员累计影响近半数员工(约300人),以提升效率和盈利能力 [69][70] - AI代码生成公司Windsurf在被收购后裁撤30人,并为剩余200人提供自愿离职方案 [71][73] 传统行业与新创企业受波及 - 星巴克裁撤1100名技术员工,将部分IT职能外包,反映数字化转型中内部岗位被外部服务或AI工具取代 [77] - 通用汽车底特律电动车工厂裁员200人,电动车新秀Rivian三度裁员累计近900人(最近一次裁600人,占约4%),应对市场增速放缓和需求降温 [79] - 英特尔计划裁减多达20%的员工(约21000人),重点针对代工服务部门,以削减成本并专注AI芯片制造 [79] - 西门子全球裁员约5600人,主要集中在自动化和电动车充电业务,以提升竞争力 [80] - 共享出行平台Turo裁员150人,企业协作软件Smartsheet被收购后裁逾120人,人力资源平台Workday裁减1750名员工(占8.5%)以压缩开支 [82] - 自动驾驶公司Cruise解散一半员工并关闭运营,残存资产被母公司通用汽车收编 [83] AI对岗位结构的双重影响 - AI自动化冲击重复性、支持性岗位(如客服、测试工程师、市场运营、技术文档撰写人),例如Chegg因学生转向ChatGPT裁员逾200人(占22%),Canva解雇十多位技术文档撰写人 [93][94] - AI浪潮催生对机器学习工程师、Prompt专家、数据科学家等新兴角色的高需求,企业争抢顶尖AI人才 [43][91][96] - Salesforce裁掉4000名客服人员,却计划新增5000名销售推广AI产品;IBM用聊天机器人取代200位人力招募专员,但通过业务转型实现员工总数增长 [97]
每周100多万人跟ChatGPT聊自杀,OpenAI紧急更新「救命」
36氪· 2025-10-29 21:35
文章核心观点 - ChatGPT已成为用户心理危机的重要倾诉渠道,每周有大量用户出现精神异常或表达自杀倾向,引发对AI心理安全风险的关注[7][9] - OpenAI面临严峻的法律和监管压力,包括过失致人死亡诉讼和谋杀案诱因指控,促使其必须加强AI安全措施[15][17][18] - OpenAI通过联合170多名医学专家更新GPT-5模型,在识别心理危机、引导专业求助方面取得显著改进,但实际效果和评估标准仍受质疑[21][22][41] 用户心理健康数据 - 每周约0.07%用户出现精神病或躁狂迹象,0.15%用户谈及自杀念头或计划[5] - 以8亿周活用户计算,每周约56万人出现精神异常对话,120万人表达自杀倾向或情绪依赖[6] - 许多AI精神病案例发生在深夜长时间聊天后,导致住院、离婚甚至死亡等严重后果[10][36] OpenAI应对措施 - 与60个国家170多名精神科医生、心理学家合作,教会AI识别痛苦、缓和对话并引导专业护理[21][22] - GPT-5模型针对妄想、自杀倾向和情感依赖三方面更新:表达同情但不肯定无现实基础的提示、引导转向危机热线、鼓励现实人际联系[24][26][27] - 新模型不良答案减少39%-52%,对比8月版本不合规行为响应率降低65%-80%,自杀对话合规性从77%提升至91%[31][32][33] - 长时间对话中的可靠性超过95%,解决了安全措施在深夜长聊中效果差的问题[36][37] 行业挑战与争议 - 尽管心理健康对话占比极低(0.07%),但在数亿用户基数上影响人群规模巨大[40] - 模型安全评估基准由OpenAI自行设计,用户是否会因AI回答真正改变行为尚未可知[41] - OpenAI继续向付费用户提供更旧、更不安全的GPT-4o模型选项,存在安全隐患[42]
Fiserv(FI) - 2025 Q3 - Earnings Call Transcript
2025-10-29 21:02
财务数据和关键指标变化 - 第三季度公司有机收入增长1% 达到49亿美元 调整后营业收入下降7%至18亿美元 调整后营业利润率为37% 下降320个基点 [36] - 第三季度调整后每股收益为204美元 较去年同期的230美元下降11% 年初至今调整后每股收益增长6%至665美元 [36] - 第三季度自由现金流为13亿美元 年初至今自由现金流为29亿美元 预计全年自由现金流约为425亿美元 资本支出预计为18亿美元 约占收入的9% [36][38] - 阿根廷业务对财务产生显著影响 第三季度外币费用为5300万美元 对调整后每股收益造成010美元的负面影响 阿根廷利率上升导致利息支出同比增加约3100万美元 造成004美元的负面影响 [37] - 公司终止一项商户联盟合资企业 产生8900万美元的免税收益 对调整后每股收益带来016美元的正面影响 [37] - 全年2025年有机收入增长预期下调至35%-4% 调整后每股收益预期为850-860美元 较上年略有下降 [20][21] 各条业务线数据和关键指标变化 - 商户解决方案部门第三季度有机收入增长5% 年初至今增长7% 该部门调整后营业收入增长3%至962亿美元 调整后营业利润率为372% 下降50个基点 [38][41] - 小企业业务线第三季度有机收入增长6% 调整后收入增长7% 交易量增长8% 主要由Clover北美ISV业务和拉丁美洲预期收入驱动 [39] - Clover业务第三季度总收入增长26% 总支付额增长8% 若排除网关转换影响 增长为11% 若进一步排除阿根廷比索贬值影响 报告和排除网关转换后的增长率均会再提高1个百分点 [17][39] - 企业业务线若排除网关转换 第三季度有机和调整后收入分别增长9%和4% 交易量增长12% 若排除大型PFAT客户的网络费用影响 增长率将再提高6个百分点 [40] - 处理业务线第三季度有机和调整后收入分别下降8%和6% 主要受去年同期专业服务收入和硬件销售基数较高影响 [40] - 金融解决方案部门第三季度有机收入下降3% 年初至今增长3% 该部门调整后营业收入下降13%至991亿美元 调整后营业利润率为425% 下降490个基点 [42][44] - 数字支付业务线有机和调整后收入均下降5% 发行业务线有机和调整后收入分别增长1%和2% 银行业务线有机和调整后收入下降7% 主要由于周期性许可收入减少 [42][43][44] 各个市场数据和关键指标变化 - 阿根廷市场对历史增长贡献巨大 2023年贡献超过5个百分点使全年有机增长率达12% 2024年贡献约10个百分点使增长率达16% 2025年至今阿根廷有机增长率为56% 为公司整体约5%的有机增长率贡献约2个百分点 [8][9] - 排除阿根廷影响后 公司2023年和2024年的整体有机收入增长率均为中个位数 2025年至今约为3% [9][51] - 公司在美国的Clover总支付额增长约75% 较上半年略有加速 [17] - 公司通过合作将Clover解决方案引入日本市场 并与Nubank签署独家长期合作伙伴关系 在巴西的国际扩张进展良好 [15][20][75] 公司战略和发展方向和行业竞争 - 公司启动"One Fiserv"行动计划 聚焦五大战略领域 包括以客户为先 通过Clover构建卓越的小企业运营平台 打造金融和商业差异化创新平台 通过AI实现卓越运营 以及进行严谨的资本配置 [22] - 公司正将银行核心系统从16个整合至5个 并嵌入实时能力和AI 由Finxact领导构建商户编排层和支付网关 包括针对小企业的Clover 针对ISV的CardFree和针对企业客户的Commerce Hub [23][62] - 公司加速在稳定币能力方面的投资 推出Fi USD 并计划通过收购StoneCastle获得数字货币托管许可证 [24][46] - 公司与IBM合作启动"Project Elevate"多年转型计划 专注于销售 客户入驻 Clover客户服务 人力资源和财务五大流程 旨在通过AI嵌入提升业务质量和生产力 [24][90] - 公司计划货币化某些非核心的小型业务 并与麦肯锡合作优化业务组合和资本配置 [26] - 公司认为其业务定位良好 所服务的市场正在增长 并正在拓展新的总目标市场 客户对创新技术和支付解决方案有近乎无限的需求 [13] 管理层对经营环境和未来前景的评论 - 管理层承认近期业绩令人失望 但认为当前采取的行动是基于严格分析的必要重置 将为公司带来新生 公司资产基础出色 挑战主要是自身原因造成 而非市场定位发生实质性变化 [3][14] - 公司增长和利润率目标需要重置 主要受四大因素驱动 阿根廷周期性增长放缓 原始指引中乐观增长假设的重新校准 某些延迟投资的影响 以及短期收入和支出举措的优先级降低 [7][8][11][12][13] - 公司决定降低短期举措的优先级 这将对近期增长和盈利能力产生一些影响 但将更注重建立长期客户关系和获取高经常性收入 [12][13] - 展望2026年 预计将是一个关键的投资和过渡年份 有机收入增长将为低个位数 调整后每股收益较2025年将略有下降 预计从2027年开始 公司将恢复中个位数收入增长 并实现两位数调整后每股收益增长 [21][33][54] 其他重要信息 - 公司宣布新的领导团队任命 Takis Georgiakopoulos和Divya Suryadevara自12月1日起担任联合总裁 Paul Todd自10月31日起担任首席财务官 [5][26][27][28] - 公司董事会将迎来三位新董事 包括新任独立董事长Gordon Nixon 新任审计委员会主席Gary Shedlin 以及审计委员会成员Celine Dufatel 均拥有丰富的相关经验 [5][29][30][31] - 公司在第三季度完成了对Smith Consulting Group和CardFree的收购 并达成了收购StoneCastle Cash Management的协议 以增强客户服务 增值服务和稳定币增长机会 [23][45][46] 问答环节所有提问和回答 问题: 公司过度盈利的持续时间以及恢复两位数每股收益增长的时间和成本 [48] - 公司表示经过全面分析 当前结构上是一个中个位数增长的公司 处于该区间的低端 通过投资和领导团队变革 有清晰路径达到中个位数增长的坚实部分 并进一步加速 [51][52][53] - 公司的自由现金流生成能力和资本管理计划没有改变 结合严谨的资本配置 该模式将驱动两位数调整后每股收益增长 目标是从2027年开始实现 [33][54] 问题: 金融解决方案部门增长轨迹变化的具体原因以及对该部门真正潜力的看法 [57][58] - 该部门第三季度业绩受到多种因素影响 包括数字支付方面为长期竞争定位采取的行动 发行业务中输出服务领域的同比基数挑战 以及银行业务中周期性许可收入减少 [67][68] - 从长期看 发行业务基础强劲 数字支付业务借记交易量健康增长 银行业务核心部分预计为低个位数增长 但通过Finxact等现代平台和嵌入式金融等新领域 有潜力超越该增长率 [60][61][62][63][64][100] 问题: Clover第四季度10%的收入增长是否是明年的合适参考 以及对商户业务竞争定位的最新评估 [73] - Clover第四季度10%的增长反映了定价反转的影响 若不考虑此因素 增长将为高 teens 预计2026年将回升至低 teens 范围 并在2027年及以后进一步加速至高 teens 水平 [78][79][80] - 公司对Clover的竞争定位感觉良好 继续在垂直扩张 水平扩张 国际扩张等方面进行投资 并专注于通过AI全面改革客户体验和运营效率 [75][76] 问题: 利润率走势 特别是第四季度和明年上半年的投资高峰情况 [83] - 利润率预计在第四季度和明年第一季度见底 明年全年利润率预计在33%-35%范围 第一季度是低谷 之后将逐步回升 到明年年底恢复至今年水平 并在此基础上有序扩张 [84][85] - 第四季度受到双重影响 一方面是去年第四季度短期举措达到高峰 另一方面是公司逆转了这些举措并采取了定价调整 公司正致力于建立一个可增长的基线 [86] 问题: 金融解决方案部门第三季度收入为何在两个月内发生如此剧烈变化 以及为何季度内可见度不足 [93] - 七月份的指引调整主要集中于重新评估一些大型项目 但随着第三季度初出现更多财务意外 促使公司进行了更严格的全面审查 发现了原始指引中嵌入的许多乐观假设 即使强力执行也难以同时成功实现 [94][95] - 金融解决方案部门上半年的高增长率(7%-8%)对于该业务集合而言高于通常水平 考虑到账户文件和借记交易等基础因素的中个位数增长 明年低个位数的增长预期更为正常化 [98][99]
Booking3Q25业绩快览:收入、预定额及利润均超预期,亚洲市场是主要增长引擎
海通国际证券· 2025-10-29 21:01
报告行业投资评级 - 报告未明确给出对Booking Holdings Inc的股票投资评级 [1] 核心观点 - Booking Holdings Inc 3Q25业绩全面超预期,收入、预定总额及利润均高于市场共识和公司指引上限 [1] - 亚洲市场被强调为未来增长的主要引擎,公司目标增速快于该地区高个位数的行业平均增长率 [9] - 公司正成功向商家直销模式转型,并凭借“一站式旅行”愿景和生成式AI应用推动长期价值 [9][10] 财务业绩总结 - 3Q25总收入同比增长12.7%至90.1亿美元,超出彭博共识预期3.2% [3] - 3Q25预定总额同比增长14.3%至496.7亿美元,超出彭博共识预期3.7% [3] - 3Q25调整后税息折旧及摊销前利润同比增长15%至42.3亿美元,超出预期4.8%,利润率达47.0% [3] - 3Q25调整后每股收益同比增长19%至100美元,超出预期3.8%,增速高于调整后税息折旧及摊销前利润主要得益于流通股数减少4% [3][6] 分业务表现 - 商家业务收入同比增长23.3%至61.3亿美元,超预期5.2%,主要受Booking.com住宿预订增长和向商家模式转型推动 [3] - 代理业务收入同比下降6.7%至25.7亿美元,略低于预期1.2%,同样受业务模式转型影响 [3] - 广告及其他业务收入同比增长14.5%至3.1亿美元,超预期5.3%,增长受OpenTable业务和广告收入推动 [3] 运营指标与费用 - 客房间夜量同比增长8.2%至3.23亿间,主要受欧洲和亚洲旅游需求推动 [3] - 机票销售量同比增长32.3%至1700万张,得益于与瑞安航空和西南航空等新合作 [3] - 营销费用率为37.3%,同比改善0.5个百分点,环比改善7.4个百分点 [4] - 管理费用同比下降55.8%,主要因去年同期计提了与意大利间接税事项相关的3.65亿美元费用 [3] 股东回报与现金流 - 公司3Q25股份回购金额约为7亿美元,截至2025年9月30日,剩余回购授权总额为239亿美元 [6] - 董事会宣布派发每股9.60美元的现金股息 [6] - 自由现金流为13.7亿美元,同比下降40% [6] 未来业绩指引 - 公司预计2025年全年调整后税息折旧及摊销前利润同比增长约17%-18%,略高于彭博共识预期的16.0% [1][7] - 公司预计2025年全年客房间夜总数同比增长约7%,略高于彭博共识预期的6.7% [1][7] - 对于4Q25,公司预计收入同比增长10%-12%,调整后税息折旧及摊销前利润在20亿至21亿美元之间 [7] 战略重点与增长动力 - 公司在亚洲市场依托Agoda的本地优势与Booking.com的全球品牌,形成互补,目标增速快于市场平均水平 [9] - 非标住宿业务表现强劲,客房间夜量同比增长约10%,超过整体增速,其占比提升至36% [10] - 公司积极应用生成式AI,例如在Agoda平台推出AI聊天机器人,以提升用户体验和预订转化率 [10]
AI如何驱动研发?诺奖得主们这样说
第一财经· 2025-10-29 20:35
AI驱动科学研究的范式变革 - 发现式智能被定义为能够主动构建可检验理论模型并提出可证伪假说的真正通用人工智能(AGI)[1] - AI正在成为新的科学思维体,赋予科学自行思考、推理和演进的能力[1] - 高效的“设计-构建-测试-学习”反馈闭环对于AI模型的快速发展至关重要[3] AI在材料科学领域的应用突破 - 利用ChatGPT进行分子优化编辑,设计出可在湿度低于15%的死亡谷沙漠中成功取水的便携式装置材料[1] - 由七个ChatGPT Agents组成的虚拟科研团队,在几天内完成上百次实验,优化了多孔有机框架材料COF-323的结晶过程,实现从无定形到高结晶的飞跃[1] - 训练ChatGPT阅读数千份合成报告并进行推理,使其从文本生成器演变为科学推理引擎,预测性能优于传统启发式方法[2] AI在生物医学领域的创新成果 - RF Diffusion3模型能够在三维结构空间运算,仅输入期望分子功能即可生成新型蛋白质的精确三维结构蓝图[3] - 应用包括:设计特异性捕获β-淀粉样蛋白的新型肽类结合物以干预阿尔茨海默病、开发首个“从头设计”的蛋白酶、研制新型GPCR激动剂与拮抗剂[3] - CRISPR技术与机器学习协同进化,通过系统性制造“基因扰动”来大规模筛选鉴定基因功能,为构建因果数据集提供工具[4] 行业资源投入与发展趋势 - 宣布投入10亿美元算力支持全球科学家的创新人工智能研究[6] - 预计真正改变智能的下一个算法将出现在笔记本电脑上,而非数据中心[6]
2023年中国AI医疗器械行业调研简报:Q1:全球监管政策有哪些关键突破?对行业有何影响?-20251029
头豹研究院· 2025-10-29 20:03
行业投资评级 - 报告未明确给出行业投资评级 [1] 核心观点 - 全球AI医疗器械监管在2025年呈现趋严但路径明晰的突破性进展,形成“严监管+促创新”的平衡模式,倒逼企业构建全周期质控体系 [4] - 中国AI医疗器械行业正从“算法突破”阶段快速过渡到“场景深耕与合规运营”阶段,获批产品遵循“小切口、可验证、强合规”策略 [12][13] - 2025年AI医疗器械投资生态正从快速扩张转向精耕细作,资本更注重项目的成熟度和实际效益,市场进入高质量发展阶段 [18][19] - AI医疗器械技术正从辅助工具向核心诊疗手段演进,多模态大模型底座构建、生成式AI全链条渗透和人机协同范式升级成为突破性进展 [24][25] 全球监管政策关键突破 - 欧盟于2025年7月批准首款基于大型语言模型的临床决策系统获得CE认证(IIb类),为生成式AI医疗器械设立全新标杆,要求建立全程数据可追溯体系等 [4][7] - 中国国家药监局发布新举措,明确简化AI算法优化产品的变更注册流程,将AI影像产品平均审批时间从24个月压缩至14个月,缩短40% [4][7] - 美国FDA通过《预设变更控制计划》构建动态监管框架,允许AI模型在保障安全前提下持续迭代 [4][7] - 监管路径明晰化促使全球Top20医疗器械企业全部建立AI模型风险评估部门,合规成本占研发总投入比例从2023年的18%上升至27% [4] 2025年中国AI医疗器械获批产品特征 - 截至2025年5月末,国家药监局共批准11款AI医疗器械取得三类证,覆盖影像、手术规划及辅助诊断三大场景 [12] - 获批产品呈现“细分病种、影像主导、临床强提示”的集中特征,适应症高度聚焦于冠脉钙化、头颈血管、肺栓塞等九大解剖部位 [12] - 企业类型呈现“北京-长三角-珠三角”三极分布,区域创新集群效应明显 [12] - 技术路径以深度学习+规则后处理为主,产品形态全部为独立软件,强调与指定型号影像设备的适配性 [12] 2025年AI医疗器械投资趋势 - 投资热度维持相对活跃,但整体节奏较此前略有放缓,资本关注点从概念验证转向对实际应用场景的深度挖掘 [18] - 单笔投资规模呈现上升趋势,反映出资本更注重企业的核心竞争力和可持续发展能力 [18] - 医疗影像分析、智能手术辅助以及个性化健康管理等与临床需求紧密结合的技术方向成为资本布局重点 [18] 2025年AI医疗器械突破性技术进展 - 多模态大模型底座加速构建,形成“基础大模型-领域专用模型-临床微调模型”的三级架构,支持跨模态数据深度融合 [22][24] - 生成式AI全链条渗透至预防、诊断、治疗、康复全流程,AI系统可实时生成个性化诊疗路径建议 [22][24] - 人机协同范式升级,AI承担医疗机构50%以上的标准化工作,并通过“虚拟标准化病人”系统提升住院医师培训效率 [22][25]
近500页史上最全扩散模型修炼宝典,宋飏等人一书覆盖三大主流视角
机器之心· 2025-10-29 15:23
书籍核心价值与定位 - 书籍《The Principles of Diffusion Models》系统梳理了扩散模型的发展脉络与核心思想,深入解析了模型的工作原理、有效性及未来方向[5] - 该书以460多页的篇幅,通过严密的数学推导与公式展开,为具有深度学习基础的研究人员、研究生及从业者提供可靠的理论指南[1][8] - 书籍将变分、得分与流等多种视角在统一的数学框架下进行串联,既是研究者的系统参考资料,也是初学者的友好入门读物[5][6] 扩散模型基础原理 - 扩散模型将生成过程视为随时间逐步演化的变换,通过多阶段推理将粗略结构细化为精致细节,与传统生成模型直接学习噪声到数据的映射不同[11] - 领域研究者从三种主要视角发展扩散模型:变分方法、基于得分的方法和基于流的方法,这些视角提供了互补的框架[11][14] - 三种视角在数学上等价,共同构成了扩散建模的统一理论图景,并与变分自编码器、能量模型和归一化流等方法相联系[16][23] 扩散模型核心视角详解 - **变分视角**:源自变分自编码器,将扩散过程理解为通过变分目标学习去噪过程,形成去噪扩散概率模型[23] - **得分视角**:起源于能量模型,通过学习对数数据密度的梯度来指导逐步去噪,在连续时间设定下与随机微分方程和常微分方程理论紧密相连[23] - **流视角**:基于归一化流,将生成建模表述为连续的流动变换,通过ODE描述样本从简单先验分布逐步运输至数据分布的过程[23] - 第6章展示了三种视角之间的深层统一性,第7章进一步探讨其与最优传输理论及薛定谔桥之间的联系[24][25] 扩散采样控制与加速 - 扩散模型的生成过程呈现出由粗到细逐步精化的特征,但采样过程计算代价较高,需要改进采样方法和学习型加速技术[26][27] - **引导式生成**:通过分类器引导和无分类器引导等方法,使生成过程能够根据用户定义的目标或属性进行条件控制,实现偏好对齐[29] - **基于数值求解器的快速生成**:采用先进数值求解器,在更少的反向积分步骤中近似模拟扩散反过程,显著降低计算成本的同时保持生成质量[29] 快速生成模型的学习方法 - **基于蒸馏的方法**:训练学生模型模仿已训练好的教师扩散模型的行为,以显著更少的积分步数重现教师模型的采样轨迹或输出分布[30] - **从零开始的学习**:直接从零开始学习ODE的解映射(流映射),无需依赖教师模型,实现端到端的快速生成,消除多步采样的时间瓶颈[30][31][32] - 这些方法旨在通过模型学习获得对扩散动态的直接近似,从根本上提升生成速度与可扩展性[30] 书籍涵盖范围与理论体系 - 全书围绕统一核心原理展开:构建连续时间动力系统,将简单先验分布逐渐传输至数据分布,并确保任意时刻的边缘分布与预设正向过程诱导的边缘分布一致[33] - 书籍系统推导了扩散模型的基本机制,包括构建支持采样的随机流与确定性流、通过引导机制控制生成轨迹、利用数值求解器加速采样过程[34][36] - 本书旨在建立具有持久价值的理论体系,帮助读者在统一框架下定位新研究、理解方法原理、并具备设计与改进新一代生成模型的能力[36]
腾讯AI知识库应用智能体能力上线,此前文件总量已破2亿
南方都市报· 2025-10-29 14:05
产品更新与核心功能 - 腾讯旗下AI原生应用ima于10月27日正式更新至2.0版本,核心更新为基于Agent能力的“任务模式”[1] - 用户可在首页或知识库内使用自然语言发起任务,ima能交付可直接使用的结果[1] - “任务模式”支持生成报告和播客两种内容形式,并能添加知识库、文档、图片、音频等多种附件[3] - ima基于全网或知识库数据,自主拆解、规划任务步骤,调用精读、搜索、创作等工具完成指令,实现搜、读、写工作流一体化[4] 产品定位与市场表现 - ima是腾讯推出的AI智能工作台产品,集AI搜索、阅读、写作等功能于一体,旨在帮助用户沉淀和挖掘信息价值,成为“第二大脑”[3][4] - 上线一年以来,ima知识库文件总量达到2亿,相较今年1月,9月月活跃用户增长突破80倍[1] - 产品已深入科技、金融、教育、医疗等20多个行业,知识库数量前三的领域为科技互联网、经济金融、健康医疗[4] 公司战略与产品组合 - ima与元宝、QQ浏览器、搜狗输入法共同构成腾讯云与智慧产业事业群面向大模型时代的产品组合[3] - 公司目前对To C的AI原生应用处于投入期,重心放在打磨产品和服务体验上,尚未深度考虑商业化[4][5]
Z Potentials|专访a16z被投Phota Labs联创张璇儿:在Photoshop与美图之间,如何杀出一条新路?
Z Potentials· 2025-10-29 13:16
公司核心观点 - Phota Labs是一家专注于利用生成式AI技术重构照片记忆场景的初创公司,其目标不是简单的图像修复或增强,而是通过算法重新演绎拍摄时的决策过程,将日常照片转化为美好的记忆[1][6][9] - 公司定位为品类定义者,致力于解决摄影行业长期未被满足的情感连接需求,其核心理念是“Transform everyday photos into beautiful memories”,让AI技术成为用户记录生活时的“第二视角”[6][8][36] - 公司采用纯软件解决方案,通过身份保持和上下文理解两大技术原则,确保生成结果既真实又符合用户的记忆场景,未来商业模式将包括C端订阅和B端API授权[37][56][58] 创始人背景与创业契机 - 创始人Cecilia Zhang拥有深厚的计算摄影学术和工业背景,本科就读于Rice大学计算机和电子工程,在伯克利攻读计算机博士期间专攻计算摄影,导师是光场相机公司Lytro的创始人[11][13][14] - 在Adobe工作期间,Cecilia参与了Project Indigo等计算摄影项目,积累了从研究到产品化的全流程经验,并观察到生成式AI技术成熟带来的创业窗口[18][19][20] - 创业灵感来源于用户反馈“我不是想修好这张照片,我只是希望能‘再回到那个瞬间’”,这促使她思考如何用AI技术建立情感连接而非仅仅提供工具[2][3][20] 产品定位与技术特点 - 产品与现有图像工具的根本区别在于从“修复增强”转向“场景重构”,通过理解人物身份、场景内容和拍摄环境等上下文信息,结合摄影学知识进行生成[37][41][42] - 技术管线分为理解和生成两大部分,理解层依赖语言模型的语义理解能力,生成层则融合摄影美感原则,整个系统强调身份保持和审美一致性[41][42][47] - 产品初期需要用户提供30到50张照片建立个人档案,以实现跨照片的身份一致性,未来计划支持视频输入并从动态内容中自动挑选最佳瞬间[23][51][54] 目标市场与竞争策略 - 初期目标用户定位为有摄影基础的人群,这类用户对成片效果有清晰预期,能提供高质量反馈,但长期目标是服务所有普通用户[35][36] - 公司认为目前市场上没有完全相似的产品,属于品类定义者,潜在竞争对手可能是掌握照片入口的手机厂商,但创业公司在迭代速度和用户理解深度上具有优势[57] - 明确排除硬件路径,因为硬件创业成本与节奏远高于软件,且现有设备已能满足采集需求,公司更专注于通过算法和审美优势构建壁垒[7][58] 技术演进与未来规划 - 技术进步主要体现在模型架构、推理速度和计算效率的提升,但对用户数据输入量的要求并未降低,身份认知仍需30张左右的照片进行学习[49] - 视觉模型的发展与语言模型深度融合,语言模型提供的世界知识对视觉理解和生成起到关键作用,这是三年前难以实现的技术条件[50] - 长期愿景是成为用户记录生活的“第二视角”,无论使用何种设备拍照,用户都会好奇通过Phota Labs重构后的效果,未来计划探索从视频中自动生成精选照片组[52][54][55]
英伟达市值逼近5万亿美元!
国芯网· 2025-10-29 12:51
英伟达市场表现与展望 - 英伟达股价上涨约5%,续创新高,总市值逼近5万亿美元 [1] - 公司计划逐步向微软支持的OpenAI投资至多1000亿美元,用于建设和部署至少10吉瓦的人工智能数据中心 [3] - 公司已参与埃隆・马斯克旗下生成式人工智能公司xAI的最新一轮融资 [3] 行业转型与市场规模 - 超大规模计算市场已是一个价值2.5万亿美元的产业,其资本支出约为5000亿美元 [3] - 从传统CPU主导的计算向由GPU驱动的生成式AI计算的转型才刚刚开始 [3] - 2000年所有互联网公司的总市值仅为300亿至400亿美元,当前数千亿美元的基础设施建设投资增长是自然且合理的 [3]