Workflow
机器学习
icon
搜索文档
Upstart (UPST) 2025 Conference Transcript
2025-06-04 02:40
纪要涉及的行业或者公司 - 行业:消费金融、支付行业 - 公司:Upstart (UPST) 纪要提到的核心观点和论据 1. Upstart使用AI的差异化优势及可持续性 - **核心观点**:Upstart在使用AI方面与其他贷款机构存在差异,具有可持续优势,核心竞争力在于速度 [8]。 - **论据**:其他机构若要复制Upstart的成果,需投资组建约70人的机器学习研究团队,克服传统金融机构风险控制难题,进行多年替代数据收集,构建并修改机器学习算法,且要承受监管压力和早期模型表现不佳带来的风险,而Upstart历史上研究投资回报率未递减,能持续提升模型准确性 [8][9][12]。 2. 模型每月2 - 3%改进的方式 - **核心观点**:模型改进分为四个类别 [21]。 - **论据**:一是投资模型架构,引入不同算法、调整模型集成方式和损失函数;二是获取新的消费者数据,每季度能发现有价值的数据;三是投资计算和内存,支持更复杂模型;四是获取更多还款数据,解锁更多变量和算法设计的复杂性 [21][22][23]。 3. 模型宏观校准及应对未来宏观冲击的能力 - **核心观点**:模型引入宏观校准后更具宏观弹性,能应对未来不同的宏观冲击 [27]。 - **论据**:历史上模型未考虑宏观因素,2022年后引入使模型具有时间感知能力,创建Upstart Macro Index,让时间变量与借款人特征动态交互,此方法不针对特定宏观冲击,只要冲击与借款人特征相关就能起作用 [28][29]。 4. 模型改进对业务财务的影响 - **核心观点**:模型改进虽不在损益表上直接体现,但对业务有重要影响 [37]。 - **论据**:信用表现是业务核心指标,模型改进提升信用评估能力,增强资本弹性,让公司更自信地审批和承保借款人 [36]。 5. 产品扩张的原因和策略 - **核心观点**:产品扩张围绕借款人需求,有三个主要动机 [43]。 - **论据**:一是相邻市场存在未被充分满足的信贷需求,如汽车、HELOC等市场;二是部分产品有降低信贷流程成本的机会;三是为满足借款人全生命周期的信贷需求,提供全品类产品 [43][44][45]。 6. 不同产品的机会和特点 - **核心观点**:HELOC、小额度产品和汽车贷款各有优势 [53][54][55]。 - **论据**:HELOC能使公司服务更广泛人群;小额度产品针对信贷服务不足的人群,提高审批率;汽车贷款是普遍需求的信贷产品 [53][54][55]。 7. 实现年度盈利的条件和风险 - **核心观点**:实现年度下半年盈利需满足两个条件,存在一定风险 [59]。 - **论据**:条件一是宏观违约风险大致保持稳定,二是按历史速度推进模型改进;风险包括技术改进执行风险和宏观环境恶化风险 [59][60]。 8. 前向流协议的风险和管理 - **核心观点**:前向流协议存在一定风险,公司进行风险管理 [61]。 - **论据**:协议中会有表现好和不佳的贷款批次,公司通过收获表现好的批次收益来弥补不佳批次损失,若损失过大,部分风险在资产负债表上体现,风险控制在整体发起量的低到中个位数百分比 [61][62][64]。 9. 宏观经济数据与市场情绪的差异 - **核心观点**:宏观经济数据与市场情绪存在脱节 [65]。 - **论据**:GDP和失业率数据显示经济强劲,但消费的可承受性存疑,储蓄率降低,部分人群依赖现金流产品维持生活,导致人们缺乏财务安全感 [65][66][67]。 其他重要但是可能被忽略的内容 - 2022年公司面临困境时,对四个孵化项目进行决策,牺牲小商业贷款项目,保护汽车贷款、HELOC和小额度短期贷款项目,目前这些项目开始显现成果 [48][49][50]。 - 前向流协议中,公司承担风险的金额约为整体发起量的5% [64]。
地平线为何获得Baillie Gifford青睐?创始人余凯与劳伦斯·伯恩斯最新对话:希望成为“机器人的微软”
聪明投资者· 2025-06-03 13:56
行业趋势与公司定位 - 汽车正从机械设备转型为"装上轮子的计算机",软件和计算能力成为核心[1] - 中国电动车市场极度拥挤且竞争激烈,但具备以优质低价引领全球的潜力[1][35] - 公司定位为"机器人的微软",致力于构建赋能通用机器人的软硬件平台[3][46][51] 公司财务与市场表现 - 2024年10月登陆港股主板,成为当年最大科技IPO,最新市值近千亿港元[2] - 2024年收入23.84亿元,同比增长53.6%,授权及服务收入增长70.9%,毛利率达92%[2] - Baillie Gifford为主要机构投资者,IPO时认购5.07亿股(约2.6亿美元),持股比例4.65%[2] 技术优势与商业模式 - 软硬件一体化协同优化能力显著快于传统半导体厂商,商业化节奏缩短至5-10年[22][27][29] - 技术底座涵盖芯片+算法全栈解决方案,已装配300万辆新车[10][28] - 商业模式从芯片销售转向高附加值软件授权与服务,毛利率达92%[2] 创始人背景与团队 - 创始人余凯30年专注机器学习,曾创立中国首个深度学习实验室及自动驾驶项目[11][12][17] - 2010年带领团队赢得首届ImageNet大赛,早于深度学习三巨头Geoffrey Hinton[20][21] - 技术型创始人特质吸引顶尖人才,形成"世界最严肃AI团队之一"[7] 全球化战略与合作伙伴 - 与大众、博世、采埃孚等国际一级供应商建立合作,获大众20亿美元投资[31][38] - "同行·致远"理念强调与OEM共同定义方案,已覆盖中国主要车企及欧洲市场[31][33][37] - 中国本土市场高渗透率(电动车/智能座舱)为全球化提供跳板[35][36] 自动驾驶技术展望 - 预测三年内实现100%"脱手"通勤,五年内"脱眼"驾驶,十年内完全"脱脑"驾驶[42] - 基于端到端训练的神经网络技术加速演进,2024-2025年为行业拐点[41][42] - RoboTaxi普及仍需较长时间,聚焦渐进式自动驾驶路径[42][43] 长期愿景与第二曲线 - 汽车作为移动机器人首场景,技术可扩展至护理/农业/物流等领域[46][47] - 需突破人形机器人运动自由度、电池效率及生物启发式架构等挑战[48] - 终极目标是让人类摆脱机械化劳动,专注创造性工作[49][50]
大唐黄金设AI矿业合资公司
智通财经· 2025-06-02 23:05
合资公司成立 - 大唐黄金与无锡专心智制在香港成立合资公司人工智能矿业有限公司 公司持股51% 合资公司将纳入集团综合财务报表 [1] - 无锡专心智制是中国领先的创新科技公司 专注于为工业领域提供数据服务和人工智能解决方案 [1] 合资公司业务方向 - 合资公司旨在开发AI在有色金属勘探 开采工艺及安全生产方面的应用 [1] - 将通过随机森林 强化学习 卷积神经网络等机器学习工具开发专业AI应用模型 推动采矿业数字化及智能化转型 [1] - 将引入数字孪生及数字化绩效运营系统 整合技术 供应链及运营要素 提高生产及资源利用效率 改善工作安全 创造合作机会 [1] 战略合作进展 - 合资公司已与SRK Consulting(China)Ltd订立谅解备忘录 开展战略合作 [1] - 合作目标包括打造AI深度结合黄金及有色金属开采的标杆案例 建立系统性AI采矿学习机制 开发适用于采矿生产各环节的应用模型 并在行业中实施 [1] 合作意义与规划 - 与SRK的合作符合采矿行业应用AI解决方案的趋势 可作为集团业务内生性增长 符合公司及股东整体利益 [2] - 开发的AI模型将优先应用于公司附属公司太洲矿业的矿产勘探及加工 提高勘探 加工及矿物精炼厂的效率及生产力 [2] - AI采矿模型成熟并通过验证后 订约方拟将该模型商业化 更广泛地应用于采矿行业领域 [2]
中国学者本周发表3篇Cell论文:AI 驱动的体内蛋白质激活平台;核应激小体动态组装及其炎症调控、新型菌源性胆汁酸改善血糖稳态
生物世界· 2025-05-31 13:57
AI驱动的体内蛋白质激活平台 - 北京大学陈鹏团队与王初团队合作开发了CAGE-Prox vivo平台,利用AI辅助在活体小鼠中按需激活蛋白质及调控蛋白-蛋白相互作用 [4] - 该技术通过机器学习优化氨酰tRNA合成酶进化,将化学笼化的反式环辛烯-酪氨酸整合到目标蛋白质的脱笼位点,实现功能暂时阻断与原位恢复 [7] - 应用场景包括肿瘤治疗中化学调控的T细胞募集和激活,为活体生物学研究和治疗干预提供通用平台 [7] 核应激小体的动态组装及炎症调控 - 中国科学院陈玲玲团队解析了核应激小体(nSB)的层级结构,揭示其通过缩短基因三维距离促进NFIL3转录以抑制炎症因子表达 [8][9] - nSB由SatIII DNA/RNA和30种蛋白质组成,应激条件下激活SatIII异染色质可增强NFIL3染色质可及性,招募HSF1等转录因子 [12] - 脓毒症患者中NFIL3表达与SatIII激活及生存率呈正相关,为脓毒血症诊疗提供新靶点 [12][13] 新型菌源性胆汁酸改善血糖稳态 - 北京大学姜长涛团队发现色氨酸胆酸(Trp-CA)能特异性激活孤儿受体MRGPRE,通过β-arrestin-1-ALDOA磷酸化促进GLP-1分泌 [15] - Trp-CA避免了传统胆汁酸引起的瘙痒副作用,为2型糖尿病药物开发提供新策略 [18] - 研究首次确立MRGPRE-β-arrestin-1-ALDOA为GLP-1分泌的新调控机制,拓展了菌源胆汁酸(MABA)的功能研究范式 [15][18]
机器学习因子选股月报(2025年6月)
西南证券· 2025-05-29 14:10
量化模型与构建方式 1. **模型名称**:GAN_GRU模型 - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10]。 - **模型具体构建过程**: 1. **数据输入**:18个量价特征(如收盘价、成交量等),采样形状为40*18(过去40天的特征)[13][14]。 2. **预处理**:时序去极值+标准化,截面标准化[14]。 3. **GAN部分**: - 生成器(G):LSTM结构,输入噪声生成逼真量价特征,损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ - 判别器(D):CNN结构,区分真实与生成特征,损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ - 交替训练G和D直至收敛[20][21][23][26]。 4. **GRU部分**:两层GRU(128,128) + MLP(256,64,64),输出预测收益pRet作为因子[18]。 - **模型评价**:有效捕捉量价时序特征的非线性关系,生成因子具有较高区分度[9][18]。 --- 量化因子与构建方式 1. **因子名称**:GAN_GRU因子 - **因子构建思路**:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][37]。 - **因子具体构建过程**: 1. 模型训练:半年滚动训练(每年6月30日、12月31日更新),预测未来20日收益[14]。 2. 因子生成:对全A股(剔除ST及上市不足半年股票)输出pRet,中性化处理[14][18]。 --- 模型的回测效果 1. **GAN_GRU模型**: - IC均值:11.57% | ICIR:0.89 | 年化超额收益率:25.01% - 年化波动率:24.02% | IR:1.66 | 最大回撤:27.29%[37][38]。 --- 因子的回测效果 1. **GAN_GRU因子**: - **全A表现**: - 近一年IC均值:11.54% | 最新一期IC:-0.28%[37][38]。 - **行业表现**: - 当期IC前五行业:社会服务(30.15%)、国防军工(28.07%)、银行(25.31%)[39]。 - 近一年超额收益前五行业:石油石化(5.60%)、建筑材料(5.29%)、家用电器(5.06%)[42]。 - **多头组合**: - 当期超额收益最高行业:商贸零售(8.22%)、国防军工(7.15%)[42]。 - 最新前十个股:顺威股份、博深股份、九典制药等[44][48]。
机器学习因子选股月报(2025年6月)-20250529
西南证券· 2025-05-29 13:15
量化模型与构建方式 1. **模型名称**:GAN_GRU模型 - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10] - **模型具体构建过程**: 1. **数据输入**:18个量价特征(如收盘价、成交量等),过去400天的数据,每5天采样一次,形成40×18的特征矩阵[13][14] 2. **GAN部分**: - **生成器(G)**:LSTM结构,输入噪声生成模拟量价特征,损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ - **判别器(D)**:CNN结构,区分真实与生成特征,损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ - 交替训练G和D直至收敛[20][23][26] 3. **GRU部分**:两层GRU(128,128)提取时序特征,后接MLP(256,64,64)输出预测收益pRet作为因子[18] 4. **数据处理**:时序去极值+标准化,截面标准化[14] - **模型评价**:通过对抗训练提升特征生成质量,保留时序特性,适配金融数据的高噪声环境[29][33] --- 量化因子与构建方式 1. **因子名称**:GAN_GRU因子 - **因子构建思路**:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][37] - **因子具体构建过程**: 1. 模型每半年滚动训练(6月30日/12月31日),预测未来半年收益[14] 2. 剔除ST股及上市不足半年的股票,保留有效样本[14] 3. 因子值=模型输出的pRet,截面排序后取前10%作为多头组合[37][44] --- 模型的回测效果 1. **GAN_GRU模型**: - **IC均值**:11.57%(全A股,2019/01-2025/05)[37] - **ICIR**:0.89[38] - **年化超额收益率**:25.01%[37] - **信息比率(IR)**:1.66[38] - **最大回撤**:27.29%[38] --- 因子的回测效果 1. **GAN_GRU因子**: - **近期IC(2025/05)**:-0.28%,近一年IC均值11.54%[37][38] - **行业表现**: - 当期IC前五行业:社会服务(30.15%)、国防军工(28.07%)、银行(25.31%)[39] - 近一年IC均值前五行业:建筑装饰(18.54%)、公用事业(18.14%)[39] - **多头组合超额收益**: - 当期最高行业:商贸零售(8.22%)、国防军工(7.15%)[42] - 近一年月均最高行业:石油石化(5.60%)、建筑材料(5.29%)[42] --- 多头组合示例(2025/05) - **前十个股**:顺威股份(家用电器)、博深股份(机械设备)、九典制药(医药生物)等[44][48] - **行业排名第一个股**:如顺威股份(家用电器)、盛剑科技(环保)等[44]
速递|AI会计系统Rillet获红杉领投2500万美金,AI总账助力企业月结提速至小时级
Z Potentials· 2025-05-29 11:13
公司融资情况 - Rillet完成2500万美元A轮融资 由红杉资本领投 现有投资者跟投 [1] - 此次融资距公司获得1350万美元种子轮及Pre-seed轮融资仅过去10个月 [1] 产品技术优势 - 运用机器学习和生成式AI实现会计报告自动化 直接从客户银行及Salesforce等平台提取数据生成财务报表 [1] - 软件使中型企业会计团队能在数小时内完成月度或季度结账 过去需数周 [2] - 数据迁移时间从数月缩短至4-6周 客户可并行使用原有系统直至确认数据安全迁移 [3] 市场定位与竞争格局 - 主攻中型企业市场 与NetSuite等传统平台竞争 在AI替代会计系统领域尚无明确对手 [4] - 约三分之一客户来自替换NetSuite或类似系统的需求 [2] - 竞争对手Digits主要面向小型企业用户 与Rillet市场定位不同 [4] 业务发展数据 - 公司收入自产品推出以来增长五倍 已获得近200家客户 [2] - 客户包括估值30亿美元的Windsurf和估值16亿美元的Decagon等知名企业 [2] 行业痛点与机遇 - 总账系统更换难度大 被比喻为"心脏直视手术" [1] - NetSuite等传统会计软件运行缓慢且操作笨拙 存在明显替代空间 [2] - 红杉资本最初认为总账软件创业难度大 因客户转换成本高且业务建立挑战大 [1]
意料之外的EDA
新浪财经· 2025-05-29 08:53
全球EDA行业整体表现 - 2024年Q4 EDA行业收入同比增长11%达49亿美元,中国市场疲软但全球增长稳健[3][4] - 行业集中度高,Cadence、Synopsys、Siemens EDA三大巨头占中国市场份额超70%[5] - PCB设计、封装设计等细分领域增长显著[4] EDA增长驱动因素 - 边缘计算和高性能计算(HPC)芯片需求推动复杂自动化EDA解决方案需求[6] - 云端解决方案普及促进全球设计团队协作与可访问性[6] - AI/ML算法集成优化设计准确性、效率并缩短产品上市时间[6] - 物联网和AI应用节能芯片组需求推动EDA创新,半导体公司与EDA厂商加大研发投入[6] 细分领域增长数据 - CAE(计算机辅助工程)增长10.9%达16.969亿美元(四季度移动平均+12.3%)[7] - IC物理设计与验证增长15.4%达7.979亿美元(移动平均+8.1%)[7] - PCB & MCM增长15.9%达4.762亿美元(移动平均+8.3%)[7] - 半导体IP增长7.9%达17.607亿美元(未报告公司如Arm增长21%)[7] - IC封装设计增长70%(年收入8400万美元),反映先进封装需求激增[7] AI在EDA中的应用 - AI优化EDA软件引擎、流程和工作流,需确保算法可验证、准确和稳健[8] - 西门子EDA将AI应用于核心技术、流程优化和开放平台,提升工程师生产力[8] - Synopsys的AI工具缩短设计周期,谷歌AlphaChip实现芯片布局"超人"级优化[11] - 生成式AI(GenAI)协助设计建议和代码优化,但面临数据可用性限制[12] Chiplet技术对EDA的影响 - Chiplet技术推动EDA工具支持异构集成设计,需重构工具架构[13] - 先进封装EDA市场规模2025年将突破5亿美元,增速高于传统工具[13] - EDA厂商开发集成平台(如Synopsys 3DIC Compiler)应对Chiplet设计挑战[13][15] - Chiplet设计需整合8-12个供应商IP模块,驱动AI工具解决协同优化问题[15] 行业竞争与战略方向 - EDA厂商IP业务依赖传统接口协议,RISC-V生态崛起分化市场格局[14] - 未来竞争关键为EDA工具与IP协同设计能力,需评估深度开发或并购扩展战略[14]
北京大学发表最新Cell论文
生物世界· 2025-05-28 15:30
研究背景与意义 - 活体动物体内精确控制蛋白质激活的通用策略对蛋白质功能增益研究至关重要[1] - 现有技术依赖复杂蛋白质构建体设计,可能改变目标蛋白质的天然功能和相互作用[4] - 生物正交断键反应(BCR)与遗传密码扩展(GCE)技术结合,可利用非天然氨基酸暂时掩蔽目标蛋白活性位点[4] 技术突破 - 开发CAGE-Prox vivo策略,通过引入反式环辛烯-酪氨酸(TCOY)暂时关闭蛋白功能,再通过小分子诱导恢复活性[7] - 利用机器学习流程进化出能精准识别TCOY的氨酰-tRNA合成酶突变体(PylRS)[7][10] - 采用3,6-二甲基-1,2,4,5-四嗪(Me2Tz)触发TCOY的生物正交剪切反应释放天然酪氨酸[10] 技术优势 - 体内操作无需紫外线,穿透深层组织[10] - 靶向递送与化学激活双重精准控制[10] - 通用平台可精准调控酶活性、蛋白质互作、抗体功能等[10] 应用场景 - 精准杀伤肿瘤细胞:通过EGF-PA靶向递送失活LF,Me2Tz激活后诱导肿瘤细胞凋亡[9] - 定向激活肿瘤细胞焦亡:重新激活LF触发Caspase3/8级联反应切割GSDME[11] - 构建更安全双特异性抗体:TCOY修饰抗CD3抗体避免细胞因子风暴,提高安全性[11] 研究意义 - 为活体条件下时间分辨生物学研究和按需治疗干预提供通用平台[13] - 实现活体动物中按需激活蛋白质及调控蛋白-蛋白相互作用[13]
【行业深度】洞察2025:中国自学习边缘计算智控器市场规模及竞争格局(附市场规模、竞争格局等)
前瞻网· 2025-05-28 12:44
自学习边缘计算智控器概述 - 自学习边缘计算智控器是基于边缘计算架构与机器学习技术的分布式网络系统,可对安防、门禁、环境调控等核心场景进行实时感知、动态决策与自主优化 [1] - 主要应用于酒店场景,其次为景区、园区,未来将拓展至家居、养老、楼宇等领域 [1] - 核心功能包括实时感知(采集温湿度、能耗等数据)、自主决策(动态调整系统参数)、服务协同(自动化响应需求)、安全管控(整合门禁与安防系统) [3] 酒店数字化产业链结构 - 上游为数字基础设施(服务器、存储设备、操作系统等),中游为数字化解决方案提供商(智控器、PMS系统、智能门锁等),下游为酒店主体 [3] - 中国酒店数字化解决方案分为系统解决方案(如智控器)和设备解决方案(如通信终端) [3] 全球市场分析 - 全球酒店营收从2022年5501.5亿美元增长至2024年7302.7亿美元 [6] - 全球酒店技术投入2024年达138.8亿美元,占营收比重稳定在1.9% [8] - 自学习边缘计算智控器在酒店技术投入占比为2.9%,2024年市场规模达28.7亿元 [10][15] - 市场竞争集中度一般,CR3为31.6%,前三企业市占率分别为13.3%、9.7%、8.6% [18] 中国市场分析 - 中国酒店营收从2022年3057.3亿元增长至2024年3791.5亿元 [19][21] - 酒店技术投入占比2024年为4%,规模达151.7亿元 [22] - 自学习边缘计算智控器技术投入占比从2022年5.0%提升至2024年6.5%,2024年市场规模达9.9亿元 [26][28][29] - 市场竞争集中度较高,CR5为68.1%,前三企业市占率分别为18.3%、17.4%、15.0% [32] 行业数据来源 - 数据来源于前瞻产业研究院《中国边缘计算行业市场前瞻与投资战略规划分析报告》 [33]