Workflow
Deep Learning
icon
搜索文档
别再乱选AI课程了——这些书才是你的正解
36氪· 2025-08-03 08:03
编程与软件工程 - 编程能力与软件工程技能是进入AI领域的必备基础,OpenAI首席技术官Greg Brockman支持这一观点 [1] - AI领域最具影响力的人往往是同时精通软件工程与机器学习的专家,优秀软件工程师在AI领域潜力非凡 [1] - Python凭借易用性和完善生态成为AI领域首选语言,但热门AI工程师岗位可能需要掌握Java/GO/Rust等后端语言 [1] - 建议从Python入门,但未来可能需要转向其他语言,持续实践是掌握编程技能的最佳方式 [2] - 推荐Python学习资源包括4小时启蒙课、全网最受推崇的体系课程、面试刷题平台和哈佛CS50计算机导论 [5] 数学与统计学 - 成为顶尖AI从业者需理解模型底层原理,推荐资源包括《数据科学实用统计学》和《机器学习数学基础》 [9] - DeepLearning.AI推出的数学专项课程涵盖微积分、线性代数、统计概率等核心内容,专为AI/ML设计 [9] 机器学习 - 当前主流AI指生成式AI(GenAI),属于机器学习分支,但AI概念可追溯至上世纪50年代神经网络诞生时 [6][8] - 推荐机器学习资源包括《Scikit-Learn、Keras与TensorFlow机器学习实战》和机器学习专项课,后者新增推荐系统与强化学习内容 [12] - 《统计学习导论》是掌握机器学习根基的绝佳教材,传授学科精髓 [12] 深度学习与大语言模型 - 深度学习是AI的子集,当前所有生成式AI算法源于此领域,包括大语言模型、扩散模型和Transformer架构 [10] - PyTorch是深度学习框架首选,2021年77%研究论文采用该框架,HuggingFace平台92%模型为其专属 [13] - 推荐资源包括深度学习专项课、Andrej Karpathy的《大语言模型入门》和《神经网络:从零进阶》 [13] 人工智能工程 - AI工程师的核心工作是运用基础GenAI模型开发产品,工作性质更接近传统软件工程而非机器学习工程 [11] - 《实用MLOps指南》是模型部署领域必备书,覆盖容器化、脚本编写、云系统和模型监控等全流程 [11] - 《人工智能工程实践》是当红教材,作者Chip Huyen是生产环境ML/AI系统权威专家 [14]
Can Taboola's Realize Platform Drive Scalable, AI-Powered Ad Growth?
ZACKS· 2025-07-31 01:46
Key Takeaways TBLA's Realize platform drives ad growth by automating ad matching and improving campaign performance.Deep-learning personalization and self-serve tools expand TBLA's advertiser base without raising costs.Realize supports TBLA's strategy to compete with Google and Meta as an open-web ad alternative.Taboola.com Inc.’s (TBLA) Realize platform plays a vital role in scaling the company’s advertising operations by significantly enhancing efficiency and performance. As Taboola’s proprietary AI-drive ...
Alterity Therapeutics Announces Publication on Novel MRI Endpoint from the bioMUSE Natural History Study
Globenewswire· 2025-07-24 19:25
核心观点 - Alterity Therapeutics开发的MSA萎缩指数(MSA-AI)通过深度学习技术精确量化多系统萎缩症(MSA)患者脑萎缩程度 该指标与疾病严重程度和进展显著相关 为诊断和临床试验提供客观工具 [1][2][3] - MSA-AI能有效区分MSA与其他突触核蛋白病(如帕金森病和路易体痴呆) 其纵向变化与12个月内临床恶化显著相关(ρ=-0.65 p=0 01) [5] - 该技术已应用于公司ATH434-201二期临床试验 未来将用于三期试验的患者筛选和疾病监测 [3][7] 技术突破 - 采用先进神经影像学方法超越传统MRI技术 通过深度学习精确定义脑部关键区域解剖结构 [2][3] - 开发出表型无关的评估标准 适用于MSA-P和MSA-C亚型 解决早期诊断困难(与帕金森病症状重叠) [4] - 研究结合bioMUSE纵向队列(n≈20)和横断面队列 覆盖疾病全阶段 结果显示MSA患者脑体积显著低于对照组(p<0 001) [5][7][8] 临床应用 - 提供标准化结构变化指标 支持更早更准确诊断 优化临床试验受试者选择 [4][5] - 12个月内脑体积统计学显著减少与临床恶化相关 验证其作为生物标志物的可靠性 [3][5] - 技术已整合入二期临床项目 将用于评估ATH434等疾病修饰疗法的效果 [3][7] 疾病背景 - MSA是罕见神经退行性疾病 美国患者约15 000人 目前无延缓疾病进展的疗法 [9] - 特征为自主神经功能障碍和运动障碍 伴随α-突触核蛋白在神经胶质细胞异常沉积 [9] - bioMUSE自然史研究为临床试验设计提供关键数据 包括生物标志物选择和疾病进展特征 [7][8] 公司动态 - Alterity专注于神经退行性疾病治疗 主导产品ATH434在MSA二期试验显示积极数据 [10] - 与范德比尔特大学医学中心合作开发生物标志物技术 强化临床开发能力 [3][7] - 同时推进帕金森病及相关疾病的疾病修饰疗法研发 拥有专利化合物发现平台 [10]
AI Chat With Roland Rott, President & CEO of Imaging at GE HealthCare
The Motley Fool· 2025-07-24 12:23
GE Healthcare业务概况 - GE Healthcare从通用电气分拆后成为独立上市公司 2023年初完成分拆 目前年收入达196亿美元 服务覆盖160个国家超10亿患者[5] - 业务模式采用"D3战略":智能设备(Smart Devices)、智能药物(Smart Drugs)和数字解决方案(Digital Solutions)相结合 聚焦癌症和心血管疾病等特定疾病领域[6] - 影像部门年收入90亿美元 产品线涵盖X光、CT、MRI和分子影像等 其中分子影像(如PET CT)是未来增长重点[3][9][10] 技术创新与AI应用 - 公司拥有85款FDA批准的AI医疗设备 AI技术使MRI重建时间缩短70% 心脏检查时间减少83% 已服务超3000万患者[13][14] - 研发重点包括:CT光子计数架构、分子影像新同位素应用 以及跨设备数据整合的AI解决方案[11][20] - AI应用场景:消除影像伪影提升诊断信心 优化检查流程提高患者吞吐量 并辅助医生生成综合诊断报告[14][18][20] 行业竞争与生态系统 - 通过收购Caption Health(超声)和MIM(分子影像软件)等AI公司强化技术布局 同时与大型医疗系统共建开放生态系统[19] - 竞争优势体现在:FDA获批AI设备数量领先 以及从单设备优化到全诊疗流程整合的解决方案能力[19][20] - 结合精益管理(Lean)与AI技术 同步提升内部研发效率和临床服务能力[17] 产品演进与市场机会 - 影像技术历经四代发展:从基础X光到分子影像 当前PET CT/MR在癌症诊疗中展现最大增长潜力[9][10] - 成熟市场MRI普及度高 但分子影像的临床适应症仍在扩展 新兴市场对高端影像设备存在显著未满足需求[10] - 服务收入构成重要板块 包括设备维护和AI算法更新等持续服务 形成长期客户粘性[8]
L4产业链跟踪系列第三期-头部Robotaxi公司近况跟踪(技术方向)
2025-07-16 14:13
纪要涉及的行业和公司 - 行业:自动驾驶(Robotech)行业 - 公司:小马、百度、文远、滴滴、Otto X、Vimo 纪要提到的核心观点和论据 技术架构与算法框架 - 最初自动驾驶底层算法框架是模块化做法,包含感知、预测、规控、规划和控制,如今强化学习和世界模式加入,但原框架未完全拿掉 [2] - 产业链车企经历从CNN架构到transformer的转变,小马逐步将规则方案替换为模型输出,出发晚的车企替换更容易,小马因原有方案基线高,替换需更长时间 [3][4] - 感知和预测模块很早就用模型做,规控模块虽有模型应用但未完全大模型化,业界多是一段式端到端化,大语言模型未上车,模型训练已使用transformer底层架构 [5][6][7] 数据处理 - 小马内部有模块化和端到端两种方案,模块化方案目前大部分用真实数据,端到端和规控模型化会增加仿真数据使用,因规控数据不足,仿真数据可解决corner case问题 [8][9] 学习方法应用 - 模仿学习较早用于规则处理不好的场景,强化学习用于e2e模型和部分小模块,使用比例不大 [11] 车辆投放 - 目前有安全冗余或测试车辆约小几百(300)辆,主要投放于北京和广州(北京在益州,广州在南沙区),深圳(前海)和上海较少 [14] - 今年计划扩大投放,主要城市为北京、广州和深圳,若上海拿到牌照也会增加投入 [21] 车辆成本与配置 - 车辆成本十几万,加装成本为主,包括9个激光雷达、13 - 14个相机、4个Orin X车载芯片及定位、线控等模块,成本在几万块以内,之前对内称整套成本可控制在20万以内 [15] 算力分配与融合方案 - 算力架构采用前融合和后融合并存,有冗余性,4个Orin X芯片中3个开启,1个备用。第一个芯片运行大部分感知模型,第二个芯片运行部分无雷达输入或对实时性要求稍低的模型,第三个芯片部分模型可能移至第二个芯片 [17][18] - 目前算力吃紧,2024年部分精力用于削减个体量化,暂无换CPU计划 [19] 运营经济账 - 每辆车每天接单约30单,每单平均价格约29元,可据此估算营收。成本主要是电费、车辆折旧费,还有人工充电、车辆维修等成本,1000多辆车可实现盈亏平衡 [24][25] - 后台安全员人车比去年为1:3 - 1:6,现在部分情况可达1:20 [25] 商业化落地排序 - 全球来看,Vimo在美国落地较多,走在前面;国内参与者中,小马、百度的阿波罗、文远较靠前,滴滴靠后,Otto X、袁隆等已停止相关业务 [27][28] - 小马拿商业牌照速度比百度快,内部端到端模型在某些情况下输出结果优于模块化模型,未来有望切换到端到端方案 [28][29] 其他重要但是可能被忽略的内容 - 公司计划在2027年底或2028年底实现公司层面盈亏平衡,可能需要万辆以上甚至十万辆车 [26] - 后续会议将关注无人物流等行业头部公司进展 [30]
刚刚,何恺明官宣新动向~
自动驾驶之心· 2025-06-26 18:41
何恺明职业动态 - AI领域顶尖学者何恺明正式入职谷歌DeepMind担任杰出科学家,同时保留MIT终身副教授身份[1][3][4] - 此次跨界标志着何恺明实现"学界+业界"双轨并行发展模式[5][12] - DeepMind联合创始人Demis Hassabis曾预测AGI将在5-10年内实现,何恺明的加入将加速该目标[7][8] 学术成就与技术贡献 - 提出深度残差网络(ResNet)成为现代AI模型基石,相关论文在2016-2021年连续三年位居谷歌学术全领域被引榜首[18][19] - 开发的Faster R-CNN和Mask R-CNN是物体检测领域被引量最高的论文之一,分别被引用91993次和45582次[19][21][24] - 论文总被引量达713370次,h-index指数71,近五年被引量597873次[18][19] 近期研究成果 - 2024年与Yann LeCun合作提出无归一化层Transformer,仅用9行代码实现,成果被CVPR 2025收录[33][34] - 2024年2月提出分形生成模型,将像素级图像生成计算效率提升4000倍[36][37] - 2024年5月联合CMU团队开发MeanFlow框架,实现无需预训练的一步生成建模[38][39] 职业经历与教育背景 - 曾任职微软亚洲研究院(2011-2016)和Meta FAIR实验室(2016-2023)[12][32] - 2007年获清华大学学士学位,2011年获香港中文大学博士学位[29][30] - 2009年成为首位获得CVPR最佳论文奖的中国学者,累计获得4次国际顶会最佳论文奖[24][27]
刚刚,何恺明官宣入职谷歌DeepMind!
猿大侠· 2025-06-26 11:20
何恺明职业动态 - AI领域顶尖专家何恺明正式加入谷歌DeepMind担任杰出科学家,同时保留MIT终身副教授职位[2][3][4][5] - 此次跨界加盟将显著增强DeepMind在AGI领域的技术实力,其学术影响力(论文总引用71万次)与业界经验(Meta/微软亚研院)形成双重优势[5][7][11][17] - DeepMind CEO Demis Hassabis曾预测AGI将在5-10年内实现,何恺明的加入将加速这一进程[8][9] 技术成就与行业影响 - 提出的ResNet成为深度学习基石,相关论文在2016-2021年连续位居谷歌学术全领域引用榜首(28万次)[5][18][20] - 开发的Faster R-CNN(引用9.2万次)和Mask R-CNN(引用4.6万次)持续引领计算机视觉发展[18][20][23] - 2024年最新研究成果包括:无归一化Transformer(9行代码实现)、分形生成模型(计算效率提升4000倍)、MeanFlow一步生图框架[31][34][35][36] 学术地位与职业轨迹 - 首位获得CVPR最佳论文奖的中国学者,累计斩获4项国际顶会最佳论文荣誉[23][26] - 职业经历覆盖微软亚研院(2011-2016)、Meta FAIR(2016-2023)、MIT(2023至今)三大顶尖机构[11][30][5] - 保持高频科研产出,2024年已有3篇突破性论文被CVPR/ICCV等顶会收录[32][34][36]
Gorilla Technology Sets Q1 2025 Conference Call for June 18th, 2025, at 4:30 p.m. ET
Newsfile· 2025-06-13 20:00
公司动态 - Gorilla Technology Group Inc (NASDAQ: GRRR) 将于2025年6月18日美国东部时间下午4:30(太平洋时间下午1:30)举行电话会议,讨论2025财年第一季度(截至2025年3月31日)的财务业绩 [1] - 财务业绩将在电话会议前通过新闻稿发布 [1] - 电话会议可通过免费电话+1-833-752-4853或国际电话+1-647-849-3362接入,并提供网络直播及回放链接 [2] 公司业务 - 公司总部位于英国伦敦,是全球安全智能、网络智能、商业智能和物联网技术解决方案提供商 [3] - 业务覆盖智慧城市、网络、视频、安全融合和物联网等领域,主要服务于政府及公共服务、制造、电信、零售、交通运输与物流、医疗保健和教育等行业 [3] - 核心技术包括AI和深度学习技术驱动的智能视频监控、人脸识别、车牌识别、边缘计算、事后分析和高级网络安全技术 [4] - 公司通过AI技术整合提升智慧城市的运营效率、安全性和网络安防措施,改善居民生活质量 [4]
Nvidia's Stock and Business: How Did I Do With My 5-Year Predictions Made in 2020?
The Motley Fool· 2025-06-06 08:00
公司表现 - 英伟达股票在2020年3月至2025年3月期间总回报率达1760%,远超标普500的118%回报率 [2] - 同期1000美元投资可增值至18600美元 [2] - 公司股价表现主要由GPU及AI相关技术的强劲需求驱动 [2] 管理层与战略 - CEO黄仁勋自1993年联合创立公司后仍继续领导公司 [4] - 黄仁勋十多年前开始将游戏业务利润投入AI领域布局,使公司在AI时代占据领先地位 [4][5] 游戏GPU市场 - 公司在独立桌面GPU市场份额从2019年Q4的68.9%提升至2024年Q4的82% [6][7] - 主要竞争对手AMD同期市场份额为17%,英特尔仅占1% [7] - 游戏平台收入从2020财年55.2亿美元增长至2025财年113.5亿美元,年复合增长率15.5% [9] AI与数据中心业务 - 数据中心GPU市场份额在2024年达到92% [12] - 数据中心平台收入从2020财年29.8亿美元飙升至2025财年1152亿美元,年复合增长率107% [14] - 该业务占公司总收入比例从2020财年27%提升至2025财年88% [14] - AI推理芯片市场份额从几乎为零发展到占据最大份额 [13] 自动驾驶业务 - 完全自动驾驶汽车在美国合法化的时间表比预期延迟 [15] - 公司DRIVE平台仍被视为未来增长的重要驱动力 [15] 创新与技术 - 公司推出多项突破性技术,包括2021年发布的Omniverse虚拟仿真平台 [16][17] - Omniverse已被亚马逊、百事可乐、宝马等大型企业广泛采用 [17] 市场预测 - 游戏市场规模持续扩大,推动公司相关业务增长 [8] - 公司GPU仍被视为AI训练领域的黄金标准 [11] - 整体表现验证了五年前对市场表现的乐观预测 [18][19]
ZipRecruiter (ZIP) FY Conference Transcript
2025-06-05 03:20
纪要涉及的公司 ZipRecruiter (ZIP) 纪要提到的核心观点和论据 公司优势 - 财务状况良好,经营15年且盈利,资产负债表有4.68亿美元,去年调整后EBITDA超7000万美元,利润率16% [2][3] - 市场地位领先,是g2上排名第一的招聘雇主网站,连续五年多是安卓和iOS应用商店排名第一的求职应用,求职者流量增长快于竞争对手 [2] - 品牌建设成功,投入超10亿美元营销,80%以上求职者和雇主有品牌认知度,成为求职和招聘时的首选答案 [3][12][27] - 技术实力强,约9年前进入质量时代,在以色列建立研发中心,利用机器学习等技术处理大量数据,实现更好匹配 [7][8] - 产品体验佳,引入AI个人招聘专员Phil,推动双方交流,获得大量五星评价 [10][12] - 营销策略灵活,采用多渠道广告,每年投入9位数,能根据市场信号调整支出,快速响应市场变化 [13][15] - 客户价值增长,每位付费雇主季度收入为1734美元,自2021年以来复合年增长率约11% [20] 行业趋势 - 招聘市场规模大,美国每年招聘支出超3000亿美元,但大部分仍流向线下传统招聘公司,线上招聘占比小,面临长期变革 [4][5] - 技术应用增加,技术解决方案、雇主对其熟悉度和信心不断提高,线上招聘将迎来发展 [5] 业务表现与展望 - 业务在劳动力市场低迷中仍增长,过去两年处于招聘低迷期,但业务持续发展,付费雇主数量和收入呈增长趋势 [17][21] - 近期趋势向好,去年12月至今年1月付费雇主趋势改善,Q4到Q1付费雇主数量环比增长10%,Q1到Q2收入环比略有增长,预计Q3继续增长,Q4实现同比增长 [21][22][31] - 不同行业表现有差异,医疗保健行业表现强劲,零售行业波动较大 [33] - 不同客户反应不同,付费雇主以中小企业为主,中小企业对宏观变化反应更快,但年初两个客户群体都表现出优势 [36] 投资决策依据 - 市场表现鼓励投资,去年12月起市场表现良好,付费雇主活动活跃,支持Q1和Q2投资,预计Q2 EBITDA利润率为6% [38] - 投资考虑多方面因素,销售和营销支出统一考虑,兼顾短期现金回报、长期客户价值和品牌知名度提升 [40][41][42] 大语言模型应用 - 前端应用待验证,在求职领域,聊天界面可能延长求职者找工作时间,导致转化率下降 [44] - 后端应用有优势,能从文档中提取信息,适应不同格式,有助于构建算法训练和再训练管道 [45] 市场机会与挑战 - 求职者数量是关键,平台求职者越多,越能展示匹配算法和参与功能,如Zip Intro产品受好评 [47] - 线下市场渗透难,面临传统招聘方式的惯性和不信任,但能提供高效低成本解决方案,部分垂直领域有突破机会 [48][49][50] 其他重要但是可能被忽略的内容 - 公司多渠道营销包括电视、广播、卫星广播、播客、直邮等广告形式 [13] - 公司可根据招聘信息数量快速获取市场信号,灵活调整经营策略 [15] - 公司自2019年以来,各年度起始时每位雇主的平均收入呈上升趋势 [16]