深度学习
搜索文档
淘宝灰度测试“AI万能搜”新功能,电商搜索迎来变革
搜狐财经· 2025-08-22 09:24
淘宝AI搜索技术升级 - 公司推出"AI万能搜"新功能 目前处于灰度测试阶段 入口位于淘宝搜索激活页[3] - 该功能采用口语化交互模式 用户可通过日常对话式提问获取商品推荐 例如"适合职场新人的简约风格连衣裙"或"预算500元左右送父亲的实用礼物"[3] - 系统基于AI技术理解语义和场景需求 生成包含商品链接、测评视频、选购指南的多维答案报告 覆盖购物攻略、口碑对比、优惠信息等全链路消费需求[3] 技术实现与功能特性 - 功能依托阿里云通义大模型技术能力 结合淘宝海量商品数据与用户行为洞察 具备强大语义理解、意图识别和内容生成能力[4] - 系统能自动拆解预算、场景、人群、偏好等需求维度 例如输入"如何选择手机"时自动解析性价比、预算区间、续航能力等核心维度[4] - 具备"购物偏好"功能 采用协同过滤算法参考用户偏好 使AI既拥有产品知识又了解用户品味[4] 用户体验优化 - 结果页面提供AI提炼的核心选购标准、针对性避坑提醒及搭配建议[4] - 若用户对结果不满意 系统会引导细化需求 提供"按品牌筛选"或"对比同价位机型"等二次提问选项[4] - 对于"适合小户型的高性价比空调"类查询 除推荐机型外还提供安装注意事项、能效对比、用户评价摘要及使用效果短视频[4] 技术细节待明确 - 尚未明确是否使用DeepSeek等其他模型 以及搜索数据是基于商品详情还是种草笔记[5]
深度学习与转债定价:转债量化定价2.0
财通证券· 2025-08-20 09:47
报告行业投资评级 未提及 报告的核心观点 - 深度学习或能对转债定价,基于万能近似定理,若转债定价存在解析解,神经网络模型可拟合结果 [2][5] - 设计多层感知机模型(MLP),通过多层非线性变换学习定价模型,添加 11 种因子非线性拟合定价特征 [2][5] - 模型收敛性好且外推泛化能力出色,对样本外数据有强解释能力 [2][8] - 结合 MC 模型和传统 BS 模型,三个模型可在多场景辅助投资活动 [2][13] - 神经网络模型显示当前市场定价有高估,但仍有上行空间 [2][13] - MLP 和 MC 模型在新券定价上“高低搭配”,MC 适合大额高评级转债,MLP 对常规转债效果好 [2][16] - 模型在下修定价方面有较好效果 [2][19] 根据相关目录分别进行总结 深度学习定价模型的思路与设计 - 参考 BS 公式,中国可转债是复杂期权,可能存在复杂定价公式,基于万能近似定理,神经网络模型可拟合定价结果 [5] - 设计 MLP 模型,建立有限隐藏层,通过多层非线性变换学习定价模型,添加 11 种因子拟合定价特征 [5] - 模型收敛性好且外推泛化能力出色,选择 2022 - 2023 年因子数据训练和测试,剔除异常数据,第 100 轮迭代误差收敛,对 2024 - 1Q2025 数据解释能力强 [8] - 与 BS 公式和 MC 模型相比,MLP 模型定价效果更强,拟合市场整体转债价格平均值和所有转债价格时误差更小、稳定性更强 [10] - MLP 模型批量计算定价结果速度快,考虑转债特性和市场环境,定价更贴近实际,但存在不可解释性和需大量历史数据训练的问题 [11] 转债量化定价 2.0——模型有哪些应用? - 结合 MC 模型和传统 BS 模型,三个模型可在新券定价、市场解释、条款定价等场景辅助投资 [13] - 神经网络模型显示当前市场定价有高估,但截至 2025 年 8 月 15 日,市场价格中位数估值高估幅度不大,转债估值虽在高位但仍有上行空间 [13] - MLP 和 MC 模型在新券定价上“高低搭配”,MC 适合大额高评级转债,MLP 对常规转债效果好,超 50% 转债上市价格在 MC - MLP 框定区间,2024 年 11 月后超 80% 被捕捉 [16] - 模型在下修定价方面有较好效果,2025 年一季度多数转债提议下修第二个交易日价格能被 MLP 预测价格区间框定或接近上下沿 [19]
每经热评丨人形机器人运动会启示:前沿技术走向大众需要催化剂
每日经济新闻· 2025-08-19 23:07
技术层面 - 全球首个人形机器人运动会在北京举行 来自16个国家280支队伍500余台机器人参与26个大项538个小项竞技 [1] - 人形机器人以人工智能和深度学习为内核 具备自主决策和自适应能力 实现感知行动与认知融合 [1] - 运动会在真实竞技环境中检验传感器识别 运动控制 路径规划等综合能力 暴露技术缺陷并提供改进方向 [1] 产业层面 - 运动会吸引192支高校赛队和88支企业赛队 包括天工 宇树科技 加速进化等头部整机企业 [2] - 赛事考验算法数据质量 硬件供应链稳定性到运维响应速度的整个生态系统成熟度 [2] - 亦庄人形机器人马拉松赛事后松延动力N2机器人产品获得超过2000台订单 [2] 社会影响层面 - 运动会搭建公众与前沿科技沟通桥梁 通过竞技形式让公众直观理解机器人能力 [3] - 赛事荣誉体系和竞争氛围为青年人才提供展示舞台 激励投身机器人科研领域 [3] - 竞技活动推动技术融合与突破 促进前沿技术从实验室走向大众市场 [3]
图灵奖得主杨立昆沉寂数月后发声:AI安全是工程问题,不必恐慌“失控”
36氪· 2025-08-19 10:50
Meta公司战略与组织动态 - 2025年7月1日,Meta正式宣布成立Meta超级智能实验室,以加速通用人工智能的研发进程 [3] - 在此次重组过程中,公司创始人马克·扎克伯格主导了一系列高调挖角行动,展现出对AI顶尖人才的强烈渴求 [3] - 长期担任Meta基础AI研究实验室首席科学家的杨立昆在此过程中逐渐被边缘化,淡出了公众视野 [3] 杨立昆的职业生涯与学术贡献 - 杨立昆与杰弗里·辛顿和约书亚·本吉奥因深度学习的开创性贡献共同获得图灵奖,三人被并称为人工智能三大教父 [3] - 其博士论文提出了早期反向传播算法,随后在贝尔实验室推动了支票识别系统等技术的产品化应用 [4] - 2003年,杨立昆在纽约大学重启神经网络研究,并将神经网络更名为深度学习,此后该技术在语音识别领域取得重大成功并迅速成为主流 [4][9] 人工智能行业发展与竞争格局 - AI领域的竞争并非地域间的较量,而是开放研究与开源生态对封闭专有系统的对抗 [4][10] - Meta开源的Llama模型家族自2023年夏季以来已被下载约8亿次,开放研究被认为加速了技术进步 [4][11] - 深度学习成为主流的突破点出现在本世纪10年代末的语音识别领域,18个月内几乎所有智能手机的语音识别系统都采用了该技术 [9] 人工智能技术理念与安全观点 - 杨立昆长期坚信神经网络的潜力,主张机器无需显式编程即可通过学习掌握技能,这一理念已成为现代AI的基石 [3] - 其提出目标驱动架构,核心思路是为AI系统设定清晰的目标和必要的安全边界,使其在既定范围内执行任务 [5][13] - 认为AI安全是工程问题,可通过合理设计解决,即便出现失控AI,社会也能通过更先进的AI技术进行抵御和风险消除 [5][13] 人工智能的社会影响与未来展望 - AI可能像15世纪的印刷术一样,引发一场新的文艺复兴,极大地增强和放大人类智慧 [5][14] - 杨立昆激励年轻人积极投身创新,不要被负面叙事所束缚,要认识到自己的力量并主动塑造未来 [5][18] - 巴黎已成为欧洲AI与高科技初创企业的中心,受益于本地人才储备和高度集中的创新生态 [4]
几何计算联袂深度学习 提升疾病诊断准确率
科技日报· 2025-08-19 09:22
科技日报讯 (记者金凤)记者8月17日从东南大学获悉,该校教授顾忠泽团队联合中国科学院外籍 院士丘成桐团队等研发出基于几何表面参数化的多组学预测技术。该技术能提升对结直肠肿瘤等实体瘤 的组织分型与分子标志物的预测准确率,有望支撑人工智能在病理图像分析领域的应用。相关成果近日 刊发于中国工程院院刊《工程学》。 "人工智能已经在病理诊断中有不少应用,但现有算法多用于自然图像领域,其处理不规则病理图 像的能力有限。"论文第一作者、东南大学生物科学与医学工程学院博士生黄锴介绍,当碰到病理组织 分布不均匀等情况时,人工智能对疾病的预测准确度就会大打折扣。 "病理切片中的组织形状很不规则,造成图像中有许多空白区域,这些空白对于疾病的诊断没有意 义,我们将包含少量空白的不规则组织的图像提取出来,再将这些图像转换为正方形。"论文共同通讯 作者李铁香介绍,团队通过几何映射技术,保留了病理图像关键特征,同时引入多尺度和各向异性信 息,提升病理切片图像中有关肿瘤区域的信息量。经过这番处理,既减少了对无用信息的储存、处理, 又能增强卷积神经网络对肿瘤特征的学习能力。 黄锴介绍,团队使用该方法在573名结直肠癌患者的1802张切片上进 ...
每经热评︱人形机器人运动会启示:前沿技术走向大众需要催化剂
每日经济新闻· 2025-08-18 15:40
技术层面 - 全球首个人形机器人运动会在北京举行 来自16个国家280支队伍500余台机器人参与26个大项538个小项竞技 [1] - 人形机器人以人工智能和深度学习为内核 具备自主决策和自适应能力 实现感知行动与认知的融合 [1] - 运动会使技术缺陷在传感器识别运动控制路径规划等环节暴露 推动机械结构人工智能光学传感材料等多学科技术进步 [1] 产业层面 - 运动会吸引192支高校赛队和88支企业赛队 包括天工宇树科技加速进化等头部整机企业 [2] - 赛事考验算法数据质量硬件供应链稳定性运维响应速度等全生态系统成熟度 [2] - 亦庄人形机器人马拉松赛事后松延动力N2机器人获得超过2000台订单 [2] 社会影响 - 运动会搭建公众与前沿科技沟通桥梁 通过竞技形式让公众直观理解人形机器人应用场景 [3] - 赛事荣誉体系和竞争氛围激励青年人才投身机器人科研领域 加速行业人才培养 [3] - 竞技活动推动技术从实验室走向大众市场 实现产业革新 [3]
卖酒的茅台要学AI了!和奔驰麦当劳一起拜师百度
量子位· 2025-08-17 11:43
百度AICA项目概况 - 百度举办第九期首席AI架构师培养计划(AICA),吸引茅台、奔驰、麦当劳、国网、中石化、中石油等头部企业技术高管参与[2][3] - 项目依托百度自研飞桨深度学习平台和文心大模型,培养兼具技术开发与项目落地能力的复合型AI架构师[5] - 本期96名学员从500多名报名者中筛选,61%来自国央企/上市公司/T1服务商,80%具备"管理+专业+技术"复合背景,覆盖能源、重工业、医疗等18个领域[42][44] 大模型技术发展趋势 - 大模型相关课题占比达51%,首次涉及多智能体协同等前沿技术应用[6][7] - AI技术进入软件3.0时代:1.0为传统编码,2.0为深度学习模型,3.0通过大模型提示词实现多功能任务[35] - 百度内部AI代码生成占比从2022年5%提升至50%,采纳率从15%增至80%,可处理复杂编程任务[28] - 大模型参数规模达十亿级,核心进步在于Transformer架构、注意力机制及专家MoE结构的优化[36][37][38] 产业落地关键方向 - AI竞争重点转向制造、医疗、金融等场景落地,需解决产品同质化、与核心业务挂钩等挑战[13][20] - 企业应用AI的三大价值:工作效率提升(OpenAI研究)、服务模式重构(赛迪研究院补充)、资源均衡分配[16][17] - 国内AI发展呈现技术比拼(智能水平替代参数规模)、商业应用(场景实践替代概念验证)、产业格局(头部企业主导)三大趋势[18] AI架构师能力要求 - 需掌握提示词工程(任务拆解/指令优化)、模型调优(微调/对齐)、全栈系统设计(开发至部署)、场景洞察四大核心能力[32][33] - 重点提升大模型输出质量与效率,包括结果优化、速度提升及Agent工作流整合[30][33] - 百度通过AICA提供文心大模型实战案例,已培养489名架构师覆盖工业、能源、金融等数十行业[47] 行业应用案例 - 麦当劳团队申报《麦麦巡警数字员工》课题,探索大模型优化与Agent工程化设计[45] - 百度文心大模型4.5 Turbo应用于罗永浩数字人直播,展现深度分析与持续输出能力[26]
Cell重磅:AI破局抗生素耐药危机,从头设计全新抗生素,精准杀灭耐药菌
生物世界· 2025-08-15 12:21
抗生素耐药性危机与公共卫生威胁 - 2021年全球471万例死亡与细菌抗生素耐药性相关,其中114万例直接归因于抗生素耐药性[2] - 美国疾控中心将淋病奈瑟菌和金黄色葡萄球菌列为"紧急"和"严重"威胁,因对现有抗生素产生广泛耐药性且缺乏新治疗手段[5] - 1980年至2003年间全球前15大制药公司仅开发出5种抗菌药物,凸显新结构化合物需求紧迫性[5] 生成式人工智能在抗生素开发中的突破 - 研究团队开发生成式AI平台,通过基于片段的CReM方法和无约束的VAE方法设计新型抗生素分子[8] - 平台生成超过3600万种未记录抗菌活性化合物,从中合成24种化合物,7种显示选择性抗菌活性[8] - 两种先导化合物NG1和DN1对多重耐药菌株具杀菌效力,作用机制各异,在小鼠模型中杀菌速度超过万古霉素[8] 技术方法与创新应用 - 深度学习中的图神经网络(GNN)将化学结构表示为数学图,通过消息传递操作预测分子抗菌活性概率[6] - 生成式AI突破已知化学空间限制,理论化学空间包含约10^60种化合物,而最大计算机模拟库仅含10^11种[7] - 遗传算法与变分自编码器实现基于片段设计和从头设计,为探索化学空间未知领域提供平台[10][11] 研究成果与实验验证 - 先导化合物显著降低淋病奈瑟菌感染和耐甲氧西林金黄色葡萄球菌皮肤感染小鼠模型的细菌负荷量[8] - 化合物对人类细胞显示安全性,且对耐药菌株表现出独特作用模式[3][10] - 研究方法增强在化学空间中寻找候选抗生素的能力,为应对抗生素耐药性危机提供新武器[7][11]
NVIDIA英伟达进入自动驾驶领域二三事
自动驾驶之心· 2025-08-14 07:33
自动驾驶行业格局与Orin平台应用 - 英伟达Orin平台目前被众多明星车企采用,包括上汽R/智己、理想L9、蔚来ET7、小鹏新一代P7、威马M7、比亚迪、沃尔沃XC90等乘用车品牌,以及智加科技等自动驾驶卡车公司和Cruise/Zoox/滴滴/小马智行/AutoX等Robotaxi企业[2] - 软件公司Momonta等也基于Orin平台进行开发[2] 特斯拉与Mobileye的合作与分歧 - 2013年9月特斯拉宣布自研自动驾驶技术,但初期因缺乏芯片支持被迫与Mobileye合作[5] - 特斯拉在Mobileye方案基础上创新性增加Fleet Learning功能,实现Autopilot自我学习能力,这成为后来"影子模式"的雏形[9] - 2015年特斯拉成立Tesla Vision团队并挖角微软计算机视觉专家David Nister,引发Mobileye强烈反对[11][12] - Mobileye要求特斯拉停止自研算法否则断供技术支持,导致2015年双方矛盾激化[13] 英伟达切入自动驾驶领域 - 2012年黄仁勋认定电动汽车自动驾驶是英伟达在端侧最佳方向[15] - 2013年英伟达财报会议提出汽车业务应向自动化发展,强调GPGPU将赋能计算机视觉和驾驶辅助功能[17] - 2015年1月发布DRIVE品牌及PX平台,基于Tegra X1芯片和Maxwell GPU,算力超1 TOPS[18] - 2016年1月黄仁勋亲自向马斯克展示DRIVE PX平台[18] 特斯拉转向英伟达合作 - 2016年Mobileye因Autopilot事故终止与特斯拉合作[19] - 2016年10月特斯拉HW2.0采用英伟达DRIVE PX 2定制版,算力提升40多倍,支持8摄像头+12超声波雷达+1前向雷达的传感器方案[20] - 英伟达2016年初发布的DRIVE PX 2被黄仁勋称为"首款自动驾驶超级计算机"[21] 英伟达技术迭代与生态拓展 - 2017年底特斯拉公开自研芯片计划[25] - 同期英伟达加速产品迭代并拓展225家合作伙伴,涵盖车企/供应商/互联网公司/创业公司等[26] - 2018年CES发布DRIVE Xavier SoC平台,性能提升同时功耗显著降低[28] 特斯拉自研芯片进展 - 2018年马斯克承认英伟达硬件优秀但强调特斯拉需要独特定制方案[28] - 2019年4月发布自研HW3(FSD Computer),宣称图像处理能力达英伟达方案10倍[30] - 至此英伟达与特斯拉在智驾平台合作正式结束[32] 自动驾驶技术社区生态 - 行业已形成包含大模型/VLA/端到端/BEV/Occupancy/多模态融合等30+技术方向的学习路线[35] - 技术交流覆盖感知/仿真/C++开发/传感器融合等全链条环节[35]
OpenAI联合创始人Greg Brockman:对话黄仁勋、预言GPT-6、我们正处在一个算法瓶颈回归的时代
AI科技大本营· 2025-08-13 17:53
行业演进与公司发展 - 计算机行业正经历从个人魔法到工业革命的演进,OpenAI驾驭十万GPU集群标志着AI基础设施的成熟[3] - Stripe早期通过第一性原理突破传统限制,24小时完成银行需9个月的技术对接,体现硅谷创新精神[15][16] - OpenAI构建了研究-工程双引擎文化,工程能力与研究洞见同等重要,共同推动AGI发展[27][28][29] 技术突破与创新 - 深度学习从AlexNet开始颠覆传统规则,神经网络在多个领域超越人类设计的系统[24][25] - 强化学习(RL)和混合专家模型(MoE)成为解决算法瓶颈的关键方向,推动AGI研究进入新阶段[49][48] - Codex已贡献OpenAI内部10%代码合并请求,外部GitHub日处理24000个PR,重塑软件开发流程[42] 基础设施与硬件需求 - AI基础设施需兼顾高计算量任务与低延迟响应,催生专用加速器需求[45][47] - 模型规模扩大带来系统复杂性挑战,检查点机制和可靠性设计成为训练长周期智能体的关键[43][44] - 黄仁勋提出未来数据中心需支持多样化工作负载,包括多模态AI和实时交互系统[45][46] 产品化与生态发展 - AI产品化面临模型与产品的鸿沟,需结合领域专业知识构建垂直智能体生态[52][53] - GPT-4o图像功能5天获1亿用户,反映AI应用病毒式传播特性与规模化挑战[35][36] - 经济将因AI驱动产生10倍增长,医疗、教育等领域需定制化解决方案[54][55] 研发趋势与瓶颈 - 基础研究回归成为核心,算法瓶颈重新成为制约AGI进展的关键因素[49][50] - 当前研发受计算资源、数据、算法、电力等多维度限制,需动态平衡[49] - GPT-4暴露可靠性问题,显示AI需突破"隔玻璃观察"的学习模式[50][51]