Workflow
生成式AI
icon
搜索文档
阿里将向日本企业提供生成式AI基础模型方案
日经中文网· 2025-03-08 14:27
阿里云在日本推广生成式AI业务 - 阿里云宣布面向日本企业推广生成式AI基础模型的商业提案,并与日本咨询公司和系统开发公司开展合作 [1] - 公司计划在3年内将使用其模型的项目增加到1000个以上 [1] - 阿里云拥有通义千问(Qwen)和通义万相(Wan)等基础模型,其中Qwen2.5擅长编程、数学、生成长文本,且日语处理精度高 [1] 通义千问在日本的现状与未来计划 - 目前通义千问在日本的应用仅限于部分新兴企业的微调(Fine-tuning) [1][2] - 阿里云日本公司将与合作伙伴共同开发定制化模型和AI应用,已开始与多家企业谈判,计划2025年内正式提出方案 [2] - 公司将优先向IT、制造、零售行业推广,并引入在中国的成功案例 [2] 数据安全与本地化策略 - 阿里云强调其AI基础模型将以私有云形式在日本提供,数据不会离开日本数据中心 [1][2] - 公司承诺安全性保障,以缓解日本企业对中国开发模型的顾虑 [2]
AI 2.0时代,鸿蒙原生应用开发者手握入场券
36氪· 2025-03-07 22:31
生成式AI革命 - 生成式AI引发的科技革命可与电力带来的工业革命相提并论 [2] - DeepSeek在20天内达成2000万DAU,增长态势超越ChatGPT [2] - AI正重塑技术生态底层逻辑,实时响应、场景化交互、零门槛操作成为新刚需 [5] 鸿蒙原生AI布局 - 鸿蒙系统通过底层技术重构实现弯道超车,将AI从"工具"升级为"基础设施" [5] - 鸿蒙提供超过15个系统级AI能力,覆盖图像、语音、智能推荐等领域 [7] - 开发者可通过"一行代码"调用系统级原生AI能力,无需从零搭建模型 [7] 鸿蒙与开发者合作 - 鸿蒙与DeepSeek合作,开发者可借助其实现代码辅助、逻辑扩展和问题解答 [8] - 快递100通过鸿蒙端侧AI能力实现自然语言指令完成复杂操作 [9] - 什么值得买接入鸿蒙后,应用启动速度从2秒缩短至1秒,内存占用减少50% [12] 鸿蒙生态优势 - 鸿蒙通过负一屏、小艺建议等场景化入口,打破应用商店中心化模式 [11] - 元服务架构让"小而美"应用无需下载即可运行,聚焦服务价值密度 [11] - 鸿蒙已覆盖2万个头部原生应用和元服务,目标2025年达到10万个应用 [14] 未来展望 - 鸿蒙凭借10亿终端设备市场存量,打造用户体验持续更优的生态 [15] - 鸿蒙万物智联能力、盘古大模型能力等助力行业完成底层重构 [13] - 鸿蒙生态标志着国产操作系统构建下的应用生态变革机会 [16]
机构:2027年HBM4将用于自动驾驶
半导体芯闻· 2025-03-07 18:20
内存解决方案与生成式AI发展 - 内存解决方案是推动生成式AI发展的核心动力 DRAM虽具优势但面临成本与上市时程挑战 需客户参与承诺采购并采用LPDDR PIM Wide I/O GDDR与HBM等降本策略 [2] - 短期PIM被视为最具创新性的内存方案 主要支援神经处理单元但应用有限 Mobile HBM可提升效能但应用场景尚未明朗 [2] - 预计2026年苹果将在iPhone Pro Max与折叠机型中转向独立式DRAM配置 提升频宽 NAND表现将通过UFS 5.0技术改进 [2] 自动驾驶与高效能应用处理器 - 自动驾驶技术发展将推动高效能应用处理器与LPDDR使用增加 HBM4预计2027年后导入自动驾驶系统 [2] - XR装置 无人机与游戏领域将扩展Wide I/O应用以提升低延迟处理能力 [2] 技术创新与供应链合作 - NVIDIA的DIGITS技术将整合GPU与HBM提升内存频宽 2025年通过SOCAMM技术增强CPU频宽 但PCB与连接器成本仍是挑战 [3] - 三星强调生成式AI内存解决方案需平衡高频宽 速度 容量 低延迟与功耗管理 [3] - 预计2030年HBM5堆叠层数达20层 并与更多逻辑装置整合于Chiplet架构 台积电CoWoS技术角色将更关键 [3] - 供应链横向合作模式将取代垂直整合 技术标准化与成本优化推动产业向高效能低功耗发展 [3][4] 行动AI与标准化趋势 - DeepSeek正开发行动AI的大型语言模型 OpenAI等企业将逐步标准化AI技术 [3] - PIM与Low Latency Wide I/O等创新技术普及后 有望在软体标准化后加速落地 [3]
声网发布对话式AI引擎:让任意大模型开口说话
36氪· 2025-03-07 17:37
产品发布 - 公司于3月6日举办"AI开口,互动无界"发布会,推出全球首个对话式AI引擎,支持任意文本大模型升级为多模态大模型 [2] - 定价策略为0.098元/分钟,单次赠送1000分钟,智能打断功能增值服务0.042元/分钟 [2][7] 核心技术能力 - 模型选择多:支持DeepSeek、ChatGPT等全球主流大模型及语音合成供应商,兼容30000+终端机型 [4] - 响应速度快:全链路优化后语音对话延迟中位数650ms,打断响应低至340ms [5] - 抗干扰能力强:选择性注意力锁定功能屏蔽95%环境噪声,80%丢包率下仍可稳定对话 [5] - 开发效率高:仅需2行代码15分钟完成部署,支持LLM与TTS的URL/Key快速接入 [6] 成本效益分析 - 用户单次对话平均3轮问答21.1秒,成本约3分钱,月均15次对话成本不足5毛钱,年成本5元 [8] 应用场景拓展 - 主要落地场景包括智能助手、虚拟陪伴、口语陪练、智能客服及智能硬件 [10] - 智能硬件领域可实现语音控制、智能看护、个性化服务,覆盖AI玩具、教育硬件、穿戴设备等 [10]
2行代码与DeepSeek语音对话,1分钟不到一毛钱,所有大模型都能开口说话
量子位· 2025-03-07 15:12
核心观点 - 声网推出超低延迟实时对话式AI引擎,支持DeepSeek等大模型接入,仅需两行代码即可实现高质量语音交互[2][3] - 该引擎每分钟成本仅0.098元,单次对话平均成本3分钱,月成本不足5毛钱,年成本5元,价格极具竞争力[3][5] - 技术突破包括响应延迟中位数650毫秒,打断响应低至340ms,支持嘈杂环境和弱网条件下的稳定交互[7][8][9][10] - 开发者可在15分钟内完成AI语音交互功能部署,支持全球主流大模型和语音合成供应商的灵活切换[11][13][14] - 声网定位为"AI语音交互中间件",开创"语音交互即服务"新模式,推动生成式AI行业变革[17][19][22] 技术性能 - 关键延迟指标:对话响应延迟中位数650毫秒,远低于1.7秒的体验阈值[7][8] - 打断功能:支持自然打断,响应时间低至340ms,模拟人类对话节奏[9] - 抗干扰能力:可屏蔽95%环境噪声,在嘈杂场所保持对话质量[9] - 弱网适应:80%丢包率下仍可稳定交流,断网3-5秒不影响流畅度[10] - 全球覆盖:依托200+数据中心的SD-RTN网络实现跨区域低延迟[10] 成本优势 - 按用量付费模式:每分钟0.098元,单次赠送1000分钟[3] - 单次对话成本:平均3轮问答/21.1秒,成本3分钱[5] - 月成本:15次对话场景下不足5毛钱,年成本5元[5] - 无使用上限:支持百万级用户规模的多模态AI应用[5] 开发者体验 - 极简接入:2行核心代码即可完成大模型对接[2][11] - 快速部署:15分钟实现从零到完整AI Agent部署[11] - 模型兼容:支持全球主流大模型厂商,与OpenAI协议兼容[13] - 音色定制:可接入语音合成供应商的自定义音色[14] - 硬件适配:音视频SDK支持30000+终端机型,覆盖中低端设备[16] 行业影响 - 模式创新:开创"语音交互即服务"新业态,实现RTC与大模型技术解耦[17][18] - 生态定位:通过统一API接口成为"AI语音交互中间件"[19] - 基础设施:为多模态实时交互的Agent应用提供关键技术支撑[21] - 行业推动:加速"让所有AI都能开口说话"的生成式AI变革[22]
Broadcom(AVGO) - 2025 Q1 - Earnings Call Transcript
2025-03-07 08:58
财务数据和关键指标变化 - 2025财年第一季度总营收达创纪录的149亿美元,同比增长25%;调整后EBITDA达创纪录的101亿美元,同比增长41% [6] - 第一季度毛利润率为79.1%,运营利润率为66%,调整后EBITDA利润率为68%,高于66%的指引 [26][27] - 第一季度自由现金流为60亿美元,占收入的40%;资本支出为1亿美元;库存为19亿美元,较上一季度增长8% [31][32] - 预计第二季度综合营收约为149亿美元,同比增长19%;调整后EBITDA约为营收的66%;非GAAP稀释后股份数约为49.5亿股 [23][35] 各条业务线数据和关键指标变化 半导体业务 - 第一季度半导体营收为82亿美元,同比增长11%;AI营收为41亿美元,同比增长77%;非AI半导体营收为41亿美元,因无线业务季节性下滑环比下降9% [6][15] - 预计第二季度半导体营收为84亿美元,同比增长17%;AI营收为44亿美元,同比增长44%;非AI半导体营收为40亿美元 [18][35] 基础设施软件业务 - 第一季度基础设施软件营收为67亿美元,同比增长47%,环比增长15% [19] - 预计第二季度基础设施软件营收约为65亿美元,同比增长23% [23][36] 各个市场数据和关键指标变化 - 公司预计三个超大规模客户在2027财年将产生600 - 900亿美元的可服务潜在市场 [10] 公司战略和发展方向和行业竞争 - 加大在前沿AI半导体研发方面的投资,包括研发下一代加速器和扩展超大规模客户的加速器集群 [7][8] - 将业务从永久许可证模式向全面订阅模式转变,并向客户推销全栈VCF解决方案 [20][21] - 与英伟达合作推出VMware Private AI Foundation平台,满足企业在本地运行AI工作负载的需求 [22][23] 管理层对经营环境和未来前景的评论 - 生成式AI正在加速半导体技术的发展,包括工艺、封装和设计等方面 [62] - 尽管存在关税等不确定因素,但公司认为目前最大的挑战和机遇来自于优化硬件以支持前沿模型的训练和推理 [61][63] 其他重要信息 - 公司计划于2025年6月5日收盘后公布2025财年第二季度财报,并于太平洋时间下午2点举行财报电话会议 [137] 总结问答环节所有的提问和回答 问题1: 新增的四个合作伙伴客户的潜力以及定制硅趋势对业务的长期影响 - 这四个是合作伙伴,并非传统意义上的客户;公司帮助超大规模合作伙伴创建芯片和计算系统,其硬件需与合作伙伴的软件模型和算法配合才能部署和扩展;这四个合作伙伴未来有潜力产生与现有三个客户相当的需求,但时间上会更晚 [40][42][45] 问题2: 下半年AI业务的增长情况以及3纳米AI加速器项目的进展 - 第一季度业绩出色部分得益于网络产品出货量的改善以及部分订单提前交付;对于下半年的情况暂不做推测 [51][52][55] 问题3: 关税和市场动态对公司的影响以及公司可能的变化 - 关税情况不明,目前难以评估其影响;生成式AI对半导体行业产生了积极的干扰,加速了半导体技术的发展;公司参与其中并努力优化硬件以支持前沿模型 [61][62][67] 问题4: 从设计到部署的转化率以及如何评估 - 公司认为设计成功是指产品大规模生产并实际部署;从产品交付到大规模生产需要6个月到1年时间;公司会选择有大规模需求的合作伙伴,并与他们制定多年路线图 [77][78][80] 问题5: 新法规或AI扩散规则是否会影响现有三个客户的设计订单或出货量 - 目前没有相关担忧 [85] 问题6: 如果AI市场向推理工作负载倾斜,公司的机会和市场份额会如何变化 - 公司的600 - 900亿美元市场规模包括训练和推理两部分;目前大部分收入来自训练业务 [92][93] 问题7: 客户在选择交换机ASIC和计算产品时的考虑因素 - 超大规模客户在连接AI加速器集群时非常注重性能,公司在网络技术方面有优势,会持续加大投资以满足客户需求 [97][98][100] 问题8: 新增的四个合作伙伴客户是否会增加XPU的预计出货量 - 目前预计的XPU出货量仅针对现有三个客户,新增的四个合作伙伴暂不包含在内 [107] 问题9: 如何扩展产品组合以支持六个超大规模前沿模型,以及与客户的合作边界 - 公司为客户提供半导体基础技术,帮助他们优化模型;优化过程受客户需求和反馈的影响,涉及性能、功耗等多个方面 [113][114][115] 问题10: 公司在新的市场机会中的发展潜力以及运营支出的方向 - 公司在网络连接方面有广泛的产品组合,包括光学和铜缆解决方案,这些业务约占AI总收入的20% - 30%;第一季度研发支出为14亿美元,第二季度会增加,主要用于下一代AI产品的研发 [124][125][128] 问题11: 网络业务的增长情况以及未来的并购计划 - 第一季度网络业务有一定增长,但预计正常比例为计算业务占70%,网络业务占30%;目前公司专注于AI和VMware业务,暂无并购计划 [133][134]
Broadcom(AVGO) - 2025 Q1 - Earnings Call Transcript
2025-03-07 07:02
财务数据和关键指标变化 - 2025财年第一季度,公司总营收达创纪录的149亿美元,同比增长25%;调整后EBITDA达创纪录的101亿美元,同比增长41% [6] - 第一季度自由现金流为60亿美元,占收入的40%;资本支出为1亿美元;第一季度末库存为19亿美元,环比增长8%;现金为93亿美元,总债务为688亿美元 [25][26] - 预计第二季度合并营收约为149亿美元,同比增长19%;调整后EBITDA约为营收的66%;非GAAP稀释股份数约为49.5亿股;非GAAP税率约为14% [19][28][29] 各条业务线数据和关键指标变化 半导体业务 - 第一季度半导体营收为82亿美元,同比增长11%;AI营收为41亿美元,同比增长77%;非AI半导体营收为41亿美元,因无线业务季节性下滑,环比下降9% [6][13] - 预计第二季度半导体营收将环比增长2%,同比增长17%,达到84亿美元;AI营收将增长至44亿美元,同比增长44%;非AI半导体营收将基本持平 [15][28] - 第一季度半导体业务毛利率约为68%,同比上升70个基点;运营费用同比增长3%,运营利润率为57% [23] 基础设施软件业务 - 第一季度基础设施软件营收为67亿美元,同比增长47%,环比增长15% [15] - 预计第二季度基础设施软件营收约为65亿美元,同比增长23% [19][29] - 第一季度基础设施软件业务毛利率为92.5%,去年同期为88%;运营费用约为11亿美元,运营利润率为76%,去年同期为59% [24] 公司战略和发展方向和行业竞争 - 公司在半导体业务上加大研发投入,一方面研发下一代加速器,推出行业首个2纳米AI XPU;另一方面为超大规模客户扩展加速器集群,推出下一代100太比特Tomahawk 6交换机 [8][9] - 公司将基础设施软件业务从永久许可证模式向订阅模式转变,目前超60%已完成转换;向客户推销全栈VCS,截至第一季度末,约70%的前10000大客户已采用VCF [16][17] - 公司与NVIDIA合作推出VMware Private AI Foundation,已有39家企业客户 [19] 管理层对经营环境和未来前景的评论 - 生成式AI加速了半导体技术的发展,公司在优化硬件以适配前沿模型时面临诸多挑战,但也为工程师提供了创新机会 [49] - 随着大型企业采用AI,他们需在本地数据中心运行AI工作负载,这为公司的VCF和VMware Private AI Foundation带来了增长机会 [17] - 目前关税威胁尚未实际发生,影响尚不明朗,需3 - 6个月观察 [48][55] 其他重要信息 - 公司预计2027财年,三家超大规模客户将产生600 - 900亿美元的可服务潜在市场 [10] - 公司目前与另外四家超大规模客户合作开发定制AI加速器,虽尚未成为正式客户,但未来有望带来需求 [11][32] 总结问答环节所有的提问和回答 问题: 新接触的四家客户情况及定制硅趋势 - 这四家目前不算正式客户,公司帮助超大规模合作伙伴创建芯片和计算系统,需与合作伙伴的软件模型和算法配合才能部署和扩展;这四家未来有可能产生与现有三家相当的需求,但时间会较晚 [32][33][34] 问题: 2025财年下半年AI业务情况及3纳米产品进展 - 第一季度和第二季度业绩良好部分得益于网络出货量增加和订单提前交付;对于下半年情况,公司不做推测 [39][40][41] 问题: 关税和DeepSeek等因素对公司的影响 - 目前关税威胁未实际发生,影响不明;生成式AI对半导体行业有积极的推动作用,促使公司在技术和设计上不断创新;大型企业采用AI会推动其升级本地数据中心 [48][49][53] 问题: 从设计到部署的转化率及判断方式 - 公司认为设计成功是指产品大规模生产并实际部署,从产品交付到大规模生产需6个月 - 1年;公司选择有大量需求的合作伙伴,只与可持续的客户制定多年路线图 [59][60][61] 问题: 新法规或AI扩散规则对现有客户设计和出货的影响 - 目前没有相关担忧 [66] 问题: AI市场转向推理工作负载对公司机会和份额的影响 - 公司芯片业务涵盖训练和推理产品线,架构不同;目前提到的600 - 900亿美元可服务潜在市场是两者的总和,其中训练业务占比更大 [72][73] 问题: 客户选择交换机ASIC和计算设备的考虑因素 - 超大规模客户在连接AI加速器集群时非常注重性能,公司在网络、交换和路由方面有丰富经验和成熟技术,具有较大优势 [77][78] 问题: 新接触的四家客户是否增加XPU预计数量 - 目前提到的市场和数量仅针对现有三家客户,这四家合作伙伴不算在可服务潜在市场内 [85] 问题: 如何扩展产品组合以适配六种超大规模前沿模型,以及协助程度和信息共享界限 - 公司仅提供半导体基础技术,由合作伙伴根据自身模型和算法进行优化;优化涉及五个自由度,具体实施需根据合作伙伴需求,公司可见度有限 [92][93] 问题: 新的绿地扩展机会及OpEx资金去向 - 公司在超大规模客户的扩展项目中机会大,主要是绿地项目;在光学连接方面机会多,提供多种激光和网络架构;其他产品组合约占AI总收入的20% - 30%;第一季度研发支出为14亿美元,第二季度会增加,主要集中在研发2纳米AI XPU和扩展Tomahawk 5的基数容量 [100][101][105] 问题: 网络业务增长情况及未来并购计划 - 第一季度网络业务有增长,但60%计算和40%网络的比例不是常态,正常比例约为70% - 30%;目前公司专注于AI和VMware业务,暂无并购计划 [110][111]
深度|OpenAI主席Bret Taylor:看好AI Agent前景
Z Potentials· 2025-03-06 14:36
图片来源: Unsplash 在周二巴塞罗那的移动世界大会炉边谈话中, Bret Taylor 仍未给出 AI Agent的确切定义。 这位 Sierra 创始人和 OpenAI 董事会主席选择回避 CNN 主持人 Anna Stewart 关于AI Agent 与"生成式 AI 聊天机器人"有何不同的问题,而是暗示大家都不 喜欢前者,却对 AI Agent能提供的"共情"回应感到欣喜。 鉴于他的新创业公司正在构建一个客户服务 AI 代理,你会期待 Taylor 对这项技术的潜力充满热情。 "这些代理的非凡之处在于,人们实际上非常喜欢它们。" AI正在提升客户体验并降低成本 他确实没有让人失望:"我对大型语言模型和当前这波技术浪潮的兴奋程度,超过了我能记得的任何技术,也许可以追溯到我十几岁时发现互联网的时 候,"他在会议上对代表们说道。 生成式 AI 驱动的 AI Agent,与早期版本的 AI 聊天机器人相比,其能力的飞跃在于达到了更高的水平——例如"多语言且即时响应"的 AI。 "我认为我们现在正处于这样一个时代,这些 AI 解决方案实际上比替代方案更好,"他说道,并补充说:"我们与美国的 SiriusX ...
速递|Meta正考虑测试DeepSeek的AI模型,提升其AI营销工具
Z Potentials· 2025-03-05 14:19
文章核心观点 Meta发展商业AI聊天机器人吸引企业,但面临定制回复慢、无法从互动中学习等挑战,在推动企业使用AI技术方面也遇障碍,而云巨头利用AI工具提升销售效率,AI或成企业接触客户和推销产品重要方式 [1][2][5][6] Meta商业AI聊天机器人情况 - Meta准备发展并运行AI聊天机器人吸引Messenger和WhatsApp等企业,定位为提供客户支持、信息和推荐以促进销售的工具,还可助企业定向投放广告 [1] - 2023年10月开始测试商业聊天机器人,随后悄然推出,支持英语和西班牙语,11月聘请Clara Shih领导商业AI团队后进程加速 [2] - Shih团队被分配月度目标,团队包括公司资深员工并努力招聘B2B销售经验外部人员 [3] - 数百家企业正在测试Meta聊天机器人,测试主要关注在Messenger和WhatsApp上使用点击发送消息广告的企业,集中在东南亚和拉丁美洲 [3] - 测试企业询问Meta关于数据使用和聊天机器人表现信息,Meta会收集对话信息改进人工智能技术 [4] Meta商业AI聊天机器人面临挑战 - 测试过的企业称Meta聊天机器人可能需数月定制答复,且无法从企业代表与客户互动中学习 [1] - 竞争对手如Gorgias的AI代理一开始就能学习品牌声音并执行订单操作,反映出Meta向企业销售软件艰难 [2] Meta推动企业使用AI技术其他努力情况 - 自2023年5月为广告商推出文本和媒体生成工具,超400万广告商使用至少一种工具,Meta推销工具以提高平台广告覆盖范围 [4] - 一些广告商投诉工具准确性,称需重写或编辑AI生成内容,问题在于工具无法适应广告商习惯和控制细节水平 [4] - Meta考虑在广告商工具中测试DeepSeek的AI模型,权衡是为确保为广告商提供最佳体验 [5] 云巨头AI工具情况 - 亚马逊、微软和谷歌开发定制工具使销售人员处理更多账户和销售更多软件,以更少员工增加收入,自生成式AI热潮开始裁掉一些销售人员 [5] - 工具主要处理耗时重复任务,如亚马逊销售人员用工具起草提案建议客户增加云软件投入 [5] 行业趋势 云计算公司在AI工具上的成功可能在整个经济中产生影响,AI可能成为企业接触客户和推销产品方式中日益重要的一部分 [5][6]
日元贬值助推,日本2024年电子零部件出货回暖
日经中文网· 2025-03-05 11:48
行业整体表现 - 2024年电子零部件出货额达4 4844万亿日元 同比增长3% 主要受日元贬值及消费类产品库存调整结束推动 [1] - 2025年日资企业电子零部件产值预计达11 2142万亿日元 同比增长6% 占全球产值约30% [1] 品类增长情况 - 11个品类中有7个出货额超上年水平 电感器(14%)和电容器(7%)增长最为显著 [1] - 12月单月数据:电容器出货额1248亿日元(同比+10%) 电感器334亿日元(同比+14%) 连接器503亿日元(同比+7%) [2] 需求驱动因素 - 生成式AI发展带动数据中心服务器电子零部件需求强劲增长 [1] - 工业设备市场复苏与AI需求持续增长共同推动行业正增长预期 [1]