Cloud Computing

搜索文档
一文读懂数据工程的基础知识
36氪· 2025-07-10 10:10
数据工程定义 - 数据工程是设计、构建和维护系统的过程,该系统可以收集、存储、分析数据并基于数据做出决策,旨在让其他数据用户能够访问高质量数据 [2] - 数据工程是数据驱动型公司的基石,贯穿从数据收集到决策的所有步骤,堪称现代公司的血液 [1] 数据源类型 - 结构化数据源:遵循预定义模式,组织在行列表格中,适合高一致性数据,包括关系数据库(PostgreSQL/MySQL)、CRM系统(Salesforce)、ERP系统(SAP) [7][8][9] - 半结构化数据源:使用标签组织但无固定模式,包括JSON文件、XML文件、HTML文档和电子邮件 [10][12][13][14][15] - 非结构化数据源:缺乏预定义模型,包括文本文档、社交媒体帖子、视频和图像 [16][18][19][20][21] 数据提取方法 - 批处理:按预定间隔(如每日)处理数据,适用于信用卡账单、工资单等场景,工具包括Informatica/Talend [24] - 实时流处理:持续收集处理数据,适用于股票市场/零售库存,工具包括Apache Kafka/Amazon Kinesis [25][26] 数据存储系统 - 数据库:关系型(MySQL)适合事务处理,NoSQL(MongoDB/Redis)处理半结构化数据 [29] - 数据湖(Amazon S3/Databricks):存储原始多类型数据,适合AI/大数据分析 [30] - 数据仓库:优化结构化数据查询,用于商业智能,如Snowflake/Redshift [30][33] 数据处理技术 - 预处理包括数据清理(去重/填充缺失值)、规范化(数值缩放)、编码(分类转数值) [38][39] - ETL流程:提取源数据→转换格式→加载至存储系统,是数据集成的核心 [41] - 数据管道:自动化实时数据传输,工具如Apache NiFi/Airbyte [42][44] 数据集成方法 - 数据联合:创建虚拟数据库统一访问多源数据,无需物理整合 [46] - API集成:通过应用程序接口实现系统间数据调用 [47][48] - 聚合策略:包括分组(按属性分类)、汇总(计算总和/平均值)、层级汇总(日→周→月) [51][52][54] 数据质量保障 - 验证技术:模式验证、格式检查、范围检查、重复检测等,预防数据问题 [61][62] - 质量监控:定期审计+自动化工具(Great Expectations/Deequ)持续维护数据质量 [66][68] 数据建模与分析 - 建模分概念(实体关系图)→逻辑(定义键/约束)→物理(实际数据库实现)三阶段 [71] - 可视化工具:Tableau/Power BI展示数据趋势,Python库(pandas/Matplotlib)支持分析 [73][74] 系统优化趋势 - 可扩展性技术:分布式计算(Apache Spark)、云平台(AWS/Azure)、数据分区/缓存 [79] - 大数据工具:分布式存储(Google Cloud Storage)、处理框架(Hadoop/Flink)、实时分析(Kafka) [80][82][84] 行业技术趋势 - AI/ML正融入数据管道,实现自动化模式识别和预测分析 [84] - 云计算(AWS/Azure)和无服务器架构降低基础设施成本,提升处理效率 [85] - 未来数据工程师需兼具传统工程技能与AI/ML知识,需求将持续增长 [86]
DELL Moves Above 50 and 200-Day SMAs: Is the Stock a Smart Buy Now?
ZACKS· 2025-07-10 00:55
股价表现与技术指标 - 公司股价持续高于200日(11124美元)和50日(11077美元)移动平均线,显示长期看涨趋势 [1] - 截至周二收盘价为12439美元,年内累计上涨8%,跑赢计算机与科技行业7%的涨幅 [5] - 计算机-微型计算机行业同期下跌156%,公司表现显著优于同业 [5] AI服务器业务增长 - 首季AI服务器订单增加121亿美元,发货量达18亿美元,未交付订单144亿美元 [11] - PowerEdge XE9680L等AI优化服务器需求强劲,推动基础设施解决方案部门(ISG)收入同比增长12%至1031亿美元 [9][13] - 与NVIDIA合作的Dell AI Factory被劳氏公司用于优化1700家门店的库存管理与服务 [16] 云计算与解决方案组合 - APEX平台提供多云解决方案和AI基础设施,ISG部门收入包含云服务业务 [12][13] - 2025年5月推出存储、网络安全和自动化创新方案,提升私有云及边缘环境性能 [14] - 与Worley合作开发安全AI解决方案,强化数据隐私保护 [17] 客户与合作伙伴网络 - 合作伙伴包括劳氏、NVIDIA、微软、Meta、AMD等知名企业 [15] - 通过技术合作帮助劳氏提升门店运营效率,优化资产保护系统 [16] 财务指引与估值 - 预计第二季度营收285-295亿美元(中值290亿),同比增长16% [18] - 非GAAP每股收益预期225美元(±10美分),市场共识预期228美元,对应2063%同比增长 [19] - 远期市销率079倍,显著低于行业658倍水平 [20] 市场评级与增长潜力 - 获Zacks1(强力买入)评级,增长评分B级 [23] - AI服务器需求增长与合作伙伴网络扩张构成主要驱动力 [22]
Akamai Technologies To Hold Second Quarter 2025 Investor Conference Call On Thursday, August 7, at 4:30 PM ET
Prnewswire· 2025-07-09 19:01
公司动态 - 公司将于2025年8月7日美国东部时间下午4:30举行投资者电话会议 内容包括2025年第二季度财务结果及管理层可能提供的财务前瞻指引 [1] - 电话会议将通过公司投资者关系页面进行网络直播 并提供两周的电话回放服务 国际回拨号码为(412) 317-0088 [2][5] 业务概况 - 公司是网络安全和云计算领域领导者 通过市场领先的安全解决方案、威胁情报和全球运营团队为企业数据及应用程序提供全方位保护 [3] - 提供全栈云计算解决方案 基于全球分布式平台实现高性能与成本效益 其服务以行业领先的可靠性、规模和专业能力获得全球企业信赖 [3] 投资者联系 - 投资者关系联系方式通过电子邮件提供 具体查询需联系[email protected] [4]
Will Amazon Be a $5 Trillion Stock by 2030?
The Motley Fool· 2025-07-09 17:15
公司估值与增长潜力 - 亚马逊当前市值达到2.37万亿美元 部分投资者认为到2030年可能达到5万亿美元市值 意味着111%的涨幅 [1][2] - 实现5万亿美元市值需在2030年前产生2000亿美元运营收入 当前12个月运营收入为720亿美元 [11] - 若AWS和广告业务保持15%年复合增长率 到2025年可贡献1470亿美元运营收入 剩余业务需额外贡献530亿美元 [12][13] 核心业务表现 - 在线商店和第三方卖家服务Q1收入增速分别为5%和6% 显示成熟业务增速放缓 [4][5] - AWS Q1收入同比增长17% 运营利润增长23% 运营利润率高达39% 贡献公司63%运营利润但仅占19%总收入 [6][7] - 广告服务Q1收入增长18% 为增速最快板块 推测运营利润率接近Meta等公司的30%-40%水平 [8][9][10] 高增长业务驱动因素 - AWS受益于企业从本地部署转向云计算及AI工作负载需求的双重趋势 [6] - 广告业务依托平台用户行为数据优势 预计将持续高速增长 [10] - AWS和广告业务若保持40%运营利润率 将成为5万亿美元估值目标的核心支撑 [12] 估值方法论 - 采用运营收入倍数法更准确 当前股价为运营收入的33.1倍 长期估值倍数假设下调至25倍 [10][11]
10 Under-the-Radar Tech Stocks With Incredible Growth Potential
The Motley Fool· 2025-07-09 16:23
核心观点 - 文章指出除了微软、英伟达和谷歌等知名科技巨头外,许多中小型科技公司也具备显著投资潜力 [1][2] - 重点介绍了10家具有高增长潜力的科技公司,涵盖专业软件、数据管理、网络安全、半导体、数字广告、云计算、AI制药、电商和量子计算等领域 [2] 专业软件 - Tyler Technologies专注于为政府、教育等机构提供定制化软件解决方案,如校车路线规划、法庭案件管理等 [4][5] - 预计公司收入未来几年将保持约10%的年增长率 [6] 数据管理 - Snowflake帮助大型机构有效利用海量数据,通过AI技术简化数据分析流程 [7] - 公司年收入增速超过20%,全球数据分析市场预计到2034年将保持近30%的年增长率 [8] - Confluent专注于数据流处理,帮助企业管理实时数据流,适用于零售、金融等行业 [9][10] - 公司去年营收近10亿美元,预计今明两年收入增速分别为19%和18% [10] 网络安全 - Fortinet在网络安全领域提供定制化ASIC安全芯片,是唯一具备该技术的公司 [12] - 全球网络安全市场预计到2034年将保持近13%的年增长率 [13] 半导体 - Marvell Technology专注于定制化AI加速芯片,预计今年收入增长超40%,明年增长近20% [14][15] 数字广告 - The Trade Desk帮助广告主优化在线营销,去年营收25亿美元,同比增长26% [17][18] - 分析师预计未来几年将保持类似增速 [18] 云计算 - DigitalOcean提供云计算解决方案,支持Kubernetes等技术,帮助企业提升效率 [20][21] - 全球云计算市场预计到2030年将保持22%的年增长率 [22] AI制药 - Recursion Pharmaceuticals利用AI平台测试新药,可大幅缩短临床试验时间和成本 [23][24] - 已与罗氏、赛诺菲等制药巨头合作 [25] 电商 - MercadoLibre被称为"拉丁美洲的亚马逊",去年拉美智能手机出货量达1.37亿部 [26] - 预计拉美电商市场今年增长21%,2023-2027年间规模将翻倍 [27] 量子计算 - Rigetti Computing专注于提供经济型量子计算平台,去年营收1080万美元 [28][29] - 公司仍处于亏损状态,但未来发展潜力巨大 [30]
This Artificial Intelligence (AI) Stock Is Surging After Joining the S&P 500. Can It Continue to Skyrocket?
The Motley Fool· 2025-07-09 08:00
公司动态 - Datadog股价在7月3日上涨近15% 因公司将于7月9日加入标普500指数[1] - 公司取代被HPE收购的Juniper Networks进入标普500 入选标准需满足过去四个季度持续盈利及足够流动性[2] - 近三个月股价累计上涨76% 市场对其加入标普500反应积极[3] 业务概况 - 提供云监控、可观测性及安全解决方案 客户可监控服务器、数据库及应用的云活动并检测漏洞[5] - 业务扩展至大语言模型(LLM)和AI应用监控工具 目标市场规模达800亿美元[6] - 过去12个月营收28亿美元 现有30,500家客户 其中4,000家使用AI服务[9] 财务表现 - 当前市盈率高达330倍 远期市盈率82倍 显著高于标普500平均24倍的水平[7] - 市销率20倍 是标普500平均水平的6倍[8] 增长驱动 - AI服务客户数同比翻倍 Bits AI平台可自主处理事件调查、代码修复及安全警报[10] - 使用LLM可观测性服务的客户数量过去6个月翻倍[10] - 预计2030年LLM市场规模增长超6倍 将带动公司产品需求[11] 发展前景 - 现有客户中AI解决方案渗透率仍低 交叉销售空间巨大[15] - 云市场长期增长及AI应用普及有望加速公司收入增长[16]
ORCL's Cloud Database Gains Steam: Is it the Next Revenue Pillar?
ZACKS· 2025-07-09 01:36
公司战略与业务发展 - 公司正在推动企业从本地数据库向云数据库转型 云数据库服务有望成为收入增长的第三大支柱 [1] - 第四季度云数据库服务收入同比增长31% 年化收入达26亿美元 [1] - 推出Oracle 23 AI平台 通过AI模型训练企业数据提升功能 支持全球企业获取可扩展的安全解决方案 [2] - 积极推动客户向自主数据库迁移 自主数据库消费收入增长47% 去年增长27% [3] - 2026财年资本支出预计超250亿美元 计划建设47个多云数据中心 以支持自主数据库和Oracle 23AI的需求 [4] 财务表现与估值 - 2026财年云服务和许可收入预计达520亿美元 同比增长17.3% [4] - 年初至今股价上涨43.3% 表现优于计算机与技术行业7%的回报率和计算机软件行业16.4%的增长率 [8] - 三年EV/EBITDA为28.69倍 显著高于行业平均20.07倍 [12] - 2026财年每股收益共识预期为6.71美元 较去年同期增长11.28% [15] 行业竞争格局 - 公司在云数据库服务领域面临亚马逊AWS和微软Azure的激烈竞争 [5] - 亚马逊AWS是企业云基础设施的领先提供商 近期推出多模态模型Nova Premier 并计划投资超10亿美元在俄亥俄州和佐治亚州建设AI数据中心 [6] - 微软Azure在云基础设施、软件和平台领域占据重要份额 已在70多个地区部署Azure 并计划投资800亿美元建设全球AI数据中心 [7]
3 Reasons to Buy Microsoft Stock Despite 11.7x P/S Premium Valuation
ZACKS· 2025-07-09 01:01
投资机会 - 微软在2025年展现出强劲投资吸引力 尽管其11.76倍市销率高于行业平均9.8倍 但AI变现能力、云市场主导地位及企业生态整合推动估值溢价 [1] - AI业务年化收入达130亿美元 同比增长175% 显著领先同业 且AI服务贡献了Azure第三季度33%增长中的16个百分点 [6][8] - 2025年800亿美元基础设施投资聚焦美国设施 支撑AI服务与OpenAI运营 构建竞争壁垒 [7] 竞争优势 - 企业级AI采用率领先 通过Office 365和Azure现有关系实现高客户渗透率 对比谷歌AI工具优势更易商业化 [2] - Azure全球市场份额提升至20-25% 紧追AWS的29% 420亿美元云收入同比增长20% 非AI业务表现超预期显示多元化增长 [11][12] - 89%企业采用多云策略 81%使用Azure(略高于AWS的79%) 商业订单年增67% 近3000亿美元客户合同保障收入能见度 [13] 财务表现 - 2025财年第三季度收入701亿美元(同比+13%) 运营利润增16% 显示投资AI同时保持利润率扩张 [14] - 智能云业务收入267.5亿美元(同比+21%) 生产力和业务流程贡献299亿美元(同比+10%) 由商业云收入加速驱动 [15] - 2025财年收入共识预期2790.9亿美元(同比+13.86%) 每股收益13.36美元(同比+13.22%) 季度分红和回购达97亿美元 [17][16] 产品与生态 - Copilot企业用户18个月内增长超10倍 覆盖23万组织和90%财富500强 每用户月均创收30美元 520万商业订阅用户待进一步变现 [8][9] - Build 2025发布多智能体编排、SQL Server 2025内置AI功能 GitHub Copilot升级为完整编码代理 强化生态粘性 [10] - 全栈AI整合能力优于英伟达硬件销售模式 云服务提供经常性收入 对比AWS基础设施策略更具应用层优势 [2] 市场表现 - 过去六个月股价回报17.1% 跑赢科技板块及竞争对手 英伟达和亚马逊同期回报0.2%/13.5% 谷歌下跌9.1% [3][5]
Wall Street just turned bearish on this top-performing Nvidia stock
Finbold· 2025-07-08 20:03
公司股价表现 - 华尔街对人工智能和云计算公司CoreWeave的情绪转为看跌 尽管其自3月底IPO以来表现突出 [1] - 上一交易日收盘时 CoreWeave股价下跌3.33%至159.70美元 但自IPO以来已飙升299% [1] - 股价飙升由投资者兴趣激增及与英伟达的紧密联系驱动 [1] 华尔街机构评级调整 - Stifel分析师Ruben Roy将评级从"买入"下调至"持有" 但将目标价从75美元上调至115美元 [4] - Roy认可公司90亿美元全股票收购比特币矿企Core Scientific的长期战略价值 但指出"关键短期不利因素" [4] - Mizuho分析师Gregg Moskowitz将评级从"跑赢大盘"下调至"中性" 同时将目标价从70美元大幅上调至150美元 [7] 战略收购分析 - 收购Core Scientific将帮助公司转型为垂直整合的AI和高性能计算基础设施提供商 [5] - 交易完成时将拥有约1.3吉瓦总电力容量 未来潜在扩展超过1吉瓦 [5] - 全股票交易对Core Scientific估值为每股20.40美元 旨在加强公司在AI数据中心和能源资产领域的地位 [6] - 分析师认为此次收购使公司能够规模化发展并加强对基础设施的控制 [8] 估值与市场观点 - 分析师认为尽管大幅提高目标价 但近300%的涨幅使风险与回报更加平衡 [9] - 评级下调反映了对近期估值倍数上升 AI基础设施需求激增以及通过交易高效获取额外容量的考量 [8]
Oracle Database@AWS Now Generally Available
Prnewswire· 2025-07-08 20:00
产品发布与区域扩展 - Oracle与AWS联合推出Oracle Database@AWS服务 客户可在AWS北弗吉尼亚和俄勒冈区域通过OCI专用基础设施运行Oracle Exadata Database Service及Oracle Autonomous Database [1] - 计划将服务扩展至全球20个新增AWS区域 包括加拿大中部、法兰克福、悉尼、东京等核心市场 [8] 技术能力与集成优势 - 支持Oracle Database 23ai的嵌入式AI Vector功能 实现基于概念内容(非关键字)的文档、图像及关系型数据搜索 [4] - 零ETL集成简化Oracle数据库与AWS分析服务的数据管道构建 实现与AWS机器学习、生成式AI服务的无缝数据流动 [2] - 提供Oracle RAC高可用架构 结合AWS多可用区部署及Amazon S3备份 增强灾备能力 [4] 客户应用案例 - 富达投资(Fidelity)采用该服务推进数字化转型 强化关键应用的企业级弹性与云敏捷性 [7] - 全美保险(Nationwide)通过服务实现云战略落地 平衡运营效率与客户预期的可靠性 [7] - SAS借助该方案帮助客户在AWS上高效访问应用数据 支持其AI目标 [7] 部署与采购模式 - 通过AWS Marketplace简化采购流程 支持BYOL(自带许可)及Oracle Support Rewards等折扣计划 [4] - 提供AWS管理控制台、CLI等工具 集成IAM、CloudWatch等AWS核心服务实现统一运维 [4] 行业覆盖与产品组合 - 服务已覆盖电信、能源、金融等强监管行业 客户反馈运营效率显著提升 [6] - 兼容Oracle E-Business Suite、PeopleSoft等企业级应用 支持遗留系统现代化迁移 [5] 基础设施布局 - AWS当前覆盖37个地理区域的117个可用区 并计划新增智利、新西兰等4个区域 [11] - OCI通过混合云(Exadata Cloud@Customer)及多云部署(Oracle Database@Azure等)实现全域覆盖 [10]