TensorFlow

搜索文档
开源CUDA项目起死回生,支持非英伟达芯片,濒临倒闭时神秘机构出手援助
量子位· 2025-07-08 08:40
项目背景与发展历程 - 开源项目ZLUDA旨在让非NVIDIA芯片运行CUDA程序,由前Intel开发者Andrzej Janik于2020年启动技术验证并实现可行性[4][5] - Intel曾接手ZLUDA作为内部试验项目,目标是为其GPU和oneAPI生态补充CUDA兼容性,但因触及NVIDIA商业生态链被终止[6][7][8][9] - 2022年AMD资助重启项目并支持其硬件,但2024年2月因NVIDIA发布CUDA 11.6禁止非NVIDIA平台逆向工程再次停摆[10][11][12] - 2024年10月项目获神秘机构资助恢复,重点转向机器学习框架支持(如llama.cpp、PyTorch),主线开发基于AMD GPU[13][15] 技术进展与当前状态 - 新增全职开发者Violet,一个月内推动大型语言模型(LLM)工作负载支持,通过llm.c测试项目实现44个CUDA API中16个的兼容性[17][20][23][25] - 首次尝试同时处理常规CUDA函数与cuBLAS等专用库,测试程序调用8,186次CUDA函数,为支持PyTorch等大型软件奠定基础[22][23] - 改进PTX指令集扫描测试,解决早期版本跳过指令修饰符的问题,提升非NVIDIA GPU运行CUDA程序的精确性(如cvt指令已完全精确)[26][27][28][30] - 日志系统升级后能跟踪更广泛的CUDA运行时行为(如cuBLAS与cuBLASLt的依赖关系),并修复ROCm/HIP 6.4版本ABI变更导致的动态编译错误[33][34][35][38] 社区贡献与未来目标 - 社区成员@Groowy启动32位PhysX支持工作,发现部分错误影响64位功能,修复已纳入官方路线图[19] - 团队计划2025年Q3完全恢复项目功能,目前专注于LLM支持、多GPU架构兼容及代码优化[15][16][18]
第四期全球名校“Z世代”领袖连线活动举办 中外青年共话AI技术应用
环球网资讯· 2025-07-02 11:25
AI技术与未来应用 - 全球15所知名高校的40余名青年代表与专家围绕"AI技术与未来应用"主题展开深入探讨 [1] - 青年代表们以跨界视角讨论人工智能技术前沿与社会发展话题 [3] 编程技术变革 - 人工智能大模型使编程能力普及化,通过自然语言描述即可生成代码 [4] - 代码多智能体(如Devin、Manus)发展为能自主协作的"数字工程师团队",自动化完成编码、测试、部署全流程 [4] - 人类角色从"代码编写者"跃升为"智能体指挥官",专注于系统架构设计与伦理边界守护 [4] AIGC应用 - AIGC核心价值在于"人与算法的协同共创",而非取代人类创作 [5] - Google DeepMind的"MedGemma"模型和中国商汤科技的"大医"平台提升医疗诊断能力,使偏远地区医疗服务智能化 [5] - AIGC提升个性化教学效率与医疗诊断能力 [5] 教育技术发展 - 在线教育从"电话授课"发展到"VR+脑电波传感器"教学 [7] - 芬兰等国家在中小学引入AI课程,鼓励学生参与全球议题如可持续发展目标与气候变化 [7] - 技术应服务于创造力、合作与批判思维,而非制造懒惰与分裂 [7] 就业影响与技能发展 - 未来8500万个工作岗位将被人工智能取代,同时创造更多新职业 [9] - AI难以复制的人类技能包括适应力、AI素养、创造性思维、语言能力、逻辑与数学技能、情商和人际沟通能力 [9][10] - 建议公众借助TensorFlow、GitHub、ChatGPT、Notion AI等工具进行自我赋能 [10] 数据价值与AI优化 - "脏数据有时比干净数据更有训练价值",尤其在金融欺诈检测中 [12] - 不规则数据能反映异常和可疑的金融模式,更具辨识潜力 [12] - 推动AI进步关键在于用聪明方式解读复杂性 [12]
Lex Fridman 对谈谷歌 CEO:追上进度后,谷歌接下来打算做什么?
Founder Park· 2025-06-06 23:03
Google AI战略与产品进展 - Google通过整合Brain和DeepMind团队成立Google DeepMind 显著提升AI研发能力[5][6][9] - 公司TPU基础设施投资已持续十年 目前正扩大规模以支持大模型训练[6][8][12] - Gemini系列模型处理token量从12个月前的9 7万亿/月暴增至480万亿/月 增长50倍[27][28] - 推出Gemini 1 5 Pro、Flash等差异化产品线 Pro模型能力达Ultra的80%-90%但成本更低[30][31] 搜索业务AI化转型 - 搜索未来将部署多路径检索模型 整合网络信息并引导至有价值内容[4][14] - AI概览功能已嵌入广告 用户反馈积极并推动产品增长[15][16][18] - AI模式作为独立标签页测试 成熟后将逐步迁移至主搜索页面[18][21] - 非英语用户受益显著 Gemini多模态能力打破语言信息壁垒[15][22] 技术突破与行业影响 - 30%代码由AI辅助生成 整体工程效率提升10%[32][33] - 计算领域下一个交互范式是AR Project Astra项目将重塑Android XR生态[36][37][38] - 自动驾驶领域Waymo完成1000万次付费服务 最后20%技术攻坚比初期80%更耗时[39][40] - 当前处于AJI(非均衡AI)阶段 2030年前或难实现AGI但各维度将现飞跃[42][43][44] AI长期价值与产业变革 - AI独特之处在于递归式自我改进 将超越电力成为人类史上最重要技术[57][58] - 创造力门槛降低将释放全球80亿人认知潜力 内容创作群体或达十亿级[60][62][64] - 未来顶级内容体验仍依赖人类特质 AI生成与人类创作将长期共存[63][64][66] - 模型推理能力构建基于科学原理而非硬编码规则 尤其在数理领域[25][26][29]
社交APP开发的技术框架
搜狐财经· 2025-05-28 14:49
社交APP技术架构 前端开发 - 移动端分为iOS和Android原生开发,iOS推荐Swift和SwiftUI框架,Android推荐Kotlin和Jetpack Compose框架,性能最佳但开发成本高 [6] - Web端采用React.js、Vue.js、Angular等框架构建单页应用(SPA),适用于社交APP的Web版本和后台管理系统 [5] - 跨平台开发方案包括React Native(JavaScript)、Flutter(Dart)、uni-app(Vue.js)和Taro(React/Vue),可降低多端开发成本,其中uni-app和Taro特别适合中国市场的小程序生态 [6] 后端开发 - Java(Spring Boot/Cloud)适合大型复杂社交APP,具备高并发处理能力 [9] - Python(Django/Flask)适合快速原型开发,语法简洁但高并发性能较弱 [9] - Node.js(Express/NestJS)适合实时聊天等I/O密集型场景,开发效率高 [9] - Go语言适合高并发核心服务,性能接近C/C++且内存占用低 [9] 数据库与存储 - 关系型数据库MySQL和PostgreSQL适合存储用户数据和好友关系 [9] - 非关系型数据库MongoDB适合动态/评论等非结构化数据,Redis用于缓存和实时计数 [9] - 图数据库Neo4j适合处理复杂社交关系网络 [9] - 对象存储(阿里云OSS/腾讯云COS)和CDN用于静态资源分发 [9] 第三方服务集成 - 即时通讯可选用融云/环信等国内SDK或自建WebSocket/MQTT系统 [9] - 音视频处理采用FFmpeg或云服务商(腾讯云TRTC/阿里云RTC) [9] - 内容审核需集成阿里云/腾讯云的内容安全API [8] 中国市场特殊考量 - 必须完成ICP备案和APP备案等合规要求 [8] - 优先选择阿里云/腾讯云等国内云服务商 [8] - 开发框架推荐支持多端发布的uni-app或Taro [8]
如何打破CUDA垄断?LLVM奠基人长文解读
半导体行业观察· 2025-05-02 11:58
核心观点 - DeepSeek的成功证明小规模专注团队可通过效率突破挑战行业巨头,打破"只有大公司才能推动AI前沿"的固有认知 [1] - AI发展需降低总体拥有成本(TCO),否则将面临硬件短缺或开发者难以有效利用现有资源的瓶颈 [2] - CUDA平台是NVIDIA构建的庞大分层生态系统,包含编程模型、库和优化,而非单一技术 [6][26] - AI行业面临的关键问题是技术锁定和生态碎片化,替代方案难以突破CUDA主导地位 [69][70] CUDA平台分析 定义与组成 - CUDA包含三层结构:底层并行编程模型(类似C++语法)、中间件库(cuDNN等)、高级解决方案(TensorRT-LLM) [8] - 实际是涵盖驱动程序、语言、库和框架的多层生态系统,类似Java生态系统或操作系统 [26][28] - 核心组件包括:庞大代码库(数十年优化)、工具生态系统(cuDNN/TensorRT)、硬件优化性能、专有闭源特性 [30] 发展历程 - 从图形处理器演进而来,2001年GeForce引入可编程着色器开启通用计算可能 [9] - 2006年推出首个通用GPU编程平台,通过CUDA语言和驱动程序暴露GPU底层特性 [11][12] - 通过高层库(cuDNN等)降低使用门槛,支撑TensorFlow/PyTorch等框架崛起 [18][20] - 垂直解决方案(TensorRT等)进一步抽象复杂性,推动GenAI应用爆发 [22][25] 成功因素 - 统一产品线战略:游戏GPU到数据中心加速器的无缝扩展,降低开发者准入门槛 [31][33] - 抓住AI浪潮:优化cuDNN等库与PyTorch/TensorFlow深度整合,形成硬件-软件协同设计 [34][35] - 生成式AI爆发:ChatGPT推动计算需求激增,行业被迫针对CUDA优化 [38][39] - 自我强化循环:用户基础吸引更多研究投入,新硬件发布需重写软件加深依赖 [42][44] 行业挑战与替代方案 CUDA局限性 - 版本管理复杂:工具包/驱动/框架兼容性问题频发,故障排查成本高 [47][50] - 性能可移植性差:新旧硬件代际间需重写代码,无法充分发挥新架构性能 [17][65] - 语言不匹配:CUDA基于C++而AI开发主要用Python,增加开发障碍 [56][57] - 供应商锁定:无法在其他硬件运行,跨平台开发需维护多套代码路径 [59] 替代方案失败原因 - OpenCL:委员会决策缓慢、技术碎片化、缺乏张量核心支持导致性能落后 [71][76][81] - TVM:难以实现现代硬件最佳性能,商业利益导致代码分支碎片化 [100][101] - XLA:谷歌内部TPU优先,GPU支持不足,技术设计无法适应GenAI需求 [106][109][111] - 共同问题:缺乏参考实现、发展速度慢、性能不达预期、生态建设不足 [85] 未来发展方向 - 硬件创新加速:AMD/Intel等厂商持续投入,但需解决软件生态短板 [69] - 编译器技术演进:MLIR等框架试图解决跨平台问题,但尚未形成统一标准 [86] - 效率突破关键:如DeepSeek直接操作PTX层,探索绕过CUDA的新路径 [41][53] - 行业协作需求:避免重复建设,建立开放社区推动标准化 [85]
Google首席科学家万字演讲回顾AI十年:哪些关键技术决定了今天的大模型格局?
机器人圈· 2025-04-30 17:10
Google 首席科学家Jeff Dean 今年4月于在苏黎世联邦理工学院发表关于人工智能重要趋势的演讲,本次演讲回顾 了奠定现代AI基础的一系列关键技术里程碑,包括神经网络与反向传播、早期大规模训练、硬件加速、开源生 态、架构革命、训练范式、模型效率、推理优化等。算力、数据量、模型规模扩展以及算法和模型架构创新对AI 能力提升的关键作用。 以下是本次演讲 实录 经数字开物团队编译整理 01 AI 正以前所未有的规模和算法进步改变计算范式 Jeff Dean: 今天我将和大家探讨 AI 的重要趋势。我们会回顾:这个领域是如何发展到今天这个模型能力水平的?在当前的技 术水平下,我们能做些什么?以及,我们该如何塑造 AI 的未来发展方向? 这项工作是与 Google 内外的众多同仁共同完成的,所以并非全是我个人的成果,其中许多是合作研究。有些工作 甚至并非由我主导,但我认为它们都非常重要,值得在此与大家分享和探讨。 我们先来看一些观察发现,其中大部分对在座各位而言可能显而易见。首先,我认为最重要的一点是,机器学习 彻底改变了我们对计算机能力的认知和期待。回想十年前,当时的计算机视觉技术尚处初级阶段,计算机几乎谈 ...
速递|阿里前副总裁贾扬清已入职英伟达,团队一笔套现或数亿美元,公司仅创立2年
Z Finance· 2025-04-08 11:19
图片来源: Youtube 据The Information透露, 英伟达已完成对Lepton AI的收购, Lepton 联合创始人贾扬清和白俊杰均 已加入英伟达。 交易达成时,Lepton约有20名员工。 不久之前,英伟达被曝出即将达成收购 Lepton AI 的协议, 交易价值数亿美元。 这笔交易是英伟达 通过收购小型 AI 初创公司来推动其云和软件业务的一部分,使得使用英伟达芯片构建新的 AI 模型 成为可能。 根据公开信息,Lepton AI是一家成立于2023年的人工智能公司,致力于为企业提供高效、可扩展的 AI应用平台。 公司由阿里前 高管贾扬清创办。 Lepton AI支持模型的开发、训练和部署,具备生产级性能和成本效益,提供全面的机器学习工具和 灵活的GPU选项,满足企业级服务水平协议(SLA)的要求。 Lepton 之前曾为游戏初创公司 Latitude.io 和科学研究初创公司 SciSpace 提供 AI 云服务。 据钛媒体报道,Lepton AI在2023年5月成功完成天使轮融资,投资方包括硅谷知名风投CRV、红杉中 国和Fusion Fund。三家投资机构在短短不到两年时间内就实现 ...
速递|重磅!阿里前副总裁、Caffe之父贾扬清创办的Lepton AI将卖身英伟达,一笔套现或数亿美元,公司仅创立2年
Z Finance· 2025-03-27 04:21
创业历史 2023年3月,被誉为"Caffe之父"的人工智能领域权威贾扬清宣布离开阿里云投身AI创业,结束了他在该公司长达4年的职业生涯。2024年, 贾扬清还当选为 美国国家人工智能学院院士。 贾扬清本科和硕士毕业于清华大学自动化系,并在加州大学伯克利分校攻读计算机科学博士学位期间,开发了深度学习框架Caffe,成为全球最受欢迎的开 源深度学习框架之一。毕业后,他先后在新加坡国立大学、NEC美国实验室以及Google Brain(谷歌大脑)工作。在谷歌期间,他参与了TensorFlow框架的 研究和开发。 2019年3月,贾扬清加入阿里巴巴,担任技术副总裁。同年9月, 阿里巴巴集团副总裁、阿里云智能计算平台事业部总裁、高级研究员贾扬清成为阿里巴巴 开源技术委员会负责人。 在他任职期间, 贾扬清与团队共同建设了大数据和人工智能平台,推动技术、产品和解决方案的发展,将阿里云的大数据和人工 智能业务发展成为行业领先地位。 图片来源: Youtube 据 The Information 报道, 美国科技巨头英伟达即将达成收购 Lepton AI 的协议, 交易价值数亿美元。 这笔交易是英伟达通过收购小型 AI 初创 ...
2025,半导体更难
投资界· 2025-01-03 14:53
以下文章来源于南风窗 ,作者荣智慧 南风窗 . 冷静地思考,热情地生活。 芯片必须越来越小。 作者 | 荣智慧 来源 | 南风窗 (ID:SouthReviews) 半导体领域的事儿,越来越"矛盾"。 晶体管的通道、软硬件之间的"次元壁"越来越小。而国家之间的"墙"越来越大。 在越来越小的领域,英伟达、AMD和台积电赚得盆满钵满。在越来越大的领域,金钱像 筹码一样押在跷跷板的两头——一头是美国,身后坐着拉美"后院"伙伴,非洲国家跟随 其后;一头是中国,东南亚和南亚正等着溢出的供应链;中国台湾、日本和韩国首鼠两 端。 更顽固的是消费者,今年大伙儿牢牢捂紧钱包,什么也不想买。随着当选总统特朗普第 二任期的逼近,更多的出口禁令、更高的关税、供应过剩和更富创造性的制裁规避方法 将在2025年出现。 越来越小 按价值计算,半导体现在是世界上交易量第三大的商品,仅次于石油和汽车。 处理能力每两年翻一番的摩尔定律,成功运行了半个多世纪。2 0 1 7年,英伟达创始人黄 仁勋宣布摩尔定律已死。2 024年,摩尔创立的英特尔的首席执行官帕特·基辛格坚称摩尔 定律还活着,年底,基辛格被大失所望的股东"炒了鱿鱼"。 在2024年, ...