Open source

搜索文档
开源CUDA项目起死回生,支持非英伟达芯片,濒临倒闭时神秘机构出手援助
量子位· 2025-07-08 08:40
奕然 发自 凹非寺 量子位 | 公众号 QbitAI 能让非NVIDIA芯片跑CUDA的开源项目ZLUDA,起死回生了。 最新版增加了对大模型工作负载的支持,一举登上GitHub热榜! 开发者@vosen本名Andrzej Janik,曾经在Intel工作。 该项目一度因AMD停止资助濒临破产,最终被一家神秘机构出手相救。 现在,创始人vosen带来好消息,表示ZLUDA团队新添一员猛将并稳定进行项目恢复中。 在2020年,Andrzej Janik想要尝试一下技术突破,让CUDA程序在非NVIDIA平台运行,一尝试,便有了可行性。 之后,ZLUDA被Intel接手,作为一个内部试验项目发展。 Intel分配资源给了ZLUDA,目的很明显了,让其 在Intel GPU上跑CUDA程序,作为Intel oneAPI生态的一种补充方式 。 无疑,这触碰到了NVIDIA的商业生态链。 没过多久,这个项目就被终止了。 2022年,ZLUDA得到了AMD的支持而重启,并支持AMD硬件。 好景不长,这次也仅仅维持2年,2024年2月宣布终止。 过往发展:起起伏伏又起起 一个月后,英伟达就发布CUDA 11.6版本,并明确 ...
开源项目推动下,CUDA将兼容非Nvidia GPU?
半导体行业观察· 2025-07-06 10:49
CUDA兼容性突破 - Nvidia于2006年推出CUDA作为专有API和软件层,成为释放GPU并行计算能力的关键技术,广泛应用于人工智能、科学计算和高性能模拟领域[4] - 开源项目Zluda致力于打破CUDA对Nvidia硬件的依赖,实现在AMD、Intel等第三方GPU上运行未经修改的CUDA应用程序,显著扩展硬件选择并减少供应商锁定[4] - Zluda团队规模扩大一倍,现有两名全职开发人员,新成员Violet已为GitHub开源仓库做出突出贡献[4] 技术进展 - Zluda在非Nvidia GPU上执行CUDA二进制文件的性能显著提升,改进后的代码可处理cvt指令等复杂情况并达到位精度[7] - 项目增强了对ROCm/HIP GPU运行时的支持,确保其在Linux和Windows系统可靠运行[5] - 日志记录功能改进,能捕获更多API交互细节,包括中间调用过程[7] 应用场景突破 - 在llm.c测试实现中取得进展,已支持44个函数中的16个,目标实现GPT-2/GPT-3语言模型的全面运行[7] - 针对32位PhysX代码的支持取得初步进展,通过CUDA日志收集识别潜在错误,但完整支持需第三方开发者大量贡献[8] - 改进对旧硬件的兼容性,GPU运行时可在编译时优化代码以适应不同硬件架构[5]
刘维亮:北京是全球开源资源最丰富、开源创新最活跃的城市之一
贝壳财经· 2025-07-05 19:00
北京市开源生态发展 - 北京市汇聚全国半数以上开源商业初创企业,涌现"飞桨""香山""天工机器人"等优质开源成果[1] - 北京市未来四大战略举措:加速开源生态构建(鼓励模型/数据/Agent开源)、加快开源项目培育(投融资对接)、强化开源人才培养(进校园入课程)、深化开源国际合作[1] 开源产业宏观趋势 - 开源已成为驱动全球科技革命和产业变革的关键力量,具有开放共建共享共治特征[2] - 国家工业信息安全发展研究中心将持续跟踪全球开源动态,与海外组织建立常态化合作机制[2] 人工智能开源国际合作 - 十余家机构联合发起《人工智能开源创新北京宣言》,提出开源无国界/技术开源/生态共建/开源安全/AI伦理/风险治理六条倡议[2] - 宣言呼吁全球以公平普惠方式共建AI开源生态,弥合AI发展鸿沟[2] 开源技术前沿探讨 - 论坛主题涵盖AI驱动下的开源生态建设、全球社区文化与发展动态[3] - 圆桌讨论聚焦AI开源生态建设、技术垄断与开源平衡、数据合规等关键议题[3]
UC Berkeley池宇峰: 采用3D打印技术制造 人形机器人成本不超35000元!
机器人大讲堂· 2025-07-05 12:09
当前限制人形机器人规模化落地的主要因素有两点,第一是机器人的泛化能力有限,在实际场景下技术的迁移 能力远远不够,导致其无法在具体环境中部署。第二是制造成本限制,主流人形机器人本体价格普遍在 50万 左右,个别高端型号甚至达到百万级别。 高昂的开发成本、闭源的设计架构及有限的定制能力,成为制约该领域快速发展的主要瓶颈。 为解决这一问 题, 加州大学伯克利分校池宇峰团队 打造了一款低成本开源人形机器人 Berkeley Humanoid Lite , 该机 器人采用桌面 3D打印制造,支持定制化设计,本体BOM成本在5000美元以内,约合35000元人民币。 ▍ 成本破局!低成本 3D打印专为开发者量身打造! 当前市场上的人形机器人平台主要分为商业产品和研究原型两类。商业产品如 Agility Robotics的Digit、 Fourier Intelligence的GR1等,虽然性能卓越,但价格普遍超过数万美元,使得大多数研究机构和个人难以 承受。 此外,尽管研究原型具备较高的定制性与性能表现,但因其制造依赖 CNC加工、激光切割等专门流 程,而这类设施并非所有研究机构都能轻松获取,从而严重限制了其广泛应用范围 ...
个人开发者时代崛起,22岁印度开发者搞的业余项目被马斯克Groq看上,如今用户破6万
36氪· 2025-07-04 16:38
人工智能搜索引擎行业 - 人工智能技术发展使得搜索变得更加复杂,用户需要在多个网站和应用之间跳转以获取清晰答案 [1] - 22岁开发者Zaid Mukaddam开发了开源AI搜索引擎Scira,定位为"Perplexity替代品",在社区中获得大量关注 [2] - Scira支持多源搜索,包括网页、X帖子、研究论文、YouTube视频等 [3] Scira产品特点 - 提供即时视频摘要功能,节省用户观看长视频时间 [9] - 支持从YouTube、Twitter、科学论文、产品页面等多源收集信息 [9] - 搜索查询可包含文件和位置数据,这是ChatGPT目前不支持的功能 [9] - 采用GPT-4o mini、GPT-4o和Claude 3.5 Sonnet等顶级AI模型提供支持 [9] - 界面设计极简,无广告干扰,专注于纯粹搜索服务 [10] 开发历程 - 项目最初命名为"MiniPerplx",灵感来自Perplexity [7] - 2024年8月4日开始开发,8月7日在X平台发布后获得14000次曝光 [7] - 后更名为"Scira",源自拉丁语"scire"(知道),更符合产品定位 [11] - 采用Vercel AI SDK、Shadcn/UI、Tailwind CSS和Next.js等技术框架 [9][10] - 核心搜索功能依赖Tavily Search API,提供实时准确结果并引用来源 [10] 用户增长与挑战 - GitHub星标数从10个月前的200增长至9000 [12] - 平台流量从500一夜激增至16000 [12] - 流量暴增导致API成本大幅上升,开发团队难以承受 [14] - Groq公司提供计算资源和阿里巴巴Qwen模型使用权,帮助度过难关 [14] - 获得Vercel、xAI、Tavily等多家公司支持,运营7个多月 [14] - 入选Vercel AI加速器,成为40个入选团队之一 [15] 行业影响 - 开发者独自构建AI项目并获得成功的案例增多 [19] - TinyWow成立于2018年,提供免费AI驱动转换工具,月访问量达300万次 [21] - Only Finders作为OnlyFans定制搜索引擎,采用按点击收费的商业模式 [21] - 这些案例展示了个人开发者在AI领域的创新潜力 [19][21]
李飞飞最新访谈:没有空间智能,AGI就不完整
量子位· 2025-07-02 17:33
李飞飞对AGI与空间智能的核心观点 - 空间智能是通用人工智能(AGI)不可或缺的组成部分 没有空间智能 AGI就不完整 [1][4][29] - 3D世界建模是实现AGI的关键 包括理解三维世界 生成三维世界 推理三维世界和在三维世界中做事 [7][29] - 目标是创建超越平面像素 跨越语言障碍 能够真正捕捉三维世界结构和空间智能的世界模型 [8][29] - 视觉智能的进化历史长达5.4亿年 远比语言进化(3-5亿年)更复杂 是智能发展的基础 [27] ImageNet项目的历史意义 - 2009年创建的ImageNet解决了AI领域的关键数据问题 为现代计算机视觉搭建了数据骨架 [11][13] - 项目构想源于机器学习需要范式转变 通过下载十亿张图片创建视觉分类体系来训练算法 [13][14] - 2012年AlexNet突破性进展 将卷积神经网络 GPU和深度学习首次结合 错误率从30%大幅下降 [15][17][19] - ImageNet开源策略和挑战赛机制推动了整个AI社区的发展 [15] 计算机视觉的发展历程 - 从物体识别(ImageNet)到场景描述(2015年图像字幕技术)再到3D世界建模的演进 [19][20][22][24] - 自然语言与视觉信号的融合让智能体能够讲述世界的故事 [22] - 生成式AI的发展使得从文字生成图像成为可能 展现了AI的惊人进步 [22] 空间智能的挑战与机遇 - 3D建模面临数据缺失问题 互联网缺乏空间智能数据 信息主要存在于人类大脑中 [9][33][49] - 3D世界比语言(一维)复杂得多 涉及物理规律 投射转换等多重数学难题 [30][31] - World Labs正在构建3D基础模型 应用场景包括设计 建筑 游戏开发和机器人等领域 [35] - 元宇宙是重要应用方向 需要硬件和软件的融合以及内容生成的世界模型 [35][36][37] 人才培养与团队建设 - 思想上的无畏精神是成功人士的核心特质 也是招聘的重要标准 [41][42] - World Labs正在招募工程 产品 3D和生成模型领域的人才 [43] - 跨学科AI和小数据领域是学术界值得关注的方向 [44][45] - 研究生阶段应被强烈好奇心引领 专注于解决根本性问题 [47][48]
AI Agent产品矩阵全景:从RPA到智能体的进化图谱
搜狐财经· 2025-06-30 21:43
在AI技术快速渗透的今天,AI Agent已从实验室走向企业级应用,成为自动化解决方案的核心载体。从字节跳动的"扣子空间"到OpenManus的开源生态,从 AutoGLM的深度思考到实在智能的TARS-RPA-Agent,市面上的AI Agent产品呈现出百花齐放的格局。这些产品不仅定义了技术边界,更在不同场景中重塑 了人机协作的范式。 RPA与AI Agent的融合:从执行到决策的跃迁传统RPA(机器人流程自动化)曾以"规则驱动"为核心,依赖预设流程完成重复性任务。然而,随着AI技术的 成熟,RPA逐渐与AI Agent结合,形成"RPA+AI"的混合自动化模式。例如,Automation Anywhere推出的AI Agent Studio,通过低代码平台允许用户构建自定 义AI Agent,其核心在于将自然语言指令转化为可执行的自动化流程。而实在智能的TARS-RPA-Agent则进一步突破了这一框架,它不仅具备强大的意图理 解能力,还能在复杂操作系统及桌面软件环境下精准操作,甚至能通过"自主感知"调整策略,实现从"执行者"到"决策者"的跃迁。 垂直领域深耕:AI Agent的差异化优势在金融、政务、 ...
China's biggest public AI drop since DeepSeek, Baidu's open source Ernie, is about to hit the market
CNBC· 2025-06-30 00:35
百度开源ERNIE大模型战略 - 百度计划逐步开源其生成式AI大语言模型ERNIE 这被视为中国科技行业自DeepSeek出现以来在AI竞赛中的最大动作 [1] - 公司此前一直坚持专有商业模式 但竞争对手的成功证明开源模型同样具有竞争力 [2] - CEO李彦宏表示该举措将帮助全球开发者降低开发成本 无需担心模型能力或工具问题 [6] 对AI行业竞争格局的影响 - 每次主流实验室开源强大模型都会提高整个行业的标准 此次事件具有全球性影响 [3] - 开源策略将对OpenAI等闭源供应商形成压力 迫使其证明高价API的合理性 [4] - 行业专家将此举比作"向AI世界投掷燃烧弹" 可能颠覆中美竞争对手的定价体系 [5][6] 技术性能与价格优势 - ERNIE X1模型性能与DeepSeek R1相当 但价格仅为后者一半 [6] - 开源模型能带来更低成本、更好性能及本地化支持 开发者可更自由地迭代和部署 [4] - 该策略可能使更多应用基于"极其廉价"的模型开发 快速改变AI模型获取的成本动态 [7] 商业模式转变的行业意义 - 标志百度从反对开源转向拥抱开源 反映行业技术路线的重大转变 [2] - 向全球开发者免费提供高性能模型 类似Costco创建Kirkland品牌的颠覆性策略 [5] - 分析师认为这不仅是竞争 更是对现行AI定价体系的"宣战" [6]
腾讯,大动作!
中国基金报· 2025-06-27 23:11
【导读】腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解 头部互联网公司旗下大模型加速开源。 6月27日,腾讯混元开源的首款混合推理MoE模型Hunyuan-A13B发布,该模型是业界首个13B级别的MoE开源混合推理 模型,其效果比肩同等架构领先开源模型。 开源模型灵活性、透明度和成本优势,为人工智能产业发展带来新机遇。今年年初DeepSeek出圈后,腾讯、阿里、字节 等头部互联网公司旗下大模型开源悄然加速。 腾讯混元开源首款混合推理MoE模型 *加粗为最高分,下划线表示第二名,数据来源于模型各个公开的测试数据集得分 在实际使用场景中,Hunyuan-A13B模型可以根据需要选择思考模式。快思考模式提供简洁、高效的输出;慢思考则涉 及更深、更全面的推理步骤,如反思和回溯。 Hunyuan-A13B模型对个人开发者较为友好,在严格条件下,只需要1张中低端GPU卡即可部署。目前,Hunyuan-A13B已 经融入开源主流推理框架生态,无损支持多种量化格式,在相同输入输出规模上,整体吞吐量是前沿开源模型的2倍以 上。 Hunyuan-A13B集合了腾讯混元在模型预训练、后训练等多个环节的创新技术 ...
EPAM Releases DIAL 3.0: An Evolution of Open-Source GenAI Enterprise Platform
Prnewswire· 2025-06-24 20:02
NEWTOWN, Pa., June 24, 2025 /PRNewswire/ -- EPAM Systems, Inc. (NYSE: EPAM), a leading digital transformation services and product engineering company, today announced the release of DIAL 3.0, the next iteration of its open-source GenAI platform. More than just a platform release, DIAL 3.0 embodies EPAM's broader vision for enabling enterprise AI adoption through a modular, open-source approach - one that balances innovation velocity with long-term control, interoperability and responsible governance. F ...