Open source - 财报，业绩电话会，研报，新闻 - Reportify

Open source

搜索文档

开源CUDA项目起死回生，支持非英伟达芯片，濒临倒闭时神秘机构出手援助

量子位· 2025-07-08 08:40

奕然发自凹非寺量子位 | 公众号 QbitAI 能让非NVIDIA芯片跑CUDA的开源项目ZLUDA，起死回生了。最新版增加了对大模型工作负载的支持，一举登上GitHub热榜！开发者@vosen本名Andrzej Janik，曾经在Intel工作。该项目一度因AMD停止资助濒临破产，最终被一家神秘机构出手相救。现在，创始人vosen带来好消息，表示ZLUDA团队新添一员猛将并稳定进行项目恢复中。在2020年，Andrzej Janik想要尝试一下技术突破，让CUDA程序在非NVIDIA平台运行，一尝试，便有了可行性。之后，ZLUDA被Intel接手，作为一个内部试验项目发展。 Intel分配资源给了ZLUDA，目的很明显了，让其在Intel GPU上跑CUDA程序，作为Intel oneAPI生态的一种补充方式。无疑，这触碰到了NVIDIA的商业生态链。没过多久，这个项目就被终止了。 2022年，ZLUDA得到了AMD的支持而重启，并支持AMD硬件。好景不长，这次也仅仅维持2年，2024年2月宣布终止。过往发展：起起伏伏又起起一个月后，英伟达就发布CUDA 11.6版本，并明确 ...

Machine Learning

Machine Learning

开源项目推动下，CUDA将兼容非Nvidia GPU？

半导体行业观察· 2025-07-06 10:49

CUDA兼容性突破 - Nvidia于2006年推出CUDA作为专有API和软件层，成为释放GPU并行计算能力的关键技术，广泛应用于人工智能、科学计算和高性能模拟领域[4] - 开源项目Zluda致力于打破CUDA对Nvidia硬件的依赖，实现在AMD、Intel等第三方GPU上运行未经修改的CUDA应用程序，显著扩展硬件选择并减少供应商锁定[4] - Zluda团队规模扩大一倍，现有两名全职开发人员，新成员Violet已为GitHub开源仓库做出突出贡献[4] 技术进展 - Zluda在非Nvidia GPU上执行CUDA二进制文件的性能显著提升，改进后的代码可处理cvt指令等复杂情况并达到位精度[7] - 项目增强了对ROCm/HIP GPU运行时的支持，确保其在Linux和Windows系统可靠运行[5] - 日志记录功能改进，能捕获更多API交互细节，包括中间调用过程[7] 应用场景突破 - 在llm.c测试实现中取得进展，已支持44个函数中的16个，目标实现GPT-2/GPT-3语言模型的全面运行[7] - 针对32位PhysX代码的支持取得初步进展，通过CUDA日志收集识别潜在错误，但完整支持需第三方开发者大量贡献[8] - 改进对旧硬件的兼容性，GPU运行时可在编译时优化代码以适应不同硬件架构[5]

英伟达(US:NVDA)

刘维亮：北京是全球开源资源最丰富、开源创新最活跃的城市之一

贝壳财经· 2025-07-05 19:00

北京市开源生态发展 - 北京市汇聚全国半数以上开源商业初创企业，涌现"飞桨""香山""天工机器人"等优质开源成果[1] - 北京市未来四大战略举措：加速开源生态构建（鼓励模型/数据/Agent开源）、加快开源项目培育（投融资对接）、强化开源人才培养（进校园入课程）、深化开源国际合作[1] 开源产业宏观趋势 - 开源已成为驱动全球科技革命和产业变革的关键力量，具有开放共建共享共治特征[2] - 国家工业信息安全发展研究中心将持续跟踪全球开源动态，与海外组织建立常态化合作机制[2] 人工智能开源国际合作 - 十余家机构联合发起《人工智能开源创新北京宣言》，提出开源无国界/技术开源/生态共建/开源安全/AI伦理/风险治理六条倡议[2] - 宣言呼吁全球以公平普惠方式共建AI开源生态，弥合AI发展鸿沟[2] 开源技术前沿探讨 - 论坛主题涵盖AI驱动下的开源生态建设、全球社区文化与发展动态[3] - 圆桌讨论聚焦AI开源生态建设、技术垄断与开源平衡、数据合规等关键议题[3]

Artificial Intelligence

天工机器人

Artificial Intelligence

天工机器人

UC Berkeley池宇峰: 采用3D打印技术制造人形机器人成本不超35000元！

机器人大讲堂· 2025-07-05 12:09

当前限制人形机器人规模化落地的主要因素有两点，第一是机器人的泛化能力有限，在实际场景下技术的迁移能力远远不够，导致其无法在具体环境中部署。第二是制造成本限制，主流人形机器人本体价格普遍在 50万左右，个别高端型号甚至达到百万级别。高昂的开发成本、闭源的设计架构及有限的定制能力，成为制约该领域快速发展的主要瓶颈。为解决这一问题，加州大学伯克利分校池宇峰团队打造了一款低成本开源人形机器人 Berkeley Humanoid Lite ，该机器人采用桌面 3D打印制造，支持定制化设计，本体BOM成本在5000美元以内，约合35000元人民币。 ▍ 成本破局！低成本 3D打印专为开发者量身打造！当前市场上的人形机器人平台主要分为商业产品和研究原型两类。商业产品如 Agility Robotics的Digit、 Fourier Intelligence的GR1等，虽然性能卓越，但价格普遍超过数万美元，使得大多数研究机构和个人难以承受。此外，尽管研究原型具备较高的定制性与性能表现，但因其制造依赖 CNC加工、激光切割等专门流程，而这类设施并非所有研究机构都能轻松获取，从而严重限制了其广泛应用范围 ...

Berkeley Humanoid Lite

Berkeley Humanoid Lite

个人开发者时代崛起，22岁印度开发者搞的业余项目被马斯克Groq看上，如今用户破6万

36氪· 2025-07-04 16:38

人工智能搜索引擎行业 - 人工智能技术发展使得搜索变得更加复杂，用户需要在多个网站和应用之间跳转以获取清晰答案 [1] - 22岁开发者Zaid Mukaddam开发了开源AI搜索引擎Scira，定位为"Perplexity替代品"，在社区中获得大量关注 [2] - Scira支持多源搜索，包括网页、X帖子、研究论文、YouTube视频等 [3] Scira产品特点 - 提供即时视频摘要功能，节省用户观看长视频时间 [9] - 支持从YouTube、Twitter、科学论文、产品页面等多源收集信息 [9] - 搜索查询可包含文件和位置数据，这是ChatGPT目前不支持的功能 [9] - 采用GPT-4o mini、GPT-4o和Claude 3.5 Sonnet等顶级AI模型提供支持 [9] - 界面设计极简，无广告干扰，专注于纯粹搜索服务 [10] 开发历程 - 项目最初命名为"MiniPerplx"，灵感来自Perplexity [7] - 2024年8月4日开始开发，8月7日在X平台发布后获得14000次曝光 [7] - 后更名为"Scira"，源自拉丁语"scire"(知道)，更符合产品定位 [11] - 采用Vercel AI SDK、Shadcn/UI、Tailwind CSS和Next.js等技术框架 [9][10] - 核心搜索功能依赖Tavily Search API，提供实时准确结果并引用来源 [10] 用户增长与挑战 - GitHub星标数从10个月前的200增长至9000 [12] - 平台流量从500一夜激增至16000 [12] - 流量暴增导致API成本大幅上升，开发团队难以承受 [14] - Groq公司提供计算资源和阿里巴巴Qwen模型使用权，帮助度过难关 [14] - 获得Vercel、xAI、Tavily等多家公司支持，运营7个多月 [14] - 入选Vercel AI加速器，成为40个入选团队之一 [15] 行业影响 - 开发者独自构建AI项目并获得成功的案例增多 [19] - TinyWow成立于2018年，提供免费AI驱动转换工具，月访问量达300万次 [21] - Only Finders作为OnlyFans定制搜索引擎，采用按点击收费的商业模式 [21] - 这些案例展示了个人开发者在AI领域的创新潜力 [19][21]

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

李飞飞最新访谈：没有空间智能，AGI就不完整

量子位· 2025-07-02 17:33

李飞飞对AGI与空间智能的核心观点 - 空间智能是通用人工智能(AGI)不可或缺的组成部分没有空间智能 AGI就不完整 [1][4][29] - 3D世界建模是实现AGI的关键包括理解三维世界生成三维世界推理三维世界和在三维世界中做事 [7][29] - 目标是创建超越平面像素跨越语言障碍能够真正捕捉三维世界结构和空间智能的世界模型 [8][29] - 视觉智能的进化历史长达5.4亿年远比语言进化(3-5亿年)更复杂是智能发展的基础 [27] ImageNet项目的历史意义 - 2009年创建的ImageNet解决了AI领域的关键数据问题为现代计算机视觉搭建了数据骨架 [11][13] - 项目构想源于机器学习需要范式转变通过下载十亿张图片创建视觉分类体系来训练算法 [13][14] - 2012年AlexNet突破性进展将卷积神经网络 GPU和深度学习首次结合错误率从30%大幅下降 [15][17][19] - ImageNet开源策略和挑战赛机制推动了整个AI社区的发展 [15] 计算机视觉的发展历程 - 从物体识别(ImageNet)到场景描述(2015年图像字幕技术)再到3D世界建模的演进 [19][20][22][24] - 自然语言与视觉信号的融合让智能体能够讲述世界的故事 [22] - 生成式AI的发展使得从文字生成图像成为可能展现了AI的惊人进步 [22] 空间智能的挑战与机遇 - 3D建模面临数据缺失问题互联网缺乏空间智能数据信息主要存在于人类大脑中 [9][33][49] - 3D世界比语言(一维)复杂得多涉及物理规律投射转换等多重数学难题 [30][31] - World Labs正在构建3D基础模型应用场景包括设计建筑游戏开发和机器人等领域 [35] - 元宇宙是重要应用方向需要硬件和软件的融合以及内容生成的世界模型 [35][36][37] 人才培养与团队建设 - 思想上的无畏精神是成功人士的核心特质也是招聘的重要标准 [41][42] - World Labs正在招募工程产品 3D和生成模型领域的人才 [43] - 跨学科AI和小数据领域是学术界值得关注的方向 [44][45] - 研究生阶段应被强烈好奇心引领专注于解决根本性问题 [47][48]

Artificial Intelligence

General Artificial Intelligence (AGI)

Spatial Intelligence

Artificial Intelligence

General Artificial Intelligence (AGI)

Spatial Intelligence

AI Agent产品矩阵全景：从RPA到智能体的进化图谱

搜狐财经· 2025-06-30 21:43

在AI技术快速渗透的今天，AI Agent已从实验室走向企业级应用，成为自动化解决方案的核心载体。从字节跳动的"扣子空间"到OpenManus的开源生态，从 AutoGLM的深度思考到实在智能的TARS-RPA-Agent，市面上的AI Agent产品呈现出百花齐放的格局。这些产品不仅定义了技术边界，更在不同场景中重塑了人机协作的范式。 RPA与AI Agent的融合：从执行到决策的跃迁传统RPA（机器人流程自动化）曾以"规则驱动"为核心，依赖预设流程完成重复性任务。然而，随着AI技术的成熟，RPA逐渐与AI Agent结合，形成"RPA+AI"的混合自动化模式。例如，Automation Anywhere推出的AI Agent Studio，通过低代码平台允许用户构建自定义AI Agent，其核心在于将自然语言指令转化为可执行的自动化流程。而实在智能的TARS-RPA-Agent则进一步突破了这一框架，它不仅具备强大的意图理解能力，还能在复杂操作系统及桌面软件环境下精准操作，甚至能通过"自主感知"调整策略，实现从"执行者"到"决策者"的跃迁。垂直领域深耕：AI Agent的差异化优势在金融、政务、 ...

Artificial Intelligence

Multi - Agent Collaboration

Artificial Intelligence

TARS - RPA - Agent

Artificial Intelligence

Multi - Agent Collaboration

Artificial Intelligence

TARS - RPA - Agent

China's biggest public AI drop since DeepSeek, Baidu's open source Ernie, is about to hit the market

CNBC· 2025-06-30 00:35

百度开源ERNIE大模型战略 - 百度计划逐步开源其生成式AI大语言模型ERNIE 这被视为中国科技行业自DeepSeek出现以来在AI竞赛中的最大动作 [1] - 公司此前一直坚持专有商业模式但竞争对手的成功证明开源模型同样具有竞争力 [2] - CEO李彦宏表示该举措将帮助全球开发者降低开发成本无需担心模型能力或工具问题 [6] 对AI行业竞争格局的影响 - 每次主流实验室开源强大模型都会提高整个行业的标准此次事件具有全球性影响 [3] - 开源策略将对OpenAI等闭源供应商形成压力迫使其证明高价API的合理性 [4] - 行业专家将此举比作"向AI世界投掷燃烧弹" 可能颠覆中美竞争对手的定价体系 [5][6] 技术性能与价格优势 - ERNIE X1模型性能与DeepSeek R1相当但价格仅为后者一半 [6] - 开源模型能带来更低成本、更好性能及本地化支持开发者可更自由地迭代和部署 [4] - 该策略可能使更多应用基于"极其廉价"的模型开发快速改变AI模型获取的成本动态 [7] 商业模式转变的行业意义 - 标志百度从反对开源转向拥抱开源反映行业技术路线的重大转变 [2] - 向全球开发者免费提供高性能模型类似Costco创建Kirkland品牌的颠覆性策略 [5] - 分析师认为这不仅是竞争更是对现行AI定价体系的"宣战" [6]

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

腾讯，大动作！

中国基金报· 2025-06-27 23:11

【导读】腾讯混元推出首款开源混合推理模型，擅长Agent工具调用和长文理解头部互联网公司旗下大模型加速开源。 6月27日，腾讯混元开源的首款混合推理MoE模型Hunyuan-A13B发布，该模型是业界首个13B级别的MoE开源混合推理模型，其效果比肩同等架构领先开源模型。开源模型灵活性、透明度和成本优势，为人工智能产业发展带来新机遇。今年年初DeepSeek出圈后，腾讯、阿里、字节等头部互联网公司旗下大模型开源悄然加速。腾讯混元开源首款混合推理MoE模型 *加粗为最高分，下划线表示第二名，数据来源于模型各个公开的测试数据集得分在实际使用场景中，Hunyuan-A13B模型可以根据需要选择思考模式。快思考模式提供简洁、高效的输出；慢思考则涉及更深、更全面的推理步骤，如反思和回溯。 Hunyuan-A13B模型对个人开发者较为友好，在严格条件下，只需要1张中低端GPU卡即可部署。目前，Hunyuan-A13B已经融入开源主流推理框架生态，无损支持多种量化格式，在相同输入输出规模上，整体吞吐量是前沿开源模型的2倍以上。 Hunyuan-A13B集合了腾讯混元在模型预训练、后训练等多个环节的创新技术 ...

腾讯控股(HK:00700)

Artificial Intelligence

Artificial Intelligence

EPAM Releases DIAL 3.0: An Evolution of Open-Source GenAI Enterprise Platform

Prnewswire· 2025-06-24 20:02

NEWTOWN, Pa., June 24, 2025 /PRNewswire/ -- EPAM Systems, Inc. (NYSE: EPAM), a leading digital transformation services and product engineering company, today announced the release of DIAL 3.0, the next iteration of its open-source GenAI platform. More than just a platform release, DIAL 3.0 embodies EPAM's broader vision for enabling enterprise AI adoption through a modular, open-source approach - one that balances innovation velocity with long-term control, interoperability and responsible governance. F ...

Artificial Intelligence

Information Technology Services

Artificial Intelligence

Information Technology Services