Workflow
LLM
icon
搜索文档
Embedded LLM Launches First-of-its-Kind Monetisation Platform for AMD AI GPUs
GlobeNewswire News Room· 2025-07-22 10:30
TokenVisor平台发布 - 公司Embedded LLM推出全球首款针对AMD GPU生态的TokenVisor商业化平台,专注于LLM工作负载的计费、使用跟踪和多租户管理 [1][3] - 平台最初在2025年6月Advancing AI大会上与AMD联合展示,现正式全球发布 [1][6] - 该平台被定位为"AI代币时代的虚拟机监控程序",旨在实现去中心化GPU计算的商业化可行性 [6] 行业痛点与解决方案 - 行业面临AI工厂硬件投资难以转化为可衡量收入的挑战,传统方式需要数月定制开发且ROI路径复杂 [3] - TokenVisor提供开箱即用的商业化工具,包括实时使用监控、自动化计费、多租户管理等功能,将服务上线时间缩短至数天 [5][7][8] - 平台支持主流LLM模型,并提供开发者门户、API密钥管理和LLM测试沙盒等配套工具 [7] 合作伙伴评价 - AMD数据中心GPU业务高级总监表示该平台为AMD GPU新云生态系统带来强大的管理和变现能力 [4] - 联想亚太区总经理指出TokenVisor改变了AI基础设施的经济模型,结合联想服务器和AMD GPU可快速部署创收型LLM服务 [5] - 早期采用者反馈平台消除了商业化过程中的不确定性,显著加速投资回报周期 [8] 公司背景 - Embedded LLM专注于为知识经济构建AI基础设施,是vLLM for AMD ROCm的重要开源贡献者,同时提供JamAI Base等低代码LLM编排工具 [9] - AMD拥有55年高性能计算创新历史,其技术被财富500强企业和科研机构广泛采用 [10] - 联想作为全球收入690亿美元的科技巨头,在180个市场开展业务,致力于提供全栈AI解决方案 [11]
TME(TME) - 2024 Q3 - Earnings Call Presentation
2025-07-01 20:25
业绩总结 - 2024年第三季度总收入为64.5亿人民币,同比增长26.6%[15] - 2024年第三季度在线音乐订阅收入为38.4亿人民币,同比增长20.3%[37] - 2024年第三季度非国际财务报告准则净利润为19.4亿人民币,同比增长29.1%[37] - 2024年第三季度在线音乐服务的毛利率为42.6%,同比增长6.9个百分点[37] - 2024年第三季度每用户平均收入(ARPPU)为10.8人民币,同比增长4.9%[37] - 2024年第三季度社交娱乐移动月活跃用户为9000万[15] - 2024年第三季度独立音乐人数量超过48万[15] 用户数据 - 2024年第三季度在线音乐付费用户达到1190万,付费比例为20.7%[28] - 2024年第三季度在线音乐服务占总收入的比例为76%[43] 财务状况 - 2024年第三季度总现金、现金等价物、定期存款和短期投资为278亿人民币[15] - 2023年第三季度的非国际财务报告准则净利润率为22.9%[50] - 2023年第三季度的经营现金流为2.17亿人民币[49] - 2023年第三季度的股东权益投资总额为36.04亿人民币[49] - 2023年第三季度的每股收益(稀释后)为0.44人民币[50] - 2023年第三季度的总资产公允价值为11.78亿人民币[49] - 2023年第三季度的股本为1.57亿股[49] 其他信息 - 2023年第三季度的毛利为2,342百万人民币,毛利率为35.7%[47] - 2023年第三季度的毛利同比增长了21.0%[47] - 2023年第三季度的非国际财务报告准则净利润同比增长了28.9%[50]
ICCV 2025放榜!录取率24%,夏威夷门票你抢到了吗?
具身智能之心· 2025-06-26 22:19
ICCV 2025会议数据 - ICCV 2025共收到11239份有效投稿 录用2699篇论文 录用率为24% [3] - 投稿量较2019年增长近三倍 反映计算机视觉领域快速扩张 [3] - 历史录用率稳定:2023年26 15% 2021年26 20% 2019年25% [6] 学术评审机制改革 - 新政策强化问责制 因审稿人不负责任直接拒稿29篇 其中12篇本应被录用 [4][5] - 建议建立双向评审系统 允许作者评估评审质量 审稿人获得认证 [34][38] - 提出系统性奖励机制 激励高质量评审工作 [36][38] 行业技术趋势 - 深度学习自2012年突破后 在计算机视觉 NLP等领域持续革新 [27] - LLM和生成式AI等颠覆性技术推动研究热情 论文数量激增 [29] - 主流AI会议投稿量超万篇 NIPS 2025或突破3万篇 [31] 代表性研究成果 - 高保真3D几何生成技术 [7] - 十亿级MRI标注医学图像分割数据集 [13] - 自动驾驶风险评估框架OD-RASE [21] - 通用扩散模型UniVG实现图像生成与编辑一体化 [22]
AI大神Karpathy演讲刷屏:软件3.0时代已来,提示词就是新代码
36氪· 2025-06-20 20:18
LLM技术演进 - LLM发展经历了三个阶段:软件1.0时代、以数据为核心的2.0时代、通过自然语言指令控制模型的3.0时代[3] - 语言正在演变为控制系统,每个个体都拥有语言接口的一部分[3] - LLM技术分支发展迅速,类似芯片制造业需要巨额资本支出[4] LLM生态系统定位 - LLM更接近操作系统而非公共事业商品,形成日益复杂的软件生态[6] - 闭源LLM提供商类比Windows/Mac OS,开源Llama生态类似Linux[6] - 技术架构上:模型本体相当于CPU,上下文窗口相当于内存,工作流如同操作系统调度资源[6][8] 人机交互优化方向 - 纯文本交互将进化,GUI可视化界面能加速AI工作成果的验证环节(如Cursor的代码高亮功能)[11][13] - 有效自动化需满足三要素:感知(获取信息)、行动(执行操作)、监督(人工介入机制)[15][17] - 当前软件界面设计阻碍AI自动化,需改造为LLM可访问的形式[16] AI代理发展路径 - AI代理发展应是十年周期而非短期爆发,从演示级到工业级需跨越可靠性鸿沟[21] - 现实场景复杂度远超预期,特斯拉经验显示需谨慎对待agent技术[19] LLM特性与局限 - LLM具有类人心理特征,既拥有百科全书式知识又存在幻觉、记忆缺陷等问题[27][29] - 训练数据导致其同时具备超能力与认知缺陷,类似《雨人》角色特征[27] 技术扩散模式创新 - LLM颠覆传统技术扩散路径:先消费级应用普及,后政企采用(如ChatGPT烹饪问答)[31] - 当前是行业进入良机,因技术扩散方向与历史模式完全相反[31] 教育领域应用 - 开放式指令易导致AI教学失控,需结构化课程设计(教师-AI协作制定大纲)[23][24] - 过度反应的代理会产生无效输出,需限制在人类可验证的产出框架内[24]
游戏教父 John Carmack:LLM 不是游戏的未来
AI前线· 2025-06-16 15:37
公司背景 - Id Software成立于90年代,开发了《指挥官基恩》《德军总部3D》《毁灭战士》和《雷神之锤》系列,其中《雷神之锤》推动了GPU发展和普及,间接促成现代人工智能世界的形成[3] - Armadillo Aerospace致力于垂直起降(VTVL)火箭研发,相关工作持续十年[6] - Oculus为现代虚拟现实奠定技术基础,后被Meta收购[8] - Keen Technologies专注于AI研究,团队已有六名来自学术界和工业界的研究人员[11][12][13] 技术方向 - 不参与LLM相关工作,认为LLM"无所不知却又无所学",更倾向于通过交互式体验流进行学习[16] - 专注于游戏和虚拟环境,认为PC游戏中的超人类水平机器人作弊问题可通过云游戏流媒体解决[18] - 目标提供由混合被动和交互内容组成的虚拟学习环境,构成无限可滚动的"视频墙"[22] - 选择Atari游戏作为研究平台,因其无偏见且玩法多样,与大量研究成果可比性高[30][31] 技术挑战 - 连续高效终身单一环境多任务在线学习仍是未解决问题,现有系统无法复制猫狗的简单能力[20] - 强化学习框架存在近期偏差和灾难性遗忘问题,串行多任务学习中智能体难以保留旧技能[81][82] - 神经网络训练存在可塑性丧失现象,与生物大脑老化相似,需平衡初始学习速度与长期表现[93][94] - 离线强化学习效果不佳,因缺乏持续现实检验,可能陷入未经验证的连贯幻想世界[87][88] 算法优化 - 使用CUDA图和显式同步优化训练过程与环境交互的重叠,提高消费级硬件上的FPS[41] - 为动作添加延迟线解决现代高性能算法在延迟环境中的崩溃问题[43] - 提出新基准测试循环通过一组游戏,结合原始学习速度与避免遗忘能力[97] - 探索各向同性CNN、循环各向同性半密集CNN等新型网络架构提升图像处理性能[143][145] 实验设计 - 开发Atari 2600+游戏系统,包含摄像头、伺服电机操纵杆和运行强化学习智能体的笔记本电脑[47] - 测试八款不同游戏,关注摄像头观察、操纵杆动作、分数检测等物理硬件交互问题[50][51][55][62] - 开源相关工作,使用April Tags进行屏幕校正和分数识别[48][52] - 将硬探索游戏如《蒙特祖玛的复仇》和《Pitfall》作为长期研究课题[71]
网友怒了!Alist 开源项目 Issues 被屠版了
程序员的那些事· 2025-06-12 16:43
AList被收购事件 - 开源神器AList被新东家收购后引发社区强烈反弹[1] - GitHub Issues板块出现大规模抗议帖 累计达350条(14页×25条/页)[1] 相关技术行业动态 - Redis创始人公开发声 认为人类程序员仍优于大型语言模型[2] - Java创始人James Gosling批评AI技术夸大宣传 否认其能替代程序员[2] - 阿里云遭遇严重安全事件 核心域名系统遭到非法劫持[2]
趣图:真 AI、真 LLM、真 API…
程序员的那些事· 2025-06-10 11:49
Mumbai:印度孟买, 常被视为提供廉价技术劳动力的地区 真 AI、真 LLM、真 API… ↓↓↓ Gujarati:印度的古吉拉特邦,以商业著称 往期趣图 (点击下方图片可跳转阅读) ...
AI Agents:从工具到伙伴 | 2025 HongShan AI Day(下篇)
红杉汇· 2025-06-02 15:06
AI Agents技术演进与评估 - 红杉中国推出全新AI基准测试工具xbench 采用双轨评测体系 AGI track验证基础能力 Profession Aligned聚焦生产场景实用性评估 预设TMF目标后停止更新难度 [7][8] - xbench通过数学模型将波动分数转化为单调递增能力曲线 解决不同时间维度模型能力比较难题 清晰展示AI真实成长轨迹 [8] - Agent定义包含三层架构 模型智能 行业私有知识 用户使用反馈 其核心价值在于泛化性 突破传统模型任务覆盖范围 [10] 商业应用与创业机会 - Agent创业需考量经济价值与生产成本平衡 关键在于能否抽象出可复制的生产方法 艺术类项目具备模型化潜力 [10] - 垂直行业场景如教育 旅游等需连接真实世界知识的领域 Agent将成为通用大模型与行业落地关键枢纽 [10][11] - 2025年LLM关键判断显示 Coding+Agentic AI将成AGI时代超级应用机会 Long Context问题解决后将引爆应用发展 [13] 企业组织形态变革 - AI时代企业规模趋向小型化 组织架构扁平化 人效显著提升但管理复杂度增加 创始人需强化招聘与领导力 [16] - 国际化企业需提前搭建海外架构 涵盖人力 品牌 财务等模块 全球人才协同创造价值成为核心竞争力 [15] - AI重塑品牌传播方法论 企业需精准把握核心受众关注点 技术创新与品牌内容建设需同步推进 [15] 技术突破方向 - Agent交互方式从按钮操作转向多模态自然交互 需突破上下文管理瓶颈以实现长期连续性任务执行 [11] - 在线学习(Online-learning)成为新范式 允许模型自主探索 可能催生"堪比爱因斯坦的AGI" [13] - LLM Agent应升级为数字员工角色 解析执行复杂任务 创业公司需在新环境下重新定位价值 [19] 行业竞争格局 - OpenAI与Anthropic在LLM领域占据绝对领先优势 AGI发展路线已出现分化 [13] - 2030年前将出现多家市值超10万亿美元公司 标志AI经济价值跃升 预训练仍是新能力涌现关键 [13] - 谷歌提出AI战略核心是构建端到端平台而非单一模型 2025年将成AI创新真正起点 [18]
趣图:女朋友是 model
程序员的那些事· 2025-05-31 18:41
人类与LLM对比 - 人类在特定领域表现优于大型语言模型(LLM) [1] - Redis创始人亲自验证人类能力优势 [1] - 网络趣图显示人类仍具不可替代性 [1] 技术发展趋势 - 出现"Make Human Great Again"的技术发展倾向 [1]
人工智能三人行-热评:如何看待MCP领域的竞争?您看好哪家?
搜狐财经· 2025-05-29 08:13
微软宣布全面拥抱MCP - 微软高调宣布全面拥抱MCP,但MCP领域竞争激烈,已有OpenAI、谷歌、百度、阿里等企业布局 [1] - 部分企业可能借助MCP热度推广产品,真正开放生态并为开发者提供切实服务的企业目前较少 [1] 百度在MCP领域的布局 - 百度在4月开发者大会上明确提出帮助开发者全面拥抱MCP,将MCP比作"AI界的万能插座",通过标准化接口降低开发门槛 [1] - 百度发布全球首个电商交易MCP,其搜索、地图、文库、网盘等业务全面提供MCP Server供开发者调用 [1] - 百度举措让开发者无需担忧模型能力、成本、开发工具等问题,可更专注应用开发 [1] MCP标准化趋势 - MCP标准化是AI行业发展的必然方向,百度选择这一道路具有前瞻性 [1] - 行业企业需在MCP赛道上找准方向并加速前行 [1] 人工智能工程师培训课程 - 工业和信息化部教育与考试中心推出人工智能(大模型)工程师中级课程,涵盖大模型核心原理、开发技能和应用实践 [5] - 课程内容包括AIGC和LLM基础知识、提示词工程、开发环境构建、LangChain框架等 [5][6] - 课程目标是为工程师提供全面学习机会,使其在行业中发挥更大影响力 [5] 行业专家背景 - 大模型资深技术专家曾任职微软中国,专注于云平台、人工智能等领域,拥有近两万小时培训经验 [10] - AlOps国际讲师是AlOps和SRE领域资深专家,拥有15年以上经验,发起中国首个SRE社区 [12] - 智用人工智能应用研究院CTO曾任微软中国首席创新技术架构师,拥有数据科学、人工智能等领域专业学位 [13]