AGI

搜索文档
AI中厂夹缝求生
36氪· 2025-04-30 15:37
文章核心观点 昆仑万维在AI领域布局多年,2024年财报首次披露AI产品商业成果,但公司仍面临盈利挑战,不过其表示为抓住AI机遇会坚定投入,预计2027年AI大模型业务实现盈利 [1][16][17] 分组1:AI商业成果 - 公司AGI与AIGC业务商业化取得重要进展,AI社交单月最高收入突破100万美元,AI音乐年化流水收入ARR达约1200万美金(截至2025年3月底) [1] - 天工AI峰值月活跃用户突破1000万,app月活数据522万,全球排名64 [4] 分组2:AI产品布局 - 模型层覆盖语言、多模态、3D、视频、音乐等大模型,音乐大模型技术指标最好 [3] - 应用层在AI助手、AI游戏、AI短剧、AI音乐等方面全面开花,如天工AI智能助手功能不断升级,推出AI音乐平台和AI短剧创作平台 [3][4][5] 分组3:商业策略与思路 - 公司用AI重构传统业务,驱动信息分发与元宇宙平台Opera创新,提升用户体验 [8] - 为完成商业闭环,考虑通过模型优化压低推理成本、搭建AI UGC平台、发展AI终端三种路径 [10] - 采用模型+产品思路,通过调动更小参数实现高效运行,降低成本并提高灵活性和可扩展性 [9][10] 分组4:市场竞争地位 - 不属于大厂、创业公司、颠覆者三类,在模型市场迭代更新,打法更长远 [9] - 音乐生成大模型Mureka在测试中击败Suno,达到SOTA水平,但人声生成有瑕疵 [12][15] 分组5:财务状况与前景 - 2024年净利润(扣非)从2023年的6.6亿元下滑到亏损16亿,2025年一季度亏损7.7亿元,同比下滑298%,经营活动净现金流首次为负 [16] - 称亏损是主动性战略投入,预计2027年AI大模型业务实现盈利 [16][17]
实现商业化落地,人形机器人的核心点是上肢还是下肢?
Robot猎场备忘录· 2025-04-30 15:14
温馨提示 : 点击下方图片,查看运营团队2025年最新原创报告(共210页) 说明: 欢迎约稿、刊例合作、行业人士交流 , 行业交流记得先加入 "机器人头条"知识星球 ,后添加( 微信号:lietou100w ) 微信; 若有侵权、改稿请联系编辑运营(微信:li_sir_2020); 人形机器人要实现真正商业化落地是上肢重要还是下肢重要? 人形机器人真正落地实用场景,任务终结点是手臂和手,而小编注意到涉及手臂相关研究极少,是工业机械臂发 展多年,导致人形机器人机械臂结构和相关算法控制已完全成熟,只需要专注于"小脑"上层层面控制?但是参加 展会时,可明显看到人形机器人手臂运动过程中颤颤巍巍、卡顿、僵硬的现状,所 以这是"小脑"层面控制问题, 还是关节间问题? 目前业内对于灵巧手研究已经很多且备受重视,除了人形机器人本体厂商自研外,也出现了专注于灵巧手和触觉 感知研究的初创公司,也是目前人形机器人发展过程中核心卡点之一。 正文: 具身智能机器人是一个复杂的AI+机器人+自动驾驶的系统性学术+工程问题,远期AGI的物理世界载体,受算力、 软件算法、数据、硬件、工程化等多面因素影响;小编往 期文章 : 【原创】人形机 ...
通义千问 Qwen3 发布,对话阿里周靖人
晚点LatePost· 2025-04-29 16:43
文章核心观点 - 阿里云CTO周靖人认为大模型发展已进入早期阶段中期,需在多模态、工具使用、Agent支持和持续学习等多方向布局[5][14] - 通义千问Qwen3作为全球首个开源混合推理模型,通过融合推理和非推理模式实现性能与成本平衡,代表技术新趋势[6][15] - 阿里开源战略成效显著:Qwen系列下载量达3亿次,衍生模型超10万个,超越Meta Llama成为全球最活跃开源模型[7][8][18] - 公司坚持技术规律导向的研发节奏,强调长期创新而非短期竞争,认为AGI发展需要云计算体系与大模型的深度协同[12][13][21] 技术突破 - Qwen3-235B-A22B以2350亿总参数在多项基准测试超越6710亿参数的DeepSeek-R1,小尺寸MoE模型Qwen3-30B-A3B激活参数仅30亿但性能更优[7] - 混合推理模型创新性实现"思考预算"设置,开发者可自定义深度思考的token消耗量以平衡成本效益[15] - 模型支持vLLM/SGLang推理框架和MCP协议,配合Qwen-Agent框架可快速开发智能体[18] - 多模态技术积累始于2019年,2021年已发布万亿参数MoE多模态模型M6,当前视频生成模型万相2.1与Sora互有胜负[17][26] 开源生态 - 开源决策基于两大判断:模型作为核心生产元素需通过开源普及,开源已成为大模型重要创新驱动力[18] - 魔搭社区累计开源超200个模型,Qwen系列占Hugging Face下载量30%以上,衍生模型数量持续领先Llama系列[7][8][18] - 版本策略覆盖全场景需求:0.6B-32B稠密模型满足端侧到企业部署,MoE模型提供高性价比选择[18] - 开发者服务导向体现在消费级显卡适配、及时支持主流框架等举措,形成技术生态正循环[18] 研发体系 - 采用pipeline式研发管理,预研方向通过小规模实验验证后阶梯式投入,保持多技术方向并行探索[24] - 实验平台支持快速迭代,避免直接超大规模投入,强调科学评估和数据驱动的决策机制[25] - 人才策略结合职级普调与使命驱动,通过系统性工程积累形成代际技术优势[25][26] - 研发投入聚焦三大方向:类人思考能力进化、多模态融合、云模型协同优化带来的效率突破[13][20] 行业竞争 - 认为当前模型竞争本质是系统工程较量,需云计算、数据平台和工程能力的全面配合[13][21] - 指出纯Infra优化无法替代完整云服务,强调阿里云在SLA保障、多模型兼容等方面的企业级优势[22] - 预判行业将面临供电瓶颈,提前布局智算中心选址的energy-aware优化[22][23] - 3800亿新基建投入应对AI应用指数增长,目前MaaS服务已现供不应求态势[22]
对话昆仑万维方汉:冲击AI巨头的野望和决心
经济观察网· 2025-04-28 16:56
公司战略与投入 - 公司董事长方汉认为AI将重塑内容行业,并全力投入AI研发,包括亲自阅读200篇论文、面试算法博士等[1][16] - 公司2024年投入8亿元购买算力芯片,研发费用增至15.4亿元,同比增长近60%[1] - 公司采用"Fast Fail"机制,快速试错并集中资源于有突破潜力的领域如AI音乐、AI短剧、AI社交等[5][6] - 公司设立2050研究院,聚集年轻研究员专注AGI研发,并坚持开源策略,已开放20多个大模型[16][18][19] 财务与业务表现 - 公司2024年营收56.6亿元,同比增长15.2%,毛利率达73.6%[4] - 2024年公司出现上市十年来的首次年度亏损[1] - AI业务年化收入达1.4亿美元,成为海外收入增速最快的中国AI企业[5] - AI音乐年化流水收入达1200万美元,短剧平台Dramawave年化流水收入达1.2亿美元[5] - AI社交单月最高收入突破100万美元[5] 产品与技术突破 - 音乐生成工具Mureka V1上线后,用户创作歌曲成本降至0.1-0.7元,企业成本不到0.05元[8] - Mureka O1模型击败美国Suno登顶全球第一,支持10种语言,用户遍布100多个国家[8] - 推出全球首个集成视频大模型与3D大模型的AI短剧创作平台SkyReels[9] - 开源模型Skywork R1V和Skywork-Reward分别达到同类型开源模型全球第一[19] - 开源视频模型SkyReels V1被下载3万余次,带动短剧订阅用户暴涨十几倍[19] 市场与行业判断 - 国际作者和作曲者协会联合会预计AI生成音乐市场将从30亿欧元增至2028年640亿欧元[8] - 公司认为全球80亿人口中1%的付费用户即可催生千亿级市场[9] - 公司选择相对冷门的AI音乐、AI短剧等娱乐赛道避开与大厂直接竞争[11] - 公司判断3-5年内线下劳动力无法被完全替代,但20年内AGI将渗透至每个行业[20] 竞争优势与执行策略 - 公司拥有200万首正版歌曲授权数据,音乐语料规模仅次于腾讯、字节和网易[13] - 通过早期海外市场布局积累本地化经验,如优化千元以下手机音质[13] - 决策灵活,从决定All in AI到执行仅用7天,资源调配迅速[13][14] - 偏好招聘应届博士而非大厂老将,认为其创新思维更强[16][17]
昆仑万维2024年财报:AI业务高歌猛进,净利润巨亏15.95亿
搜狐财经· 2025-04-28 15:38
财务表现 - 公司2024年实现营业总收入56.62亿元 同比增长15.20% [1] - 归属于母公司股东的净利润亏损15.95亿元 同比下降226.74% [1][7] - 金融资产价格波动导致投资损失8.2亿元 是亏损主因之一 [7] 海外业务 - 海外业务收入51.5亿元 同比增长21.9% 占总收入91% [4] - Opera平台营业收入4.8亿美元 同比增长21.1% 月活用户近3亿 [4] - 海外社交网络和短剧平台收入12.5亿元 同比增长28.5% [4] - 短剧平台DramaWave年化流水收入ARR达1.2亿美元 月流水1000万美元 [4] - 爆款短剧《订婚风暴》上线5天播放量破千万 登顶韩国Google Play娱乐榜 [4] 研发投入与技术突破 - 全年研发费用15.4亿元 同比增长59.5% [4][7] - 发布"天工2.0/3.0/4.0"系列大模型 含实时语音交互和慢思考推理能力 [5] - 开源Skywork-MoE稀疏大模型等多款AI模型 推动技术普惠化 [5] - MurekaO1/V6音乐模型性能超越Suno 登顶SOTA [6] - AI音乐平台年化流水ARR达1200万美元 巩固海外市场领先地位 [6] 战略展望 - 2025-2026年为AI大模型应用落地期 预计2027年实现盈利 [7] - 公司将持续保持AI大模型第一梯队 通过技术创新推进商业化 [7]
AI如何改变产品、护城河与创业法则?
虎嗅· 2025-04-28 13:42
在一日一变的AI圈,有句格言值得铭记:"你今天用的AI模型,会是你用过的最差的AI模型。"这一振 聋发聩的观点出自OpenAI首席产品官Kevin Weil之口,道出了AI发展速度之快令人咋舌。 Kevin Wheel曾在Twitter、Instagram、Facebook和Planet等科技公司担任产品负责人,也是Facebook Libra 加密货币的共同创建者,同时他还是Planet、Strava、黑人产品经理网络和自然保护协会的董事会成 员。但他说,这些职业经历与在OpenAI工作的体验截然不同。 站在AI、AGI、也许未来还有超级智能的最前沿,Kevin Wheel在一次长达1个半小时的深度访谈中,讨 论了OpenAI的产品思维、AI对工作和产品的影响、OpenAI可能不会做的市场、在AI时代最重要的技能 是什么、甚至他教自己的孩子关注什么等等一系列干货。本文特此梳理其中的十条经验之谈,希望能为 AI创业者和AI爱好者带去思考。 一、对AI产品开发的思考 这种研究与产品的融合是OpenAI产品成功的关键。Wheel解释说,"最好的产品来自于产品设计和研究 团队一起工作,共同构建新颖的东西。"他指出公 ...
除了Ilya、Karpathy,离职OpenAI的大牛们,竟然创立了这么多公司
机器之心· 2025-04-28 12:32
机器之心报道 机器之心编辑部 聚是一团火,散是满天星。 硅谷新势力已经崛起,这些创业者来自 OpenAI。 作为 ChatGPT 的缔造者,OpenAI 堪称当今人工智能领域最耀眼的明星。这家公司正以惊人的速度飙升至 3000 亿美元估值的同时,也催生了一批离职创业的成 员。 OpenAI 的光环效应如此强大,以至于 Ilya Sutskever 的 AI 初创公司 Safe Superintelligence (SSI) 和 Mira Murati 的 Thinking Machines Lab 等企业尚未推出产品就获得 数十亿美元融资。 这个新兴生态圈还包括诸多明星项目,以下是离职 OpenAI 的研究者打造的最受瞩目企业盘点。 Dario Amodei, Daniela Amodei, John Schulman — Anthropic Dario Amodei 和 Daniela Amodei 兄妹二人于 2021 年离开 OpenAI,联合其他 OpenAI 高管共同创立了 Anthropic,专注于开发安全、可解释、对齐人类价值观的 AI 系统。 随后,OpenAI 联合创始人 John Schu ...
重押AI后,昆仑万维去年由盈转亏了
华尔街见闻· 2025-04-26 20:04
文章核心观点 - ChatGPT掀起AI大模型浪潮后竞争焦点从底层技术转移到AI应用,昆仑万维战略重心转向AIGC但仍未盈利,公司将采取措施改善盈利状况并预计2027年开始AI大模型业务盈利,需平衡大模型技术和AI应用发展 [3][4][10] 行业情况 - ChatGPT掀起AI大模型浪潮两年后,竞争焦点从底层大模型技术转移到AI应用 [3] - 2023 - 24年是AI大模型初始投资期,全球科技公司投资数百亿美金处于巨亏状态;25 - 26年是应用落地和收入增长期,行业收入快速增长但仍亏损;2027年以后开始盈利 [10] 公司战略 - 昆仑万维将战略重心更多放在AIGC,认为这是更容易实现商业变现的路径 [3] - 为改善未来盈利状况,公司将在业务端提升研发成果商业化效率,投资端优化资产配置策略,拓展多元化收入来源并降本 [8] 公司财务 - 2024年度财报显示,公司去年净亏损15.9亿元,较2023年转盈为亏,原因是研发投入加大和投资收益不及同期 [5] - 去年研发费用15.4亿元,同比增长59.5%,投资相关损失8.2亿元 [5] - 去年营业总收入56.6亿元,同比增长15.2%,海外营收占比提升至91%,同比提升5个百分点 [7] 公司业务进展 - 自2023年发布“天工1.0”大模型后多次迭代,在复杂任务处理、多模态等方面有多项突破 [11] - AI社交应用Linky单月最高收入突破100万美元,AI音乐年化流水收入ARR约1200万美金,短剧平台DramaWave年化流水收入ARR约1.2亿美金 [12] 公司未来展望 - 预计2027年开始AI大模型业务实现盈利,会坚定投入保持在第一梯队 [10] - 要在熟悉的应用赛道发力,同时平衡大模型技术和AI应用 [12][13]
o3 深度解读:OpenAI 终于发力 tool use,agent 产品危险了吗?
海外独角兽· 2025-04-25 19:52
OpenAI新模型发布 - OpenAI发布o3和o4-mini模型,其中o3是目前最先进的推理模型,具有全面的推理能力、丰富的tool use方式和全新的多模态CoT能力 [5] - o4-mini是专为高效推理优化的小模型,在某些benchmark上表现优于o3,但实际使用中思考时间明显更短 [5] - 两个模型实现了agentic浏览网络、Python代码执行与可视化、图片推理与增强、文件读取等能力 [5] - 模型定价方面,o3比其他一线模型更贵,o4-mini定价是o3的1/10 [59][60] Agent能力突破 - o3的agentic能力接近理想agent,任务完成方式与Deep Research类似,能在3分钟内给出不错结果 [6] - o3的tool use体验无缝,比Devin、Manus等产品更快更自然,思考推理过程更长不截断 [6] - 测试显示o3能完成YC官网企业信息整理和Amazon销售数据分析等复杂任务,表现优于Manus [7][8][11][12] - 用户案例显示o3能自主定位Youtube视频内容并进行分析搜索,类似完整agent的工作方式 [28] 多模态能力进展 - o3和o4-mini首次实现将图像直接融入CoT,能"看懂"图像并用图像思考,在多模态理解benchmark领先 [33] - 测试显示模型能处理模糊、反转或低质量图像,理解内容并进行裁剪、旋转等操作 [34] - 模型通过地貌、文字等线索成功识别埃及尼罗河和马来西亚婆罗洲等地理位置 [37][39] - 但视觉推理能力仍不稳定,在数手指、判断时钟时间等任务上存在系统性错误 [53][55][56] 技术路线与商业化 - agent产品分化为两类技术路线:OpenAI的黑盒端到端训练和Manus的白盒工作流外置 [4][6] - OpenAI将agent产品作为未来商业化收入重点,可能覆盖通用agent产品市场 [3] - 开源Codex CLI旨在普及竞品功能,具有多模态推理和本地代码环境集成两大特性 [47][51] - RL Scaling依然有效,算力投入与性能提升成正比,o3比o1表现更好 [61][62] 强化学习发展方向 - RL教父提出"体验时代"概念,强调agent需从自主经验中学习达到超人类水平 [65][68] - 未来agent将形成长期连续experience stream,能自我修正实现长期目标 [68] - 需转向基于真实环境信号的奖励机制,如健康数据、考试成绩等 [70] - agent可能发展出非人类思维方式,结合世界模型实现更有效规划 [71]
李建忠:大模型技术创新驱动的 AI 生态和应用演进
AI科技大本营· 2025-04-24 11:39
AI发展阶段与生物智能演化对比 - AI发展分为五个阶段:1940年代符号主义起步[4]、2012-2018年感知AI(如AlexNet突破)[4]、2018-2024年生成式AI(如GPT-1.0和ChatGPT)[4]、2024-2030年AI智能体(强化学习驱动)[4]、2030年后物理AI(具身智能)[4] - 生物智能演化对应:5.5亿年前线虫大脑诞生[7]、5.4亿年前三叶虫视觉出现[8]、5000年前人类文字发明[8]、16-17世纪科学革命[9] - 两者均呈现"大脑→视觉→语言→推理"的加速发展路径,语言是智能跃迁核心[9][10] 自然语言在智能中的核心地位 - 人类文明因文字出现而腾飞,AI领域OpenAI押注自然语言路线,通过大模型实现智能突破[12] - Anthropic研究反驳统计学派:大模型内部存在规划逻辑(非简单概率输出)、跨语言泛化能力、语言映射共享概念区域(如"苹果"的抽象概念)[13][14][15] - OpenAI首席科学家Ilya Sutskever认为"语言是对人类智能的压缩",与维特根斯坦哲学观点一致[19] 大模型技术范式演进 - 三阶段划分:预训练(知识灌输)、后训练(价值观对齐)构成"快思考",推理(逻辑思维)构成"慢思考"[21] - Scaling Law持续有效:预训练受限于语料瓶颈,但强化学习(如OpenAI o1和DeepSeek-R1)通过合成数据推动新增长曲线[23] - 推理模型成为主流范式,DeepSeek-R1开源方案推动行业转向强化学习[19][21] AI应用生态与模态演进 - 生成式AI(AIGC)与AI智能体并行发展:前者提供情绪价值(toC娱乐),后者提供成就价值(toB效率)[25] - 内容模态遵循"文字→图片→音频→视频"路径,AI降低创作门槛(博客时代作者比例1%,短视频时代37.5%)[27] - 智能体五大能力:规划(推理驱动)、工具调用(MCP协议)、协作(A2A协议)、记忆、行动[28][31][33] Agent平台与协议生态 - MCP协议连接大模型与传统软件(结构化数据/中心化架构),A2A协议实现Agent间协作(自然语言/去中心化)[33][34] - Agent平台将成为大模型厂商竞争焦点,需整合MCP和A2A协议以链接传统服务与多Agent协作[35][37][38] - 传统软件需重构为"面向智能体+自然语言交互+消除割裂"的三要素,否则面临淘汰[42] AGI发展路径与组织协作 - OpenAI定义AGI五阶段:聊天机器人→推理者→智能体→创新者→组织者[45][50] - 强化学习推动AI从"人类数据时代"(知识回声)到"经验数据时代"(突破边界)[47][49] - 高阶智能体现为组织协作,未来或出现大规模Agent协作网络(如软件开发中需求分析、编码等角色Agent化)[53][55]