AGI

搜索文档
ChatGPT负责人坦言:GPT-5 仍有“幻觉”问题,建议用户核对答案;智元发布OmniHand 2025灵巧手丨AIGC日报
创业邦· 2025-08-18 08:10
ChatGPT与GPT-5 - GPT-5仍存在"幻觉"问题,OpenAI高管建议用户核对答案,强调可靠性尚未在所有领域超越人类专家 [2] 智元机器人OmniHand 2025灵巧手 - 推出"灵动款"与"专业款"两款产品,灵动款首发限时降价5000元至9800元,触觉款线上首发价1.48万元(原价1.98万元) [2] 银河通用Galbot人形机器人 - 在2025世界人形机器人运动会医院药品分拣赛中,以10分22秒成绩夺冠 [2] Qwen3 Coder市场份额 - 在OpenRouter平台市场份额达20.5%,较7月第四周增长15.4%,超越GPT-5(份额不足5%)并挤压Anthropic和Google的编程市场份额 [2] 行业数据服务 - 提供2万+LP数据、10万+基金数据、1万+专精特新小巨人企业信息及产业图谱 [8] - 支持人形机器人、商业航天、AGI等热门赛道深度分析 [4]
Meta AI大动作!超级智能实验室拆分,团队重组抢滩AI技术高地
搜狐财经· 2025-08-18 02:17
公司战略重组 - 全球科技巨头meta正对其人工智能部门进行大规模重组 这是过去半年内的第四次重大调整 彰显公司在全球AI技术竞争中持续调整战略步伐的决心 [1] - 重组核心举措是将超级智能实验室拆分为四个小组 包括TBD实验室 产品团队 基础设施团队和FAIR实验室 以实现更明确的职责分工 [1][3] 新部门职能划分 - TBD实验室专注于前沿AI技术探索 特别是生成式AI和大模型优化领域 承担快速验证技术可行性的任务 [1] - 产品团队致力于将AI技术深度融入meta核心产品矩阵 包括升级Facebook内容推荐算法 迭代Instagram图像生成功能 优化WhatsApp智能交互服务等 [3] - 基础设施团队负责搭建和维护底层技术架构 包括算力集群 数据存储与安全体系 算法训练平台等 是AI业务的技术基石 [3] - FAIR实验室继续专注于长期基础性AI研究 涵盖通用人工智能核心技术突破 AI伦理与安全机制构建等 保持相对独立研究属性 [3] 重组动因分析 - 行业竞争加剧 OpenAI 谷歌 微软等对手在生成式AI和大模型应用领域动作频频 公司需提升研发效率和落地速度应对挑战 [4] - 超级智能实验室内部存在职责交叉和沟通成本较高问题 拆分旨在让各小组更聚焦核心任务 激发团队创造力和战斗力 [4]
腾讯研究院AI速递 20250818
腾讯研究院· 2025-08-18 00:01
谷歌开源Gemma 3 270M - 谷歌发布轻量级模型Gemma 3 270M,参数规模2.7亿(嵌入参数1.7亿,Transformer模块1亿),下载体积仅241MB [1] - 模型在Pixel 9 Pro手机上25次对话仅耗电0.75%,INT4量化后适配资源受限设备 [1] - IFEval基准测试表现超越Qwen 2.5同级模型,下载量突破两亿次,支持任务微调 [1] Meta开源DINOv3视觉模型 - DINOv3采用自监督学习,在密集预测任务中超越弱监督模型,参数规模达70亿,训练数据17亿张图像 [2] - 创新技术包括Gram Anchoring策略和旋转位置编码(RoPE),提供ViT-B/ViT-L等系列模型 [2] - 商业许可开源,已应用于卫星图像分析和环境监测领域 [2] 腾讯混元3D世界模型Lite版 - 显存需求降至17GB以下,消费级显卡可运行,显存占用减少35% [3] - 动态FP8量化和SageAttention技术使推理速度提升3倍,精度损失小于1% [3] - 支持单文本/图片输入生成可漫游3D世界,可导出Mesh文件接入游戏引擎 [3] 昆仑万维音乐模型Mureka V7.5 - 一周内发布六款模型覆盖视频生成、AI音乐等热点领域 [4] - Mureka V7.5优化ASR技术提升中文歌曲音色与咬字,超越国外顶尖音乐模型 [4] - 同期推出MoE-TTS框架,通过自然语言控制语音特征,开源条件下超越闭源产品 [4] GPT-5编程提示技巧 - 指令需避免冲突与含糊,过分强硬措辞可能适得其反 [5] - 复杂任务用高推理力度,类XML语法可结构化规则 [6] - 零到一任务需先规划评判标准,控制Agent工具预算与查找节奏 [6] 人形机器人运动会 - 首日赛事包括1500米长跑(宇树机器人夺冠)、5V5足球等,蓝队1号球员完成3次进球 [7] - 现场解说聚焦AI技术,出现机器人集体摔倒等"鬼畜"场面 [7] DeepMind Genie 3世界模型 - 结合Veo 2和Genie 2,每秒生成24帧720p画面,支持单文本创建互动世界 [8] - 具备1分钟视觉记忆能力,物理规律表现随数据规模提升 [8] - 被视为AGI重要路径,可解决机器人训练数据瓶颈 [8] OpenAI战略动向 - 计划斥资数万亿建设数据中心,暗示未来AI可能担任CEO [9] - 与Jony Ive合作开发AI硬件,承认人类创作内容价值将上升 [9] - 认为当前AI泡沫类似互联网泡沫,但技术革命影响占比将达10%-20% [9] AGI发展观点 - AGI定义细化多维能力集合,评测基准需转向应用价值评估 [10] - 模型已在IMO/ICPC等竞赛展现推理能力,编程教育需结合AI辅助 [10][11] Agent市场展望 - AI市场将分基础模型、工具链、应用型Agent三赛道,后者机会最大 [12] - Agent将重构生产力曲线,未来按业务成果定价,长尾型公司大量涌现 [12]
GPT-5“让人失望”,AI“撞墙”了吗?
华尔街见闻· 2025-08-17 11:00
核心观点 - OpenAI发布的GPT-5未能达到市场预期,未带来革命性突破,引发用户和投资者失望 [1][3][4] - AI行业竞争格局改变,OpenAI一家独大局面被打破,Google、Anthropic、DeepSeek和xAI等竞争对手已缩小差距 [4] - AI发展重心从追求AGI转向产品化和商业应用,资本市场更关注实际增长而非技术突破 [2][7][8] - "规模定律"面临瓶颈,数据枯竭和算力限制制约大型语言模型发展 [5] - 技术进步放缓引发对"AI寒冬"的担忧,但资本仍在持续涌入AI领域 [6] 技术表现 - GPT-5发布后因技术故障表现"笨拙",用户抱怨其不如前代产品,犯下低级错误如错误标注美国地图 [1][3] - CEO Sam Altman承认发布"坎坷",解释称底层"自动切换器"失灵导致系统调用较弱模型 [3] - 资深用户对其性能和"个性"变化不满,认为基准测试表现平平 [1] - 评估发现GPT-5在不同任务中表现并非明显逊色,但在成本效益和速度方面表现出色 [7] 行业竞争 - OpenAI一家独大局面不复存在,Google、Anthropic、DeepSeek和xAI等竞争对手已缩小前沿开发差距 [4] - 行业竞争焦点从模型能力极限转向更务实、更具成本效益的产品化落地 [2] - AI公司开始派遣"前线部署工程师"入驻客户公司帮助集成模型,显示战略转变 [7] 技术发展瓶颈 - "规模定律"面临两大制约:数据枯竭和算力限制 [5] - AI公司几乎耗尽互联网上所有免费训练数据,正寻求与出版商和版权所有者达成新数据交易 [5] - 训练和运行大型AI模型消耗巨大能源,GPT-5训练动用数十万颗英伟达下一代处理器 [5] - Altman承认底层AI模型仍在进步,但像ChatGPT这样的聊天机器人"不会变得更好了" [5] 资本市场反应 - 尽管技术前景争论不休,AI相关股票和初创公司估值持续飙升 [7] - 英伟达市值攀升至4.4万亿美元接近历史高点,OpenAI投资方软银集团股价过去一个月上涨超过50% [7] - ChatGPT为OpenAI带来年经常性收入达120亿美元 [8] - 今年AI已占全球风险投资总额的33% [6] 未来趋势 - 行业焦点从AGI转向产品化和商业应用创新 [2][7][8] - 纯文本训练的LLM进入回报递减阶段,基于多模态数据的"世界模型"仍有巨大潜力 [7] - 投资者认为当前模型中仍有巨大价值未被挖掘,商业和消费应用开发"刚刚触及皮毛" [8] - 即使无法实现AGI,仍有很多创新机会可创造商业价值 [8]
无伪装谍照曝光:特斯拉Model Y L门店展车已发运;华为与上汽合作首款车型尚界H5将于9月上市丨汽车交通日报
创业邦· 2025-08-16 18:08
特斯拉Model Y L - 全新特斯拉Model Y L已安排媒体看车,无伪装展车正在发运途中,预示加长版车型即将上市 [2] - 多辆无伪装Model Y L整齐排列在运输车上,车身细节清晰可见,上市时间或临近"金秋" [4] 长安深蓝L06 - 长安汽车集团"新央企"首款车型深蓝L06实车图曝光,提供增程和纯电双动力 [4] - 全系标配激光雷达,搭载3nm车规级芯片,计划2023年Q4发布 [4] 蔚来ES8 - 蔚来全新ES8完成中国高端纯电车三代迭代,成为首款实现该里程碑的车型 [6] - 李斌称纯电大三排SUV黄金时代到来,ES8可满足部分MPV需求,展示纯电架构在空间效率、补能网络等优势 [6] - 全新ES8车队完成西藏日喀则至珠峰全程换电,验证补能网络能力 [6] 华为与上汽合作 - 华为与上汽合作首款车型尚界H5将于9月上市,搭载HUAWEI ADS 4辅助驾驶系统 [6] - 具备全域通行、泊车辅助、多重感知功能,提供纯电与增程双动力版本 [6]
Perplexity疯砸345亿抢谷歌;AI Agent接管中小企业生意链条?;AGI的4层突破与3大难关 |混沌AI一周焦点
混沌学园· 2025-08-15 20:07
本周核心趋势 - Perplexity提出345亿美元收购谷歌Chrome浏览器 目标挑战谷歌入口霸权 借舆论杠杆抢占用户心智 [3][12] - 阿里Accio Agent实现中小企业商业流程全链条自动化 覆盖市场调研至销售环节 突破人力瓶颈 [4][13] - 英伟达Cosmos世界模型升级机器人推理与决策能力 Jetson Thor芯片推动零售/医疗等行业智能化重塑 [5][16][17] - 美团NoCode与百度秒哒推动零代码开发革命 软件业转向全民参与 百度秒哒4个月创建20万应用 [6][25][29] AI盛典与行业活动 - 中央广播电视总台《2025中国·AI盛典》展示人机共舞/格斗/合奏等表演 涵盖智元A2/傅利叶GR-2等机器人 [7] - WAIC大会评选10位"年度AI人物" 无问芯穹夏立雪与DeepSeek分获人物与创新应用奖项 [8] - 世界机器人大会汇聚200+企业 宇树G1/京东物流机器人等展示商业化落地成果 [22][24] 企业动态与技术突破 - Perplexity以180亿估值发起345亿Chrome收购 获风投支持承诺保持开源 但交易可行性低 [12] - 英伟达向银河通用交付首批Jetson Thor芯片 加速中国具身智能商业化 已落地100+无人药房 [17] - 百川开源Baichuan-M2-32B医疗模型在HealthBench超越多数开源模型 支持RTX 4090单卡部署 [18][22] - xAI宣布Grok 4永久免费 提供Auto/Expert双模式 直接挑战OpenAI付费模式 [21] 技术演进与商业化 - 商汤林达华提出AGI四层突破框架:感知/认知/推理/行动 需克服数据/算力/泛化挑战 [15][19] - 美团NoCode实现1秒生成200行代码 内部50%新代码由AI生成 推理速度达2000 tokens/s [20][23] - 百度秒哒整合LUI+GUI与多智能体架构 调用100+生态工具 月均增速300%碾压行业 [25][29]
深度|英伟达最新挑战者Cerebras创始人对话谷歌前高管:我们正处于一个无法预测拐点的阶段
Z Potentials· 2025-08-15 11:53
核心观点 - AI芯片公司Cerebras致力于构建全球最快、最大的AI计算硬件,其芯片比已知最大芯片大56倍,专注于加速稀疏线性代数运算以提升AI计算效率[3][8][11] - 行业正经历新一轮半导体、软件和硬件革命,开源生态对初创公司至关重要,Meta和DeepSeek推动OpenAI加入开源模型竞争[6][18][19] - AGI发展受电力供应限制,大型数据中心需1.5吉瓦核电站支持,美国电力基建严重不足[42][45][46] 突破计算极限:Cerebras芯片的创新 - Cerebras的WSE芯片通过整合计算与内存单元,实现比传统芯片快近两个数量级的AI计算速度,特别优化Transformer等模型的矩阵运算[8][11][34] - 芯片设计从底层数学原理出发,专注稀疏线性代数加速,避免专用架构陷阱,在Transformer诞生前已确立技术优势[10][11] - 每token成本以每年10倍速度下降,类比汽车发动机80年演进压缩至5年完成[12][16] 硬件与软件的协同演进 - 硬件需与AI算法协同设计,团队需包含顶尖研究人员预判技术方向,系统级优化涉及I/O结构、提示缓存等工具[11][24] - NVIDIA的CUDA生态形成技术壁垒,但未来五年技术栈可能重构,多种路径并行发展[10][16] - 推理需求呈指数增长,用户日均使用频次从1-2次跃升至20次,驱动计算量爆发[32][33] 全球化竞争与开源战略 - AI竞争呈现中美两极格局,中国通过开源模型在非洲、中亚等地区拓展影响力[18] - 开源使初创公司能以1.5美元/百万token成本对抗封闭模型的100美元定价,推动技术民主化[19] - 智能手机端LLM应用可能改变产业格局,离线场景能力成为新竞争维度[19][20] AGI发展瓶颈与关键指标 - 电力成为核心制约因素,单个数据中心需匹兹堡全市1/3电量(1吉瓦),美国需新建92座核电站满足需求[42][45][46] - 衡量AGI进展的指标尚未标准化,每秒token数反映用户体验,但传统SaaS指标已失效[33][34] - Scaling Law持续生效但拐点未知,强化学习需成千上万倍计算量,行业处于爆发期[28][29][32] AI对齐与安全挑战 - 对齐测试方法在行业共享,但自我改进系统的持续对齐尚未解决,存在信息隐瞒风险[36][37][38] - 安全责任主要由软件和人类团队承担,硬件层作用有限[35][39] - 欧洲可通过国家战略发展主权AI,需培养工程师群体并明确经济优先级[40][41]
没有杀手级AI应用,李彦宏靠什么扳回一城?
36氪· 2025-08-14 09:27
行业技术发展态势 - 大模型技术迭代速度放缓 行业期待已久的GPT-5未能展现超预期代际领先[1][3] - 2025年上半年国内外主要厂商合计发布超过50款AI大模型 模型间技术差距逐步缩小[3] - 计算机视觉 数据标注等成熟技术加速商业化落地 推动AI商业化潜力释放[3] 百度战略转型 - 公司从聚焦技术参数转向强调应用创新与生态建设 公开场合减少技术讨论[2][5] - 发展路线经历三阶段演变:从2023年对标GPT-4的技术竞争 到聚焦应用开发 最终定调"实用主义"路径[11][12][16] - 通过举办AI DAY活动 联合AI创业公司构建"AI新势力"生态圈 重点布局手机可穿戴设备 电商 游戏等赛道[3][6][7] 产品与商业化进展 - 百度智能云业务营收同比增长42% AI相关收入实现三位数同比增速[17] - 萝卜快跑2025年Q1提供超140万次出行服务 同比增长75%[17] - 百度文库AI功能月活接近1亿 百度网盘AI功能月活超8000万[17] - 搜索业务进行10年来最大改版 用AI智能框取代传统搜索框并集成多款AI工具[8] 应用场景拓展 - 推出多模态数字人矩阵 L4级自动驾驶 AI相机 GenFlow超能搭子等具体应用产品[8][9] - 在游戏场景推出可陪聊陪玩的AI伙伴 在消费电子领域推出具备导游 翻译功能的AI眼镜[3] - 为电商商家提供从选品到营销的全场景经营AI助手[3]
腾讯研究院AI速递 20250814
腾讯研究院· 2025-08-14 00:01
一、OpenAI投资脑机接口公司挑战Neuralink - OpenAI及Sam Altman将支持脑机接口新公司Merge Labs,预计估值达8.5亿美元,与Neuralink直接竞争 [1] - Altman参与联合创办Merge Labs但不负责日常管理,实现其2017年人机融合愿景 [1] - Merge Labs处于起步阶段,计划利用AI领域最新进展开发更简单实用的脑机接口技术 [1] 二、Claude Sonnet 4解锁百万上下文 - Claude Sonnet 4支持高达100万Token的上下文窗口,容量是之前的5倍,可处理超过75,000行代码或数十篇研究论文 [2] - 定价调整:200K以内每百万Token输入3美元/输出15美元,超过200K部分每百万Token输入6美元/输出22.5美元 [2] - 功能已在亚马逊Bedrock公测,将登陆Google Cloud Vertex AI,被合作伙伴称为"生产级AI工程"能力 [2] 三、昆仑万维开源Skywork UniPic 2.0 - 开源统一多模态模型Skywork UniPic 2.0,实现理解、生图、编辑一体化框架 [3] - 模型包含三核心模块:生图编辑模块、多模态连接器预训练、Flow-GRPO渐进式双任务强化策略 [3] - UniPic2-SD3.5M-Kontext-2B在生图指标上超越12B参数的Flux.dev,编辑效果优于同参数量竞品 [3] 四、Perplexity拟345亿美元收购Chrome - AI初创公司Perplexity向谷歌发出345亿美元全现金收购Chrome浏览器要约 [4] - 报价是Perplexity自身估值(180亿美元)的两倍,时机选在谷歌面临反垄断诉讼关键节点 [4] - Perplexity承诺维护Chromium开源项目并两年内投资超30亿美元,但谷歌表示无意出售 [4] 五、Pika推出音频驱动表演模型 - 新模型能将静态图片与音频结合生成同步视频,实现精确口型同步和自然表情变化 [5] - 平均仅需6秒生成720p高清视频,长度不限,未来可应用于社交媒体、游戏开发和教育领域 [5] - 目前技术限于iOS端并需邀请码,但带来信息真伪辨别新挑战 [5] 六、Figure人形机器人展示衣物折叠能力 - 在原有物流分拣能力基础上仅增加数据即可掌握叠衣服新技能 [6] - 演示中表现出与人类相似的行为(眼神交流、点头确认等),采用端到端视觉-语言-动作模型控制 [6] - 叠衣服是极具挑战的灵巧操作任务,Figure依靠Helix架构实现无需改变原有架构 [6] 七、DeepMind揭秘Genie 3对AGI意义 - Genie 3不仅能生成虚拟世界,更能让世界真实运转并支持智能体训练 [7] - 已开始将Sima智能体放入Genie 3生成世界测试,实现"AI在另一个AI大脑中运行" [7] - 哈萨比斯认为模型评测是关键,Game Arena将成为重要评测基准 [7] 八、Notion CEO谈AI产品开发理念 - AI时代产品应打造"AI工作空间",将AI从工具转变为提供"工作本身" [8] - AI开发像"酿啤酒"而非"造桥",常只能完成70-80%功能,需大量实验而非传统设计流程 [8] - 成功的AI产品需平衡工艺与实用性,7.5分足够,过度追求完美影响商业价值 [8] 九、OpenAI联合创始人谈AI发展趋势 - AI开发进入"基础研究回归"阶段,算法再次成为决定性瓶颈 [9] - 未来AI基础设施需平衡"长时间重度计算"和"实时响应"两种工作负载 [9] - 预测AI生态将"百花齐放",实现经济"10倍增长"需各领域专家深入思考应用方式 [9]
大模型淘汰赛开启,智谱能笑到最后吗?
36氪· 2025-08-13 20:22
行业竞争格局变化 - DeepSeek爆红后 AI六小虎(智谱 月之暗面 百川智能 MiniMax 阶跃星辰 零一万物)声量下滑 零一万物与百川智能放弃大参数模型转向应用 形成"四小强"竞争格局 [1] - 月之暗面 Minimax和智谱近期更新底座大模型以维持竞争力 智谱GLM-4.5在推理 代码 智能体综合能力达开源模型SOTA水平 [1] - 行业出现整合趋势 零一万物创始人预测国内基座大模型最终仅剩DeepSeek 阿里巴巴 字节跳动三家 投资界认为市场仅容留性能与成本前二至三名的玩家 [10] 智谱技术进展 - 推出GLM-4.5系列6款大参数模型 其中GLM-4.5V为106B总参数视觉推理模型(激活参数12B) 号称全球100B级效果最佳开源视觉推理模型 [1][3] - GLM-4.5实现推理 编码和智能体能力原生融合 在多个评测基准中获全球模型第三 国产模型第一 开源模型第一成绩 [4] - 展示强Agent编程能力 可一分钟生成可运行搜索引擎 构建社交媒体网站及游戏应用 [6] - API调用成本显著降低 输入价格百万tokens仅0.8元 输出为2元 提供50元1万亿token资源包 [7] 融资与资金状况 - 2025年完成五轮融资超30亿元人民币 投资方包括浦东创投集团 张江集团 北京市人工智能产业投资基金 成都高新区 华发集团 杭州城投 上城资本等国资背景机构 [10][11] - 当前估值突破400亿人民币 成国内估值最高大模型创业公司之一 [16] - 2024年行业AI赛道融资额同比下降14.2% 大模型技术层融资金额92.98亿元 不足AIGC赛道三分之一 [12] - 2024年公司收入约3亿元 亏损约20亿元 模型预训练年成本超2亿美元 [14] 商业化挑战 - 主要收入来源为B端私有化部署服务(API调用 MaaS平台 行业定制) 但交付周期长 规模复制性差 且受DeepSeek等竞争对手挤压 [16][18] - C端APP"清言"2025年3月月活1043万 居AI产品榜第10 远低于豆包(9736万) DeepSeek(7701万) Kimi(2649万) [19][20] - 2024年商业化收入实现100%以上增长 MaaS平台API年收入增超30倍 但仍未盈利 [16] - C端市场面临用户付费意愿有限问题 需依靠烧钱投流换取增长 [19] 战略布局与风险 - 正式启动A股与港股IPO进程 由中金公司辅导 计划2025年10月完成辅导 动机包括现金流压力 一级市场估值已达440亿元 以及IPO审核趋严背景 [14] - 发力Agent产品线 推出个人端AutoGLM沉思Agent与企业级CoCo Agent 但面临技术限制(如报告仅支持文本输出)及百度 字节等大厂竞争 [21] - 2024年起多名核心管理层离职 包括首席战略官 副总裁等6名高管 人才流失对公司稳定性与创新性构成挑战 [23]