GenFlow 2.0

搜索文档
数字经济双周报:人形机器人技术验证与规模量产双提速-20250828
银河证券· 2025-08-28 18:09
核心观点 - 全球首届人形机器人运动会成功举办 标志着人形机器人技术从实验室走向产业级应用 运动可靠性显著提升且产业场景落地加速 [1] - 人形机器人被视为继计算机、智能手机和新能源汽车后的颠覆性产品 需实现感知-决策-执行闭环 并依赖本体硬件与智能体技术的协同突破 [1][9] - 行业处于高速扩张阶段 全球人形机器人本体企业数量已超300家 其中中国企业超过150家 竞争格局急剧分化 初创企业占比42% 跨界企业占比11% [15] - 2025年以来人形机器人指数表现优于科创50、创业板指及沪深300等主要指数 成为泛科技赛道重要投资方向 [11][12] 本周焦点:人形机器人运动会 - 全球首个人形机器人运动会于8月14-17日在北京举办 吸引16个国家280支队伍及500余台机器人参赛 涵盖竞技赛、表演赛和场景赛三类项目 [5] - 天工Ultra实现全程无遥控、零人工干预完赛 100米决赛以21.50秒夺冠 宇树科技H1与清华大学等队伍在田径、足球项目中摘得冠军 [1][6] - 赛事展现出机器人决策系统代际跃升 通过视觉感知与环境感知自主完成比赛 标志产业从特殊应用走向广泛应用 [6][7] 中国数字经济动态 - 8月各地密集出台AI专项政策:河南设立30亿元人工智能产业基金 安徽发布AI政策2.0版 济南成立产业联盟整合30余家企业机构 上海聚焦AI+制造 [3][18] - 数据要素改革加速:江苏将数据要素市场化纳入数字经济创新重点任务 北京发布公共数据资源开发20条举措 重庆重组设立数字重庆大数据集团 [19] - 数字人民币跨境试点深化:广州扩大数字人民币在跨境贸易场景应用 广西探索离岸数字人民币存贷款创新 旨在提升人民币国际化路径 [20] - 算力基础设施突破:苏州投用8000P算力中心 总投资超20亿元 为长三角AI产业提供底层支撑 降低企业创新成本 [21] - 区域技术落地协同:河北推动北斗与5G/AI融合 浙江发布AI+医疗三年行动计划 四川落地科大讯飞机器人超脑平台应用分中心 [22] 美国科技与市场动态 - 英伟达以H20芯片销售收入15%上缴为条件获对华出口许可 但因安全疑虑被中国网信办约谈 国内企业暂不贸然采购 [3][23] - 英伟达停产H20并为中国市场开发基于Blackwell架构的新芯片B30A 性能优于H20 但安全风险未解决前在华市场仍受阻 [3][24][25] - Anthropic以每机构1美元象征性价格向美联邦政府提供Claude AI服务 并推进100亿美元融资 由Iconiq Capital领投 [26][27] - 谷歌宣布未来两年在俄克拉荷马州追加90亿美元投资云计算与AI基础设施 并与Meta达成超100亿美元云计算合作 [28] - Perplexity AI向Alphabet提交345亿美元全现金收购Chrome浏览器要约 拟获取超30亿用户入口强化AI搜索布局 [29] - Vantage Data Centers斥资超250亿美元在得州建设1.4吉瓦数据中心园区 满足AI算力需求并提供5000个就业岗位 [30] - 机器人公司Field AI完成4.05亿美元融资 估值达20亿美元 投资方包括英伟达NVentures和Bezos Expeditions [31][32] 欧洲贸易与技术进展 - 美欧达成贸易协定框架 承诺取消电子传输关税 支持数字产品零关税永久化 欧盟放弃征收网络使用费以消除数字贸易壁垒 [3][33] - 欧盟正式启动PIXEurope光子芯片项目 总投资400亿欧元 联合11国20个合作伙伴 加速光子芯片在计算与通信领域应用 [35] 其他国家AI投资 - 印度获Kyndryl公司22.5亿美元AI投资 用于技术基础设施现代化和人才发展 计划在班加罗尔建立AI创新实验室 [38] - 新加坡Circles与OpenAI合作开发AI原生电信平台 结合运营商专长与AI模型变革客户体验和运营效率 [36][37] 技术前沿突破 - DeepSeek发布V3.1模型 采用UE8M0 FP8数值精度格式 针对下一代国产芯片设计 支持128K tokens上下文窗口 构建模型-芯片-系统-应用全栈国产化生态 [39] - 昆仑万维开源Matrix-Game 2.0和Matrix-3D世界模型 实现高帧率实时交互和单图建3D空间 对标DeepMind Genie 3 [40] - 智元推出开源机器人世界模型平台Genie Envisioner 整合视觉-决策-执行闭环 腾讯混元3D世界模型1.0Lite版将显存需求从26GB降至17GB 推理速度提升3倍 [41] - 百度发布GenFlow 2.0智能体 可并行调度超100个专家智能体 3分钟内完成5项复杂任务 生成速度达主流产品10倍 [43] 智库观点与企业转型 - Adobe报告显示65%高管将AI列为2025年增长首要驱动力 53%企业使用生成式AI后团队效率显著提升 50%实现内容生产提速 [44] - 71%消费者期待品牌预判需求并提供个性化服务 但仅34%企业能有效满足 数据安全信任缺口制约个性化服务推进 [45] - 企业竞争焦点从是否采用AI转向如何规模化落地并创造持续价值 未来赢家需具备数据基础扎实、人机协同高效及组织协同顺畅三大特征 [3][45]
腾讯研究院AI速递 20250819
腾讯研究院· 2025-08-19 00:01
Meta首款带显示AI眼镜 - Meta将于9月发布首款带显示屏的智能眼镜,价格定为800美元起,低于此前预期的1000美元以上 [1] - 该眼镜代号Hypernova,配备小型单目抬头显示(HUD)和sEMG神经腕带,可通过手指手势控制 [1] - 眼镜可显示时间、天气、通知,框架和预览照片,提供转弯导航和实时字幕翻译功能,重量约70克 [1] AI游戏伙伴 - "逗逗AI"是一款专注游戏陪玩的AI产品,拥有庞大的游戏知识库,能实时读取游戏画面并提供攻略和情感陪伴 [2] - 平台提供丰富的角色选择,包括官方原创角色和知名UP主形象,支持游戏间的长期记忆和良好的上下文理解能力 [2] - 其月卡订阅模式提供无限通话时长和长期记忆功能,目前支持《黑神话:悟空》、《原神》、《星露谷物语》等多款游戏 [2] AI游戏《Whisper from the Stars》 - 蔡浩宇的AI游戏《Whisper from the Stars》完整版正式上线,售价27元,玩家可通过语音或文字与AI角色Stella进行全英文交流 [3] - 游戏通过对话推进剧情,主角Stella为一名天体物理学生,在星际调研中遇险,玩家需要与其对话帮助她解决困境 [3] - 游戏AI响应能力佳,记忆持久,但随着游戏深入,聊天负担增加,节奏偏慢,缺乏明确目标导向 [3] 西班牙AI独角兽微型AI模型 - 西班牙公司Multiverse Computing发布两款极小体积的高性能AI模型:"超级苍蝇"(9400万参数)和"鸡脑"(32亿参数),采用量子压缩技术 [4] - 这些微型模型可在智能手机、手表和物联网设备上本地运行,实现离线功能、提升隐私保护、降低延迟和运营成本 [4] - 公司由物理学家罗曼·奥鲁斯创立,基于量子计算技术开发了名为CompactifAI的模型压缩技术,已获1.89亿欧元融资 [4] 百度文库通用智能体GenFlow 2.0 - 百度文库与百度网盘发布全球首个全端通用智能体GenFlow 2.0,支持100+专家智能体同时工作,3分钟并行完成5项以上复杂任务 [5] - 系统自主识别简单对话与复杂任务,提供分钟级并行工作和交付,生成速度超主流同类产品10倍 [5] - GenFlow 2.0兼容MCP协议,可连接百度文库14亿专业文档、百度学术6.8亿文献库,还能在用户授权后调用网盘文件 [6] 世界人形机器人运动会 - 首届世界人形机器人运动会在北京闭幕,来自16个国家的280支队伍、500余台人形机器人参赛,比赛包括田径、足球、武术和场景挑战赛 [7] - 宇树科技H1机器人获1500米、400米和4×100米接力三项冠军,北京天工队的"具身天工Ultra"机器人以21.5秒成绩获100米冠军 [7] - 赛事创新设置场景赛单元,测试机器人在工业、医药、酒店和仓储场景的实际应用能力 [7] 鸿蒙操作系统 - 华为常务董事余承东宣布单框架鸿蒙5.0设备突破1000万,称已过"生死线",每年研发投入超万人,总投入数百亿,开发1.3亿行代码 [8] - 回应"安卓套壳"质疑,表示鸿蒙5.0以前为双框架支持安卓应用,5.0及以后所有应用都是重新开发 [8] - 余承东期望鸿蒙与中国应用一起出海,预计未来操作系统"三分天下,其一必有鸿蒙" [8] AI控制与伦理 - "AI教父"Hinton在Ai4 2025大会上警告AGI可能在几年内到来,认为人类试图控制AI终将徒劳 [9] - Hinton提出AI将很快演化出自我存续和获取更多控制权两个子目标,并建议在AI中建立"母性本能" [9] - 李飞飞则持相反立场,呼吁打造"以人为本的人工智能",维护人类尊严与自主权 [9] AI时代设计师指南 - 创造而非画图:杰出设计师不仅交付效果图,还亲手打磨可运行产品,将蓝图变为现实 [10] - 敏捷迭代学习、构建而非堆砌、洞悉技术脉络是适应AI时代的必备能力 [10] - 人性是永恒优势:设计关乎共情和对微妙情境的洞察,顶尖设计师懂得将人性温度注入冰冷算法 [10] 小模型Agent研究 - 英伟达最新研究表明小模型在Agent任务中优于大模型,以更低资源消耗、更经济灵活的方式完成任务 [12] - 小模型通过针对GPU资源优化和任务定制部署两大方面实现"四两拨千斤",降低10-30倍推理成本 [12] - 小模型可快速适配新需求,在边缘计算中部署更便捷 [12]
GenFlow 2.0:将AI从“工具”晋升为“伙伴”!
硬AI· 2025-08-01 17:03
核心观点 - GenFlow 2.0通过「单入口、全智能、可并行、能干预、长记忆」重塑AI人机共创范式,从工具升级为"数字同事"[1][11][49] - 产品突破传统"指令-响应"模式,实现并行任务处理、实时干预和长期记忆三大核心能力[18][19][22] - 在旅行规划、营销创意、财报分析等场景展示显著效率提升,如10分钟生成完整营销素材包[30][31] - 未来可能发展主动交互能力,基于用户习惯推送建议,构建开放生态平台[44][45] 产品特性 并行处理 - 可同时执行多条任务流,如同步生成报告大纲、分析内容和PPT框架[3][5] - 图片生成支持多进度条并行渲染,9张主题图片同时产出[31] - 相比串行模式效率提升显著,解决传统AI工具等待焦虑[19] 实时干预 - 用户可随时打断任务流补充指令,如新增分析章节或插入最新数据[9][10] - 支持中途修改生成内容,如调整海报风格只需简单语音指令[31] - 解决70%-80%用户因输出不可编辑而弃用的痛点[20] 长期记忆 - 记忆跨度达数月,可追溯文库/网盘历史记录及个人文档[22] - 保留用户工作偏好,使每次交互保持连续性而非离散问答[22] - 能调用授权私有文件辅助分析,如直接解读上传的财报PDF[38] 应用场景 商业分析 - 30分钟内完成蔚来/理想/小米的竞品分析报告及PPT[3] - 深度解析微软/亚马逊季报,结构化输出关键指标对比[36][40] - 直接处理私有文档,准确提取PDF中的财务数据[38] 营销创意 - 10分钟产出包含文案、九宫格图片、海报的完整素材包[30] - 同步启动多模态创作Agent,保持IP形象一致性[31] - 支持实时风格调整,如将背景改为赛博朋克风[31] 生活助理 - 智能整合景点/展会信息生成五日游路线[27] - 提供"迪士尼早享卡"等本地化实用建议[27] - 自动关联交通APP下载等细节方案[27] 技术架构 - 集成百度文库高质量文档作为独特数据源[6][8] - 基于沧舟OS内容操作系统构建开放生态[45] - 单入口设计自动判断意图,无需手动选择模式[24] 行业影响 - 推动AI Agent从执行工具向协作伙伴转型[12][14] - 可能重构知识工作价值链分配方式[45] - 未来或发展为连接各类数字劳动力的平台级产品[45]
三天,我看清楚了未来AI将如何介入我们的生活
36氪· 2025-08-01 07:23
大会概况 - 2025年世界人工智能大会(WAIC)在上海举办 为期3天 吸引70多个国家和地区1500多位专家及800多家企业参与 展览面积首次突破7万平方米 参观人数预计达35万[1] - 海外厂商参与度较低 除谷歌和特斯拉外缺乏国际巨头 同时由于与世界机器人大赛(WRC)时间冲突 部分厂商选择保留重磅新品[1] 生成式AI应用拓展 - 生成式AI渗透至工业 医疗 交通等硬核领域 从文本 图像生成向多模态任务执行演进[3][4] - 阶跃星辰发布3210亿参数MoE架构模型Step 3 激活参数38亿 实现多模态推理并在国产芯片上提升解码效率[4] - MiniMax推出全栈智能体MiniMax Agent 可分解任务并调用API 演示中单句指令生成数据看板或搭建电商网站 一个月内迭代12次[4] - 合合信息展示AI鉴伪技术 毫秒级识别深度伪造 适用于金融票据篡改等高危场景[5] - 百度推出GenFlow 2.0多智能体调度系统及秒哒平台 3分钟生成可运行应用 数字人Nova升级版提升直播场景拟真度[5] - 声网发布对话式AI引擎 新增声纹识别与视觉理解能力 互动宠物"芙崽"实现嘈杂环境语音响应及拟人化反馈[7] - 阿里云发布云端AI Agents平台无影AgentBay 支持多系统无缝切换 三行代码接入 同时展示从芯片到平台的全栈能力[8] 算力基础设施升级 - 国产GPU厂商集中展示芯片架构与智算方案 竞争焦点从单卡性能转向全链路效率与成本优化[9][14] - 华为昇腾AI云服务采用CloudMatrix 384超节点 整合384颗NPU与192颗CPU 算力达300 PFlops 突破跨机通信瓶颈[9][11] - 沐曦科技发布曦云C600 GPU 支持多精度混合算力 内置安全模块瞄准金融政务场景[11] - 摩尔线程推出全功能GPU产品线 覆盖云端训练卡MTT S4000(48GB显存/768GB/s带宽) 云渲染卡及消费级显卡[12] - 燧原科技展示燧原S60推理卡商业化应用 覆盖聊天机器人 广告投放等场景 并公布多地智算中心部署案例[14] 具身智能突破 - 机器人运动控制与交互能力显著提升 从基础行走扩展到复杂任务执行与情绪表达[3][15][21] - 千寻智能人形机器人Moz1搭载Spirit v1 VLA模型 完成太空步 S型压弯等高难度动作 并演示饮料递送 衣物折叠等泛化任务[15] - 傅利叶智能交互陪伴机器人GR-3结合康养场景 提供导诊 认知康复等多维服务 外骨骼设备实现远程康复协同[16] - 智元机器人灵犀X2-N实现双足与轮式模式切换 在开幕式中完成灯光表演[18] - 优艾智合工业模型MAIC实现多机器人协同调度 完成搬运 拣选等流水线作业[18] - 宇树科技人形机器人G1(29关节/35公斤)展示格斗动作及击倒快速起身 工业四足机器人B2负重120公斤 消费级Go2售价低于1万元[18][20] - 云深处科技四足机器人绝影X30在电力巡检场景实现1000小时无故障运行 支持自主充电及AR手势操控[20] 自动驾驶商业化推进 - Robotaxi开展城市道路体验活动 覆盖浦东30公里路网 延伸至机场与迪士尼区间 实现L4级跨区域接驳[22][24] - 小马智行Robotaxi覆盖北上广深 集成大模型优化乘客交互 支持语音添加临时需求如顺路购咖啡[24] - 斑马智行基于高通8295平台推出端侧智能座舱 支持离线90%功能闭环 并根据驾驶员情绪推荐内容[24] - 蘑菇车联推出城市级交通模型MogoMind 聚合多源数据实现智能调度与拥堵预测[25] - 上海发布自动驾驶行动方案 目标2027年L4载客600万人次 载货80万TEU 开放道路超5000公里[27]
大厂不再重压ChatBot、“六小虎”声量分化、机器人不依赖绳索“吊着”|WAIC观察
财经网· 2025-07-31 11:53
WAIC展会核心观察 - 展会吸引约35万线下观众,800多家展商展示从大模型到机器人零部件的全产业链技术进展 [1] - 大模型应用从ChatBot转向Agent成为行业焦点,Agent市场规模已达50亿美元且年增长率40% [3][4] - 人形机器人实现从"被吊着"到实际场景复刻的跨越,展示娱乐表演/工厂作业/家庭服务三大类应用 [2][10] 大厂Agent布局 - 阿里推出无影AgentBay并展示三款开源大模型,夸克AI眼镜集成Qwen大模型支持导航/支付/比价功能 [3] - 百度GenFlow 2.0 Agent平台支持多智能体协作和主动干预,8月将全量上线 [3] - 蚂蚁数科基于Qwen3推出金融推理大模型Agentar-Fin-R1,联合金融机构推出超百个金融智能体解决方案 [6] 大模型"六小虎"动态 - 百川智能和零一万物未参展,后者战略转向ToB推出万智企业大模型平台2.0 [7] - 阶跃星辰发布Step3大模型并组建"模芯生态联盟",全年营收目标10亿元 [8] - 智谱AI展示AutoGLM模型可自主完成电商操作,月之暗面重点展示K2模型 [8] 人形机器人进展 - 宇树/智元/星动纪元等厂商展示舞蹈/搬运/服务等场景,核心零部件六维力传感器出货量年增2000+台 [10][12] - 蓝点触控六维力传感器占国内70%市场份额,订单排至9月并完成近亿元B轮融资 [12][14] - 非夕科技展示自适应机器人完成蛋雕/按摩等精细操作,结合具身智能大模型实现复杂任务 [11] 基础设施与算力 - 超云展示AI大模型一体机SuperCube R7000,强调高性价比和专业服务 [9] - 大模型一体机市场快速膨胀,超云通过联合生态伙伴打通应用落地"最后一公里" [10] 行业趋势 - 技术展示转向场景演练,AI应用从"技术炫技"进入产品化能力比拼阶段 [14] - 具身智能技术路线尚未收敛,软硬协同和生态组建成为竞争关键变量 [14]
大厂不再重压ChatBot、“六小虎”声量分化、机器人不依赖绳索“吊着”
财经网· 2025-07-30 22:13
展会规模与参与情况 - 2025年WAIC线下观众达35万人次 [1] - 超过800家展商参展 覆盖大模型、具身智能、AI基础设施及机器人核心零部件等领域 [1][2] 大模型厂商动态 - 百度、阿里、蚂蚁、腾讯等大厂重点展示AI应用 Agent成为竞争焦点 [1][3][6] - 大模型"六小虎"出现分化:百川智能和零一万物未参展 月之暗面与智谱展台规模缩减 阶跃星辰联合芯片厂商组建生态联盟并设10亿元年营收目标 [1][7][8] - 阿里发布三款开源大模型及Agent平台"无影AgentBay" 百度推出GenFlow 2.0 Agent平台支持多智能体协作 [3][6] - 零一万物战略转向to B 推出万智企业大模型平台2.0版本 [7] 智能体(Agent)技术进展 - 全球AI Agents市场规模突破50亿美元 年增长率达40% [4] - 蜜度推出"校对通"多模态智能体 可处理混合文件包并生成勘误报告 [4] - 蚂蚁数科基于Qwen3推出金融推理大模型Agentar-Fin-R1 联合金融机构推出超百个金融智能体解决方案 [6] - 智谱AutoGLM模型实现自主抢红包、淘宝下单等操作 [8] 人形机器人场景落地 - 机器人应用场景分为娱乐表演、工厂作业和家庭服务三大类 实现敲锣打鼓、搬箱子、叠衣服等实际任务 [2][10][11] - 宇树机器人设擂台表演 智元机器人展示跳舞送水等技能 数字华夏机器人表演《夜上海》 [10] - 非夕科技自适应机器人完成蛋雕、按摩、穿关东煮等精细操作 千寻智能机器人Moz1实现递送饮料及走珠任务 [11][12] - 星动纪元、擎朗科技、傅利叶等公司分别展示街舞、食品制作及互动功能 [11] 核心零部件与供应链 - 蓝点触控六维力传感器占国内人形机器人市场70%份额 订单排至9月 2024年工业机器人出货量超4万台 [12] - 传感器研发周期从2-3个月压缩至2-4周 公司完成近亿元B轮融资 计划2028年具备IPO条件 [12][13][14] 算力与基础设施 - 超云展示AI大模型一体机SuperCube R7000等产品 强调高性价比和专业服务 [8][9][10] - 大模型一体机市场快速膨胀 超云通过联合生态伙伴打造解决方案 [10] 技术趋势转变 - 行业从"技术炫技"转向"场景演练" ChatBot隐身 Agent成为主战场 [14] - 多模态、推理能力和低成本成为用户核心需求 [1]
“不是工具,是搭子”:GenFlow 2.0将让AI进入交付时代
财经网· 2025-07-30 17:16
核心观点 - 百度在WAIC推出GenFlow 2.0通用Agent平台 具备多智能体协作 多模态内容生成和全链路编辑能力 代表行业从ChatBot向Agent的转型趋势 [1][2][12] - 该平台通过六大模式(包括首创记忆模式和并行模式)实现复杂任务落地 显著提升人机协同效率和任务交付速度 [3][8][9] - 技术底座依赖百度自研的"沧舟OS"和MoE架构 支持全模态输入输出及多Agent调度 在成本 性能和编辑灵活性上超越同类产品 [11][12] 产品特性 - 支持"一个入口 N种模式" 根据用户需求自动切换模式 涵盖简单模式 通用模式 记忆模式 并行模式等 [1][3][8] - 并行模式通过多Agent同步执行任务(如A Agent B Agent C Agent并行) 5分钟内完成包含PPT 图表 海报的复杂资料生成 [9] - 记忆模式可调用用户历史交互数据和网盘素材库 使内容生成更贴合个人习惯 例如根据过往查询推荐演唱会信息 [8] 技术架构 - 底层依托"沧舟OS"内容操作系统 实现全场景数据互通和Agent智能调度 支持文字 语音 图片 视频全模态处理 [11][12] - 采用MoE(混合专家模型)架构 按任务步骤调用不同模型 在交付速度和质量上优于行业同类产品 [11] - 融合百度文库与网盘的自研编辑器 支持生成后内容自由编辑 而ChatGPT Agent无法实现此功能 [9] 行业地位与战略 - 百度从2024年4月起将智能体视为核心战略方向 类比"PC时代的网站" 并通过WAIC展示GenFlow 2.0强化布局 [12] - 产品能力通过MCP Server开放给华为 三星等企业 推动生态合作 [12] - 当前行业多数Agent无法实现并行调度多Agent 多模态内容同步生成及后链路编辑 百度在此领域具领先性 [1][9]