Workflow
通用智能体
icon
搜索文档
百度文库网盘发布GenFlow3.0 成全球最大通用智能体
证券时报网· 2025-11-13 16:27
人民财讯11月13日电,11月13日,百度文库、百度网盘正式发布GenFlow3.0,活跃用户超2000万,成 为"全球最大通用智能体"。目前,GenFlow3.0已在文库、网盘全端正式上线,帮助用户在工作、学习、 生活中成为"超级个体"。 ...
奢侈科技品牌BUTTONS与特斯联合作,发布首款搭载HALI智能体的影音机器人|最前线
36氪· 2025-10-20 18:29
产品发布 - 全球奢侈科技品牌BUTTONS推出首款搭载特斯联通用智能体HALI的硬件设备BUTTONS SOLEMATE智能体超级影音机器人 [1] - 通用智能体HALI于2024年11月14日发布 经迭代已从高度拟人化智能体演进为具备空间认知与物理交互能力的生活协同者 [1] 通用智能体HALI技术特性 - HALI构建了与物理环境深度绑定的三维语义记忆模型 将信息记忆关联于空间坐标与环境上下文 提高信息调用直观性与准确性并使AI能运用世界模型进行推理 [3] - HALI作为用户交互智能中枢 能实时感知并处理用户请求 以用户位置行为意图及环境状态作为交互第一语境 实现服务找人的主动转变 [3] - HALI运作流程为先通过端侧模型解析用户意图拆解任务 在时空连续体中对资源设备及行为进行最优编排 再借助端侧芯片完成数据预处理与加密 最终联动云端调度多个垂域智能体实现复杂功能 [3] 云端算力与平台支持 - 特斯联徐州AIoT智算中心的GPU服务器集群负责执行大规模协同计算 AIoT智算云平台上的混合智算引擎支撑任务动态调度 [4] - 特斯联云端大模型承担路径规划确保设备避开障碍 视觉语言模型负责识别目标 大语言模型生成执行策略并回传 最终由智能体落地决策与响应 [4] - 基于特斯联徐州智算中心庞大异构算力储备 可将复杂流程在数秒间完成 AIoT智算云平台构建了统一抽象层和端到端工具链 使模型无缝运行在异构算力上并大幅提升推理及训练效率 [6] 行业趋势与战略方向 - 公司指出专用AI Agents能力局限于专业领域 缺乏跨领域迁移学习能力 主要在数字世界中运行而没有空间感知或与物理世界的直接交互 [6] - AI向通用性演进的关键在于突破数字世界壁垒 获得在物理环境中感知-推理-行动的完整能力闭环 真正的通用智能体必须能感知三维环境 推理空间关系及物理定律 并安全有效地执行任务影响现实世界 [6]
BUTTONS SOLEMATE发布 特斯联构建新“智能体生态”
中证网· 2025-10-19 15:03
公司产品发布与升级 - 公司发布首款搭载特斯联通用智能体HALI的“BUTTONS SOLEMATE 智能体超级影音机器人” [1] - 此举推动公司自研智能体HALI全面进化,构建新的“智能体生态”,完成从智能产品到沉浸式智能体验的升级 [1] - HALI自2024年11月14日首次亮相后持续迭代,已从高度拟人化的智能体演进为具备空间认知与物理交互能力的“生活协同者”和应用于物理世界的通用Agent产品 [1] 产品技术能力与特性 - HALI能实时感知和处理用户请求,通过端侧模型解析意图、拆解任务,并利用端侧芯片预处理与加密数据,云端调度多个垂域智能体共同完成复杂功能 [1] - 借助公司云端大模型,BUTTONS SOLEMATE可实现空间避障导航、视觉目标识别、智能策略生成与执行响应的一体化功能 [1] - 得益于公司徐州智算中心庞大的异构算力储备,看似复杂的流程可以在数秒间完成 [1] 行业技术趋势与平台能力 - 为应对异构芯片融合计算挑战,公司AIoT智算云平台在模型与硬件间构建了基于多架构芯片算子库的统一抽象层,并提供兼容多种推理及训练框架的端到端工具链 [2] - 该平台使模型得以无缝运行在异构算力之上,并实现推理及训练效率的大幅提升 [2] - 行业观点认为,AI向通用性演进的关键一步在于突破数字世界壁垒,获得在物理环境中“感知-推理-行动”的完整能力闭环 [2] - 真正的通用智能体必须能够感知三维环境的几何结构与动态变化,推理物体之间的空间关系、物理定律及动作的因果链条,并最终安全有效地执行任务以影响现实世界 [2]
微软全面升级Windows 11,语音成为核心交互方式
36氪· 2025-10-17 17:39
战略定位与核心愿景 - 公司宣布其战略重点从单纯追求个人电脑处理性能转向打造智能化的对话式交互体验,旨在让每一台Windows 11设备都成为新范式的载体[2] - 此次重大升级标志着公司的一项战略赌注,即通过全面升级Copilot功能,使人机交互体验更自然,AI表现更聪明[2] - 公司执行副总裁表示,其目标是让用户拥有的个人电脑不仅仅是一个工具,而是真正值得信赖的助手和伙伴[16] 语音交互功能升级 - 公司正全力推动语音成为继键盘、鼠标之后的核心个人电脑交互方式,全面开放“Hey, Copilot”语音唤醒功能,用户无需点击图标即可通过语音开启对话[3] - 系统会以麦克风图标和提示音回应,确认处于聆听状态,结束对话可通过说“再见”或直接停止说话实现,此举旨在消除传统语音助手的使用门槛[3] - 公司内部数据显示,使用语音与Copilot交互的频率是纯文本输入的两倍[3] 视觉识别与上下文理解能力 - 公司全球上线Copilot Vision功能,使AI首次具备真正的视觉能力,能够实时分析和理解用户屏幕上的内容,并在任何应用程序中提供精准的上下文帮助[6] - 该功能的应用范围已从早期的单一程序支持扩展为“桌面共享”模式,可以识别并理解用户跨多个应用程序窗口的完整操作流程[7] - 其工作原理是当用户共享桌面或特定窗口时,Copilot能看到用户所看到的一切并实时讨论内容,应用场景包括为创意项目提供建议、帮助优化简历、指导游戏技巧等[8] - 该功能采取了谨慎的隐私保护策略,默认关闭,用户需要在每个会话中主动点击独特的“眼镜”图标授权才能启动屏幕共享[6] 本地任务执行与智能体演进 - 公司推出预览阶段的Copilot Actions功能,标志着AI从被动的“助手”向主动的“智能体”演进,首次能够在用户个人电脑上直接执行多步骤操作任务[4][10] - 该功能让Copilot具备实际操作能力,如打开应用、输入文字、滚动页面,用户只需用日常语言描述需求,智能体就会尝试通过与桌面和网络应用的交互来完成任务[10] - 用户在智能体后台工作时可继续专注于其他事务,并始终掌握控制权,可随时查看任务进度、审查具体操作或中断任务[12] - 需要注意的是,Vision功能目前仅具备“观察”和“建议”的能力,无法直接代表用户操作系统,执行操作由专门的Copilot Actions负责[9] 游戏娱乐体验整合 - 公司探索AI如何融入娱乐体验,例如在手持游戏设备领域,将便携游戏与人工智能助手技术融合[13] - 在如ROG Ally等设备上,用户长按“库”按钮即可唤出Gaming Copilot,它能在游戏过程中实时提供攻略推荐、操作技巧与场景解读,而玩家无需退出游戏或切换屏幕[15] - 该体验还能够快速访问来自Xbox、PC Game Pass及其他主流游戏商店的内容[15] 生态系统整合 - 公司通过Copilot连接器整合Gmail等第三方服务,以扩展其生态系统[2]
外滩大会一线投资人热议Agent投资路径:通用与垂类智能体的路径权衡
环球网· 2025-09-13 10:43
行业技术发展现状 - 技术正从大模型向多模态、AI Agent与具身智能跃迁 产业处于技术奇点与商业爆发交汇口 [1] - 智能体在金融、医疗、教育等垂直领域快速渗透 下一代智能硬件竞争焦点为"会做事、总在场、有记忆、能进化" [1] - 世界模型建立将推动智能体从数字世界走向物理世界 实现自主学习甚至与人类共同发现新物理规律 [1] 智能体发展前景与挑战 - 高容忍度场景(如线下中介、情感陪伴)将优先落地 但需要精确数据闭环的场景仍需发展过程 [3] - 金融场景容错率极低 市场对交付完成度要求越来越高 [4] - 需平衡时效性、准确性和成本 构建用户安全感 并与全球监管机构互动 [4] 中国AI应用竞争力 - 中国AI应用走在国际前列 多个全球"首个智能体"来自中国 [3] - 中国过去20年在互联网、移动互联网积累了大量产品经理能力 技术跟进速度快 [3] - 预计未来全球最顶尖的智能体中三分之二将来自中国创业团队 [3] 投资策略与方向选择 - 智能体公司估值尚未锚定 商业化处于早期阶段 [5] - 通用智能体天花板更高但投资风险更大 垂直智能体超额回报想象空间有限 [5] - 蚂蚁集团投资以垂类智能体为主 选择标准为市场空间大、付费意愿强、能构建护城河 [7] - 需持续关注算力等底层基础设施 Token消耗及能源支撑是必须解决的问题 [7] 创业与竞争策略 - 智能体创业需避开大模型能力迭代主赛道 避免被大模型公司版本升级冲击 [7] - 应基于能力定义具体服务领域(如Replay在编程领域的实践) [7] - 建议采用"哑铃策略"投资:一方面投资与复杂工作流紧密结合的To B应用 另一方面投资高风险高天花板的通用方向 [7] - AI时代产品增长靠创新而非流量 应优先构建产品再随模型能力提升 追求认知领先与极致执行 [4] - 新一代Agent产品应具备"天生全球化"特性 [4]
姚顺雨离职OpenAI,开启下半场
量子位· 2025-09-12 08:59
姚顺雨职业动态 - 姚顺雨已从OpenAI离职 但尚未官宣下一步去向 [2][3] - 传闻其可能加盟中国科技巨头或选择个人创业 但均未获证实 [2][53] - 有爆料称其以上亿薪资入职腾讯 但已被腾讯官方辟谣 [53] 教育背景与早期成就 - 合肥一中毕业 高考704分位列安徽省第三 进入清华姚班主修计算机科学 [4][10] - 曾获全国信息学奥林匹克竞赛(NOI)银牌(495分) [10] - 普林斯顿大学计算机博士 研究方向为自然语言处理与强化学习 [4][22] 学术研究与技术贡献 - 提出思维树(Tree of Thoughts)方法 显著提升大语言模型复杂问题解决能力 [6][39] - 开发SWE-bench评估数据集和SWE-agent开源AI程序员工具 [6][34] - 创建ReAct框架 使语言模型在交互中同步进行推理与行动 在AlFWorld任务中成功率提升至71% [36][38] - 构建WebShop模拟电商环境 验证语言智能体在真实任务中的泛化能力 [31] - 累计学术引用15253次 h指数24 i10指数29 [42] 行业观点与职业转向 - 提出AI发展进入"下半场" 重点从模型构建转向现实任务定义与评估 [46][47] - 强调语言作为实现AI泛化的核心媒介 其研究聚焦通用智能体开发 [28][30][41] - 职业规划从学术研究转向产品与商业应用 曾表达创建万亿美金级Agent公司的意向 [50][51]
“专家团”齐上阵,全球首个全端通用智能体发布
北京日报客户端· 2025-08-19 08:45
产品发布与升级 - 百度文库联合百度网盘发布全球首个全端通用智能体GenFlow2 0 支持超100个专家智能体同时干活 3分钟并行完成超5项复杂任务 [1] - GenFlow2 0重点解决通用Agent描述难、等待久、交付差、不可编辑等难题 可自主理解用户意图并规划执行 自动切换不同协作模式 [1] - GenFlow2 0支持用户在任务过程随时干预 包括暂停、追问、修改思考内容 记忆可追溯 [1] - 相比1 0版本 GenFlow2 0通过分析用户历史沟通记录和文件操作 提供更个性化内容结果 [2] 技术突破与行业趋势 - 多智能体协作成为科技企业竞逐热点 需解决任务分配、参数传递、上下文管理等关键问题 [2] - 360集团近期上线纳米AI多智能体蜂群 实现智能体从单兵作战到群体协同的进化 [2] - 目前GenFlow2 0已在百度文库网页端和APP端全面上线 无需排队或邀请码 [2]
面对AI业务的困境,苹果选择了吃“回头草”
36氪· 2025-08-07 19:51
苹果AI战略调整 - 公司低调成立新内部团队AKI 旨在开发类似ChatGPT的AI聊天机器人 由前Siri开发主管罗比·沃克领导[3] - 软件工程主管克雷格·费德里吉成为苹果AI团队新负责人 原Siri主管被边缘化 公司可能采取内部赛马机制并行开发个性化Siri与AKI项目[3] - 公司2023年曾否认开发聊天机器人 但在Apple Intelligence表现平淡及个性化Siri延迟后重新对聊天机器人产生兴趣[1] 股价表现与市场压力 - 2025年以来公司股价下跌约16% 在"美股七姐妹"中表现仅优于特斯拉[5] - 尽管iPhone、Mac和服务等核心业务线均实现超预期增长 华尔街分析师认为AI竞赛失利是股价下跌原因之一[6] - CEO库克在8月1日员工会议上强调AI革命重要性 将其与互联网、智能手机、云计算和应用程序并列称为"转折点" 承认公司起步较晚但强调历史上有后来居上先例[6] 人才流失与技术挑战 - 基础模型团队AFM负责人庞若鸣以2亿美元身价转投Meta 团队中杰出工程师马克·李、汤姆·冈特及多模态专家张博文也陆续加盟Meta[6] - AI研究人员身价被抬高至媲美体育明星 因AI开发高度依赖天才研究人员 关键人员流失对Apple Intelligence基础模型构成重大挑战[8] - 个性化Siri开发面临技术难题 因其作为通用智能体需调用iPhone多项功能 对技术实力和工程能力要求极高 而公司追求产品稳定性的调性导致项目延期[10][12] 产品战略转向 - AI聊天机器人开发难度相对较低 文生文本是大语言模型基础能力 使用场景单一化降低系统性风险[12] - 只要基础模型能力不被ChatGPT、Gemini大幅领先 公司AI聊天机器人有望提供合格体验[12] - AKI团队被视为应急产物 旨在应对友商端侧AI竞争压力 避免忠实用户失望[12]
沙龙| 未可知 x 杭州滨江: "科学家+企业家"AI+应用发展沙龙, 共话AI产业新未来
AI产业应用发展沙龙 - 活动由杭州市滨江区委相关部门及协会举办,旨在搭建"科学家+企业家"跨界交流平台,推动AI技术与产业应用深度结合 [1] - 未可知人工智能研究院副院长张孜铭受邀发表主题演讲,并获聘为滨江区智库专家,体现官方对其研究能力的认可 [3][5] AI投资趋势分析 - 演讲主题聚焦《AI投资下半场:技术、赛道与商业化》,剖析全球AI产业发展趋势 [3] - 指出中国AI产业面临融资约束与算力瓶颈等关键挑战 [3] - 深度求索(DeepSeek)等创新企业正在改变产业格局 [3] 2025年AI细分赛道前瞻 - 通用智能体、具身智能与人形机器人被列为重点发展方向 [5] - 分析为企业家和投资人提供了商业化路径思考 [5] 未可知人工智能研究院定位 - 研究领域聚焦AI前沿趋势、商业落地与人才发展 [7] - 目标成为"AI时代的认知基础设施" [7] - 合作伙伴涵盖字节跳动、创维、博雅生物等跨领域企业 [10]
“人工智能+”战略提速,AI Agent时代正加速到来
中航证券· 2025-08-03 22:45
投资评级 - 社会服务行业投资评级为"增持",维持评级 [3] 核心观点 - 国家层面全面推进"人工智能+"战略,国务院审议通过《关于深入实施"人工智能+"行动的意见》,明确推动AI在经济社会各领域的规模化、商业化应用,构建创新与应用双轮驱动的发展模式 [2][18] - 国产通用大模型GLM-4.5加速开源商用化,在推理、编码、智能体三大能力维度达国产领先,参数效率与调用成本处于国际前列 [2][18] - OpenAI将于8月发布GPT-5,致力于整合推理与多模态模型,强化全场景执行能力 [2][18] - 政策明确"AI+"发展主线叠加通用大模型技术持续突破,形成政策底+能力底共振格局,AI产业即将进入价值释放窗口期 [2][18] - GLM-4.5的发布标志国产大模型在推理能力、代码生成与智能体交互等核心能力实现跨越式发展,其3550亿总参数、320亿激活参数的MoE架构在国际评测中位居全球开源模型前三 [19] - GLM-4.5高效版本GLM-4.5-Air以远低于竞品的规模实现"参数更小,性能更强"的优化突破,API成本仅0.8元/百万token,大幅降低使用门槛 [19] - 微软Azure因AI服务实现Q2营收同比+39%,365 Copilot月活破亿;Meta广告系统引入AI驱动算法后应用业务FoA同比增长22% [20] - GPT-5将采用后台模型路由系统,结合推理模型与多模态模型能力,逐步实现"大一统智能体"构建 [21] 市场行情回顾 - 社会服务(申万)板块指数周涨跌幅0.10%,在申万一级行业涨跌幅中排名5/31 [5] - 子行业涨跌幅排名:教育(2.74%)、旅游及景区(2.69%)、专业服务(-1.23%)、体育II(-1.31%)、酒店餐饮(-2.72%) [5] - 个股涨跌幅排名前五:西藏旅游(46.42%)、中国高科(18.66%)、安车检测(12.69%)、苏试试验(10.42%)、学大教育(6.83%) [5] - 个股涨跌幅排名后五:兰生股份(-9.99%)、大连圣亚(-9.77%)、实朴检测(-9.12%)、中钢天源(-8.87%)、科锐国际(-5.18%) [5] 投资建议 - 2025年下半年将成为"AI应用落地元年",通用型智能体工具逐步成熟,企业AI助手、自动化工作流与智能内容生成将率先形成高频使用场景 [22] - 重点关注两类投资主线:①大模型开发与AI Agent能力提供商【昆仑万维、科大讯飞】;②AI落地场景应用【焦点科技、奥飞娱乐、值得买、上海电影、恺英网络、中文在线、万兴科技】 [22] 行业新闻动态 - 四川发力银发旅游专列扩容,推出《做优银发旅游列车促进服务消费发展行动方案》,构建多层次产品体系和线路网络 [23] - 免签入境已成为外籍人员来华旅游、商贸主渠道,带动2024年外国游客达2694万人次、同比增96% [24] - 浙江启航"AI产业加速器计划",助力中小企业数智化转型,推出四大举措培育研发大脑、智能工具箱、市场智能助手和制控驾驶舱 [24] - 人社部部署开展专业技术人才人工智能通识继续教育,自2025年起在全体专业技术人才队伍中广泛实施 [24] - 即时零售推动餐饮业捕捉"即买即用"增量需求,将餐饮店辐射范围从1.5公里扩至3-5公里,全国3万个前置仓创造50万岗位 [24]