Computer Use

搜索文档
ChatGPT智能体正式发布,多个创业赛道昨夜无眠
量子位· 2025-07-18 08:30
ChatGPT Agent核心功能 - 整合"思考"和"执行"能力,实现深度研究与操作执行的统一[2][8] - 可接管用户电脑操作,接近操作系统级别的控制[3] - 工作场景支持会议安排、PPT生成、报销提交等高管助理级功能[4] - 生活场景覆盖旅游规划、活动安排等CEO秘书级服务[4] 技术实现与性能 - 采用专用模型实现SOTA,网页浏览和现实任务执行能力显著提升[5][30] - 动态学习机制优化速度、准确性和效率,配备可视化/文本浏览器及API访问路径[27][28] - 在DSBench测试中超越人类水平,SpreadsheetBench得分比GPT-4o提升超一倍[33][34][38] - "人类最后考试"得分41.6分,远超早期模型不足10分的表现[31] 商业化部署 - Pro版支持无限次任务,其他付费版每月50次任务,企业/教育版7月开放[22][23][24] - 通过积分制扩展使用量,免费用户暂未开放[23][25] 行业影响与竞争格局 - 将创业赛道功能整合为大厂标准化产品,冲击Agent领域创业者[5][7] - 落后于Anthropic等竞品的"Computer Use"功能,但在通用Agent领域加速追赶[48] - 手机厂商华为/小米等已试水Agent应用,如自动订咖啡、接听电话等[49] 长期趋势展望 - 可能重塑互联网形态,从PC时代"网站"、移动时代"APP"转向AI时代"Agent"[52] - 企业级应用如AI客服已快速渗透,垂直领域AI编程/绘图同步推进[46][47] - 预示由AI驱动的操作系统级产品形态正在形成[50][51]
中金 | AI进化论(8):AI Agent:AI的L3时刻?
中金点睛· 2025-03-25 07:32
中金研究 在ChatGPT引领本轮AI的产品开端后,关于下一代AI的产品形态也引起了广泛关注。近期创业公司Monica推出通用型AI Agent Manus,引发了对AI Agent这一AI的L3阶段产品的讨论,Manus在多代理模式和可靠性问题上有所创新。我们认为AI Agent这类产品形态的创新与底层的模型演进同样重 要,并展现出了强大的商业化变现和落地潜力。展望未来,我们认为AI Agent或将通过接管手机的方式,重塑互联网生态。 从L2向L3级别迈进,AI进入智能体时代 从推理者到智能体,AI的L3时代加速来临。 在ChatGPT引领本轮AI的开端后,关于AI的演进过程即下一代AI的产品形态也引起了世界的关注。在AI发展 的路线图方面,OpenAI参考智能驾驶等级将AI发展划分为聊天机器人(Chatbots)、推理者(Reasoners)、智能体(Agents)、创新者(Innovators)、 完整组织(Organizations)五个阶段。 ► Level 1: ChatGPT的推出标志着AI达到L1阶段,即能够理解语言,智谱认为L1能力已经达到了80~90%。 点击小程序查看报告原文 从推理者到 ...
泥沙俱下,Manus被掩埋的价值
新财富· 2025-03-12 09:50
本文约4200字,推荐阅读时长15分钟,欢迎关注新财富公众号。 3月11日,Manus 官方正式宣布与阿里通义千问团队开展战略合作。由通义千问提供专属模型支持的 Manus 中文版本正在开发中… (由于没有邀请码测试 Ma n u s,本文侧重行业分析,体验归纳所选取的案例资料均来自于公开的测试回放) 1 创新的质疑 在 De e pSe e k 浪潮之后, "世界首个通用型AI Ag e n t "标签加持下的 Ma n u s ,注定要受到所有人的注目。 从自媒体争先恐后的"炸裂"、"上帝之手"般的吹捧,到"自嗨"、"饥饿营销"的千夫所指,Ma n u s在1 2个小时之内经历了从被吹上天到被锤到 地底的体验。 而这背后混杂的,是自媒体流量的争夺、投资人的FOMO(错失恐惧症)与普通用户对"一夜成神"故事的期待。 截至Ma n u s发布,海外AI巨头 An t h r o p i c 、Op e nAI 已经推出了Comp u t e r Us e 、Op e r a t o r这些垂类的AI通用Ag e n t,在代码垂类领域也有 De v i n AI 编程 Ag e n t 这样的产品,国内智谱也 ...
晚点播客丨硅谷怎么看 DeepSeek?与 FusionFund 张璐聊开源、Agent 和除了 AI
晚点LatePost· 2025-02-13 21:01
开源生态与AI模型发展 - DeepSeek发布开源推理模型R1,以较低成本在部分Benchmark上比肩甚至超越闭源模型o1,引发全球讨论[7] - DeepSeek的成功被视为开源生态的胜利,其创新建立在开源社区积累的基础上,同时推动了无监督强化学习和合成数据应用[11][12] - 开源生态有利于初创企业,促进多样性创新,而闭源更有利于大企业[13] DeepSeek的影响与行业反应 - DeepSeek改变了国际对中国AI公司的认知,展示底层架构创新能力而非仅工程优化[14] - AMD宣布与DeepSeek合作,但开源模型降低行业使用门槛可能长期增加算力需求而非利空英伟达[8][15] - Meta面临压力,其Llama架构受益于DeepSeek的结构探索,但品牌公关层面受到挑战[16] 闭源模型与开源模型的竞争 - OpenAI和Anthropic仍为行业Benchmark,但开源模型追赶速度超预期[16] - xAI凭借特斯拉和SpaceX的3D产业数据优势,内部迭代速度惊人[17] - 开源生态的多样性可能催生新架构,使AI模型在CPU上高效运行,改变芯片市场格局[19] Agent应用与行业机会 - OpenAI的Operator和Anthropic的Computer Use展示了智能体应用的潜力,但当前速度慢且存在信息编造问题[21] - Agent应用在医疗、金融、保险、太空科技等领域有垂直机会,与传统RPA的区别在于交互革新[24][23] - 用户对AI的信任度高于人类服务提供者,尤其在隐私信息分享方面,年轻一代行为模式变化显著[25] 中美AI投资差异 - 美国生态中巨头聚焦基础模型,初创企业在应用层与巨头形成协同,垂直领域受监管行业更倾向与初创合作[26][27] - 国内投资人担忧单一环节公司易受巨头挤压,而美国初创企业在高度监管行业有更多合作机会[26] 非AI领域的热点方向 - BioTech方向从延长寿命转向提升生命质量,AI加速医疗技术创新如数字化诊断和治疗[28] - SpaceTech因SpaceX降低发射成本,未来3-5年可能迎来爆发,洛杉矶形成太空科技聚集地[28][30] - 美国创新核心分布在硅谷、波士顿、纽约、奥斯汀和洛杉矶[30]