Workflow
Artificial Intelligence
icon
搜索文档
Z Event|本周日ZP团队现场对话明星AI硬件公司,嘉宾完整名单揭晓,我们未来与AI共生
Z Potentials· 2025-11-21 11:15
活动基本信息 - 活动名称为虎嗅FM创新节 主题为"新节" 活动时间为11月22日至11月23日 [4] - 活动地点位于北京798·751园区的79罐 第一车间和黑魔方三个场地 [4] - 预计现场观众规模超过5000人 参与KOL和虎嗅作者超过200位 [4] 圆桌对话安排 - 11月23日11:10-11:50举行圆桌对话 主题为"记录的意义—AI从捕捉瞬间到重塑体验" [1] - 主持人包括Seki Yuca和Sarea 合作单位包括Z Potentials Z Lives和IRN TO AI [1] - 圆桌嘉宾包括Z Potentials主理人 ZP Fellow 心流资本合伙人以及前Kimi产品经理 [1] 活动主题与理念 - 活动核心理念为"商业在祛魅 技术在破界 而人的价值从来不是被定义" [4] - 强调与"保持beta的人"相遇 通过AI技术"撕碎过去的标签"和"重构自我" [4] - 活动设有"AI记录·AI陪伴"环节 关注AI技术如何从捕捉瞬间发展到重塑体验 [1] 参与方式 - 可通过"虎嗅FM创新节"小程序 输入兑换码"ZP1123"获得限量免费赠票 [3]
速递 | 打破Instagram与Snapchat增长纪录:Agnes揭示AI时代真正的增长来自未被服务的99.5%
Z Potentials· 2025-11-21 11:15
公司业绩与增长表现 - 公司Agnes AI在PC端上线后2个月内实现注册用户新增300万,日活跃用户突破20万 [3] - 其增长速度打破了Instagram和 Snapchat的历史纪录,并成为东南亚、拉美、中东等新兴市场最热门的消费级AI应用 [4] - 公司展现出高用户留存率,第4周留存率为40%,第8周留存率仍高达30% [4] - 用户获取成本极低,仅为0.2美元,公司估值已超过1亿美元 [4] 行业洞察与市场定位 - 尽管AI热度高,但全球每日真正使用AI的用户约5亿至6亿,仅占全球60亿网民的约10%,其中真实订阅用户不足5%,即仅占全民网民的0.5% [7] - 当前绝大多数AI应用产品围绕全球前0.5%的“高认知、任务型、愿付费”用户设计,聚焦于办公效率、研究、生产力等狭窄赛道 [7] - 公司定位服务于全球99.5%的“长尾用户”,这些用户可能没有PC或iOS设备,主要使用安卓,对AI功能使用浅甚至未使用付费功能 [7] - AI真正的增长机会在于满足99.5%普通人的未被满足需求,而非争夺前0.5%的用户 [8] 产品战略与功能特点 - 公司选择打造AI原生的“全民AI”,不同于传统AI应用聚焦生产力工具,其目标是让AI融入更广泛的生活与工作场景 [9] - 核心功能覆盖AI搜索、深度研究、广度研究、图片视频生成、PPT与表格生成等主流生产力需求 [9] - 通过底层工程优化响应速度、输出质量与成本控制,并构建一体化工作流模式建立竞争优势 [9] - 向所有用户开放高级功能体验并提供相当免费额度,极大降低用户使用门槛 [12] - 积极探索AI在社交、娱乐等多元场景的应用,认为社交是提升使用频次和时长的有效途径,并可能重塑人机交互方式 [13][14] 技术架构与研发实力 - 团队核心成员来自麻省理工、斯坦福、加州大学伯克利分校、德克萨斯大学奥斯汀分校、新加坡国立大学、南洋理工大学等世界一流院校 [15] - 为支撑“AI普惠”愿景,公司尽量不依赖昂贵的外部SOTA API,而是自研高性能模型和多Agent架构 [15] - 团队在模型训练、多智能体协作、Agentic Office System以及AIGC生成优化等领域成果丰硕,有多篇论文被国际顶级会议录取 [16] - 自主研发的7B参数SOTA模型AgnesR1已商用,多个参数规模在7B至30B的模型也已部署应用,更大规模模型在积极研发中 [16] - 50%的流量路由到自研模型,用于任务编排、研究调研、PPT生成、图片和视频生成等大部分任务,在推理速度、输出质量和token成本效率上表现优异 [18] - 为提升东南亚及拉美用户的本地化体验,持续训练区域大语言模型以加强对当地口语、俚语及文化环境的理解与生成能力 [18]
谷歌又来炸场!大热生图模型升级,Nano Banana Pro提供“摄影棚级别”精度和控制
硬AI· 2025-11-21 11:03
产品核心功能与性能提升 - 新模型Nano Banana Pro支持生成最高4K分辨率的图像,并在多语言环境下实现精确文本渲染 [2][3] - 模型提供专业级控制能力,用户可调整拍摄角度、景深、色彩、光照等参数,并能将场景从白天转换为夜晚 [2][12][13] - 在素材一致性方面,模型可保持最多五个角色和十四个物体的一致性 [2][3][18] - 模型支持1K、2K和4K三种分辨率的精准放大,并能随意切换纵横比 [16] 技术突破与专业应用 - 新模型攻克了AI图像生成中长期存在的文本渲染准确性难题,能更好地规划文本位置、字体特征及其空间关系 [6][7] - 该技术可将菜谱文本转换为图解流程图,或可视化天气、体育等实时信息,适用于制作信息图表、幻灯片设计 [7][3] - 模型能将草图转化为物体,将手绘笔记转为图表,将创意变成3D渲染建筑,并创建具有真实细节的逼真图像 [19] 商业化策略与市场推广 - 谷歌将新模型集成至Canva、Figma、Adobe Firefly和Photoshop等主流设计工具,以扩大其应用范围 [5] - Gemini App免费用户可在配额限制内使用新模型,付费AI计划订阅用户(如AI Plus、Pro和Ultra)则拥有更高使用额度 [5][21] - 公司同步推出AI内容溯源功能,用户可上传图像查询是否由谷歌AI生成,该功能未来将扩展至音频和视频 [5][22] 用户增长与市场竞争 - Gemini App目前每月活跃用户超过6.5亿,由Gemini驱动的AI Overviews每月用户达20亿 [24] - 相比之下,OpenAI的ChatGPT每周活跃用户达8亿,目前在苹果App Store免费应用榜单中排名第一,Gemini位居第二 [24] - 产品需求持续增长,许多用户注册Gemini订阅计划以获得高级模型的更高限额 [24]
Genspark 再拿 2.75 亿估值 12.5 亿美金,两个华人 AI ARR 超 3000 万美金
投资实习所· 2025-11-21 10:38
Genspark 今天宣布,完成了 2.75 亿美金的 B 轮融资,估值达 12.5 亿美金,由 Emergence Capital 领投,SBI Investment、LG Technology Ventures、 新加坡淡马锡旗下 Pavilion Capital 和 UpHonest Capital 等跟投。 上个月我曾分享了红杉中国领投 Genspark 估值 10 亿美金的融资《 红杉中国领投 Genspark 估值 10 亿美金,又一华人语音 AI ARR 超 5000 万美金 》,后来又爆出了腾讯也参与了那一轮,而且腾讯想领投但最后被红杉领投了。 此次公开的 B 轮融资信息,所有国内的投资人都没有提及,估计还是担心地缘政治的因素。而之前国内投资机构和此次公开的 B 轮,应该是分开做的两 轮融资。 9 月底的时候,Genspark 宣布其 ARR(annual run rate)已经超过了 5000 万美金,过去 3 个月收入环比增长约 20%。 今天 Genspark 又宣布推出了一系列功能更新,包括 Genspark AI Workspace,Genspark AI Inbox、Genspar ...
智能早报丨华为高速L3七城路测冲刺商用;OpenAI连发GPT-5.1两大新模型
观察者网· 2025-11-21 10:04
华为乾崑智驾技术进展 - 华为乾崑高速L3解决方案进入商用冲刺阶段,已在北上广深、合肥、武汉、重庆等7个城市开展路测 [1] - 乾崑ADS 4系统旗舰版具备高速L3能力,并配备专属人机交互方案,通过语音和界面显示强化用户感知 [3] - 行业预判2025年高阶辅助驾驶车辆渗透率将达30%,2027年超50%,其中高速L3渗透率或突破20% [3] - 华为规划2025年实现高速L3试点商用,2026年力争规模商用,2027年全面开启智驾无人化时代 [3] - 计划2026年一季度通过OTA将城区NCA功能下沉至15万元级车型,明年有20余款车型搭载相关技术 [3] OpenAI模型发布与生态合作 - OpenAI发布GPT-5.1 Pro与GPT-5.1-Codex-Max两款新模型,GPT-5.1 Pro已向所有ChatGPT Pro用户推送 [4] - GPT-5.1 Pro在复杂工作中提供更清晰答案,尤其在写作辅助、数据科学和商业任务上提升显著,高推理模式能力指数与GPT-5持平 [5] - GPT-5.1-Codex-Max引入原生压缩机制,可连续工作超24小时,处理数百万token任务,SWE-bench Verified准确率达77.9%,较前代提升4.2% [6] - 新编码模型思考token量减少30%,成本大幅降低,支持Windows环境及CLI、IDE扩展等多场景使用 [6] - OpenAI与Target合作,通过ChatGPT中的Target应用提供个性化推荐和购物功能,Target加入超过100万OpenAI企业客户行列 [9] - 阿里升级“通义千问”,MiniMax、月之暗面等发布新模型,带动模型、应用与算力同步推进 [9] 国轩高科与大众汽车合作 - 国轩高科标准电芯量产交付,标志着与大众汽车集团及PowerCo历时5年的战略合作进入规模化量产阶段 [10] - 该标准电芯由双方联合研发,适配大众新一代新能源整车平台,将覆盖大众旗下80%以上的新能源车型 [10] - 电芯在能量密度与安全性能上达国际先进水平,通过统一规格将电池系统成本降低最高50% [10] - 国轩高科同步发布基于标准电芯的电池包系统,合作从单一电芯供应向系统解决方案延伸 [10] - 根据规划,2026年至2032年间,国轩高科将持续向大众集团交付高性能磷酸铁锂及其他规格标准电芯 [10] 鸿海集团与Intrinsic合作 - 鸿海集团与Alphabet旗下机器人公司Intrinsic在美国成立合资公司,共同建设AI机器人工厂,合作已获欧盟反垄断批准 [12] - 合资公司初期将聚焦组装、检测、设备维护及物流四大核心场景,整合Intrinsic的AI技术平台与鸿海的全球制造资源 [12] - 鸿海在北美已布局德州、威斯康辛州等生产基地,为技术落地提供硬件支撑 [12] - 此次合作是鸿海深化美国布局的重要举措,北美将是集团未来三年AI服务器的核心生产重镇,2025年在美产能扩张规模将再创新高 [13]
黑芝麻智能发布机器人商业化专属部署平台SesameX,打造「机器人多维智能引擎」
IPO早知道· 2025-11-21 10:04
产品发布核心信息 - 黑芝麻智能于11月20日正式推出业界首个全栈自进化、支持全脑智能的机器人商业化部署平台SesameX [2] - SesameX平台的推出标志着公司发展路径从智能驾驶扩展到包含机器人的具身智能产业 [3] - 公司创始人表示在智能汽车产业积累的研发和量产经验将直接支持机器人领域的新应用 [6] 行业痛点与产品定位 - 机器人行业存在四大技术痛点:大小脑/左右脑不平衡、安全无系统保障、系统割裂导致多任务算力不协调、算法难闭环进化 [6] - SesameX定位为针对行业痛点的全栈自研平台,从硬件、软件、工具链到模型生态全覆盖 [6] - 平台旨在打造机器人的"多维智能引擎",推动机器人产业发展 [6] 平台技术架构 - SesameX系统结构分为四层:计算平台层、中间件层、原子应用层以及协同构建的可信可靠安全保障 [8] - 计算平台层包含自研的Kalos、Aura、Liora三款模组,配套运行Ubuntu、ROS2和自研SesameX-RTOS系统 [8] - 中间件层由调度引擎、工具链和Runtime三大模块组成,确保智能单元协同工作 [8] - 原子应用层分为任务模型和原子模型,使机器人成为"技能学习者"而非"程序执行器" [8] 核心计算模组与应用场景 - Kalos模组对应视觉驱动层级,应用于送餐机器人、迎宾机器人、巡检机器人等低速轮式场景,是平台中最成熟、最具性价比的机器人中枢 [9] - Aura模组对应感控协同层级,适用于多足机器人、工业巡检机器人、智能机械臂等,是高性能异构计算平台,最聪明、最可靠的行动脑 [9] - Liora模组对应认知进化层级,是面向具身智能"大脑"的全能计算平台,最快、最安全,支持世界模型与端到端控制,使机器人能思考、预测并自主决策 [9] - 三款模组与上层软件算法系统结合形成有层次、有协同、有成长的"机器人大脑体系" [10] 平台核心理念 - SesameX将安全定义为"智能属性",提出"行动即安全(Action = Safety)"理念 [10] - 平台架构旨在使机器人从"预设程序执行者"转变为"能够自我成长的智能生命体" [10] 生态合作与商业化进展 - 公司公布首批机器人合作伙伴名单,包括云深处、傅利叶智能、极智嘉、联想等11家企业 [10] - 平台核心价值已率先落地,与星程智能、深庭记、云深处、灵御智能等伙伴实现商业化部署,应用于物流车、四足机器人、轮式机器人等产品 [10] - 与均胜电子达成战略合作,计划未来推出基于SesameX的具身机器人头部总成和域控制器 [11] - 与湖北华中电力科技开发有限责任公司达成合作,共同探索具身机器人在电力行业的落地应用 [11]
知产总数达5650项!在上地UPSIDE看见AI创新样本
南方都市报· 2025-11-21 09:36
"海淀是全国人工智能领域科研基础最好、研发能力最强、产品迭代最活跃的地区,诚邀全球创投人来 海淀投资兴业!"19日的"上地UPSIDE"2025人工智能创新创业大赛颁奖盛典上,中关村科学城管委会副 主任、海淀区副区长唐超透露,海淀区近期将立足区域AI优势特色发布相关产业行动方案,并面向海 内外发出"AI产业合伙人"邀约! 据唐超在发言中介绍,海淀当前已基本形成了以芯片、框架、大模型、数据技术与处理服务等技术为主 的自主可控全产业链。南都记者了解到,为了让AI产业跑得更快,海淀正在搭建公共算力平台,一个 面积达53平方公里的人工智能创新街区也正加紧建设。此外,海淀区还提出了要把中关村科学城打造 成"AI全景赋能第一城"的口号。 覆盖从基础到应用的AI全产业链 活动现场,北京市海淀区上地街道党工委书记黄春明发布了本次赛事成果报告。其中介绍,本届赛事自 今年5月启动以来,共吸引全球513个项目报名参赛,较去年增加35.71%;参赛项目覆盖基础层、框架 层、模型层、应用层等AI全产业链,其中京外及海外项目达211个,占比达41.13%,增幅达71.5%,彰 显了赛事日益提升的国际影响力;参赛项目质量显著提升,硕博及以 ...
2025年中国MaaS(模型即服务)行业发展背景、市场规模、企业格局及未来趋势研判:行业进入快速发展期,市场规模激增,市场竞争呈现高度集中态势[图]
产业信息网· 2025-11-21 09:20
文章核心观点 - 模型即服务(MaaS)通过封装AI算法模型能力,以服务形式降低技术门槛、控制成本、简化运维,从而加速“人工智能+”进程 [1] - 中国MaaS市场在2024年呈现爆发式增长,规模达7.1亿元,同比增长215.7%,市场格局高度集中 [1][8] - MaaS作为大模型落地的核心载体,已在金融、政务、电信等行业产生积极成效,未来将向更普惠、安全的方向发展 [1][10][12] MaaS行业相关概述 - MaaS核心目标为降低人工智能技术使用门槛,控制应用建设成本,简化系统运维管理复杂度,提升人工智能技术的综合应用效能 [1][2] - MaaS主要提供三部分服务能力:全栈平台型服务、丰富资产库服务、基于AI模型的应用开发工具服务 [3] - 围绕模型服务生产及使用的全生命周期,形成了包含模型平台层、模型层以及应用开发层在内的MaaS三层落地框架 [4] MaaS行业发展背景 - 截至2025年7月27日,全球已发布大模型总数达3755个,其中中国企业贡献1509个,数量位居全球首位 [1][4] - 中国大模型应用市场规模2024年达到47.9亿元,较2023年实现跨越式增长,应用广泛分布于代码助手、数字人、智能客服等领域 [6] - 中央政府与地方政府多次在政策中提及“模型即服务”,如2025年8月国务院发布《关于深入实施“人工智能+”行动的意见》,为行业发展提供有力支持 [6] MaaS市场规模与驱动因素 - 2024年中国MaaS市场全年规模达7.1亿元,较2023年同比激增215.7% [1][8] - 市场发展受多重因素驱动:企业数字化、智能化转型需求;大模型技术持续演进;政府出台支持人工智能产业发展的政策 [8] - MaaS服务和产品在金融、政务、电信等行业不断落地,金融行业因其完善的技术储备和丰富的业务数据成为落地最多的领域 [10] MaaS企业格局 - 2025年上半年中国MaaS市场前五大服务商为火山引擎、阿里巴巴、百度、腾讯、中国移动,合计占据超80%市场份额 [1][11] - 火山引擎以37.5%的市占率位居企业之首,阿里巴巴市占率为21.0% [1][11] - 市场主要参与者分为三类:以阿里云、百度智能云为代表的云服务商;以商汤科技、百融云创为代表的人工智能企业;以中国移动等为代表的电信运营商 [11] MaaS行业发展趋势 - 大小模型协同将成为模型服务场景化落地的重要方式 [1][12] - MaaS服务的能力和内部接口将走向统一化 [1][12] - MaaS将催生基于大模型的应用新生态,并围绕模型服务持续强化安全保障 [1][12]
谷歌又来炸场!大热生图模型升级,Nano Banana Pro提供“摄影棚级别”精度和控制
美股IPO· 2025-11-21 09:05
产品发布与核心功能 - 谷歌发布基于Gemini的升级图像生成与编辑模型Nano Banana Pro,旨在将AI图像工具从消费级应用推向专业设计领域[4] - 新模型支持生成最高4K分辨率的图像,并在多语言环境下实现精确的文本渲染[1][4] - 模型提供专业级控制能力,用户可像使用专业相机一样调整拍摄角度、景深、色彩和光照等参数,甚至可将场景从白天转换为夜晚[1][4][14][15] - 在素材一致性方面,模型可保持最多五个角色和十四个物体的一致性[1][4] 技术突破与应用场景 - 新模型攻克了AI图像生成中长期存在的文本渲染准确性难题,能更好地规划文本位置、字体特征及其空间关系[9] - 该技术可将菜谱文本转换为图解流程图,可视化天气、体育等实时信息,或将草图转化为物体、手绘笔记转为图表[9][18] - 模型能创建针对国际市场的产品展示、海报和信息图表,支持用户描述所需字体类型或模拟不同手写风格[11] 商业化策略与市场定位 - 谷歌全球免费Gemini用户可在配额限制内使用Nano Banana Pro,付费AI计划订阅用户则拥有更高使用额度[6][20] - 新模型已集成至Canva、Figma、Adobe Firefly和Photoshop等主流设计工具,并通过Gemini API等向开发者开放[6][20] - 生成4K图像的成本为0.24美元,高于原模型生成1024像素图像的0.039美元[18] - 此次发布是谷歌在生成式AI竞赛中追赶OpenAI的重要一步,标志着其将AI技术商业化的最新尝试[6][22] 用户增长与市场反响 - Nano Banana Pro的前身Nano Banana在今年8月面世后帮助Gemini应用在四天内新增1300万用户[22] - Gemini App目前每月活跃用户超过6.5亿,由Gemini驱动的AI Overviews每月用户达20亿[22] - 相比之下,OpenAI的ChatGPT每周活跃用户达8亿,目前在苹果App Store免费应用榜单中排名第一,Gemini位居第二[22] - 谷歌AI产品需求持续增长,许多用户注册Gemini订阅计划以获得高级模型的更高限额[22] 辅助功能与未来规划 - 谷歌同步推出AI内容溯源功能,用户可上传图像查询是否由谷歌AI生成,该功能未来将扩展至音频和视频[6][21] - 谷歌为AI生成图像添加水印,免费或Pro方案用户创建的图像带可见水印,最高价Ultra方案用户可移除可见水印[21] - 公司计划继续扩大AI产品规模,重点包括AI电影制作工具Flow和"世界构建"模型Genie[23]
Gemini 3背后,一个带领谷歌AI翻盘的男人
36氪· 2025-11-21 08:47
OpenAI CEO奥尔特曼在社交媒体上发表评论称Gemini 3 "看起来是个很棒的模型";马斯克也一如既往地送上"Nice work"的评价。 全网创作者也都迫不及待体验一下Gemini 3,开发出了多种应用,比如有人重现经典游戏创建了3D吃豆人游戏。这种3D开发原本需要耗费大量时间精 力,但现在几句话就能搞定。 资本用实际行动对Gemini 3给予了肯定。19日,谷歌母公司Alphabet股价最高涨6.9%,达303.68美元,刷新历史新高,最终收于292.99美元,当日市值达 3.54万亿美元。 自ChatGPT诞生,人们把更多目光投向了OpenAI,或者是和它大抢人才的Meta,甚至是来自东方的DeepSeek,Gemini 3诞生后,谷歌AI的含金量在上升。 Gemini 3来自谷歌旗下AI研究团队DeepMind。该团队表示,Gemini 3是全球最先进的多模态理解模型、谷歌最强大的Agent编程和氛围编程模型,能呈现 更丰富的可视化效果和更深度的交互体验,且完全构建于最先进的推理技术基础之上。 北京时间11月19日凌晨,万众期待的谷歌最强推理模型Gemini 3正式揭开面纱,包括Gemini ...