AI Agent
搜索文档
美图秀秀将接入AI智能助手 提供AI Agent服务
新浪科技· 2025-09-23 11:56
公司产品动态 - 美图秀秀将于9月下旬上线AI智能助手 提供垂直场景Agent服务 [1] - AI智能助手核心能力或来自同门原生AI应用RoboNeo [1] - 公司正加速将AI智能助手深度融入产品生态 [1] 技术发展进程 - 美图产品AI渗透率已达90% [1] - AI技术逐步成熟 公司认为改变影像领域交互的时机已经到来 [1] - 打造AI Agent产品是基于技术成熟度的战略决策 [1]
DeepSeek线上模型升级至V3.1-Terminus!算力与应用板块或迎价值重估(附概念股)
智通财经· 2025-09-23 07:37
模型升级与性能表现 - DeepSeek-V3.1-Terminus版本于9月23日发布 重点优化语言一致性与Agent能力 缓解中英文混杂及异常字符问题 提升Code Agent与Search Agent表现 [1] - 非Agent测评中 MMLU-Pro得分从84.8提升至85.0 GPQA-Diamond从80.1提升至80.7 Humanity's Last Exam从15.9大幅提升至21.7 LiveCodeBench从74.8微升至74.9 Codeforces从2091降至2046 Aider-Polyglot从76.3微降至76.1 [1] - Agent测评显示 BrowseComp从30.0显著提升至38.5 BrowseComp-zh从49.2降至45.0 SimpleQA从93.4提升至96.8 SWE Verified从66.0提升至68.4 SWE-bench Multilingual从54.5提升至57.8 Terminal-bench从31.3提升至36.7 [1] - 官方App 网页端 小程序与API模型均已同步更新至DeepSeek-V3.1-Terminus版本 [1] 学术突破与行业影响 - DeepSeek-R1推理模型研究论文登上《自然》期刊封面 打破主流大模型未经独立同行评审的空白 [2] - DeepSeek-V3.1于8月21日发布 采用混合推理架构 同时支持思考模式与非思考模式 具有更高思考效率和更强Agent能力 [2] - DeepSeek的成功推动中国公司转向开源路线 7月底出现开源井喷潮 阿里连续发布4款开源模型 腾讯开源混元3D世界模型1.0 智谱发布GLM-4.5 阶跃星辰开源Step-3模型 [3] 国产算力生态建设 - DeepSeek-V3.1采用UE8M0 FP8格式专为下一代国产芯片设计 解决与英伟达FP8标准兼容性问题 打破对英伟达依赖 [2] - 英伟达H20芯片停产促使国内算力替代需求迫切 国产算力板块受推荐 [2] - DeepSeek模型训练与推理有望更多应用国产AI芯片 助力国产算力生态加速建设 [3] - 大模型训推带动AI算力需求增长 GB300 Vera Rubin等新一代算力架构将推出 AI芯片 服务器整机 铜连接 HBM 液冷 光模块 IDC等环节持续受益 [4] 相关企业动态 - 百度文心大模型X1.1于9月9日发布 事实性提升34.8% 指令遵循提升12.5% 智能体提升9.6% 在多个基准评测中超越DeepSeek R1-0528 与GPT-5和Gemini 2.5 Pro效果持平 [6] - 阿里巴巴通义千问推出Qwen3-Max-Preview模型 被描述为系列最强大语言模型 国产大模型企业进入全球第一梯队 [6] - 商汤日日新大模型接入小米AI眼镜 实现全双工实时音视频交互能力 为智能硬件交互提供新范式 [7] - 中兴通讯推出多款AI一体机产品 AiCube训推一体机助力企业部署DeepSeek大模型 5G UniEngine算网一体机支撑行业应用 智海AI教育一体机实现国产算力与DeepSeek适配 Common Edge一体机用于5G边缘计算 [7] 半导体产业链布局 - 亚太精选ETF(159687)包含亚太优质红利资产和半导体龙头企业 丰田汽车 腾讯控股 阿里巴巴 三菱集团等提供稳健收益 台积电(权重超8%) 三星 东京电子 联发科等代表半导体核心企业 [5] - 2022年亚太地区半导体产业收入占全球57.6% 凸显区域产业链核心地位 [5]
港股概念追踪 | DeepSeek线上模型升级至V3.1-Terminus!算力与应用板块或迎价值重估(附概念股)
智通财经网· 2025-09-23 07:27
DeepSeek-V3.1-Terminus版本升级 - 深度求索正式升级DeepSeek-V3.1至DeepSeek-V3.1-Terminus版本 优化语言一致性与Agent能力 缓解中英文混杂及异常字符问题 提升Code Agent与Search Agent表现 [1] - 新模型各领域测评结果如下:MMLU-Pro从84.8提升至85.0 GPQA-Diamond从80.1提升至80.7 Humanity's Last Exam从15.9提升至21.7 LiveCodeBench从74.8提升至74.9 Codeforces从2091降至2046 Aider-Polyglot从76.3降至76.1 [1] - Agent测评表现提升:BrowseComp从30.0提升至38.5 BrowseComp-zh从49.2降至45.0 SimpleQA从93.4提升至96.8 SWE Verified从66.0提升至68.4 SWE-bench Multilingual从54.5提升至57.8 Terminal-bench从31.3提升至36.7 [1] - 官方App、网页端、小程序与API模型均已同步更新为DeepSeek-V3.1-Terminus [1] 学术研究与国际认可 - DeepSeek团队研究论文登上《自然》期刊封面 打破主流大模型未经独立同行评审的空白 [2] - 8月21日发布的DeepSeek-V3.1实现混合推理架构 同时支持思考模式与非思考模式 具有更高思考效率和更强Agent能力 [2] 国产算力生态与产业链影响 - DeepSeek V3.1采用UE8M0 FP8格式 专为下一代国产芯片设计 解决与英伟达FP8标准兼容性问题 推动国产算力生态自主化 [2] - 英伟达H20芯片停产使国内算力替代需求迫切 国产算力板块获推荐 [2] - DeepSeek V3.1发布带动国产算力产业链标的大幅上涨 未来训练与推理有望更多应用国产AI芯片 加速国产算力生态建设 [3] - 大模型训推带动AI算力需求增长 GB300、Vera Rubin等新一代算力架构将推出 AI芯片、服务器整机、铜连接、HBM、液冷、光模块、IDC等环节持续受益 [4] 开源模式与行业趋势 - DeepSeek成功推动国产大模型走向分水岭 更多中国公司转向开源路线 重点重新转向模型优化与更新迭代 [3] - 7月底国产大模型迎来开源"井喷潮":阿里连续发布4款开源模型 腾讯开源混元3D世界模型1.0 智谱发布GLM-4.5 阶跃星辰开源Step-3 [3] 相关企业动态与产品进展 - 百度文心大模型X1.1正式发布 事实性提升34.8% 指令遵循提升12.5% 智能体提升9.6% 在多个基准评测中超越DeepSeek R1-0528 与GPT-5和Gemini 2.5 Pro效果持平 [6] - 阿里巴巴通义千问推出Qwen3-Max-Preview模型 成为系列最强大语言模型 国产大模型企业进入全球第一梯队 [6] - 商汤"日日新"大模型接入小米AI眼镜 实现全双工实时音视频交互能力 推动智能硬件交互范式发展 [7] - 中兴通讯推出多款AI一体机产品:AiCube训推一体机助力企业部署DeepSeek大模型 5G UniEngine算网一体机支撑行业应用 智海AI教育一体机实现国产算力与DeepSeek适配 Common Edge一体机用于5G边缘计算 [7] 半导体与ETF投资机会 - 亚太精选ETF(159687)包含亚太优质红利资产和半导体龙头企业 丰田汽车、腾讯控股、阿里巴巴、三菱集团等提供稳健收益 台积电、三星、东京电子、联发科等半导体企业占比显著 亚太地区半导体产业收入占全球57.6% [5]
从169家初创公司,我看到了AI创业这两个趋势
36氪· 2025-09-22 19:28
文章核心观点 - AI Agent(智能代理)成为YC 2025夏季演示日的核心主题,标志着AI创业从辅助工具向自主执行复杂任务转变 [2][4][6] - AI创业呈现极度垂直化趋势,公司专注于解决特定行业(如医疗、金融、房地产、制造业)的DDE(枯燥、困难、昂贵)痛点 [14][15][23] - AI生态系统趋于成熟,催生一批为AI应用提供底层工具、平台和基础设施的公司 [24][27] - 投资逻辑回归商业本质,更关注用户留存、单位经济效益和解决真实行业痛点,而非单纯技术新颖性 [28][29] AI Agent成为核心主题 - 超过一半的YC S25项目在描述中提及AI代理、自主、自动化或autopilot等关键词 [5] - AI应用从Copilot(辅助工具,人做决策)向能自主感知、决策和执行的AI Agent转移 [6] - B2B企业付费意愿高,商业模式简化为替客户省钱(按节省成本分成)或替客户赚钱(按成交额抽佣) [7][12] - 典型案例包括:Solva用AI自动化保险理赔,上线10周实现年化收入24.5万美元;Autumn为AI公司处理复杂计费,被数百个AI应用和40家YC初创使用 [8][9] 聚焦DDE工作实现落地 - AI代理瞄准DDE(枯燥、困难、昂贵)工作场景,作为规模化落地的最佳入口 [10] - 省钱案例:Frizzle AI批改作业解放教师;F4和ContextFort进行工程图纸合规检查;Risely AI自动化高校行政工作 [11] - 赚钱案例:Shor作为AI工资发放助手,将发工资时间缩短至3分钟,费用节省80%,通过WhatsApp消息即可完成全球雇佣和薪酬支付 [13] 极度垂直化深入行业 - 创业公司不再追求通用大平台,而是深度切入垂直行业,将AI转化为新型“劳动力”和“专家系统” [14][15] - 医疗领域:Perspectives Health监听医患对话实时生成病历,为医生节省一半文书时间,试点阶段保持每周25%增长,已接入9家诊所 [16] - 房地产领域:Clodo提供语言交互式CRM,自动记录线索和跟进客户,已被60名美国房产经纪人使用;Spotlight Realty聚焦租赁佣金;Closera服务商业地产 [17][18] - 金融法律领域:Magnetic为会计事务所提供AI报税;Kalinda为律所进行集体诉讼研究;Qualify.bot是跑贷款业务的AI电话代理 [18] - 制造业领域:Flywheel为挖掘机加装智能盒子实现远程操控,使一人可管理多台机器甚至多个工地,同时采集数据供AI模型学习技能 [20][23] AI基础设施趋于成熟 - 公司专注于为AI开发者提供底层工具,覆盖开发、部署、评估、优化全生命周期 [24] - 开发与部署:Lilac发现并再利用企业闲置GPU算力;Metis提供构建可靠代理的基础设施;Kernel提供“浏览器即服务” [24] - 评估与监控:AgentHub提供AI代理仿真与评估平台;Truthsystems专注于实时治理,自动阻止高风险行为 [25] - 数据与模型:Louiza Labs合成医学数据集;Relling打造“世界模型版的ImageNet” [26] - 性能优化:Luminal通过开源编译器和框架优化AI模型在不同硬件的运行性能,速度可提升10倍,服务过耶鲁大学;Herdora分析NVIDIA GPU性能瓶颈,曾帮客户部署Llama模型时降低67%延迟 [26]
农银汇理基金最新投研观点来了!
华夏时报· 2025-09-22 15:29
生活服务AI应用 - 某外卖平台内测生活Agent"小美" 实现一句话完成外卖下单全流程 支持复杂需求处理和消费偏好记忆 [1] - 该服务将传统"搜索浏览比价下单"链路简化为"我说它做"高效模式 基于消费行为实现个性化决策 [1] - 高德地图"扫街榜"覆盖全国300多城 专注帮助用户发现美食 与外卖平台形成"让想去"和"帮买到"互补 [1] - 未来两者打通将形成"发现决策下单履约"服务闭环 AI将围绕人的需求调动各类资源 [1] 办公协作AI转型 - AI办公工具从简单工具升级为"职场搭子" Notion AI和飞书等可根据自然语言一键生成项目计划和会议纪要 [2] - Canva和Beautiful.ai等工具自动完成排版 大幅降低非设计师创作门槛 [2] - 大模型能直接读懂表格并用自然语言解答业务问题 如"销售利润率为何下降" [2] - 办公AI从"听话执行指令"转向"理解上下文会推理能提建议" 重构企业人力结构和岗位职能 [2] 医疗健康AI升级 - AI医疗从"诊后辅助"走向"诊前陪伴" 海外医学大模型在专业考试中达到人类医生水准 [3] - AI应用贯穿诊疗全流程:诊前分诊风险评估 诊中辅助读片避免漏诊 诊后智能随访用药提醒 [3] - AI可能成为个人健康管家 降低诊疗门槛并为医生释放宝贵时间 特别有利于医疗资源分布不均地区 [3] 内容创作AI变革 - 谷歌图片生成大模型可几秒内渲染图文分镜角色 通过多轮对话微调效果 [3] - 作家可用AI推敲情节写初稿 视频博主可生成分镜脚本配音台词 设计师可快速尝试多种风格 [3] - AI大幅降低内容创作生产力门槛 释放创造力长尾供给 使每个人都能成为内容创作者 [3] AI进化趋势与投资逻辑 - AI正从被动工具转变为能主动理解规划执行任务的"通用智能代理" [4] - 平台核心竞争力转向"谁的AI最懂用户" 数据壁垒从流量数据转向行为偏好上下文 [4] - AI应用投资分三阶段:可用阶段关注铲子股和快速落地应用 好用阶段关注流程贯通公司和垂类一体化公司 替代阶段关注新流量入口和场景运营企业 [4]
搞碳化硅C轮融资超10亿丨投融周报
投中网· 2025-09-22 14:36
低空经济与出行赛道 - 微分智飞连续完成PreA轮和PreA+轮融资 总金额近2亿元人民币 投资方包括东方富海、洪泰基金、华映资本、深创投等机构[4][13][14] - 云枢智航完成近1亿元人民币天使轮融资 为安徽省宿州市首家低空经济解决方案综合服务商[4][18] - 星火空间完成5500万元人民币天使轮融资 由锦沙资本和合肥产投资本联合领投[10] 生物医药与健康产业 - 华龛生物完成数亿元人民币B+轮融资 为全球三维细胞规模化智造平台解决方案企业[4][26] - 恩瑞恺诺完成逾2亿元人民币A轮融资 由深创投、横琴创投和松禾资本共同领投[5][27] - 美央创新科技完成数亿元人民币Pre-A+轮融资 专注于AI驱动医疗机器人与医疗智能硬件创新[29] - 弘星相和完成近1亿元人民币Pre-A轮融资 由北极光创投领投[30] - 湃诺瓦医疗完成数千万元B轮首关融资 由集富亚洲领投[25] 半导体与硬科技 - 瞻芯电子完成超10亿元人民币C轮融资 专注于碳化硅功率器件和芯片方案[22][23] - 北极雄芯完成超1亿元人民币融资 引入无锡高新区科产集团等投资方[16] - 北极芯微完成超1亿元人民币A轮融资 由招银国际领投[21] - 磐盟半导体完成近1亿元人民币A轮融资 专注于半导体超纯刻蚀硅材料[19] - 灵明光子完成C3轮融资 累计获得浙江省国资平台近1亿元投资[9] 人工智能与互联网服务 - 生数科技完成数亿元人民币A轮融资 由博华资本领投 百度战投等老股东跟投[5][39] - Teable完成数百万美元天使轮融资 为AI Agent赛道新成员 投资方包括真格基金和百度风投[5][36] - 微盟集团获2亿美元融资 来自国际长线投资机构无极资本[37] - OneStar一星机器人完成数亿元"种子轮"融资 投资方包括百度风投、同创伟业等[15] 新能源与绿色科技 - 海德氢能完成新一轮战略融资 由蔚来资本等机构投资 老股东持续加码[11] - 禄海科技完成数千万A轮融资 由广润创投投资[12] - 塑新科技完成数千万元pre-A轮和pre-A+轮融资 专注于绿色科技[28] 新材料与先进制造 - 青昀新材完成数亿元人民币C轮融资 由元禾璞华领投[17] - 清力技术完成亿元级Pre-A轮融资 由清华大学教授领衔创办[20] 消费与零售 - 麒麟燚完成1860万元人民币A轮融资 为中式快餐创新企业 由智胜资本投资[7] 医疗与器械服务 - 星眸生物完成数千万元人民币A2轮融资 由凯风创投和国科创投共同投资[31] - 医鹭久歌完成数千万元人民币B轮融资 聚焦医疗器械出海领域[32] - 凯瑞医疗完成Pre-A+轮融资 由华西银峰独家投资[33] - 中科菁萃完成数千万元天使++轮融资 由湖南省财信产业基金投资[34]
周五小饭局报名,ChatGPT 和 Claude 报告带来的创业机会
投资实习所· 2025-09-22 13:42
核心观点 - OpenAI和Anthropic的用户行为报告显示ChatGPT已成为日常化产品,非工作用途占比显著增长至73%,而Claude主要聚焦专业生产力场景 [1][4][23] - 两类产品定位分化明显:ChatGPT覆盖广泛大众市场包括低中收入国家,Claude集中于企业级和高教育背景用户 [25][29][30] - AI应用以辅助协作为主(Anthropic报告中augmentation占比57%),完全自动化替代尚未成为主流 [12][13][26] 用户行为与增长趋势 - ChatGPT周活跃用户超7亿,2024年7月至2025年7月用户总消息量增长超5倍,老用户使用深度持续增加 [1] - 非工作用途消息占比从53%提升至73%,工作用途从47%降至27%,该转变源于用户习惯改变而非新用户结构变化 [2][4] - 三大核心话题类别为Practical Guidance(~29%)、Seeking Information(24%)和Writing(24%),合计占比77-80% [2][5] 使用意图与话题分布 - 用户消息意图分布:Asking(49%)、Doing(40%)、Expressing(11%),其中工作场景中Doing占比达56% [3][5] - Technical Help类话题比重下降(如编程仅占4.2%),Multimedia类从2%提升至7% [5] - 写作类需求从36%降至24%,信息寻求类从14%增长至24% [5] 用户人口统计特征 - 性别比例从80%男性主导变为近乎平衡,女性用户略占优 [7][8] - 46%消息量来自18-25岁用户,但工作用途随年龄增长而增加 [8] - 高教育用户更倾向工作用途:低于学士学位者工作消息占比37%,本科46%,研究生及以上48% [8] 职业与地域差异 - 技术/管理/工程类职业工作使用率更高,行政/体力类职业使用率低 [8] - 低中等收入国家用户增长更快,地域渗透率差异显著 [8][17] - Claude用户中计算机与数学类任务占比37.2%,艺术媒体类占10.3% [10] 企业级应用特点 - 仅4%职业的75%以上任务被AI覆盖,36%职业有25%任务涉及AI使用 [10] - AI应用集中在中高薪技术岗位,低薪体力劳动或极高责任岗位使用率低 [14] - 企业采用不均衡,技术发达地区和大企业使用率更高 [17][18] 产品定位对比 - ChatGPT覆盖年轻用户、多教育背景群体,非工作场景占主导 [25][30] - Claude聚焦专业任务和企业客户,用户多为中高教育水平的知识工作者 [25][30] - ChatGPT满足日常生活信息查询和娱乐需求,Claude侧重软件开发、写作编辑等专业任务 [25][28] 市场机会方向 - 非工作用途市场增长迅速,涵盖教育支持、生活助手、兴趣指导等场景 [28] - 企业级B2B用例价值高,付费意愿强,尤其技术开发和写作类任务 [28] - 低满意度领域(技术帮助、媒体生成)存在产品差异化机会 [22][30] - 低中收入国家市场拓展需结合本地化、语言支持和定价策略 [29]
AI Agent时代「顶格配置」:华为云,重塑算力格局
36氪· 2025-09-21 19:10
Lovart Beta版本上线5天内注册用户超过10万人;Genspark只用了9天就突破1000万美元ARR;"初代顶流"Manus更是一再刷新全球关注度纪录…… 2025年,全球AI Agent(智能体)市场再度迎来爆发,AI算力市场随之迎来了一轮新"狂飙"。 一方面,随着全球模型复杂度与大规模实时互动需求齐头并进,中外"AI算力"概念股狂飙。全球AI算力需求不仅没有因为"百模大战"的逐渐熄火而消退,反 而需求日盛。 另一方面,面对全球AI Agent热潮,AI算力的严重不足首当其冲,成本控制与弹性扩容成为企业面临的巨大难题,伴随而来还有配置和管理庞大的AI工具链 极为繁琐,全链条技术底座缺失。 如果说"百模大战"是这场比赛的Level 1,那么在通关以后,一个更难的Level 2摆在了所有人面前。 ——在"Agent为王"时代,如何在高并发、高吞吐的推理与训练场景中,实现算力效率的极致突破? 在华为全联接大会2025上,华为重磅宣布其"明星产品"CloudMatrix的云上超节点规格将从384卡升级到未来的8192卡;同时,会上还宣布CloudMatrix384 AI Token推理服务全面上线,并发布 ...
AI产业跟踪:通义首个深度研究Agent开源,看好AIAgent迭代及其商业化落地加速
长江证券· 2025-09-21 10:25
行业投资评级 - 行业投资评级为看好 维持[8] 核心观点 - 通义DeepResearch模型以30B-A3B轻量级在多个权威评测集上取得SOTA成绩 包括HLE(32.9) BrowseComp-ZH(46.7) GAIA(70.9) xbench-Deepsearch(75.0) WebWalkerQA(72.2) Frames(90.6)和SimpleQA(98.6)[2][5] - 模型采用原生ReAct模式(128k上下文)和深度模式双推理范式 支持多次迭代解决问题[10] - 建立从增量预训练到强化学习的端到端方案 通过合成数据驱动训练链路 创新IterResearch范式解决长周期任务处理问题[10] - 已在阿里系应用验证 包括高德出行Agent和通义法睿 未来将在企业战略 科研综述 法律合规等多场景落地[10] - 伴随国内Agent能力加速迭代和AI应用货币化开启 持续看好Agent商业化及投资机遇[2][10] 技术突破 - 以30B-A3B轻量级实现性能比肩海外旗舰模型ReAct Agent[10] - 采用On-Policy策略的RL算法 结合高效异步强化学习算法和自动化数据策展流程[10] - 形成"Agentic CPT→Agentic SFT→Agentic RL"的端到端循环训练链路[10] 商业化应用 - 高德出行Agent实现地图导航+本地生活的复杂查询体验[10] - 通义法睿提供权威类案检索 法条匹配与专业观点融合[10] - 未来应用场景涵盖企业战略 科研综述 法律合规 投研分析 电商选品和教育培训[10] 投资关注方向 - AI Infra领域重点推荐阿里巴巴[10] - AI Agent相关厂商[2][10] - 中国推理算力产业链[2][10] - CSP厂商推理需求推动[2][10] - 与阿里等大厂合作的IDC[2][10]
具身领域的大模型基础部分,都在这里了......
具身智能之心· 2025-09-21 00:03
社区定位与目标 - 社区旨在打造集视频、图文、学习路线、问答、求职交流为一体的综合类大模型技术社区,为初学者和进阶者提供交流与技术分享平台 [1] - 社区目标是成为大模型前沿技术聚集地,汇集来自国内外知名高校实验室及头部公司的嘉宾,高校包括上交、清华、北京大学等,公司包括阿里千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等 [3][68] 核心学习路线与内容 - 社区汇总了大模型全栈学习路线图,核心领域包括RAG、AI Agent和多模态大模型 [3] - RAG学习路线细分为Graph RAG、Knowledge RAG、多模态RAG、Reasoning RAG等8个子领域 [3][9][10][12][14][16][18][20][22][23][24] - AI Agent学习路线涵盖前沿综述、评测、强化学习、多模态Agent、Agent通讯等7个子领域 [25][26][28][30][32][34][35][37][39][41] - 多模态大模型训练路线包括开源数据集、MLLM、VLM、大模型微调、RLHF、MoE等9个技术方向 [42][43][45][47][49][51][53][55][56][57][59] - 社区扩展了大模型量化、部署及推理相关内容,以满足成员部署自有模型的需求 [61][62][63][64] 社区资源与福利 - 社区已邀请40余位学术界和工业界专家,来自国内外知名高校和头部公司 [68] - 成员福利包括第一时间掌握学术进展与工业应用、与行业大佬交流工作与求职问题、获得大模型相关岗位推荐及投资与项目对接机会 [7][70] - 未来计划不定期邀请行业大佬进行直播分享,内容可反复观看,旨在邀请国内外顶尖学术界和工业界专家 [66]