Workflow
Artificial Intelligence
icon
搜索文档
马斯克抢先谷歌一步放大招,Grok 4.1登顶LMArena,创意写作直逼GPT-5.1
搜狐财经· 2025-11-18 17:53
产品发布与定位 - xAI于2025年11月17日发布新一代大语言模型Grok 4.1,包含Grok 4.1和Grok 4.1 Thinking两个版本,二者基于同一底层模型,仅推理配置不同[6] - Grok 4.1对所有人免费开放,提供官网、X平台以及iOS和安卓移动APP版本[1] - Grok 4.1 Thinking是增强推理变体,使用"思考令牌"进行链式推理,适合复杂数学、编程或多步问题[6] 性能表现与基准测试 - 在LMArena文本排行榜上,Grok 4.1 Thinking以1483 Elo分数排名第一,比第二名Gemini 2.5 Pro高出31分[2][3] - 非推理版Grok 4.1以1465 Elo分数排名第二,超越其他厂商的推理模型[3][7] - 在EQ-Bench情商测试中,Grok 4.1获得1586 Elo高分,比上一代提升超过100点,占据榜单前两名[11] - 在Creative Writing v3创意写作测试中,Grok 4.1得分跃升至1722 Elo,较上一版提升近600分[17] 技术改进与能力提升 - 模型幻觉率从12.09%大幅下降至4.22%,降幅接近三倍[9] - FActScore指标从9.89降至2.97,事实准确性和可信度显著提升[11] - 上下文窗口扩展至256K tokens,Fast模式下可达200万tokens,增强长文档处理能力[22] - 通过大规模强化学习系统和前沿推理模型作为奖励模型进行训练重构,提升输出稳定性和事实判断[8] 用户体验与市场反馈 - 在为期两周的静默发布测试中,Grok 4.1的回答有64.78%的概率被用户选为"更好"[23] - 模型在情绪理解、创意写作和交互体验上有质变,回复更细腻自然,风格调节更稳定[15][21] - 实测显示模型能成功找出复杂逻辑题的2组解,并具备图像生成和根据图像生成视频的能力[27][31][33] 产品局限 - 在生成代码方面竞争力尚显不足[5] - 实测中发现其在统计中文字数时存在偏差[30]
高瓴、红杉一起投了一家出海销售Agent
36氪· 2025-11-18 17:53
公司概况与融资信息 - 前高瓴投资人、前有赞COO浣昉(Leo)创立的AI Agent公司Dealism已完成1500万美元天使轮融资[4] - 本轮融资由高瓴创投领投,红杉中国、线性资本跟投,为两轮合并交割,并包含创始人自有资金及多位个人投资者[4] - 公司于今年7月正式成立,目前团队规模在20人以内,总部设在新加坡,并计划向全球扩展[5][6] 核心产品与技术定位 - 核心产品为对话式销售Agent,主打“Vibe Selling Agent”概念,旨在成为能读懂客户心理、洞察情绪信号并推进成交的AI销售拍档[6] - 产品定位并非传统聊天机器人,而是基于目的驱动的对话Agent,具备理解用户身份与目标、自主与外部客户沟通以达成目标的能力[8] - Agent具备持续学习和记忆能力,可学习用户的语料、沟通风格及销售流程,并在情商、客户心理等“类真人”方面不断优化[8] - 目标是通过赋予每个销售人员一个“AI分身”,让普通创业者及副业从业者能轻松使用销售Agent[9] 市场定位与目标客户 - 主打拉美与北美市场,服务对象涵盖独立创作者、本地服务商、电商卖家等中小企业客户[6] - 目标客户层级偏Pro C和SMB,例如中国的出海品牌和外贸商[10] - 选择该市场是因为其整体“在线化”程度较低但进程快,人工成本高,沟通需求大但缺乏专业运营团队和现成CRM系统,Agent可填补空白[11] 商业模式与商业化进展 - 当前商业化模式按用户订阅+会话量计费,未来计划过渡到按结果付费[12] - 按结果付费的交付衡量已在某些特定行业和场景中接近直接成交,进展乐观[13] 行业前景与公司愿景 - 全球有1.5亿销售从业者,劳动力市场每年支出达3-5万亿美元,Agent若能替代其中一部分,市场潜力巨大[14] - 公司愿景是让全球销售个体都能拥有一个Agent,成为“新时代的超级个体”,并希望成为最早实现这一目标的企业[15] - 垂直类AI Agent被视为未来新的生产力形态,AI的智能和推理能力将解构并重构各行业岗位和工作流,导致组织规模和人力需求下降,团队生产力显著提高[17] - 预计未来先进组织规模将极小,管理重点从HR转向AR(Agent resource)[18] 创始人背景与竞争优势 - 创始人Leo在高瓴期间投资了有赞、Zoom、蔚来等项目,后在有赞任联席总裁与COO7年,负责公司商业化、销售体系与增长战略,管理数千人团队,每年预算超1亿美元[4][20] - 团队可能是在所有做AI的团队里最懂消费品的,基于在有赞时期服务数十万中国及海外to C消费品牌、覆盖所有行业与品类、每年促成超千亿GMV的经验[19] - 竞争优势在于深刻的行业认知、构建下一代产品交互形态的能力以及执行速度[22] - 创业灵感部分源于管理大型销售团队时,60%预算花在一线团队招聘培训,且许多优秀员工因重复性客户拓展工作而流失,AI Sales Agent可接管重复沟通,让人专注于更有价值的客户链接[20] 发展挑战与关键成功因素 - 最大难点在于对话式销售是去中心化的认知积累,需构建新产品交互形态使用户能给反馈、累积经验数据,让Agent持续学习变得更像用户,并积累交易全链路买家行为[21] - 胜出核心取决于深刻的行业认知、构建下一代产品交互形态的能力以及执行速度[22] - Agent替代生产力是一个十年周期、十万亿美元级别的事,现在行动是重要时机[23]
China's time-honored commercial port city Wenzhou to facilitate dialogue between East and West
Globenewswire· 2025-11-18 17:40
WENZHOU, China, Nov. 18, 2025 (GLOBE NEWSWIRE) -- From November 18 to 20, Wenzhou, a coastal city in east China's Zhejiang Province, will host 2025 Maritime Silk Road Urban Cooperation and Development Conference & The International Travel Agents Conference. A Media Snippet accompanying this announcement is available by clicking on this link. Highlighting integration, innovation and win-win cooperation, the event will create a range of exchange platforms, design supporting activities, and build a new transn ...
Linkup AI搜索接入GPTBots平台,开启企业智能体安全互联新时代
格隆汇· 2025-11-18 17:22
GPTBots.ai,企业级 AI 智能体平台的创新引领者,宣布与全球领先的 AI 网页搜索与内容集成服务商 Linkup 达成深度合作。此次合作,标志着新一代"互 联互通、合规安全"的 AI 解决方案正式落地,助力企业在业务应用中安全、智能地获取和利用实时高质量的互联网内容。 企业级灵活扩展 让企业AI智能体更强大:实时互联,安全合规 Linkup 的先进 AI 搜索 API 现已正式集成至 GPTBots 开放工具体系,进一步强化了平台在实时、高质量互联网内容获取、数据安全与合规等方面的技术 优势。此次合作不仅丰富了 GPTBots 智能体的知识广度和信息时效性,更为企业用户提供了"互联+合规"双重保障,赋能客户服务、合规管理、智能分析 等多元业务场景的创新升级,加速企业智能化转型进程。 合作亮点一览: 智能互联,信息触手可及 基于 GPTBots 构建的 AI 智能体现可利用Linkup的实时精准网页搜索,提供更丰富、更相关的答案和建议,有效连接企业系统与全球信息。 合规为本,安全无忧 GPTBots 与 Linkup 均以企业级安全和隐私为核心,全面通过 SOC 2 Type II 合规认证,为各类业 ...
顶尖AI大会调研“你会做空哪家初创公司?”,排名第一是Perplexity,第二是OpenAI
硬AI· 2025-11-18 17:04
文章核心观点 - 在一场硅谷AI行业峰会的非正式调查中,Perplexity和OpenAI被与会者选为最可能失败的高估值AI公司,反映出行业内部对当前AI泡沫的普遍担忧 [1][2] - 尽管存在看空情绪,但市场对头部企业前景存在巨大分歧,高风险与高回报并存是当前AI投资领域的真实写照 [10] - 许多资深投资者认为当前确实处于AI泡沫中,但这符合技术周期规律,最终只有少数公司能存活并成长为行业巨头 [10] Perplexity的估值与市场看法 - Perplexity在“做空”调查中高居榜首,被视为AI泡沫的典型代表 [1][5] - 该公司正以惊人速度进行多轮融资,估值从140亿美元一路飙升至高达500亿美元,这种快速攀升的估值使其成为泡沫论的“海报男孩” [5] - 对于调查结果,Perplexity发言人回应称“这听起来更像是一个爱评头论足的山谷峰会” [5] OpenAI的财务可持续性担忧 - OpenAI在调查中位列第二,其不断膨胀的估值和对基础设施的巨额支出承诺让部分投资者感到不安 [1][7] - 公司高达数万亿美元的基础设施支出计划引发对其财务可持续性的担忧,特别是其年收入130亿美元与1.4万亿美元支出承诺的对比 [7] - 当被质疑公司估值被夸大时,首席执行官Sam Altman强力反驳,并表示可帮助质疑者寻找股份买家 [7] 市场分歧与行业共识 - 在另一项“看涨”调查中,Perplexity和OpenAI同样上榜,表明市场对这些公司的未来预期存在巨大分歧 [10] - 在“看涨”榜单中位列第一的是Anthropic,该公司正在探索新一轮融资,估值可能高达3500亿美元 [10] - 峰会的一个共识是确实处于AI泡沫中,但资深投资者认为这符合技术周期规律,最终会有几十家公司规模巨大,少数几家成为改变时代的公司 [10]
2025年度AI落地案例征集|量子位智库
量子位· 2025-11-18 17:00
量子位智库 发自 凹非寺 量子位 | 公众号 QbitAI AI ,作为当前时代最耀眼的前沿科技,为社会创新、生产效率和生活质量的变革带来无数 机遇 。 AI时代的变化日新月异,却仍有迹可循,需要我们选准落地领域、准确洞察时间点,把握成果转化和产业变革的风向。 与AI发展共进之时,许多问题,每一年都值得进行年度复盘、思考和回答—— 五年来,量子位智库坚持对全年度科技趋势进行总结和展望,每年末推出 「十大趋势系列报告」 ,并与阿里达摩院、百度研究院、腾讯研 究院出品的年度趋势一起,成为科技产业内的 4大科技趋势参考 。 2024年起,「报告」聚焦于提名正在释放巨大潜力的AI十大趋势,我们关注到新型架构与推理能力的变化、世界模型和空间智能的发展、 多模态和Agent在应用领域的表现……这些趋势不但在2025得到了印证,也成为每位AI关注者的关键词。 一直以来,「十大趋势系列报告」正是期望帮助更多人关注到各项科技正在发生的变革、提早参与科技创新、投身其中并驾驭每一次变革的 巨浪。 关键的趋势可能会迟到,但一定会到达,还会在更多的关注下加速实现。所以2025年量子位智库将继续锚定AI这一科技发展的主旋律,面 向全产学 ...
正面硬刚谷歌和OpenAI!马斯克旗下xAI突然出手
新华网财经· 2025-11-18 16:34
模型性能表现 - Grok 4 1在大模型竞技场文本排行榜上位居首位 其具备深度思考能力的版本Grok 4 1 Thinking Elo分数为1483 非推理模式Elo分数为1465 [1][2] - 与线上生产模型相比 在对比评估中有64 78%的概率被用户偏好选择 [2] - 模型幻觉率显著降低 从12 09%下降到4 22 减少近三倍 [4] 核心能力提升 - 情感智能是重要迭代方向 在EQ Bench3测试中推理模式和非推理模式位居榜单前两名 能够更敏锐感知细微意图 个性更加一致 [2] - 通过案例展示 对情绪类提示的回应更具真实同理心和细节 文笔更好 [3][4] - 创意写作能力显著提升 文学表达和戏剧张力明显增强 [4] 技术实现路径 - 公司沿用Grok 4的大规模强化学习基础设施 应用于优化模型风格、个性、实用性和一致性 [5] - 开发新方法 利用前沿的智能推理模型作为奖励模型 以大规模自主评估并迭代输出结果 [5] 行业竞争态势 - 模型发布时机恰逢谷歌即将揭晓新一代Gemini模型前夕 行业竞争加剧 [1][6] - 此次迭代方向与OpenAI发布的GPT 5 1一致 均旨在实现更富有人情味的交互体验 [2][6]
“组团出海”助AI企业切入全球赛道
北京青年报· 2025-11-18 16:26
出海战略背景 - 面对国内市场日趋激烈的竞争,出海已成为中国AI企业开拓增量市场的核心战略 [1] 服务体系建立 - 首批“中关村人工智能企业出海服务港”揭牌,由4家机构作为挂牌主体,聚焦AI企业出海的现实痛点与共性难题 [1] - 出海服务港提供出海前的一站式服务,包括政策咨询、合规培训、材料预审 [1] - 出海服务站扎根海外,提供当地资源链接、市场渠道拓展、供需对接、应急与维权等服务,成为企业在海外市场的“前哨” [1] - 服务体系实现“出海前有指引,出海后有支撑”的全流程服务保障 [1] 挂牌机构优势 - 中关村京港澳青创中心凭借跨境孵化经验与港澳资源,构建分层服务体系,已成功协助瑞莱智慧、云迹科技、中科闻歌等AI企业落地香港数码港 [2] - 中发展集团在全球设立20个创新网络节点,与马来西亚柔佛机构签署协议,依托“柔佛-新加坡经济特区”服务AI等企业拓展东盟市场 [2] - 北京启迪创业孵化器以“启迪之星”为品牌,在全球布局200多个孵化器,正与新加坡联合推出“启新汇”项目助力AI企业合作 [2] - 中关村科学城公司布局三大海外加速器、六个海外加速站,正推进中关村迪拜海外联络处建设,助力AI企业进军中东市场 [2] 出海模式与成果 - 在“组团出海”新模式推动下,企业从单打独斗走向生态协同 [3] - 北京以广西为“桥头堡”搭建面向东盟的出海枢纽,推动智谱AI、数据堂、爱诗科技等企业将底层算力、大模型、数据集及AI产品整体落地东盟多国 [3] - 出海模式实现从技术出海到“产业链输出”的升级 [3]
成都人工智能数字贸易中心今日正式启动运营
中国新闻网· 2025-11-18 16:16
当日的启动及开馆仪式上,成都成商未来人工智能公司与8家人工智能企业签署战略合作签约,和10家 高校进行校企合作签约。同时,博士后流动站科创基地授牌(成都理工)、30亿元"成都成商未来数智创 业投资合伙企业(有限合伙)"基金也在现场发布。在当日下午举办的人工智能数字贸易产教融合发展 (2025)高峰论坛上,企业、高校代表围绕"如何构建产学研一体化AI生态"展开深入研讨。 中新网四川新闻11月18日电 (唐倩)11月18日,成都人工智能数字贸易中心在成都国际商贸城启动运营。 启动仪 式。成都成商未来人工智能公司 供图 成都人工智能数字贸易中心AI应用体验馆也同时亮相,展厅约5000平方米,是项目整体规划的浓缩展 示窗口,兼具接待功能与沉浸式体验属性,勾勒人工智能应用的未来图景。AI应用体验馆将演示40万 平方米数字贸易中心整体规划,并设置互动体验区。体验馆展示了智能机器人、智能穿戴、低空经济、 智慧医疗、智慧办公等领域的AI应用,吸引了云深处、中科星图、科大讯飞、宇视、灵伴等30余家企 业产品入驻,展现各领域AI应用的市场吸引力。 据成都成商未来人工智能公司董事长孙正川介绍,成都人工智能数字贸易中心是成都国际商贸 ...
大泽湖新增一家上市公司区域总部!佳都科技中南区总部入驻大泽湖海归小镇
长沙晚报· 2025-11-18 16:04
公司战略布局 - 佳都科技集团中南区总部正式入驻长沙望城区大泽湖海归小镇·湘商总部基地 [1] - 公司将建设"一总部三中心",包括中南区总部、第二研发中心、中南区域交付中心和企业数字化转型运营中心 [1] - 此举旨在打造集科研创新、成果转化、产业孵化于一体的高能级平台,为认知智能等前沿技术领域攻关提供支撑 [1] - 公司未来将依托该总部作为战略支点,持续加大研发投入,推动创新技术在智慧轨道交通、智慧城市交通等领域的规模化应用 [3] 技术实力与行业地位 - 佳都科技是上海A股主板上市公司、国家级人工智能开放创新平台企业 [1] - 公司是人工智能、智慧轨道交通等多条产业链的链主单位,技术实力与行业影响力领跑全国 [1] - 公司曾携手广州地铁、中铁电气化局等产业链伙伴投资参建长沙地铁6号线,整合了百余家上下游生态资源 [1] - 该项目成功打造了长沙首条智慧地铁线路,并已成为全国智慧城轨建设的典型标杆 [1] - 公司展示了在智慧轨道交通、智慧城市治理、交通鸿蒙操作系统、AI大模型等前沿领域的技术成果与应用实践 [3] 区域发展与产业协同 - 公司选择落户长沙是响应国家区域协调发展战略、优化全国业务布局的重要举措,看中其优越的区位条件、完善的产业生态和一流的营商环境 [2] - 公司已在大泽湖设立中南区总部与全球认知智能研究院,组建了规模逾百人的研发团队 [2] - 作为产业链主导企业,公司将发挥引领和桥梁作用,引导更多优质企业来湘投资,促进人才、资本、技术等创新要素在湖南高效集聚 [2] - 公司致力于与湖南共同打造具有全国影响力的数字产业集群,助力长沙智慧城市建设和数字化转型升级 [2][3]