Workflow
Claude系列
icon
搜索文档
谷歌新模型2.5 Pro霸榜AI竞技场,开发者评价两极分化
第一财经· 2025-06-06 15:12
"榜一"光环难掩实际应用场景分歧。 北京时间6月6日,谷歌推出升级预览版大模型Gemini 2.5 Pro(0605),并表示这会在几周后成为正式的稳定版本,适用于企业级应用。 Gemini 2.5 Pro是谷歌旗舰模型系列,在前三个月公布了几个预览版,此前也一直在大模型竞技场LMArena排名第一,这一次更新的版本各方面的分数都超 过了此前的版本,继续排在榜一。 不过,第一财经也询问了一些开发者,他们认为,不能完全相信榜单,要看实际体验和绝大多数开发者的选择,此前Gemini的模型表现各有优劣,开发者评 价两极分化,目前刚出来大家或许要用一用才能有更客观的评价。 根据谷歌官方博客,最新2.5 Pro 在多项AI性能基准测试中取得了更高的分数,在 LMArena上Elo分数(衡量模型相对技能水平的评分)提升了24分,目前以 1470分的成绩保持领先。 在谷歌模型发布后,业界知名的测评方大模型竞技场 (lmarena.ai)发布了一份新的榜单,显示2.5 Pro新版在总分和所有子榜单位列第一,包括文本、视觉、数 学、创意等。 不过,"高分低能"的产品此前也有过,不乏开发者对这个榜单存疑。例如,从编程体验上来说, ...
腾讯研究院AI速递 20250605
腾讯研究院· 2025-06-04 22:24
生成式AI 一、 OpenAI 将为免费版的ChatGPT用户,提供轻量级记忆功能 1. OpenAI为免费版ChatGPT提供轻量级记忆功能,可根据用户对话习惯进行个性化回答; 2. 轻量级记忆功能(免费版)仅支持短期对话的连续性,用户可以体验基础的记忆功能,让 ChatGPT记住一些基本的用户偏好和对话内容 ; 3. 该功能对写作、金融分析、医疗跟踪等领域有显著帮助,用户可随时启用或禁用相关功 能。 https://mp.weixin.qq.com/s/K5PAi-iQ2Dcnip6Lw2gAFg 二、 ChatGPT的plus普通会员能用编程神器Codex了!支持联网 1. ChatGPT的CodeX编程工具现已向Plus会员开放,新增互联网访问、更新PR和语音输入 功能; 2. CodeX互联网访问功能默认关闭需手动开启,提供约70个安全白名单网站; 3. OpenAI在持续更新中,CodeX两周内已更新三次,奥特曼表示更多功能即将发布,如o3 pro模型等。 https://mp.weixin.qq.com/s/T2Xxw7mNdDH5O0yx5_Ewjw 三 、 将被 OpenAI 收购的 AI ...
AI大佬教你如何中顶会:写论文也要关注「叙事」
量子位· 2025-05-13 15:11
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI NeurIPS投稿数量破纪录了!Deadline还有不到一个月,如何让论文更容易中? 大佬的论文撰写指南它来了。 来自Google DeepMind的 Neel Nanda 在指导了20多篇论文之后,发布了一则关于如何写好机器学习论文的指南。 旨在帮助研究者将研究成果转化为 高质量、科学诚信 的论文,解决在表达上"晦涩难懂"的痛点。 So what? ——读者为什么要关心呢? 让我们一起来看看一篇优秀的论文该怎么写吧。 What? How? So what? Neel Nanda认为, 研究只有被人们阅读、理解、参与,甚至理想情况下相信时,才会有意义 。 What? ——一到三个符合连贯主题的具体新颖主张。 并且他提到 理想论文的精髓 在于 叙事 :讲述一个简短、严谨、基于证据的技术故事,并包含读者关心的要点。 How? ——你需要严谨的实证证据来令人信服地支持你的主张。 写论文要将研究压缩为核心主张,并用严格的实验证据支持,同时要让读者明白研究的动机、问题及影响。 论文写作关键要素 构建叙事 从研究中提炼出令人感兴趣、重要且独特的结果作为核心主张(1-3 ...
心智观察所:英伟达对他忍不住了
观察者网· 2025-05-09 08:17
中美AI竞争与Anthropic立场 - Anthropic公开支持美国政府对中国的AI芯片出口管制 认为这是确保民主国家在AI领域领先并捍卫自由价值观的必要手段 [1][7] - Anthropic将中美AI竞争框定为"民主AI"与"威权AI"的对决 警告中国AI可能被用于生成生物武器信息或破坏民主价值观 [7][9] - 英伟达强烈反对Anthropic的立场 认为中国拥有全球47%的AI研究人员和技术实力 监管无法遏制其发展 过度管制反而削弱美国企业竞争力 [1][8] Anthropic公司背景与发展 - Anthropic由前OpenAI研究人员创立 包括达里奥·阿莫迪和丹妮拉·阿莫迪等 团队深受有效利他主义哲学影响 [2][4] - 公司注册为公共利益公司 致力于开发"负责任"的AI Claude系列模型采用"宪法AI"框架确保输出安全性与价值一致性 [4] - Anthropic获得巨额融资 包括亚马逊125亿美元和谷歌50亿美元 推动其技术发展 2024年Claude 3系列在多项测试中超越对手 [5] 技术竞争与市场格局 - 中国AI企业如DeepSeek通过开源模式和价格优势挑战西方AI 其R1和V3模型性能接近美国最先进模型但成本仅为Claude 3.5 Sonnet的十分之一 [7][10] - DeepSeek采用混合专家模型和高效键值缓存技术 在算力优化和工程效率上取得突破 [10] - 中国AI生态在全球影响力扩大 开源模型在东南亚和非洲市场广受欢迎 而Anthropic的封闭生态和高昂费用限制其普及 [11][12] 行业分歧与战略考量 - 美国AI产业链内部分歧明显 芯片供应商如英伟达重视市场开放 模型开发者如Anthropic更担忧技术扩散风险 [8] - Anthropic支持出口管制的背后既有战略考量(延缓中国竞争者步伐) 也有意识形态驱动(民主与威权对决) [8][9] - 出口管制导致英伟达H20芯片预计损失55亿美元 凸显管制对美国企业的经济代价 [9] 全球AI治理与偏见争议 - Anthropic的"宪法AI"伦理标准被批评缺乏对非西方文化的适应性 西方模型被指带有明显美国西海岸偏见 [11][12] - 中国推动全球AI治理倡议和多边技术合作 而Anthropic支持的出口管制政策可能加剧全球AI生态碎片化 [12] - 研究表明AI模型的安全机制问题与开发者意识形态无关 西方模型同样存在生成有害内容的风险 [11]
MCP,AI时代的“书同文,车同轨”
21世纪经济报道· 2025-05-08 21:26
MCP协议发展现状 - MCP(模型上下文协议)旨在打造AI模型与软件间的通用接口,实现AI智能体功能,被类比为AI领域的"USB"或"Type-C"标准 [1] - 百度在Create2025大会上发布九大AI产品,重点推出电商交易MCP和搜索MCP,提出"全面拥抱MCP"战略 [1] - 阿里、腾讯、字节等国内互联网巨头2025年纷纷入局MCP,推动概念快速升温 [1] 技术路线竞争格局 - Monica公司采用"虚拟机+云计算"模式开发Manus AI,与MCP形成技术路线差异 [2] - MCP由Anthropic于2024年11月首次提出,早期反响平淡,后因Cursor/VSCode等工具支持而快速普及 [2] - OpenAI 2025年3月发布新版AI智能体SDK深度整合MCP,谷歌同期为Gemini添加MCP支持并推出互补协议A2A [3] 云计算厂商战略布局 - 微软联合Anthropic开发MCP工具包,推出MCP Server服务以强化Azure云生态 [3] - 阿里云推出"百炼平台"集成高德/支付宝等MCP服务,腾讯云TI平台提供微信支付/小程序场景的MCP插件托管 [3] - 字节跳动与华为基于自身云服务推出MCP SDK及Server解决方案 [4] 生态价值与行业影响 - MCP协议类似高铁铁轨,大厂通过自建MCP Server(高铁站)连接各类服务资源,形成生态竞争壁垒 [5] - 开放生态使MCP相比封闭式Manus方案更具扩展性,后者可能转型为MCP Client融入主流生态 [6] - 中金研报指出MCP处于"协议红利期",早期参与者可通过定义接口标准/积累工具资产构建结构性优势 [7]
前OpenAI首席技术官,正筹集20亿美元种子轮融资
证券时报· 2025-04-12 19:48
出走创业,顺便带走一波OpenAI骨干 去年9月底,米拉·穆拉蒂官宣从OpenAI离职,表示离职是因为想"进行自己的探索",此后她的去向便一直是大家关注的焦点。今年2月19日,米拉·穆拉蒂正 式宣布成立思维机器实验室,由于创业阵容强大而引发行业热议。作为推动OpenAI发展的关键人物,外界对米拉·穆拉蒂寄予厚望,认为其未来可能成为 OpenAI的强劲对手,本轮规模巨大的种子轮就彰显了资本对她的期待。 思维机器实验室,也是"吸金"机器。 据外媒报道,前OpenAI首席技术官米拉·穆拉蒂(Mira Murati)创办的AI创业公司"思维机器实验室"(Thinking Machines Lab)正在就种子轮筹集20亿美元 (约合人民币146亿元)的资金。若融资顺利完成,这家尚无任何产品发布的公司估值就将达到100亿美元,而且也将打破历史上种子轮的融资规模纪录。 作为人工智能领域的"顶流"公司,OpenAI在创业的早年间吸引了一大批行业最顶尖的人才,其中就包括米拉·穆拉蒂。 此前,业界一直流传着一张照片,照片中OpenAI最核心的四大成员集结合影,分别包括OpenAI首席执行官山姆·奥特曼、OpenAI总裁格雷格·布 ...
淘宝百补开始区域竞价,推动商品降价;教培和电商不及预期,新东方股价大跌;OpenAI攒局千亿美元AI基建投资丨百亿美元公司动向
晚点LatePost· 2025-01-22 21:56
淘宝百亿补贴区域竞价 - 淘宝百亿补贴上线区域竞价功能,商家可按省份竞价,前三名优先派单,天猫商家可享受交易佣金100%返还[1] - 调整目的是改善补贴商品价格不够低的情况,鼓励商家在区域内报出最低价并叠加官方补贴[1] - 拼多多2023年已实施类似模式,淘宝、京东等电商平台在百亿补贴各环节学习拼多多但尚未动摇其用户心智[1] 新东方业绩下滑 - 新东方2023年9-11月营收同比上升19.4%至10.39亿美元,经营利润同比下降9.8%至1930万美元[2] - K12辅导等新业务收入增速跌至40%左右,公司未更新学校和学习中心数量[2] - 剔除东方甄选后,预计收入增速将下滑7个百分点至18%-21%[2] 东方甄选业绩收缩 - 东方甄选2023年6-11月销售额同比下跌16%至48亿元[3] - 销售费用上涨24.3%至4.59亿元,净利润同比减少八成至3270万元[3] - 业绩受与董宇辉分家影响,同时公司引导消费者向自有应用程序迁移[3] AI基础设施投资 - OpenAI、软银、甲骨文合资公司计划投入1000亿美元建设AI数据中心,未来四年追加4000亿美元[4] - OpenAI负责运营,软银负责财务,孙正义担任合资公司董事长[5] - 投资规模占美国GDP比重相当于阿波罗登月计划和曼哈顿计划[6] TikTok收购动态 - 特朗普对马斯克或甲骨文董事长收购TikTok持开放态度[7] - TikTok美国业务估值约500亿美元,若有运营许可证可能价值1万亿美元[7] - 中国2020年限制出口名单对TikTok算法出售构成障碍[7] 日本旅游消费 - 2024年中国大陆游客访日人均消费27.7万日元(约1.3万元人民币)[8] - 中国大陆游客消费总额1.73万亿日元位居各国之首[8] - 访日游客数量中国大陆以698万位居第二,仅次于韩国881万[8] AI领域投资 - Google向Anthropic追加10亿美元投资,此前已注资20亿美元[9] - Anthropic估值达600亿美元,其Claude系列是OpenAI GPT主要竞争对手[9] 阿迪达斯业绩 - 2024年阿迪达斯收入同比增长12%,营业利润同比翻五倍至13.37亿欧元[10][11] - 毛利率提升3.3个百分点至50.8%,但仍未达到长期目标[11] - Yeezy系列曾贡献10%收入,终止合作后公司依靠Samba等复古产品线提振业绩[11] 中国奢侈品市场 - 2024年中国内地奢侈品销售额下降18%-20%至3500亿元,跌回2020年水平[12] - 消费者倾向出国购买,日本奢侈品可能比中国内地便宜近30%[12] - 贝恩预测2025年内地奢侈品消费外流将加剧,销售额与去年持平[12] 中国汽车进口 - 2024年中国汽车进口量同比下降12%至70万台,连续三年下滑[13] - 2014年峰值143万台后年均下降8%,2021年短暂持平于93万台[13] - 2022年起逐年下降分别为88万、80万和70万台[13] 蔚来机器狗项目 - 蔚来组建20人团队调研机器狗项目,负责人为前Momenta算法专家徐抗[14] - 具身智能是AI落地热门方向,特斯拉、小鹏、广汽等车企均已涉足[14] - 理想汽车CEO表示会做人形机器人但节奏不是现在[14] 小米汽车交付 - 2023年12月小米SU7交付2.58万辆超过特斯拉Model 3的2.1万辆[15][16] - 上市不到7个月交付10万辆,2024年全年交付13.5万辆[16] - 目前订购小米SU7需等待20-27周[16]