AI数学
搜索文档
腾讯研究院AI速递 20260316
腾讯研究院· 2026-03-16 00:01
Claude模型更新与定价策略 - Opus 4.6和Sonnet 4.6模型正式全面开放100万上下文,并取消长文本溢价,所有长度统一标准计费,Opus每百万Token收费25美元,Sonnet每百万Token收费5美元 [1] - 多模态处理能力提升6倍,单次请求支持的图像或PDF页面上限从100页大幅增加至600页,API长请求可自动处理无需Beta请求头 [1] - 在MRCR v2评测中,Opus 4.6以78.3%的得分位列同级模型第一,Claude Code用户可默认开启百万上下文,大幅减少强制压缩次数 [1] OpenClaw平台迭代与安全升级 - OpenClaw 2026.3.12版本发布,控制台UI重构为模块化视图,模型“快速模式”统一抽象跨平台调用参数,并将Ollama/vLLM/SGLang迁入provider-plugin架构为生态扩展奠定基础 [2] - 新增Kubernetes部署starter方案和sessions_yield多智能体调度机制,推动平台从“能跑”向适合长期部署和生产使用转型 [2] - 修复两项高危安全漏洞:设备配对改用短时bootstrap token防止凭证泄露,工作区插件禁用隐式自动加载防止恶意代码执行 [2] Google Maps AI与3D导航升级 - Google Maps引入沉浸式3D导航,借助Street View数据和Gemini AI进行空间理解,实时高亮车道和红绿灯,并新增“透视建筑”功能以帮助复杂路口决策 [3] - 推出Ask Maps自然语言对话搜索功能,基于超过3亿个地点和超过5亿条用户评价,可处理多条件模糊需求并支持多日旅行规划和个性化推荐 [3] - 对比显示,谷歌的优势在于全球数据规模与AI语义理解,而高德则在本土场景密度和城市级数据协同上更为深入 [3] Perplexity放弃MCP协议转向CLI - Perplexity CTO宣布内部放弃MCP协议,转而使用API和CLI,Duetchat v2也删除了MCP集成,YC总裁直言“MCP sucks”,该协议正走向边缘化 [4] - MCP协议的核心问题在于线性上下文成本高,每个工具的Schema和描述会挤占Agent的上下文窗口,且存在初始化不稳定、反复认证和权限管理粗糙等实用缺陷 [4] - CLI经过数十年迭代,具备可组合、可调试、人机通用的优势,LLM本身擅长使用命令行工具,无需额外抽象层即可高效完成任务 [4] 生数科技发布AI漫剧解决方案 - 生数科技Vidu Q3发布全球首个专门针对AI漫剧的解决方案,从底层算法专为漫剧量身定制,旨在解决“角色变脸、画风跳跃、分镜不连贯”等行业痛点,实现30个分镜不穿帮、非人型角色跨镜头稳定复用 [5] - 推出主体库2.0建立标准化角色资产库、提示词优化Bot可一句话生成分镜、口型分层处理实现音画同步,配合解说漫API可实现剧本直出成片 [6] - 即将上线“参考生”功能,可从参考视频学习动作运镜风格以生成原创内容,并与万兴科技联合发布“万兴剧厂”平台以推进AI漫剧工业化 [6] xAI人事动荡与战略调整 - xAI本周又有两位华人联创Zihang Dai和Guodong Zhang离职,11位联合创始人仅剩2人,2026年初的密集离职潮涉及Greg Yang、Tony Wu、Jimmy Ba等核心研究负责人 [7] - 前员工爆料xAI名为扁平实则官僚化严重,员工主动征集Grok改进建议反被冻结账号,与宣传文化严重脱节 [7] - 马斯克承认Grok编程落后竞争对手,表示“第一次没建对要从头再来”,SpaceX收购xAI后计划于2026年6月启动IPO,目标估值超过1.75万亿美元 [7] 谷歌AlphaEvolve在数学领域突破 - 谷歌AlphaEvolve一次性改进了R(3,13)、R(3,18)、R(4,13)、R(4,14)、R(4,15)五个经典拉姆齐数下界,刷新了纪录,部分纪录已尘封20年 [8] - 其核心思路是在算法空间而非图空间进行搜索,利用LLM进化代码,自动发现四大类搜索策略,其中包含人类文献中不存在的新方法 [8] - Hassabis称其为AI数学领域又一里程碑,AlphaEvolve已形成“算法优化算法”的飞轮效应,但目前仅能处理构造性下界,无法证明上界 [8] LabClaw开源AI科研技能库 - 斯坦福与普林斯顿联合开源LabClaw,这是一个面向生物医学的开源科研技能库,内含211个生产级SKILL.md文件,覆盖文献检索、数据分析、实验记录等全流程,一条指令即可在OpenClaw中调用 [9] - 可部署为Always-On Lab Agent持续读取仪器数据和实验记录,自动触发分析流程并生成报告,配套LabOS系统实现XR眼镜与实验机器人的人机协同实验 [9] - 该项目由斯坦福丛乐教授和普林斯顿王梦迪教授团队联合推出,获英伟达支持,将AI辅助科研门槛降至“一条指令”级别 [9] 人形机器人高动态运动突破 - 银河通用人形机器人联合清华大学提出LATENT方法,使机器人仅从碎片化不完美动作数据中自主学习网球技能,无需预编程即可完成多回合连续对打 [10] - 核心创新包括“运动技能空间”将零散动作整合为可组合技能、“隐空间动作屏障”确保高动态击球同时保持自然流畅动作,在成功率和精准度上全面超越基线算法 [10] - 银河通用已形成硬件-模型-生态完整闭环,产业落地覆盖工业、零售、仓储物流、医疗康养等领域 [10] AI对职业替代风险的评估 - Karpathy抓取美国劳工统计局全部342个职业数据,用LLM逐一评估AI暴露分数(0-10分),制作交互式热力图,整体加权平均风险为4.9分 [11] - Anthropic真实使用数据显示,AI暴露最高的全是白领知识型工作,高暴露群体平均时薪比低暴露群体高47%,核心规律是“工作离屏幕越近离失业越近” [11] - AI暴露高不等于立即失业,例如软件开发者虽评分8-9分但就业仍预计增长17.9%,真正危险的是需求固定且AI替代效果好的岗位如数据录入和医疗转录 [11]
24岁,她融资4亿,来自广州
华尔街见闻· 2025-10-06 20:13
公司融资与估值 - Axiom Math完成首轮6400万美元(约合人民币4.6亿元)融资,由B Capital领投,Greycroft、Madrona和Menlo Ventures等机构参与 [2] - 公司投后估值达到3亿美元(约合人民币20亿元) [2] - 公司核心团队目前仅有10名全职员工 [6][9] 公司技术与业务模式 - 公司定位为以AI数学家为起点,打造能够自我提升的超级智能推理系统 [6] - 核心模型旨在解决复杂数学问题,能生成详细的推理步骤并进行验证 [7] - 技术路径是将教科书、论文和期刊中的英文数学内容转换为程序化知识,使AI能解决并验证数学问题 [7] - 未来研究场景有望拓展至金融建模、芯片架构及量化交易等领域 [7] - 创始人设想该模型未来或能提出新的数学猜想,从而产生全新知识 [8] - 公司认为当前正站在一场由人工智能、编程语言和数学三大支柱推动的数学复兴门槛上 [8] 创始人及团队背景 - 创始人洪乐潼(Carina Hong)为00后,24岁,在广州出生长大,曾就读于华南师大附中并多次获得奥数竞赛奖牌 [2][12] - 其教育背景包括麻省理工学院数学和物理双学位、牛津大学神经科学硕士,并曾进入斯坦福大学攻读数学与法学博士 [2][13] - 学术成就包括获得Schafer数学卓越奖(每年仅颁发给一名本科女生)以及北美数学本科生最高荣誉摩根奖(第五位获此殊荣的女生) [13] - 2022年底获得牛津大学罗德奖学金,成为当年仅有的四名中国获奖者之一 [13] - 公司CTO Shubho Sengupta曾领导Meta FAIR团队,开发OpenGo和CrypTen,并是早期CUDA技术专家之一 [11] - 团队其他成员包括前Meta人工智能研究科学家François Charton和Hugh Leather,他们在AI与数学交叉领域有深厚积累 [11] 行业趋势:00后创始人崛起 - 00后创始人正集体登上AI舞台,成为创投圈新面孔 [5][15] - 案例包括麻省理工00后创立的Sola Solutions,总计完成2100万美元(约合人民币1.5亿元)融资 [15] - AI编程独角兽Anysphere完成9亿美元(约合人民币65亿元)融资,估值达90亿美元,由麻省理工毕业生创立 [16] - AI招聘网站Mercor完成1亿美元B轮融资,估值达20亿美元,由三位从哈佛及乔治敦大学退学的00后创立 [16] - 国内案例包括清华三位00后创立的机器人公司零次方,完成亿元级融资 [17] - 投资人分析认为,在AI创业潮中,00后创始人因对新事物认知触感更强、没有历史包袱而具备优势 [17]
形式化证明与大模型:共创可验证的AI数学未来|量子位直播
量子位· 2025-05-27 11:53
大模型数学推理能力发展 - 5月DeepSeek Prover V2发布 陶哲轩AI数学直播举行 谷歌AlphaEvolve推出 显示大模型解数学题能力成为衡量AI智能天花板的关键指标[1] - FormalMATH基准测试近期发布 旨在系统评估AI数学推理能力 自动定理证明表现与技术路径成为行业焦点[2] 行业技术研讨活动 - 5月29日20:00举办大语言模型形式化证明前沿探索直播 由2077AI开源基金会与多个项目团队联合发起[2] - 参与嘉宾包括DeepSeek Prover第一作者辛华剑 FormalMath项目郁昼亮 Kinima技术负责人王海明等7位学术与工业界专家[3] 行业生态互动 - 量子位策划AI主题征集活动 涵盖365行AI落地方案与一千零一个AI应用案例 鼓励分享AI产品新动向[4] - 量子位每日AI交流群开放加入 提供科技前沿进展每日更新服务[5]