Workflow
通用人工智能
icon
搜索文档
2024科技投入234.5亿元,蚂蚁AI聚焦金融、医疗
搜狐财经· 2025-07-01 11:31
公司发展 - 2024年员工数量从29740人增长至36559人,增幅超20%,主要源于AI技术研发和全球化业务布局投入 [4] - 研发投入达234.5亿元,较2023年211.9亿元增长10.67%,资金主要投向人工智能及数据要素技术、分布式计算及安全领域 [4] - 董事长致辞中"AI"提及次数从2023年4次增至2024年15次,显示战略重心转向人工智能 [3][4] AI战略布局 - AI应用覆盖金融、医疗、生活场景,推出健康管家、理财管家、生活管家三大AI产品,累计服务用户超1.3亿,43%来自三线及以下城市 [5] - 医疗领域发布独立App"AQ",基于医疗大模型提供上百项功能,连接全国超5000家医院、近百万医生及200个名医AI分身 [6] - 金融领域升级AI理财助理"蚂小财",联合行业伙伴推出超百个金融智能体解决方案,网商银行计划转型为AI银行,服务6800万小微经营者 [9][10] 支付业务创新 - "碰一下"支付用户数超1亿,覆盖400个城市、5000+品牌及千万商家,拓展至300种细分场景 [11] - 投入40亿"服务商激励计划"和"商家百亿助力计划"推广"碰一下",目标重塑用户服务入口 [13] - Alipay+覆盖70多个市场,连接17亿消费者账户和1亿商户,与微信支付的掌纹支付、虹膜支付形成技术竞争 [14] 医疗数字化进展 - 支付宝激活医保电子凭证超6.6亿用户、亲情账户6800万,1517家医院提供线上医疗服务 [8] - 好大夫在线问诊服务累计用户超1500万,收购后加速整合医疗资源与AI技术 [6][8]
被Meta连挖8人后,OpenAI坐不住了
华尔街见闻· 2025-06-30 18:43
硅谷AI人才争夺战升级 - Meta近期展开针对OpenAI的"挖角行动",一周内挖走8名顶尖研究人员,其中包括4名华人核心研究员,他们均为OpenAI核心项目(如o3、GPT-4系列等关键模型)的负责人[1] - Meta为部分研究人员提供高达1亿美元的签约奖金,虽Meta高管对此数字在内部进行了反驳[2] - 扎克伯格采取特别积极的招募策略,甚至亲自联系潜在招募对象[1] OpenAI人才流失危机 - OpenAI首席研究官Mark Chen在内部备忘录中表达震惊和不满,称公司正在"重新校准薪酬"并承诺采取"创造性方式来认可和奖励顶尖人才"[1] - 被Meta挖走的8名研究员中包括4名华人技术骨干:Jiahui Yu(o3、o4-mini及GPT-4.1项目主导者)、Hongyu Ren(o3-mini和o1-mini模型创造者)、Shuchao Bi(多模态模型后训练团队负责人)、Shengjia Zhao(GPT-4和o1项目关键贡献者)[3][5][7][9] - OpenAI员工面临每周80小时的高强度工作压力,这为竞争对手的招募创造了机会[3] OpenAI应对措施 - OpenAI首席研究官Chen承认公司过于专注于常规产品发布和与竞争对手的短期比较,现在需要重新聚焦于实现通用人工智能这一"主要任务"[11] - OpenAI将重新评估和调整薪酬体系,设计更具创造性的激励方案,但强调不会为了留住某些人而破坏对其他员工的公平性[12] - OpenAI安排一周的集体休假让员工"充电",但担心Meta可能利用这个机会施压并做出"荒谬的、有时间限制的爆炸性offer"[12]
只用2700万参数,这个推理模型超越了DeepSeek和Claude
机器之心· 2025-06-30 18:23
大模型架构变革 - 当前大语言模型(LLM)采用思维链(CoT)技术存在任务分解复杂、数据需求大、高延迟等问题 [2] - 分层推理模型(HRM)通过循环架构实现高计算深度,仅需2700万参数和1000个训练样本即可在复杂推理任务中表现卓越 [3][4] - HRM无需预训练或CoT数据,在数独、迷宫路径查找等任务中达到近乎完美性能,并在ARC-AGI基准上超越更大模型 [5][7] HRM设计原理 - 核心灵感源于大脑分层处理和多时间尺度机制:高级模块负责抽象规划(慢速),低级模块处理细节计算(快速) [12][13] - 采用四个可学习组件(输入网络、高低级循环模块、输出网络)实现层级收敛性,H模块稳定收敛,L模块周期性重置 [14][15][17] - 通过一步梯度近似法(O(1)内存)和深度监督机制优化训练效率,避免传统BPTT算法的深层信用分配难题 [19][20][23] 性能与实验验证 - 在ARC-AGI、数独、迷宫任务中,HRM表现出类似深度优先搜索和渐进优化的底层推理算法 [31] - 训练后高层模块与低层模块自然涌现维度层级分化,而非架构固有特性 [33][34] - 具备图灵完备性,可模拟任何图灵机,通过自适应计算时间(ACT)动态调整资源分配 [35][36][27] 技术对比优势 - 相比CoT模型,HRM在符号树搜索任务(如Sudoku-Extreme)中准确率接近100%,而标准Transformer增加深度无效 [10] - 强化学习(RL)需依赖CoT能力且数据效率低,HRM通过密集梯度反馈实现连续空间运算,生物合理性更高 [37][39] - 推理阶段仅需调整计算限制参数Mmax即可扩展性能,无需重新训练 [28]
AI专家给奥特曼泼凉水:纯LLM从未真正理解世界,以此构建AGI没希望
36氪· 2025-06-30 17:29
通用人工智能发展现状 - OpenAI首席执行官认为通用人工智能即将实现[2] - 认知科学家马库斯指出生成式AI缺乏稳健世界模型是致命缺陷[2][3] - 苹果公司研究揭示大语言模型在逻辑推理和数学计算中频繁出错[3][4] 大语言模型的结构性缺陷 - 大语言模型依赖语料统计而非世界建模 无法跟踪事件进展或理解因果关系[7][9] - 模型缺乏动态更新的内部数据结构 如事件变量和角色状态[9][10] - 在象棋等规则明确任务中频繁违规 如棋子横向移动或跳马吃子[4][10][14] 世界模型的核心价值 - 世界模型是智能系统感知和追踪现实的核心框架 人类和动物均具备该能力[5][8] - 传统AI设计以世界模型为基础 如图灵1949年象棋程序包含动态棋盘模型[6][9] - 当前大语言模型放弃世界建模 仅依靠语言统计模拟思维过程[9][11] 缺陷导致的系统性风险 - 生成内容存在"知识错觉" 如虚构书籍标题或错误计算8.8-8.11=-0.31[13][17] - 图像生成违反常识 如绘制五条腿的狗或倒挂姿势错误[17][21] - 视频理解遗漏关键行为 如忽略猴子抢包的核心事件[21][22] 商业应用中的具体问题 - Anthropic实验显示AI经营商店时持续亏损并做出反逻辑决策[23] - 模型无法理解商业基本概念 如顾客结构或定价策略[23] - 在井字棋测试中 替换符号即导致模型丧失胜负判断能力[23] 安全与责任隐患 - 系统提示限制易被绕过 如详细生成化学武器制作指南[25] - 生成危险建议时缺乏生死概念 如论证被车撞有益健康[25] - 医疗法律等关键领域出现虚构案例或错误建议[24][26] 行业技术路径争议 - 主流模型依赖参数规模和数据量 忽视结构化世界理解[11][15] - 统计拟合无法替代模型驱动的设计路径[15][16] - 智能系统必须构建可更新的世界模型而非依赖语言统计[11][28]
安徽智能算力两年多来提升约37倍
中国新闻网· 2025-06-30 14:15
安徽省人工智能产业发展 - 安徽省智能算力从2023年初800P跃升至3万P,提升37倍 [1] - 已集聚人工智能规上企业894家、产业链关联企业1 2万家 [1] - 2024年安徽人工智能产业发展评价居全国第5位,仅次于北京、广东、上海、浙江 [1] 政策支持与平台建设 - 安徽获批国家新一代人工智能创新发展试验区、新一代人工智能公共算力开放创新平台等国家级创新平台 [1] - 承担国家数据要素综合试验区建设任务,合肥成为长三角唯一数据标注基地建设试点城市 [1] - 全国率先出台通用人工智能发展三年行动计划和专项政策,系统谋划大算力、大模型、大应用 [1] 技术研发与产业应用 - 科大讯飞联合华为开展国产软硬件底座研发,部署59个人工智能攻关项目,引导企业研发投入11 5亿元 [1] - 九韶智能研发九韶内核4 0版填补我国商用工业软件底层内核技术空白 [2] - 海螺集团联合华为发布水泥行业首个人工智能大模型,单条产线年减碳4500吨 [2] 场景开放与投资增长 - 围绕工业、教育、医疗等领域开放"人工智能+"场景机会300余项 [2] - 2024年招引人工智能落地项目超1000个,拟投资金额超4000亿元,同比分别增长46 8%和34 6% [2]
连挖四名顶尖华人,Meta疯狂对OpenAI”挖墙角“
华尔街见闻· 2025-06-30 08:39
人才争夺战升级 - Meta展开强烈"挖角行动",过去一周从OpenAI挖走八名顶尖研究人员,其中包括四名华人核心研究员[1] - 被挖走的研究人员均为OpenAI核心项目负责人,涉及o3、GPT-4系列等关键模型[1] - Meta为部分研究人员提供高达1亿美元的签约奖金,但Meta高管对此数字在内部进行了反驳[1] OpenAI应对措施 - OpenAI首席研究官Mark Chen表示公司正在"重新校准薪酬",并承诺采取"创造性方式来认可和奖励顶尖人才"[1] - 领导层以前所未有的积极态度采取行动,核心措施包括重新评估和调整薪酬体系,并设计更具创造性的激励方案[2] - OpenAI安排一周集体休假让员工"充电",但担心Meta可能利用这个机会施压并做出"荒谬的、有时间限制的爆炸性offer"[2] 人才流失影响 - 四位华人研究员均为OpenAI内部公认的技术骨干,涉及多个关键项目[3][5][7][9] - Jiahui Yu主导o3、o4-mini及GPT-4.1项目,担任GPT-4o图像生成研究顾问[3] - Hongyu Ren是o3-mini和o1-mini模型的创造者,负责后训练团队工作[5] - Shuchao Bi担任多模态模型后训练团队负责人,研究领域涵盖后训练新范式、多模态推理等[7] - Shengjia Zhao是GPT-4和o1项目的关键贡献者,专注于ChatGPT以及GPT-next项目开发[9] 行业竞争态势 - Meta大幅提升研究招募力度,特别关注来自OpenAI和Google的人才[1] - 扎克伯格采取特别积极的招募策略,甚至亲自联系潜在招募对象[1] - OpenAI员工面临每周80小时的高强度工作压力,为竞争对手的招募创造了机会[2]
“AI考生”何以成为力学“学霸”
科技日报· 2025-06-30 06:25
人工智能在力学领域的突破 - 清华大学自主研发的人工智能力学求解系统"GT-Mech"在第十五届全国周培源大学生力学竞赛中达到特等奖水平,成绩位列前五名 [1] - 这是全球首次由大型语言模型驱动的AI系统以"参赛选手"身份参与国家级顶级力学赛事,与3万余名考生同场竞技 [1] - 该系统展示了AI解决复杂力学问题的潜力,为未来教育模式变革提供新思路 [1] AI解决力学问题的技术挑战 - 力学问题要求AI从自然语言描述中构建物理模型,涉及数学公式处理和物理概念抽象 [1] - 典型力学题目融合自然语言理解、物理建模、符号推演和数值计算等综合能力,是衡量通用AI发展的关键指标 [2] - 与围棋等规则明确的任务不同,力学问题根植于对物理世界的连续理解 [1] "GT-Mech"系统的技术创新 - 构建结构化力学知识图谱,将教材题库等知识编织成语义网络,实现专家级知识调用 [2] - 采用"逻辑推理—符号计算"双核引擎,结合AI规划能力与符号计算准确性,减少低级错误 [2] - 设计精密检查纠错机制,通过批判性思考模块对解题三大关键环节进行自我修正 [3] AI对力学教育的影响 - 系统在专业竞赛中的优势引发对AI时代力学教学、学习和考核方式的重新思考 [3] - AI将在辅助教学、培养创新思维和加速科研等方面发挥重要作用 [3] - 未来力学教育可能转向学生与AI助教的互动式、探究式学习模式 [3]
硅谷大厂“杀疯了”!华人AI大牛被疯狂挖角,黄仁勋买完公司再收清华“天才少年”
钛媒体APP· 2025-06-29 20:52
硅谷科技巨头AI人才争夺战 - 英伟达CEO黄仁勋亲自招募两位华人AI大牛:华盛顿大学助理教授Banghua Zhu(朱邦华)和加州大学伯克利分校教授Jiantao Jiao(焦剑涛),两人曾联合创办AI公司Nexusflow并获1060万美元种子轮融资 [2][11][12] - Meta从OpenAI挖走4名顶尖华人学者:多模态后训练研究负责人Shuchao Bi、感知技术研究负责人Jiahui Yu、研究科学家Hongyu Ren和Shengjia Zhao,其中3人此前从谷歌DeepMind跳槽至OpenAI [15][17] - 仅2024年6月Meta已挖角超过9名OpenAI核心研究人员,OpenAI CEO奥尔特曼称Meta提供1亿美元签约奖金但被Meta否认 [17][18] 华人AI科学家职业动向 - 朱邦华将加入英伟达Star Nemotron团队任首席研究科学家,其创办的Nexusflow产品Athene-V2-Chat在多项基准测试中匹敌GPT-4o,安全场景准确率达95%(GPT-4仅64%)[11][14] - 焦剑涛以兼职身份加入谷歌DeepMind,强调将继续推动开源研究 [6][14] - Nexusflow CTO Jian Zhang(清华校友)成为英伟达应用研究总监,显示英伟达通过收购整合团队技术 [14] 科技巨头的收购与投资策略 - 英伟达2024年收购活动激增:包括Run:ai(以色列GPU运算公司)、Gretel(合成数据)、LeptonAI(贾扬清创立)、CentML(加拿大AI优化)等,涉及AI基础设施和企业存储领域 [19][20] - 2024年英伟达参与50项融资总额超10亿美元,半年内收购约26家公司,整合顶尖人才如MIT副教授韩松 [20][22] - Meta向Scale AI投资143亿美元获49%股份,创始人Alexandr Wang将领导Meta超级智能实验室,交易引发谷歌、OpenAI、xAI暂停与Scale AI合作 [18][19] 行业竞争格局与技术发展 - OpenAI领先地位受开源模型冲击(DeepSeek、Llama、Gemma),科技巨头投入上千亿美元加码AI [6][24] - 英伟达占据AI数据中心芯片市场80%-85%份额,Blackwell平台推动市值预期达5万亿美元 [23][24] - 黄仁勋称全球50%AI研究人员为华人,认可中国AI进展如DeepSeek和华为技术实力 [24] 美国AI政策与基础设施 - 特朗普政府拟推AI行动计划简化电网审批、提供数据中心用地,预计2024-2029年美国电力需求增长五倍 [24][25] - "星际之门"项目初始投资1000亿美元(计划增至5000亿),目标创造10万就业岗位 [25] - 政策转向优先本土AI生态建设,但面临供应链本土化与出口管制等实施挑战 [26][27]
深度|Sam Altman发文AI奇点时代加速到来:“智能便宜得像水电一样”这件事近在咫尺
Z Potentials· 2025-06-28 11:36
AI奇点临近与社会变革 - 核心观点:AI发展已越过"事件视界",超级智能的飞跃正在进行中,将带来前所未有的社会变革[3][7] - ChatGPT等系统已在多方面超越人类智能,每天有数亿人依赖其完成重要任务[4][10] - 2030年代将出现智能与能源极度丰富的局面,突破人类进步的核心限制[7] - AI创造的经济价值正推动算力基础设施的复利式扩建[9] - 智能成本最终将趋近于电力成本,每次ChatGPT查询消耗约0.34瓦时能量[11] 技术发展里程碑 - 2025年将出现能完成真正认知工作的Agent[4] - 2026年可能出现提出新颖见解的系统[4] - 2027年或出现能在现实世界完成任务的机器人[4] - 2030年个人工作效率将远超2020年水平,实现跨越式进步[5] - 科学家工作效率已提升2-3倍,AI正加速自身研究进程[9] 行业变革特征 - "奇点"特征:惊艳→平常→标配的演进过程[8][10] - 递归式自我改进雏形已现,AI系统将实现自主更新代码[9] - 机器人制造机器人、数据中心"复制"数据中心的未来不再遥远[9] - 点子人的时代来临,执行力不再是最主要限制[14] - 编程、艺术创作等领域将发生根本性变革[4] 社会影响与治理 - 人类对关系的重视是相对于AI的根本优势[10][12] - 需要解决AI对齐问题,避免算法错位[13] - 确保超级智能廉价且广泛可用,避免过度集中[13] - 社会将快速适应技术变革,创造新的需求和职业[11] - 全球对话需尽早启动以确立共识边界[13] 未来展望 - 2030年代将呈现熟悉与剧变共存的图景[6][7] - 技术进步速度将以月而非十年计[10] - 可能实现高带宽脑机接口、太空殖民等突破[12] - 智能将变得像水电一样廉价易用[14] - 行业正在构建高度个性化、易用的"世界大脑"[14]
筹资290亿美元,Meta要联手PE巨头建AI数据中心
华尔街见闻· 2025-06-28 11:30
Meta融资布局AI数据中心 - 公司正寻求从PE巨头筹集高达290亿美元资金 包括30亿美元股权和260亿美元债务 用于大规模建设美国AI数据中心 [1] - 融资谈判已进入深入阶段 涉及阿波罗全球管理公司 KKR Brookfield Carlyle和Pimco等顶级PE机构 [1] - 该债务融资有望成为同类私人融资中规模最大的交易之一 [1] AI战略加速推进 - 公司大幅提升AI领域投入 以追赶竞争对手 此前大型语言模型Llama 4表现未达预期 旗舰模型Behemoth发布推迟 [2] - 近期动作包括向数据标注初创ScaleAI投资150亿美元 聘请其CEO加入"超级智能"团队 并从OpenAI挖来三位顶尖研究员 [2] - 将全年资本支出预测上调10%至640-720亿美元 主因AI数据中心投资和硬件成本增加 [2] - 签署20年核电站电力采购协议 并与Invenergy达成四项清洁能源合作 以支持AI计算需求 [2] 科技巨头与私人资本合作趋势 - 公司选择与PE机构合作旨在分担AI计算能力竞赛中的风险和成本 [3] - 行业普遍采用特殊目的载体或合资企业结构 资产管理公司获少数股权 科技公司贡献资产换取资本 避免影响资产负债表 [3] - 类似案例包括OpenAI与Blue Owl合作150亿美元数据中心项目 以及与软银甲骨文洽谈的5000亿美元合资计划 [3] - 阿波罗去年与英特尔达成110亿美元协议 为爱尔兰半导体工厂提供资金 换取业务部门股权 [3]