Workflow
算法创新
icon
搜索文档
Altman公布OpenAI“小目标”:基础设施一年要投1万亿,2028年实现全自动“AI研究员”
华尔街见闻· 2025-10-29 06:17
基础设施投入规划 - 公司已承诺投入约1.4万亿美元用于基础设施建设,相当于约30吉瓦(GW)的数据中心容量 [1] - 长期目标是建立一套体系,能够以每周1GW的速度新增产能,每GW成本约200亿美元 [1] - 为实现上述产能扩张目标,公司最终需要达到每年数千亿美元的收入规模 [1][2] AI研究能力时间表 - 根据内部进展跟踪,公司有望在2026年9月实现实习生级别的研究助手,并在2028年实现完全自动化的"真正的AI研究员" [3] - 首席科学家将超级智能定义为在大量关键行动上超越人类的系统,并认为深度学习系统距离此目标可能不到十年 [3] - 实现目标的两大关键策略是持续的算法创新和大幅扩展"测试时计算",即模型思考问题所花费的时间 [3] 营利性重组与股权结构 - 公司已完成营利性重组,营利性部门现为OpenAI Group PBC,非营利部门更名为OpenAI基金会,持有PBC约26%的股权,目前整体估值约1300亿美元 [1][5] - 作为重组的一部分,微软与公司达成新协议,微软在转换摊薄基础上的持股比例从约32.5%降至约27%,这部分股权估值约1350亿美元 [5] - 新协议解决了微软在通用人工智能(AGI)实现后将失去技术权利的关键症结,条款变得更加清晰 [6]
第四届琶洲算法大赛生态赋能大会举行
人民日报· 2025-09-24 05:52
大赛概况 - 第四届琶洲算法大赛于9月23日在广东广州琶洲举行生态赋能大会并公布奖项 [1] - 大赛历时5个月,汇聚来自30余个国家共8131支团队参与 [1] - 183支队伍进入决赛,最终82支参赛队伍获奖 [1] 大赛机制与焦点 - 大赛聚焦企业发展痛点,以真实场景驱动算法创新与落地应用 [1] - 评审采用“技术+应用”双维评价机制,侧重算法在实际业务中的适用性与落地潜力 [1] - 该机制旨在提高获奖项目的产业价值和转化效率 [1] 主办方与配套活动 - 大赛由广州市人民政府和中国人工智能学会联合主办 [1] - 大赛期间举办了具身智能、脑机接口、数据产业、大模型前沿技术等主题分论坛 [1]
字节跳动、阿里AI“大将”出走
36氪· 2025-08-26 09:25
核心事件 - 字节跳动豆包大模型视觉基础研究团队负责人冯佳时近期离职 下一步动向尚未披露 [1] - 冯佳时2019年加入字节跳动 长期专注于计算机视觉与机器学习方向的基础研究 是内部典型学术型技术人物 [1] - 曾主导计算机视觉与机器学习在多媒体方向的基础研究 后成为视觉基础研究负责人 [1] 个人背景 - 本科毕业于中国科学技术大学 硕士就读于中科院自动化所 博士毕业于新加坡国立大学 [1] - 曾任新加坡国立大学电子与计算机工程系助理教授 机器学习与视觉实验室负责人 [1] - 发表深度学习 物体识别 生成模型 机器学习理论等领域论文400余篇 [1] - 曾获MIT科技评论"35岁以下创新者(亚洲)" ACM MM最佳学生论文奖 ICCV TASK-CV最佳论文奖 CVPR 2021最佳论文提名 [1] - 担任CVPR ICML ICLR NeurIPS等顶会领域主席 [1] 技术贡献 - 2023年底作为核心研究员推动新加坡国立大学Show Lab与字节联合推出视频生成模型MagicAnimate [2] - MagicAnimate模型只需一张图像即可驱动人物舞动 开源后在社区快速走红 [2] - 与项亮 王语轩 王明轩 李成刚等人并称为"支撑字节大模型的关键八人" [2] 行业人才流动 - 近一年大模型厂商中高层人员离职频繁 包括智谱首席运营官张帆 MiniMax商业化合伙人魏伟 百川智能联合创始人洪涛 [2] - 大模型快速迭代导致行业人才竞争激烈 核心技术人员去留直接影响企业研发重心 [2] - 头部企业面临算力消耗高企 商业化落地不明朗压力 基础研究负责人转向更具自主空间或科研导向岗位 [2] - 阿里系大模型人才流动不时发生 前阿里云P10高管占超群创立质变科技 发布类人决策智能体Bloom [3] - 质变科技获得高瓴创投与光速光合联合投资的数千万美元天使轮融资 [3] 流动方向 - 离职人员部分选择赴高校 创业公司或海外研究机构 另一些投向同赛道新兴企业或创办AI初创团队 [3] - 多家AI企业出现核心人员离职后快速再创业的连锁现象 新团队获得资本青睐延续前沿研究方向探索 [3] - 海外大模型企业同样经历高管与科学家再分配 OpenAI多位核心研究人员离职加入Anthropic xAI等团队 谷歌DeepMind出现科学家出走创业 [3] - 人才多选择在模型架构 推理效率 多模态生成等方向组建小型实验室或初创公司 并迅速获得风险投资支持 [3] 行业影响 - 顶尖研究员去留对短期业务推进影响有限 但长期竞争核心在于算法创新与基础研究积累 [4] - 基础研究能力是真正护城河 而非短期靠算力或资金堆砌形成 [4] - 开源生态加速发展使技术人才个人影响力进一步凸显 [4] - 核心科技人员流动折射中国大模型产业阶段性转变 从集中资源快速追赶转向多点探索兼顾学术研究与产业落地的新阶段 [4]
李礼辉:构建可信任的数字金融 | 金融与科技
清华金融评论· 2025-05-11 18:39
中国大模型发展的新突破 - DeepSeek-V3开源模型获全球高度评价,性能与GPT-4o相当,多项表现位列全球前几名,训练成本仅600万美元,远低于GPT-4o的1亿美元 [4] - 算法创新成为核心竞争力,包括MLA多头潜在注意力机制、MoE混合专家架构等,为金融机构提供重要技术支撑 [4] - 昇腾910B芯片实现自主化突破,半精度算力超越英伟达A100,能效比高25%,国内产业链快速适配形成模型即服务等应用模式 [5] AI技术的陷阱与挑战 - 安全风险突出,如Ollama框架存在无鉴权机制、数据窃取和恶意攻击漏洞,影响模型服务的稳定性和数据完整性 [8] - 主流大模型如Grok-3、GPT-4、DeepSeek-V3均存在模型幻觉问题,且尚未解决歧视、算法共振、隐私泄露等技术缺陷 [9][10] - AI智能体首次被用于网络攻击,动态代码生成能力对国家安全防御体系构成新挑战 [10] 数字金融创新的挑战与目标 - 金融行业需实现从"可用"到"好用"的跨越,核心在于构建可信任的数字金融,主动防范AI陷阱并满足监管要求 [12][13] - 垂直模型需聚焦金融场景专业化能力,而非通用复杂问题解决能力,强调模型可信度和解释性 [13] 可信任数字金融的构建路径 - 高可靠性要求:部署AI时需强化防火墙、零信任架构等安全措施,针对不同场景需特别注意模型幻觉、歧视等问题 [15] - 可解释性为关键:需展示完整推理路径,通过可视化工具和注意力机制提升透明度 [15] - 行业级与企业级模型协同发展:预训练行业级模型降低边际成本,科技企业与金融机构合作共建生态圈 [16]