AI前线

搜索文档
用印度程序员冒充 AI 的“独角兽”彻底倒闭了!伪 AI 烧光 5 亿美元,连微软和亚马逊都被“坑”了
AI前线· 2025-05-24 12:56
估值直逼 10 亿美金! 英国 AI 初创公司 Builder.ai 曾在 24 个月前的 D 轮融资中一举拿下 2.5 亿美元,在科技巨头微 软以及众多风险投资机构的鼎力支持下,Builder.ai 迅速崛起,估值接近 10 亿美元,几乎跻身独 角兽行列。然而如今,Builder.ai 宣布破产。据报道,仅对亚马逊和微软的未偿债务就超过 1 亿 美元。 这家曾被视为"准独角兽"的公司,于 5 月 20 日正式宣布破产。就在一个月前,它刚完成最后一 轮重组,从 770 名员工中裁员 220 人。 Builder.ai 公司本周表示,尽管管理层"不懈努力",但"仍未能从历史挑战和过往的决策所造成的 巨大财务压力之下恢复过来",因此只能任命一名管理人以监督执行破产程序。 编译 | 核子可乐、Tina 据报道,在 Builder.AI 承认其前任管理层存在"问题"数周后,这家获得微软支持的科技初创公司 如今已正式启动破产程序。 这家曾经充满希望的公司轰然倒塌,还欠下亚马逊 8500 万美元、欠微软 3000 万美元。然而, 它的倒闭也为人工智能在编码实践中的应用带来了新的反思与启示。 当 AI 遇上"人肉"开发, ...
大模型时代,数据智能的构建路径与应用落点 | 直播预告
AI前线· 2025-05-24 12:56
从训练数据构建、智能体框架,到 ChatBI 落地挑战,5 月 26 日晚上 20:00,来自DaoCloud、货拉 拉、中电金信与数据项素的多位嘉宾将围绕「大模型时代的数据智能如何演进」展开对话。扫码预 约,不见不散! 直播介绍 直播时间 5 月 26 日 20:00-21:30 主持人 :郭峰,DaoCloud 道客 / 联合创始人兼首席技术官 嘉宾 : 直播亮点 单海军,中电金信研究院 / 副院长 覃睿,数据项素 / 产品副总裁 凌霄,货拉拉 / 大数据专家 从不同视角审视"数据智能"的路径选择 探讨数据智能在企业落地过程中的真实难题与解决思路 数据构建、智能体落地、系统集成等方面的实践与反思 如何看直播? 扫描下图海报 【二维码】 ,或戳直播预约按钮,预约 AI 前线视频号直播。 直播主题 大模型时代,数据智能的构建路径与应用落点 直播嘉宾 如何向讲师提问? 文末留言写下问题,讲师会在直播中为你解答。 ...
腾讯混元TurboS技术报告首次全公开:560B参数混合Mamba架构,自适应长短链融合
AI前线· 2025-05-23 03:57
随着大型语言模型(LLM)的飞速发展,模型能力与效率的平衡成为了前沿研究的关键议题。 腾讯混 元团队最新推出的混元TurboS模型,是一款新颖的 超大型 Hybrid Transformer-Mamba架构MoE模型 。该模型通过Mamba架构在长序列处理上的卓越效率与Transformer架构在上下文理解上的固有优势的 有机协同,实现了性能与效率的精妙平衡。 混元TurboS引入了创新的自适应长短思维链机制,能够根据问题复杂度动态切换快速响应模式与深度 思考模式,从而优化计算资源分配。更重要的是,其模型激活参数达到了56B(总参数560B),是业 界首个大规模部署的Transformer-Mamba专家混合(MoE)模型。 架构创新以及参数量的保证,让模型效果进步明显,国际最权威的大模型评测榜单LMSYS Chatbot Arena最新排名显示: 混元Turbo S 取得了整体1356的高分,在所有239个参赛模型中位列全球前7名。 | Rank* | Rank | Model | Arena 4 | વેરૂર A | Votes | A Organizatio License | 4 | | --- | ...
全球最强编码模型 Claude 4 震撼发布:自主编码7小时、给出一句指令30秒内搞定任务,丝滑无Bug
AI前线· 2025-05-23 03:57
该系列模型下共有两个型号:Claude Opus 4 和 Claude Sonnet 4,为编码、高级推理和 AI 代理设 定新的标准。 作者 | 冬梅 Claude 4 系列模型发布,编码、推理能力更上一步 昨天夜里,在 Anthropic 的首届开发者大会上,Anthropic CEO Dario Amodei 宣布 Claude 4 正式发 布。 | | | | SIMULE T NUTHINI NJ | | | | | --- | --- | --- | --- | --- | --- | --- | | | Claude Opus 4 | Claude Sonnet 4 | Claude Sonnet 3.7 | OpenAl o3 | OpenAl GPT-4.1 | Gemini 2.5 Pro Preview (05-06) | | Agentic coding SWE-bench Verified15 | 72.5% / 79.4% | 72.7% / 80.2% | 62.3% / 70.3% | 69.1% | 54.6% | 63.2% | | Agentic terminal cod ...
砸65亿美元招揽58岁乔布斯门生!55名苹果元老工程师尽归OpenAI,奥特曼终拿下“盯了”两年多的AI产品!
AI前线· 2025-05-22 12:30
整理 | 华卫 今日凌晨,OpenAI 的 CEO Sam Altman 突然宣布,他们将收购 IO——这家成立仅一年、由苹果前 高管、iPhone 设计师 Jony Ive 领导的初创公司。 在联合采访中,Ive 和 Altman 拒绝透露这类设备的具体形态和运作方式,但表示希望明年分享细 节。58 岁的 Ive 将这一愿景形容为"星际级",目标是创造"提升人类的卓越产品"。40 岁的 Altman 则 补充称:"我们已经等待下一个重大突破 20 年了。我们想为人们带来超越长期使用的传统产品的新事 物。" 斥资 65 亿美元, 前苹果关键设计团队加盟 此次收购主要是全股权交易。据外媒报道,该收购案的价格高达 65 亿美元。两位知情人士透露,根 据去年底双方达成的协议,OpenAI 已持有 IO 23% 的股份,因此此次需支付约 50 亿美元完成全额 收购。 作为交易的一部分,OpenAI 将把 IO 公司约 55 名工程师和产品开发人员都纳入 OpenAI,其中包括 前苹果资深员工 Scott Cannon、Evans Hankey 和 Tang Tan,他们都是 iPhone、iPad 和 Apple W ...
从 DeepSeek 部署看,华为如何让 MOE 架构“迎来”海量“专家”?
AI前线· 2025-05-22 12:30
作者 | 褚杏娟 "模型开发已经从早期的算法层优化,转向系统工程层面的深度创新。"华为技术专家说道。 如今已经从数字化时代的比特流量转向 Token 经济体系。国内 Token 日消耗量从千亿级跃升至十万亿级,DeepSeek 等头部平台日均处理 6000 亿 Token 的实践,验证了高吞吐、低时延系统的商业价值。 同时,随着模型结构从单一架构探索发展为多模态融合创新,大模型的驱动部署模式发生根本转变。传统单卡部署已无法满足大模型高吞吐、高并发的 需求,分布式集群部署成为新常态。以 ChatGPT 和 DeepSeek 为例,用户规模突破亿级的时间从 1 个月压缩至 7 天,倒逼系统处理能力实现数量级提 升。如何提供更高的吞吐能力、更低的时延成为系统,成为各基础设施厂商的必做题。 DeepSeek 专调 DeepSeek 本身已经在 infra 层做了很多优化,但在企业部署过程中,华为自己也针对 DeepSeek 的模型做了各种优化,帮助企业全面兼容和支持应 用。 大模型训推方案 预训练方面,华为首先完整复现了幻方的 DualPipe 技术(仅开源了框架,没有开源代码),但该方案存在静态显存占用较高的问题。 ...
3 层人群定位 × 5 种赋能手段,企业全员数据能力提升指南 | 极客时间企业版
AI前线· 2025-05-22 12:30
在 AI 重构商业规则的今天,数据能力已不再仅是企业的"数字化配件",而是驱动智能革命的"数字神经中枢"。数据是 AI 价值爆发的"第一性原理"。无论 是大语言模型对万亿级 token 的吞噬,还是工业 AI 对千万传感器信号的解析,缺乏高质量数据喂养的 AI 系统如同无米之炊。当传统企业的竞争停留于 产品功能迭代时,数据驱动的企业已构建起"感知 - 决策 - 行动"的智能闭环,数据密度与业务智能度呈现指数级正相关。 当前,众多企业在构建数据人才体系时普遍存在一些问题:缺乏系统化培养路径,难以匹配不同层级员工的差异化需求;缺少实战导向的方法论,人才 培养与业务场景脱节;以及专业师资与前沿课程资源不足。这些瓶颈正成为企业释放数据价值、实现智能升级的重要阻碍。对此,极客时间打造了一套 覆盖"战略规划 - 业务落地 - 技术支撑"全链条的数据人才培养体系,帮助企业全员建设数据能力的解决方案。 企业数据人才培养痛点与挑战 在当今全球化时代,数据已成为企业和国家发展的重要战略资源。培养数据方向人才对于企业提升竞争力和推动国家数字经济发展具有重要意义。全球 范围内对数字经济的重视程度日益提升,众多国家和国际组织围绕数据人 ...
博士宿舍激情脑暴,革新了Scaling Law?Qwen和浙大联手推出新定律,直接干掉95.5%推理内存!
AI前线· 2025-05-21 18:04
整理 | 华卫 提升大语言模型(LLM)的智能水平,通常有两条主流的 Scaling Law 路线。一是扩展参数,用更多 模型参数来更细致地学习,这种方法非常吃显存;二是扩展推理思考的时间,增大思维链长度,这种 方法非常吃时间且依赖于训练数据、训练策略(RL),只适用于部分场景。 | Method | Inference Time | Inference Space | Training Cost | Specialized Strategy | | --- | --- | --- | --- | --- | | Dense Scaling | Moderate | 20 High | Pre-training only | (= No | | MoE Scaling | Low | 60 High | Pre-training only | 69 Load balancing | | Inference-Time Scaling | 6. High | (= Moderate | Post-training | 0 RL / reward data | | Parallel Scaling | (=) Mo ...
汤道生:腾讯持续加大 AI 投入力度,各项业务全面拥抱 AI
AI前线· 2025-05-21 18:04
整理 | 褚杏娟 "AI 持续落地,每个企业正在成为 AI 公司,每个人也将成为 AI 加持的'超级个体'。"腾讯集团高级执 行副总裁、云与智慧产业事业群 CEO 汤道生在 5 月 21 日的腾讯峰会上说道。 模型深度思考的突破,推动生成式 AI 的可用性从"量变"发展到"质变"。汤道生表示,腾讯将持续加大 AI 投入力度,各项业务全面拥抱 AI,同时也以大模型、智能体、知识库和基础设施"四个加速",打 造"好用的 AI"。 今年以来,产业对于大模型 API 的调用量、算力需求等也快速增长。汤道生认为,生成式 AI 已经逐 步跨过"可用性"的门槛,未来要从"可用"到"好用";从"一部分人用",到"人人能用",还需要在交互体 验、执行能力、内容准确性、落地成本等方面持续升级。优化模型可以提升性能和交互体验;智能体 可以赋予模型独立执行任务的能力;知识库能帮助减少模型幻觉,更懂企业和用户;基础设施和工程 优化可以降低训推成本、提升响应速度。 模型是 AI 应用的基础。但模型除了会思考,还要能执行。智能体让 AI 有了"手和脚",成为能直接干 活的"智能员工",极大拓展了 AI 的价值边界。 大模型"智商"再高,如 ...
谷歌AI核爆:升级全系模型,Gemini 2.5双榜登顶!所有产品用AI重做,OpenAI如何接招?
AI前线· 2025-05-21 18:04
作者|冬梅 通常情况下,在 I/O 大会前的几周里,外界不会听到太多 I/O 大会的消息,因为谷歌一般会把最好的 模型留到 I/O 大会上发布。但在 Gemini 时代,谷歌很可能会在三月的某个周二突然发布出他们最强 的人工智能模型,或者提前一周宣布像 AlphaEvolve 这样的酷炫突破。 因为大模型时代,尽快将最好的模型和产品送到用户手中,是企业技术能力的展现。 北京时间 5 月 21 日凌晨一点,随着多个产品在 2025 谷歌 I/O 大会上发布,现场响起了一波又一波 热烈的掌声。 在本场发布会上,作为主题演讲嘉宾,谷歌首席执行官桑达尔·皮查伊在一个多小时的时间里紧锣密 鼓地介绍着谷歌在 AI、移动操作系统、搜索等领域的众多更新,这一场发布会上初步统计,Gemini 被提及 95 次,人工智能被提及 92 次。 以下是本场发布会的几个重要更新,首先是模型层面。 为 Gemini 2.5 Pro 引入 Deep Think 推理模型和更好的 2.5 Flash 此次发布会的高潮部分,是谷歌宣布为 Gemini 2.5 Pro 引入 Deep Think 推理模型和更好的 2.5 Flash。 谷歌在大会 ...