Workflow
Scaling law
icon
搜索文档
Tencent says it has enough high-end chips to train AI for 'generations' even if the US cuts it off
Business Insider· 2025-05-15 12:30
The Chinese tech giant Tencent said it has a "pretty strong stockpile of chips" to tide it through America's chip sale restrictions. The company's president, Martin Lau, was speaking to investors during an earnings call on Wednesday when he was asked how Tencent would deal with US chip restrictions.Lau said "it's a very dynamic situation" that Tencent is managing, and it's trying to "figure out the right solution" to make sure its AI strategy "can still be executed." Lau told investors that Tencent can ...
10万美元成本训练的小模型,在特定任务超越GPT-4o,延迟低99倍
36氪· 2025-05-14 17:45
公司概况 - Fastino是一家专注于开发"任务特定语言模型"(TLMs)的早期初创公司,由连续创业者Ash Lewis和George Hurn-Maloney共同创立[4] - 公司技术团队来自谷歌DeepMind、斯坦福大学、卡内基梅隆大学及苹果等知名机构[6] - 已累计获得近2500万美元融资,包括1750万美元种子轮和700万美元前种子轮[3] 技术方案 - 采用低端游戏GPU训练TLM模型,平均成本不到10万美元[3] - TLM模型在特定任务上性能媲美大型语言模型,推理速度比GPT-4o快99倍(100ms vs 4000ms)[8] - 基准测试显示TLM模型的F1分数比GPT-4o高出17%[9] - 模型架构基于Transformer但引入任务专精优化,消除参数冗余和架构低效[8] 产品特点 - 首批模型覆盖文本摘要、函数调用、文本转JSON等企业核心需求[10] - 提供PII屏蔽、文本分类、脏话过滤、信息提取等具体功能[17] - 支持部署在虚拟私有云、本地数据中心或边缘设备[13] - 已在金融、医疗、电子商务等行业应用,获得财富500强企业采用[13] 商业模式 - 采用订阅制收费而非用量定价,个人开发者每月1万次免费请求[11] - Pro用户每月10万次请求收费45美元,团队用户300万次请求收费1275美元[11] - 极低的模型运行成本支撑其定价策略[13] 行业趋势 - 大语言模型训练成本高达数千万美元,部署和推理成本同样高昂[7] - 小模型在成本、推理时延和特定任务性能上具有显著优势[14] - 类似企业包括Cohere、Mistral、阿里云Qwen3和Writer的Palmyra系列[14] - 对于高并发、低延迟要求的应用场景,小模型更具经济性[14]
2025 大模型“国战”:从百模混战到五强争锋
佩妮Penny的世界· 2025-05-13 18:24
大家好,我是佩妮。 AI 2.0 是最近几年投资行业最热赛道,没有之一。 我也一直在关注行业的进展和 AI 相关资本市场的变化。 如果到了 2025 年,你对 AI 大模型的认识还停留在 "AI 六小虎", 那已经远远过时了。 在 ChatGPT 爆火 2 年多后,咱们是时候一起从资本市场观察的视角,来聊聊现在国内AI 基座模型公司的格局演变,以及未来可能的变化趋 势。 本文得到了一些AI 行业和投资人朋友的信息帮助,非常感谢~ 1)AI六小虎,一场关于牛人和朋友圈的资本局; 六小虎中,除了 2019 年成立的智谱,和 2021 年创立的 Minimax,其他公司都是在 2023 年上半年成立的,直接的导火索就是 22 年底 ChatGPT 的横空出世。 不到两年,这几家公司在一级市场的估值就都超过了百亿人民币,领头的智谱 估值超过 250 亿人民币 。 考虑到这些公司的用户规模,收入进展(最多营收不过数亿,没有利润),相比估值的差距,这个火箭跃升的速度,在整个创投历史上都罕 见。 当时虽然也有百模大战之称,但是因为大模型的烧钱特性,能上牌桌的都不是无名之辈。 其中, 零一万物 核心团队已经并入阿里云,明确" ...
超过霉霉,她拿下全球最年轻女富豪
华尔街见闻· 2025-05-11 19:48
以下文章来源于投中网 ,作者张雪 投中网 . 投中网是领先的创新经济信息服务平台,拥有立体化传播矩阵,为创新经济人群提供深入、独到的智识和洞见,在私募股权投资行业和创新商业领域拥有权 威影响力。官网:www.chinaventure.com.cn 这似乎是出人意料的 , 一时间"Lucy Guo是谁"成了各大媒体的头版标题 。的确,即便是Lucy最为人熟知的身份——Scale AI的联合创始人,也常 常是作为该公司和另一位创始人的后缀信息存在。 对于这一头衔,Lucy的态度也比较松弛,"我其实没怎么想过,有点儿疯狂。可惜那都只是纸面上的数字。"得知自己的新头衔后,她向《福布斯》透 露道。 但如果深入了解Lucy的成长经历,就会发现,她能摘下全球最年轻白手起家女亿万富翁的桂冠并非偶然。 辍学、创业、投资, 不被定义的"天才少女" 图片来源福布斯 35岁的泰勒·斯威夫特失去了"全球最年轻白手起家女亿万富翁"头衔,取而代之的是一位华裔科技创业者,年仅30岁的Lucy Guo。 | 姓名 | 年龄 | 身家 | 国籍 | 财富来源 | | --- | --- | --- | --- | --- | | Lucy Gu ...
早融合 VS 晚融合,Natvie 多模态大模型的 Scaling Law 有所不同吗?
机器之心· 2025-05-10 21:10
本期通讯总计 21681 字,可免费试读至 6% 消耗 99 微信豆即可兑换完整本期解读(约合人民币 9.9 元) 机器之心PRO · 会员通讯 Week 19 --- 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 --- 1. 早融合 VS 晚融合,Natvie 多模态大模型的 Scaling Law 有所不同吗? 什么是Native多模态模型?相较目前流行的「晚融合」方案,「早融合」的Native多模态模型的训练过程有何不同?苹果公司 近期发布的「NNM」技术报告中,有哪些反直觉的新发现?近期业内有哪些获得较好表现的多模态模型?「早融合」是否正在 成为主流?... 2. Agent产品,快者为王?Anthropic 和 Databrick CEO 对话解读 Dario Amodei 为什么说「AI 的未来是 Agents」?数据的「Scaling Law」依然乐观?围绕 Agents 进行数据创新?MCP和 A2A范式下,企业怎样维护数据系统安全?Agents产品迭代的关键缺口如何突破?人类如何把握 AI 技术的双刃剑?... 本期完整版通讯含 2 项专题解读 + 29 项 AI ...
Agent产品,快者为王?Anthropic 和 Databrick CEO 对话解读
机器之心· 2025-05-10 14:07
本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。 Anthropic 和 Databrick 近期以「人工智能的未来:面向各领域的专用 Agent」为主题的线上峰会。两家公司的 CEO Dario Amodei 和 Ali Ghodsi 在其中的对谈环节分享了有关 Agent 的未来、Amodei 此前的博文以及双方 所展开的相关合作等话题。 目录 01. 在谈论Agents之前,人们应该先关注什么? Dario Amodei 在《Machine of Loving Grace》中写了什么?为什么说「AI的未来是Agent」?... 02 . 数 据价值无可替代,但数据治理风险如何破解? Anthropic 和 Databrick 如何围绕数据 Agent 数据进行创新?人类如何把握 AI技术的双刃剑?... 03. AI 应用快速迭代的阻塞要靠 MCP 跨越? Agents 产品迭代的关键缺口如何突破?MCP 和 A2A 范式下,企业怎样维护数据安全?... 04. Anthropic 为何仍乐观看待「Scaling Law」? 3、Ghodsi 进而提出「AI 技术要多久才能 ...
她超过霉霉,拿下全球最年轻女富豪
36氪· 2025-05-09 20:37
以下文章来源于投中网 ,作者张雪 投中网 . 投中网是领先的创新经济信息服务平台,拥有立体化传播矩阵,为创新经济人群提供深入、独到的智识和洞见,在私募股权投资行业和创新商业领域拥有 权威影响力。官网:www.chinaventure.com.cn 持股公司估值突破1800亿。 文 | 张雪 来源| 投中网(ID:China-Venture) 封面来源 | 《福布斯》杂志网站报道截图 35岁的泰勒·斯威夫特失去了"全球最年轻白手起家女亿万富翁"头衔,取而代之的是一位华裔科技创业者,年仅30岁的Lucy Guo。 这似乎是出人意料的,一时间"Lucy Guo是谁"成了各大媒体的头版标题。的确,即便是Lucy最为人熟知的身份——Scale AI的联合创始人,也常常是作为 该公司和另一位创始人的后缀信息存在。 对于这一头衔,Lucy的态度也比较松弛,"我其实没怎么想过,有点儿疯狂。可惜那都只是纸面上的数字。"得知自己的新头衔后,她向《福布斯》透露 道。 但如果深入了解Lucy的成长经历,就会发现,她能摘下全球最年轻白手起家女亿万富翁的桂冠并非偶然。 辍学、创业、投资 不被定义的"天才少女" 今年30岁的Lucy出生于 ...
她超过霉霉,拿下全球最年轻女富豪
虎嗅APP· 2025-05-07 21:32
本文来自微信公众号: 投中网 (ID:China-Venture) ,作者:张雪,头图来自:视觉中国 35岁的泰勒·斯威夫特失去了"全球最年轻白手起家女亿万富翁"头衔,取而代之的是一位华裔科技创业者, 年仅30岁的Lucy Guo。 这似乎是出人意料的,一时间"Lucy Guo是谁"成了各大媒体的头版标题。的确,即便是Lucy最为人熟知的 身份——Scale AI的联合创始人,也常常是作为该公司和另一位创始人的后缀信息存在。 对于这一头衔,Lucy的态度也比较松弛,"我其实没怎么想过,有点儿疯狂。可惜那都只是纸面上的数 字。"得知自己的新头衔后,她向《福布斯》透露道。 以下文章来源于投中网 ,作者张雪 投中网 . 投中网是领先的创新经济信息服务平台,拥有立体化传播矩阵,为创新经济人群提供深入、独到的智识 和洞见,在私募股权投资行业和创新商业领域拥有权威影响力。官网:www.chinaventure.com.cn 但如果深入了解Lucy的成长经历,就会发现,她能摘下全球最年轻白手起家女亿万富翁的桂冠并非偶然。 一、辍学、创业、投资:不被定义 的"天才少女" 今年30岁的Lucy出生于1994年10月14日,她在 ...
万字长文带你读懂强化学习,去中心化强化学习又能否实现?
机器之心· 2025-05-07 12:34
选自 Symbolic Capital 作者:Sam Lehman 机器之心编译 AI / 机器学习 scaling 简史 (极简版) 强化学习(RL)是当今 AI 领域最热门的词汇之一。近日,一篇长文梳理了新时代的强化学习范式对于模型提升的作用,同时还探索了强化学习对去中心化的意 义。 原文地址:https://www.symbolic.capital/writing/the-worlds-rl-gym 「有时候几十年什么也不会发生;有时候几周时间仿佛过了几十年。」这句话形容当今的现代 AI 领域最为贴切。似乎每天都有新的突破性模型、训练方法或公司 涌现,迫使我们重新思考 AI 世界的可能性。今年早些时候是 DeepSeek,接下来是星际之门项目,现在还有 Qwen、Manus、MCP 等。谁知道接下来会发生什么? 目前,在打造更好的模型方面,通过预训练以及最近的测试时间计算进行 scaling 是引领性方法。但最近,随着 DeepSeek-R1 和 R1-Zero 的发布,人们开始更加亲 睐一种不同的模型 scaling 方法 —— 强化学习(RL)。本文的目标是探索基于 RL 的模型改进的含义,并会特别 ...
她超过霉霉,拿下全球最年轻女富豪
投中网· 2025-05-06 15:13
这似乎是出人意料的 ,一时间" Lucy Guo 是谁"成了各大媒体的头版标题。的确,即便是 Lucy 最 为人熟知的身份 ——Scale AI 的联合创始人,也常常是作为该公司和另一位创始人的后缀信息存 在。 对于这一头衔, Lucy 的态度也比较松弛, " 我其实没怎么想过,有点儿疯狂。可惜那都只是纸面 上的数字。 " 得知自己的新头衔后,她向《福布斯》透露道。 将投中网设为"星标⭐",第一时间收获最新推送 持股公司估值突破1800亿。 作者丨 张雪 来源丨 投中网 35 岁的泰勒 · 斯威夫特失去了"全球最年轻白手起家女亿万富翁"头衔,取而代之的是一位华裔科 技创业者,年仅 30 岁的 Lucy Guo 。 但如果深入了解 Lucy 的成长经历,就会发现,她能摘下全球最年轻白手起家女亿万富翁的桂冠并 非偶然。 辍学、创业、投资 不被定义的 " 天才少女 " 今年 30 岁的 Lucy 出生于 1994 年 10 月 14 日,她在加州弗里蒙特长大,父母都是华裔移民, 都是电气工程师。尽管父母都有技术背景,但他们对她从事科技行业犹豫不决,认为女性想要在该领 域取得成功,有点难。 或许是出于天赋, Lucy ...