Workflow
开源模型
icon
搜索文档
华尔街这是“约好了一起唱空”?巴克莱:现有AI算力似乎足以满足需求
硬AI· 2025-03-27 10:52
算力供需分析 - 2025年全球AI算力可支持15-220亿个AI Agent,足以满足欧美1亿多白领和10亿企业软件许可证需求 [3][4] - 2025年全球将有1570万个AI加速器在线,其中40%(630万个)用于推理,50%推理算力(310万个)专用于Agent/聊天机器人 [4] - 现有H100等效安装基数为1570万颗,其中60%(940万颗)用于训练,40%(630万颗)用于推理,50%推理芯片(310万颗)分配给Agent服务 [5] - 使用高效模型(如DeepSeek R1)可使行业容量提升15倍,企业正转向开源模型(如Mistral)降低成本 [6][11] - 表面算力充足但存在结构性缺口,需更多专用推理芯片和训练GPU转推理用途 [13] 市场机会与竞争格局 - AI Agent市场增长潜力巨大,低推理成本和开源模型是盈利关键 [8][9] - 高效推理成本结构和专注小型高效模型的公司更具竞争优势 [13] - 超级Agent产品(如GPT-5)单月消耗3560万Token,日查询44次,远超普通Agent的2.6次 [18] 模型经济效益对比 - OpenAI o1模型Agent年成本2400美元,DeepSeek R1仅88美元,后者用户容量是前者15倍 [15] - Agent单次查询生成1万Token(传统聊天机器人400个),推理成本增加25倍 [15] - 不同模型参数差异显著:GPT-5参数1.5万亿(活跃33%),DeepSeek R1参数671亿(活跃6%) [5] 技术发展趋势 - 行业需从基准测试转向实用Agent部署,关注单位经济学 [2][13] - 更便宜/小型高效模型(如DeepSeek风格)是未来需求方向 [13]
Z Potentials|沈振宇,一个潮玩公司如何做出世界第一的AIGC模型平台
Z Potentials· 2025-03-26 11:49
核心观点 - AI技术将像水电一样普及,未来所有公司都将成为AI公司,不再有AI与非AI公司的区别 [2][4] - 开源模型将主导未来AI发展,技术秘密正在加速流动,闭源模式难以长期维持技术壁垒 [1][12][13] - TensorArt通过构建"模型规模"和"创作者规模"双重护城河,已成为全球最大开源图像视频模型平台 [1][19][20] - AI行业分为三层:底层算力和基座模型、中层平台、上层应用,TensorArt选择专注平台层 [10] - 低价策略带来规模效应是核心商业哲学,TensorArt会员费仅9.9美元,算力价格比竞品便宜5倍 [17][29] 创业历程 - 创始人沈振宇北大计算机系毕业,曾创立图虫被字节收购,亲历字节崛起全过程 [3][6] - 第二次创业选择潮玩赛道切入年轻人兴趣社区,现已覆盖数十个品类数千个IP [5] - 从字节学到"以终为始"思维方式和组织建设方法论,影响后续所有决策 [6][7] - 创业动机包含商业和情怀双重因素,看好小众兴趣大众化趋势 [4][5] TensorArt战略 - 定位为AI模型托管平台和分享社区,目前用户超200万,模型超50万,日生成图片超200万张 [9] - 核心优势在于强大的推理功能、高性能低价格的算力服务、完善的创作者商业化机制 [17][18] - 视频生成领域布局积极,已是支持最多基座模型的视频生成平台 [22][23] - 商业模式以会员订阅为主,50%收入来自额外算力包,海外用户付费意愿显著高于国内 [24] - 明确不做自有模型,专注开源模型基础设施,已赞助多个流行开源模型训练 [16] AI行业洞察 - 单一大模型能力有限,需要大量微调模型解决细分场景问题 [2][12] - 技术壁垒难以长期维持,Transformer原理已可被普通大学生理解 [13] - 95%模型训练师不会写代码,普通人也能参与AI创新 [2][14] - ChatBot和当前Agent都不是AI应用的最终形态,未来交互将更碎片化 [4][25] - AI工作流将成为重要方向,通过组合多个模型解决复杂问题 [26][27] 商业理念 - 坚持"低价带来规模"策略,定价贴近成本,通过规模效应盈利 [29] - 全球市场定位明确,模型开发者追求全球影响力而非局限国内 [21] - 借鉴小米科技普惠理念,让更多人能使用AI技术 [29] - CEO需要克服ego干扰,保持冷静判断市场情绪 [28][32]
DeepSeek,上新!
证券时报· 2025-03-25 12:28
DeepSeek V3-0324模型升级 核心观点 - DeepSeek发布V3-0324模型,参数规模达6850亿,较前版6710亿小幅提升,优化性能与用户体验并采用更宽松的MIT开源协议 [1][2][3] 性能优化 - 未公布基准测试但用户反馈显示在复杂代码生成、数学求解、前端设计任务表现更优,代码能力提升显著,接近Anthropic Claude3.5/3.7 Sonnet水平 [2] - 示例:单提示即可生成完整市场网站,涵盖命名、主题设计等,被评价为"击败编码领域其他模型" [2] 交互改进 - 默认关闭"深度思考"模式以提升响应速度,适合快速迭代任务,API用户无需调整代码即可兼容 [2] - 多轮对话中自然语言表达能力增强,上下文理解与人类化表达改善,减少机械式回复 [3] 开源策略 - 采用MIT开源协议,允许自由下载、修改及商业集成,较初代V3更宽松,激发开发者社区关注 [3] 市场预期 - 分析认为V3-0324或为DeepSeek-R2基础模型,虽官方辟谣R2提前发布传闻,市场仍预期其5月推出 [3]
百度2024年财报解析:传统业务疲软,AI与智能驾驶能否撑起未来?
YOUNG财经 漾财经· 2025-03-11 19:10
2024年,百度在AI转型的关键一年交出了一份喜忧参半的财报。智能云业务逆势增长26%,文心一言调 用量激增33倍,转型成果初显。然而,传统广告业务持续承压,爱奇艺业绩表现不佳,整体 业绩略显疲 软。更值得关注的是,百度在AI领域的先发优势被DeepSeek等开源模型全面瓦解,这背后,除了战略失 误,或许还掩藏着组织内耗、人才流失等更深层次的困境。 然而,2024年行业格局骤变:异军突起的DeepSeek以极低的成本实现对标GPT-4的基准性 能,并用开源生态瓦解了传统大厂的技术壁垒,直接冲击百度的"生态闭环优势"。 此刻摆在百度面前的,是比财务数据更严峻的产业拷问:当年轻用户的搜索习惯向AI助手迁 移的背景下,其传统搜索业务是否还能继续造血?当国产大模型拥抱开源生态,其商业模式 百度2024年财报解析:传统业务疲软,AI与智能 驾驶能否撑起未来? 又该如何重构? 吴楠 2025年2月18日,百度交出2024年四季度及全年成绩单。 财报三大分化 从财报数据看,2024Q4公司实现营业收入341亿元,同比下降2%,Non-GAAP净利润为67亿 元,同比下降13%;2024年公司全年总收入为1331亿元,同比减 ...
喝点VC|Greylock解读DeepSeek-R1,掀起AI革命和重构经济秩序
Z Potentials· 2025-03-04 13:33
开源与闭源模型 - DeepSeek-R1 缩小了开源模型与闭源模型的差距 在关键推理基准测试中与 OpenAI 最新模型持平 尽管其规模更小 [2] - 开源模型在质量上已与最先进的闭源模型持平 标志着开源将模型层商品化的转折点 [2] - 开源模型的进步将推动 LLM 市场的竞争 企业将拥有多样化的实用选项 在计算能力、成本和性能之间进行权衡 [2][3] AI 基础设施与开发者使用 - DeepSeek-R1 利用强化学习(RL)提升推理能力 采用广义策略优化强化学习(GRPO)技术 是首个成功大规模实施并取得可测量增益的开源模型 [3] - 强化学习的突破被视为游戏规则的改变者 但当前 AI 工具尚未完全支持这一新范式 [3] - 开源模型的普及消除了“最大最好模型必须封闭”的护城河 企业可以完全掌控前沿模型 [4] 新应用与行业影响 - DeepSeek 增强的推理能力开启新应用浪潮 包括自主 AI 代理、专业规划系统和企业 AI 助手 [5] - 高度监管行业将受益于开源模型 因为企业可以完全控制数据的使用方式和发送目的地 [6] - 数据质量仍是关键优势 特定领域的标注和奖励函数对模型性能至关重要 [6] GenAI 经济学 - DeepSeek 降低了推理和训练成本 改变了 GenAI 部署的经济性 企业将更多地使用 AI 并部署多个特定领域模型 [7] - 开源模型的成本比使用 OpenAI 或 Anthropic 便宜多达 7 倍 解锁了更多经济上不可行的案例 [7] - 生成器的商品化趋势将推动标注技术的进步 包括 RLHF 和奖励函数等方法的优化 [8] 行业展望 - DeepSeek 标志着开源模型首次真正达到与专有替代品竞争的水平 开启了 AI 发展的新时代 [8] - 高质量、特定领域的数据和标注仍是 AI 未来的关键 尽管 DeepSeek 代表了有意义的进展 [8]
30天,DeepSeek改变了谁
投资界· 2025-02-19 15:46
以下文章来源于财经杂志 ,作者《财经》杂志 财经杂志 . 《财经》杂志官方微信。《财经》杂志由中国证券市场研究中心主办,1998年创刊,秉承"独立、独家、独到"的新闻理念,以权威性、公正性、专业性报 道见长,是政经学界决策者、研究者、管理者的必读刊物。 打破了几个"刻板共识"。 作者 | 《财经》杂志 来源 | 财经杂志 (ID: i-caijing) 2025年春节的前一周,节日气氛正浓,来自中国杭州的一家初创公司开始让华尔街投资人寝食难安。 杭州量化私募机构幻方旗下的大模型公司DeepSeek(深度求索)发布的一款开源AI模型,在多项测试中表现优于OpenAI的产品,且 研发成本不到600万美元。更让华尔街投资人震惊的是,DeepSeek1月20日发布R1模型,上线六天后同时登顶苹果App Store和谷 歌Play Store全球下载榜首,上线18天内,累计下载量已突破1600万次。随后在2月1日突破3000万大关,成为史上最快达成这一 里程碑的应用。 华尔街的担忧在于,目前投入数十亿美元用于构建大型AI模型的做法可能会打水漂,更廉价的替代方案将让华尔街人工智能的泡沫破 裂。泡沫破裂带来的资本市场危机短 ...