开源模型 - 财报，业绩电话会，研报，新闻 - Reportify

开源模型

搜索文档

速递｜筹集400亿美元后，OpenAI宣布开源模型回归计划，推理能力模型即将面世

Z Potentials· 2025-04-01 11:49

开源模型发布计划 - 公司即将在未来数月推出自GPT-2以来首个具备推理能力的开源模型 [1][3] - 新开放模型能力类似于o3-mini 将根据准备框架评估后再发布 [2][3] - 计划举办全球开发者活动收集反馈首场活动在旧金山举行随后扩展至欧洲和亚太 [4] 融资与基础设施投入 - 公司以3000亿美元估值完成400亿美元融资为历史上最大私人融资之一 [1] - 180亿美元资金将用于Stargate项目建设美国人工智能数据中心网络 [1] 开源战略调整 - CEO表示需调整开源策略未来将推出更好模型但领先优势可能减弱 [5] - 面临开源竞争对手压力如DeepSeek采用开放模型发布方式 [5] - 技术战略负责人透露今年将发布可自主部署的模型架构 [7] 行业竞争态势 - 开源生态崛起 Meta的Llama系列模型下载量突破10亿次 [6] - DeepSeek通过开源战略快速扩张全球用户版图 [6]

Artificial Intelligence

Llama系列模型

Artificial Intelligence

Llama系列模型

3D版DeepSeek卷起开源月：两大基础模型率先SOTA！又是VAST

量子位· 2025-03-28 18:01

3D生成模型技术突破 - VAST公司发布TripoSG和TripoSF两个基础3D生成模型，均刷新开源和闭源领域的SOTA性能[6][7][8] - TripoSG开源1.5B版本模型权重、推理代码及演示Demo，在质量、细节和保真度实现重大突破[14][15][16] - TripoSF采用阶段性开源策略，目前发布VAE预训练模型和推理代码，满血版将在Tripo 3.0开放[16][64] 技术创新亮点 - TripoSG首创将矫正流(RF)Transformer架构应用于3D生成，结合MoE层实现参数容量提升[21][22][24][25] - 开发基于SDFs的高精度VAE架构，引入混合监督训练策略提升几何表示质量[28][30][31] - TripoSF核心创新SparseFlex表示方法，支持1024³高分辨率训练，内存占用降低82%[48][49][54][57] - 构建200万高质量"图像-SDF"训练样本数据集，验证数据质量对性能的关键影响[32][34] 性能表现 - TripoSG在语义一致性上超越现有模型，能处理复杂拓扑结构和精细元素[35][37][43] - TripoSF在标准测试中实现82% Chamfer Distance降低和88% F-score提升[57] - 高分辨率版本(Ours1024)在Toys4k和Dora Benchmark上全面领先竞品[58] 开源战略布局 - 启动持续一个月的开源计划，每周发布新项目[10][13] - 后续将开源三维部件补全模型、绑定生成模型及SIGGRAPH Asia收录的交互式草图模型[66][67] - 此前已开源MV-Adapter多视图生成方案和MIDI单图3D场景创建技术[70][72][74][75] 行业影响 - 公司2024年发表数十篇论文，此前开源项目包括threestudio、Wonder3D等业界知名框架[80] - 被专业艺术工作者认可，成为3D生成领域国产代表企业[81][87] - 技术路线规划明确：从静态生成向动态交互演进，目标2025年底实现零门槛3D创作[83][84][85]

Artificial Intelligence

Artificial Intelligence

华尔街这是“约好了一起唱空”？巴克莱：现有AI算力似乎足以满足需求

硬AI· 2025-03-27 10:52

算力供需分析 - 2025年全球AI算力可支持15-220亿个AI Agent，足以满足欧美1亿多白领和10亿企业软件许可证需求 [3][4] - 2025年全球将有1570万个AI加速器在线，其中40%（630万个）用于推理，50%推理算力（310万个）专用于Agent/聊天机器人 [4] - 现有H100等效安装基数为1570万颗，其中60%（940万颗）用于训练，40%（630万颗）用于推理，50%推理芯片（310万颗）分配给Agent服务 [5] - 使用高效模型（如DeepSeek R1）可使行业容量提升15倍，企业正转向开源模型（如Mistral）降低成本 [6][11] - 表面算力充足但存在结构性缺口，需更多专用推理芯片和训练GPU转推理用途 [13] 市场机会与竞争格局 - AI Agent市场增长潜力巨大，低推理成本和开源模型是盈利关键 [8][9] - 高效推理成本结构和专注小型高效模型的公司更具竞争优势 [13] - 超级Agent产品（如GPT-5）单月消耗3560万Token，日查询44次，远超普通Agent的2.6次 [18] 模型经济效益对比 - OpenAI o1模型Agent年成本2400美元，DeepSeek R1仅88美元，后者用户容量是前者15倍 [15] - Agent单次查询生成1万Token（传统聊天机器人400个），推理成本增加25倍 [15] - 不同模型参数差异显著：GPT-5参数1.5万亿（活跃33%），DeepSeek R1参数671亿（活跃6%） [5] 技术发展趋势 - 行业需从基准测试转向实用Agent部署，关注单位经济学 [2][13] - 更便宜/小型高效模型（如DeepSeek风格）是未来需求方向 [13]

巴克莱(US:BCS)

人工智能算力

人工智能算力

Z Potentials｜沈振宇，一个潮玩公司如何做出世界第一的AIGC模型平台

Z Potentials· 2025-03-26 11:49

核心观点 - AI技术将像水电一样普及，未来所有公司都将成为AI公司，不再有AI与非AI公司的区别 [2][4] - 开源模型将主导未来AI发展，技术秘密正在加速流动，闭源模式难以长期维持技术壁垒 [1][12][13] - TensorArt通过构建"模型规模"和"创作者规模"双重护城河，已成为全球最大开源图像视频模型平台 [1][19][20] - AI行业分为三层：底层算力和基座模型、中层平台、上层应用，TensorArt选择专注平台层 [10] - 低价策略带来规模效应是核心商业哲学，TensorArt会员费仅9.9美元，算力价格比竞品便宜5倍 [17][29] 创业历程 - 创始人沈振宇北大计算机系毕业，曾创立图虫被字节收购，亲历字节崛起全过程 [3][6] - 第二次创业选择潮玩赛道切入年轻人兴趣社区，现已覆盖数十个品类数千个IP [5] - 从字节学到"以终为始"思维方式和组织建设方法论，影响后续所有决策 [6][7] - 创业动机包含商业和情怀双重因素，看好小众兴趣大众化趋势 [4][5] TensorArt战略 - 定位为AI模型托管平台和分享社区，目前用户超200万，模型超50万，日生成图片超200万张 [9] - 核心优势在于强大的推理功能、高性能低价格的算力服务、完善的创作者商业化机制 [17][18] - 视频生成领域布局积极，已是支持最多基座模型的视频生成平台 [22][23] - 商业模式以会员订阅为主，50%收入来自额外算力包，海外用户付费意愿显著高于国内 [24] - 明确不做自有模型，专注开源模型基础设施，已赞助多个流行开源模型训练 [16] AI行业洞察 - 单一大模型能力有限，需要大量微调模型解决细分场景问题 [2][12] - 技术壁垒难以长期维持，Transformer原理已可被普通大学生理解 [13] - 95%模型训练师不会写代码，普通人也能参与AI创新 [2][14] - ChatBot和当前Agent都不是AI应用的最终形态，未来交互将更碎片化 [4][25] - AI工作流将成为重要方向，通过组合多个模型解决复杂问题 [26][27] 商业理念 - 坚持"低价带来规模"策略，定价贴近成本，通过规模效应盈利 [29] - 全球市场定位明确，模型开发者追求全球影响力而非局限国内 [21] - 借鉴小米科技普惠理念，让更多人能使用AI技术 [29] - CEO需要克服ego干扰，保持冷静判断市场情绪 [28][32]

DeepSeek，上新！

证券时报· 2025-03-25 12:28

DeepSeek V3-0324模型升级核心观点 - DeepSeek发布V3-0324模型，参数规模达6850亿，较前版6710亿小幅提升，优化性能与用户体验并采用更宽松的MIT开源协议 [1][2][3] 性能优化 - 未公布基准测试但用户反馈显示在复杂代码生成、数学求解、前端设计任务表现更优，代码能力提升显著，接近Anthropic Claude3.5/3.7 Sonnet水平 [2] - 示例：单提示即可生成完整市场网站，涵盖命名、主题设计等，被评价为"击败编码领域其他模型" [2] 交互改进 - 默认关闭"深度思考"模式以提升响应速度，适合快速迭代任务，API用户无需调整代码即可兼容 [2] - 多轮对话中自然语言表达能力增强，上下文理解与人类化表达改善，减少机械式回复 [3] 开源策略 - 采用MIT开源协议，允许自由下载、修改及商业集成，较初代V3更宽松，激发开发者社区关注 [3] 市场预期 - 分析认为V3-0324或为DeepSeek-R2基础模型，虽官方辟谣R2提前发布传闻，市场仍预期其5月推出 [3]

Artificial Intelligence

DeepSeek V3-0324模型

Artificial Intelligence

DeepSeek V3-0324模型

百度2024年财报解析：传统业务疲软，AI与智能驾驶能否撑起未来？

YOUNG财经漾财经· 2025-03-11 19:10

2024年，百度在AI转型的关键一年交出了一份喜忧参半的财报。智能云业务逆势增长26%，文心一言调用量激增33倍，转型成果初显。然而，传统广告业务持续承压，爱奇艺业绩表现不佳，整体业绩略显疲软。更值得关注的是，百度在AI领域的先发优势被DeepSeek等开源模型全面瓦解，这背后，除了战略失误，或许还掩藏着组织内耗、人才流失等更深层次的困境。然而，2024年行业格局骤变：异军突起的DeepSeek以极低的成本实现对标GPT-4的基准性能，并用开源生态瓦解了传统大厂的技术壁垒，直接冲击百度的"生态闭环优势"。此刻摆在百度面前的，是比财务数据更严峻的产业拷问：当年轻用户的搜索习惯向AI助手迁移的背景下，其传统搜索业务是否还能继续造血？当国产大模型拥抱开源生态，其商业模式百度2024年财报解析：传统业务疲软，AI与智能驾驶能否撑起未来？又该如何重构？吴楠 2025年2月18日，百度交出2024年四季度及全年成绩单。财报三大分化从财报数据看，2024Q4公司实现营业收入341亿元，同比下降2%，Non-GAAP净利润为67亿元，同比下降13%；2024年公司全年总收入为1331亿元，同比减 ...

喝点VC｜Greylock解读DeepSeek-R1，掀起AI革命和重构经济秩序

Z Potentials· 2025-03-04 13:33

开源与闭源模型 - DeepSeek-R1 缩小了开源模型与闭源模型的差距在关键推理基准测试中与 OpenAI 最新模型持平尽管其规模更小 [2] - 开源模型在质量上已与最先进的闭源模型持平标志着开源将模型层商品化的转折点 [2] - 开源模型的进步将推动 LLM 市场的竞争企业将拥有多样化的实用选项在计算能力、成本和性能之间进行权衡 [2][3] AI 基础设施与开发者使用 - DeepSeek-R1 利用强化学习（RL）提升推理能力采用广义策略优化强化学习（GRPO）技术是首个成功大规模实施并取得可测量增益的开源模型 [3] - 强化学习的突破被视为游戏规则的改变者但当前 AI 工具尚未完全支持这一新范式 [3] - 开源模型的普及消除了“最大最好模型必须封闭”的护城河企业可以完全掌控前沿模型 [4] 新应用与行业影响 - DeepSeek 增强的推理能力开启新应用浪潮包括自主 AI 代理、专业规划系统和企业 AI 助手 [5] - 高度监管行业将受益于开源模型因为企业可以完全控制数据的使用方式和发送目的地 [6] - 数据质量仍是关键优势特定领域的标注和奖励函数对模型性能至关重要 [6] GenAI 经济学 - DeepSeek 降低了推理和训练成本改变了 GenAI 部署的经济性企业将更多地使用 AI 并部署多个特定领域模型 [7] - 开源模型的成本比使用 OpenAI 或 Anthropic 便宜多达 7 倍解锁了更多经济上不可行的案例 [7] - 生成器的商品化趋势将推动标注技术的进步包括 RLHF 和奖励函数等方法的优化 [8] 行业展望 - DeepSeek 标志着开源模型首次真正达到与专有替代品竞争的水平开启了 AI 发展的新时代 [8] - 高质量、特定领域的数据和标注仍是 AI 未来的关键尽管 DeepSeek 代表了有意义的进展 [8]

Artificial Intelligence

杰文斯悖论

Artificial Intelligence

Artificial Intelligence

杰文斯悖论

Artificial Intelligence

30天，DeepSeek改变了谁

投资界· 2025-02-19 15:46

DeepSeek引发的行业冲击 - 杭州量化私募幻方旗下DeepSeek公司以不到600万美元研发成本推出开源AI模型，在多项测试中表现优于OpenAI产品[3] - DeepSeek R1模型上线6天后登顶苹果App Store和谷歌Play Store全球下载榜首，上线18天内累计下载量突破1600万次，2月1日突破3000万大关成为史上最快达成此里程碑的应用[3] - 该事件引发华尔街对AI投资泡沫担忧，1月27日美股科技股集体下跌：英伟达股价下跌约17%市值蒸发近6000亿美元创历史最大单日跌幅纪录，博通跌17%，AMD跌6%，微软跌2%，纳斯达克综合指数跌3.07%[3] 全球科技巨头应对策略 - Meta要求技术团队加班复刻DeepSeek路径，OpenAI调整模型发布策略不再"挤牙膏"，各大云厂商迅速上线DeepSeek开源模型[8] - 阿里云1月29日发布通义千问Qwen 2.5-Max MoE采用类似DeepSeek技术路线，谷歌2月5日上线Gemini 2.0推出思维链功能，OpenAI CEO宣布GPT-4.5/5将很快发布[8] - 百度2月14日宣布文心一言4月1日起免费，未来数月推出文心大模型4.5系列，6月30日开源文心大模型，标志国内科技大厂全部加入开源阵营[9] 产业格局重构与影响 - DeepSeek打破信息技术关键突破都在美国的刻板共识，成为近20年来首个拿出革命性方案的中国创业公司，将AI竞争焦点从训练提前到推理[9] - 一级投资市场反应迅速，投资人四处寻找DeepSeek投资门路未果后转向杭州其他科技公司，"害怕错过"情绪再次蔓延[9] - 产业竞争焦点转向推理将带来硬软件协同加强，基于大模型技术的千行百业应用将大发展而不仅仅是对话模型[9] 技术路径与成本革命 - DeepSeek采用MoE架构降低对内存带宽需求，使用6万张英伟达GPU卡包括1万张A100、1万张H100、1万张H800和3万张H20[17] - API定价仅为OpenAI运行成本的1/30，每百万词元仅需2.2美元，大幅降低应用开发门槛[22] - 技术路径从"大力出奇迹"转向"四两拨千斤"，盘活闲置算力资源甚至CPU服务器也能运行大模型[25] 生态构建与产业协同 - 百余家中国公司宣布接入DeepSeek，覆盖芯片、算力服务商到最终用户各级生态圈，形成快速扩张态势[19] - 芯片厂商包括英伟达、AMD、华为昇腾、百度昆仑芯、海光等迅速适配DeepSeek优化AI推理，云厂商和软件公司积极接入[19] - DeepSeek累计获得1.25亿用户，2025年1月网站月访问量达2.56亿，以22.3倍速度增长成为最快突破3000万日活应用[20] 投资市场变化与机遇 - 2024年中国AI领域融资总额约495亿元，月之暗面、百川智能、智谱AI和Minimax四家公司完成233亿元融资占行业48%[22] - DeepSeek出现加剧大模型创业公司融资压力，头部六家公司中至少四家面临融资困难，投资逻辑转向应用为王[23] - 2025年一级市场融资频率和金额预计明显提升，美元机构表现出投资更早期项目意愿降低业务数据要求[23] 算力产业变革 - 美国科技四巨头2025年资本支出总额将超过3200亿美元，微软、亚马逊、谷歌、Meta增速分别达环比增加、近30%、超40%、60%-75%[25] - 中国科技公司认为算力需求螺旋上升，预测2027年每天推理算力消耗量将增长100倍以上，阿里云2025年重点仍是大规模投资算力[28][31] - 国产芯片获得发展空间，并行科技评估哪种国产芯片在DeepSeek上性能最优性价比最高，为金融等行业推广提供案例[25] 开源模式与长期影响 - DeepSeek选择宽松友好的MIT开源协议支持商用，吸引生态合作伙伴形成良性开发者社区[33] - 开源模式可能复制Linux操作系统成功路径，形成丰富的AI大模型应用生态系统[33] - 打破中国AI相对美国差距拉大、美国芯片可卡住中国、AI竞争核心是训练等刻板共识，提供全新发展思路[34]

Artificial Intelligence

通义千问Qwen 2.5-Max MoE

Artificial Intelligence

通义千问Qwen 2.5-Max MoE