百度蒸汽机2.0

搜索文档
AI视频生成新品实测:这怎么不算影院级呢?
量子位· 2025-08-25 23:47
模型性能表现 - 作为全球首个中文音视频一体化生成的I2V模型,在中文语音和口型同步方面表现自然[3][6] - 升级版本擅长复杂运镜和镜头叙事能力,画质进一步提升[7] - 视频生成精细度较高,生成视频大小达20.8M,比对比产品3M大很多[18] 功能应用场景 - 仅用1张图片和1段提示词即可生成带音效的视频,例如猫呼噜声和虫子叫声[4] - 支持宠物动态写真生成,使照片自然动起来[20][29] - 支持创意实现如让林黛玉念《葬花吟》或麦当劳叔叔推荐肯德基[34] - 提供5秒和10秒两种视频长度选择[47] 语义理解能力 - 对提示词中部分内容如"奔跑"和"黄蝴蝶"存在理解忽略现象[15][45] - 对情绪把控有待提升,出现中气十足林黛玉和被迫营业麦当劳的情况[35] - 人手生成仍是历史难题,还有进步空间[46] 音效处理特性 - 可生成效果音和对话,但不会自主生成背景音,需要手动添加BGM[44] - 音效表现突出,如键盘敲击声效果不错[43] - 提供单独的背景音选项但选择后无变化[44] 价格优势 - 限时优惠价格1.4元/5秒,低至行业70%[49] - 登录赠送每月210免费额度[50] - 正常价格2.5元/5秒,200秒视频仅需100元,比对比产品便宜一大半[52] 生成效率 - 视频生成需3分钟,相比对比产品不到1分钟的速度较慢[16][17] - 可能因画面精细度较高导致生成时间较长[18] 生态整合 - 已在百度移动生态广泛使用,结合本土中文生态更适合中国创作者[57] - 提供免费额度获取机会[52]
计算机行业周报:DeepSeek-V3.1开启AI高效计算时代,百度发布音视频一体化模型蒸汽机2.0-20250825
华鑫证券· 2025-08-25 23:35
行业投资评级 - 计算机行业评级为"推荐"(维持) [3] 核心观点 - DeepSeek-V3.1大模型发布推动国产AI算力自主化进程 采用UE8M0 FP8超低精度数值格式训练 显著提升计算密度并降低能耗与延迟 支持硬件级国产芯片适配 [3][6][17][18] - 百度蒸汽机2.0实现音视频毫秒级同步 全系价格仅为国内主流竞品的70% Turbo版生成5秒有声视频限时价格仅为1.4元 [3][27][29] - FieldAI完成4.05亿美元融资 投后估值达20亿美元 由英伟达NVentures和贝索斯家族办公室共同领投 [4][36][37] - 文心一言周平均停留时长环比增长3.74% 显示用户参与度提升 [26][28] 算力动态 - 算力租赁价格保持平稳 A100-40G配置中腾讯云16核+96G价格为5.73元/时 阿里云12核+94GiB价格为31.58元/时 A100-80G配置中恒源云13核+128G价格为6.99元/时 [16] - DeepSeek-V3.1采用混合推理机制 支持思考与非思考模式动态切换 参数规模达671B 激活参数37B 支持128K上下文长度 [3][19] - FP8格式使计算单元部署密度提升2-3倍于FP16 数据移动能耗降至FP16的四分之一 大模型响应速度提升超过40% [18] - 模型在编程基准测试中超越Claude 4 Opus等国际顶尖模型 登顶开源编程榜首 [3][19] AI应用动态 - AI网站流量排名前三为ChatGPT(1331.0M访问量) Bing(837.2M)和Canva(186.8M) Perplexity以2.68%的环比增速位居访问量增长第一 [26][28] - 百度蒸汽机2.0提供四个版本: Turbo版(720p/5s) Lite版(更轻量级) Pro版(1080p/5s)和有声版(720p/5s或10s) [29] - 蒸汽机1.0在VBench I2V图生视频榜单中以89.38%总分成为全球第一 [31][32] - 模型采用LMMP架构 能自主规划多角色互动 并融入海量中文语料训练 [33] AI融资动向 - FieldAI核心技术为Field Foundation Models(FFMs) 以物理优先为设计原则 支持复杂非结构化环境中的自主决策 [4][37] - 技术已应用于全球数百个工业场景 涵盖建筑、能源、制造和物流领域 [4][37] - 其他重大融资包括EliseAI完成2.5亿美元E轮融资(累计超3.6亿美元) 估值22亿美元 Nuro完成2.03亿美元E轮融资(累计23.35亿美元) 估值60亿美元 [39] 行情表现 - 计算机(申万)指数近1月上涨14.6% 近3月上涨30.8% 近12月上涨101.2% 显著跑赢沪深300指数(同期分别上涨8.3%/15.1%/34.3%) [1] - 上周(8.18-8.22)AI算力指数单日最大涨幅4.21% AI应用指数单日最大涨幅3.00% [40] - 芯原股份以41.79%涨幅领涨AI算力和应用指数 *ST云创以-3.74%跌幅成为AI算力指数最大下跌个股 硕贝德以-5.18%跌幅成为AI应用指数最大下跌个股 [40] 投资建议 - 重点关注临床AI产品落地的嘉和美康(688246 SH) 与AI眼镜厂商合作的亿道信息(001314 SZ) 扩张算力业务的迈信林(688685 SH) 加码高速铜缆的泓淋电力(301439 SZ) 以及新能源高增的唯科科技(301196 SZ) [7][47][48] - 亿道信息2025E市盈率54.54倍 唯科科技2025E市盈率45.64倍 泓淋电力2025E市盈率25.77倍 税友股份2025E市盈率82.57倍 嘉和美康2025E市盈率48.65倍 迈信林2025E市盈率37.22倍 [9][49]
百度蒸汽机2.0发布:成本降至七成,AIGC视频将进入普惠时代
财经网· 2025-08-23 19:09
核心观点 - AI视频生成成为大模型竞争核心战场 成本与质量平衡成为行业比拼关键[1] - 公司通过技术突破和价格下调策略 旨在撬动更大规模创作者和商业市场[1] 技术突破与产品升级 - 蒸汽机2.0采用端到端生成方式 通过统一潜在空间规划实现多角色自然协同互动[2] - 新版本在语音画面同步、多角色对话生成和中文场景适配等方面升级[1] - 端到端架构提升可用性 支持复杂场景和多角色同时发声的长镜头[2] - 一体化生成方式避免合成痕迹 效果接近真实拍摄[2] 成本优化措施 - 训练阶段通过算子优化和数据集调整减少冗余计算[5] - 推理阶段进行工程化改造 避免传统扩散模型指数级成本增长[5] - 底层算力依托百舸平台和自研昆仑芯片 形成软硬件结合成本压缩能力[5] - GPU算力架构和工程优化积累使推理效率和算力利用率大幅提升[1][4] 价格与商业模式 - 刊例价相比同类产品下降至70% 将好莱坞百万级特效成本降至百元级别[1][3] - 价格优势源自多年GPU算力积累 非补贴换量[4] - 案例显示成本从数周制作周期缩短至数日 费用从万元级降至千元内[5] - 降价策略惠及中小企业市场 降低视频创作门槛[6] 行业竞争与生态落地 - AI视频生成赛道竞争激烈 但存在质量、时长和交互稳定性瓶颈[7] - 公司聚焦中文场景与生态落地可持续性 非单纯追逐画质极致[7] - 蒸汽机已贯穿搜索、内容生态、营销和企业市场等多业务场景[7] - 百度搜索中超60%流量带有AIGC生成内容 增强用户体验[7] - 生态定位驱动搜索与内容生态增长 模型调用营收非首要目标[7]
特斯拉大模型“上车”细节曝光:语音助手接入豆包与DeepSeek;全球最轻的MR头显发布,双目8K,价格有望9999?丨AI周报
创业邦· 2025-08-23 18:09
国内AI模型与产品更新 - DeepSeek V3.1发布 采用混合推理架构 用户可在思考模式与非思考模式间切换 输出token数减少20%-50% [4] - 新模型在工具调用和智能体任务中表现提升 编程与搜索Agent测评优于前代 基础模型新增8400亿tokens训练 [6] - API价格上调 自9月6日起取消夜间优惠 输入价格缓存命中为0.5元/百万tokens 未命中4元 输出价格由8元涨至12元/百万tokens [6] - 字节跳动开源大型语言模型Seed-OSS-36B 包含360亿参数 分布在64层网络中 支持15.5万词表 最大上下文长度可达512k tokens [12] - 百度蒸汽机2.0视频生成大模型上线 首次实现多人有声视频一体化生成 Turbo版、Lite版、Pro版及全系有声版全面开放 [12] - 智谱AutoGLM 2.0升级为全球首个手机Agent 开创Agent+云手机/云电脑新技术范式 由国产模型GLM-4.5、GLM-4.5V驱动 [19] - 百度文库网盘发布通用智能体GenFlow2.0 支持超100个专家智能体同时工作 3分钟并行完成超5项复杂任务 生成速度超主流同类型产品10倍 [25] 智能硬件与机器人进展 - vivo发布首款混合现实头显vivo Vision探索版 设备重量398克 搭载第二代骁龙XR2+平台 配备双目8K Micro-OLED屏幕 [8] - 智元机器人发布新款轮式双臂机器人灵犀X2-W 专为作业智能打造 [10] - 智元机器人推出三款四足机器人产品D1 Pro、D1 Edu和D1 Ultra D1 Pro重15kg 最大奔跑速度3.7m/s 能完成35cm高度跳跃 最大续航2小时 [23] - 智元机器人发布OmniHand 2025灵巧手 灵动款指导价1.48万元 首发限时9800元 灵动触觉款首发线上价1.48万元 [25] - 北京人形机器人创新中心具身天工Ultra获得世界机器人运动会100米短跑冠军 成绩21.50秒 采用全自主导航系统 [29] - Halo将推出始终在线AI眼镜 定价249美元 能实时聆听、录音并转录对话 实时显示相关信息 [35] - Meta配备显示屏的AI眼镜Hypernova将于下月发布 起售价或降至约800美元 [40] 企业合作与市场动态 - 特斯拉语音助手接入火山引擎Doubao大模型和DeepSeek Chat 实现更自然智能座舱交互体验 [7] - 国内多数AI模型训练使用中文数据占比超60% 有的模型达80% 高质量数据集超3.5万个 总体量相当于中国国家图书馆数字资源总量的140倍 [15][27] - 阿里巴巴前合伙人蔡景现以技术合伙人身份加入贝联珠贯 贝联珠贯致力于提供大数据、AI基础设施产品服务 [21] - 字节跳动辟谣与芯原股份并无AI芯片相关合作 [17] - 智己L4级Robotaxi上海国际旅游度假区专线正式运营 用户可通过享道出行APP一键呼叫免费体验 [17] - 北京AIGC视听产业创新中心启用 朝阳区登记注册文化企业达10万家 其中影视企业3274家 上半年规模以上影视企业实现收入超百亿元 [17] - IDC报告显示2024年中国大模型开发平台市场规模达16.9亿元人民币 市场前六厂商包括百度智能云、阿里云、商汤科技、智谱AI、电信AI及稀宇科技 [19] 海外AI发展与融资 - Meta回应冻结AI部门招聘传闻 称只是基本组织规划调整 将暂停部分招聘工作 [33] - Grok超37万条聊天记录泄露 用户上传照片、电子表格和其他文档被公开发布 [33] - 马斯克表示Grok 5将于下个月开始训练 特斯拉Autopilot V14将于下个月发布 [33] - 英特尔市值本月上涨28% 增加约240亿美元 动态市盈率达53倍 为2002年初以来最高 [37] - Databricks宣布进行K轮融资 估值超1000亿美元 较7个月前620亿美元估值大幅提升 [37] - 软银集团与英特尔签署20亿美元投资协议 软银以每股23美元价格购买英特尔普通股 [38] - ChatGPT移动应用自2023年5月推出以来已创造20亿美元收入 今年收入13.5亿美元 同比增长673% 平均每月营收接近1.93亿美元 [39] - OpenAI拟按5000亿美元估值出售约60亿美元股权 年化经常性收入已攀升至130亿美元 预计年底突破200亿美元 ChatGPT付费企业用户数量增长至500万 [40][42] - 本周全球披露AI融资事件19起 已披露融资金额事件14个 总融资规模115.87亿元人民币 平均融资金额8.28亿元人民币 [46] - 本周国内AI领域已披露融资总额6905万元人民币 融资额最高的为魔仓机器人 完成数千万人民币A轮融资 [53] - 本周海外AI领域已披露融资总额115.18亿元人民币 融资额最高的为Cognition 完成5亿美元C轮融资 [55]
斑马原CFO公开吐槽老东家上市圈钱:离开是不看好业务;传阴阳师事业部负责人金韬已离职创业;极氪优化直营体系,转手部分门店
雷峰网· 2025-08-22 08:35
斑马网络分拆上市及高管争议 - 斑马网络已向港交所提交上市申请 拟通过全球发售方式在香港联交所主板独立上市[6] - 阿里巴巴持有斑马网络约44.72%股份 分拆后将继续持有超过30%的股份[6] - 原CFO夏莲公开质疑公司发展前景和上市动机 称离职时协助将斑马估值降低50%[4] 网易阴阳师人事变动 - 阴阳师事业部负责人金韬离职创业 持股90%成立广州芥子信息[8] - 老策划郑涛重新接管《阴阳师》项目 曾为项目初期核心策划成员[9] - 创业项目可能接近此前未通过的《代号:云图》 已获得知名投资机构融资[8] DeepSeek-V3.1技术升级 - 新版本采用混合推理架构 支持思考与非思考模式自由切换[11] - 使用UE8M0 FP8参数精度 针对下一代国产芯片设计[11] - API价格调整:输入缓存命中0.5元/百万tokens 未命中4元/百万tokens 输出12元/百万tokens[11] 阿里灵犀互娱汇报线调整 - 汇报对象从大文娱变更为阿里CFO徐宏 可能预示业务独立性提升[12] - 历史类似调整案例显示 业务后续获得更多资源支持(如饿了么日订单破4000万)[12] 极氪渠道改革 - 推行"M计划"将部分直营门店转让给投资人 保持全国约500家门店总量[13][14] - 销售人员转为投资人旗下员工 但公司保留直营体系管控终端售价[14] 网约车平台抽成调整 - 滴滴将最高抽成降至27% T3出行降至17% 曹操出行降至22.5%[24] - 高德打车推动80家合作平台抽成不超过27% 信息服务费降至9%[24] 零跑汽车交付与盈利 - 累计交付突破90万台 7月销量首次突破5万台[26] - 2025年上半年实现盈利 净利润0.3亿元 交付量同比增长155.7%[26] - 将全年销量目标上调至58-65万台 明年挑战100万台[27] 比亚迪仰望U9性能数据 - 累计交付149台 成为中国首款百台交付的超跑[27] - 极速达391.94km/h 累计行驶59.7万公里[28] - 智能化功能中"你好仰望"唤醒13.3万次 自动泊车使用2385次[28] 快手二季度业绩 - 营收350.5亿元同比增长13.1% 经调整净利润56亿元[39] - 毛利率55.7%和经调整净利润率16%均创新高[39] - 首次宣布派发特别股息每股0.46港元 总额约20亿港元[39] B站二季度财报 - 总营收73.4亿元同比增长20% 广告收入24.5亿元游戏收入16.1亿元[40] - 月活用户达3.63亿 日均使用时长105分钟[40] - 净利润2.2亿元和调整后净利润5.6亿元均创新高[40] 三星HBM4进展 - HBM4样品通过英伟达测试 本月进入预生产阶段[44] - 拟应用于英伟达下一代AI加速器"Rubin" 11月可能开始量产[44] - HBM3E 12层产品预计本月底通过质量测试[45] OpenAI运营状况 - 7月单月营收首次突破10亿美元 年经常性收入达100亿美元[50] - 面临持续算力短缺 正推进"星际之门"等基础设施建设项目[50] - 与微软保持紧密合作 预计年营收将增长三倍至127亿美元[50] Meta组织调整与争议 - AI部门暂停招聘系组织架构调整 新设"Meta超级智能实验室"[42] - 被前员工指控夸大广告指标17%-19% 并绕过苹果隐私限制跟踪用户[51][52] - 此前曾以2000万美元年薪挖角AI人才[43] Grok隐私泄露事件 - 超过37万条用户聊天记录被公开 包含照片和敏感文档[46] - 问题源于分享功能设计缺陷 导致私密链接被搜索引擎抓取[47] - xAI尚未发布正式声明 用户数据处于全网可查状态[47] 新能源汽车动态 - 蔚来新ES8预售41.68万元起 升级为大型SUV并增加冰箱等配置[19] - 小米SU7 Ultra在50万元以上纯电市场销量第一 首都机场投放广告[21][22] - 岚图汽车将发布5C超级快充技术 全新知音预售价22万元起[31] 科技产品发布 - vivo Vision探索版重量仅398g 为行业最轻MR头显[30] - 索尼LYT-828传感器动态范围超100dB 由vivo X300系列首发[48] - 百度蒸汽机视频模型价格低至行业70% 支持多人有声视频生成[36][37]
马斯克旗下Grok超37万条聊天记录泄露;DeepSeek-V3.1发布;辛巴快手账号作品清空;鱼泡直聘创始人回应油出圈丨邦早报
创业邦· 2025-08-22 08:08
DeepSeek AI模型升级 - DeepSeek-V3.1正式发布,支持思考模式与非思考模式自由切换,思考模式相比DeepSeek-R1-0528能在更短时间内给出答案,通过Post-Training优化在工具使用与智能体任务中表现有较大提升 [1] - DeepSeek开放平台API接口调用价格将于北京时间2025年9月6日凌晨起调整并取消夜间时段优惠,9月6日前所有API服务仍按原价格政策计费 [3] 特斯拉产品动态 - 特斯拉在中国推出新款六人座Model Y车型,轴距更长且设置三排座椅,售价约为47,200美元,该车型可能不会在美国投产 [5] - 特斯拉Autopilot V14将于下个月发布 [15] - SpaceX今年从NASA获得收入约10亿美元,约占150亿美元总收入的7% [16] 快手业绩表现 - 2025年第二季度总收入同比增长13.1%至350亿元,经调整利润净额达到56亿元,同比增长20.1%,经调整净利润率达16.0% [11] - 平均日活跃用户达到4.09亿,可灵AI的收入超过2.5亿元,电商GMV同比增长17.6%至3,589亿元,电商月均买家数达1.34亿 [11] - 直播电商主播辛巴账号作品已经清空,仅剩去年嘉年华的直播回放,粉丝量仍然是9999万+ [5] 人工智能与自动驾驶融资 - Anthropic正在洽谈筹集高达100亿美元的新资金,估值可能达1700亿美元,Iconiq Capital将领投 [18] - 自动驾驶企业白犀牛完成近5亿元B轮融资,资金将投向车规级无人车产品研发、AI技术迭代和商业场景拓展 [17] - 机器人公司Field AI获贝佐斯英伟达4.05亿美元投资,估值达20亿美元 [18] - 自动驾驶技术公司Nuro完成2.03亿美元E轮融资,估值达60亿美元 [18] - 追梦空天科技完成超亿元Pre-A++轮及战略轮融资,资金将用于首型产品DF600的适航取证及量产、载人产品DF3000的研制 [18] 科技公司动态 - Meta回应冻结AI部门招聘传闻,称只是基本的组织规划调整,在为新的人工智能项目建立架构期间暂停部分招聘工作 [9] - 马斯克旗下xAI公司GrokAI聊天平台被曝隐私问题,超过37万条AI聊天记录被发布并被搜索引擎索引 [9] - 英特尔正与其他大型投资者洽谈,计划以折扣价增发股权以增加资本 [15] - KKR在日产汽车总部大楼竞购中领先,出价6.1亿美元 [16] - 字节跳动开源大型语言模型Seed-OSS-36B,包含360亿参数,支持512k tokens上下文长度 [28] - 百度蒸汽机2.0视频生成大模型上线,实现多人有声视频一体化生成 [28] 消费电子与智能设备 - vivo发布首款MR头显Vision探索版,重量为398克,配备Micro-OLED双目8K屏幕,搭载第二代骁龙XR2+平台,定价与开售时间待定 [19] - 智元机器人发布新款产品"灵犀X2-W",为基于X2平台衍生的轮式双臂机器人原型 [21] - Halo将推出"始终在线"AI智能眼镜,定价为249美元,能够实时聆听、录音并转录对话 [24] - 荣耀Magic V Flip2发布,售价5499元起,搭载第三代骁龙8移动平台,采用50μm UTG玻璃,搭载5500mAh青海湖电池 [26] 电动汽车与出行 - 蔚来全新ES8开启预售,整车购买预售价41.68万元起,电池租用方式购买预售价30.88万元起,将于2025年9月下旬正式上市并开启交付 [23] - 小鹏汽车董事长何小鹏增持310万股A类普通股,平均价为每股80.49港元,增持后何小鹏及其关联方合计拥有公司约18.9%的股份 [11] 其他公司动态 - 泡泡玛特MOKOKO未售先火,官方定价199元的搪胶毛绒挂件被炒至600元到1999元不等,整盒6个装售价474元被炒至1000元 [11] - 罗永浩与康师傅合作推广新品"特别特鲜泡面",并非自立门户进军泡面行业 [13] - BOSS直聘任命陈旭为总裁,负责优化治理结构和提升组织效率 [15] - 名创优品旗下TOP TOY完成由淡马锡领投的战略融资,交易后估值约100亿港元 [18] - 搜狐视频不参与短剧创作,目前参与制作的都是长剧 [11] 行业数据与趋势 - 2025年第二季度美国智能手机市场同比增长9%,主要受三大运营商强劲表现拉动,AT&T、T-Mobile和Verizon门店智能手机销售量同比分别增长16%、20%和12% [33] - 国内多数AI模型训练使用的中文数据占比已超过60%,有的模型达到80% [33]