Workflow
百度蒸汽机
icon
搜索文档
从工具到搭子 百度搜索求变
北京商报· 2025-10-15 23:54
今年7月完成最大改版后,"百度搜索主要瞄准两个产品形态做改造""基于AIGC(人工智能生成内容) 的一些玩法和创意实现",10月15日,百度副总裁、百度搜索总经理赵世奇向北京商报记者总结。当 日,百度搜索宣布全面升级文心助手AIGC创作能力、发布行业首个开放式实时互动的数字人智能体、 升级了视频生成模型百度蒸汽机(文心专精),万能搭子的定位多次被强调。根据Omdia及QuestMobile 最新数据,百度搜索在AI用户规模、综合技术能力等多个核心指标位列AI搜索行业第一。围绕核心业 务搜索,百度花了不少精力,盯着AI搜索这块蛋糕的对手也一样。 近日,百度App进行了最新一次升级,从15.31.1版本直接跳到15.31.5版本。10月15日的发布沟通会一开 场,百度搜索相关负责人举了多个实例介绍文心助手的能力。例如在旅行中通过百度对景点某物拍摄并 发问,文心助手会对该物体的名称、寓意、历史等进行详细介绍。 蒸汽机模型是下半场的重点,升级版的百度蒸汽机可实现AI长视频实时交互生成。该功能升级依托流 式视频技术实现"无限时长"生成,突破传统AI视频生成10秒左右的时长限制。 参会者现场参与了一则沙漠赛车视频的剧情改 ...
AI进化速递丨行业首次,百度蒸汽机实现AI长视频实时交互
第一财经· 2025-10-15 20:55
AI进化速递丨行业首次,百度蒸汽机实现AI长视频实时交互 ①行业首次,百度蒸汽机实现AI长视频实时交互; ②荣耀CEO李健:智能体YOYO具备自进化能力; ③阿里云在迪拜启用第二座数据中心; ④英特尔公布新款GPU Crescent Island; ⑤Nscale计划为微软在德克萨斯州建造大型AI数据中心; ⑥OpenAI宣布投资250亿美元在阿根廷建设AI数据中心。 ...
Sora2不够香了!这款国产AI视频模型已经能边看边生成,生成快还互动佳
量子位· 2025-10-15 18:20
衡宇 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 还在用Sora2做恶搞视频或表情包玩儿?快醒醒,国内AI视频玩家已实现弯道超车了—— 开卷 实时流式生成 ! 就是那种模型推理到哪儿,画面就生成到哪儿;想改剧情,直接暂停、改指令、视频重新走向。 换言之,Sora2能做的,它能做;Sora2做不到的,它还能做。 而这,才是和AI视频一起"创作"的未来式答卷——来自 百度蒸汽机 (文心专精版)。 百度蒸汽机相信大家都已经不陌生了,5月份以黑马之姿闯入AI生视频赛道,初登场就拿下VBench-I2V全球榜一,全球首个实现中文音视频 一体化的视频生成模型,首次实现多人有声视频生成…… 而这一次升级的背后,是百度对AI视频生成领域的重新再定义。 当同行还卡在"生成10s稳定、连续的视频画面"时,百度已经率先实现" 生成迅速、实时交互、无限续写 "三件套: 此外,在百度蒸汽机,还能告别以往单向输出的数字人,定制1V1专属数字人,沉浸式体验数字分身互动;任意生成、创造全场景开放世界, 无论是开拓新的游戏地图,还是爽玩全球旅游景点, 百度这次,全都有 。 只需一张图+一个Prompt,生成过程更流畅自然,短时间、低 ...
Sora 2颠覆短视频,传统玩家们如何接招?
虎嗅· 2025-10-15 17:45
| 5 | Threads Share ideas & trends with text | SPS FIX | | --- | --- | --- | | 6 | 谷歌手机软件 图片和文字 AI 赋能搜索, | | | | 都能授 | App 内购买 | | 1 | Amazon Prime Video 娱乐 | SEE EAV | | | | App 内购买 | | 00 | Temu: Shop Like a | | | Todav | 浙字又文 | Arcade | *图源苹果应用商店截图 这不是一次升级,而是一场颠覆。AI短视频迎来"iPhone时刻"。 十一前夕,OpenAI推出了视频生成模型的升级版Sora 2,以及一款同名的AI短视频应用Sora App。 上线不到五天,该应用下载量便突破100万次。这一速度甚至超过了OpenAI旗下的另一款现象级应用ChatGPT,创下新纪录。 值得注意的是,该应用目前仅支持iOS设备,只限北美使用,且采用邀请制,用户需凭借邀请码才能使用。尽管存在这些限制,Sora仍攀升至苹 果应用商店App Store下载榜榜首。试想,若全面开放,其增长势头将何等恐怖。 ...
AI视频生成“暗战”起风
华尔街见闻· 2025-09-29 08:01
用户付费在大语言模型中尚未跑通,但正悄然在AI视频生成赛道中生根发芽。 今年6月,AI视频生成初创公司Runway的年化营收超过9000万美元(约合人民币6.4亿元);同年第二 季度,快手(1024.HK)旗下的AI视频生成应用"可灵"创收超过2.5亿元。 国内初创公司纷纷涌上牌桌。 北京生数科技有限公司(下称"生数科技")的"Vidu"、北京爱诗科技有限公司(下称"爱诗科技") 的"拍我"用户数均已突破千万;作为"杭州AI六小龙"首个IPO,Manycore Tech Inc.(下称"群核科技") 年内亦计划发布针对C端消费者的AI视频生成产品。 市场对于AI视频的商业化前景不仅是局限于个人创作者生成一段短视频,还有影视创作、具身智能等 更多领域。 但由于空间一致性、内容拼接的崩坏等问题的存在,亦让AI视频生成模型陷入"卖家秀"和"买家秀"的争 议中。 尽管属于AI视频生成行业的DeepSeek时刻尚未到来,但在各家大厂的加码下,市场有理由相信未来的 发展路径会愈发清晰。 拼时长 2024年2月,OpenAI推出了Sora 1.0,较此前Runway只能生成3-4秒的视频来说实现了突破性的进展,成 为全球首 ...
英伟达的50亿美元还不够?英特尔扭头又“求”苹果投资;北京发布薪酬数据报告,AI技术年薪中位值达31万丨AI周报
创业邦· 2025-09-28 11:12
国内AI产业发展动态 - 北京建成国内最大人形机器人训练场 占地面积上万平方米 年产数据量超600万条 推动行业标准化规模化发展[8] - 北京市人工智能工程技术人员年薪中位值达312684元 大数据工程技术人员达316388元 反映高端人才薪酬竞争力[8] - 百度萝卜快跑获迪拜001号自动驾驶测试牌照 成为当地唯一开放道路试乘Robotaxi企业[9] - 阿里云发布企业级AI智能体平台"瓴羊AgentOne" 已部署超20种企业级Agent应对数据密集等核心场景[9] - 美的集团完成全人形X系列1代机器人整机设计 预计明年应用验证 其机器人"美罗"已参与工厂巡检及物料搬运[9] - 阿里夸克发布AI创作平台"造点" 集成生图与生视频能力 率先接入通义万相Wan2.5并引入Midjourney V7模型[10][11] - 阿里开源Qwen3-VL系列视觉理解模型 包含235B参数版本 在多项评测中性能达Gemini 2.5 Pro水平[12] - 百度蒸汽机突破AI长视频生成技术 采用流式生成实现无限长度视频制作 突破此前5-10秒限制[12] - 月之暗面Kimi发布Agent模式OK Computer 通过端到端训练提升工具调用能力 支持网站开发及PPT制作等复杂任务[12] - 新石器完成1万台无人车交付 标志无人配送行业从试验迈向规模化应用[16] - 小红书上线AI办公APP"hi" 新增AI助手hibo支持信息总结及联网搜索 或进军企业级服务市场[16][17] - 宇树科技G1机器人实现"反重力"模式 任意动作下稳定性提升 摔倒后可快速起身[19] - 智元机器人披露合伙人团队 彭志辉任总裁兼CTO 团队涵盖营销服及具身业务等核心职能[25] - 腾讯元宝全量上线公众号及视频号评论区 具备用户情绪感知与回应能力[27] - 小米开源原生端到端语音大模型Xiaomi-MiMo-Audio 基于亿小时训练数据实现少样本泛化[27] - 腾讯发布一站式3D工作平台"混元3D Studio" 通过AI技术将3D资产生产周期从天级缩短至分钟级[27] - 通义万相开源动作生成模型Wan2.2-Animate 支持驱动人物及动物照片 应用于短视频创作等领域[29] - 北京完成159款大模型备案 占全国总量28.39% 全国备案大模型达560款 注册用户超32亿[29] 海外AI技术突破与战略布局 - OpenAI CEO预测超级智能或于2030年前出现 AI能力提升轨迹陡峭 几年内或实现人类无法单独完成的科学发现[29] - 英特尔寻求苹果投资以重振芯片业务 今年股价累计涨54% 此前获英伟达50亿及美国政府89亿美元投资[30] - OpenAI考虑租赁英伟达芯片 或节省10%-15%成本支出 采用GPU租赁模式避免采购筹资压力[30] - OpenAI联合甲骨文及软银在美国新增5个"星际之门"数据中心 总投资额达4000亿美元 德州站点已投入运营[31] - 台积电3纳米制程代工价格传闻上涨20% 2纳米制程或涨50% 客户包括苹果及英伟达等头部芯片企业[31] - SAP与OpenAI合作推出"德国版OpenAI" 结合企业应用与AI技术 服务于德国公共部门并确保数据主权[32] - 花旗分析指出OpenAI开发AI边缘设备或使苹果供应链企业受益 立讯精密及歌尔股份等已接触[32] - 马斯克否认xAI融资100亿美元及估值2000亿美元传闻 称目前未进行任何融资[33] - 扎克伯格表示宁愿浪费数千亿美元也不愿在AI领域落后 认为AI泡沫可能出现但更大风险是犹豫[35] - 谷歌将Gemini AI全面整合进Chrome浏览器 支持网页解释及多标签页信息整合 并与日历等应用联动[36] - 英伟达CEO称赞马斯克有望在AI领域占据领导地位 称其经常使用xAI的Grok模型[36] - 微软将在美国威斯康星州建第二座数据中心 累计投资超70亿美元 首座数据中心2026年投运[37][38] - 特斯拉Optimus AI团队负责人Ashish Kumar离职加盟Meta 其曾领导强化学习技术提升机器人灵巧度[38] - 英伟达拟向英国自动驾驶企业Wayve投资5亿美元 已签署意向书评估下一轮融资[40] AI投融资市场概况 - 全球本周披露AI融资事件35起 较上周减少1起 已披露金额事件24个 总融资规模190.84亿元人民币 平均融资金额7.95亿元[42] - 早期阶段融资19起 成长期12起 后期3起 显示资本持续关注早期创新项目[44] - 国内融资集中在江苏及广东等地 江苏披露8起融资共12.2亿元 广东4起共1.4亿元 北京3起共0.4亿元 上海3起共3.3亿元[47][50] - 国内AI领域已披露融资总额20.3亿元 智能清洁泳池机器人商星迈创新获10亿元A+轮融资 为本周最高[52] - 海外AI领域已披露融资总额170.54亿元 AI数据中心开发商Nscale获11亿美元B轮融资 使用AMD及英伟达GPU硬件[62]
AI视频进入蒸汽机时代
机器之心· 2025-09-26 07:54
技术升级与核心突破 - 推出行业首个通用AI长视频生成功能,突破5秒和10秒的时长限制,理论上支持任意长度视频生成[3] - 采用流式生成技术替代传统首尾帧续写方案,用户仅需一张图片和提示词即可实现无限时视频生成,并支持实时调整提示词[4] - 引入交互式需求表达功能,允许在生成过程中暂停并修改提示词,无需等待完整推理过程结束[3][4] 性能表现与案例展示 - 生成视频实现毫秒级人物口型、表情、动作同步,中文语音细节还原度超98%[3][19] - 成功生成连贯长视频案例:小鸭子划水上岸动作流畅,水面涟漪和羽毛细节逼真;西部牛仔一镜到底场景转换丝滑;纸船漂流轨迹真实无失真[6][8][10] - 新增首尾帧功能,通过2张图片和提示词生成5秒视频,支持定格动画、季节过渡等复杂场景[11][15][16] 行业痛点与解决方案 - 解决长视频生成两大核心挑战:时长方面通过自回归扩散模型和动态缓冲区管理保障连续性与一致性;成本方面通过阶梯独立噪声构造降低平方级计算复杂度[25][26][27] - 采用历史参考帧增强策略,通过概率扰动和注意力门控机制缓解累积误差与信息漂移问题[28][30] - 引入训练指导帧和抗偏移技术,确保生成内容不偏离初始设定并保持主体一致性[32] 商业化应用前景 - 大幅降低创作门槛与成本,可应用于广告大片制作(如耳机产品展示)、影视预演、虚拟角色对话等场景[16][19][33] - 支持多角色自然对话与大师级运镜,依托海量中文语料训练实现电影级画质输出[19][33] - 推动AI视频生成从工具级片段制作向互动视频、直播等实时交互场景演进,重塑内容创作商业模式[22][37]
华尔街见闻早餐FM-Radio | 2025年9月26日
华尔街见闻· 2025-09-26 07:08
市场表现 - 美国第二季度GDP增速上修至3.8% 创近两年新高 PCE物价指数2.6% [3][9] - 美国上周首申失业金人数大幅回落至21.8万人 为7月以来最低水平 [3][9] - 美股三大指数三连跌 标普500指数收跌0.50% 道指跌0.38% 纳指跌0.50% 回吐美联储9月会议后涨幅 [2][6] - 美债主要期限收益率齐升 2年期收益率涨4.5基点 10年期涨2.13基点 [2][6] - 美元两日连涨至三周高点 美元兑日元逼近150 [2] - 加密货币全线暴跌 比特币跌破11万美元下跌3.62% 以太坊重挫超7%至3823美元创七周新低 Solana跌7.2%连跌6天 [2][11] - 现货黄金反弹0.38% 白银突破45美元创十四年新高 原油先跌后涨美油较日低涨近2% [2][6] - 创业板再创逾三年高位 宁德时代总市值超贵州茅台达1.83万亿元 恒科指涨近1% 小米午后大涨5% [2][18] 货币政策与央行动态 - 多位前美联储主席、前财长及经济顾问致函最高法院反对解雇美联储理事库克 称将削弱公众对美联储信任 [3][9][12] - 美联储理事米兰主张每次降息50基点 通过"短暂且大幅"降息快速达到中性利率 警告当前政策利率处于"高度限制性"区间 [3][9] - 美联储副主席鲍曼称就业市场"脆弱"证明理应进一步降息 通胀率已足够接近美联储目标 [3][10] - 美联储明年票委洛根呼吁利率工具改革 建议用三方一般担保利率(TGCR)替代联邦基金利率 因TGCR每日交易量超万亿美元远超当前基准 [3][10] - 瑞士央行拒绝负利率 2024年初以来首度暂停降息 瑞士法郎兑美元升至十年高位 [19] 科技与互联网 - 小米17系列全球首发第五代骁龙8至尊版 采用第三代3nm制程工艺 起售价4499元 Pro版4999元搭载"妙享背屏" [3][13][21] - 雷军回应技术质疑 称芯片是成功必由之路 至少坚持十年投入五百亿 五十来岁正是闯的年纪 [3][13][21] - 小米汽车计划2027年进军欧洲市场 已启动实地调研筹备销售网络 长期目标跻身全球前五 [3][21] - 阿里宣布增加AI投资并与英伟达建立新合作 大摩预计阿里云每年新增容量超3GW 相当于2025年整个中国市场新增容量 每1GW约1000亿人民币资本投入 [16][17] - 快手发布"可灵AI 2.5 Turbo"模型 实现近30%成本削减 高盛称其处于全球AI视频生成领域顶尖水平 预计2025财年收入达1.54亿美元 [17] 加密货币与区块链 - 数字人民币国际运营中心正式运营 推出跨境数字支付、区块链服务及数字资产三大平台 [3][9][26] - 加密货币市场遭遇重挫 全球近25万人爆仓损失超11亿美元 17亿美元多头被强制平仓 机构资金撤离加剧抛售压力 [11] - 韩国Naver金融拟收购Upbit 推出韩元稳定币进军全球 将Web2与Web3力量结合 [4][14] - Circle研究稳定币"可逆"交易机制 旨在通过区块链Arc实现"反向支付" 吸引银行及机构客户 [22] - 永续合约加速登陆美国受监管市场 Coinbase已向零售客户推出 芝加哥期权交易所计划11月推出 [20] 新能源汽车与电池 - 比亚迪欧洲8月销量同比暴增200% 连续两个月超越特斯拉 市场份额扩大至1.3% 特斯拉销量下滑36.6% [3][14] - 宁德时代市值达1.83万亿元超越贵州茅台 成为中国第三大上市公司 电池前景良好引发投资者从电动汽车股轮动至电池股 [18] - 小米汽车进军欧洲计划2027年落地 将通过开设展厅让消费者体验电动汽车及智能生态系统 本地化生产为长期必然规划 [21] 大宗商品与资源 - 全球第二大铜矿Grasberg因重大事故停产 高盛预计未来12-15个月造成50万吨铜供应损失 铜价必须上涨 [19] - 中国有色金属工业协会提出严控铜冶炼产能扩张措施 淘汰落后产能 鼓励配套铜矿产能或利用再生资源 行业利润长期有望回归正值 [25] - 阿根廷恢复谷物出口税 70亿美元出口申报额上限仅用两天达成 农产品出口免税政策提前结束 [19] 人工智能与技术创新 - 百度发布全球首个中文音视频一体化模型蒸汽机 支持无限长度AI视频生成 定价策略下调至同类产品70% [28] - 强脑科技推出无线连接仿生手 无需植入芯片依靠超级传感器解码神经信号 实现意念操控 延迟几乎可忽略不计 [29] - 多个AI模型在几分钟内通过CFA三级考试 Gemini 2.5 Pro综合表现最佳 国产KIMI K2多选题正确率达78.3% [24] - Meta推出AI视频创作平台Vibes 集成在Meta AI应用中 允许用户创作、发现和分享短视频内容 [23] - 微软公布芯片内部蚀刻冷却液通道新技术 散热效率达传统冷板三倍 但大摩认为广泛采用仍需时日 [23] 国际贸易与政策 - 商务部对墨西哥涉华限制措施进行贸易投资壁垒调查 涉及汽车及零部件、纺织品、服装等产品类别 [15] - 美国施压韩国将投资承诺提高近2000亿美元 要求现金而非贷款 投资规模向日本5500亿美元协议靠拢 [3][10] - 白宫警告政府关门期间或永久裁员 预算僵局再升级 若10月1日前未达成协议部分联邦雇员面临永久失业风险 [3][10] 企业动态与并购 - 亚马逊与FTC达成和解 支付25亿美元解决诱导用户订阅Prime指控 包括10亿美元罚款和15亿美元用户退款 [22] - 特朗普政府同意使用马斯克旗下xAI的AI模型 联邦机构可以42美分象征性费用获得Grok 4等模型 [22] - SAP遭欧盟反垄断调查 涉软件支持服务限制竞争 可能面临巨额罚款 股价跌超2.3% [23]
百度蒸汽机迎来最新升级,支持生成无限长度的AI视频
选股宝· 2025-09-25 22:41
百度蒸汽机技术升级 - 全球首个中文音视频一体化视频生成模型百度蒸汽机升级 发布通用AI长视频生成功能 支持用户生成无限长度AI视频[1] - 采用流式生成技术突破此前AI仅能生成5秒、10秒短视频的局限 实现通用长视频"无限"生成能力[1] - 一个月前已发布蒸汽机2.0版本 涵盖Turbo、Lite、Pro及有声版多个版本 丰富产品形态和用户选择[1] 产品定价策略 - 新版蒸汽机定价策略大幅下调 刊例价对比同类产品下降至70%[1] - 定价举措降低视频生成门槛 增强产品在市场上的性价比和竞争力[1] 行业应用前景 - 通用AI长视频生成功能有望拓宽AI视频生成工具应用场景 包括电影级特效、数字内容创作等[1] - 中文音视频一体化视频生成模型将推动国产AI在视频内容创作领域高速发展[1] - 视频生成领域应用持续迭代 行业头部公司持续布局 有望提升应用渗透率[1] 相关公司业务进展 - 中文在线通过自研工具链将传统动漫短剧制作11个环节压缩至5个核心步骤 实现生产周期缩短70%、成本降低50%[2] - 零点有数深耕数据分析与决策智能 涵盖AI、云计算、物联网等领域 能力可助力AI视频生成、大模型定制训练、数据治理等多个细分环节[2]
晚报 | 9月26日主题前瞻
选股宝· 2025-09-25 22:35
明日主题前瞻 1、铜 | 据中国有色金属报,近日,中国有色金属工业协会铜业分会第三届理事会第五次会议在河北省雄安新区召开。中国有色金属工业协会高度重视铜冶 炼"内卷式"问题,提出严控铜冶炼产能扩张的具体措施建议。目前,国家有关部门正在加快研究如何加强对铜冶炼产能建设规范化管理具体措施。 点评:据悉,这款产品摆脱了传统假肢的物理控制方式,实现了真正意义上的"大脑遥控"。强脑科技专注于非侵入式脑机接口技术研发,致力于通过脑机技 术提升人类能力,其核心产品包括智能仿生手、智能仿生腿等。与侵入式方案不同,强脑科技选择的是非植入路线,通过自主研发的人工智能算法解析大脑 神经信号,使得高位截瘫患者无需外骨骼即可用意念写字,失语者能重新"发声"。 点评:天风证券认为,铜冶炼行业"反内卷"重中之重在于"产能的优化"。首先,淘汰一批落后产能;其次,现有产能降本增效,包括采用先进冶炼技术以及 智能化、绿色化;最后,新扩建产能需建设高水平冶炼厂,鼓励配套铜矿产能,或有效利用再生资源。铜行业利润长期有望回归正值,产能布局实现优化。 参考供给侧改革成果,预计通过"反内卷"矿冶之间的匹配度将提升,铜冶炼行业存在扭亏为盈的预期。 2、数字 ...