Video Ocean

搜索文档
腾讯研究院AI速递 20250826
腾讯研究院· 2025-08-26 00:01
AI行业竞争动态 - 马斯克成立新AI软件公司"巨硬"(Macrohard) 直接针对微软 目标是用AI黑箱完全替代微软核心业务[1] - 新公司可能与xAI的孟菲斯Colossus 2超级计算机项目密切相关 延续了马斯克与比尔·盖茨的个人及商业竞争关系[1] 3D生成技术突破 - 群核科技开源3D场景生成模型SpatialGen 一句话即可生成可交互的3D室内空间设计[2] - 模型支持结构化场景交互 包括空间查询、适老化设计及路径规划等功能[2] - 公司正在开发全球首款深度融合3D能力的AI视频生成Agent 已实现精准一致性和动作稳定的视频生成[2] 智能会议解决方案 - 腾讯会议推出"AI纪要"功能 每2分钟主动推送会议总结 实时捕捉关键信息、结论和待办事项[3] - 功能可识别会议氛围和言语潜台词 支持会议记录一键导入元宝进行深度提问与内容提炼[3] - 钉钉发布首款AI硬件DingTalk A1 集成录音笔、会议机、翻译机和AI助理功能 配备5颗全向麦克风和骨传导技术[5] - A1内置AI听记系统基于1亿小时音频训练 支持30种方言、140种语言识别和200多种行业术语 会议后自动生成任务跟进表格[6] 视频生成技术演进 - Video Ocean成为全球首个接入GPT-5的视频智能体 一句话即可生成分钟级完整视频 涵盖分镜、画面、配音和字幕全流程[4] - 产品通过三大模块无缝衔接 将用户从提示词工程师转变为创意导演 效率提升10倍[4] - 已吸引14个国家115位创作者体验 可生成F1赛车解说、海洋纪录片等多类型视频内容[4] 科研激励与人才发展 - 2025年科学探索奖评选50位青年科学家 信息电子领域6位学者获奖 包括复旦大学姜育刚、清华大学吴嘉敏等[7] - 获奖者中包含13位年轻科学家(男性35岁及以下 女性38岁及以下) 含6位90后 每人5年内获300万元人民币奖金[7] - 评审机制强调原创性 重点关注"为什么能做出前人做不出的工作" 由14位科学家与马化腾共同发起[7] 开发者工具生态 - 前特斯拉AI总监Karpathy分享四层AI编程工具链 75%时间使用Cursor编辑器自动补全代码[8] - 第二层通过大模型修改代码段 第三层使用Claude Code实现功能模块 最难问题交由GPT-5 Pro在10分钟内解决隐蔽bug[8] 数字永生与知识传承 - Delphi公司开发数字思维(digital minds)产品 通过AI构建专家和创作者的个性化思维模型供他人交互学习[9] - 公司认为连接、能量和信任将成为AI时代最稀缺资源 预计2026年用户难以区分与真人或其数字思维的交流[9] - 采用自适应时间性知识图谱技术 已应用于教育学习、CEO思维规模化和个人流量入口等场景[9]
AI智能体加持,爆款视频产出速度提升了10倍,全民导演时代已来
机器之心· 2025-08-25 10:48
核心观点 - Vibe Coding范式正迁移至影像创作领域,Video Ocean作为AI视频生成平台,通过自动化全流程创作实现效率与创意的双重突破[1][2][5] - 该平台将传统需数周的拍摄周期缩短至数分钟,用户仅需一句话指令即可生成完整视频,内容产出效率提升10倍[2][10] - 创新焦点从模型性能转向应用层交互方式,通过任务导向的智能Agent实现端到端创作,而非单一镜头生成或模板填充[4][5][6] 产品功能与设计 - 全球首个接入GPT-5的视频Agent,提供脚本策划、视觉合成、配音字幕三大模块,自动完成分镜、画面生成、音效及字幕嵌入[6][7][13] - 智能Agent具备持续学习能力,可记忆用户品牌风格与历史创作,避免传统工具每次需重新开始的局限[8] - 支持多语言背景音乐与音效匹配,商用级广告与宣传片一键生成,覆盖企业广告、品牌宣传片、产品发布会等场景[11][13] 用户反馈与市场反响 - 10天内吸引14个国家115位创作者排队体验,首批邀请码数秒内抢空[3] - 海外创作者反馈生成流程顺畅且任务导向明确,可仅用一句话完成完整视频创作[3] - 案例包括F1赛车解说、海洋纪录片、香奈儿广告等,均通过一句话指令生成[13] 应用场景与效率提升 - 热点响应与批量生成能力使内容产出效率提升10倍,适用于产品宣传、活动推广及热点追踪[10] - 支持从0到1构建专业级影视内容,省去拍摄与后期制作流程,快速建立可持续创作体系[12] - 操作仅需通过输入栏提交指令,无需复杂提示词编写,支持修改意见自助调整[15][18][19] 技术基础与行业定位 - 基于潞晨开源项目Open-Sora,学术论文引用量已超越多个著名机构的视频大模型[27] - 定位为AI应用层新范式而非云剪辑工具,聚焦自动化创作生态系统而非参数比拼[5][6] - 目标用户涵盖视频制作新手与专业创作者,旨在实现"Filmmaking for Everyone"的普及化创作[25][26][30]
首个接入GPT-5的视频Agent!一句话生成商业级广告大片,分镜配音字幕等全包了
量子位· 2025-08-25 10:32
产品核心功能 - AI视频生成Agent只需一句提示词即可自动完成分镜、画面、配音、字幕等全流程制作[1][2] - 能够真实还原现实世界画面 从食物到人物动作都极致逼真[4] - 将原本需要数周的视频制作时间缩短至数天甚至数分钟[5] - 不同于传统AI视频生成单个镜头片段 而是直接交付完整创意项目[7] 技术架构特点 - 全球首个接入GPT-5的视频Agent[4][9] - 打造完全自动化的创作生态系统 使AI成为云端创作团队[9][10] - 具备持续学习能力 能记住品牌风格和历史创作[11] - 包含脚本策划、视觉合成、配音字幕三大智能模块[16] 商业应用价值 - 内容产出效率提升10倍 可快速批量生产爆款视频[12] - 支持企业广告、品牌宣传片、产品发布会视频等商业场景[13] - 从0到1构建专业级影视内容 建立可持续创作的影视王国[14] - 通过简单文字指令即可生成商用级视频 降低专业制作门槛[19][21] 用户体验优势 - 操作界面简化 所有功能通过输入栏即可完成[19] - 自动将文本指令分解为创意构思、脚本编写和分镜生成[21] - 支持实时修改调整 生成的图像自动归类到对应分镜[23][25] - 自动完成剪辑过程 并提供项目回放功能追溯创作历程[26] 市场反响 - 小范围开放邀请码后迅速在X、Reddit、YouTube等平台刷屏[6] - 主要创新在于改变了创作协作模式 从单点效率提升转向完整项目交付[7]
突发!潞晨科技宣布将暂停DeepSeek API服务,时间在一周后
证券时报· 2025-03-02 07:43
潞晨科技停止DeepSeek API服务 - 潞晨科技宣布一周后停止提供DeepSeek API服务 未用完余额将全额退款 [2] - 此前华为计算公众号发文称DeepSeek-R1系列模型因性能和低成本引发全球关注 潞晨科技与昇腾联合发布基于昇腾算力的DeepSeek-R1推理API及云镜像服务 [2] DeepSeek-R1模型成本与定价争议 - 潞晨科技CEO尤洋表示满血版DeepSeek-R1每百万token定价16元 每日输出1000亿token可使接入企业月收入达4800万元 [2] - 完成1000亿token输出需约4000台H800机器 月机器成本达4.5亿元 可能导致企业月亏损4亿元 [2] - DeepSeek披露理论成本利润率545% 在GPU租赁成本2美元/小时情况下 日总成本87072美元 日总收入562027美元 [6] 公司背景与业务发展 - 潞晨科技核心团队来自加州大学伯克利分校 斯坦福大学 清华大学 北京大学等知名高校 [6] - 主营业务包括分布式软件系统 大规模人工智能平台 企业级云计算解决方案 [6] - 开发开源低成本AI大模型开发系统Colossal-AI 旨在最大化AI训练效率同时最小化训练成本 [7] - Video Ocean和潞晨云累计服务用户超10万 付费客户2476家 包括4家世界500强和10家上市公司 [7] - 2024年营收7700万元人民币 预计2025年达1.5亿元 2026年增至3亿元 [7]