Seko
搜索文档
Sora登顶苹果App Store;阿里云升级全栈AI体系;英伟达拟投1000亿助OpenAI建数据中心|一周AI要闻回顾
36氪· 2025-10-04 21:22
AI视频生成技术突破与应用 - OpenAI推出AI视频生成应用Sora,凭借独特技术超越Google Gemini和ChatGPT,登顶苹果App Store免费应用榜首[2] - Sora2模型能生成高度逼真的场景和声音,用户可通过邀请码在iOS设备上制作并分享由版权内容生成的AI视频[2] - 快手发布可灵2.5 Turbo视频生成模型,文生视频、图生视频功能更新,文本响应和动态效果显著提升,1080p模式下生成5秒视频成本降低30%[7] - 商汤科技AI视频Agent Seko上线一个月吸引超10万创作者,作为创编一体AI短片创作工具,通过对话即可直接生成视频[8] - 阿里夸克推出"造点"AI产品,联合接入通义万相Wan2.5视频生成模型与Midjourney V7生图模型,成国内首个支持音视频同步生成的AI平台,Midjourney V7会员价腰斩至48元/月[6] 大模型技术竞争与性能提升 - 阿里云发布7款通义大模型,旗舰模型Qwen3-Max参数超万亿,预训练数据达36T tokens,在编程、Agent工具调用测试中超越GPT5、Claude Opus 4,跻身全球前3[3] - 专项模型Qwen3-Coder开源后调用量激增1474%,全模态模型Qwen3-Omni在32项开源评测中获最佳,支持音视频全场景交互[3][4] - 谷歌推出AI心情板构建工具Mixboard,结合Gemini 2.5 Flash模型,用户可通过文本提示创建设计项目心情板,在美国进行公开测试[6] - GPT-5首次通过"哥德尔测试",在组合优化领域破解5个未解决猜想中的3个,展现从"学数学"到"做数学"的跨越[16] - GPT-5助力量子计算专家团队攻克量子领域核心难题,将原本需1-2周人力的工作压缩至30分钟内完成[17][18] AI基础设施与重大投资计划 - 阿里云宣布未来三年投入3800亿建设云和AI基础设施,当前其在国内AI云市场占比领先,推动阿里巴巴港股当日涨超7%[2][5] - 英伟达拟投资1000亿美元助力OpenAI建设至少10GW数据中心,该合作意向推动英伟达股价涨3.93%,市值增长1700亿美元[9] - 京东发布AI全景图,宣布未来三年持续投入构建万亿规模人工智能生态,并开放产业场景与供应链数据支持企业模型训练[10] - 阿里巴巴宣布将AI领域投资提升至超过500亿元人民币,以加强在全球科技市场的竞争力[12] - 阿里巴巴与英伟达开展Physical AI合作,阿里云人工智能平台PAI将集成英伟达Physical AI软件栈,缩短具身智能等应用开发周期[10] 机器人技术与具身智能发展 - 特斯拉CEO马斯克透露公司正全力推进Optimus人形机器人大规模生产,目标明年生产5万至10万台,并预计未来特斯拉80%价值将来自于此[11] - 优必选再签3000万元人形机器人大单,其Walker系列人形机器人累计获近4.3亿元合同,产品已进入全球多家工厂实训[12] - 京东方成立机器人公司,注册资本2亿元人民币,经营范围涵盖工业机器人制造和智能机器人研发[11] - OpenAI投资的挪威机器人公司1X Technologies寻求新一轮10亿美元融资,目标估值100亿美元,较2025年1月估值增长12倍以上[13] - 谷歌推出Gemini Robotics-ER 1.5模型,专为提升机器人感知和现实世界互动能力设计,作为机器人高级推理大脑向所有开发者开放[16] AI应用生态与商业模式创新 - 滴滴AI出行助手"小滴"开启公测,用户可通过自然语言下达复杂出行指令,AI助手将完成车辆匹配与调度并提供最多3个方案选择[8] - 京东发布"他她它"数字人万能助手,内置数字人智能体可回答问题、聊天、点餐,并支持用户自创智能体及装入智能设备[7] - AI陪伴硬件公司珞博智能完成红杉中国领投的数千万元天使+轮融资,其产品"Fuzozo芙崽"月销量突破2万台[14] - AI初创公司Paid完成2160万美元种子轮融资,主打"结果计费"商业模式,为AI agent提供收益分成基础设施[14] - 数据公司Fivetran寻求收购估值数十亿美元的DBT Labs,旨在整合数据建模工具和服务,提供更全面数据解决方案[15] AI行业趋势与影响 - OpenAI CEO Sam Altman预测到2030年超级智能很可能出现,AI转折点是从被动等待用户提问转变为主动思考[17] - 周鸿祎表示公司有理由裁掉拒绝使用AI的员工,强调AI时代趋势要求员工必须适应和应用AI技术[15] - 蓝色光标投资PureblueAI清蓝超千万元,其2025年上半年AI驱动收入达15.7亿元,已超2024年全年[13] - 语音聊天App Neon-Money Talks上线一周冲入美区App Store免费榜前五,揭示AI时代数据商品化趋势及隐私保护担忧[9] - AI代理平台Paid已拿下包括Artisan在内的客户,并与ERP供应商IFS达成合作,探索AI代理新型商业模式[15]
商汤推出短片创作平台Seko 成本骤降引10万创作者入驻
证券时报网· 2025-09-30 19:41
公司产品发布与技术创新 - 商汤推出业界首个“创编一体”的AI视频创作平台Seko,用户通过文字指令和对话即可生成影片[1] - Seko平台可将制作单分钟动画的成本较传统模式大幅降低99.5%[1] - 平台集成自研SekoTalk技术,支持长图生成影像并匹配口型,且不受时长限制[1] - 平台提供配音及配乐服务,包含60种自然音色,确保角色画面、台词与配音高度匹配[1] - Seko通过复制分镜及对应指令的上下文记忆和改图能力,保障剧情与场景连贯性[2] - 平台集成日日新、即梦4.0、可灵2.1等一致性生图模型,可一次性创作高度一致的超长连续分镜[2] - Seko的专业级成片编辑器支持创作中预览效果,便于高效修改并导出成片[2] 市场采用与行业影响 - Seko平台已吸引逾10万内地创作者使用,涵盖影片制作团队、KOL、短剧导演等群体[1][2] - AIGC创作者利用Seko制作的短片《飞天计划》已获得“古今双飞天AIGC创新设计大赛”最佳创意奖[2] - AI短剧成为新趋势,Seko平台涵盖AI短剧、AI漫剧等热门场景[1] - 公司已从教育、医疗、媒体、金融、交通等领域的ToB与ToG客户中获得生成式AI新项目订单[3] 财务表现与机构观点 - 商汤股价于9月30日大涨5.47%,盘中最高触及2.9港元,创下2023年4月以来两年多新高[4] - 高盛预期公司未来项目将加速增长,主要受惠于内地云端资本开支提升及“AI+”行动方案等政策推动[3] - 高盛认为商汤具备提供覆盖算力、AI基础设施、基础模型及生成式AI应用的全套解决方案能力[3] - 预计公司未来几年将继续专注于大型项目,以确保更高效率并提高收入[3]
腾讯研究院AI速递 20250813
腾讯研究院· 2025-08-13 00:01
英伟达和AMD芯片出口许可 - 英伟达和AMD同意向美国政府上缴特供中国芯片收入的15%以换取出口许可证 [1] - 英伟达将上缴H20芯片在中国销售收入的15%,AMD上缴MI308芯片相同比例收入 [1] - 美国商务部已开始发放面向中国市场的出口许可证 [1] OpenAI在IOI竞赛表现 - OpenAI在2025年国际信息学奥林匹克AI赛道取得金牌级成绩,在330位人类选手中排名第6 [2] - 仅使用通用推理模型,未针对比赛专门训练,遵守5小时答题时间和50次提交限制 [2] - 成绩从去年第49百分位跃升至第98百分位,展示强大通用推理能力 [2] 智谱开源GLM-4.5V模型 - 开源106B参数视觉推理模型GLM-4.5V,在41个多模态榜单达SOTA性能 [3] - 图像识别与推理测试击败99%人类玩家,创下图寻游戏全球第66名 [3] - 采用三阶段训练策略,支持64K多模态长上下文,API价格低至输入2元/M tokens [3] 昆仑万维开源3D生成模型 - 开源Matrix-3D大模型,可从单张图像生成高质量全景视频和可漫游3D空间 [4] - 具备场景全局一致、生成范围大、高度可控等五大核心优势 [4] - 构建包含116K全景视频、22M全景帧的Matrix-Pano数据集 [4] 腾讯混元多模态模型 - 发布混元Large-Vision模型,采用MoE架构,激活参数52B [5] - 在国际LMArena Vision榜取得1256分,位列国内第一 [6] - 基于数十亿参数视觉编码器和389B参数MoE语言模型构成 [6] GitHub并入微软CoreAI - GitHub将整体并入微软新成立的CoreAI工程集团,不再独立运营 [7] - 由微软开发者部门负责人和AI平台副总裁分管 [7] - 目标是将GitHub打造为"AI智能体工厂" [7] 商汤AI视频工具Seko - 推出全流程视频生成工具Seko,可自动完成剧本理解、镜头拆解等工作 [8] - 基于Agent系统集成文生图、图生视频等多种功能 [8] - 提供可视化成片编辑体验,支持分镜复制和单镜头替换 [8] 苹果Siri升级计划 - 分三阶段重塑Siri,2025年底推出初步"Apple智能" [9] - 基于App Intents框架打通应用间接口,支持屏幕感知和连续对话 [9] - 正与Uber、YouTube等战略伙伴进行内部测试 [9] Periodic Labs材料科学AI - 由OpenAI和DeepMind前成员创立,获2亿美元融资 [10] - 成立3个月即获10亿美元投前估值,OpenAI可能参投 [10] - 目标是构建"用于材料科学的ChatGPT" [11] GPT-5与Claude编程测评 - GPT-5在算法题上token消耗比Claude少90%(8K vs 79K) [12] - Claude在网页开发还原度更高但token消耗更多(140万 vs 90万) [12] - GPT-5完成任务成本约$3.50,Claude约$7.58 [12]