Workflow
新浪科技
icon
搜索文档
阿里AI四连发,宣布开源电影级视频模型Wan2.2
新浪科技· 2025-07-28 20:26
新浪科技讯 7月28日晚间消息,继上周阿里AI三连发后,阿里又扔出新的开源模型——电影级视频生成 模型通义万相Wan2.2。Wan2.2可将光影、色彩、镜头语言三大电影美学元素装进模型,随意组合60多 个直观可控的参数,大幅提升电影级画面的制作效率。 目前,该模型单次可生成5s的高清视频,用户可通过多轮提示词进一步完成短剧制作,未来通义万相还 将继续提升单次视频生成的时长,让视频创作更高效。 据悉,Wan2.2此次开源了文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频 生成(Wan2.2-TI2V-5B)三款模型,其中文生视频模型和图生视频模型均为业界首个使用MoE架构的视 频生成模型,总参数量为27B,激活参数14B,均由高噪声专家模型和低噪专家模型组成,分别负责视 频的整体布局和细节完善,在同参数规模下,可节省约50%的计算资源消耗,有效解决视频生成处理 Token过长导致的计算资源消耗大问题,同时在复杂运动生成、人物交互、美学表达、复杂运动等维度 上也取得了显著提升。 此外,Wan2.2还首创了电影美学控制系统,光影、色彩、构图、微表情等能力媲美专业电影水 ...
猎豹移动宣布控股UFACTORY,合计持股超80%
新浪科技· 2025-07-28 17:53
交易概述 - 猎豹移动拟以约9946万元总对价收购深圳众为创造科技有限公司60.8%股份 [1] - 交易前猎豹移动全资子公司已持有UFACTORY 19.2%股份 [1] - 交易完成后猎豹移动将合计持有UFACTORY 80%股份,对应最终经济权益增至75.8% [1] - 交易预计于2025年三季度完成,已获董事会及审计委员会批准 [1] 标的公司情况 - UFACTORY成立于2013年,总部位于深圳,专注轻量型协作机器人研发与制造 [1] - 公司产品覆盖全球80多个国家和地区,以海外市场为主且实现盈利 [1] - 通过国际市场渠道开拓建立稳定全球客户群,营收持续稳定增长 [1] 战略意义 - 交易将进一步丰富猎豹移动机器人产品矩阵 [2] - 拓展机器人应用边界,覆盖更多物理世界场景与作业需求 [2] - 猎豹移动截至2025年3月31日持有超过2.3亿美元净现金,为机器人战略提供资金保障 [2]
对话金山办公助理总裁田然:AI PPT续费率极低,好的AI助理要像人一样
新浪科技· 2025-07-28 15:18
WPS AI PPT产品负责人陆炜俊在与新浪科技沟通中同样表示,"我们的核心优势是有37年的Office编辑 器理解,我是非常重要的,我们除了能够用好AI,还能够理解office,这就是我们跟别人不一样的地 方。"在他看来,对于office的理解就像是办公软件领域的"芯片",外围的只是"造手机",金山办公虽然 也会自己"造手机",但更核心的还是拥有office的理解能力。 据他透露,目前很多创业公司正主动找到金山办公,希望跟金山办公承接好他们做完的网页。"这个事 情全球范围内只有微软和我们能干,这就是我们的核心能力。"陆炜俊表示。(文猛) 责任编辑:何俊熹 在与新浪科技沟通中,金山办公助理总裁田然表示,"一个好的AI办公软件或AI助理,是跟人一样的, 你怎么去与一个(真人)助理沟通,就该怎样(用AI)去还原它。"在他看来,WPS灵犀就金山办公从 2023年发布WPS AI至今,探索出的更实用、更接近用户的产品形态。 田然指出,今天很多生成AI PPT的智能体产品,其实续费率是非常低的,他的用户留存、次月留存数 据远低于一般产品的平均线,原因是这缺乏粘性和留存,只能解决用户一些简单的基础的问题,但却不 能解决一 ...
汉王科技发布全新语音王App,实现与汉王智能办公本深度打通
新浪科技· 2025-07-28 15:07
汉王科技新产品发布 - 公司在2025世界人工智能大会上展示了多模态智能感知、天地大模型、仿生智能、智能终端和人工智能+行业解决方案 [2] - 公司发布了基于自研多模态天地大模型的语音王App,具备AI语音记录、智能翻译与同声传译三大功能 [2] - 语音王App支持AI精准转写、拍录同步、话稿整理、智能总结及长时段不间断实时翻译等功能 [2] 技术突破 - 公司基于天地大模型开发了新一代语音识别系统,采用端到端一体化设计,相比传统多模块分离式架构减少了误差传递 [2] - 新系统在复杂噪声环境和多样化应用场景中表现更加稳定可靠 [2] 产品生态整合 - 语音王App实现了与汉王智能办公本的深度打通,并入电纸本账号系统,支持数据无缝同步 [3] - 用户无需绑定设备或账号即可完成数据同步,实现功能/记录完全互通 [3] - 公司提供免费无限次的语音转写服务,支持手机端和办公本端使用 [3] 协同办公生态 - 公司此前已通过扫描王App、电纸本助手、聚合网盘等应用构建了协同生态 [3] - 新App实现了语音识别技术、类纸护眼显示技术与跨设备高效流转的深度融合 [3] - 公司计划持续推动自研技术在墨水屏产品上的应用,包括手写电磁笔技术、OCR技术等 [3]
金山办公助理总裁田然:我们这些人挺实在,不会发炫酷的东西
新浪科技· 2025-07-28 14:46
新浪科技讯 7月28日下午消息,2025世界人工智能大会(WAIC 2025)期间,金山办公发布了WPS AI 3.0版本——WPS灵犀,用户只需通过自然语言、多轮对话即可完成文档创作、演示文稿生成及语音助 手等功能,全程无需复杂操作和外部跳转,是真正意义上的原生Office办公智能体。 在与新浪科技等媒体沟通中,金山办公助理总裁田然表示,"一些AI公司做的东西,和用户真实的需求 是不一致的,WPS刻在所有产品经理骨子里的东西是——我们踏踏实实的,我们这些人其实挺实在 的,在发布会上一般发挥不了什么炫酷的东西,我们每天看着1亿的用户,他们不是想要一个炫酷的产 品,要的是解决PPT、表格、文档中实际的问题。" "当前绝大多数的AI公司,还在致力于去证明自己的AI能力,并把自己AI模型的能力包装出去提供给用 户,而不是满足用户真实的需求。"在田然看来,证明自己的阶段自然很必要,但金山办公更想做的 是"很快地进入下一个阶段"。(文猛) 责任编辑:尉旖涵 "一句话生成长达几十页的调研报告,这个很炫酷,但我们会倾向于有用。"在田然看来,一个好的AI办 公软件或者AI助理,是跟人一样的,你怎么去与一个(真人)助理沟通,就 ...
对话商汤联创林达华:多模态是AGI的必经之路,是不可缺少的部分
新浪科技· 2025-07-28 12:24
公司动态 - 商汤科技在2025世界人工智能大会期间发布"悟能"具身智能平台 该平台以具身世界模型为核心引擎 依托商汤大装置提供端侧和云侧算力支持 能为机器人 智能设备提供感知 视觉导航及多模态交互能力 [1] - 商汤科技联合创始人表示 多模态是AGI的必经之路 公司在计算机视觉领域积累多年 拥有多模态模型和AI技术 并与硬件公司有广泛合作 在智能驾驶过程中积累了模型应用和控制技术体系 [1] - 公司旗下拥有元萝卜机器人及绝影等机器人及智驾业务 同时通过国香资本重点投资具身智能赛道 被投企业包括银河通用 众擎机器人 钛虎机器人 鹿明机器人等 [1] 行业趋势 - 具身智能市场正在快速成长 商汤科技希望从商业角度捕捉这一机会 公司认为其多模态大脑与具身智能相结合 在世界模型上的积累将形成重要竞争优势 [1] - 具身智能领域近期融资活跃 商汤投资的银河通用获得宁德时代参投的11亿元新一轮融资 众擎机器人完成近10亿元融资 [1]
直击WAIC丨蚂蚁数科发布金融推理大模型,评测效果超主流开源大模型
新浪科技· 2025-07-28 11:28
专题:2025世界人工智能大会 - 蚂蚁数科在世界人工智能大会论坛上正式发布金融推理大模型Agentar-Fin-R1,旨在为金融AI应用打造"可靠、可控、可优化"的智能中枢 [1] - Agentar-Fin-R1基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越Deepseek-R1等同尺寸开源通用大模型以及金融大模型 [1] - 该模型展现出更强的金融专业性、推理能力以及安全合规能力 [1] 金融大模型技术特点 - Agentar-Fin-R1包括32B和8B参数两个版本 [2] - 蚂蚁数科推出基于百灵大模型的MOE架构模型,获得更优推理速度 [2] - 还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求 [2] 金融大模型应用前景 - 通用大模型距离产业实际应用存在"知识鸿沟",构建专业的金融大模型是推进金融与AI深度融合的必然路径 [1] - 未来金融大模型的应用深度将成为金融机构竞争力的关键要素 [1] - 蚂蚁数科构建了业内最全面与专业的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景 [1] 数据与技术优势 - 基于千亿级金融专业数据语料 [1] - 通过可信数据合成技术以及结合专家标注的金融长思维链(CoT)构造机制,显著提升模型处理复杂任务的能力 [1] - 使大模型"天生懂金融,出厂即专家" [1]
硅谷观察:特朗普又赢了,全球第二富豪绝对掌控美国媒体巨头
新浪科技· 2025-07-28 07:18
超级富豪与媒体控制权 - 全球首富马斯克身价3600亿美元,埃里森、扎克伯格、贝佐斯身价在2000亿-2800亿美元之间 [2] - 超级富豪普遍拥有媒体资产:马斯克控制X平台、扎克伯格运营Meta社交矩阵、贝佐斯持有《华盛顿邮报》 [2] - 埃里森以60亿美元收购派拉蒙控股权,交易总价值84亿美元 [2][13] 派拉蒙交易细节 - 交易结构包括24亿美元现金收购National Amusements、45亿美元支付流通股东、15亿美元用于业务扩张 [13] - 新公司Paramount Skydance估值280亿美元,埃里森家族持股70%且拥有全部投票权 [13] - 原派拉蒙控股方雷石东家族完全退出,大卫·埃里森将出任新集团CEO兼董事长 [14] 好莱坞行业整合趋势 - 近年重大并购包括亚马逊收购米高梅、华纳与Discovery合并、迪士尼收购福克斯 [10] - 派拉蒙2024上半年净亏损60亿美元,流媒体转型受阻促使出售 [13] - 交易标志传统影业向"内容+平台+资本"模式转型,直接对标迪士尼/Netflix [14] 埃里森家族影视布局 - 大卫·埃里森2006年创立Skydance,参与制作《碟中谍6》《星际迷航》等大片 [6][8] - Skydance业务覆盖电影/电视剧/动画/男装品牌,2018年与腾讯达成战略合作并获得1亿美元投资 [8] - 公司此前通过制作协议与派拉蒙合作,现直接收购该好莱坞五大制片厂之一 [8][10] 交易政治背景 - 派拉蒙支付1600万美元与特朗普达成诉讼和解,被质疑为换取监管批准 [16][17] - Skydance承诺未来提供2000万美元政治广告,并取消DEI政策以迎合共和党 [19] - FCC以2:1投票批准交易,民主党委员批评此举损害新闻独立性 [15][16] 甲骨文与政商关系 - 埃里森长期支持特朗普,2020年举办筹款活动,2024年协助组建执政团队数据库 [22][24] - 甲骨文股价年内上涨47.6%至7000亿美元市值,参与美国政府5000亿美元AI计划 [24] - 公司获得司法部支持对抗谷歌,并承接"星际之门计划"数据中心建设 [22][24]
直击WAIC丨智联招聘亮相2025世界人工智能大会,首发智联招聘AI版
新浪科技· 2025-07-27 22:50
专题:2025世界人工智能大会 新浪科技讯 7月27日晚间消息,日前,2025世界人工智能大会(WAIC 2025)在上海开幕。智联招聘携 数智化创新成果亮相,发布全新的AI应用成果。 在大会核心展区,智联招聘以极具科技感的黑色主题展厅亮相。展台中央的大型交互屏幕实时演示升级 后的智联招聘AI版的各项功能,包括AI发布职位、智能沟通等全流程招聘解决方案,吸引了众多参展 观众感受人工智能对招聘模式的重塑。在技术的加持下,Z世代HR用算法解放事务性工作,新生代求职 者通过AI工具优化求职策略,招聘和求职正在完成从"技术赋能"到"代际共识"的跨越。 智联招聘AI版基于对不同行业的属性和岗位招聘特征定制"智能全托管"服务,从过去面向全行业的招聘 提效,进入"行业定制化"阶段,使AI招聘更具个性化,进一步提升招聘效率和精准度。 智联招聘AI版能够覆盖招聘的全流程,从职位发布、简历筛选、智能沟通到面试,每个环节均有AI助 力,大幅提升招聘效率。例如,AI 沟通助手可以即时响应求职者,自动答疑;AI推荐助手能够自动更 新推荐列表;AI批量邀约可以实现智能筛选、批量邀请投递、多轮对话加强求职者意向、AI辅助沟通 直至达成投递 ...
直击WAIC|Soul App亮相WAIC 2025,公布全双工语音通话大模型
新浪科技· 2025-07-27 15:58
公司动态 - Soul App在2025世界人工智能大会(WAIC 2025)上展示最新升级的自研端到端全双工语音通话大模型及其在多人语音互动场景群聊派对AI主持的应用交互效果 [1] - 公司CTO陶明表示AI融入社交关系网络、重构交互方式已成为大势所趋,Soul致力于构建AI与人类共存的社交社区 [3] - 公司在大会现场以"AI社交练习"为主题,重点展示全双工语音/视频通话能力支持的"超类真人"和"深度沉浸"社交体验 [3] 技术突破 - Soul自研的端到端全双工语音通话大模型摒弃传统VAD机制与延迟控制逻辑,打破行业"轮次对话"模式,赋予AI自主决策对话节奏能力 [4] - 全双工通话大模型即将在平台内测,后续将落地于虚拟人实时通话、AI匹配等1V1、多对多互动场景 [4] - 公司展示了基于全双工语音通话能力和实时视频生成能力的最新探索成果,使用户可以看到"AI的形象和世界" [4] 产品应用 - AI在社交中扮演双重角色:情感疗愈伙伴(解析用户社交困境,提供情绪赋能)和真人关系桥梁(捕捉共鸣信号催化真实友谊) [3] - 公司通过全双工实时视频通话能力,使用户能多维度塑造"数字人格",促进关系深度链接 [4] - 此前Soul团队实时人像视频生成研究成果已被国际学术顶会CVPR2025接收 [4]