Workflow
Veo 3.1
icon
搜索文档
万兴科技入围中国人工智能百强榜
科技日报· 2026-01-19 20:47
公司荣誉与行业地位 - 万兴科技入选深圳市人工智能产业协会发布的“中国人工智能百强榜”前50名,与字节跳动、华为、阿里、腾讯等头部企业一同上榜 [1] - 公司被视为“中国版Adobe”,业务覆盖全球200多个国家和地区,累计活跃用户突破20亿 [2] 技术研发与产品创新 - 2025年6月,公司推出万兴天幕音视频多媒体大模型2.0,相比1.0版本,新模型性能平均提升约90% [1] - 其海外版ToMoviee 2.0 AI在文生视频大模型全球评测榜单VBench-2.0中跻身全球前三,并在摄像机运动与运动合理性两项关键指标上位列全球第一 [1] - 公司产品覆盖视频创意、文档创意、绘图创意等业务领域,已打造万兴喵影、万兴脑图、万兴图示、Wondershare SelfyzAI等明星产品 [1][2] 产业生态与合作布局 - 公司在AI技术研发、产品应用落地、产业生态合作、AI人才布局等层面持续投入,系统性构建AI驱动的数字创意软件生态 [1] - 已与微软、华为、英伟达、谷歌等企业深化合作,共建前沿AI应用生态 [1] - 旗下多款海外产品已集成谷歌新一代图像生成与编辑模型Nano Banana Pro、新一代AI视频生成模型Veo 3.1,以及OpenAI新一代视频生成模型Sora 2等模型能力 [1]
AI应用的三个真相:革命未至,真金浮现
36氪· 2026-01-15 21:47
文章核心观点 - 2025年AI应用正从泡沫破裂低谷期迈向稳步爬升期,进入价值实现与规模起量阶段,但尚未催生决定性新物种 [1] - 消费端应用感知度更高,但企业端付费意愿更强、市场潜力巨大,两者正以不同商业逻辑并行发展,整体市场规模尚未有定论 [1][2][3][4] - 新的用户入口正在酝酿,2026年或将成为AI在多市场实现规模收益的第一年,多个热门赛道有望爆发 [1][6][7] - 中美AI落地路径呈现差异,美国已深入支柱产业,中国需加速AI在制造、新能源等核心产业落地以转化为生产力与竞争优势 [1][11][12] 消费端与企业端应用现状与对比 - **消费端应用特点**:高度贴近手机场景,天然适配对话与生成式交互,大众感知明显 [2] - **消费端主要赛道**:集中在AI助手App、AIGC生成工具、手机厂商智能助手、AI教育辅导四类 [2] - **消费端市场数据**:2025年12月周活跃用户前五为字节豆包(1.55亿)、DeepSeek(8156万)、腾讯元宝(2084万)、蚂蚁阿福(1025万)、阿里千问(872万)[2] - **消费端商业化**:AI教育辅导付费率达25%~30%,率先实现付费闭环 [2] - **手机智能助手市场**:被低估,OPPO小布2025年8月月活达1.7亿,浪潮信息称其算力消耗长期位居前列 [2] - **企业端应用范围**:已在汽车、金融、农业、医药等多个行业铺开,各行业均在拥抱AI [3] - **企业端高潜力领域**:AIGC、AI硬件、AI短剧、AI Agent处于爆发前夜,AIGC流程跑通后对模型与算力的消耗将是指数级大爆发 [3] - **企业端应用规模争议**:一方认为消费端AI助手、文生视频占据最大市场(如豆包每天消耗50万亿tokens)[3],另一方认为企业级市场(如AI编程、标书审查、科研文献整理)调用量巨大,空间不低于消费端 [4] - **企业端付费优势**:企业级付费意愿和商业化空间更高,同样的token消耗价值高于消费端 [4] - **市场规模衡量挑战**:当前以Token为使用量指标存在结构性偏差,大量企业私有化部署、端侧推理、开源模型应用等产生的Token未进入公有云API统计体系 [4][5] - **隐形企业级市场**:2025年数据中心与智算中心亿元级公开招投标项目已超过222个,大量算力建设与AI应用在公开tokens统计之外 [5] 2026年热门赛道与产业拐点 - **发展速度**:AI落地速度明显快于以往技术周期,从提出到产业化被压缩至2-3年 [6] - **产业阶段判断**:AI尚未完成“革命”,但2026年或将成为形成规模收益的第一年 [1][6][7] - **文生视频赛道**:自谷歌推出Veo 2后,开始具备商业化可能,呈现多强竞争格局,紧盯快消、美妆、3C电子等市场,广告自动化生成已开始起量 [7] - **AI手机赛道**:字节与中兴联合推出GUI Agent手机激起行业研发,各厂商路径不一(GUI路线与MCP/A2A路线并存),后续竞争有看点 [7] - **具身智能/人形机器人赛道**:2025年全球出货量约1.3万台,前十厂商中六家来自中国,Omdia预测2035年出货量将达260万台 [8] - **具身智能技术主线**:一看“大脑”(新型模型架构或于2026年下半年突破),二看灵巧手(仿生手研发复杂度远超外界想象)[8] - **B端行业深化应用**:预测性维护等智能体产品已从头部向中腰部客户复制,客户ROI评估转向要求AI完成过去做不到的事 [10] - **高价值智能体特征**:复杂度高,能自动编排二三十步任务,实现端到端业务流程闭环与自适应调整,为企业创造巨大价值 [10] 中美AI落地路径差异与中国核心产业机遇 - **中美调用结构差异**:中国公有云MaaS主要调用来自手机与互联网应用,美国最大调用方是SaaS企业(如SAP是OpenAI全球前五大客户)[11] - **美国应用领域**:已将AI用于科研、生物医药、金融等支柱产业,AI Coding是第二大调用来源,以Claude模型为例,其2025年收入已接近百亿美元 [11][12] - **中国核心落地产业**:需加速将AI落地于制造、电子电气、新能源、农业、互联网等自身核心支柱产业,以转化为效率、社会价值与GDP增量 [1][12] - **“AI+制造”的战略地位**:被视为关键战场,关乎全球制造业竞争格局与产业话语权,对中国是“必选题” [12] - **中国制造业AI挑战**:与欧美头部企业存在应用差距,制造业数字化水平参差不齐,需补“数据债、信息债、自动化债、工业软件债”,落地挑战高于金融、互联网 [14] - **工业AI实施复杂性**:需融合多模态模型、机理模型甚至世界模型,并依赖生态协同,是一场长期工程 [14] - **政策支持**:2025年国务院发布《关于深入实施“人工智能+”行动的意见》,国资委上线人工智能“焕新社区”平台,推动AI与支柱产业结合 [14] - **技术迭代预期**:未来两个月内全球大模型将迎来迭代高潮,市场期待在多模态、Coding模型、世界模型等方向突破,从而再次拉动应用层爆发 [15]
谷歌也要「AI抖音」了!新Veo 3.1原生支持竖屏,4K分辨率高画质
量子位· 2026-01-14 16:10
谷歌Veo 3.1模型升级核心要点 - 谷歌Veo 3.1模型进行了重要更新,核心升级方向为**竖屏**和**4K**画质,标志着公司正式进军AI短视频领域 [1][2][11] - 此次更新虽被官方视为小幅升级,但具备重大意义,旨在满足移动端短视频需求并提升用户体验 [9][10][12] 技术功能与性能提升 - **首次原生支持9:16竖屏视频**,专为移动端短视频平台优化,无需裁剪 [15] - 在原有720p基础上,**新增4K分辨率**,此前最高为1080p [15] - **创意能力提升**:即使提供简单提示词和参考图片,模型也能生成各种小剧场 [13][14] - **一致性大幅改进**:包括角色一致性(如人物在不同场景中保持相同外观)和背景与物体一致性(保持场景物体在多个镜头中的完整性) [16][26] - **元素融合能力大幅改善**:可将多张图片中的角色、物体、纹理和风格化背景自然融合成连贯视频 [20][21] 应用场景与用户反馈 - 功能已面向所有谷歌用户推出,**普通消费者**可通过YouTube Shorts、YouTube Create及Gemini应用体验 [23][24] - **企业或专业用户**可通过Flow、Gemini API、Vertex AI和Google Vids等平台使用 [25] - 用户实际生成案例显示效果良好,包括角色一致性故事、虚拟偶像组合及AI动漫制作 [26][29][30] 行业趋势与竞争格局 - AI视频正在进入**竖屏时代**,谷歌并非首家,OpenAI和迪士尼等公司已先行布局 [33][34] - OpenAI曾推出独立Sora应用(被视为“AI版抖音”),但其用户留存率数据显示从首日10%降至第7日2%、第30日1%,分析认为OpenAI在运营方面面临挑战 [35][36][37] - 谷歌拥有**全栈运营能力**和**平台闭环优势**,包括YouTube这一成熟的视频内容运营系统,Veo竖屏视频可直接适配YouTube Shorts,有利于形成“创作—分发—反馈—优化”的正向循环 [37][38] - 迪士尼计划在Disney+引入竖屏内容信息流,并与OpenAI合作引入视频生成能力,进一步印证竖屏模式的重要性 [40][41][42] - 国内AI玩家如可灵AI、Vidu AI等也已进行类似短视频生成的尝试 [44][46]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 18:55
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍[1] - 在MaaS(模型即服务)市场,火山引擎已成为国内市场份额第一,全球排名第三[2] - 公司营收规模快速增长,2024年营收超过110亿元,增速远超60%;2025年营收已超过200亿元[6] 2025年AI市场核心趋势 - 多模态和Agent是2025年AI市场的关键趋势[3] - 视频生成模型的竞争焦点已从参数、时长转向能否直接产出“可发布的完整作品”,声画同步成为重要竞争因素[7][11] - 行业迭代速度极快,模型正从技术工具演变为具备社交平台潜力的创作工具[9][22] 火山引擎Force大会核心产品发布 - 模型侧发布豆包旗舰模型1.8和视频生成模型Seedance 1.5 pro[3] - 围绕Agent生态发布企业推理代工服务、强化学习平台、企业级AI Agent平台AgentKit以及HiAgent“1+N+X”智能体工作站[3] - 豆包大模型1.8采用集成策略,将LLM、VLM、Thinking等能力整合进单一模型接口,简化客户选择与集成流程[26][27] Seedance 1.5 pro视频模型的技术与商业突破 - 核心主打声画同步功能,可实现开箱即用,生成视频的嘴型匹配、情绪捕捉与画面配合度达到高可用水平[8][13] - 在中文适配、电影级运镜、动态张力及环境沉浸感方面表现突出,优于部分海外模型[13][14][15] - 通过多阶段蒸馏、量化等工程优化,模型端到端推理速度提升超过10倍,极大降低了生成成本[17][31] - 模型支持多种方言和强表演场景,适合生成可供二次创作的社交内容,与豆包、即梦等C端产品联动潜力大[21][22] 火山引擎的AI发展战略与系统工程 - 公司定位为AI Native,其基础设施、产品架构及商业模式均围绕AI云原生设计,视AI为弯道超车的关键[34] - 竞争已从模型能力比拼转向系统工程较量,重点解决企业“用不起来”的问题,涉及数据接入、任务编排、效果评估等[35] - 同步建设模型的“脑”(豆包大模型)与“手”(AgentKit),旨在降低开发门槛,提供从开发到运营的闭环解决方案[37] - 演示中企业级电商客服Agent从搭建到上线用时不足半小时,展现了效率的飞跃[38] 商业模式与成本优化创新 - 推出“AI节省计划”,通过阶梯式折扣帮助企业最高节省47%的成本[32] - 探索按“智能”交付物价值或按思考长度分段付费等新型计费模式,超越单纯的Token计费[33] - 通过工程优化不断提升MaaS服务“密度”,即在同等成本下提供更多价值[30][31] 市场渗透现状与未来展望 - 国内大约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高,头部效应明显[24][25] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍[24] - 公司目标是构建完整的AI基础设施和服务体系,让每个企业都能低门槛、低成本地使用先进AI能力[38]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 18:31
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍 [3] - 2025年日均token使用量为16.4万亿 [4] - 火山引擎在MaaS(模型即服务)市场已成为国内份额第一,全球排名第三 [4] - 公司2024年营收规模超过110亿元,增速远超60%;2025年营收已超过200亿元 [8] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍 [36] 大模型发展趋势:从单点能力到系统工程 - 大模型竞争已从单点能力较量进入系统工程的较量 [2] - 行业头部效应明显,约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高 [36][37] - 公司提出在模型上做“减法”,将LLM、VLM、Thinking等所有模型能力集成进一个API接口,降低客户选择与集成复杂度 [38] - 模型能力的集成对基础模型要求更高,需要领先的基模作为支撑 [39] - 基础模型的能力直接决定下游应用天花板,例如豆包基础模型支撑了Seedance在语义理解、情感识别等方面的细致表现 [40][41] 视频生成模型的竞争维度与进展 - 2025年视频模型竞争焦点从卷参数、秒数,转向能否直接产出“可发布的完整作品” [10] - “声画同出”(声画同步)成为关键竞争因素,是客户的核心诉求之一 [15][28] - 火山引擎发布的视频生成模型Seedance 1.5 pro主打声画同步、开箱即用 [11] - 该模型在中文对口型匹配度、声音与人物环境适配度、沉浸感方面表现突出 [18][19] - 模型强化了对电影级运镜和动态张力的遵循,动作幅度及多镜头、多主体呈现高于行业水平 [20][25] - 通过多阶段蒸馏、量化等工程优化,Seedance 1.5 pro的端到端推理速度提升超过10倍,降低了生成成本 [28][46] Agent(智能体)工具链与生态建设 - 公司重点发布围绕Agent的工具链和生态服务,包括企业模型推理代工、强化学习平台、企业级AI Agent平台AgentKit及智能体工作站HiAgent [6] - AgentKit旨在降低开发者门槛,封装prompt工程、工具调用等底层能力,让开发者聚焦业务逻辑,并提供从创建、测试、部署到监控的完整运营闭环 [53] - 公司自身在客服、内容审核等业务中积累了Agent实践经验,并通过AgentKit对外输出 [53] - 演示案例显示,从零搭建并上线一个企业级电商客服Agent用时不到半小时 [54] - 公司目标是让每个企业都能拥有自己的AI助手,构建完整的AI基础设施和服务体系 [54] 商业化、工程优化与计费创新 - 行业通过工程优化提升MaaS服务“密度”,即在同等成本下提供更多价值 [45] - 公司推出“AI节省计划”计费模式,通过阶梯式折扣,帮助企业最高节省47%的成本 [47] - 公司认为未来计费方式不应仅按Token,而可能按交付的“智能”或思考长度分段付费 [47][48] - 公司从成立起就围绕AI云原生设计基础设施、产品架构和商业模式,将AI视为弯道超车的关键 [49][50] - AI基础设施竞争已演变为系统工程的较量,企业需要解决数据接入、任务编排、效果评估、成本控制等系列问题 [51] 内容生态与模型应用潜力 - Seedance 1.5 pro支持方言、对白和强表演场景,适合在豆包、即梦等C端产品中生成可供二次创作和分享的内容 [32] - 公司对“什么内容能火”的理解已转化为模型的训练目标 [33] - 随着视频生成模型成熟,AI生产视频将与C端产品联动,模型不仅作为技术工具,更具备演变为社交平台的潜力 [33]
2025年人工智能核心产业规模有望破万亿元!科创人工智能ETF华夏(589010) 震荡回调,逢低配置窗口开启
每日经济新闻· 2025-12-15 14:29
科创人工智能ETF (589010) 市场表现 - 截至14点,科创人工智能ETF (589010) 日内回调2.14%,价格回踩至1.326元附近 [1] - 尽管指数短期承压,但持仓股星环科技逆势上涨19.99%,天准科技大涨超7%,显示核心个股弹性强 [1] - 该ETF成交额已超4700万元,交投活跃 [1] - 当前板块经历调整后,估值性价比进一步凸显,或为逢低布局的配置窗口 [1] 人工智能行业宏观发展 - 中国信息通信研究院数据显示,2024年我国人工智能核心产业规模超过9000亿元,增速达24% [1] - 预计2025年人工智能核心产业规模有望突破1.2万亿元,增速将进一步提升 [1] - 今年以来,生产制造环节的大模型应用案例占比由去年的19.9%增长至25.9%,增长显著 [1] 多模态大模型技术进展 - OpenAI于2024年2月推出初代Sora模型,被视为视频领域的GPT-1时刻 [2] - 2025年9月底,OpenAI推出Sora 2,视频领域有望迎来GPT 3.5式突破,其在物理模拟、真实感和可控性方面显著提升 [2] - 10月16日,谷歌在Gemini API中发布Veo 3.1和Veo 3.1 Fast付费预览版,在音频支持、叙事控制及质感还原方面进行了重大升级 [2] 科创人工智能ETF (589010) 产品特征 - 科创人工智能ETF华夏 (589010) 紧密跟踪上证科创板人工智能指数,覆盖全产业链优质企业 [2] - 该指数成分股兼具高研发投入与政策红利支持 [2] - 科创板20%涨跌幅与中小盘弹性有助于捕捉AI产业“奇点时刻” [2]
刚刚,神秘模型登顶视频生成榜,又是个中国模型?
机器之心· 2025-11-28 16:05
神秘模型Whisper Thunder登顶AI视频榜 - 一个名为Whisper Thunder (aka) David的神秘模型登上了Artificial Analysis视频榜榜首,超越了包括Veo 3、Veo 3.1、Kling 2.5以及Sora 2 Pro在内的所有公开AI视频模型 [1] Artificial Analysis榜单排名详情 - 在Artificial Analysis全球公开权重模型排行榜上,Whisper Thunder (aka) David以1,247的ELO评分位列第一 [2] - 排名第二的是谷歌的Veo 3 (无音频版),ELO评分为1,226 [2] - 快手KlingAl的Kling 2.5 Turbo 1080p以1,225的ELO评分位列第三 [2] - 谷歌的Veo 3.1 Preview (无音频版)和Veo 3.1 Fast Preview (无音频版)分别以1,223和1,219的ELO评分位列第四和第五 [2] - Luma Labs的Ray 3排名第六,ELO评分为1,210 [2] - OpenAI的Sora 2 Pro (无音频版)以1,205的ELO评分位列第七 [2] - MiniMax的海螺02 Standard O和海螺2.3 O分别以1,198和1,188的ELO评分位列第八和第九 [2] - Lightricks的LTX-2 Pro (无音频版)以1,187的ELO评分位列第十 [2] Whisper Thunder模型特性与市场反应 - 该模型生成的视频时长固定为8秒,且运动幅度肉眼可见更强 [3] - 目前其在平台上的出现频率有所降低,用户可能需要反复刷新尝试才能遇到 [3] - 由于测试平台无音频测试机制,该模型是否具备原生音频能力仍是未知 [3] - 不少网友从其生成效果和审美倾向推测,这个神秘模型很可能来自中国 [4] - 尽管在高动作场景下会出现一些抖动,但其生成效果仍然非常令人印象深刻 [11] - 作为榜单头名,该模型在Artificial Analysis Arena的用户投票机制下,仍然存在不少的生成瑕疵 [13] - 行业关注度极高,在下一次刷新之前,所有人都在等待它闪亮登场 [14] Whisper Thunder模型生成示例 - 能够生成复杂的延时摄影场景,如起重机吊装钢梁、城市天际线快速变化的建筑工地 [5] - 可处理特殊镜头效果,如产生变形镜头光斑的沙漠高速公路经典汽车飞驰场景 [6] - 擅长动漫风格内容生成,如将钢琴键转化为彩色音符环绕角色的情感化音乐表演场景 [7] - 能够生成具有电影感的城市景观,如从圣保罗屋顶拍摄的洗衣绳、天线与城市网格 [8] - 可创建环保主题场景,如太阳能电池板追踪日光、风力发电机转动的宁静山谷 [9] - 能够生成超现实主义内容,如月光泻湖中鳞片闪烁的美人鱼 [10] - 可精确生成动物行为细节,如针鼹用长舌捕捉蚂蚁时刺的颤动 [12]
测完Nano Banana Pro的时空重现,我人傻了……
机器之心· 2025-11-26 09:36
核心观点 - Nano Banana Pro展现出革命性的“时空重现”能力,能够基于坐标和时间生成拟真影像,实现了从“推理”到“创造”的跃升[1][7] - 该技术在历史事件重建和虚实结合场景中展现出巨大潜力,但存在显著的不稳定性和“时代错乱”等严重幻觉问题[9][17][21] 技术能力分析 - 基于坐标和时间直接重构特定时空的光影与现实,完成从画面推导坐标到逆向创造的进化[7] - 能够理解时代影像特征,如生成黑白图片并添加照片瑕疵和做旧效果增强真实感[24] - 支持虚实结合玩法,可将现实坐标与虚拟世界背景设定叠加生成拟真照片[27] 应用场景探索 - 历史事件现场重建,如911事件、泰坦尼克号幸存经历、秦始皇泰山封禅等场景模拟[1][3][12] - 创意内容生成,包括动漫人物真实化映射、迷因图处理和视频内容自动生成[31][33][34] - 实用功能开发,如人物年龄分析等潜在应用方向[29] 性能表现评估 - 在诺曼底登陆场景中表现出色,正确识别坐标并生成符合时代特征的影像[22][24] - 存在严重的地理位置偏差和时代错乱问题,如北京奥运会开幕式场地错误、崇祯帝场景出现清末龙旗等明显幻觉[10][21] - 对生成结果表现出迷之自信,即使通过提示词要求修改也难以纠正错误[17]
非客观人工智能使用指南
36氪· 2025-11-19 07:15
全球AI使用现状 - 全球约10%人口每周使用AI工具,其中绝大多数使用免费版本 [1] 主要AI系统提供商 - 四大最先进AI系统包括Anthropic的Claude、谷歌的Gemini、OpenAI的ChatGPT和埃隆·马斯克xAI旗下的Grok [3] - 第二梯队开放权重AI包括中国的Deepseek、Kimi、Z和Qwen,以及法国的Mistral,这些模型变体占据AI评级系统前35名 [3] - Microsoft Copilot和Perplexity等服务基于上述九个核心AI系统构建 [3] 付费AI服务定价策略 - 高级AI服务月费分为20美元和200美元两档,20美元档满足绝大多数需求,200美元档针对复杂技术和编码需求用户 [6] - 公司正在全球某些地区试验其他定价模式 [6] 付费AI系统功能对比 - 主要付费系统(Claude、Gemini、ChatGPT)均提供智能体能力、语音模式、图像文档处理、代码执行、移动应用和多模态创作功能 [7] - Claude目前缺少图像生成能力,Gemini和ChatGPT具备图像视频生成功能 [7][20] - Grok适合X平台重度用户,但产品安全透明度较低 [7] - Microsoft Copilot通过Windows系统提供ChatGPT功能,但用户对模型控制力较弱 [7] AI模型技术分级 - 聊天模型适合对话场景,响应迅速且具人情味 [9] - 智能体模型可自主执行多步骤复杂任务(网页搜索、代码使用、文档制作),出错概率更低 [9] - 巫师模型用于处理非常复杂的学术任务 [9] 各厂商模型选择策略 - ChatGPT提供从GPT-5 mini到GPT-5 Pro的多层级模型,付费用户可手动选择GPT-5 Thinking Extended(20美元套餐)或GPT-5 Thinking Heavy(200美元套餐) [11] - Gemini提供Gemini 2.5 Flash和Gemini 2.5 Pro两个选项,Ultra套餐用户可使用Gemini Deep Think [13] - Claude采用简化模型选择策略,主要使用Sonnet 4.5处理任务,提供"扩展思考"选项用于难题处理 [14] 数据隐私与功能权衡 - 关闭ChatGPT和Claude的训练功能不会损失功用,但Gemini会牺牲部分功能 [15] AI深度研究能力 - 深度研究模式可进行10-15分钟广泛网络研究,生成高质量报告 [16] - GPT-5 Thinking具备自主研究能力,Claude提供"中度研究"选项 [16] 数据整合能力 - AI系统支持连接Gmail到SharePoint等多种应用,Claude在整合搜索电子邮件、日历和云盘方面表现突出 [18] 多模态输入功能 - Gemini和ChatGPT在语音模式方面表现最佳,Claude语音功能相对较弱 [19] - 所有模型支持PDF、图片和视频上传,ChatGPT和Gemini的App版本支持屏幕共享和摄像头实时交互 [19] 内容创作能力 - Claude和ChatGPT可生成高质量PowerPoint和Excel文件,Claude目前在文档格式处理方面领先 [20] - Gemini拥有最强AI图像生成模型,Gemini和OpenAI具备视频生成能力(Veo 3.1和Sora 2) [20] - Sora 2定位社交媒体应用,Veo 3.1用途更广泛,生成视频均带声音 [20] 技术发展轨迹 - AI图像生成能力显著提升,从2021年生成扭曲图像发展到目前可制作多种风格的高质量视频 [21][23] 行业应用趋势 - AI系统正从基础对话向复杂任务执行演进,用户逐渐探索AI在报告撰写、问题解决和项目管理等方面的应用场景 [24] - 建立对AI系统能力和局限的直觉比掌握具体操作技巧更为重要 [24]
微软豪赌超级智能?科创人工智能ETF华夏(589010) 早盘承压下行,短线回踩至分时均线下方
每日经济新闻· 2025-11-07 10:18
科创人工智能ETF市场表现 - 截至9点55分,科创人工智能ETF(589010)下跌1.91%,最新价1.383元,早盘低开后震荡走弱,运行于分时均线下方 [1] - 持仓股表现分化明显,30只成分股中仅2只上涨,星环科技、合合信息微幅飘红,而芯原股份、奥比中光、寒武纪跌幅居前,均超3% [1] - 成交额约2394万元,市场换手温和,人工智能板块短线调整,权重个股普遍回调 [1] 人工智能行业动态 - 微软Microsoft AI组建超级智能团队,由首席执行官Mustafa Suleyman负责,聚焦三个领域:价格低廉的AI伴侣、在全方位诊断方面达到专家级水平的医疗超级智能、充足的清洁能源 [1] - 国内外多模态大模型迎来快速突破,OpenAI于2024年2月推出初代Sora模型,2025年9月底推出Sora 2,在物理模拟、真实感和可控性方面显著提升,并能同步生成对话、背景音效和声音效果 [2] - 10月16日,谷歌在Gemini API中发布Veo 3.1和Veo 3.1 Fast付费预览版,在Veo 3基础上进行重大升级,带来更丰富的音频支持、更强的叙事控制及更逼真的质感还原 [2] 科创人工智能ETF产品特征 - 科创人工智能ETF华夏(589010)紧密跟踪上证科创板人工智能指数,覆盖全产业链优质企业 [2] - 该ETF兼具高研发投入与政策红利支持,20%涨跌幅与中小盘弹性助力捕捉AI产业"奇点时刻" [2]