Workflow
Sora 2
icon
搜索文档
谈谈2025年人工智能现状及发展趋势分析
36氪· 2025-12-30 17:18
一年即将结束,是时候回顾今年的人工智能发展现状,并展望来年的发展趋势了。这份概述基于包括麻省理工学院、 普华永道、OpenAI、OpenRouter 等在内的众多全球机构的数据。 一 "高采纳率,低转化率"悖论 企业人工智能领域存在着巨大的脱节:许多组织都在广泛使用人工智能工具,但真正获得可衡量的经济回报的却寥寥 无几。事实上,尽管投入了巨额资金,95% 的企业却一无所获。哦,对了,你终于可以松一口气了——失败的并非只 有你,几乎所有人都是如此。尽管科技大会层出不穷,各大公司都在吹嘘人工智能的奇迹,但匿名调查显示,很多 企 业 都在谈论人工智能,但真正付诸行动的却寥寥无几。 麻省理工学院的报告称之为"人工智能世代分化"。 数据有力地证明了这一悖论的正反两面: 高采纳率(普遍性) 仅有 39% 的组织报告其收益增长可归因于人工智能。 超过 90% 的企业正试图采用人工智能解决方案以保持竞争力。 95% 的组织从生成式人工智能(GenAI)投资中获得零回报,且陷入无实际可衡量影响的困境。 预计到 2025 年,全球人工智能支出将接近 1.5 万亿美元。 仅约三分之一的组织已成功开始在全企业范围内扩展人工智能应用。 ...
碾压小扎!22岁成亿万富翁,2025年AI造富速度刷新人类认知
猿大侠· 2025-12-29 12:11
文章核心观点 - 2025年AI领域成为超级财富制造机 将50多位创始人送入亿万富翁俱乐部[1][3] - AI行业从基础设施到应用层全面爆发 巨额资本涌入驱动估值飙升和财富创造[3][8] AI行业融资与估值飙升 - 2025年全球投资者向AI领域投资超2000亿美元 占全球创投总额一半 同比增长超过75%[8] - Anthropic公司年初以615亿美元估值融资35亿美元 9月估值飙升至1830亿美元[6][7] - 多模态AI初创公司受追捧 语音生成公司ElevenLabs在10月以66亿美元估值完成融资[13] - AI编程工具Cursor的母公司Anysphere在11月获得290亿美元估值[16] 基础设施投资与“卖铲人”致富 - 巨头竞相投入AI基建 特朗普宣布OpenAI、软银和甲骨文斥资5000亿美元打造“星际之门”数据中心[9] - Meta、谷歌和微软每家公司在AI基建上的承诺投入都超过650亿美元[9] - 半导体网络、数据中心地产、PCB制造、变压器及云计算等上游供应商创始人跻身富豪榜[9] 数据标注与AI训练服务市场 - Meta在6月以140亿美元收购数据标注独角兽Scale AI 49%股份 使其估值达290亿美元[10] - Scale AI的竞争对手Surge AI去年营收12亿美元 估值240亿美元 创始人持75%股份价值180亿美元[11] - 数据标注公司Mercor在10月融资后估值达100亿美元 三位22岁联合创始人各自身家约22亿美元[11] AI应用落地与生产力工具 - 职场中每周多次使用AI的比例从2023年的11%翻倍至2025年的23%[15] - 微软公司20%-30%的代码已由AI编写[16] - 允许无编程经验用户创建网站的Lovable公司 在八个月内年化收入突破1亿美元[27] 新晋AI亿万富翁案例 - **Edwin Chen**: 身家180亿美元 财富来源Surge AI 持有公司约75%股份[18][21] - **Bret Taylor 和 Clay Bavor**: 身家各25亿美元 财富来源AI客服智能体公司Sierra 估值100亿美元 各持约25%股份[22][24] - **Brendan Foody, Adarsh Hiremath 和 Surya Midha**: 身家各22亿美元 财富来源数据训练服务公司Mercor 估值100亿美元 各持约22%股份[24][26] - **Anton Osika 和 Fabian Hedin**: 身家各16亿美元 财富来源“氛围编程”公司Lovable 估值66亿美元 各持约24%股份[27][28] - **Lucy Guo**: 身家14亿美元 财富来源Scale AI 持有稀释后约3%股份[30] - **Michael Truell等四人**: 身家各13亿美元 财富来源AI编程工具Cursor 估值293亿美元 各持4%股份[32][33] - **Mati Staniszewski 和 Piotr Dabkowski**: 身家各11亿美元 财富来源语音生成公司ElevenLabs 估值66亿美元 各持约17%股份[35][38]
碾压小扎,22岁成亿万富翁,2025年AI造富速度刷新人类认知
36氪· 2025-12-29 10:03
文章核心观点 - 2025年,AI领域成为超级财富制造机,从基础设施到应用层全面爆发,当年将超过50位创始人送入亿万富翁俱乐部 [1] AI领域投融资规模 - 2025年全球投资者向AI领域投资超过2000亿美元,占据全球创投总额的半壁江山,同比增长超过75% [3] - Anthropic公司在年初以615亿美元估值完成35亿美元融资,至9月估值已飙升至1830亿美元 [3] - 语音生成公司ElevenLabs在10月以66亿美元估值完成融资 [7] - AI编程工具Cursor的母公司Anysphere在11月获得290亿美元估值 [8] - 主打“氛围编程”的初创公司Lovable在12月以66亿美元估值融资3.3亿美元 [20] 基础设施与“卖铲人” - 1月,特朗普宣布OpenAI、软银和甲骨文将斥资5000亿美元打造代号为“星际之门”的数据中心项目 [5] - Meta、谷歌和微软每家在AI基建上的承诺投入都超过了650亿美元 [6] - 对数据中心的巨大需求造就了一批“卖铲人”公司,包括Astera Labs、Fermi、ISU Petasys、Sanil Electric以及CoreWeave等,其创始人均在2025年跻身富豪榜 [6] 数据标注与人才市场 - 6月,Meta以140亿美元收购数据标注独角兽Scale AI 49%的股份,使其估值达到290亿美元,并任命其28岁的CEO Alexandr Wang为首席AI官 [6] - Scale AI的交易使其31岁的联合创始人Lucy Guo身家暴涨至约14亿美元 [6] - Scale AI的竞争对手Surge AI在2024年营收达12亿美元,估值飙升至240亿美元,其创始人Edwin Chen持有的约75%股份价值高达180亿美元 [7][11] - 另一家数据标注公司Mercor在10月融资后估值达到100亿美元,三位22岁的联合创始人成为史上最年轻的白手起家亿万富翁,每人身家约22亿美元 [7][17] 多模态与AI应用落地 - 9月,OpenAI发布Sora 2,引发数十亿美元资金涌向图像、视频和音频等多模态AI初创公司 [7] - AI正从玩具变成生产力工具,职场中每周多次使用AI的比例从2023年的11%翻倍至2025年的23% [7] - 微软CEO透露,公司20%-30%的代码已由AI编写 [8] - 深度应用AI的企业如叠纸游戏、翻译软件TransPerfect和机器视觉公司Orbbec的创始人,也在这波浪潮中实现了财富自由 [8] 新晋AI亿万富翁案例 - **Edwin Chen**:身家180亿美元,财富来源为数据标注公司Surge AI,持有公司约75%股份,公司2024年营收12亿美元,估值240亿美元 [9][11] - **Bret Taylor 和 Clay Bavor**:身家各25亿美元,财富来源为AI客服智能体公司Sierra,公司估值100亿美元,两人各持有约25%股份 [12][14] - **Brendan Foody, Adarsh Hiremath 和 Surya Midha**:身家各22亿美元,财富来源为数据标注公司Mercor,公司估值100亿美元,三人各持有约22%股份 [15][17] - **Anton Osika 和 Fabian Hedin**:身家各16亿美元,财富来源为“氛围编程”公司Lovable,公司估值66亿美元,两人各持有约24%股份,公司在八个月内年化收入突破1亿美元 [18][20] - **Lucy Guo**:身家14亿美元,财富主要来源于其联合创立的Scale AI(持有稀释后约3%股份)以及其创立的另一家应用Passes [22] - **Michael Truell, Aman Sanger, Sualeh Asif 和 Arvid Lunnemark**:身家各13亿美元,财富来源为AI编程工具Cursor,公司估值293亿美元,四位联合创始人各持有4%股份,公司年化收入已超10亿美元 [23][25] - **Mati Staniszewski 和 Piotr Dabkowski**:身家各11亿美元,财富来源为语音生成公司ElevenLabs,公司估值66亿美元,两人各持有17%股份,公司过去12个月营收接近2亿美元 [26][28]
火了整整一年 AI更“懂人”了!
搜狐财经· 2025-12-27 17:43
核心观点 - 2025年全球AI行业迎来标志性发展,从技术突破走向应用爆发与价值重估,行业正经历从“概念期”向“成长期”的过渡,竞争焦点从通用大模型转向多模态能力、垂直应用与商业化变现 [2][8][9] 行业技术演进路径 - AI能力实现从“意图理解”到“执行服务”的跨越,从“回答者”演变为“执行者”,能处理多模态信息并理解物理世界以解决实际问题 [2][3] - 行业竞争核心从大模型技术转向多模态能力,即对文本、图像、音频、视频等信息的统一理解与生成能力 [4] - 具体技术升级案例:千问APP接入高德地图可生成可视化决策卡片并调用导航服务[4];腾讯混元图像3.0可一句话生成图片,元宝支持单次深度解析10张图并能视频通话[4];火山引擎豆包大模型1.8单次视频理解帧数从640帧倍增至1280帧[4];谷歌发布Gemini 3 FLASH,OpenAI发布Sora 2,模型理解能力实现极大跃升[4] 应用生态发展趋势 - AI应用呈现垂直化与专业化趋势,形成通用AI与垂类AI分庭抗礼的格局,在最新统计周期内周活跃用户规模Top10的AI APP中有4个是垂类场景专业AI [5] - 垂类应用核心竞争力从比拼模型参数转向比拼行业理解深度、场景闭环构建能力及可信赖的用户关系运营 [6] - 具体垂直应用案例:蚂蚁阿福APP从AI工具转向AI健康朋友,发布后一度冲上苹果应用总榜第三,按月活计算已跻身国内AI APP前五并成为第一大健康管理AI APP[5];其背后有千人医学团队数据标注支撑的医疗多模态大模型体系[6];抖音旗下小荷AI医生APP覆盖疾病自查、用药参考等健康咨询场景[5] 资本市场动态 - 中国AI行业正从依赖资本输血的“青春期”步入需要自我造血的“成年期”,标志性事件是智谱与MiniMax双双通过港交所聆讯冲刺“大模型第一股” [7] - 智谱IPO前完成8轮融资累计超83亿元人民币,最新投后估值达243.77亿元,投资方包括美团、阿里、腾讯等[7];MiniMax自2021年成立获7轮融资合计约15.55亿美元[7] - 2025年7月至11月AIGC产业完成186起投融资,金额达336.7亿元,较上半年增加20.8% [7] - 互联网大厂加大投入:阿里巴巴计划未来3年投入至少3800亿元人民币用于云计算和AI基础设施建设[7];腾讯升级大模型研发架构,成立AI Infra部等部门全面强化研发[7] 未来展望与挑战 - 当前AI处在概念期向成长期过渡阶段,应用已逐渐爆发但普遍变现能力不强,2026年将是检验期,需探索更易变现的应用方向 [9] - 行业处于技术深耕与应用规模化落地的过渡阶段,技术上大模型从通用能力竞赛转向垂直优化、效率提升与成本控制 [9] - 2026年或将呈现三大趋势:模型轻量化与端侧部署加速,AI原生应用与硬件深度融合;行业大模型与实体经济融合加深;监管框架完善推动规范发展 [9] - 另两大发展趋势主线:进入具身智能、AI手机等爆发增长期及智能终端规模化应用前期;迈向以自主芯片构建为主导的新阶段,应用生态成为竞争焦点 [10]
图数室丨回看2025,AI那些“封神”瞬间
新浪财经· 2025-12-26 17:28
行业核心观点 - 2025年是人工智能从实验室概念大规模落地到现实应用、走入亿万人生活的“全民AI元年”,AI从“看起来很聪明”转变为“真正开始接管现实世界” [2] 大模型技术突破与迭代 - 深度求索(DeepSeek)于1月20日推出新一代大模型R1,给全球AI界带来“地震” [4] - DeepSeek在5月29日完成R1模型的小版本升级,模型的思维深度与推理能力显著提升 [8] - 深度求索发布新模型DeepSeek-Math-V2,这是全球首个以开源形式达到国际奥林匹克数学竞赛金牌水平的数学推理大模型 [12] - OpenAI于3月25日正式推出基于GPT-4o模型的原生图像生成功能 [6] - OpenAI于8月7日正式发布GPT-5系列模型 [8] - OpenAI于11月13日发布GPT-5.1系列模型,包括即时版和思考版 [12] - 谷歌于3月25日发布号称最强推理模型的Gemini 2.5 Pro [6] - 谷歌于11月18日发布Gemini 3 Pro,可同时处理文本、图像和音频,支持生成杂志风格的可浏览页面或定制化动态布局界面 [12] - Anthropic于5月22日正式推出Claude 4系列大模型 [8] - xAI于2月17日发布最新人工智能模型Grok 3 [6] - 字节跳动旗下火山引擎于10月16日发布新版豆包大模型1.6更新版,成为国内首个支持“分档调节思考长度”的模型 [8] - 截至7月,中国已有433款大模型完成备案并上线 [8] AI智能体与操作系统 - Manus于3月6日正式发布,被广泛认为是首个“真正意义上的通用AI Agent” [6] - OpenAI于7月18日推出全新智能体产品“ChatGPT Agent” [8] - 字节跳动于12月1日发布豆包手机助手技术预览版,开始探路“AI操作手机” [10] 机器人技术发展 - 宇树科技Unitree H1“福兮”机器人于1月28日在春晚舞台上身着喜庆花袄大秀秧歌技艺 [6] - 4月13日,北京举行全球首个人形机器人半程马拉松赛,人形机器人“天工”以2小时40分42秒的成绩夺冠 [6] - 6月7日,2025智源大会召开,人形机器人量产成为现实 [8] AI应用与产品落地 - Perplexity于7月9日推出Comet,一款原生AI网络浏览器,集成搜索与助手功能 [8] - AI音乐生成模型Suno V5发布,将AI音乐生成质量提升至录音室级别 [10] - OpenAI于9月20日正式发布Sora 2 [8] - 特斯拉于6月27日成功完成了Model Y汽车首次“全自动驾驶交付” [8][9] 基础设施与前沿项目 - OpenAI、甲骨文、日本软银于9月23日联合宣布,联手打造的“星际之门”项目将在美国新建5个AI数据中心 [8] - 谷歌公司于11月5日首次公开“太阳捕手”计划,试图打造基于太空的机器学习“数据中心” [12] 行业监管与法律 - 欧盟《人工智能法案》于8月正式生效,成为全球首个系统性的AI监管框架 [8] - 4月17日,全国首例涉及AI模型结构和参数保护的案件正式生效 [6] 跨学科研究 - 美国弧形研究所、英伟达、斯坦福大学等机构的科研人员于2月19日共同开发的AI生物学模型Evo 2正式发布 [6]
2025AI盘点:10大“暴论”
36氪· 2025-12-26 08:52
行业趋势与概念演变 - “Vibe”概念在AGI领域广泛传播,从Vibe Coding扩展到Vibe Everything,成为一种具有颠覆性气质的叙事,预计明年将继续存在 [2] - Prompt Engineering被认为已过时,Context Engineering成为行业热词,其更广阔的系统性定义推动了Agent和Infra类创业公司获得融资 [8][9] - 关于大语言模型发展路径出现分歧,Yann Lecun和Ilya Sutskever均对Scaling提出批评,但Scaling实践仍在继续,例如马斯克宣布将在2026年推出6万亿参数的Grok 5模型 [27][28] 人形机器人领域动态 - 2025年人形机器人估值大涨,但“泡沫论”阴影持续,部分公司创始人私下承认存在资本泡沫 [6] - 行业竞争焦点从“融资PR”转向“订单PR”,但对商业化场景的探索进展有限,主要场景仍集中在教育、舞蹈演出,AI陪伴有破圈趋势但主力产品非人形 [6] - 行业内部围绕“数据与模型”关系展开论战,VLA模型架构受到质疑,世界模型和大小脑架构兴起,同时数据采集工厂和数据集探索增多以解决数据紧缺问题 [9][10] AI基础设施与全球竞争 - 英伟达CEO黄仁勋表态“中国将赢得人工智能竞赛”,折射出中美成为AI体系化竞赛主导者的现状 [12][13] - AI算力需求激增导致电力供应成为关键瓶颈,摩根士丹利报告称若电力供应无法跟上,美国电网可能在2028年出现高达20%的电力缺口,缺电量达44GW [24] - 为应对电力挑战,微软、Meta、亚马逊等硅谷巨头开始投资核能,同时大量资本涌入核聚变领域 [25] 产品形态与生态变革 - 行业领袖预测传统手机和APP将消失,被智能体取代,豆包手机的发布被视为对此趋势的早期实践 [15][16] - OpenAI的首代硬件可能于明年出现,预示着原生AI硬件的发展 [17] - AI生成内容呈双刃剑效应,一方面辅助创作出精品内容并催生新市场(如AI成人内容市场规模预计2025年约25亿美元,年增速约27%),另一方面导致“Slop”(AI垃圾内容)泛滥,引发对内容生态的担忧 [31][32] 商业与资本前景 - OpenAI CEO Sam Altman激烈回应做空质疑,公司宣布累计1.4万亿美元的算力投入计划,但其年收入仅130亿美元,估值在5000-7000亿美元之间,2030年收入目标为2000亿美元 [19] - 市场对AI远景有共识,但对当前资产价格和投入产出比存在分歧,OpenAI的商业化变现能力被视为行业信心的重要风向标 [20][21]
ChatGPT也上线了个人年度报告
36氪· 2025-12-23 18:46
OpenAI产品功能更新 - OpenAI为ChatGPT推出名为“Your Year with ChatGPT”的年度回顾功能 [1] - 该功能目前在美国、英国、加拿大、澳大利亚、新西兰等国家进行试水 [3] - 用户需在App对话框中输入指令“Show me my year with ChatGPT”以获取报告 [3][5] 功能使用权限与设计风格 - 该年度报告功能仅面向免费版、Pro版和Plus版用户开放,企业版账号用户无法使用 [9] - 报告设计采用复古的像素风艺术图,而非其先进的视频生成技术风格 [28][32] - 报告结尾包含一个“擦除迷雾”的互动小游戏,用于展示AI对用户2026年的预测,且可刷新更换 [33][35] 年度报告数据维度 - 报告核心数据包括用户发送消息总数、聊天会话总数以及对话最活跃的日期 [12] - 报告会统计用户使用破折号(Em-dashes)的数量,以分析聊天习惯 [14] - 报告分析用户的“聊天风格”,并授予“年度奖项”进行用户画像归类 [15][17] - 例如,有用户被归类为“工程师”风格,该群体占比为19.1%的用户 [21][24] 功能定位与用户洞察 - 相较于其他App的年度报告,ChatGPT的报告被认为更简洁,且数据更为私密和真实 [40] - 报告强调ChatGPT作为用户梳理思绪、安放好奇与焦虑的场所 [40][41][47] - 该功能被视为AI时代用户与AI互动新常态的一种体现,AI扮演了绝对耐心、永远在线的倾听者角色 [46][47]
全球功能最全的视频生成模型来了
量子位· 2025-12-17 18:00
公司产品发布 - 阿里发布了新一代通义万相2.6系列模型,该模型一次性覆盖文生视频、图生视频、参考生视频、图像生成和文生图,是目前全球功能最全的视频生成模型 [1] - 该模型在视频创作上推出了Sora2目前还没有的多音频驱动生视频能力,并同步引入了音画同步、多镜头叙事等能力 [2] 视频生成核心能力升级 - **视频参考生成**:支持视频参考,模型能提取其中主体的外观与音色,并结合提示词生成新视频内容,可用于单人表演或双人合拍等场景 [12] - **多镜头叙事**:支持多镜头生成,保持镜头间关键信息一致,可通过简单提示词完成分镜 [12] - **自然声画同步**:在多人对话等复杂场景中,语音与动作匹配更稳定 [12] - **长视频生成**:单条视频最长15秒(参考生视频最长10秒) [12] - **基础能力提升**:在指令理解与执行、画面真实度及整体美学表现等方面均有加强 [12] 视频生成能力实测表现 - **视频参考生成效果**:在主体一致性和提示词理解上做得比较扎实,能实现1:1还原,口型匹配较为准确,动作、表情与台词语义能够对应,但生成结果中的声线并未完全沿用原视频 [11] - **声画同步效果**:在双人剧情对话等复杂场景中,动作与语言能形成完整互动,模型能补全台词并添加与动作匹配的拟声细节,能区分不同角色的情感变化,但在多角色台词绑定上仍有提升空间,偶尔会出现角色说错台词或字幕语音未完全对齐的情况 [13] - **画面质感与美学**:在画面质感和美学呈现方面有提升,能准确呈现如“第一人称赛博城市飞行视角”等复杂提示词,生成具有电影级画面质感、节奏紧凑、科幻感强烈的视频 [13][14] - **多镜头叙事效果**:对多镜头叙事的理解较为到位,镜头中的主要动作和转场均能得到完整呈现,镜头衔接自然,但对于提示词中描述不够充分的抽象动作(如“探头观察”)仍存在理解难度 [15][17][18] 图像生成能力升级 - 图片生成功能在美学理解、人像生成、文字处理、历史文化及知识IP语义理解上带来新升级 [18] - **风格化能力**:能及时掌握并生成新的美学风格,如生成具有高饱和色块拼接、像素风处理的“星露谷风格”插画 [19][20][22] - **人像生成能力**:在人像光影方面的处理更好,能生成具有清晰明暗分区、面部结构立体、肤质细节自然、具有电影感和空间层次感的半身人像 [22][24] - **中英文处理与排版能力**:能生成中英文对照排版的美食宣传海报,在构图排版上判断靠谱,主体突出,文字层级分明,达到成品水准 [25][27] 整体评价与可用性 - 模型在音视频参考、声画同步、风格理解方面表现不错,但在个别场景下仍会出现画面逻辑偏差、多角色台词对不上、复杂动作理解不到位等小问题 [7][28] - 对于日常短视频创作和二创而言,模型已经是可用且好用的水平,用户敢多跑几次而不用每次都碰运气 [7][28][29] - 模型还在多图融合、美学要素迁移、历史知识语义理解上做了提升 [30]
硬刚Sora2,万相2.6轻松定制角色、控制分镜,普通人也能当导演
机器之心· 2025-12-17 13:28
行业年度回顾与趋势 - 2025年视频生成领域发展突飞猛进,视频内容创作范式正在发生改变 [1] - 行业在B端和C端商业化落地速度惊人:B端大量AI短剧、漫剧上线,制作成本大幅降低;C端社交平台出现爆款特效,大量博主开始常态化使用AI制作剧情短片 [1] - 顶尖模型生成的画面在光影质感与物理规律上已臻化境,但用户体验门槛依然存在,如高不可攀的内测资格或不菲的订阅费用 [1] 公司产品发布与定位 - 阿里于12月16日正式发布新一代万相2.6系列模型,涵盖文生视频、图生视频、参考生视频、图像生成和文生图共5款模型,是目前全球功能覆盖最全面的视频生成模型家族之一 [2][3] - 万相2.6是**国内首个**具备声画一致性角色定制能力的模型,能通过角色参考固定IP形象,并参考输入视频中的音色,实现从画面到声音的完美复刻 [3] - 该版本进一步提升了画质、音效和指令遵循能力,单次视频生成时长实现了**国内最高的15秒**(参考生视频为10秒) [3] - 模型已同步上线阿里云百炼和万相官网,企业用户可直接调用API,千问APP也将于近期上线 [3] 核心技术能力突破 - 万相2.6具备“参考生视频”能力,成为**全球唯二、国内首个**拥有此能力的模型,允许将任意人或物设定为主角,在多镜头切换中保持核心主体、场景和环境氛围的统一 [7] - 模型在结构上集成了多项创新技术,可对输入参考视频进行多模态联合建模与学习,提取主体的时序情绪、姿态、视觉特征及音色、语速等声学特征,实现从视觉到听觉的全感官一致性迁移 [9] - 模型具备“分镜控制”功能,通过高层语义理解将简单提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频,确保内容、节奏和氛围的高一致性 [3][9] 产品功能实测与效果 - 实测中,万相2.6能精准提取参考素材中主体的形象特征、声音声线及惯用神态,并可通过提示词将其置入全新剧情 [11] - 在多角色声画同步测试中,模型对科技人物(如奥特曼、哈萨比斯、黄仁勋)的眉眼微表情、肢体语言及习惯性动作还原度极高,英文版能完美复刻其原本的声线与语调 [13][14] - 在细节把控测试中,模型能生成电影级高保真度的特写镜头,完美呈现如眼镜片因热气起雾、皮肤细微纹理和毛孔“呼吸感”等复杂细节,打破了AI生成人物常见的“塑料感” [17][18] - 在长叙事能力测试中,模型展现出了类似专业导演的运镜意识,能通过推拉摇移和景深变化掌控叙事节奏,并高度还原设定的视觉风格与人物情绪 [24] 图像生成能力升级 - 万相2.6在静态图像生成领域完成了版本迭代,在“高美学”与“强可控”上同时迈进 [26][27] - 在文生图方面,新模型实现了对艺术风格的“灵魂捕捉”,对肌理、色彩、笔触等细节刻画更为到位,并能进行平滑自然的风格融合 [27] - 针对人物写实照片,2.6版本综合优化了构图与光影,削弱了“AI塑料感”,人物神态更自然,肤质真实感大幅提升 [29] - 新版本改善了在图片中生成中英文文本的能力,并新增了“图文混排输出”和“多图融合生成”等功能,能依据逻辑创作具有叙事性的绘本或复杂商品组合场景 [31] - 模型提供了商用级的一致性保持能力,以及更精确的镜头远近视角和光影效果控制选项 [33] 应用场景与市场影响 - 万相2.6面向广告设计、短剧制作等专业场景展现出惊人潜力,通过连续提示词能生成完整叙事的短片 [16] - 万相模型家族已支持文生图、图像编辑、文生视频等10多种视觉创作能力,已广泛应用于AI漫剧、广告设计和短视频创作等领域 [35] - 万相2.6的发布标志着AI视频生成告别“抽卡”时代,迈向了精准可控的电影级创作新阶段,将昂贵的影视工业特权折叠进了手机和云端 [36]
2025年人工智能核心产业规模有望破万亿元!科创人工智能ETF华夏(589010) 震荡回调,逢低配置窗口开启
每日经济新闻· 2025-12-15 14:29
科创人工智能ETF (589010) 市场表现 - 截至14点,科创人工智能ETF (589010) 日内回调2.14%,价格回踩至1.326元附近 [1] - 尽管指数短期承压,但持仓股星环科技逆势上涨19.99%,天准科技大涨超7%,显示核心个股弹性强 [1] - 该ETF成交额已超4700万元,交投活跃 [1] - 当前板块经历调整后,估值性价比进一步凸显,或为逢低布局的配置窗口 [1] 人工智能行业宏观发展 - 中国信息通信研究院数据显示,2024年我国人工智能核心产业规模超过9000亿元,增速达24% [1] - 预计2025年人工智能核心产业规模有望突破1.2万亿元,增速将进一步提升 [1] - 今年以来,生产制造环节的大模型应用案例占比由去年的19.9%增长至25.9%,增长显著 [1] 多模态大模型技术进展 - OpenAI于2024年2月推出初代Sora模型,被视为视频领域的GPT-1时刻 [2] - 2025年9月底,OpenAI推出Sora 2,视频领域有望迎来GPT 3.5式突破,其在物理模拟、真实感和可控性方面显著提升 [2] - 10月16日,谷歌在Gemini API中发布Veo 3.1和Veo 3.1 Fast付费预览版,在音频支持、叙事控制及质感还原方面进行了重大升级 [2] 科创人工智能ETF (589010) 产品特征 - 科创人工智能ETF华夏 (589010) 紧密跟踪上证科创板人工智能指数,覆盖全产业链优质企业 [2] - 该指数成分股兼具高研发投入与政策红利支持 [2] - 科创板20%涨跌幅与中小盘弹性有助于捕捉AI产业“奇点时刻” [2]