人工智能

搜索文档
马斯克:谷歌最有可能成为AI行业领先者
36氪· 2025-08-15 09:21
马斯克对谷歌AI的评价 - 马斯克罕见称赞谷歌,认为其目前最有可能成为AI行业领导者,因谷歌拥有最大的计算和数据优势 [1] - 马斯克预测行业格局可能在几年内变化,但大型AI公司(包括其旗下xAI)将继续蓬勃发展 [1] - 谷歌在AI领域具有技术积淀,2017年发表Transformer架构论文,该技术支撑ChatGPT等大模型 [1] - 谷歌通过投资Anthropic(持股14%)和Safe Superintelligence等初创公司强化AI布局 [1] 谷歌的AI投入 - 谷歌计划将2024年资本支出提高100亿美元至850亿美元,重点投入芯片和AI产品 [2] - 资本支出增加旨在满足市场对谷歌AI产品的需求增长 [2] 马斯克与OpenAI的纠纷 - 马斯克与OpenAI CEO奥尔特曼矛盾升级,双方互相指控平台推广不公 [3] - 纠纷源于2018年马斯克因理念不合离开OpenAI董事会,2023年其起诉OpenAI违反非营利使命 [3] - 马斯克2023年成立xAI并推出Grok聊天机器人,2024年通过三轮融资筹集超120亿美元 [3] 特斯拉与xAI的关联 - 马斯克表示特斯拉将交由股东投票决定是否投资xAI,但未公布具体时间表 [4] - 马斯克称个人倾向早已推动特斯拉投资xAI [5]
AI 模特时代到来:字节x清华推出商用级视频换装模型DreamVVT,保真度显著领先SOTA
机器之心· 2025-08-15 09:16
技术突破 - 字节跳动智能创作团队联合清华大学推出视频换装模型DreamVVT,基于Diffusion Transformer(DiTs)构建,支持任意类型衣服、处理大幅度人物或相机运动、复杂背景及不同风格输入 [2][6] - 该模型采用两阶段生成框架,解决现有技术依赖成对数据、难以处理复杂场景(如360度旋转、剧烈运镜)导致的服装细节崩坏、纹理丢失及时序抖动问题 [6][8] - 创新性结合静态关键帧试穿与视频语言模型(Video LLM),平衡服装细节保真度与视频时间一致性 [8] 技术细节 - **第一阶段**:智能采样关键帧,通过骨骼运动相似度与人物面积加权评分,筛选信息冗余度最低的关键帧;利用微调Diffusion Transformer生成多帧换装参考图,集成LoRA模块确保多帧间外观一致性 [13][14] - **第二阶段**:基于图生视频(I2V)框架,融合动作信息(2D骨骼序列)、视觉信息(VAE编码)、文本信息(Video LLM描述)及外观信息(关键帧特征),通过全自注意力机制对齐多模态输入 [16][17][18] - 采用拉普拉斯金字塔融合技术无缝嵌入原始背景,并通过多任务学习策略优化生成效果 [19] 性能验证 - 在ViViD-S数据集上,VFID和LPIPS指标达到SOTA;在Wild-TryOnBench评估中,DreamVVT在服装细节保留度(GP 3.41)、物理真实感(PR 3.69)和时序一致性(TC 3.32)全面领先竞品(如CatV²TON GP 1.30、MagicTryOn TC 1.88) [21][23] - 消融实验显示:关键帧数量从1增至2帧可提升细节保真度,LoRA微调比全参数训练更有效增强物理真实感 [24] 应用前景 - 该技术突破为电商、广告及娱乐行业提供高效视频虚拟试穿解决方案,降低传统服装视频广告制作成本 [2][26] - 支持复杂场景下的高保真生成,推动视频虚拟试穿技术向成熟商业应用迈进 [26]
辽宁省机器人及人工智能集群专班工作会议<br/>暨辽宁省机器人领域实验室群与产业集群互动对接会召开
辽宁日报· 2025-08-15 09:12
会议背景与目的 - 辽宁省召开机器人及人工智能集群专班工作会议暨实验室群与产业集群互动对接会 [1] - 会议旨在总结产业集群建设成效并部署下一阶段重点任务 [1] - 目标为推进实验室群与产业集群协同发展,强化创新链与产业链融合 [1] 产业发展现状 - 上半年辽宁省机器人及人工智能产业集群规模达308.5亿元,同比增长7% [1] - 产业面临挑战包括规模需扩大、创新能力待提升、应用场景需深入挖掘 [1] 下一阶段重点任务 - 强化创新驱动以增强源头技术供给 [1] - 扩大集群规模以增强产业发展后劲 [1] - 推进应用示范以拓展产业发展空间 [1] - 提升产业生态以营造良好发展环境 [1] 政策支持与目标 - 省委省政府将全力推动机器人及人工智能产业加快发展 [1] - 产业升级目标为助力全面振兴新突破决胜之战 [1]
万字解析DeepSeek MOE架构!
自动驾驶之心· 2025-08-15 07:33
MOE架构基本原理 - MOE全称为混合专家模型 核心思想是使用多个专家FFN替代原Transformer架构中的前馈层 每个token会选择top-K个专家进行前向传递[2][4][6] - MOE层由路由器(门控和选择器)和n个专家FFN组成 路由器通过softmax操作选择不同专家的权重 选择器确定top-K专家[6] - 在Switch Transformers中采用top-K=1策略 主要考虑专家并行方案时的通信 计算和存储效率平衡[9][10][14] - 引入容量因子概念 专家容量=(总token数/专家数量)×容量因子 用于控制每个专家处理的token数量 防止溢出或资源浪费[13][18] Switch Transformers优化方案 - 采用简单稀疏路由和高效稀疏路由两种方案 简单稀疏路由针对单个token选择专家 高效稀疏路由针对专家并行设计[7] - 负载不均衡问题通过可微的负载均衡辅助损失函数解决 使token在专家分布上尽可能均匀[17][20] - 专家容量静态分配可能导致溢出或浪费 动态计算时需要平衡容量因子设置[15][16] DeepSeek V1架构创新 - 提出细粒度专家划分策略 通过拆分FFN中间隐藏维度增加专家数量 在保持参数总量不变情况下提升专家专业化程度[22][25] - 引入共享专家分离机制 设置特定共享专家始终激活 用于捕捉通用知识 减少其他路由专家间的冗余[24][26] - MOE层输出由三部分组成:共享专家输出 Top-K路由专家输出和残差连接[30] - 设计专家级别和设备级别双重负载均衡损失函数 解决训练不充分和计算瓶颈问题[32][35] DeepSeek V2优化重点 - 实施设备受限路由策略 将每个token的激活专家所在GPU设备数量限制为3个 显著降低通信开销[37] - 新增通信负载均衡损失函数 优化设备间token分配均衡性[38][39] - 采用token丢弃策略 对超过专家容量的token按分值降序丢弃 仅影响当前MOE层计算[42] DeepSeek V3技术演进 - 将门控函数从SoftMax改为Sigmoid 可能出于降低计算复杂度考虑 特别在专家数量增至256个时更明显[44][45] - 弃用所有辅助负载均衡损失 引入可学习偏置项bi 通过动态调整偏置值实现负载均衡[46][47] - 新增序列级别辅助损失函数 防止单个序列内出现极端不平衡情况[49][50] - 完全取消token丢弃策略 通过偏置项和序列级损失实现良好负载均衡[52] MOE架构发展脉络 - MOE架构早在1991年就已提出 但直到2023年底Mixtral 8*7B模型发布后才受到广泛关注[2] - 国内Qwen和MiniMax等公司也推出MOE模型 但架构实现相对DeepSeek更简单[3] - DeepSeek从V1到V3持续优化负载均衡和通信效率 体现对高效计算的一贯追求[36][43] - MOE模型特别适合云计算并行推理场景 在AI模型中的地位日益重要[3]
刘典:从AI到“AI+”,如何实现产业跃迁
环球网资讯· 2025-08-15 06:29
中国AI产业向"AI+"迈进 - 中国AI产业正从技术叠加走向与各行业深度融合 形成覆盖基础层 技术层 应用层的完整体系 发展核心是规模化商业化应用 [1] - 国务院审议通过《关于深入实施"人工智能+"行动的意见》 为行业注入新动能并反映全球科技竞争版图变化趋势 [1] 基础层发展现状 - 2024年底中国算力总规模达280EFLOPS 其中智能算力90EFLOPS占比超30% 通过"东数西算"战略显著降低算力与能源成本 [1] - 国产芯片在云端训练 边缘推理场景份额持续扩大 但高端训练环节仍存在技术瓶颈 [1] 技术层创新进展 - 中国已发布1509个大模型占全球总量40% 拥有71家AI独角兽企业占全球271家的26% [2] - 开源社区通过知识共享降低开发门槛 加速创意到产业应用的转化效率 [2] 应用层渗透情况 - 中国AI场景渗透深度广度全球领先 53%企业用AI打通业务流程 18%头部企业以AI重构端到端流程 但仅9%实现显著价值转化 [2] - 数据治理能力不足和专业人才短缺是制约AI应用发展的主要因素 [2] 市场规模与挑战 - 2024年AI核心产业规模突破7000亿元增速超20% 预计2025年达8000-10000亿元 全产业链规模有望达5万亿元 [3] - 生成式AI快速普及 302款备案大模型用户超6亿 头部产品日活突破3000万 [3] - 行业面临技术同质化与应用碎片化挑战 部分千亿参数模型在垂直领域效果仍逊于国际顶尖竞品 存在资源浪费风险 [3] 国际合作方向 - 中国可通过技术赋能与全球南方国家共建生态 与发达国家侧重技术互补和标准互认 在国际组织层面强调普惠合作打破西方垄断 [4] - 需通过生态共建打造覆盖不同类型伙伴的合作网络 增强全球AI治理参与度 [4] 产业升级路径 - 需从铺摊子转向提质效 突破关键技术 深挖应用场景 提升响应能力 拓展国际合作 增强生态话语权 [4]
竞逐资本市场 创投钟意杭州“六小龙”
搜狐财经· 2025-08-15 06:25
成立至今,群核科技已获得包括IDG资本、纪源资本、顺为资本、云启资本、经纬创投、高瓴等多家知 名机构的投资。时报财经图库/供图 在公司业绩多年亏损的情况下,群核科技一直通过外部融资的方式发展。自2013年以来,群核科技累计 完成多轮融资,投资方阵容亮眼。招股书显示,除3位创始人黄晓煌、陈航和朱皓分别持有公司 15.46%、11.04%和4.22%的股权外,IDG资本、纪源资本、顺为资本、高瓴四大机构合计持股近50%。 除群核科技外,杭州"六小龙"之一的宇树科技也准备上市。 今年7月18日,证监会网站披露了宇树科技的上市辅导备案文件。文件显示,宇树科技于今年7月7日与 中信证券签署辅导协议,启动A股IPO进程。按计划,中信证券将在7月至9月对接受辅导人员进行集中 授课,最早将于今年10月进行上市条件综合评估,并协助公司准备IPO申请文件。 证券时报记者 王军 8月14日,群核科技于2月14日递交的港股招股书到期。据悉,港交所IPO流程规定,企业递交的招股书 有效期为6个月。若未在6个月规定期限内完成上市聆讯或上市流程,招股书将自动失效,失效后,企业 可更新数据后重新提交申请。 群核科技成立于2011年,是一家以 ...
行业生态更完善 应用场景更丰富 国资央企加力布局人工智能赛道
中国证券报· 2025-08-15 06:11
央企人工智能布局加速 - 中国移动上半年人工智能领域相关收入达"几十亿元数量级" [1] - 国家能源集团"擎源"、中国石油"昆仑"等大模型相继投用 [1] - 中央企业已布局16个重点行业800余个场景 [1] - 国资央企通过加大投入与资本运作提速,塑造新产业优势、培育新动能 [1] 央企人工智能业务表现 - 中国电信上半年智算数据中心收入同比增长7.4%,天翼云收入达573亿元,推出80余个行业大模型、30余个行业智能体,服务行业客户超2万家 [2] - 中国联通算网数智业务上半年收入达454亿元,占比提升至26%,AIDC签约金额同比增长60%,计划2025年固定资产投资550亿元 [2] - 中国移动总智算规模达61.3EFLOPS,AI+DICT签约项目达1485个,下半年人工智能投资力度快于上半年 [2] 行业大模型落地与趋势 - 国家能源集团"擎源"、中国建材集团"晓妙"、中国移动"九天"3.0、中国联通"元景"等大模型成果显著 [3] - 央企人工智能业务将呈现三大趋势:系统级场景优势转化为可开放产品、从自用转向输出、央地协同助力稳投资 [3] 地方国资开放应用场景 - 广州发布60个市属国企人工智能应用场景,大模型备案总数达33款,产业基金规模超700亿元 [4] - 深圳推出"滚动式发布"模式,首批遴选100个优质应用场景 [4] - 浙江国资委发布首批26个"人工智能+"开放场景清单,涵盖8大重点领域 [4] 政策支持与生态培育 - 国务院国资委强调落地战略性高价值应用,强化顶层设计,打造人工智能+科学、生物医药等应用标杆 [6] - 统筹规划智算集群建设,对外提供普惠高效算力服务,开放央企人工智能能力降低创新门槛 [6] - 整合资金、产业、数据等优势资源,支持产业链关键环节企业,培育世界一流企业 [6]
当中国开源AI领跑,美国科技圈和政界坐不住了
搜狐财经· 2025-08-15 02:58
中国开源AI模型发展 - 中国正加快将开源人工智能模型打造成全球标准 此举震动美国科技巨头与政策制定者 担心美国优势被取代并筹划应对策略 [2] - 中国AI领域2024年突破不断 DeepSeek推出R1推理模型引发轰动 阿里巴巴密集推进Qwen系列开源 几乎每个季度都有新动作 持续巩固开源AI地位 [2] - 开源模型提供免费下载和自由修改 推动中国AI技术迅速在全球落地应用 美国专有模型公司感受到压力 OpenAI于8月初推出首个开源模型gpt-oss应对挑战 [2] 中美AI竞争格局 - 中国出现反超美国的可能性 凭借开放权重模型生态和半导体设计制造积极布局积蓄势能 [5] - 美国特朗普政府7月发布"美国人工智能行动计划" 明确指出开源模型可能在部分领域成为全球标准 呼吁打造基于美国价值观的领先开源模型 [5] - 中国高度竞争的商业环境和知识快速扩散 在AI竞赛中积累惊人动能 中美在不同AI领域各有优势 美国在大规模云端AI部署领先 中国长期在安防技术占优 [5] 开源模型性能与应用 - 研究机构Artificial Analysis评测显示 自2023年11月起中国最好开放权重模型整体性能已超越美国开源冠军 [7] - 在数学和编程等能力方面 阿里巴巴Qwen3某一版本击败OpenAI的gpt-oss [7] - 华侨银行利用开源模型开发约30款内部工具 使用Google Gemma总结文件 Qwen协助写代码 DeepSeek分析市场趋势 同时使用约10个开源模型 [7] 开源生态商业模式 - 开源AI领先者难以立即获得可观回报 研发成本动辄上亿美元 但可通过锁定用户后在生态内其他服务盈利 类似谷歌在安卓系统捆绑搜索和YouTube [6] - 企业偏好开源模式 可自由定制并部署在内部系统 将敏感数据留在自家服务器 [6] - 科研界长期将开源视为加速新兴技术发展的方式 中国鼓励AI、操作系统、半导体架构和工程软件领域的开源研发 [6] 中美AI生态差异 - 美国公司基础模型研发采取相对封闭策略 需要投入巨额资金挖角竞争对手核心成员 知识流动缓慢且代价高昂 [9] - 中国开源AI生态呈现高度竞争态势 领先基础模型公司相互压低价格 高调宣传 在人才与客户上互相挖角 [9] - 这种达尔文式竞争会淘汰部分现有玩家 但孕育出更强大的公司 DeepSeek和阿里巴巴等免费模型赢得全球用户青睐 [9]
三重利好确立A股市场长期向好趋势
证券日报· 2025-08-15 00:12
市场表现 - 上证指数8月14日突破3700点整数关口,沪深北三市总成交额超2 3万亿元,创年内单日成交额新高 [1] - 上证指数自2025年4月3040点起步,历时4个月逐级突破3400-3700点,呈现"台阶式上行"稳健态势 [1] - 单日成交额从8月11日1 8万亿元稳步放大至8月14日2 3万亿元,显示场外资金入场意愿增强且持续 [1] 资金动向 - 融资融券余额8月初重返2万亿元大关,杠杆资金有序入场反映风险偏好理性回升 [2] - 保险资金一季度权益投资余额大幅增加,中长期资金加大权益资产配置力度 [2] - 市场资金向半导体、机器人、人工智能等科技成长板块集中,北向资金呈现持续净流入态势 [3] 经济基本面 - 上半年GDP同比增长5 3%,较2024年增速加快0 3个百分点 [4] - 规模以上高技术制造业增加值同比增长9 5%,高技术服务业投资同比增长8 6% [4] - 新兴产业如AI人工智能、创新药、高端制造迎来快速发展期 [4] 政策环境 - 监管部门出台多项举措引导资金长期投资,提升市场内在稳定性 [5] - 适度宽松货币政策提供充裕流动性,财政政策通过设备更新、消费品以旧换新激发经济活力 [5] - 宏观政策与资本市场政策协同性增强,为市场创造良好发展环境 [5]
猎豹移动上涨3.21%,报4.83美元/股,总市值1.48亿美元
金融界· 2025-08-14 23:47
股价表现与交易数据 - 8月14日盘中股价上涨3.21%至4.83美元/股 [1] - 当日成交额7.61万美元 [1] - 当前总市值达1.48亿美元 [1] 财务业绩表现 - 截至2025年3月31日收入总额2.59亿人民币,同比增长36.11% [1] - 归母净利润-3335.7万人民币,亏损幅度同比收窄58.32% [1] - 2025财年中报预计于9月12日披露 [1] 公司战略定位 - 全球领先移动互联网公司,正从移动互联网向AI驱动的产业互联网战略升级 [2] - 致力于"在人机共存的世界里用科技让生活更美好"的使命 [2] - 以成为全球领先的AI产业互联网公司为目标 [2] 技术能力体系 - 构建垂直一体化AI能力,涵盖自研芯片算力、算法能力、系统能力、应用能力及商业大脑 [2] - 算法能力包括语音全链路技术、麦克风阵列、全感知视觉识别、室内导航平台和6轴机械臂 [2] - 开发三大开放系统:猎户星空语音OS、猎户星空Robot OS和猎户星空Arm OS [2] 业务布局架构 - 智能服务机器人解决方案包括智能语音服务机器人、智能递送服务机器人和智能劳动服务机器人 [2] - AI赋能解决方案涵盖语音、芯片、视觉、智能自助设备及室内自主导航 [2] - 通过"智能服务机器人"和"AI赋能"两大业务板块迎接AI和5G时代的服务与产品智能化升级 [2]