Workflow
Artificial Intelligence
icon
搜索文档
Kimi K2高速版发布;OpenAI将“星际之门”项目引入欧洲丨AIGC日报
创业邦· 2025-08-02 09:09
OpenAI欧洲AI数据中心项目 - OpenAI宣布启动"星际之门"挪威项目 这是其在欧洲的首个AI数据中心项目 合作伙伴包括Nscale和Aker 站点由Nscale负责设计和建设 预计由Nscale与Aker成立的50/50合资企业共同拥有 [2] 阿里通义千问编程模型 - 阿里通义千问推出编程模型Qwen3-Coder-Flash 该模型在代理式编程 浏览器使用 工具调用等领域超越当前顶级开源模型 仅略逊于顶配版Qwen3-Coder-480B-A35B-Instruct Claude Sonnet-4 GPT4 1等领先闭源模型 [2] Deepseek大语言模型部署专利 - Deepseek关联公司杭州深度求索人工智能基础技术研究有限公司公布"一种大语言模型的部署方法及系统"专利 该专利涉及人工智能领域 通过将预填充阶段和解码阶段分别部署在不同性能的机器上 实现负载均衡 提高硬件利用率 减少闲置算力 降低延迟 提高吞吐量 增强系统扩展性和容错性 [3] Kimi K2高速版发布 - Kimi K2高速版kimi-k2-turbo-preview发布 模型参数与kimi-k2一致 但输出速度从每秒10 Tokens提升至每秒40 Tokens [4] 行业数据服务 - 提供人形机器人 商业航天 AGI等热门赛道的行业图谱和报告 包含2万+LP数据 10万+基金数据 1万+专精特新小巨人企业等 [4][5]
一个模型超了DeepSeek R1、V3,参数671B,成本不到350万美元
机器之心· 2025-08-02 08:55
机器之心报道 机器之心编辑部 Deep Cogito,一家鲜为人知的 AI 初创公司,总部位于旧金山,由前谷歌员工创立,如今开源的四款混合推理模型,受到大家广泛关注。 每个模型都可以直接作答(标准 LLM 模式),也可以在作答前进行自我反思(类似推理模型)。 其中,最大规模的 671B MoE 模型是目前全球最强大的开源模型之一,其性能与最新的 DeepSeek v3 和 DeepSeek R1 模型相当甚至超越,且接近 o3 和 Claude 4 Opus 等闭源前沿模型。 Deep Cogito 的核心方法是迭代蒸馏与增强(Iterated Distillation and Amplification,简称 IDA),它不依赖手工设计的提示词或静态教师模型,而是利用模型自身不 断演化的洞察力来引导训练。 这一过程不是通过延长推理时间来提升性能,而是让模型通过迭代式策略改进内化推理过程。 这是一个全新的扩展范式,使模型逐渐形成更强的直觉,并成为 AI 自我提升(AI 系统自我改进)概念的有力验证。 由于 Cogito 模型在搜索过程中对推理路径有更好的直觉,其推理链比 DeepSeek R1 缩短了 60% ...
多模态后训练反常识:长思维链SFT和RL的协同困境
机器之心· 2025-08-02 08:55
在语言模型领域,长思维链监督微调(Long-CoT SFT)与强化学习(RL)的组合堪称黄金搭档 —— 先让模型学习思考模式,再用奖励机制优化输出,性能通常 能实现叠加提升。 但 华为与香港科大的最新研究 发现了一个出人意料的现象: 在多模态视觉语言模型(VLM)中,这对组合难以实现协同增益,甚至有时会互相拖后腿。 推动这项研究的一个关键见解是认识到多模态推理评测与纯语言评测存在微妙差异。虽然文本推理任务通常侧重于逻辑要求高的问题,但多模态评测通常包含简 单基于感知的问题和复杂的认知推理挑战。作者假设,这种异质性是 Long-CoT SFT 和 RL 在多模态设置中表现出不同现象的核心原因。 为探索各种后训练技术如何影响不同类型问题性能,作者们引入了一个简单有效的难度分类方法,并基于此构建了 难度层级细化后的多模态推理榜单数据集 (包 括新的 MathVision、MathVerse、MathVista、MMMU val 和 MMStar val)。该方法根据基线模型 Qwen2.5-VL-Instruct-7B 在五个数据集的每个问题上 16 次独立运行 的成功率,将题目分为五个级别(L1-L5),分别代表 ...
OpenAI,估值已达3000亿美元
财联社· 2025-08-02 08:41
融资与估值 - 人工智能初创公司OpenAI已融资83亿美元,估值达3000亿美元,这是其今年400亿美元融资计划的一部分 [1] - 本轮融资提前完成,获得了5倍的超额认购 [2] - Dragoneer投资集团以28亿美元领投本轮,Blackstone、TPG、T. Rowe Price、Fidelity、Founders Fund、红杉资本、Andreessen Horowitz、Coatue、Altimeter、D1 Capital、Tiger Global及Thrive Capital等机构跟投 [2] 财务表现 - OpenAI年化经常性收入从6月份的100亿美元跃升至130亿美元 [2] - 公司年化经常性收入有望在年底前突破200亿美元 [2] 用户增长 - ChatGPT的付费企业用户数量从300万增至500万 [2] - ChatGPT的周活跃用户超过7亿 [2]
算力使用费,单家企业最高给2000万
每日商报· 2025-08-02 06:15
人工智能产业政策支持 - 杭州高新区(滨江)推出"数据、算力、模型"三位一体人工智能政策体系,每年安排最高1亿元"算力券"补助,给予算力使用费用最高60%补助,单家企业最高2000万元 [1] - 支持企业和机构开源人工智能计算平台、模型等,给予最高500万元奖励,促进产业集聚 [1] - 成功落地并获评标杆示范项目最高可获得250万元区级奖励,入围省市标杆项目最高可获得500万元奖励 [1] 人工智能产业布局 - 高新区(滨江)发布人工智能典型场景需求,涵盖生产制造、金融贸易、医疗健康、民生服务、社会治理五大领域 [1] - 启动杭州数谷数据创新中心和浙江省人形机器人未来产业先导区建设,探索数据资源化与资产化路径 [1] - 推动打造人形机器人技术创新核心区、具身智能引领区、训练熟化加速区和场景方案示范区 [1] 人工智能产业发展现状 - 高新区(滨江)初步形成覆盖计算芯片、AI框架、服务器、算力基础设施、行业大模型等完整产业链 [2] - 2024年全区人工智能核心产业实现营收超2000亿元,占杭州市比重超40% [2] 行业活动 - "中控杯"工业AI创新挑战赛开赛,旨在发掘工业AI领域创新力量 [2]
Meta dishes out $250M to lure 24-year-old AI whiz kid: ‘We have reached the climax of ‘Revenge of the Nerds'
New York Post· 2025-08-02 05:38
人才竞争与薪酬 - Meta向24岁AI研究员Matt Deitke提供总额达2.5亿美元的薪酬方案,创下企业史上最高薪酬记录之一,初始报价1.25亿美元被拒后CEO扎克伯格亲自将报价翻倍[1][2] - 该薪酬包含首年可能支付的1亿美元,凸显AI顶尖人才的稀缺性[2][4] - Meta为组建AI精英团队已支付超10亿美元,包括以超2亿美元薪酬从苹果挖角AI模型团队前负责人Ruoming Pang[9][15] 技术背景与行业动态 - Deitke曾主导开发多模态AI系统Molmo,能处理图像、声音和文本,与Meta技术方向高度契合[5] - 其研究成果包括3D数据集、具身AI环境和多模态模型,获NeurIPS 2022杰出论文奖(获奖率约0.1%)[7] - 离职博士项目后创立AI代理公司Vercept,获1650万美元融资,投资者含谷歌前CEO埃里克·施密特[6] 公司战略与资本投入 - Meta宣布2025年资本支出将增至720亿美元,同比增加约300亿美元[10] - 扎克伯格明确表示将"不惜代价"争夺50-70名顶级研究人员,强调"人才密度"战略[16] - 公司正建设千兆瓦级计算集群,硬件投入与人才招募形成协同效应[16] 行业影响与社会争议 - MIT经济学家David Autor指出"程序员薪酬堪比职业运动员"标志技术人才价值重估[4] - 行业出现两极分化:顶级研究者获数亿薪酬,而内容审核等岗位面临裁员且无正式员工待遇[11][13] - UCLA专家指出AI发展模式依赖底层劳动者产生的数据,但未给予相应补偿,可能加剧经济不平等[11][13][15]
Merging AI and Quantum Computing: Here's the Stock to Watch
The Motley Fool· 2025-08-02 05:24
人工智能与量子计算融合趋势 - 科技行业领导者正加速整合人工智能与量子计算技术以革新计算能力[1] - 英伟达作为AI行业领军者同时推动量子计算发展成为同时布局两大新兴领域的稀缺标的[2][9] 英伟达AI领域核心竞争力 - 通过Nvidia AI Foundry提供端到端生成式AI模型构建平台覆盖大语言模型和AI聊天机器人[4] - Nvidia AI Enterprise软件工具套件支持云原生AI开发[4] - Blackwell架构GPU成为数据中心AI计算核心 已获CoreWeave和Nebius等超大规模客户部署[5] 量子计算领域布局 - 在波士顿建立研究中心 将GB200 Grace Blackwell超级芯片与量子硬件结合以解决量子比特噪声等关键问题[6] - 向日本产业技术综合研究所提供2,020块H100 GPU 支撑全球最大量子研究超算ABC1-Q[7] - 通过Quantum-2 InfiniBand网络平台和CUDA-Q开源混合计算平台推动量子应用开发[7][8] 估值与市场定位 - 当前市盈率56倍低于五年平均70倍 反映其半导体与AI双领域龙头溢价[10] - 作为少数同时深度参与AI和量子计算的基础设施提供商 具备独特配置价值[9][11]
破晓之光:2025 ChinaJoy AIGC大会圆满召开 | ChinaJoy2025
36氪· 2025-08-02 02:07
大会概况 - 2025 ChinaJoy AIGC大会以"破晓之光"为主题,聚焦AI基建、人形机器人、数字娱乐新范式及智能技术产业融合四大板块 [1] - 大会采用"主题演讲+圆桌论坛"形式,探讨技术驱动产业从"追随者"迈向"定义者"的路径 [1] 多模态大模型技术 - 清华大学朱军团队开发的Vidu Q1视频模型实现"高可控性"与"高一致性",已应用于泛互联网、广告营销及智能硬件领域 [2] - 多模态技术推动数字与物理世界融合,AI能力从虚拟内容生成扩展到物理世界的感知、决策与执行 [2] Agentic AI与基础设施 - 微软预测Agentic AI到2028年将承担15%企业日常工作决策,中国市场年均复合增长率达72.7% [5] - 微软Azure AI Foundry平台整合LLM Models和Agents工具,AI数据中心采用NVIDIA GB200 GPU和液冷系统,性能达最快超算10倍 [5] AI算力与硬件协同 - 无问芯穹通过软硬件协同优化实现终端性能2-5倍提升,自研推理IP加速AI终端落地 [7] - 公司构建"云端一体"生态,推动算力标准化服务和AI算力国产化 [7] 生活空间机器人 - 维他动力定义生活空间机器人为自主化助人机器人,将在世界机器人大会推出行业首个智能伴随机器人 [9] - 智能终端发展遵循从垂直应用到系统整合的路径,类似Walkman到智能手机的演进 [9] 具身智能人形机器人 - 青心意创Orca机器人聚焦拟人交互陪伴,在多模态交互能力上处于领先水平 [10] - 星动纪元认为具身智能可替代高危环境作业,推动传感器等硬件升级,解决劳动力短缺问题 [13] AI游戏与应用创新 - 世纪华通"数龙杯"大赛评选11支团队,推动AI技术规模化商业化应用 [17] - 腾讯混元AIGC工具提升游戏美术资产开发效率,但风格一致性等问题仍需优化 [23] - VAST的Tripo 3D大模型服务3.5万中小客户,支持语义分割和部件级编辑 [25] 影视与视频生成技术 - 爱奇艺用AI重构影视生产流程,开发剧本工坊、虚拟制作等智能制作产品 [19] - 爱诗科技PixVerse视频大模型迭代至V4.5,实现5秒生成高质量视频,服务全球6000万用户 [21] AI Agent发展 - 扣子平台被上万家企业用于开发Agent,如抖音电商智能客服和和府捞面点评分析系统 [27] - 新智慧游戏推出GameSkill陪练AI,覆盖MOBA/FPS/RPG等主流游戏品类 [29] - 圆桌讨论预测Agent将具备自主决策能力,办公场景或实现80-90%无人化操作 [31]
AI Earnings: 2 Key Reports to Watch
ZACKS· 2025-08-02 00:16
2025年Q2财报季核心观点 - 2025年Q2财报季持续进行中 多家重量级公司将发布财报 包括Mag 7成员和AI领域关键企业Palantir(PLTR)与NVIDIA(NVDA) [1] - AI热潮持续推动相关公司业绩增长 PLTR与NVDA的财报将进一步验证这一趋势 [2] - 整体财报季表现积极 NVDA和PLTR的财报将为AI行业现状提供更清晰视角 [8][11] Palantir(PLTR)财报预期 - 公司将于8月4日发布财报 上季度销售额同比增长40% 并上调全年销售预期 [3] - 客户数量同比增长近40% 环比增长8% 美国商业合同总价值达8.1亿美元 同比激增180% [5] - 预计本季度每股收益(EPS)将增长55% 销售额增长38% 客户增长仍是关键观察指标 [6] NVIDIA(NVDA)财报预期 - 公司将于8月27日发布财报 数据中心业务销售额达391亿美元 同比增长73% [7] - 当前Zacks共识EPS预期为1美元 同比增长47% 预计销售额485亿美元 同比增长52% [10] - 数据中心业务季度销售图表显示持续增长态势 新产品发布相关评论将影响股价走势 [9] AI行业动态 - AI领域需求持续火热 推动相关公司业绩显著增长 [2] - PLTR和NVDA作为AI领域代表企业 均承载较高增长预期 [8] - 两家公司财报将帮助市场更好评估当前AI行业发展状况 [11]
普惠AI照进现实:云知声如何让技术“越山海”
观察者网· 2025-08-01 23:49
公司技术架构与产品体系 - 公司以"AI三驾马车"(算法、算力、大数据平台)为技术基座,是国内最早搭建千卡GPU智算集群的AI公司之一 [3] - 2016年完成支持千卡同时调用的Atlas智算中心,并推出以模型为中心的"云知大脑"平台,其核心为"山海大模型" [3] - 云知大脑由认知模型(山海大模型)和感知/生成模组(语音降噪、识别、合成等)构成,整合为多模态强推理大模型 [5] - 技术架构呈现"底层三驾马车-中间云知大脑-上层场景应用"的完整体系 [5] 核心应用场景布局 - 智慧物联:通过语音交互打通物联网,实现"万物互联,开口即控"的横向场景覆盖 [5] - 智慧医疗:自2016年与协和医院合作起,已深入病历质控、医保控费、辅助诊疗等垂直领域,构建医疗知识图谱并持续升级专业模型 [5] - 智慧交通:与南宁轨道集团成立合资公司,覆盖智能客服、运维调度等轨道交通智能化场景 [9] - 采用"智慧物联(宽度)+智慧医疗(深度)"的复合场景战略,形成场景化应用矩阵 [8] 技术产业化路径 - 公司经历2012年深度学习(AlexNet)和2022年大模型(ChatGPT)两次技术革命,均保持国内首批产业化应用地位 [11] - 医疗领域采用"助手-同事-导师"的渐进式发展路径,目标培养超级医生但需长期投入 [5] - 行业大模型选择标准取决于专业knowhow需求程度,医疗等严肃场景需结合行业知识与数据构建专业模型 [6] - 技术发展策略强调"深入行业解决实际问题",而非单纯技术刷榜 [11][12] 全球化与资本市场 - 出海战略聚焦东盟和"一带一路"国家,已与瓦努阿图达成震后智能化重建合作 [13][14] - 认为中国在AI工程化应用和产业化体系方面具有全球领先优势 [17] - 指出DeepSeek等突破正在重构全球对中国技术公司的价值评估,中美技术代差已缩短至1-2个季度 [16] - 预测全球化2.0将形成中美"双核主导"格局,打破美国技术垄断有利于行业均衡发展 [13][17] 行业趋势与创业建议 - 观察到WAIC参展应用从概念展示转向垂直行业落地,C端产品显著增多 [15] - 判断底层通用大模型最终存活3-5家,建议创业者聚焦应用层价值创造 [18] - 数据质量被视为AI能力关键,公司通过医疗等垂直领域深度合作获取高质量行业数据 [19][20] - 强调"算法-算力-数据"闭环需通过真实场景验证,商业化价值反哺技术迭代 [20]