Artificial Intelligence

搜索文档
Alibaba Stock Breaks Past 52-Week High As AI Frenzy Heats Up
Benzinga· 2025-09-30 18:45
股价表现 - 公司股价在周一收盘上涨约5% 成为9月表现最佳的中国科技股 [1] - 公司股价年内涨幅超过112% 远超纽交所综合指数13%的回报率 目前交易价格高于其52周高点181.34美元 [2] - 公司股价有望创下自2019年香港上市以来最佳月度表现 周二盘前交易中进一步上涨1.16%至181.99美元 [8][9] 人工智能与云计算业务进展 - 公司积极推动云计算和人工智能发展 是股价上涨的主要驱动力 [1] - 公司的Qwen3-Omni多模态AI系统在Hugging Face趋势模型榜单中排名第一 [3] - 公司云部门推出的Qwen3-Omni系列是首个统一文本、图像、音频和视频的原生端到端模型 在音频识别及图像视频理解方面表现优于其前代产品以及OpenAI的GPT-4o和谷歌的Gemini-2.5-Flash [4] - 公司在Hugging Face的开源模型占据前十名中的半数席位 超越Meta的Llama [5] - 公司上一季度AI相关产品实现三位数增长 云部门销售业绩超出预期 [8] 分析师观点与市场预期 - 晨星高级股票分析师认为公司价值被低估 理由包括增加海外数据中心支出、开源AI模型采用率强劲、芯片性能提升以及云收入增长 [6] - 摩根士丹利分析师在杭州会议后表示乐观 公司承诺进一步投资AI并宣布与英伟达建立合作伙伴关系 [7] - 摩根士丹利将公司2026财年云业务增长预期上调至32% 2027财年上调至40% 依据是资本支出增加、模型升级、新合作伙伴关系以及更快的国际扩张 [7] - 凯西·伍德的方舟投资管理公司在四年后首次重新建仓公司ADR 显示出市场兴趣重燃 [8] - 彭博行业研究分析师认为 公司的全栈云-AI整合以及百度在模型部署方面的进展 可能使中国股市在全球AI叙事中获得更强地位 [9]
具身智能产业从“单点创新”走向“体系协同”
新华财经· 2025-09-30 18:39
新华财经上海9月30日电 我国具身智能产业正在从"单点创新"走向"体系协同"。30日,记者获悉,全国 首个具身智能领域国家级标准化试点"上海虚实融合具身智能训练场标准化试点"已于近日在上海设立。 据悉,该试点将由人形机器人(上海)有限公司(即"国家地方共建人形机器人创新中心",以下简称 "国地中心")承担,以上海国地中心主训练场统领、全国各分训练场支撑的"1+N"模式开展。 其中,国地中心主训练场为标准研制核心,河南、江苏常熟、江苏吴江、北京石景山、深圳、河北、重 庆、吉林、陕西榆林等分训练场将结合区域产业特色落地标准验证,以高质量数据反哺主场。预计2025 年归集真机高质量数据15万小时,年产能超百万小时,共同推动国家试点标准体系持续优化。 国地中心表示,此次国家级标准化试点的落地,既标志着上海在人工智能最具突破性的具身智能领域获 得关键性进展,也意味着国家层面以标准化训练场为基石,开启了用标准统一全国主-分训练场,联合 各省市数据归集、标准统一、共建生态、场景落地的新征程。 试点将发挥标准体系引领作用,构建 "基础+特色" 标准体系,围绕 "实体物理场+虚拟训练场+本体/部 组件+场景应用" 四大领域,推 ...
Thinking Machines又发高质量博客:力推LoRA,不输全量微调
机器之心· 2025-09-30 18:38
机器之心报道 机器之心编辑部 LoRA 在绝大多数后训练场景下,能以远低于全量微调的成本,获得几乎同等的效果。 Thinking Machines 将这一现象形容为 LoRA 的低遗憾区间(low-regret region)——即便 不用全量微调,选择 LoRA 也不会让人后悔。 最近,Thinking Machines 真实高产啊。 今天,他们又更新了博客,力推 LoRA,且与全量微调( Full Fine-tuning ,以 下简称 FullFT ) 进 行了对比。 博客链接: https://thinkingmachines.ai/blog/lora/ 训练大模型,到底该选全量微调还是 LoRA? FullFT 意味着改动模型的所有参数,效果稳定但成本高昂,显存开销巨大;而LoRA 只改动一小部分 参数,轻量、便宜。但一个关键问题是 :便宜的 LoRA,效果会不会差很多? Thinking Machines 最新研究发现,在 小数据量任务 上,LoRA 与 FullFT 几乎没有差距,完全可以 对齐;在 大数据量任务 上,LoRA 的容量不足,承载不了过多新知识,表现略显吃力;而在 强化学习 任务 里 ...
AI圈“集体开大”!DeepSeek、Claude带头,智谱、阿里、蚂蚁、智源都“卷”起来了
AI科技大本营· 2025-09-30 18:24
整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 到底是 谁说 , 今天的 主要 工作 是 等 放假 ? 明明是 ( 被迫 ) 跟着 各家 AI 团队 卷 生卷 死 : 继昨 晚 DeepSeek发布DeepSeek V3.2-Exp 、 今 日凌晨 Anthropic推出Claude Sonnet 4.5后 , 智谱、阿里、蚂蚁、智源也 都 赶在节前最后一 天"卷 " 起来了! (即梦AI生成) 智谱 : GLM-4.6 重磅上线 , 目前国内最强的Coding模型 今天 下午 1 4 : 5 3 , 智谱 正式发布并开源新一代大模型GLM-4.6,在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智 能体应用等多个 方面实现全面提升。 据官方介绍,GLM-4.6在公开基准和真实编程任务中的表现已对齐Claude Sonnet 4、超越DeepSeek V3.2-Exp,是目前国内最强的Coding模型: (1)综合评测:在8大权威测 试(AIME 25、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-B ench、τ^2-Bench、 ...
深夜炸场!Claude Sonnet 4.5上线,自主编程30小时,网友实测:一次调用重构代码库,新增3000行代码却运行失败
AI科技大本营· 2025-09-30 18:24
整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 双节小长假将近,国内国外大模型公司闻风而动,赶在正式放假前让众人"小卷"一波。这不,继昨晚 DeepSeek 发布 DeepSeek V3.2-Exp 之后, Anthropic 又在今天带来了全新升级的 Claude Sonnet 4.5 版本,号称"世界上最好的编码模型"。 最强的编码模型 Claude Sonnet 4.5 来了:可自主持续运行 30 小时 根据官方测试结果显示,Claude Sonnet 4.5 在 SWE-bench Verified 评测里拿下了顶级成绩,这个测试主要看模型在真实世界里写代码的水平。 同时,Sonnet 4.5 在推理和数学等多项测试中也有大幅提升。从下图看出,在 Agentic Coding、Agentic Tool Use 等测试中 Claude Sonnet 4.5 远 超过更昂贵的 GPT-5、Gemini 2.5 Pro 等竞品模型。 实际测试中, Claude Sonnet 4.5 能在复杂的多步骤任务上坚持专注 超过 30 个小时。 相比此前 Opus 4 运行 7 小时左右的时间, Cla ...
零一万物联创沈鹏飞:生成式AI下半场是“一把手工程”,破局需跨越6大鸿沟
中金在线· 2025-09-30 18:22
9月25日,在零一万物华东数智大会上,零一万物联合创始人沈鹏飞首度官宣亮相,并发表了主题为"跨 越生成式人工智能商业化鸿沟"的演讲。沈鹏飞表示,"生成式AI已经过了'讲故事'的阶段,进入了'做实 事'的新阶段。从模型战争转向应用落地,从训练时代迈向推理时代,谁能真正把AI嵌入业务流程、变 成增长引擎,谁就赢了下半场。" 在沈鹏飞看来,当前生成式AI在企业端落地面临挑战的核心原因,在于三大组织障碍与三大技术障 碍。 三大组织障碍: · 人员阻力,认知冲突:不同层级对AI的认知存在显著差异,造成内部沟通不畅、协作困难,形成第一 道认知鸿沟。 · 组织阻力,部门墙高耸:AI的本质是提升效率,但传统组织依赖信息差维持管理权威,中层管理者担 忧权利被架空;数据难以跨部门共享,流程无法打通,导致"数据拿不到,流程跑不通";员工普遍害怕 被AI替代,产生焦虑情绪。 · 能力阻力,无法落地:技能短板明显,技术买来却不会用,是许多企业的现实写照。 三大技术障碍: · 场景难:在企业里面,找到大模型的应用场景难,懂技术的IT人不懂业务,懂业务的可能不懂大模型 技术。 · 应用难:大模型应用有较高的技术门槛,企业自己的IT人员很难 ...
华为昇腾、寒武纪宣布适配DeepSeek最新模型
21世纪经济报道· 2025-09-30 18:19
9月29日,DeepSeek-V3.2-Exp模型正式发布。 V3.2-Exp在V3.1-Terminus的基础上首次引入了团队自研的DeepSeek Sparse Attention (一种稀疏注意力机制,DSA),针对 长文本的训练和推理效率进行了探索性的优化和验证。 DSA是一种针对Transformer架构的优化技术。在大语言模型的技术机制中,注意力机制是一个核心组件,决定了模型如何 在文本序列中聚焦关键信息,实现语义理解与生成。 简单对比来看,在Transformer架构中,传统的注意力机制是"稠密的",处理长文本时计算量会呈指数级增长。DSA则是一 种"稀疏"方案,更高效,成本也更低。 得益于新模型服务成本的大幅降低,DeepSeek API的价格也大幅下调50%以上。 除技术创新与价格"腰斩"外, DeepSeek此次开源TileLang版本算子,同样引发业内高度关注。 实验版本 当日更早时候,有不少业内人士注意到,DeepSeek将 v3.2-base 上传至DeepSeek在社区平台HuggingFace的官方页面,但很 快被删除。此后,DeepSeek正式公告新版本DeepSeek-V3. ...
讯飞创投徐景明:投资聚焦AI主赛道,与70%被投实现产业协同
21世纪经济报道· 2025-09-30 17:45
21世纪经济报道记者 申俊涵 报道 面对瞬息万变的科技浪潮和早期投资的新格局,创投机构如何把握其中投资机遇,又如何通过赋能撬动 企业实现长期价值增长? 近日,在2025(第十九届)DEMO CHINA活动上,科大讯飞联合创始人、讯飞创投董事长徐景明结合 讯飞创投的实践经验,就上述问题给出了答案。 徐景明曾任科大讯飞高级副总裁、董事会秘书,负责公司IP0、再融资、并购及战略合作。他拥有20多 年创业、上市公司规范治理、资本运作和创业投资经验,曾主导投资过寒武纪、商汤、优必选、中科海 光、银河通用机器人等公司。 他结合创业与投资经验提出,讯飞创投的投资逻辑主要是做好两方面。一是核心发力,面向未来:聚焦 AI 主赛道,借漏斗模型与产业视角精准筛选项目;二是双向赋能,共建生态:讯飞创投目前与70%的 被投企业都实现了产业协同,始终致力于AI+生态的全面建设。 投资聚焦AI主赛道 团队以漏斗模型筛选项目,一是有优秀的流量入口;二是能够有非常清晰地算法,把不合格的项目筛出 去;三是提供真正的赋能。"在这样的漏斗模型中,每一个地方比别人高出20%-30%的成功概率,你就 有更高的概率走向成功。"徐景明说。 "硬科技时代和互 ...
Edgen Launches Multi‑Agent Intelligence Upgrade to Unify Crypto and Equity Analysis
Yahoo Finance· 2025-09-30 17:37
Hong Kong, Hong Kong, September 30th, 2025, FinanceWire Edgen, the AI platform that unites stocks and crypto into a single intelligence layer, today announced a major upgrade that transforms how investors interact with markets. This release marks a step toward Edgen’s vision of a transparent, collaborative financial ecosystem, where investors, developers, and protocols can operate on the same intelligent foundation. Investors today face fragmented markets and overwhelming data. Edgen offers a unified p ...
历史性一刻!阿里通义7大模型霸榜全球开源前十,几乎实现“屠榜”【附大模型行业市场分析】
前瞻网· 2025-09-30 17:24
阿里通义模型技术突破 - 阿里通义家族模型在全球开源榜单前十中占据七个席位 其中全模态大模型Qwen3-Omni登顶开源榜首 [2] - Qwen3-Omni为全球首个集文本、图像、音频、视频四大能力于一身的单模型 在32项音视频基准中取得开源SOTA 可直接部署于终端设备 [2] - 其他六款上榜模型覆盖视觉理解、图像编辑、动作生成及深度研究等细分场景 形成从通用到垂直的完整矩阵 [2] - 阿里通义已开源300余个模型 全球下载量突破6亿次 衍生模型超17万个 稳居全球开源生态首位 [2] 中国大模型行业发展环境 - 中国大力支持大模型发展 从中央到地方出台专项规划、算力券与亿元级基金 将大模型纳入新基建和人工智能+行动 [3] - 政策支持包括建设八大国家算力枢纽、开放高价值数据、提供千万张GPU/ASIC算力券及模型备案绿色通道 [3] - 对突破千亿参数、实现国际领先的首创模型给予最高亿元资金奖励和场景落地支持 [3] - 在政策红利和市场需求下 中国大模型数量已跃居全球第二 截至2024年第一季度累计发布478个大模型 [3] 行业投资与竞争格局 - 2021至2024年大模型行业投融资金额从54.84亿元人民币飙升至147.56亿元人民币 [4] - 自DeepSeek开源后 阿里、百度、腾讯等企业纷纷跟进开源 形成既开源又比拼速度的竞争格局 [5] - 通过开源社区共享代码与数据 企业可快速迭代优化技术 有望助力中国在AI领域缩小与美国的差距 [5] 行业技术演进趋势 - 大模型行业正从对参数规模的盲目崇拜转向对真实价值的务实追寻 模型开发转向追求精而非大 [5] - 行业更关注推理结构、稀疏激活、性价比和部署效率 算力成本压力推动企业重新评估投入产出比 [5] - 数据质量在垂直领域的权重超过数据规模 数据比参数更重要 [5]