Artificial Intelligence

搜索文档
深夜炸场!Claude Sonnet 4.5上线,自主编程30小时,网友实测:一次调用重构代码库,新增3000行代码却运行失败
AI科技大本营· 2025-09-30 18:24
整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 双节小长假将近,国内国外大模型公司闻风而动,赶在正式放假前让众人"小卷"一波。这不,继昨晚 DeepSeek 发布 DeepSeek V3.2-Exp 之后, Anthropic 又在今天带来了全新升级的 Claude Sonnet 4.5 版本,号称"世界上最好的编码模型"。 最强的编码模型 Claude Sonnet 4.5 来了:可自主持续运行 30 小时 根据官方测试结果显示,Claude Sonnet 4.5 在 SWE-bench Verified 评测里拿下了顶级成绩,这个测试主要看模型在真实世界里写代码的水平。 同时,Sonnet 4.5 在推理和数学等多项测试中也有大幅提升。从下图看出,在 Agentic Coding、Agentic Tool Use 等测试中 Claude Sonnet 4.5 远 超过更昂贵的 GPT-5、Gemini 2.5 Pro 等竞品模型。 实际测试中, Claude Sonnet 4.5 能在复杂的多步骤任务上坚持专注 超过 30 个小时。 相比此前 Opus 4 运行 7 小时左右的时间, Cla ...
零一万物联创沈鹏飞:生成式AI下半场是“一把手工程”,破局需跨越6大鸿沟
中金在线· 2025-09-30 18:22
9月25日,在零一万物华东数智大会上,零一万物联合创始人沈鹏飞首度官宣亮相,并发表了主题为"跨 越生成式人工智能商业化鸿沟"的演讲。沈鹏飞表示,"生成式AI已经过了'讲故事'的阶段,进入了'做实 事'的新阶段。从模型战争转向应用落地,从训练时代迈向推理时代,谁能真正把AI嵌入业务流程、变 成增长引擎,谁就赢了下半场。" 在沈鹏飞看来,当前生成式AI在企业端落地面临挑战的核心原因,在于三大组织障碍与三大技术障 碍。 三大组织障碍: · 人员阻力,认知冲突:不同层级对AI的认知存在显著差异,造成内部沟通不畅、协作困难,形成第一 道认知鸿沟。 · 组织阻力,部门墙高耸:AI的本质是提升效率,但传统组织依赖信息差维持管理权威,中层管理者担 忧权利被架空;数据难以跨部门共享,流程无法打通,导致"数据拿不到,流程跑不通";员工普遍害怕 被AI替代,产生焦虑情绪。 · 能力阻力,无法落地:技能短板明显,技术买来却不会用,是许多企业的现实写照。 三大技术障碍: · 场景难:在企业里面,找到大模型的应用场景难,懂技术的IT人不懂业务,懂业务的可能不懂大模型 技术。 · 应用难:大模型应用有较高的技术门槛,企业自己的IT人员很难 ...
华为昇腾、寒武纪宣布适配DeepSeek最新模型
21世纪经济报道· 2025-09-30 18:19
9月29日,DeepSeek-V3.2-Exp模型正式发布。 V3.2-Exp在V3.1-Terminus的基础上首次引入了团队自研的DeepSeek Sparse Attention (一种稀疏注意力机制,DSA),针对 长文本的训练和推理效率进行了探索性的优化和验证。 DSA是一种针对Transformer架构的优化技术。在大语言模型的技术机制中,注意力机制是一个核心组件,决定了模型如何 在文本序列中聚焦关键信息,实现语义理解与生成。 简单对比来看,在Transformer架构中,传统的注意力机制是"稠密的",处理长文本时计算量会呈指数级增长。DSA则是一 种"稀疏"方案,更高效,成本也更低。 得益于新模型服务成本的大幅降低,DeepSeek API的价格也大幅下调50%以上。 除技术创新与价格"腰斩"外, DeepSeek此次开源TileLang版本算子,同样引发业内高度关注。 实验版本 当日更早时候,有不少业内人士注意到,DeepSeek将 v3.2-base 上传至DeepSeek在社区平台HuggingFace的官方页面,但很 快被删除。此后,DeepSeek正式公告新版本DeepSeek-V3. ...
讯飞创投徐景明:投资聚焦AI主赛道,与70%被投实现产业协同
21世纪经济报道· 2025-09-30 17:45
21世纪经济报道记者 申俊涵 报道 面对瞬息万变的科技浪潮和早期投资的新格局,创投机构如何把握其中投资机遇,又如何通过赋能撬动 企业实现长期价值增长? 近日,在2025(第十九届)DEMO CHINA活动上,科大讯飞联合创始人、讯飞创投董事长徐景明结合 讯飞创投的实践经验,就上述问题给出了答案。 徐景明曾任科大讯飞高级副总裁、董事会秘书,负责公司IP0、再融资、并购及战略合作。他拥有20多 年创业、上市公司规范治理、资本运作和创业投资经验,曾主导投资过寒武纪、商汤、优必选、中科海 光、银河通用机器人等公司。 他结合创业与投资经验提出,讯飞创投的投资逻辑主要是做好两方面。一是核心发力,面向未来:聚焦 AI 主赛道,借漏斗模型与产业视角精准筛选项目;二是双向赋能,共建生态:讯飞创投目前与70%的 被投企业都实现了产业协同,始终致力于AI+生态的全面建设。 投资聚焦AI主赛道 团队以漏斗模型筛选项目,一是有优秀的流量入口;二是能够有非常清晰地算法,把不合格的项目筛出 去;三是提供真正的赋能。"在这样的漏斗模型中,每一个地方比别人高出20%-30%的成功概率,你就 有更高的概率走向成功。"徐景明说。 "硬科技时代和互 ...
历史性一刻!阿里通义7大模型霸榜全球开源前十,几乎实现“屠榜”【附大模型行业市场分析】
前瞻网· 2025-09-30 17:24
(图片来源:摄图网) 不久前,零一万物CEO李开复表示,DeepSeek带来了中国开源时代。自DeepSeek开源后,阿里、百度、腾 讯等企业纷纷跟进,形成"既开源、又比拼速度"的竞争格局。通过开源社区共享代码与数据,企业可以借鉴 他人的成功经验,快速迭代和优化自己技术,避免重复造轮子,从而有望助力中国在AI领域缩小与美国的 差距。 北京金融科技产业联盟理事王维指出,大模型行业正经历一场静水流深的转向,从对参数规模的盲目崇拜, 转向对真实价值的务实追寻。模型开发不再追求"大",而是转向追求"精", 现在,人们不再一味追求模型 参数规模,而是更关注推理结构、稀疏激活、性价比和部署效率。王维认为,算力成本压力正推动企业重新 评估投入产出比,而且数据比参数更重要,数据质量在垂直领域的权重甚至超过数据规模。 9月28日,全球最大AI开源社区Hugging Face发布最新榜单:阿里通义家族"七箭齐发",一举包揽全球开源 前十模型中的七个席位,几乎实现"屠榜"。其中,刚刚发布的全模态大模型Qwen3-Omni更是强势登顶,成 为新的开源王者。 Qwen3-Omni集文本、图像、音频、视频四大能力于一身,在32项音视频基 ...
Anthropic发布最强编码模型Claude Sonnet 4.5,可自主编码30小时
36氪· 2025-09-30 17:17
划重点: 当地时间9月29日,人工智能初创公司Anthropic正式推出新一代AI模型Claude Sonnet 4.5,宣称其为全球最先进、最安全的编码及复杂软 件智能体构建模型。 该模型在长周期任务处理上有所改进,可独立运行30小时完成从开发到安全审计的全流程工作,在SWE-bench Verified等权威测试中达到 最优水平。同时,Anthropic 升级开发者生态,推出Claude Agent SDK等工具,并为Max订阅用户开放 "用 Claude 想象" 临时预览功能, 支持实时生成软件演示。 Claude Sonnet 4.5定价延续前代标准,每百万输入Tokens 3美元,每百万输出Tokens 15美元,开发者无需额外成本即可升级。 当前AI编码领域竞争已进入白热化阶段,Anthropic面临多强并立的竞争态势:OpenAI已推出专注智能体编码的GPT-5-Codex,谷歌 Gemini则凭借出色的问题解决能力站稳脚跟。Anthropic在今年8月刚推出Claude Opus 4.1,在5月推出Claude Sonnet 4,如此快速的迭代节 奏,既凸显了当前AI领域的激烈竞争态势,也意味 ...
OpenAI拟推Sora 2独立APP,功能和界面设计与TikTok高度相似
36氪· 2025-09-30 17:17
OpenAI首席执行官山姆·奥特曼 9月30日消息,据知情人士披露,OpenAI正筹备发布下一代视频生成模型Sora 2,并计划推出一款独立移动应用。该应用在功能与界面设 计上与TikTok高度相似,旨在推动AI视频生成技术走向大众市场。 与此同时,OpenAI正深陷多起版权侵权诉讼,其中《纽约时报》提起的诉讼备受关注。该案核心指控为OpenAI在模型训练过程中使用了 该报受版权保护的材料。据报道,即便是当前阶段,Sora 2应用在内容生成时,也常因版权保护及其他过滤机制而拒绝生成部分视频。 除版权问题外,OpenAI在儿童安全领域也面临着日益增多的批评声音。9月28日,该公司发布了全新的家长控制功能,包括父母与青少 年账户关联选项,并表示正开发一款年龄预测工具,可自动将未满18岁的用户引导至功能更受限的ChatGPT版本。目前尚不清楚Sora 2应 用将采取何种年龄限制措施。 根据《连线》杂志获取的文件,OpenAI即将推出的名为"Sora 2 App"的独立应用将采用垂直视频流形式,搭配类似TikTok的滑动导航交 互方式。用户通过该应用可创建最长10秒的视频片段,应用内设有由推荐算法驱动的"为你推荐"页 ...
Did Elon Musk Just Say "Checkmate" to Amazon?
The Motley Fool· 2025-09-30 17:15
Elon Musk just expressed some choice words over Anthropic, a key partner to Amazon.Rivalries have existed for as long as history can remember. In today's world, we often associate them with sports -- where players, and by extension, the fans -- trade barbs during tense competition. What's more surprising, though, is how similar rhetoric emerges in the corporate arena from time to time.In recent weeks, Palantir Technologies CEO Alex Karp all but declared a decisive victory over his company's competition. Sal ...
Top A.I. Researchers Leave OpenAI, Google and Meta for New Start-Up
Nytimes· 2025-09-30 17:03
Founded by a co-creator of ChatGPT, Periodic Labs aims to build artificial intelligence that can accelerate discoveries in physics, chemistry and other fields. ...
粤港澳大湾区创业大赛闭幕,深圳奖项数居各城市榜首
南方都市报· 2025-09-30 16:49
"政策+服务+资源",构建创业全周期支持网络 为支持创业者成长,人社部门通过"政策+服务+资源"创业矩阵,构建起覆盖创业全周期的支持网络。 9月27日,粤港澳大湾区创业大赛总决赛在佛山举办,150个优秀创业项目展开最终角逐。深圳共47个项 目入围决赛,最终取得2个特等奖、8个金奖、12个银奖和10个铜奖,成为获奖数最多的城市。 大赛设立人工智能与机器人、集成电路与低空经济、医药健康与生物制造、食品科技与现代农业、现代 服务与文化创意等五大核心赛道。自5月启动以来,共吸引海内外超7000个创业项目报名,各赛道经过 初赛、复赛,选拔出150支优秀团队成功晋级全国总决赛。 据统计,所有报名项目中来自深圳市的项目有1134个,占比达15.9%;晋级本次决赛的150个项目中, 47个来自深圳,占比超过30%。其中,"下一代心腔超声成像系统""新型二氧化碳捕集与转化应用技 术"分获医药健康与生物制造赛道、现代服务与文化创意赛道特等奖,将50万元大奖收入囊中。深圳在 人工智能与机器人赛道表现还十分抢眼,取得2金4银4铜的好成绩,充分展现深圳作为全国创新创业之 城的强劲实力。 以赛为媒,构建全链条创业生态 由深圳承办的集成电 ...