Workflow
Seek .(SKLTY)
icon
搜索文档
R2还没来,但DeepSeek的秘密武器已经“剧透”了
虎嗅· 2025-07-31 15:58
DeepSeek R2还没来,但DeepSeek下一代模型的更新,已经提前在今年的ACL最佳论文中"剧透"了。 昨天,全球自然语言处理领域的顶级会议ACL公布了今年的最佳论文。 这个会议堪称自然语言处理领域的"世界杯",不仅是未来一两年大语言模型的风向标,而且从这里走出的顶尖技术,往往会迅速被全行业采纳。当年颠覆 了整个AI领域的Transformer架构,最初就是在这里崭露头角的。 而今年,一篇由DeepSeek和北京大学联合完成的论文斩获了"最佳论文奖":《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》。 从标题就能看出,这是一篇非常硬核的技术论文,关键词密度拉满:Sparse Attention(稀疏注意力)、Hardware-Aligned(硬件对齐)、Trainable(可训 练)…… 但即便如此,它依然值得所有关注大模型未来的人认真读一遍,因为它首次把稀疏注意力从理论推理带进了完整训练流程,在保持模型性能的同时,还带 来了高达11倍的推理加速。 论文第一作者北京大学硕转博研究生袁境 ...
刚刚,DeepSeek梁文锋NSA论文、北大杨耀东团队摘得ACL 2025最佳论文
36氪· 2025-07-31 11:40
在这届 ACL 大会上,华人团队收获颇丰。 ACL 是计算语言学和自然语言处理领域的顶级国际会议,由国际计算语言学协会组织,每年举办一次。一直以来,ACL 在 NLP 领域的学术影响力都位列 第一,它也是 CCF-A 类推荐会议。今年的 ACL 大会已是第 63 届,于 2025 年 7 月 27 日至 8 月 1 日在奥地利维也纳举行。 今年总投稿数创历史之最,高达8000多篇(去年为 4407 篇),分为主会论文和 Findings,二者的接收率分别为 20.3% 和 16.7%。 根据官方数据分析,在所有论文的第一作者中,超过半数作者来自中国(51.3%),而去年不到三成(30.6%)。紧随中国,美国作者的数量排名第二, 但只占 14.0%。 今年共评选出 4 篇最佳论文,2 篇最佳社会影响力论文、3 篇最佳资源论文、3 篇最佳主题论文、26 篇杰出论文,2 篇 TACL 最佳论文、1 篇最佳 Demo 论 文以及 47 篇 SAC Highlights。 以下是具体的获奖信息。 最佳论文奖 论文摘要:算法公平性传统上采用了种族色盲(即无差异对待)这种数学上方便的视角。然而,该团队认为,在一系列重要的情 ...
大厂「AI」智能体,等待 DeepSeek 时刻
36氪· 2025-07-31 07:56
WAIC 2025 与 AI 行业格局 - 2025 年世界人工智能大会(WAIC)全网流量达 23.6 亿,同比增长 21.6%,但 OpenAI 的 GPT-5 和 DeepSeek 的 V4 或 R2 模型未亮相 [2] - AI 行业由互联网大厂主导,抖音、腾讯、阿里和百度构成第一梯队,去重用户规模分别为 12.66 亿、12.48 亿、11.68 亿、11.05 亿 [2] - AI 应用市场 TOP30 应用中,80% 来自互联网企业,四大集团占据 66.7% 的份额;原生 APP 增长前三为 DeepSeek、豆包和腾讯元宝 [2] AI 应用类型与插件趋势 - AI 插件规模增长趋势高于原生 App 和 AI PC 网页,因传统 App 通过接入 DeepSeek 分流原生 App 流量 [4] - AI 应用插件规模前三为百度 AI、抖音 AI 搜和微信 AI 搜 [4] Agent 技术发展与行业焦点 - Agent 是使用 AI 能力帮助人类规划并执行任务的应用系统,解决复合型问题,行业进入以智能体应用为核心的下半场 [5] - 互联网大厂重点加速 B 端 Agent 在具体场景落地,需兼顾通用能力与场景化聚焦 [5] 腾讯的 Agent 战略与产品 - 腾讯在 WAIC 展示 10 多个垂直领域智能体,覆盖健康管理、营销、旅游攻略和代码诊断等场景 [6] - 推出具身智能开放平台 Tairos(钛螺丝),为机器人提供多模态感知和规划模型,但需验证商业化可行性 [6][7] 阿里的 Agent 实践与落地 - 阿里云百炼应用开发平台获“镇馆之宝”奖,超 20 万开发者创建 70 多万个 Agent 应用 [7] - 企业构建 AI 应用多选择改造现有业务,将业务入口从传统服务改为 AI Agent [8] - 阿里国际智能退款 Agent 节约纠纷处理时长 30%,降低退款成本 15%;瓴羊退换货 Agent 缩短处理时长 60%,提升人工效率 60% [11] 字节跳动的开源与商业化 - 火山引擎开源 AI Agent 开发平台扣子(Coze Studio 和 Coze Loop),三天内 GitHub stars 数破万和超 3000 [12][13] - 火山引擎 2025 年智能体中标金额达 1.55 亿,中标数量蝉联第一;2024 年营收超 120 亿,2025 年目标超 250 亿 [16][17] - 企业案例包括为爱玛电动车打造四类 AI 场景、北大光华智能体“豆角”和海亮集团 150 个智能体 [15] 百度的 Agent 布局与挑战 - 百度侧重通用性 Agent,推出“多智能体协同”平台秒哒,一季度应用数超 20 万 [18] - 上线移动端通用超级智能体 App“心响”,但 ToC 方向未突破,公测后减少投入 [19] - B 端聚焦场景化,推出新一代数字人技术 NOVA,具备交互和对话能力,试点教育和医疗行业 [20] Agent 商业化与行业竞争 - Agent 商业化竞争激烈,火山引擎、阿里云和百度云在中标数量和金额上领先 [16] - C 端 Agent 市场空间大,B 端需结合具体场景推动规模化普及,成为生产力工具 [21]
DeepSeek冲刺北交所上市,未来5年战略投资算力租赁,构建AI基础设施生态
搜狐财经· 2025-07-30 15:50
公司上市计划 - 人工智能独角兽企业DeepSeek宣布启动北交所IPO进程 预计2025年11月正式上市 [1] 公司战略规划 - 未来5年核心战略聚焦算力租赁业务 计划投资30亿元建设自主可控的高性能计算中心 [1] - 联合国产芯片厂商打造定制化AI算力解决方案 [1] 业务合作进展 - 已与华为昇腾 寒武纪等国产芯片企业达成战略合作 [3] - 算力租赁平台支持大模型训练 自动驾驶仿真等高算力需求场景 [3] 市场前景预期 - 上市将加速中国AI算力基础设施国产化进程 [3] - 有望在未来3-5年内占据国内35%以上市场份额 [3]
DeepSeek真的不行了吗
36氪· 2025-07-30 11:32
DeepSeek用户数据下滑的消息为国产AI进度条蒙上一层阴影,再加上知名AI智能体公司 Manus把总部迁移至新加坡,人们对国产AI的前景难免出现一些悲观情绪。 但我们或许没 必要因为DeepSeek一时的流量下滑,而对国产AI过于悲观。 DeepSeek在2025年年初震撼全球的光环,如今似乎正在褪色。 这几天,"DeepSeek不行了吗"登上多个热搜的榜单。行业分析机构QuestMobile的最新数据显示, DeepSeek的月均下载量从第一季度的8111.3万降至2258.9万,降幅达72.2%。在此之前,国际知名半导 体研究机构 Semianalysis也发布数据称,DeepSeek使用率由年初时7.5%的高点下滑到如今的3%。 市场对DeepSeek的悲观预期确实存在,这主要与DeepSeek的更新版本R2"爽约",未能即时发布有关。 再加上DeepSeek经常"胡说八道"的高幻觉率,也劝退了许多用户。 DeepSeek用户数据下滑的消息为国产AI进度条蒙上一层阴影,再加上知名AI智能体公司Manus把总部迁 移至新加坡,人们对国产AI的前景难免出现一些悲观情绪。 但我们或许没必要因为DeepSe ...
DeepSeek流量暴跌,要凉了?是它幻觉太严重还是它在闷声发大财?
36氪· 2025-07-29 07:45
核心观点 - DeepSeek从"国运级"项目到月下载量暴跌72.2%,用户对其生成"幻觉"内容和"AI味儿"表达不满情绪高涨 [1][12][15] - 大模型存在逻辑暴力、数据代谢病、训练语料不足等深层问题,导致输出内容机械化和虚构化 [16][17][22] - 用户需掌握识破幻觉、压力测试逻辑、感知AI黑话三项能力以对抗平庸化 [23][24] 用户反馈与市场表现 - DeepSeek月均下载量从8111.3万骤降至2258.9万,降幅72.2% [1] - 社交媒体涌现"去AI味儿"话题,用户吐槽生成内容包含虚构建议(如"南极科考"挽回感情)、伪造商家及文献 [2][8][9] - 学术场景中,论文写作被批"机器人拼积木",过度使用连接词和程式化短语 [15][16] 技术缺陷分析 - 逻辑暴力:过度依赖"首先/其次"等连接词和短句,割裂叙事节奏 [16] - 数据代谢病:30%的AI生成内容反哺训练池,导致语言多样性荒漠化 [16][17] - 训练语料缺陷:中文优质语料占比不足5%,CSSCI期刊数字化率仅30% [22] 行业共性问题 - 大模型普遍存在"致幻"现象,如GPT-4V在违和场景中准确率从80%降至66% [20] - 语言模块压制视觉信号修正,导致先验知识凌驾于现实输入 [21] - 内容审查机制扩大敏感词库,迫使输出趋向安全但平庸的表达 [22] 解决方案建议 - 交叉核验关键数据,利用CNKI等权威数据库检索 [23] - 要求模型用反例自辩,打破逻辑暴力限制 [23] - 锚定时空法定位内容,如追问"理论首见期刊年份" [23] 行业价值与展望 - AI在信息整理、概念解释、创新实验等领域仍具不可替代性 [24] - 人机交互中保留5%非优化回答可增强人性化体验 [25]
燧原科技发布DeepSeek一体机
快讯· 2025-07-28 11:21
燧原科技新产品发布 - 燧原科技在WAIC大会上展示最新DeepSeek一体机 [1] - 产品以低门槛和高效率为特点吸引众多参观者 [1] - 该产品成为会场焦点 [1] 产品定位与目标 - 一体机旨在降低人工智能技术应用门槛 [1] - 产品设计目标为提高企业研发效率 [1] - 为行业带来新的解决方案 [1]
半年不到DeepSeek已跌落神坛?透视DeepSeek暴跌背后的多重真相
搜狐财经· 2025-07-26 09:37
核心观点 - DeepSeek月均下载量从8000多万次骤降至2000多万次,跌幅达72.2%[1] - 下载量暴跌是平台策略调整、用户行为变化和市场结构演变共同作用的结果[1] - 公司正经历从"流量爆款"向"价值平台"转型的关键阶段[5][6] 官方下载量锐减分析 - 官方App下载量断崖式下跌,但用户通过第三方平台间接调用模型的现象增加[2] - 模型API被高频嵌入编程平台、智能写作软件和企业定制化应用中[2] - 实际模型调用量可能未减少,而是以更隐蔽方式融入生产力工具[2] 市场策略调整 - 战略重心从C端转向B端市场,包括企业服务、教育机构和技术社区[3] - 收紧C端推广预算,换取专业圈层更高口碑和用户粘性[3] - 深耕法律文书生成、科研分析、财务模型构建等高价值领域[3] 用户体验与竞争 - 模型更新节奏保守,在代码生成、多轮推理等关键能力上未形成压倒性优势[4] - 产品生态系统完善度不足,插件丰富度和外部工具集成能力有待提升[4] - 中文处理能力保持优势,但面临GPT-4、Claude等竞争对手压力[4] 未来展望 - 需完成从"明星项目"到"持续交付价值平台"的转型[5] - 技术实力、资金资源和战略布局需深度协调[5] - 若能在冷静期稳住核心技术并优化体验,仍有机会实现商业突破[6] 数据解读 - 下载量暴跌72.2%反映用户行为分流和平台主动调整[6] - 价值沉淀比流量数据更能体现长期发展潜力[8] - 下一季度表现将成为重要观察指标[8]
恒指公司:恒生科指过去一年涨超53% DeepSeek模型成关键催化剂
智通财经网· 2025-07-25 11:46
恒生科技指数表现 - 恒生科技指数在2024年录得近19%的升幅后,2025年进一步延续升势,截至2025年7月18日,今年再涨24% [1] - 过去一年恒生科技指数累计升幅超过53%,跑赢恒生综合指数12个百分点 [1] - 科指升势主要受DeepSeek推出成本效益大型语言模型(LLM)带动,市场对中国人工智能乐观情绪升温 [1] - 科指已收复2025年4月因贸易局势紧张导致的跌幅 [1] - 科指1年年化波动率达41%,高于恒生综指的28% [1] 追踪恒生科技指数的ETP发展 - 截至2025年6月底,追踪科指的ETP资产管理总值(AUM)达263亿美元,较2024年底上升35% [2] - 2021至2025年ETP的AUM累计涨幅达362% [2] - 目前共有29支以科指为基准的ETP在13个交易所上市,是恒生指数系列中追踪范围最广的指数 [2] - 股票互联互通机制下,有17支ETF符合南向交易资格,其中5支追踪科指,为最多南向合资格ETF追踪的指数 [2] 恒生科技指数期货表现 - 2025年上半年科指期货平均每日成交量(ADV)达17.2万张合约,较2024年增长44% [3] - 自2020年推出以来,科指期货ADV累计涨幅达97倍 [3] - 科指期货占香港整体期货市场份额22%,仅次于恒指期货及国指期货 [3]
DeepSeek月均下载量暴跌72.2%!周鸿祎:梁文锋不屑于做APP,他把技术全都开源免费【附大模型行业市场分析】
前瞻网· 2025-07-25 09:34
DeepSeek下载量变化 - 2025年二季度月均下载量从一季度的8111.3万骤降至2258.9万,降幅达72.2% [2] - 用户流失主要因第三方平台分流,59.2%转向百度App,38.6%转向豆包App [2] - 阿里、字节、百度等大厂推出低价同类API进一步挤压市场空间 [2] DeepSeek开源策略与行业影响 - 采用低成本高性能开源模式,训练成本仅600万美元+2048块H800 GPU [3] - 开源推动第三方平台开发更优质服务,加速AI技术普及 [3] - 创始人梁文锋专注AGI研发而非流量变现,技术全开源免费 [4] 国内大模型竞争格局 - 截至2024年4月国内推出305个大模型,其中10亿参数以上达254家 [4] - 百度文心4.5性能超GPT4.5但API价格仅1%,文心X1价格约为DeepSeek-R1一半 [5] - 主流模型特点:文心系列侧重综合能力,通义千问采用混合推理,DeepSeek-R1数学推理强且成本为国际模型1/10 [6] 技术成本优势与行业应用 - DeepSeek-R1推理成本为OpenAI的1/30 [5] - AI大模型成为城市规划和工业革新核心驱动力,提升动态规划与决策效率 [7] - 轻量化、低成本化趋势加速行业大模型开发与规模化应用 [9]