Workflow
DeepSeek
icon
搜索文档
新华网视评丨我们需要怎样的创新,新华网连发三评
新华社· 2025-06-13 18:03
中国科技企业创新现状 - 中国科技公司在全球崭露头角,如DeepSeek、宇树机器人、大疆和《黑神话:悟空》等成为行业引领者 [2] - 新兴企业通过自主创新突破行业瓶颈,而非等待观望 [2] - 行业前沿企业如DeepSeek、宇树科技和大疆均强调持续创新的重要性 [3] 创新与竞争 - 创新是行业发展的核心动力,企业需不断突破技术边界 [3] - 诺基亚因错失转型机会而衰落,凸显创新滞后风险 [3] - 华为、小米、苹果等品牌通过持续创新占据市场主导地位 [3] 创新生态与失败价值 - 创新需要宽容失败的环境,以促进试错和学习 [4] - 华为创始人任正非强调宽容"歪瓜裂枣"对创新的重要性 [4] - 科技发展史表明,失败是成功的重要阶梯 [4] 创新预期与实现路径 - 创新需避免急于求成,应循序渐进 [5] - "行者二号"机器人通过十年技术迭代取得突破 [6] - 国产大飞机、深海探测器、新能源汽车等成就源于长期科研积累 [6] 创新生态的长期建设 - 中关村通过制度优化实现从电子卖场到科创高地的转型 [6] - 中望CAD用二十年完成工业软件国产化替代 [6] - 科技创新需平衡紧迫感与长期定力,实现从跟跑到领跑的转变 [6]
CSDN 创始人蒋涛:“码盲”消失,新程序员崛起
AI科技大本营· 2025-06-13 15:51
AI行业变革 - ChatGPT以17个月达到8亿用户成为史上增长最快的应用[7] - AI公司收入暴涨,Cursor成为最快突破5亿美金收入的SaaS公司[7] - DeepSeek登顶全球100多个国家,推动AI平权化[1][7] 三座技术霸权 - **算力霸权**:CUDA对中国禁运,华为推CANN、AMD推ROCm、Intel推oneAPI进行破局[8] - **模型霸权**:OpenAI封闭模式受质疑,DeepSeek和阿里巴巴开源打破垄断[9] - **数据霸权**:英文语料主导全球数据,需建立多元开放数据集(如欧洲LAION项目)[9] 开发者生态重构 - GitHub开发者数量达1.9亿,年增长20%[11] - AI Coding变革传统编程,手动代码工作将被AI替代[11] - "码盲"消失,产品经理可独立开发应用(如"小猫补光灯"案例)[12][13] - 超级程序员生产力提升10倍,Agent Engineer成稀缺人才[15] 中国AI机遇 - 硬件成本降低:50元BOM成本即可接入大模型能力(ESP32芯片案例)[17] - 制造业优势:3D打印技术结合AI,创业团队两年收入达2亿美金[17] - AI重写硬件与软件,推动"义乌小商品"智能化改造[17] 技术栈与全球化 - 从Global AI转向Local AI,满足各国数据自主需求[10] - 开源系统联合对抗技术霸权,构建本地化技术栈[8][9]
百瑞赢时事新闻解析
搜狐财经· 2025-06-13 14:39
跨国企业持续加码中国 - 中国发展高层论坛2025年年会吸引21个国家86名跨国企业代表参会,首次参会企业数量创新高,反映国际资本对中国市场的坚定信心 [2] - 跨国企业投资重点加速从传统制造业向高科技领域转移,如DeepSeek等前沿科技企业和"杭州六小龙"新兴科技集群的崛起 [2] - 中国完整的产业体系配套和创新链与产业链深度融合,为科技、制造等领域创造新增长点 [3] - 中国庞大的市场规模和消费者对高品质创新产品的需求为新技术商业化提供理想环境 [3] 美联储四年首降息 - 美联储宣布将联邦基金利率目标区间下调50个基点至4.75%-5.00%,为四年来首次降息 [4] - 降息基于美国CPI同比涨幅收窄至2.5%和劳动力市场疲软迹象(7月裁员人数激增) [4] - 预计2024年底联邦基金利率降至4.25%-4.5%,2025年和2026年分别降至3.4%和2.9% [4] - 降息有助于降低企业和个人融资成本,刺激投资与消费,提升市场流动性 [5] 金价飙升创新高 - 国际现货黄金价格突破3060美元/盎司,创历史新高,年内涨幅超16% [6] - 国内足金饰品价格突破920元/克,部分品牌将于4月1日调整"一口价"黄金饰品价格 [6] - 建设银行、招商银行、宁波银行等机构提高积存金起购标准,反映黄金投资需求增长 [6] - 金价上涨主因包括全球经济不确定性增加、各国央行增持黄金和美元走势变化 [7] 油价波动频繁 - 国际原油期货价格较3月低点累计反弹17.3%,布伦特原油突破84美元/桶 [8] - 4月30日24时国内92汽油或上涨0.11元/升,柴油涨幅0.12元/升 [8] - 油价波动受供求关系(全球经济形势、产油国政策)、地缘政治和货币政策影响 [9] - 高油价增加企业生产成本(如化工、钢铁行业),并可能引发物价普涨 [10]
1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版
机器之心· 2025-06-13 12:31
开源LLM推理引擎优化 - vLLM是由加州大学伯克利分校团队开发的高性能开源LLM推理和服务引擎,旨在提升LLM的推理速度和资源利用率,兼容Hugging Face等流行模型库[2] - vLLM通过创新的PagedAttention注意力机制实现方案,使GPT、Mistral、LLaMA等主流模型系列运行更快且消耗更少资源[3] - DeepSeek AI研究者俞星凯开发了轻量级vLLM实现Nano-vLLM,代码简化至1200行,在GitHub上获得200多Star[4][5] Nano-vLLM技术特性 - Nano-vLLM具备三大核心功能:快速离线推理(速度与vLLM相当)、易读代码库(Python代码少于1200行)、优化套件(提供Prefix缓存、Torch编译等功能)[6][7][8] - 基准测试显示,Nano-vLLM与vLLM输出token相同(133,966个),时间略长(101.90秒 vs 98.95秒),吞吐量稍低(1314.65 tokens/s vs 1353.86 tokens/s)[11] - 测试配置为RTX 4070硬件、Qwen3-0.6B模型,256个序列请求,输入输出长度在100-1024 tokens间随机采样[10] 开发者背景 - Nano-vLLM开发者俞星凯现任DeepSeek深度学习系统工程师,参与过DeepSeek-V3和DeepSeek-R1开发[13] - 曾就职于腾讯、幻方(DeepSeek母公司)和字节跳动,2023年正式加入DeepSeek[14] - 此前开发过植物大战僵尸Qt版(GitHub 270+ Star)及多个南京大学计算机项目[13]
OpenAI新布局:推动ChatGPT覆盖数十亿人 2026年或成AI科学突破年
智通财经网· 2025-06-12 21:40
OpenAI 正站在一项雄心勃勃的计划中心,试图重塑人工智能领域的格局,同时加速推动美国在这一新 兴技术领域的领先地位。Stargate 项目是 OpenAI 、甲骨文和软银(SoftBank)的合作成果,计划筹集 高达 5000 亿美元的资金,在美国各地建设大规模人工智能基础设施。 现年 40 岁的 Altman 表示,该项目名称源自早期一个数据中心的设计,其外形类似于在同名电影和电视 剧中广为人知的圆环形传送门。经过数月努力向潜在投资者推介这一理念后,Stargate 于去年开始逐步 成形。在接受采访时,Altman 透露了他对这一 AI 基础设施巨大跃进可能带来的技术、行业乃至全球影 响的看法。 不过,围绕 Stargate 这类项目的一个关键问题是,OpenAI 等公司是否真的需要如此庞大的计算资源。 中国公司 DeepSeek 以及其他致力于推理能力的企业所推出的高效 AI 模型,正在挑战最初激发 Stargate 项目的"规模法则"。 但 Altman 表示,他并未因此受到打击。"目前有很多优秀的模型,我认为优秀模型将会变得非常丰 富,"他解释说,并补充道他相信 OpenAI 的知名产品将拥有优势 ...
对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds
海外独角兽· 2025-06-12 21:27
AGI与强化学习 - 实现AGI需借助"经验"媒介,即强化学习过程中积累的高质量数据,突破人类数据集限制[3] - 强化学习是AGI关键解法,AlphaProof通过RL自行"做题"积累经验,在IMO获奖,展示RL在数学等人类知识接近极限领域的突破潜力[3] - 数学证明领域半年内密集突破:AlphaProof、OpenAI o1模型、DeepSeek-Prover三部曲均展现RL在数学推理上的惊人表现[3] 形式化数学与Agent - 形式化数学用符号化方法建模和验证数学推理,将数学正确性归结为代码编译正确性[20][23] - 当代数学面临"分布式挑战",研究者间沟通成本高导致工程瓶颈,形式化数学可构建统一知识库实现中心化研究[26][30] - Lean因对前沿数学支持良好、社区活跃成为主流形式化语言,DeepSeek Prover采用后引领领域命名范式[30][34] - 形式化数学天然适配Multi-Agent,Proof Engineering Agent需具备自我规划、修复和知识积累能力,类似软件工程但更抽象[51][52] DeepSeek Prover技术演进 - Prover三部曲进展:V1验证合成数据Scaling效果,V1.5实现自然语言推理引导形式化代码,V2在671B规模实现高层次数学规划[35][37][38] - 数学RL动作空间开放无界,传统RL难以应对,LLM+RL可完成代码/数学等复杂任务[40] - 思维链扩展模型规模效应,Test Time Scaling成为可靠方向,如GPT-o系列投入更多推理预算提升结果[41] 评估与训练范式 - RL有效工作关键在Verification设定,需任务难度略高于模型当前能力,Evaluation比Training更重要[59][60] - APE-Bench基准设计聚焦Proof Engineering,要求模型处理大规模文本修改并与验证系统交互,推动从单任务向工程级能力跨越[62][63] - 合成数据在形式化数学中密集使用,AlphaProof通过问题变形/拆解从100万题扩展到1亿题,Test Time Training接近Online Learning[43][45] Certified AI与泛化 - Certified AI强调生成质量控制,通过形式化验证确保结果可靠性,数学需每一步正确,代码需通过安全性等检测[68][69] - 数学能力泛化依赖领域间共同推理模式,pre-training阶段数据配比和规则筛选是关键,如GPT-3.5因高比例代码数据提升推理[72] - 形式化方法可推广至化学、生物等依赖数理结构的领域,但需补充物理世界交互[73] 未来技术方向 - 下一个GPT-4级跨越将是具备自主规划、执行和反思能力的Agent,结合Online Learning可实现能力持续优化[80] - Reward Model演进为Reward Agent,动态收集信息判断生成正确性,解决复杂评估问题[76][77] - Pre-training仍为技术基础,虽Scaling单独难支撑跨越,但需持续融入Agent等新方法[83][84] 行业竞争格局 - AGI实现者大概率来自现有头部企业(Google/OpenAI/DeepSeek等),因需补足技术/Infra/人才积累,新入局者困难[81] - 技术发展进入积累期,o1模型与4o形成互补而非代际替代,pre-training瓶颈指单独Scaling不足,非整体重要性下降[82][83]
阿里千问与DeepSeek入选全球AI开源贡献榜前十
快讯· 2025-06-12 18:33
AI开源社区贡献榜 - Hugging Face发布最新AI开源贡献榜 中国团队表现亮眼 阿里通义千问位列全球第五 中国第一 DeepSeek排名第九 是前十中唯二的非美国机构[1] - 榜单评估指标包括开源模型 数据集 开发者关注度 社区活跃度及全球影响力等[1] 中国AI公司表现 - 阿里通义千问跻身全球第五 中国第一 展现中国AI公司在开源领域的领先地位[1] - DeepSeek位列全球第九 与阿里通义千问同为前十中仅有的非美国机构[1] 评估标准 - Hugging Face官方对全球开源模型主要机构进行评估 考察多维度指标[1] - 评估维度包括开源模型 数据集 开发者关注度 社区活跃度及全球影响力[1]
对话火山引擎谭待:马拉松才跑 500 米,要做中国 AI 云第一
晚点LatePost· 2025-06-12 18:23
火山引擎发展历程与战略 - 火山引擎成立5年,从最初不被看好到目前国内大模型调用量占比46.4%,远超二三名总和[4] - 公司2021年定下1000亿元年收入目标,当时阿里云年收入仅600亿,目前火山引擎去年收入100亿,今年目标200多亿[14] - 公司采用"内外技术同源"原则,复用字节跳动内部技术资源,如推荐系统GPU训练经验直接对外服务[10] 技术优势与市场表现 - 豆包大模型日均Token处理量从去年12月4万亿增长至16.4万亿,半年翻两番[4][26] - 公司TPM(每分钟处理Token数)达500万,远超同行默认水平,并通过技术优化将大模型价格降至行业1/3[19][22] - 深度思考模型和多模态模型带动AI工具类应用增长10倍,如AI搜索、AI编程和线下巡店等场景[26] Agent战略布局 - 公司认为Agent将突破App时代天花板,能创造更大经济价值,正在加码开发全链路Agent工具[4][25] - 推出MCP服务、Prompt Pilot等Agent定制开发套件,采用按输入长度区间定价的创新模式[5][24] - 开源强化学习框架veRL,并打通Trae开发者工具与云组件服务,构建完整Agent开发环境[24] 商业模式与竞争策略 - MaaS(模型即服务)毛利率较高,公司通过C端(豆包App)与B端协同获客,客户常参考C端效果提出需求[17][19] - 资源调度能力突出,将不同context长度混合推理,实现256K上下文窗口,国内首家[24] - 按整个集团计算资源规模不输阿里云,内部基础设施复用大团队保证体系协调[21][29] 行业趋势判断 - 预计云计算市场空间将扩大100倍,GPU为基础的AI云服务将占收入大头[14][25] - 模型能力提升带动行业爆发,如DeepSeek破圈后客户热情明显提升[26] - 提示词工程价值被低估,模型越好时明确的需求描述越能发挥性能[28]
高盛:中国软件_ Gen-AI apps 商业化_差异化功能、人工智能代理及定制化知识中心,推动付费率提升
高盛· 2025-06-12 15:19
报告行业投资评级 未提及 报告的核心观点 报告围绕AI软件的货币化、护城河与知识产权、用户案例和成本等核心辩论点展开,探讨AI软件货币化进展、定价策略、主要用户案例和软件供应商护城河等问题,指出AI软件当前营收贡献较低但被视为未来关键增长驱动力,同时介绍不同应用的货币化现状和能力,并认为金山办公、金蝶国际、用友网络等公司是AI货币化的早期受益者 [2][3] 根据相关目录分别进行总结 AI货币化进展 - 单款ToC AI应用月活超1000万,付费率3% - 13%;单款AI软件企业客户目标今年达约1000家;今年AI软件营收贡献低,个位数到十几,但软件供应商视AI为未来关键增长驱动力,AI基础模型API代币费用持续下降 [6] AI定价策略 - ToC AI工具年收费20 - 200美元/用户,AI创作工具因多模态内容成本高,价格高于AI生产力工具;ToB AI应用年收费80 - 1000美元/用户,或年许可费3000 - 20000美元;ToC供应商提供7 - 30天试用,ToB供应商为大客户提供预培训系列 [6][7] 主要AI用户案例 - AI应用分为AI创作、AI生产力、AI行业工具和AI企业服务四个细分领域;多基础模型使AI应用能深度推理生成内容,AI智能体简化流程 [10] 软件供应商护城河 - ToC方面,通用AI助手和聊天机器人免费,用户更愿为有差异化功能的工具付费;ToB方面,企业要求AI完成复杂任务、产生高投资回报率,需深入理解企业业务和行业知识,应用供应商正开发行业级AI模型和标准化解决方案 [10][15] 早期受益公司 - 金山办公(AI生产力)、金蝶国际/用友网络(AI企业服务)、虹软科技(AI摄影)、科大讯飞(AI教育/医疗)、广联达(AI BIM)是AI货币化的早期受益者 [3]
全球半导体股猛涨,中美谈判、AI需求受期待
36氪· 2025-06-12 12:29
半导体行业利好因素 - 中美贸易磋商取得进展 美国商务部长暗示将放宽半导体等产品出口管制 [1] - 生成式AI用先进半导体销售强劲 台积电2025年5月销售额同比增长40%创当月历史新高 [1] - 全球半导体股票呈现上涨态势 费城半导体指数6月10日上涨超2%创2月以来新高 较4月低点上涨50% [2] 半导体企业表现 - 博通总市值超过特斯拉 打破美国科技七巨头垄断格局 [3] - 东京股市半导体股领涨 爱德万测试6月11日涨幅超4% 较4月低点上涨80% [1] - 日经半导体指数连续7天上涨 较4月7日低点上涨43% [3] 市场需求与技术发展 - Evercore ISI高科技企业指数达57.5 创两年新高 显示行业接单情况持续改善 [2] - 中国企业DeepSeek改进AI模型"R1" 推动中美AI开发竞争加剧 [2] - 分析师认为轻量高性能AI模型将扩大应用范围 利好半导体制造设备厂商 [2] 区域市场动态 - 中国半导体市场需求增长 日本企业爱德万测试和迪思科将受益 [2] - 日本半导体股估值回升 爱德万测试预期市盈率回升至34倍以上 [3]