Workflow
Seek .(SKLTY)
icon
搜索文档
阿里Qwen3能否成为下一个DeepSeek?
36氪· 2025-05-07 19:38
模型发布与技术特点 - 阿里巴巴旗下通义千问团队发布并开源新一代模型Qwen3系列,包括2款参数规模为30B和235B的混合专家(MoE)模型,以及6款参数从0.6B到32B的密集模型 [1] - Qwen3采用混合专家(MoE)架构,旗舰模型Qwen3-235B-A22B总参数量235B但激活仅需22B,显著降低运行时算力需求 [3] - 预训练数据量跃升至36T,是Qwen2.5的三倍,多轮强化学习优化了模型在推理、指令遵循、工具调用及多语言能力等方面的表现 [5] - 在ArenaHard综合测试中得分95.6,AIME'24数学测试85.7,LiveCodeBench代码测试70.7,LiveBench决策测试77.1,显示多项能力提升 [5] 部署与成本优势 - 华为昇腾MindSpeed和MindIE实现Qwen3系列0Day适配,海光信息DCU完成全部8款模型无缝适配与调优 [2] - Qwen3-30B-A3B可单卡4090部署,Qwen3-235B-A22B仅需4张H20,显存占用为性能相近模型的三分之一,大幅降低部署成本 [2][6] - 与DeepSeek-R1相比参数量仅为其1/3,成本大幅下降,降低中小企业和个人开发者使用高性能模型的门槛 [6] 性能表现与局限性 - 在生成复杂代码、数学推理等方面思考模式表现明显优于非思考模式,但长文本能力表现不突出且存在一定幻觉率 [6] - 测试显示"普通"模式生成报告时出现较高幻觉率,而"深度思考"模式下幻觉率大幅降低,数据准确性提升 [6] 公司战略布局 - 阿里未来三年将投入超3800亿元用于云和AI硬件基础设施建设,强化通义千问与夸克的"双子星"格局 [7] - 通义千问专注云上智能支撑,夸克打造端侧入口,两大App所有用户均可免费使用Qwen3开源模型 [7] - 夸克2025年3月MAU达1.48亿登顶国内AI应用榜首,公司通过组织调整整合天猫精灵与夸克团队推进AI To C战略 [9] 行业竞争态势 - 腾讯混元大模型依托微信生态优势,字节跳动豆包借助抖音推流优势,2024年11月MAU达5998万长期霸榜AI应用前三 [10] - 阿里面临技术优势维持与使用门槛降低的双重挑战,中小企业技术对接与模型二次开发存在困难 [9] - 夸克用户体验稀释问题凸显,需优化技术架构与服务器性能以应对用户快速增长 [10]
DeepSeek致谢腾讯技术团队:对DeepEP的优化,是一次“huge speedup”代码贡献
新浪科技· 2025-05-07 19:12
技术优化 - 腾讯技术团队对DeepSeek开源的DeepEP通信框架进行深度优化,在RoCE网络环境性能提升100%,IB网络环境提升30% [1] - 优化后的技术方案获得DeepSeek公开致谢,被称为"huge speedup"代码贡献 [1] - 腾讯星脉网络团队发现DeepEP两大关键瓶颈:双端口网卡带宽利用率不足和CPU控制面交互时延 [2] - 技术优化后,DeepEP在RoCE网络实现性能翻倍,IB网络通信效率提升30% [2] 技术突破 - DeepSeek开源的DeepEP通信框架通过突破性方法提升300%通信效率,减少对英伟达NCCL的依赖 [2] - 优化措施包括:替换IBRC为IBGDA、为每个通道使用独立QP实现并行数据传输 [1] - 优化后internode带宽达到58GB/s(RDMA),internade带宽达到51GB/s(RDMA) [1] 应用与影响 - 该技术已全面开源并应用于腾讯混元大模型等项目的训练推理 [2] - 在腾讯星脉与H20服务器构建的高性能环境中展现出出色通用性 [2] - 技术优化使企业AI大模型训练获得更高效解决方案 [1]
你真的会用DeepSeek么?
搜狐财经· 2025-05-07 12:04
AI Agent行业趋势 - AI行业正从单一模型应用转向多Agent协作网络,形成"AI互联网"新范式 [7][8][27] - 2025年起行业需求从"驱动单个模型"升级为"设计智能体协作系统",从业者角色需从使用者转变为组织者 [21][27][29] - 字节跳动、阿里、腾讯等国内平台加速布局MCP协议基础设施,海外谷歌A2A协议与Anthropic MCP协议推动跨系统协同标准 [36][37][38][39] 技术架构变革 - Agent通信依赖结构化协议(MCP/A2A)而非自然语言Prompt,意图表达、任务链图谱取代传统Prompt工程 [14][27][29] - 平台化趋势显著:阿里百炼5分钟搭建MCP服务,百度推MCP插件商店,OpenAgents支持自然语言发布Agent能力 [16][38] - 开源框架LangGraph、AutoGen、CrewAI等提供多Agent编排工具,支持状态机、DAG等协作建模 [33][35][41] 企业动态与产品 - 字节跳动2025年4月推出"扣子空间"内测平台并开源Agent TARS项目,支持任务规划与多工具调用 [16][39] - 阿里云百炼上线全生命周期MCP服务,集成高德、无影等50+能力模块,提供零部署Agent构建体验 [38] - 腾讯云发布"AI开发套件"聚焦企业级调度中台,火山引擎OS Agent整合MCP协议实现"一句话开发" [38][39] 从业者转型路径 - 工程岗需转向智能体系统开发:学习LangGraph状态机、MCP协议结构、平台接口设计,目标成为Agent基础设施构建者 [33] - 运营/产品岗需掌握业务需求拆解为多Agent意图的能力,熟练使用AutoGen Studio等平台进行协作设计 [34] - 创业者应聚焦生态构建:将工具服务注册为Agent节点,参与制定意图协议标准,搭建私域Agent网络 [35] 行业基础设施进展 - 海外A2A协议覆盖50+巨头企业,专注跨平台Agent通信标准,MCP协议则强化任务调度与状态传递 [36][37] - 国内形成平台+开源双轨发展:阿里/腾讯提供企业级MCP服务,LangGraph等框架降低多Agent系统构建门槛 [38][41] - 协议层创新类比TCP/IP,MCP/A2A可能成为未来智能体互联网的底层秩序 [42]
DeepSeek:“边缘革命” 的可能性
36氪· 2025-05-07 10:34
公司概况 - DeepSeek是一家专注于通用人工智能的中国科技企业,擅长处理复杂任务,包括文本生成、自然语言理解及分析、编程与代码相关功能 [1] - 公司采用开源推理模型免费商用策略,直接面向用户并提供应用场景模式服务,支持联网搜索与深度思考模式的网络实现 [1] - DeepSeek的成功促进了开源AI模型的采用,被视为AI行业的"开源时刻" [1] 行业影响 - DeepSeek的成功缩小了中美AI差距,从ChatGPT发布后的拉大趋势到DeepSeek V3和V3-0324发布后差距缩小至几个月内 [3] - 公司推动了AI产业化进程,大模型服务提供商转向免费模式,API价格下降接近免费,加速产业应用发展 [4] - DeepSeek代表小团队驱动创新的模式,与OpenAI类似,挑战了大公司主导的创新格局 [4] 技术发展 - 开源战略带来更快的创新和广泛采用,证明底层技术国家不能完全控制网络产业平台的价值传播和利益流向 [3] - 公司展示了"边缘革命"的可能性,发展中国家通过追踪新知识可重新参与AI竞争 [2] - 大模型参数超级大时可能产生失控风险,包括自我意识争议和恶意使用破坏性活动 [2] 产业政策 - 需要合理设计国内产业内循环模式和国际国内产业整体循环模式接口政策体系,保证"技术国境线"安全 [5] - 建议政策引导资本支持科技企业创新,鼓励民间资本成为长期资本、耐心资本参与智能产业平台底层建设 [6] 教育变革 - 大模型挑战传统教育体系,未来教育重点应转向创新和实践,减少对记忆功能的强调 [7] - 教育需要面向扎实的通识教育,在求知欲强的阶段传递科技前沿知识,避免训练过时技能 [8] - 大模型使知识进入"明牌时代",个体可通过提问获得前沿知识,学习方式从阶梯式变为跃迁式 [9][10] 知识开源 - DeepSeek的开源模式启示大学应以更开放态度面对公众,形成终身学习机制 [11] - 大模型起到知识赋权作用,将"暗知识"变为"明知识",个体重心从知识生产转向知识实践 [10]
DeepSeek等大模型工具使用手册(实战篇)-厦大团队
搜狐财经· 2025-05-06 22:37
AIGC技术基础 - AIGC即人工智能生成内容 利用生成对抗网络 大型预训练模型和多模态技术生成各类内容[22] - 发展历程分为早期萌芽阶段(1950年代至1990年代中期) 沉淀累积阶段(1990年代至2010年代)和快速发展阶段[28][29][30] - 与大模型关系相辅相成 大模型提供数据资源和计算能力 AIGC推动大模型发展应用[24][25][26] 文本类AIGC应用 - 在新闻 广告 文学创作领域广泛应用 包括自动生成新闻报道和个性化广告文案[1] - DeepSeek工具需简单直接提问并支持多轮对话优化结果 文心一言需明确风格结构角色内容文体要求[1] - 支持讯飞智文 DeepSeek+Kimi生成PPT DeepSeek+xmind制作思维导图等多工具协同应用[1] 图片类AIGC应用 - 涵盖创意图片生成 AI修图 图片扩展 智能抠图 图片融合 涂抹消除与局部重绘[2] - 即梦AI生成创意图片时提示词需详细 百度AI图片助手可实现修图老照片修复和图片扩展[2] - 豆包平台支持AI绘画艺术创作和真实照片转二次元风格 百度AI能去除图片水印[2] 语音和视频类AIGC应用 - 语音类应用于智能语音助手和语音合成 豆包APP支持语音输入翻译绘图英语口语练习[3] - 腾讯智影实现文本配音 米可智能支持语音克隆[3] - 视频类应用于影视制作和短视频 可灵AI 即梦AI 腾讯智影分别支持文生视频图生视频和数字人播报[3] AIGC辅助编程与AI搜索 - AIGC技术可自动生成代码提高开发效率 豆包DeepSeek等模型能根据提示词生成PythonHTML代码[4] - AI搜索具有语义理解和多模态交互特点 纳米AI搜索支持多种输入方式并集成多款大模型[4] 行业应用场景 - 在电商领域生成商品标题描述广告文案和广告图 办公领域支持写周报日报方案读后感代码[33] - 娱乐领域涵盖头像生成照片修复图像生成音乐生成 动漫领域支持原画绘制动画生成分镜生成[35] - 艺术领域包括写诗写小说作品草图生成转换音乐创作 设计领域涵盖UI设计美术设计插画设计建筑设计[35] 技术影响 - 革新内容创作领域 自动生成高质量文本图像音频视频 提高创作效率并降低成本[37][38] - 升级用户体验 在智能客服在线教育等领域提供个性化定制化服务[39] - 催生新兴职业如AI训练师机器学习工程师数据标注员 推动传统职业如编辑转型升级[40][41] 工具生态 - 常见工具包括DeepSeek ChatGPT 文心一言 豆包等 基于大规模语言模型技术[42][43][44] - 具备文本生成语言理解能力 应用于创作辅助内容创作智能客服等领域[45]
国内AI应用市场Q1剧变:DeepSeek登顶,腾讯元宝狂飙,Kimi失速,“场景为王”时代开启|2025年一季度AI应用价值榜
每日经济新闻· 2025-05-06 19:29
市场格局变化 - 国内人工智能应用市场从模型参数竞争转向应用生态竞争,技术迭代、资本流向与用户需求共同塑造新格局 [3] - DeepSeek以8111.3万月均下载用户数和1.87亿月均活跃用户规模断层式领先,下载量是第二名豆包的三倍 [17] - 腾讯元宝月均下载量达1343.3万,环比增长近1500%,MAU为2358.3万,环比激增超1546% [20] - 豆包月均下载量2723.8万,MAU 9980.5万,但下载量环比增长不足30%,MAU环比增长约66% [21][23] - Kimi智能助手月均下载量833.8万,环比下滑3.9%,MAU 2165.3万,增长压力显著 [24] 增长与下滑应用分析 - 纳米AI搜索下载量环比增长近620%,MAU环比增长近1100% [32] - AI输入法Lovekey MAU环比增长超1670%,规模超230万 [32] - 豆包爱学MAU近650万,成为唯一上榜的AI教育应用 [32] - 即梦AI和可灵AI下载量环比分别增长301%和173% [32] - 文小言下载量环比下降17.1%,MAU环比下降17.0% [27] - 天工MAU下降33.9%,讯飞星火MAU下降22.6%,智谱清言MAU下降10.2% [27] - AI陪伴类应用如猫箱、逗逗游戏伙伴、ChatBird、冒泡鸭下载量或MAU显著下滑 [33] 行业趋势 - Top 6应用占据前20款应用MAU总和的近90%,市场集中度极高 [34] - 通用AI助手竞争白热化,垂直化、社区化成为破局关键 [37] - 用户需求从尝鲜阶段过渡到寻求实用价值、创作赋能和情感连接的应用阶段 [37] - 未来竞争将转向应用场景挖掘、产品体验优化、社区生态构建和商业模式探索 [38]
八旬院士“神预言”DeepSeek诞生!“真没料到会成预言家”
环球网资讯· 2025-05-06 17:33
基因组学研究 - 陈润生是中国非编码基因研究的拓荒者,参与全球最大生命科学工程"人类基因组计划"[1] - 1990年通过联系美国人类基因组计划办公室,获得首个5年计划文本,推动中国基因组学研究[2] - 1992年协助吴旻院士推动中国人类基因组计划立项,承担测序片段拼接和功能基因寻找任务[4] - 1999年中国完成人类三号染色体短臂3000万碱基对测序(占全球计划1%),提前2年高质量交付[6] - 发现人类基因组中97%非编码序列与疾病相关,推翻"垃圾DNA"传统认知[6] 生物信息学突破 - 团队建立全球首个非编码分子信息库,收录64万个数据并向世界开源[7] - 1980年代末已运用人工神经网络预测遗传密码,奠定AI在生物信息学应用基础[7] - 目前探索中医数据与医学AI大模型融合,构建跨医学体系的智能分析平台[8] 人工智能发展观点 - 提出"智算密度"概念,反对单纯堆积算力的发展路径[1] - 主张将AI定位为"创新中心"而非工具,激发涌现性创新[8] - 认为DeepSeek等大模型的突破验证了底层创新的重要性[1][7]
AI人工智能ETF(512930)、消费电子ETF(561600)冲击3连涨,线上消费ETF基金(159793)涨近3%,DeepSeek发布Prover-V2模型
新浪财经· 2025-05-06 10:28
人工智能行业表现 - 中证人工智能主题指数强势上涨1.64% 成分股神州泰岳上涨6.30% 光环新网上涨5.62% 金山办公上涨4.67% 新易盛和三六零等个股跟涨 [3] - AI人工智能ETF上涨1.53% 最新价报1.33元 近2周累计上涨1.79% [3] - AI人工智能ETF盘中换手2.1% 成交3956.35万元 近1月日均成交9303.68万元 最新规模达18.65亿元创近1月新高 [3] 人工智能技术突破 - DeepSeek发布6710亿参数新模型DeepSeek-Prover-V2-671B 采用高效safetensors文件格式 支持多种计算精度 [4] - 阿里巴巴开源新一代通义千问模型Qwen3 参数量缩减三分之二但性能超越DeepSeek-R1及OpenAI-o1等主流模型 [4] - Qwen3包含8个不同尺寸模型 支持119种语言 适配PC、手机及车载系统等多场景应用 [4] 消费电子行业表现 - 中证消费电子主题指数上涨1.36% 成分股光弘科技上涨5.02% 景旺电子上涨3.55% 生益科技上涨3.33% 北京君正和同方股份等个股跟涨 [7] - 消费电子ETF上涨1.15% 最新价报0.79元 近2周累计上涨1.16% 涨幅排名可比基金1/5 [7] - 消费电子ETF盘中换手2.09% 成交363.27万元 近1月日均成交1704.98万元居可比基金前2 [7] 线上消费行业表现 - 中证沪港深线上消费主题指数上涨0.71% 成分股掌阅科技上涨8.88% 神州泰岳上涨6.94% 汤姆猫上涨2.98% 姚记科技上涨2.96% 顺网科技上涨2.67% [9] - 线上消费ETF基金上涨2.60% 最新价报0.91元 近2周累计上涨2.08% [9] - 线上消费ETF基金盘中换手0.7% 成交25.05万元 近1月日均成交106.62万元 最新规模达3507.53万元创近1月新高 [9][10] 指数成分与权重 - 中证人工智能主题指数前十大权重股包括寒武纪(7.00%)、海康威视(6.12%)、韦尔股份(6.09%)等 合计占比49.82% [10][12] - 中证沪港深线上消费主题指数前十大权重股包括阿里巴巴-W、腾讯控股、美团-W等 合计占比57.55% [15] - 中证消费电子主题指数前十大权重股包括立讯精密(9.46%)、中芯国际(8.13%)、京东方A(7.02%)等 合计占比53.05% [17][18]
李彦宏说 DeepSeek 幻觉高,是真的吗?
36氪· 2025-05-02 12:29
大模型幻觉问题现状 - DeepSeek-R1在苹果美区App免费下载排行榜上力压ChatGPT,成为国产开源大模型的代表,但其"胡说八道"的批评频发,用户反馈其生成内容真伪难辨[2] - 李彦宏在2025百度AI开发者大会上直接批评DeepSeek-R1存在"单一模态支持、高幻觉率、速度慢且成本高"三大痛点[2] - Vectara的HHEM评估显示DeepSeek-R1幻觉率高达14.3%,较前代V3的3.9%提升近4倍,阿里通义QwQ-32B-Preview幻觉率更高达16.1%[6] - OpenAI内部测试发现o3模型在PersonQA基准测试中幻觉率达33%,轻量版o4-mini更达48%,均显著高于前代o1的16%[8] - 谷歌Gemini 2.0的Flash-Thinking版本比标准版幻觉更突出,显示推理能力增强可能加剧幻觉问题[10] 行业技术挑战 - 推理模型采用多轮思考策略易产生偏差累积,导致多米诺骨牌式幻觉放大,例如DeepSeek-R1的长链式思考会逐步放大微小错误[16] - 当前主流解决方案RAG(检索增强生成)通过先检索权威资料再生成回答,百度2024年发布的iRAG技术已应用于文生图领域[20][22] - 腾讯混元模型T1采用"双重把关"策略,训练Critic批判模型筛选长思维链中的逻辑错误,但数据治理仍面临互联网语料复杂性挑战[23] - OpenAI承认模型规模扩大与推理能力增强后幻觉增多的机制尚未明确,需进一步研究[23] 幻觉的双面性 - 大模型幻觉分为事实性幻觉和忠实性幻觉,后者可能产生"外箱式创意",例如DeepSeek续写刘慈欣小说章节被评价优于原作[23][26] - 刘慈欣认为AI可能突破人类认知极限,OpenAI CEO奥特曼也指出幻觉在创作领域具有积极意义[26] - 行业需根据应用场景差异化接受幻觉程度,高风险领域需严格限制,创意领域则可利用其创新潜力[27] 厂商竞争格局 - 百度等大厂既依赖DeepSeek流量导入,又因自研深度推理模型难以突破用户心智而陷入竞争困境[2] - 阿里通义Qwen系列与DeepSeek-R1同属国产模型第一梯队,但QwQ-32B-Preview幻觉率更高达16.1%[6] - 谷歌Gemini、IBM Granite、Anthropic Claude等国际主流模型幻觉率普遍在14%-17%区间,显示该问题具行业普遍性[7]