Seek .(SKLTY)
搜索文档
DeepSeek“悄悄”上线全新模型,或触发硬件光计算革命
21世纪经济报道· 2025-10-30 13:54
技术突破 - DeepSeek发布全新多模态模型DeepSeek-OCR,其核心构件视觉encoder的高效解码为光计算和量子计算在LLM领域的引入提供了明确技术路径[1] - DeepSeek首次提出“上下文光学压缩”技术,通过将文本作为图像处理实现信息高效压缩,理论上可实现无限上下文,模拟人脑遗忘机制[2] - 将文本作为图像处理可实现7-20倍的token压缩,一页文本通常需要2000-5000个文本tokens,转换为图像后仅需200-400个视觉tokens,10倍压缩时保持97%解码精度,20倍压缩时仍有60%精度[2] 技术原理与应用 - 通过将多轮对话中的历史上下文渲染成图像实现LLM Memory遗忘机制,近期对话保持高分辨率文本形态,更早历史被压缩成图像并随时间逐步降采样[3] - 该技术将文本渲染为图像后作为视觉信息处理,大幅降低数据分割和组装操作次数,从而降低整体计算负荷和对后端计算硬件在规模精度上的压力[3] - 该模型同样可以减少光电转化次数,更有效发挥光计算高并行性和低功耗优势,预计很快会有光计算芯片结合大模型应用出现[1][3] 硬件革命机遇 - DeepSeek-OCR技术为光计算芯片进入大语言模型领域铺平道路,光计算芯片利用光速传输、高并行性和低功耗特性,被誉为“后摩尔时代”潜力技术[3] - 光计算核心优势是以极高速度和极低功耗执行特定计算,如图形处理中的傅里叶变换和大规模并行处理,DeepSeek-OCR解决了引入光芯片的最大问题即序列上下文过长[4] - DeepSeek-OCR的DeepEncoder部分适合由光学协处理器执行,文本解码部分仍由电子芯片处理,记忆压缩可完全交给光计算芯片实现最优分工[4] 产业现状与挑战 - 光计算芯片目前仍处于产业化早期,受技术、制造、生态等多种边际条件制约[4] - 光芯片需要解决先进光电融合封装问题,确保光源、芯片和探测器件高效集成并与电子控制单元稳定协作,同时整个光计算软件生态还不够成熟[5] - 光计算芯片已进入产业化早期车道,但距离在数据中心与GPU同台竞技可能还需要3-5年时间攻克工程、成本和生态难题[5]
豆包月活首超DeepSeek登顶,即梦、可灵、智谱、Kimi集体下滑,“AI+医疗”异军突起
华尔街见闻· 2025-10-29 14:57
市场格局变化 - 2025年第三季度AI应用市场呈现两极分化,字节跳动旗下豆包月活环比增长22.2%至1.59亿,首次超越DeepSeek成为月活与下载量的双料冠军[1] - DeepSeek月活从二季度近1.7亿环比下滑14%至1.46亿,月均下载量从2258.9万环比下降7.9%至2080.2万[8] - 腾讯元宝月活环比增长23.6%至3092.1万,守住行业第三,下载量环比增长40.9%至870.3万[8] 头部应用竞争态势 - 豆包和DeepSeek合计占据通用AI助手赛道近88.4%的月活用户规模[14] - 豆包登顶得益于字节跳动“通用平台+垂直爆款”策略,通过抖音、剪映等生态流量形成循环[9] - DeepSeek面临技术迭代迟缓、竞争者正面挑战以及缺乏多模态功能三大困境[9][10] AI四小强表现 - Kimi月活环比下降约30%至992.6万,跌破千万大关,月均下载量环比下跌20.2%[15] - 智谱清言月活环比下降35.2%,下载量环比下降26.1%,IPO前陷入裁员争议[15][20] - MiniMax月活环比下降42.6%,月均下载量环比骤降43.3%,主攻智能体方向[16][21] - 阶跃星辰未上榜,重心已转向终端Agent[22] 垂直场景应用表现 - AI教育赛道集体降温,作业帮旗下快对AI月活环比下降42.5%至600.7万,豆包爱学月活环比下降5.7%至713.2万[24] - 内容创作智能体异军突起,字节旗下小云雀月活环比增长246.1%,下载量环比增长102.5%[25] - AI医疗成为新刚需,蚂蚁集团AQ月均下载量达307.3万,月活达464.2万[26] - AI视频/图像应用分化,即梦AI月活环比微降5.8%,但字节星绘月活环比增长85.6%[28] 新兴趋势与市场动态 - AI应用竞争核心从模型能力转向任务闭环能力,用户需要“能干活的AI”[32] - 新黑马小云雀、AQ、ima均出自大厂生态,大厂充分利用流量、数据和场景优势[33] - AI陪伴赛道出现关停潮,阶跃星辰冒泡鸭、Soul异世界回响等产品退出市场[31] - 独立App窗口期收窄,初创企业未来机会更多在于B端企业服务[33]
1.32亿!DeepSeek大单,360拿下
搜狐财经· 2025-10-29 14:05
项目中标信息 - 三六零数字安全科技集团有限公司中标武汉人工智能创新应用示范基地项目(一期),投标总价为1.32亿元[2] - 项目服务期为合同签订之日起18个月[8] - 在10月24日的中标候选人公示中,三六零为第一中标候选人,投标报价为13200.2万元[7] 项目背景与建设方 - 项目招标人为武汉长江新区长新数科信息技术有限公司,该公司为武汉长江新区产业投资有限公司100%控股的国有企业[3] - 项目聚焦构建全方位、立体化人工智能创新应用示范基地,依托长江新区已有场地配套基础进行建设[3] 项目建设核心内容 - AI安全云建设安全托管云平台、AI基础设施建设DeepSeek大模型一体机和大模型开发平台[4] - AI应用工场构建垂直领域大模型工程平台,支撑制造业、新材料、生物医药等产业智能化升级;AI学院深化产学研合作,联合高校定向培养“AI+安全”复合型人才[4] - AI政务中心、公共服务中心、中小企业服务中心和产业升级中心,为政务、民生、企业、产业四大维度提供智能化服务和解决方案[4] - 算力配套建设包括16台通用算力服务器、1台智算服务器和1台大模型服务推理机等硬件设备[5] - 配套工程主要包括可视化设备、智能化设备、机房建设等[6] 公司近期业务动态 - 10月28日,三六零旗下公司作为联合体成员中标约1.6亿元的“呼和浩特市人工智能与数字安全产业示范基地项目EPCO总承包”项目[8] - 10月13日,三六零旗下公司中标约2268万元的“宁波数字安全产业基地项目(信息化部分及人工智能)—算力资源租赁”项目[8] 公司财务与研发投入 - 根据2025年半年报,公司报告期内实现营业收入38.27亿元,同比增长3.67%[9] - 报告期内归母净利润为-2.82亿元,同比增长17.43%[9] - 研发费用为15.65亿元,占营业收入比例高达40.89%[9]
DeepSeek分析:未来5年,钱放黄金、存银行、买房哪个更划算?
搜狐财经· 2025-10-29 13:37
房地产市场 - 当前楼市经历深刻变革 平均房价相较于2021年高点已回落约30% [3] - 为激活市场 各地政府取消限购 银行下调房贷利率和首付比例 税务部门出台契税及增值税减免等优惠政策 [3] - 部分一线城市如上海和深圳房价收入比高达40倍 居民购买力不足 叠加疫情后收入普遍受影响 难以支撑高房价 [5] - 楼市赚钱效应消失 投资性购房需求大幅萎缩 盲目入市面临房价持续下跌风险 [5] 黄金市场 - 国际金价波动剧烈 主要受美元指数和全球地缘政治局势影响 例如2024年俄乌冲突升级曾导致金价在两周内暴涨12% [8] - 中东局势缓和后 金价迅速回调5% 剧烈波动对普通投资者构成高风险 高位被套后可能需等待多年才能解套 [8] - 实物黄金变现能力差 银行通常难以回收 金店回收价格远低于市场价值 例如价值150万元金条回收价可能仅为90万元 [7] 银行存款 - 自2024年以来 各大国有银行持续下调存款利率 储户存款收益不断减少 [7] - 物价上涨削弱了存款本金的购买力 资产面临缓慢贬值风险 [7] - 与投资黄金和房产相比 银行存款可避免财富大幅缩水 [7] 资产配置策略 - 多元化资产配置是实现财富保值增值的关键 应将资金平均分配到无风险、低风险和中等风险的投资品中以分散风险 [7]
豆包月活首超DeepSeek登顶 即梦、可灵、智谱、Kimi集体下滑 “AI+医疗”异军突起|2025年三季度AI应用价值榜
每日经济新闻· 2025-10-29 02:57
市场格局变化 - 2025年第三季度AI应用市场呈现两极分化,豆包月活环比增长22.2%至1.59亿,首次超越DeepSeek成为月活与下载量双料冠军[2] - DeepSeek月活从二季度近1.7亿环比下滑14%至1.46亿,月均下载量从2258.9万环比下降7.9%至2080.2万[17] - 腾讯元宝月活从2502.5万环比增长23.6%至3092.1万,守住行业第三,下载量从617.5万环比增长40.9%至870.3万[17] - 豆包和DeepSeek合计占据通用AI助手赛道近88.4%的月活用户规模[25] 头部应用表现 - 豆包月均下载量达3447万,从二季度的2981.3万增长15.6%[17] - 豆包登顶得益于字节跳动“通用平台+垂直爆款”策略,形成生态循环[18] - DeepSeek面临技术迭代迟缓、竞争者正面挑战和多模态功能缺失三大困境[18][19] - Kimi月活从1407.2万环比下降约30%至992.6万,跌破千万大关,月均下载量环比下跌20.2%[26] AI四小强现状 - 智谱清言月活环比下降35.2%,下载量环比下降26.1%[27] - MiniMax月活环比下降42.6%,月均下载量环比骤降43.3%[28] - Kimi迫于成本压力开启C端收费,从工具转向“智能体”[29][30][31] - 智谱AI在IPO前曝裁员风波,涉及人员调整和战略整合[32] - MiniMax主攻智能体,即将完成近3亿美元新融资,估值超40亿美元[33] - 阶跃星辰对C端业务进行调整,重心转向终端Agent[34] 垂直赛道表现 - “AI+教育”赛道集体降温,作业帮旗下快对AI月活环比下降42.5%至600.7万[36][37] - 字节旗下内容创作智能体小云雀月活环比增长246.1%,登顶月活增长榜,下载量环比增长102.5%[38] - 蚂蚁集团旗下AI健康应用AQ月均下载量达307.3万,高居下载量总榜第五,月活达464.2万[39] - AI视频/图像赛道中,字节旗下星绘月活环比增长85.6%,下载量增长166.1%[41] - AI陪伴赛道出现关停潮,但独响月活环比增长159.4%,破次元恋人月活环比增长60.5%[42] 行业趋势 - AI应用竞争核心从模型能力转向任务闭环能力,从“能聊”走向“能干”[44] - “刚需”场景垂直深耕,“AI+生产力”仍是核心增长极,所有垂直领域都存在机会[44] - 生态壁垒空前提高,新黑马小云雀、AQ、ima均出自大厂生态[45] - 独立App窗口期收窄,头部互联网企业在C端拥有天然优势,独立AI厂商机会更多在于B端企业服务[45]
全球顶级AI模型混战:中国AI包揽冠亚军 DeepSeek逆袭登顶
新浪财经· 2025-10-29 02:25
比赛概况与结果 - 全球顶级AI模型在nof1ai平台进行为期10天的金融实战,各获1万美元本金在Hyperliquid去中心化交易所自主交易主流加密货币,无人工干预或策略预设 [3] - 中国AI模型DeepSeek实现逆袭登顶,截至10月27日10点账户资金达22304美元,10天净赚12304美元,收益率达12304% [5] - 另一中国模型阿里通义千问Qwen3表现稳健位列第二,截至10月27日10点账户资金达20708美元,收益率为10708%,10天净赚10708美元 [5] - 美国AI模型集体陷入亏损,Claude 45 Sonnet和Grok 4亏损10%至17%,Gemini 25 Pro亏损超62%账户剩3800美元,GPT 5亏损超70%账户跌至2761美元 [6] 中国AI模型成功因素 - DeepSeek采用多元化投资组合并进行有效风险控制,使用10倍至20倍适度杠杆提升收益同时降低爆仓风险,坚持低频精准交易方式避免情绪化交易 [4] - DeepSeek开发团队幻方量化拥有深厚量化交易背景,模型继承传统量化交易风险控制基因,通过分散投资、动态调整仓位将回撤控制在最低限度 [4][7] - 阿里通义千问Qwen3展现高频优化与实时学习能力,能在高频市场反馈中持续自我优化,通过实时强化学习调整策略 [7] - 中国模型在交易中展现严谨量化模型与趋势判断敏锐性,在震荡期控回撤,在上涨期抓波段,实现收益与风险平衡 [5] 美国AI模型失误分析 - 美国模型出现方向判断错误,10月19日至22日市场处于上涨通道时,Gemini却选择做空六种加密货币导致亏损持续扩大 [8] - 美国模型缺乏止损机制,当亏损出现时没有果断止损而选择死扛,导致亏损加大 [8] - 美国模型存在情绪化决策,曲线剧烈波动与持仓组合混乱暴露决策盲目性,重仓清仓反复缺少章法 [6][8] - 美国模型持仓策略混乱,GPT和Grok多单空单混杂,Gemini做空六种加密货币背离市场趋势 [6] 行业意义与影响 - 此次实战从普通AI能力测试演变为中美AI实力巅峰对决,标志着全球AI发展进入实战PK新阶段 [4][8] - 实战揭示不同AI模型在真实市场中的决策底层逻辑,展现AI从办公室辅助工具走向实战利器的巨大潜力 [7][8] - 中国AI模型用12304%和10708%的收益与美国模型平均超40%的亏损形成鲜明对比,体现中美AI实战能力差距 [8]
超越DeepSeek后,豆包活跃用户规模继续增长
观察者网· 2025-10-28 22:29
豆包用户增长表现 - 2025年三季度豆包月活跃用户规模达到1.72亿,超过DeepSeek的1.45亿[1] - 豆包月活跃用户数在2025年8月已达1.57亿,同期DeepSeek下滑至1.43亿[1] - 豆包自2023年8月上线以来用户规模持续走高[1] - 豆包大模型每日Token调用量从2024年5月的1200亿增长至2025年9月的30万亿,实现253倍增长[1] DeepSeek用户流失情况 - DeepSeek的App端流量自2025年4月起持续下滑[1] - 2025年5月DeepSeek流失用户中59.2%转向百度App,38.6%流向豆包App,7.0%迁移至腾讯元宝[1] - 有观点认为豆包的用户增长与DeepSeek的用户流失存在关联[1]
精读DeepSeek OCR论文,我远远看到了「世界模型」的轮廓
钛媒体APP· 2025-10-27 10:34
技术性能对比 - DeepSeek OCR模型参数为30亿,在数学公式展开案例中未能识别出“极坐标”,且表格结构识别错误[2] - 参数规模仅9亿的PaddleOCR-VL模型在相同案例中表现优于DeepSeek OCR[2] - 在OCR模型综合性能排名中,DeepSeek-OCR-Gundam-M模型总体得分86.46,低于PaddleOCR-VL的92.56分[2] 技术创新与核心价值 - DeepSeek OCR的核心是DeepEncoder编码器,使用视觉Token对输入上下文信息进行编码,实现了9-10倍文本压缩下96%以上的OCR解码精度,10-12倍压缩下约90%的精度,20倍压缩下仍保持约60%的精度[10] - 该技术实现了连续可调的压缩率,可在压缩率和识别精度之间进行平滑权衡[11] - 模型提出类生物遗忘机制的压缩策略,近期上下文保持高分辨率,远期上下文逐步降低分辨率,模拟人类记忆的自然衰减[12] - 研究探索了解码N个文本Token需要多少个视觉Token的核心问题,证明了AI可以仅用100个视觉Token高精度解压缩出包含1000个文本Token的原文内容,且无需文本分词过程[17] 战略意义与行业影响 - DeepSeek OCR的深层价值在于探索“连续视觉表征压缩”,其研究方向隐隐指向终极追求——“世界模型”[6] - 该技术将大模型的前沿焦点从离散的语言Token重新转向连续视觉表征的视觉Token[6] - 论文证明了AI的主要信息入口可以从语言转向视觉,这种转变效率更高且更符合生物特性[20] - Vision→Text的任务空间完全包含了Text→Text的任务空间,任何文本都可以无损渲染成图像,这种不对称性暗示了将所有输入统一为视觉模态的激进方向[21] - 这一范式为解决长上下文建模中的效率瓶颈、记忆机制设计与多模态融合等核心问题提供了全新思路[22] 实际应用价值 - DeepSeek-OCR具备大规模预训练数据生产能力,可作为大语言模型训练过程中不可或缺的助手,每天可生成数千万页级别的训练数据,显著提升了多模态数据构建效率[15]
揭秘Meta AI大裁员:Llama 4落后DeepSeek的恐慌!扎克伯格是急功近利,自毁长城;还是在精简机构,重振业务?
搜狐财经· 2025-10-27 09:31
公司战略重组 - Meta对人工智能部门进行重组,裁员约600名员工,使部门总人数降至不到3000人[3] - 新任首席AI官亚历山大·王主导此次重组,旨在通过缩减团队规模来提升决策效率和员工影响力[3] - 重组背景是Meta的开源大模型Llama 4表现明显落后于DeepSeek等中国竞争对手,引发公司危机感[1][10] 部门调整重点 - 新组建的TBD Lab部门未受裁员影响并将继续扩张,该部门专注于开发下一代基础模型和Llama系列迭代[5] - 裁员涉及三个部门:基础AI研究部门、产品应用部门和基础设施部门,仅TBD Lab得以保留[5] - TBD Lab由亚历山大·王亲自负责,集结了从谷歌、OpenAI、苹果等竞争对手挖来的顶级AI人才[5][6] 人才战略转变 - 公司不惜重金从外部招募AI精英,例如向苹果AI大模型团队负责人开出两亿美元天价合同[6] - 一次性从OpenAI打包带走八名核心开发人才,包括GPT-4的几位核心架构师[6] - 此次裁员导致多位资深研究员离职,包括FAIR研究总监田渊栋等知名学者[17][18] 领导层变更 - 扎克伯格今年6月引入Scale AI创始人亚历山大·王全权负责AI业务[7] - 亚历山大·王的任命体现了公司领导力向商业思维和实际落地能力倾斜的战略转变[9][10] - 原首席科学家杨立昆领导的基础研究团队被并入超级智能实验室,地位逐渐边缘化[14][16] 产品开发问题 - Llama 4表现糟糕的原因被归结为团队优先投入多模态方向,但面临DeepSeek在推理能力上的竞争压力[11][13] - 前员工指出问题根源在于“外行管内行”,部分中高层领导AI背景薄弱导致决策失误[13] - 公司战略转向加速模型与产品开发以获得即时回报,而非长期基础研究投入[17] 行业影响 - 裁员消息引发行业关注,OpenAI、xAI等公司的同行纷纷在社交媒体上招募被裁员工[18][20] - 田渊栋等知名研究员的离职被业内视为Meta的重大人才损失[18][19] - 公司重组反映了AI行业竞争白热化,人才成为各家竞相争夺的核心资产[3]
独家揭秘Meta AI大裁员:Llama 4败于DeepSeek带来的恐慌
新浪科技· 2025-10-27 09:01
公司AI部门重组与裁员 - Meta宣布对旗下人工智能部门进行重组,裁员约600名员工,裁员后AI部门员工总数降至不到3000人[6][8] - 此次裁员涉及超级智能实验室下属四个部门中的三个,只有模型训练与扩展部门TBD Lab未受影响且将继续扩张招聘[11][12] - 受影响的员工被告知11月21日为离职日期,按照加州法规被裁人员将保留两个月合同与薪水[9] 新任AI负责人与战略调整 - 公司于今年6月引入Scale AI创始人兼CEO亚历山大·王全权负责AI业务,此举旨在加强AI模型训练数据和基础设施方面的核心能力[18][20] - 新任负责人认为AI部门存在臃肿低效问题,希望通过裁员实现更加精简灵活的团队结构[7][20] - 战略重心转向加速模型与产品开发以获得即时回报,传统基础研究角色正被能够推出产品的工程角色所取代[29] Llama模型表现与竞争压力 - 今年4月发布的Llama 4模型表现令人失望,其开源大模型明显落后于DeepSeek等中国竞争对手[2][22] - 团队内部因DeepSeek推理能力超越而出现恐慌,产品开发方向出现混乱[22][24] - 管理层认为Llama 4失败与团队领导问题有关,促使公司从外部引入新的领导力来提升竞争力[24] 人才流动与团队结构变化 - 新组建的TBD Lab部门集结了行业顶级技术人才,包括从OpenAI打包挖走的8名核心开发人才以及苹果AI大模型团队负责人[14] - 新团队成员平均薪酬水准显著高于其他三个部门,内部出现薪资落差和士气影响[14][25] - 基础AI研究部门FAIR被并入超级智能实验室,其创始人杨立昆的位置逐渐边缘化[26][28] 关键人员变动与行业影响 - FAIR研究总监、知名华人AI研究员田渊栋在裁员范围内,其在强化学习和大语言模型领域享有很高声望[31][33] - 田渊栋团队曾开发早于AlphaGo的围棋AI DarkForestGo,并发现注意力汇聚现象等重要研究成果[33] - 行业同行对Meta裁员决策表示遗憾,OpenAI、xAI等公司积极争取被裁的资深研究人员[34]