Workflow
DeepSeek
icon
搜索文档
六小龙留不住字节大神
36氪· 2025-06-19 15:59
字节系高管在AI行业的流动 - 前字节皮皮虾负责人张心皓调离阶跃星辰核心岗位,转为顾问虚职 [1] - 前今日头条用户产品负责人张前川以类似方式在MiniMax转为顾问 [1] - 前字节剪映产品经理明超平从月之暗面离职创业 [1] - 近两年已有超20位字节系高管投身AI创业,包括前抖音产品负责人任利锋创办数美万物等 [8] AI六小龙到四小强的格局演变 - 原AI六小龙因零一万物放弃AGI、百川智能专注医疗,缩减为智谱AI、MiniMax、月之暗面和阶跃星辰四家 [1] - 四小强策略从模型应用双轮驱动转为技术优先,导致字节系产品人才被边缘化 [2][12] - DeepSeek技术创新和科技大厂饱和式投入迫使四小强调整战略 [2] 字节跳动的产品基因与人才输出 - 字节凭借今日头条、抖音等超级APP成为"APP工厂",培养大批产品人才 [5] - 在AI时代仍保持产品力,推出豆包、即梦等头部应用 [7] - 移动互联网触顶导致字节内部人才冗余,加速高管出走创业 [7] AI应用领域的最新动态 - 明超平创办新言意码瞄准AI编程应用,对标估值200亿美元的Cursor [9][10] - Cursor近期获9亿美元融资,估值90亿美元,潜在新融资或使估值翻番至200亿 [11] 大模型行业竞争态势 - 四小强面临DeepSeek技术突破和融资环境恶化的双重压力 [15][16] - 月之暗面停止投流、MiniMax转向技术迭代、智谱专注基座模型 [16] - OpenAI将发布GPT-5,DeepSeek或推V4模型,引发新一轮性能竞赛 [19]
Prediction: After Losing More Than $1 Trillion in Market Cap Earlier This Year, This Monster Artificial Intelligence (AI) Stock Will Become the Most Valuable Business in the World by the End of the Year
The Motley Fool· 2025-06-19 01:08
市场表现与波动 - 英伟达(NVDA)在2025年成为人工智能领域最热门的股票之一,但今年表现挣扎,市值从年初的峰值3.7万亿美元下跌至4月低点,缩水约1.4万亿美元[1] - 公司股价在过去一个月左右出现反弹,几乎完全收复了之前的跌幅[2] - 2025年1-2月股价波动主要受中国AI初创公司DeepSeek进入市场的影响[3] 挑战因素 - DeepSeek声称使用英伟达较旧的芯片架构开发了低成本高性能AI模型R1,引发市场对英伟达最新GPU需求的质疑[5] - 3月市场担忧特朗普总统可能实施高关税政策,4月2日宣布对包括中国在内的全球商品征收新关税,特别是对中国的高关税影响英伟达增长[7] - 关税消息导致英伟达股价跌至2025年最低点[8] 复苏动力 - 美国与中国贸易谈判进展缓解了投资者紧张情绪[10] - 价值5000亿美元的Stargate项目将投资美国数据中心和AI基础设施,英伟达被列为关键技术合作伙伴[12][13] - 沙特阿拉伯和阿联酋启动了类似Stargate的倡议,英伟达已参与其中[14] 业务多元化 - 公司从硬件业务向软件平台扩展,开发了CUDA平台帮助开发者优化GPU使用[16] - 近年投资AI基础设施领导者CoreWeave和Nebius Group,向AI数据中心建设领域扩展[16] - 正在成为AI服务的全栈提供商,超越AMD等竞争对手[17] - 可能利用强劲收益进行收购,目标可能是机器人或自动驾驶等新兴领域[18] 市场前景 - 分析师认为股价可能迎来突破,市值超过3.5万亿美元,与微软争夺全球最有价值公司头衔[19] - AI基础设施投资的长期趋势和公司超越芯片设计的扩展努力是持续增长的核心原因[20]
不用GPS也能自主飞行,现在国赛的教育无人机都这么卷了?
机器人大讲堂· 2025-06-18 20:29
无人机技术发展 - 2025年睿抗机器人开发者大赛的无人机竞赛规则要求无人机无需GPS即可完成起飞、避障导航、目标识别、精准投放、返航降落等任务 [1] - 室内无人机面临定位难题,传统光流定位方案在纯色地板上失效,视觉SLAM受光线变化影响精度下降50%,UWB定位成本高且缺乏灵活性 [2] - 光子RC-L1采用激光雷达技术,不挑环境且每秒扫描几十万个点构建精确地图,但面临数据量爆炸问题,3米/秒飞行速度下100毫秒通信延迟导致30厘米位置偏差 [3] 无人机硬件创新 - 光子RC-L1搭载高性能处理器实现机载自主,支持10Hz建图频率和30Hz路径规划,提供手动、半自动和全自主三种模式切换 [5] - 采用扩展卡尔曼滤波融合飞控IMU数据实现连续平滑定位,整机重量仅2.3公斤,通过多处通风孔道设计解决散热问题 [6] - 实现系统级模块化设计,所有传感器模块采用统一供电标准和通信协议,支持激光雷达、双目相机、热成像仪等快速切换 [7] 软件与生态建设 - 基于ROS构建软件平台,开放路径规划模块源码,支持学生深入理解算法原理并实现自定义算法 [9] - 提供仿真功能实现"先虚后实"开发模式,可随机生成复杂环境地图进行算法测试后再部署到实机 [9] - 集成DeepSeek本地大模型,在保证飞行安全前提下完成自然语言理解、目标识别等AI任务,理解"飞到红色标志物上方"等语言指令 [13] 竞赛级设计优化 - 采用快拆结构设计,电设保护壳30秒可打开,机臂2分钟内完成更换,大幅降低维修时间和成本 [10] - 碳纤维机架提供优异强度重量比,全包式注塑桨保优先考虑防撞需求,5200mAh电池续航10分钟精确匹配竞赛时长 [12] - 软件设计考虑实战需求,提供一键起降、紧急停桨、指点飞行和预设航点等功能,兼顾新手和高阶用户 [12] 产业与教育变革 - 激光SLAM和机载AI技术从高端产品快速下沉至教育装备,ROS标准化和开源社区推动软件生态成熟 [16] - 培养模式从"操作员"转向"系统工程师",要求学生理解SLAM原理、修改路径规划算法、部署AI模型 [16] - 构建"硬件平台+开源软件+课程体系"完整生态,实现教学内容持续迭代,推动产教融合 [17] - 高校背景团队将顶刊论文算法转化为可运行代码,实验室原型机变为稳定教学装备,加速技术普及 [17]
MiniMax追着DeepSeek打
经济观察网· 2025-06-18 19:32
模型技术规格 - MiniMax M1模型支持100万个token的上下文长度,是DeepSeek R1(12.8万Token)的8倍,仅次于谷歌Gemini 2.5 Pro [1] - MiniMax M1总参数量为4560亿,每个token激活459亿参数,而DeepSeek R1总参数量6710亿但每个token仅激活370亿参数 [1] - 采用混合专家(MoE)架构,与DeepSeek R1相同 [1] 性能与成本优势 - 生成10万个token时仅消耗25%的浮点运算,64000个token推理任务计算能力需求不到DeepSeek R1一半 [2] - 强化学习阶段仅使用512块H800 GPU,耗时3周,成本53.5万美元,比预期低一个数量级 [2] - 核心技术包括线性注意力机制(Lightning Attention)和强化学习算法CISPO,后者通过裁剪采样权重提升效率 [2] 商业化定价策略 - API服务采用分级计费:0-32k Token档输入0.8元/百万Token,输出8元/百万Token;32k-128k档输入1.2元/百万Token,输出16元/百万Token;128k-1M档输入2.4元/百万Token,输出24元/百万Token [3] - 前两档定价低于DeepSeek R1(输入3.95元/百万Token,输出15.4元/百万Token),第三档为独有超长文本服务 [3] 行业动态与开源计划 - 宣布未来5天内每天发布一项新产品或新技术 [1] - 模型代码和权重已在Hugging Face和GitHub开源,支持透明检查与本地部署 [3] - DeepSeek R1曾以500-600万美元GPU成本训练出对标OpenAI o1的模型,引发行业争议 [2]
从空间服务商到生态连接器 WeWork中国升级灵活办公方案
新华财经· 2025-06-18 17:46
公司战略转型 - WeWork中国发布"悠座FLEXJOY"灵活办公智能解决方案 标志着从空间运营商向办公生态构建者的战略转型 [1] - 公司进入2 0时代 以"灵活 创新 科技"三大核心竞争力重构行业标准 [2] - 商业模式从单一租赁模式扩展到轻资产运营和系统合作模式 [2] 产品与技术 - "悠座FLEXJOY"是科技驱动的灵活办公智能解决方案 通过供需智能匹配 全链路技术支撑和生态赋能升级三大维度重新定义灵活办公 [4] - 产品功能包括24小时AI智能管家 一键开门 室内导航 远程控温等智慧功能 [4] - 系统可动态匹配闲置办公空间与灵活需求 打造行业"灵活办公连接器" [3][4] 市场布局与合作 - 公司在全国12座城市布局近70个社区 搭建灵活产品矩阵 [2] - 已与瑞安办公 BlueHub海蓝居等多家知名业主方达成"空间互联"合作 连接近100个合作办公空间 [2] - 与互影科技合作发布"互动内容生态合作平台" 帮助互动内容创作者实现创意落地 [4] 行业背景与定位 - 当前办公楼宇供给大于需求 空置率上升 但灵活办公需求未被满足 [3] - 上海市文创办期待公司发挥"产业连接器"作用 吸引AI文创科技团队扎根上海 [1] - 公司威海路社区项目已成为中国办公空间创新的"网红范本" 吸引千余家中外创新企业入驻 [1]
比我们想象还要震撼!“硅谷创投教父”霍夫曼深度剖析:当前的硅谷投资与科技趋势
聪明投资者· 2025-06-18 16:33
人工智能行业趋势 - 人工智能领域正处于爆发式增长阶段,每日有数千家新公司涌现,但大部分难以存续超过五年[8] - 企业级AI将成为2025年的关键成败之年,风投机构正密切关注其盈利能力[3][19] - 开源+蒸馏策略彻底改变竞争格局,使小型公司能以低成本训练高性能模型[3][31][33] - 垂直AI针对特定行业的需求将带来大量投资机会[43][44] - AI代理将成为最重要趋势,能够执行复杂任务并可能取代部分工作岗位[46][48][49] 投资格局变化 - 硅谷风投基金规模较2021年缩减60%,新基金募资额同比下降72%[15] - 市场呈现两极分化:少数公司获得巨额融资,如Dev Agents种子轮融资5600万美元估值达5亿美元[25],而多数初创企业面临资金短缺[23][24][26] - 风投机构转变策略,开始自行创办AI公司充当孵化器角色[17][18] - 小型创业团队凭借高效利用AI保持高生产力,吸引早期投资者关注[22] 技术创新方向 - 小型语言模型在特定领域表现优于大型模型,带来新的商业机会[40][41] - 机器人研发正追求更接近人类的能力,包括空间智能和情感识别[71][74] - 视频AI领域仍需强大计算资源,科技巨头仍具优势[34][35] - 新型算法研究可能使GPU训练速度提升1000倍,能效比提升10,000倍[96][97] 公司案例分析 - DeepSeek通过开源策略和模型蒸馏技术实现突破,成为全球性现象[28][29][31][33] - 初创公司如Emma开发"通用AI员工",由多个AI代理组成工作系统[49] - 牛津大学开发的ANA AI成为首个能提出并测试理论的AI科学家[52][53] - Goose平台提供开源AI代理构建工具,实现跨平台使用[56][57] 行业影响评估 - 未来10-20年内机器人可能以更低成本完成大部分传统工作[4][88] - 掌握机器人和AI技术的群体将控制大部分财富[89] - AI不会真正拥有人类意识,但其拟人化能力将大幅提升[106][107] - 技术变革规模将远超工业革命,每个企业都需思考应对策略[89]
200亿AI独角兽反击,MiniMax首款推理模型对标DeepSeeK,算力成本仅53万美元
华尔街见闻· 2025-06-17 19:57
核心观点 - 中国AI独角兽MiniMax推出首款推理模型M1,性能接近海外顶尖模型,部分任务超越DeepSeek、阿里、字节及OpenAI等[1][3] - M1采用混合专家架构和线性注意力机制,支持100万Token上下文输入,与谷歌Gemini 2.5 Pro并列业内最高[3] - 训练成本仅53.74万美元(约380万人民币),比预期少一个数量级[1][6] - 在生成64K token时算力消耗不到DeepSeek R1的50%,100K token时仅为其25%[1][7] 模型性能 - 总参数4560亿,每token激活参数459亿[3] - 在17个评测集中,SWE-bench软件工程能力测试超过55%,长上下文理解任务全球第二[4] - 数学测试AIME 2024得分86.0,接近Gemini 2.5 Pro的91.6[5] - 长上下文任务OpenAI-MRCR(128k)得分73.4,超越Claude 4的76.8[5] 技术架构 - 采用混合专家(MoE)架构和线性注意力机制(Lightning Attention)[3] - 开发新型强化学习算法CISPO,比字节DAPO算法训练效率提升2倍[6] - 使用512块英伟达H800 GPU训练三周完成强化学习[6] 商业策略 - 模型已开源并在MiniMax APP/Web端免费升级[8] - API采用区间定价策略,128k-1M区间价格显著低于DeepSeek-R1[8] - 被开发者评价为"性价比新王",成为继字节豆包后的"价格杀手"[8] 行业定位 - 公司为腾讯和阿里巴巴支持的"AI六小龙"成员[9] - M1是5天发布周的首个产品,后续将推出智能体应用及视频/音乐模型[9] - 创始人称"第一次感觉到大山不是不能翻越",展现技术突破信心[1][9]
创投观察:一级市场投资,回暖了?
搜狐财经· 2025-06-17 19:23
一级市场投资回暖迹象 - 2025年上半年VC机构投资项目数量达2024年全年的80%,市场热度自2024年下半年明显上升,部分项目出现一年内融资2-3轮的现象[1] - 生物医药领域BD交易活跃叠加港股创新药板块表现良好,系统性退出机会增加,投资人对创新药信心回升[1] - AI和人形机器人企业(如DeepSeek、宇树科技)崛起形成新投资风口[2] 回暖驱动因素 - 政策支持力度加大、二级市场估值修复、退出预期增强形成三重叠加效应[2] - A股退出预期改善及港股IPO市场活跃推动投资人建议企业"坚持发展"而非并购退出,与2024年策略形成反差[1] - 2025年5月新增备案基金353只(同比+34%),总规模达1452亿元(同比+28%)[2] 市场结构性分化 - 实际投资事件数量与金额同比未显著增长,新基金设立数量上升反映情绪回暖先于实质行动[2] - AI赛道资本狂热与其他领域募资难、退出不畅并存,市场化资金尚未大规模进场[2] - 行业全面回暖需满足市场化LP活跃、长线资金进场、IPO退出通畅、并购/S基金交易增多四大条件[2] 积极信号显现 - 银行保险等长线资金逐步入场,政府引导基金返投要求放宽[3] - 政策持续释放利好,IPO退出预期增强,预示一级市场可能迎来结构性突破[3]
网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一
量子位· 2025-06-17 15:41
大模型竞技场最新战报 - DeepSeek新版R1在网页编程领域超越Claude Opus 4,成为当前第一 [1] - Claude Opus 4此前被公认为"全球最强编码模型",此次被超越显示竞争格局变化 [2] - DeepSeek-R1-0528在LiveCodeBench上的表现接近OpenAI o3-high水平,引发市场对其可能是R2版本的猜测 [3] 编程能力测试数据 - 在编程测试中,DeepSeek-R1-0528以73.4分排名第四,仅次于04-Mini(79.5)、03-High(75.4) [4] - 在Easy难度测试中达到98.3分,接近最高分98.8 [4] - Medium难度表现优异,以83.4分超过部分竞品 [4] - Hard难度得分52.7,显示在复杂编程任务上仍有提升空间 [4] 实际应用测试表现 - 制作太阳系动画应用仅需49秒生成Python代码,运行后产生基本动画效果 [6][7][9] - 使用Three.js实现交互式太阳系模拟仅需34秒完成设计 [10][11] - 创建AGI主题网页仅用23秒生成完整HTML/CSS/JavaScript代码 [14][15] - 开发俄罗斯方块游戏12秒生成Python代码,但存在明显bug [17][18][20] 行业地位与竞争优势 - DeepSeek-R1-0528在LMArena.al总榜排名第六,是当前最好的开源文本模型 [25][26] - 在细分领域表现:困难提示排名第4,数学排名第5,显示多领域竞争力 [27] - 采用MIT许可证,相比闭源模型(如Claude、GPT系列)更具开放性和可获取性 [26][27] - 对国内用户更友好,免费且易于获取,形成本地化优势 [24] 行业竞争动态 - Kimi新模型Kimi-Dev以72B参数量在SWE-bench Verified上取得60.4%成绩,创开源SOTA [29] - Kimi-Dev表现优于DeepSeek-R1,并与闭源模型竞争激烈,显示开源模型快速进步 [30] - 主要闭源模型仍占据优势,Gemini-2.5-pro-preview在多个细分领域排名第一 [28]
MiniMax发布推理模型对标DeepSeek,算力成本仅约53万美元
第一财经· 2025-06-17 15:26
公司动态 - MiniMax宣布连续五天发布重要更新,首日开源推理模型MiniMax-M1 [1] - MiniMax-M1在多项基准测试中表现优异,比肩DeepSeek-R1、Qwen3等开源模型,接近海外领先模型 [3] - 模型训练效率超出预期,仅用3周时间、512块H800 GPU完成强化学习训练阶段,算力租赁成本53.47万美元 [3] - MiniMax-M1在编程能力测试中表现突出,一次通过"拆烟囱"编程案例,优于DeepSeek-R1-0528和Gemini-2.5-Pro [3] - 模型中文写作严谨优先,幻觉较低,注重指令遵循 [5] - MiniMax-M1拥有100万上下文窗口长度,与Gemini 2.5 Pro相当,是DeepSeek R1的8倍 [5] - 在长上下文理解任务(MRCR)中表现优异,超越所有开源权重模型和部分海外顶尖模型,全球排名第二 [5] - 在TAU-bench测试中表现出色,超越DeepSeeK-R1-0528和Gemini-2.5 Pro,仅次于OpenAI o3和Claude 4 Opus [7] - 在代码能力(SWE-bench)上显著超越大部分开源模型,仅微弱差距次于DeepSeek最新发布的R1 [7] - MiniMax提出创新强化学习算法CISPO,在数学AIME实验中比字节DAPO算法收敛性能快一倍 [8] - 模型定价采用阶梯式,对标DeepSeek-R1性价比更高 [8] - MiniMax预告后续四天将有更多更新,业界预期海螺新版本即将亮相 [9] 行业动态 - 月之暗面同日开源编程模型Kimi-Dev-72B,基于阿里云Qwen2.5-72B微调 [8] - Kimi-Dev-72B在SWE-bench编程基准测试中取得全球最高开源模型水平,成绩超过新版DeepSeek-R1 [8] - 但实际测试显示Kimi-Dev-72B生成的代码需要修改多个bug才能运行,引发过拟合质疑 [9] - AI六小龙经过半年沉寂后重新加入大模型竞争 [9] - 云启资本合伙人陈昱表示长文本能力对社交应用、情感陪伴应用和Agent是关键技术 [7] 技术亮点 - MiniMax-M1训练材料足够新,思考时多次反刍成功避坑 [3] - 闪电注意力机制为主的混合架构使长文本处理具有算力效率优势,8万Token推理只需DeepSeek R1约30%算力 [7] - CISPO强化学习算法显著优于DeepSeek早期使用的GRPO [8] - 模型在样式和光影效果方面仍有不足,创意内容生成能力有限 [5]