DeepSeek

搜索文档
速递|OpenAI最大金主微软下场大模型,挑战OpenAI,以支持微软Copilot等产品
Z Potentials· 2025-03-10 11:07
微软的 MAI 模型,最终可能减少该公司对 OpenAI 的依赖。 微软已向 ChatGPT 的制造商投资约 130 亿美元,两家公司之间的关系一直是科技行业圈内讨 论的话题。 微软和 OpenAI 最近重新谈判了他们的协议,并于 1 月宣布,只要微软本身不想要这项业务, OpenAI 就可以使用其他云计算竞争对手的服务器来支持其服 务。他们的协议将持续到 2030 年。 图片来源: 微软 微软公司已开发出内部人工智能模型,据知情人士透露,该公司认为这些模型能够与包括合作伙伴 OpenAI 在内的行业领导者一较高下。 该消息表示,微软正在开发的一系列模型最近产生的测试结果表明,它们与包括 OpenAI 和 Anthropic 产品在内的最先进竞争对手具有竞争力。 这家总部位于华盛顿州雷德蒙德的公司,已经测试了名为 MAI 的模型在各种任务中的表现,包括为公司的 Copilot AI 助手提供支持。 Copilot 旨在处理广 泛的用户问题,并为处理文档或参加电话会议的人提供具体建议。 微软也在开发所谓的推理模型,旨在处理更复杂的查询并展示类似人类的问题解决能力。 OpenAI 和 Anthropic ,以及 ...
3700 次预训练寻找 “线性注意力” 非共识,MiniMax-01 开发者讲述 4 年探索
晚点LatePost· 2025-03-09 20:00
线性注意力机制的发展历程 - 线性注意力机制从2021年开始探索,当时被视为"看起来很美好的泡泡",但公司团队坚持投入研发 [5][21] - 2023年底验证了15B规模的纯线性方案效果接近Transformer,但发现召回能力存在缺陷 [35] - 最终采用7层线性注意力混合1层Softmax注意力的架构,在4560亿参数模型上实现应用 [36][37] 技术优势与验证过程 - 线性注意力理论计算复杂度从二次降为线性,长序列处理速度比Full Attention快2700倍 [11][44] - 通过3700次预训练测试验证技术可行性,涵盖不同参数规模和架构方案 [41][42] - 在7B参数以上模型规模时,线性注意力优势开始明显显现 [16][17] 行业竞争格局 - 线性注意力与稀疏注意力是当前两大改进方向,2023年后线性方向热度上升 [17] - 公司认为线性架构上限更高,未来在长文本赛道具备优势 [50][51] - 目前行业对线性注意力仍存在非共识,部分认为其属于有损优化 [52][53] 产品化与战略布局 - 公司将80%研发资源投入线性架构模型开发,视为重大战略转型 [31][48] - 下一代计划推出深度推理原生多模态模型,预计4-5月发布 [58][60] - 开源4560亿参数模型MiniMax-01,但未提供小尺寸版本 [57] 技术挑战与解决方案 - 线性注意力存在GPU并行化难题,通过Lightning Attention提升实际运行效率 [22] - 召回能力缺陷通过混合架构解决,测试不同比例后选择1:7方案 [36][38] - 多模态实现采用adapter形式而非原生方案,以快速验证效果 [48]
“实习生也月入过万”,AI行业严重缺人
虎嗅APP· 2025-03-09 17:30
AI行业人才需求与薪资趋势 - 互联网大厂正全力挖掘AI领域人才,包括顶尖精英和基础岗位员工,阿里巴巴AI To C业务开放数百个岗位,腾讯元宝也开启热招[3][4] - 超级独角兽DeepSeek招聘岗位年薪至少50万元,深度学习研究员最高年薪超176万,AGI实习生日薪500-1000元可月入过万[6][7] - 猎聘数据显示近一年AI技术热招TOP5岗位中30.97%年薪超50万,算法工程师、深度学习等岗位超38%年薪达50万+[7][17] 人才流动与职业转型 - 传统程序员因担忧被AI取代而转向AI岗位,跳槽至AI相关岗位薪资涨幅可达30%,显著高于其他计算机行业[13][14] - 初级程序员积极转型AI,IT从业者需全面拥抱AI技术,"熟练使用AI软件"或成简历标配[12] - 数学、机械等理工科背景人才通过自学进入AI领域,数学系学生因算法与数学公式的关联性具备优势[28] 行业人才缺口与招聘现状 - IDC预测2026年三分之二云应用将使用AI,麦肯锡预计2030年中国AI人才缺口达400万[22] - 阿里巴巴2025春招中近50%实习生岗位与AI相关,高德AI岗位占比65%,阿里云超80%[23] - 猎聘平台AI技术人才紧缺指数(TSI)达3.24,新壹科技等企业HR每日迫切等待AI专精类和场景运营人才[24] 企业用人痛点与人才要求 - 大模型算法工程师招聘中400人仅1人符合要求,且多为单一方向专精而非全面人才[27] - 企业注重候选人基础能力与系统性思维,需理解技术对上下游的影响,实际动手能力是关键[27][28] - 复合型人才稀缺,既懂AI技术又理解业务场景的应聘者极少,高校培养与产业需求存在差距[29] 行业前景与挑战 - OpenAI以1000万美元天价年薪招人,国内大厂为硕士毕业AI人才提供月薪4-6万元[15][16] - AI创业公司如"AI六小龙"出现人员调整,智谱AI缩减上百人,MiniMax减员约50人[36] - 大厂采用内部"赛马"机制开发基座大模型,竞争可能导致部分员工去向不明[37]
两位90后火了
投资界· 2025-03-09 15:47
公司概况 - 公司Monica.im母公司为"蝴蝶效应",由肖弘于2022年创立,聚焦AI应用市场,团队base北京和武汉光谷 [3][8] - 创始人肖弘1992年出生,华中科技大学毕业,曾创办夜莺科技并出售给独角兽公司,联合创始人季逸超同为1992年出生,北京信息科技大学本硕毕业 [3][5][8] - 公司产品包括ChatGPT for Google和Monica.im,后者在海外实现超千万美元ARR(年度经常性收入) [8] - 最新产品Manus AI定位为"首个通用AI代理",强调自主执行能力而非仅生成想法,发布后迅速引发市场关注 [8][11] 融资与估值 - 公司已完成两轮融资,投资方包括真格基金、红杉中国、腾讯及王慧文 [3] - 2023年估值约1亿美元,当前因产品爆火估值预期大幅上升 [2][4] - 母公司"蝴蝶效应"获真格基金全额再投资,资金来源于肖弘上一项目退出收益 [8] 团队与招聘 - 团队正通过BOSS直聘招聘数十个岗位,涵盖技术、运营、设计等,薪资范围4k-40k,多数岗位base武汉 [12] - 创始人肖弘强调武汉创业优势,包括熟悉环境及母校资源支持,公司总部与华中科技大学仅一街之隔 [12][13] 行业竞争格局 - 中国AI头部企业多与顶尖高校关联,如"大模型五虎"中四家核心团队来自清华大学,智谱AI近半年累计融资超40亿元人民币 [16] - 清华大学与浙江大学为AI人才主要输出地,浙大系代表企业包括DeepSeek(创始人梁文锋)及"杭州六小龙"部分成员 [17] - 2024年全球生成式AI专利数据显示,浙江大学与清华大学新增专利数量断层领先 [17] - 高校加速AI人才培养,清华大学成立通识书院,浙江大学牵头5所C9高校共建"AI+X"微专业 [18]
120万年薪!华为小米砸钱抢AI大模型研发人才;我国AI人才缺口达500万人,在校生仅4万人,清华拟扩招150名本科生丨AI周报
创业邦· 2025-03-09 11:27
国内AI动态 - 中国团队发布通用型AI Agent产品Manus,在GAIA基准测试中取得SOTA成绩,性能超越OpenAI同层次大模型,其邀请码被炒至5万元[4][5] - 腾讯混元上线并开源新图生视频模型,用户可通过图片生成5秒短片,模型已在腾讯云上线并提供API接口[6] - 腾讯元宝APP超越DeepSeek登顶苹果中国区免费APP下载排行榜,引发行业对"资源驱动"与"技术驱动"模式的讨论[6][7] - DeepSeek披露V3/R1推理系统理论日利润高达346万元人民币,理论成本利润率545%,但实际收入远低于理论值[8][9][10][11] - 阿里推出QwQ-32B大语言模型,仅具DeepSeek-R1 1/20参数量即可媲美后者性能[14] - 字节跳动发布国内首个AI原生IDE工具Trae,支持切换DeepSeek R1&V3模型[19] - 我国AI人才缺口达500万人,而人工智能专业在校生仅约4万人,清华大学拟扩招150名本科生重点培养AI人才[20][21] 海外AI动态 - OpenAI计划推出月费2万美元的博士水平AI Agent,并宣布GPT-4.5向所有Plus用户开放[22] - 亚马逊进军推理AI模型领域,或于6月推出Nova品牌下的新产品,AWS成立新团队专注于Agentic AI[25][26] - OpenAI拟将视频生成工具Sora整合进ChatGPT,并正在开发Sora Turbo升级版[26] - 软银洽谈融资160亿美元专门投资人工智能项目,此前已完成185亿美元借款[28] - 微软对OpenAI的130亿美元投资获得英国监管机构批准[28] - 富士康计划在墨西哥投资9亿美元建设全球最大AI服务器组装工厂,产品将使用英伟达GB200芯片[28] AI投融资概况 - 本周全球披露AI融资事件12个,总融资规模274.82亿元人民币,平均融资金额39.26亿元[33] - 融资阶段分布:早期7个、成长期2个、后期2个[34] - 国内融资集中在上海(4起)、北京(3起)、广东(2起),总额26.39亿元[35][37] - 海外融资总额248.43亿元,最大单笔为Anthropic完成的35亿美元E轮融资[40][41] 技术突破与产品创新 - 上海人工智能实验室发布全球首个人形机器人自主站立控制算法[20] - 全球首个人形机器人半程马拉松将于4月在北京亦庄举行[20] - 智谱发布业界首个能生成汉字的开源文生图模型CogView4,支持中英双语输入[14] - 亚马逊推出新型量子计算芯片Ocelot,可使量子纠错成本最高降低90%[30]
Bold Prediction: 1 Stock That Could Be Worth More Than Nvidia 7 Years From Now
The Motley Fool· 2025-03-08 21:45
文章核心观点 - 英伟达是长期优质投资标的,其估值飙升源于人工智能崛起,但另一家芯片制造商超威半导体长期来看可能挑战英伟达地位,且超威半导体估值较低,适合耐心的成长型投资者 [1][2][11] 人工智能行业发展情况 - 人工智能创新近年来飞跃,ChatGPT每月有数十亿访问者,月活用户超4亿,且面临其他模型竞争 [3] - 企业端人工智能采用率虽美国整体低于10%,但增长空间大,变革性技术影响力可能被低估 [4] - 麦肯锡研究显示,仅生成式人工智能商业应用经济影响可达2.6万亿至4.4万亿美元,到2040年人工智能软件和服务收入将从2022年的850亿美元增至1.5万亿至4.6万亿美元 [5] 英伟达情况 - 英伟达自1999年以来股价涨幅超285000%,市值达数万亿美元,其图形处理单元在人工智能领域市场份额70% - 95% [1][6] 超威半导体情况 - 超威半导体目前技术能力和供应商锁定方面处于劣势,但研发预算占营收约25%,高于英伟达的10% [8][9] - 超威半导体持续投资使其推出游戏显卡,在人工智能图形处理单元方面逐渐追赶英伟达,还将加速产品发布 [10] - 超威半导体市值和估值远低于英伟达,虽超越英伟达困难,但鉴于市场需求增长,是耐心成长型投资者的投机之选 [9][11]
梁文锋,去香港了?
华尔街见闻· 2025-03-08 17:53
DeepSeek香港布局 - DeepSeek于2月5日在香港旺角和尖沙咀注册两家公司(DeepSeek Limited和DeepSeek (HK) Limited),或筹划建立香港总部 [2][4] - 公司近期热度飙升,创始人梁文锋行踪受关注,汇金国际大厦办公地点日均近百人造访但难接触 [3] - 香港国际化站位可助力公司全球化战略,并可能为未来上市融资铺路 [4] 香港人工智能产业政策 - 香港2025/2026财年预算预留10亿港元成立人工智能研发院,2024年推出30亿港元AI资助计划支持超算中心算力使用 [6][12][13] - 政府目标2027年实现130条智能生产线,70个部门试用本地首个大模型HKGAI V1 [12] - 引进重点企业办公室已吸引66家重点企业,其中80%计划设立全球/地区总部 [9][10] 人才竞争与招聘策略 - DeepSeek招聘年薪最高达154万港元(深度学习研究员-AGI),核心岗位要求博士学历及顶会论文成果 [5] - 香港4所大学AI专业进入全球前40(港科大第10),高素质人才供给优势显著 [5][6] - 香港通过人才入境计划已批出27万宗申请,18万人到港 [9] 香港AI生态发展 - 数码港和科学园汇聚超800家AI企业,政府推动算力中心、国际机器人大会等基础设施 [12][14] - 非本地企业获资助需承诺在港落地并雇佣专业人员,强化本地生态 [13] - 特首施政报告提出100亿港元"创科产业引导基金"支持AI等新兴产业 [6]
速递|微软“去OpenAI化”计划浮出水面,自研AI模型MAI来了
Z Finance· 2025-03-08 17:44
微软自主研发AI推理模型 - 微软正在自主研发人工智能推理模型以抗衡OpenAI并可能向开发者出售这些模型[1] - 公司已在Copilot智能助手产品中测试由xAI、Meta及DeepSeek开发的模型作为OpenAI技术的潜在替代方案[1] - 此举表明微软在深化与OpenAI合作的同时通过技术多元化策略降低对其核心依赖[1] 技术替代与成本优化 - 微软正通过整合内部及第三方AI模型为Microsoft 365 Copilot提供技术支持以突破对OpenAI的单一依赖并降低运营成本[1] - 2023年发布的365 Copilot核心卖点是采用OpenAI的GPT-4大模型[1] - 由Mustafa Suleyman领导的微软AI团队已完成代号为"MAI"的系列模型训练[1] 模型性能与商业化计划 - MAI系列模型在行业通用基准测试中表现已接近OpenAI和Anthropic的顶尖模型[2] - 团队正在开发基于思维链技术的推理模型可能与OpenAI形成直接竞争[2] - 计划今年晚些时候以API形式开放MAI模型使外部开发者能集成至自有应用程序[2] 战略背景与行业趋势 - 技术自主化战略推进正值微软通过早期投资OpenAI在AI军备竞赛中占据先发优势之际[2] - 科技巨头在保持生态合作的同时构建自主技术护城河已成为AI产业发展新常态[2]
账号解冻了!Manus最新回应
21世纪经济报道· 2025-03-08 13:03
公司动态 - ManusAI官方账号已恢复运营 强调是唯一官方渠道 并预告将继续分享AI用例 [1] - 公司联合创始人季逸超澄清Manus从未参与任何加密货币项目 与区块链相关的虚拟货币提法均为虚假 [2] - 公司账号此前遭冻结 初步判断与第三方虚拟货币指控有关 正在寻求法律手段应对恶意举报者 [2] 公司背景 - Manus由北京红色蝴蝶科技(Monica.im)发布 成立于2023年7月 注册在北京海淀区 [4] - 创始人肖弘为连续创业者 曾创办武汉夜莺科技和"蝴蝶效应"公司 其AI浏览器插件Monica已有1000万用户 [4] - 联合创始人季逸超为技术型创业者 产品合伙人张涛曾任神策数据副总裁和字节跳动国际化产品负责人 [5] 业务发展 - Manus作为通用型智能体产品引发市场关注 被与DeepSeek相提并论 [4] - 公司在海淀和武汉设有办公地点 员工总数60人 武汉团队约50人负责主要研发任务 [5] - 产品爆火后访问量激增 武汉和北京团队紧急协同加班应对需求井喷 [5]
代表委员热议高科技产业技术突破:创新“尖兵”不断涌现,中国产业竞逐全球科技高地
证券时报· 2025-03-08 08:31
文章核心观点 科技创新是企业立足世界和国家掌握话语权的关键,今年两会“创新”成热门话题,AI和机器人等产业成创新“尖兵”,中国在多产业站到全球高地,但科技创新生态在资金、研发等方面存在痛点 [1][3][9] 分组1:两会聚焦创新 - 科技创新决定企业能否立足世界和国家话语权,今年政府工作报告“创新”出现40次 [1] - 今年中国科技突破不断,使“创新”成两会热门话题 [1] 分组2:AI和机器人成创新“尖兵” - 人形机器人产业创新成果显现,两会现场有人形机器人记者参与报道 [4] - 何小鹏认为中国具身智能5 - 15年将成巨大产业,在全球领先 [5] - 聂鹏举认为人形机器人及其核心零部件发展是科技进步与产业升级的“关键支点” [5] - 2025年政府工作报告3次提“人工智能”,强调推进“人工智能+”行动 [5] - 齐向东表示人工智能会影响千行百业,带来跨越式发展 [5] 分组3:中国未来产业竞逐全球高地 - AI产业成中国冲刺全球科技高地“尖兵”,多个产品表现出色,中国生成式人工智能使用率达83%领先全球 [7] - 朱松纯认为中国发展人工智能有大数据、产业门类和人才优势 [7] - 近3年中国工业机器人装载量超全球二分之一,预计2030年全球具身智能市场规模超200亿美元 [8] - 截至2024年底全国人形机器人企业近百家,30多家宣布2025年商业化量产,预计2025年国内上万台投入市场 [8] 分组4:创新生态建设仍存堵点难点 - 李东生认为中国科技制造业存在融资痛点,资本市场融资规则难匹配投资需求 [10] - 马新强表示现有体系缺乏对失败经验的包容,科研经费和资源存在“代际垄断” [10] - 高校学科评估周期难以及时响应新兴领域变化 [10]