AGI
搜索文档
“实习生也月入过万”,这一行业严重缺人
盐财经· 2025-03-04 18:45
AI行业人才争夺现状 - 互联网大厂正以最大能量挖掘AI领域顶尖人才 包括与AI论文作者单独见面[1] - AI To C业务开启大规模招聘 阿里巴巴开放数百个岗位 腾讯元宝同时开启热招[2] - 行业高薪成为普遍现象 近三分之一AI技术岗位年薪超过50万元[5] 薪资水平与涨幅 - 超级独角兽DeepSeek提供年薪至少50万元岗位 深度学习研究员最高年薪超176万元[4] - AGI实习生日薪达500-1000元 可实现月入上万[4] - AI岗位跳槽薪资涨幅达30% 显著高于其他计算机相关行业[10] - 算法工程师 深度学习 机器学习岗位中31-38%年薪超过50万元[13] 人才供需状况 - AI技术人才紧缺指数达3.24 处于高度供不应求状态[20] - 2030年中国熟练AI专员需求将达600万 但供应量仅200万 存在400万缺口[18] - 企业招聘面临痛点 400名应聘者中仅1人符合大模型算法工程师要求[23] - 阿里巴巴春招3000个实习生岗位中近50%与AI相关 部分部门占比超80%[19] 人才要求与培养 - AI算法岗要求高学历背景和论文成果 注重基础能力与系统性思维[23] - 企业急需既懂AI技术又能理解业务场景的复合型人才[25] - 理工科学生通过自我驱动学习进入行业 数学系学生因算法优势适合AI领域[24] - 高校人才培养与产业需求存在差距 AI种子难以快速满足企业需求[25] 行业前景与挑战 - 2026年三分之二云应用将使用AI 八成企业需要AI熟练工[18] - AI创业公司出现人员调整 AI六小龙中5家去年下半年进行人员优化[29] - 大厂采用内部赛马机制 在文本 图文 视频等方向存在资源竞争[30] - 尽管存在泡沫 但社会关注与大厂入局形成势能 推动技术落地[31]
智谱完成超10亿元战略融资:今年为其「开源年」,杭州押注下一个DeepSeek
IPO早知道· 2025-03-03 09:16
融资与战略布局 - 公司完成超10亿元人民币战略融资,投资方包括杭州城投产业基金、上城资本等 [2] - 在杭州成立浙江智谱新篇科技有限公司,服务浙江省和长三角地区经济实体,推动数字产业转型升级 [2] - 2024年1月被美国商务部列入实体清单,但公司强调将继续提供世界一流的大模型技术并参与全球竞争 [2] 技术实力与产品 - 研发国产独立知识产权的GLM大模型预训练架构,最新基座模型GLM-4-Plus技术实力世界领先 [3] - 在Agentic LLM方向优势明显,先于OpenAI提出Phone Use概念并推出Agent产品AutoGLM及GLM-PC [3] - 构建开放平台bigmodel.cn,以Model as a Service(MaaS)理念推动AI生态繁荣 [3] - 2024年推出基座模型GLM-4-Plus、Agent模型AutoGLM、推理模型GLM-Zero等,技术对标GPT [5] - GLM预训练架构实现全栈自主创新,包括底层算子、训练框架等核心模块自主研发 [5] 开源与生态 - 2024年是公司的"开源年",将发布全新大模型并开源 [3] - 适配国内40多种GPU芯片,推动进口替代 [5] - MaaS平台支撑70余万企业开发者,私有化部署服务金融、医疗等20多个行业,在万余家企事业单位应用 [5] Agent技术领先 - 2025年或将是Agent爆发年,公司在Agentic LLM领域具有领先优势 [7] - 与三星合作,将Agent体验带到Galaxy S25系列手机,支持实时语音、视频通话等功能 [9] - Agentic LLM将整合物理与数字世界资源,从被动应答转向主动执行,提升生产力 [10] AGI发展路径 - 公司将AGI分为五个层级:L1预训练大模型、L2对齐&推理、L3自我学习、L4自我认知、L5意识智能 [12] - 坚定朝着AGI方向努力,推动AI从学习知识到具备自我认知和探索能力 [17]
DeepSeek理论利润率高达545%!引大模型创业者线上互怼;字节商业化大调整,千川并入电商板块;官方回应极星汽车退出中国市场
雷峰网· 2025-03-03 08:27
DeepSeek成本利润率与创始人争议 - DeepSeek首次披露理论成本利润率545%,假设GPU租赁成本2美元/小时,日总成本87072美元,理论日收入562027美元[3] - 实际收入可能因V3定价较低和夜间折扣而减少[3] - 潞晨科技尤洋质疑DeepSeek-R1定价合理性,指出企业方可能面临每月4亿元亏损[5] - 硅基流动袁进辉与尤洋互指抄袭,尤洋称硅基流动组织水军抹黑,袁进辉反驳称潞晨科技多次抄袭[5][6] - 尤洋最终道歉并删除不当表述,潞晨科技宣布暂停DeepSeek API服务[6] 宇树科技与机器人赛道投资热潮 - 宇树科技老股转让火爆,C轮估值80亿元可能飙升至200亿元[9] - 投资人转向宇树供应商,包括不懂行的VC和山西煤老板,供应商估值快速攀升[9] - 40%认购宇树老股的客户来自海外,具身智能赛道投资回报率可能高于十倍[9] - 宇树科技创始人王兴兴澄清不实信息,强调老股转让由公司直接管理[10] 企业薪酬与组织调整 - 蚂蚁集团调整薪酬政策,17级及以下员工13薪并入月薪发放,18级及以上并入年度奖金[11] - 绩效股权激励从年度归属改为季度归属,每季度归属1/16[11] - 字节跳动商业化团队调整,技术中台保留,巨量千川并入电商板块[12] - 抖音电商2024年GMV达3.5万亿元,同比增长30%,2025年目标4.2万亿元[12] 公司业务变动与市场表现 - IBM中国投资公司停运,涉及1800名员工,此前已裁员1000多人并提供N+3补偿[14] - IBM在华业务量自2013年起减少,员工反映"没有活干"[14] - 小米SU7 Ultra首批交付19000台大定,锁单10000台,传统豪车增换购用户占比80-90%[19] - 莲花集团CEO冯擎峰疑似回应小米,强调弯道性能而非单纯堆积电机与马力[17] 国际科技动态 - 谷歌创始人布林要求员工每周工作60小时,以加速AGI突破[31] - 马斯克称特斯拉5年内利润增长1000%有可能,远高于分析师预估的258%[32] - OpenAI计划将视频生成工具Sora整合进ChatGPT,并推出更强大版本[33] - 微软宣布5月停止Skype服务,建议用户转至Teams[35] - 日产GT-R R35官宣停产,不再接受新订单[37]
DeepSeek正在取代的工作
投资界· 2025-03-02 14:53
以下文章来源于智谷趋势Trend ,作者知远 智谷趋势Trend . 新中产的首席财富顾问 时代车轮滚滚而来。 作者 | 知远 来源 | 智谷趋势Trend (ID:yuanfangguanchaju) 2025,开年即暴击。 大年初九,一份聊天记录在社交平台广为流传。"韩束"母公司上美股份创始人吕义雄在工作群部署 "用AI替代人工" ,各部门裁员的 比例赫然在目: 法务 部门50%的人要淘汰,只留20%能用AI的人; 客服 部门95%的人要淘汰,只留5%能用AI的人; 新品创新中心 70%的人要淘汰,只留30%能用AI的人以及工艺把控的人; 内容创新部门 80%的人要淘汰,只留20%能用AI的人,一个团队做出20个团队的活。 尽管其后来回应"不是裁员,只是有些地方加人,有些地方减人,让运营更科学化,更有效率",但这无疑也变相承认了一些人终将被 替代的现实——赤裸裸的"适AI者生存"。 曾为DeepSeek逆袭ChatGPT而振臂欢呼的打工人,没有想到,AI会这么快就兵临城下,威胁饭碗。 变化之迅猛,可能比很多人想象的更剧烈。 活都让AI干了,普通人还能守住工作吗? 01 电视台一定需要主持人吗? 餐厅一定需 ...
大模型 “注意力简史”:与两位 AI 研究者从 DeepSeek、Kimi 最新改进聊起
晚点LatePost· 2025-03-02 14:10
大模型注意力机制改进 - 近期DeepSeek和Kimi分别推出NSA和MoBA架构,聚焦改进大模型核心机制"注意力机制",旨在提升长文本处理能力[4] - 注意力机制优化需解决两大瓶颈:显存开销随序列长度线性增长、计算复杂度呈平方级增长[16] - 稀疏注意力成为主流改进方向,通过仅保留关键连接提升效率,数学上Softmax机制天然支持稀疏性[16] 技术实现路径 - NSA采用硬件协同设计,在Block级别进行稀疏计算,利用Triton框架优化GPU并行效率,实现11.6倍解码加速[24][31] - MoBA创新性地在预训练阶段引入稀疏性,通过混合分块注意力保留远距离关键信息,效果超越稠密注意力[20][37] - 两种方案均采用动态稀疏机制,结合内容相关性动态选择关注区域,平衡效率与效果[38] 性能验证 - NSA在270亿参数模型训练中,损失曲线与稠密注意力趋同,推理任务表现更优[42][46] - MoBA在Llama-8B模型测试中,GSM8K数学推理得分达0.7278,优于稠密模型的0.7142[49] - 长文本专项测试显示,32K输入下末端1K词元预测损失显著降低[43] 行业应用前景 - 多模态发展将大幅增加输入长度,1小时视频相当于100万token,需开发跨模态注意力模式[55] - 长思维链生成成为RL训练关键,DeepSeek-R1显示输出长度随训练步数持续增长[26][28] - 科研场景被视为AGI重要突破口,需存储数月研究过程数据并支持复杂推理[59][62] 硬件与算法协同 - GPU显存发展滞后算力增长,B200显存仅为A100的1.2倍,迫使算法层压缩存储需求[53] - 系统层优化如FlashAttention使显存占用降低量级,算子级优化成为效率突破关键[20][35] - 未来可能结合RNN固定存储优势与注意力机制,探索存储复杂度新平衡点[53]
用DeepSeek帮医院做临床试验,「新视焰」获数千万元A+轮融资 | 早起看早期
36氪· 2025-02-28 22:28
公司融资与业务发展 - 数字化临床研究企业"新视焰"完成数千万元A+轮融资,由浙江省"4+1"生物医药与高端器械产业基金、夏尔巴投资、红杉中国种子基金等共同投资[3] - 2024年公司远程监查等核心业务总合同订单数千万[2][3] - 本轮融资将用于继续拓展医院,加速DeepSeek在临床试验行业的应用落地[3] 公司产品与服务 - 公司以数字化技术提升药物研发临床试验效率,聚焦"远程监查"、"受试者费用发放"环节,为申办方和医院提供数字化工具[3] - 远程监查系统已在150多家医院落地,服务70余家申办方,包括辉瑞、罗氏等跨国药企[3] - 新增功能包括纸质报告电子化、CRA数据地图、受试者费用发放等,解决医院和申办方痛点[4][5] 行业趋势与技术应用 - 药物临床试验场景适合AI落地,DeepSeek可辅助完成SDV、SDR等固定动作,并前置性预警执行风险[4] - AGI已在临床试验数据采集、治理、风险预警及决策支持等环节发挥作用,未来相当比例监查工作可由AI研究助手完成[6] - 临床试验数据质量大幅提升,海量研发数据为接入DeepSeek等大语言模型、训练AI智能体提供先决条件[3] 具体案例与数据 - 帮助南方一家三甲医院扫描130万页报告,占历年结题报告的1/4,全部完成预计五六百万页[5] - 开发"数据地图"功能解决CRA面临的多家医院信息化系统数据检索难题[5] - "受试者费用发放"功能解决补助发放滞后问题,提升受试者参与积极性[5]
对话中科闻歌王磊:DeepSeek给创业者带来的震撼与启示
中国经济网· 2025-02-27 07:41
行业趋势与市场动态 - DeepSeek AI智能助手在2025年春节前夕同时登顶中美iOS免费应用排行榜第一,因其技术优化、成本压缩及开源模式优势在全球AI大模型圈引发冲击波 [2] - 资本对大模型创业公司态度从技术信仰转向务实落地,金沙江创始合伙人朱啸虎从认为"大模型六小虎最佳命运是被大厂收购"转变为"今年最佳投资主题是China AI" [4] - 2024年12月美国AI数据分析公司Databricks获得100亿美元融资,创当年风险投资纪录,反映数据+AI市场前景广阔 [5] - 2025年预计成为AI+Agent元年,行业AI渗透率将迅速突破临界点,各领域AI应用将类似移动应用般爆发 [2][29] 技术创新与研发突破 - DeepSeek-R1采用MoE+RL(混合专家模型结合强化学习)技术路线,在仅有极少标注数据情况下显著提升模型推理能力,训练成本仅为ChatGPT的1/10-1/20 [6] - DeepSeek预训练Token规模达14.8万亿,验证Scaling Law(规模化法则)在预训练阶段的关键作用 [11] - 中科闻歌自研雅意大模型训练历时6-9个月,算力成本达数千万,最终使其基础模型进入全球主流榜单前十 [24][25] - 未来技术突破方向包括:降维Scaling Law、强化学习创新、端侧算力芯片发展,可能孵化出下一个英伟达级别的企业 [29] 企业战略与商业模式 - 中科闻歌采用"底层大模型+上层行业应用"双轨战略,2024年数亿级收入中超一半与雅意大模型直接相关,80%以上收入受益于其技术支撑 [3][5] - 公司智川X-Agent平台全面接入DeepSeek全系大模型,通过多模型支持帮助客户快速构建AI搜索、翻译、客服等应用,将复杂项目交付周期从6-9个月缩短至3个月 [2][14] - 商业模式核心在于数据与AI结合,认为二者分离如同"拿锤子盲目找钉子",参考Databricks和Palantir(市值近3000亿美元)的成功案例 [17] - 头部客户续约率近100%,连续签约5年客户占比高,但C端产品仍需等待时机推出 [17] 技术生态与产业影响 - DeepSeek通过开源技术论文、允许R1模型用于数据蒸馏训练,极大促进国内AI生态发展,缩小中美AI技术差距 [6] - 开源与闭源之争将持续存在,闭源模型在前沿探索中投入大量资源,应保护其知识产权成果,逐步开源是行业螺旋上升过程 [7] - 构建自主统一计算框架将推动国内GPU芯片生态建设,需AI开发公司与研发公司共同突破底层硬件优化 [8] - 决策智能化时代到来,需突破动态实时感知、长程规划等能力,错误决策可能带来灾难性后果 [28] 公司发展历程 - 中科闻歌2017年由中科院自动化所科研团队创立,初期专注AI+媒体领域,创始人王磊2018年飞行174次拓展业务 [3] - 2022年ChatGPT问世后果断投入大模型研发,虽面临财务压力但最终提升客户竞争力,2024年收入验证战略正确性 [24][25] - 经历AI 1.0(经典人工智能)、2.0(数据驱动深度学习)、3.0(生成式AI)三个阶段,成为少数跨越三个技术周期的企业 [16] - 早期抓住国家融媒体建设机遇,从县级市场切入,逐步拓展至金融、医疗、能源等领域,形成"技术立得住+业务接地气"的发展路径 [21][22]
微软CEO纳德拉最新访谈:开源是对赢者通吃的最大制约
IPO早知道· 2025-02-25 10:39
微软量子计算突破 - 微软发布全球首款拓扑量子芯片Majorana 1,采用半导体砷化铟和超导体铝材料,基于全新"拓扑"物质状态构建[3][4] - 该芯片历时近20年研发,目标在2030年前上市并实现百万量子比特规模,被视为量子计算的"晶体管时刻"[3][15][16] - 技术突破在于验证了马约拉纳零能模在新物相中的存在,使量子信息可被可靠隐藏和测量[15][16] 量子计算战略布局 - 微软采用软硬件分离策略,同时与中性原子、离子阱团队合作开发多种量子计算机类型[17] - 计划2027-2029年推出容错量子计算机,预计可容纳百万物理量子比特和数千逻辑量子比特[17] - 量子计算将专注于化学物理、生物学等非数据密集型但需探索指数级状态空间的领域[17][18] AI与量子计算协同 - AI可作为"模拟器的模拟器",量子计算则作为"自然模拟器",两者结合可生成合成数据训练更优模型[18] - 量子计算不会取代经典计算,但能增强高性能计算能力,尤其在材料科学等领域的模拟应用[17][18] AI市场格局判断 - 超大规模云服务(如Azure)和模型层将共存,但AI市场不会形成赢者通吃格局,企业客户会要求多供应商并存[7][8] - 开源模型将制约闭源垄断,政府监管也将介入防止私营公司主导AI领域[7] 计算基础设施需求 - AI工作负载(如ChatGPT)推动计算需求指数级增长,训练和推理阶段均需大规模计算集群[6][9] - 全球分布式计算集群成为刚需,需就近部署存储与计算资源以突破"光速限制"[9] AGI经济影响标准 - AGI实现的真正标志是全球经济增长率达到10%(当前发达国家平均2%),而非技术基准炒作[10][20] - 若实现10%增长,全球年新增价值将达10万亿美元(基于100万亿美元全球经济规模)[10] 智能成本与普及 - 遵循"杰文斯悖论",智能成本下降将刺激需求弹性,尤其在发展中国家医疗等领域的应用[14] - 智能需同时提升能力并降低成本,类似云计算通过弹性付费模式扩展市场的历史路径[14] 技术投资方法论 - 公司选择进入TAM(潜在市场总量)大且能容纳多个赢家的赛道,避免押注赢者通吃领域[8] - 研发需平衡短期需求与长期相关性,保持对失败的高容忍度以探索未来技术[23] 认知劳动演变 - 当前认知劳动可能被自动化,但会催生更高层次的认知任务,形成动态平衡而非完全替代[23][24] - AI工具应作为人类认知增强器,例如开发具备长期记忆的会议协调代理提升决策效率[25] 材料科学革命愿景 - 量子计算+AI有望加速新材料研发,目标在25年内实现传统需250年完成的工业革命级突破[25]
印奇携新身份公开亮相:聚焦「AI+车」,一个产业的发展节奏有时比方向更重要
IPO早知道· 2025-02-24 22:33
印奇对AI+车前景的判断 - 印奇认为AI+车可能是AI+第一个落地的核心应用场景[2] - 车是通向具身智能的必要路径[3] - AI+车未来有可能是第一个落地的场景 其最重要的应用场景是智驾和智舱[4] 产业发展节奏与载体选择 - 一个产业的发展方向和节奏 节奏比方向更重要[3] - 需要在技术成熟的最后3年冲刺期 同时找到一个最核心的载体[3] - 这波大模型时代是AI创业者最幸福的时代 技术上最让人兴奋的是AGI 载体上可能就是车[3] AI+与+AI的区别及现状 - 过去十年+AI最重要的两个成功案例是特斯拉和抖音 是原有产业领军者用AI给产业做的巨大赋能[4] - AI+是AI大模型时代全新的应用 AI比重得超过50% 创造的价值是10倍的价值 但目前这样的应用还没有出现[4] 智驾领域发展预测 - 围绕智驾领域 未来3年进入收敛期 L3 L4逐步推广 这会是车生态智能化的开端[4] - 按篮球比赛来讲 可能是第一节刚打完[4] - 大模型在车上的Agent应用是非常有潜力和有希望的一个点[4] 千里科技合作动态 - 千里科技联合吉利汽车集团 阶跃星辰宣布将加强三方现有技术合作伙伴关系 推动AI+车的深度融合[4] - 通过AI大模型 端到端智驾 驾舱融合等技术的突破 智能汽车体验将实现从量变到质变的跨越[4] - 将在模型优化 产品定义和软硬件研发等领域全面合作 共同打造更安全 更舒适的智能出行体验[4]
晚点对话王小川丨不是文本创作、不是物理模型,AGI 的尽头是生命科学
晚点LatePost· 2025-02-10 17:50
公司战略与定位 - 百川智能聚焦医疗领域,认为医疗是大模型皇冠上的明珠,而非垂直场景,因医疗需求不会被超级模型覆盖[7][19] - 公司提出"造医生等价于AGI",将医生职业复杂度作为AGI标尺,计划2025年实现AI医生助理覆盖海淀居民[7][9][61] - 采取"水涨船高"策略而非"沿途下蛋",医疗场景天花板高,模型能力提升会持续增强应用价值[19] 技术路线与产品进展 - 发布首个全场景推理大模型Baichuan-M1-preview,具备复杂病症诊断能力,案例显示其诊断水平达市一级医院之上[6][12] - 医疗模型采用强化学习技术,2024年7月后明确医疗增强方向,计划2025年Q1推出超级医生模型并落地北京儿童医院[11][24][62] - 坚持语言是智能主轴的观点,认为多模态主要用于交互增强而非智力提升,技术重点在AI使用工具和制造工具的能力[69][75] 商业化与落地规划 - 已与北京儿童医院、海淀卫健委等机构合作,推出"一大四小"产品矩阵,涵盖居家至医院多场景[61][62] - 商业模式设计包含G端(政府)、H端(医院)和C端三层,AI辅助诊断已进入国家医保局服务项目立项指南[63] - 中国年就诊84亿人次,百度日健康搜索请求超5000万人,公司认为医疗具备超级应用潜力[48][49] 行业竞争与差异化 - 避开通用模型红海竞争,选择医疗赛道定位"在大厂射程之外",观察到百度腾讯等减少医疗投入[53][8] - 累计融资超50亿元但未大规模烧钱,被部分投资人评价为"最稳的大模型独角兽之一"[5][27] - 开源14B医疗增强模型促进产学研合作,医疗评测得分超过72B版本,可用消费级GPU部署[34] 创始人理念与长期愿景 - 创始人王小川从2000年基因测序研究起持续关注生命科学,提出"把生命变数学"的技术理想[5][39][30] - 认为AI将推动从科学时代到智能时代的范式迁移,医疗数据未来可支持生命科学研究突破[45][38] - 长期目标是实现"生物自由",通过AI医生解决医疗资源不可能三角,并推动新医学科研范式[87][100]