大模型

搜索文档
明显感觉程序员的面试已经变了。。
猿大侠· 2025-07-23 11:25
行业趋势与职业发展 - 传统技术岗位(如Java、C++、前端)从业者面临AI大模型技术冲击,需将现有技术与大模型结合以提升竞争力 [1] - AI应用落地是未来趋势,大模型方向成为职业升级和薪资提升的关键机遇 [1] - 行业出现裁员、降薪现象,但掌握AI能力的工程师更受市场青睐 [1] 课程内容与结构 - 课程采用「代码逐行解构+实战项目操练」双轨模式,覆盖大模型微调、RAG、AI Agent、Transformer架构等核心技术 [9][11] - 五大学习模块:基础→工具→进阶→竞赛→实战,构建完整学习路径 [9] - 案例拆解包括金融行业支小助、知乎直答等商业化应用,提供一手数据资源和项目复现机会 [16] 技术应用与实战 - 聚焦主流大模型(如DeepSeek、Qwen)的微调技术,优化特定场景(制造、医药、金融)的模型性能 [11] - RAG技术应用于垂类场景(法律文档分析、医疗诊断辅助、金融报告生成),提升信息提取精准度 [11] - AI Agent开发涵盖多任务协同与自主决策,如制造业设备故障诊断、金融投资分析等场景 [11] 学员成果与就业支持 - 课程已服务20000+学员,部分学员通过内推获得高薪offer [11][20] - 提供大厂内推+直聘权益,简历直达面试官,加速职业跃迁 [15][20] - 完课赠送《大模型应用案例集》《AI商业落地白皮书》,助力技术迭代与职业发展 [1][20] 课程附加价值 - AI领域大佬授课,揭秘大厂真实案例(如知乎直答底层原理)并分享商业化项目经验 [18] - 剖析大模型招聘行情(岗位、薪资、技术迭代),规划职业发展路径 [20] - 限时免费预约,名额仅限100-200人,强调紧迫性以吸引潜在学员 [13][20]
一起做些有意思的事情!自动驾驶之心还缺几位合伙人
自动驾驶之心· 2025-07-23 10:12
业务合伙人招募 - 公司计划向国内外招募10位优秀合伙人(个人+企业)负责自动驾驶相关项目对接、课程研发、论文辅导、硬件研发、产品代理 [2] - 主要招募方向包括大模型/多模态大模型、扩散模型、VLA、端到端、具身智能、AI Agent、3D目标检测、世界模型、闭环仿真3DGS、大模型部署与量化感知推理、SLAM等 [2] - 岗位要求QS200以内高校硕士及以上学历,手握顶会论文者优先 [2] 合伙人待遇 - 提供自动驾驶资源共享(求职、读博、出国留学推荐等) [3] - 提供丰厚的现金激励 [3] - 提供创业项目合作与推荐机会 [3] 联系方式 - 咨询需添加微信wenyirumo并备注"机构/公司+自动驾驶合作咨询" [3]
阿里Qwen3-Coder携1M上下文杀来!5分钟生成网站,开发者狂欢:Claude Code可以卸载了
AI前线· 2025-07-23 08:22
阿里发布Qwen3-Coder代码模型 - 核心观点:阿里发布迄今为止最具代理能力的代码模型Qwen3-Coder,具备卓越的代码和Agent能力,支持358种编程语言,在多项评测中取得开源模型最佳效果[1] - Qwen3-Coder采用混合专家MoE架构,参数规模达480B,激活参数35B,原生支持256K token上下文,可通过YaRN扩展到1M token[1] - 模型在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use等任务上表现优异,可与Claude Sonnet4媲美[1] 模型性能表现 - 在Terminal-Bench评测中得分37.5,优于Kimi-K2 Instruct的30.0[2] - SWE-bench Verified得分69.6,SWE-bench Live得分26.3,均领先其他模型[2] - Multi-SWE-bench mini得分25.8,优于Kimi-K2 Instruct的19.8[2] - WebArena评测得分49.9,Mind2Web得分55.8,表现优异[3] - BFCL-v3评测得分68.7,TAU-Bench Retail得分77.5,展示强大工具使用能力[3] 技术特点与创新 - 训练数据总量达7.5T,其中代码占比70%[8] - 采用扩展Code RL训练方法,通过自动扩展测试样例构造高质量训练实例[7] - 实现可验证环境的扩展系统,可同时运行20k独立环境[10] - 利用Qwen2.5-Coder对低质数据进行清洗与重写,提升数据质量[8] 应用场景与效率提升 - 可帮助程序员完成基础编程任务,如写代码、补全代码、修Bug等[14] - 编程工作效率大幅提升,代码测试、查询生成等工作从数小时降至数分钟[14] - 刚入行程序员一天可完成资深程序员一周的工作[4] - 生成一个品牌官网最快只需5分钟[4] 开发者生态与商业化 - 已在魔搭社区、HuggingFace等平台开源,Github获得5.1k stars[5] - 将接入阿里AI编程产品通义灵码,API已上线阿里云百炼[5] - 阿里云百炼提供API服务,输入Token成本从$1/百万到$6/百万不等[20] 开发者反馈 - 开发者称赞模型速度快,可替代每月200美元的Claude Code[13] - 有开发者反馈模型在逐步推理提示下表现更好[19] - 部分开发者遇到基本操作失败的问题[20]
Jinqiu Select | Physical Intelligence 联创:AI训练的真实数据不可替代
锦秋集· 2025-07-22 23:04
核心观点 - 过度依赖替代数据源会严重限制AI模型的最终能力 真正的技术突破必须建立在真实数据基础之上 [1] - 当前AI研究面临"勺叉困境":试图用模拟器 人类视频或手持设备等廉价替代方案训练机器人 结果导致模型在真实场景中表现不佳 [1][3] - 机器学习的铁律是训练数据必须与测试条件相匹配 替代数据无法完全替代真实数据在物理世界中的实践 [10] 权宜之计的替代方案 - **模拟训练**:通过sim-to-real方法在模拟环境中训练机器人 但最佳模拟往往不是精确复现现实 而是编码机器人需要应对的各种变化 [3] - **人类视频学习**:需定义人机对应关系 但需弥合人类动作与机器人动作在动力学和外观上的差异 [3] - **手持夹爪设备**:让人们使用模仿机器人夹爪的设备收集数据 但仍受限于设备的工作空间和运动学差异 [3] 替代方案的局限性 - 替代数据将模型限制在三个条件的交集中:系统有效行为 能用替代方法实现的行为 不会暴露领域差异的行为 [4] - 模型越强大 越能区分替代数据与真实数据 导致交集缩小 任何扩大交集的尝试都会削弱模型能力 [6] - 替代数据优化针对特定场景 无法保证在新场景下的匹配度 模型的泛化能力反而成为推广到新场景时的累赘 [7] 真实数据的重要性 - 构建机器人基础模型必须依赖真实数据 才能实现像LLM和VLM在虚拟世界中的广泛泛化能力 [11] - 替代数据应作为辅助知识源 用于了解"世界可能发生什么" 而非"智能体该怎么做"的直接指令 [12] - 在大量真实机器人经验基础上 加入人类数据或模拟数据等多样化来源 比完全回避真实数据更有效 [11] 勺叉现象的普遍性 - "勺叉"现象不仅存在于数据替代方案 还包括混合系统 手工约束学习系统等方法 都试图用人工设计应对训练不充分问题 [13] - 手工设计的归纳偏置会成为性能瓶颈 违背机器学习通过数据驱动获取能力的核心优势 [13]
李开复的AI公司怎么样了?
虎嗅APP· 2025-07-22 21:28
公司战略转型 - 零一万物在2025年初完成战略转型,全面转向ToB业务,推出万智企业大模型一站式平台[4] - 公司内部早在2024年下半年就开始讨论转型方向,最终决定All in ToB[4] - 转型伴随组织架构调整,包括业务分拆和联创离职,员工可选择留在公司或加入与阿里云成立的联合实验室[4] 产品发布与升级 - 公司正式发布企业级Agent并升级万智企业大模型一站式平台至2.0版本[5] - 万智2.0 Agent平台是当前最重要的战略级产品,目标是通过降低落地成本快速创造价值[7] - 产品定位为"一把手工程",强调CEO驱动的AI战略转型,通过标杆客户打造灯塔效应[7] 商业模式与客户服务 - 公司采取高价值服务模式,避免价格战,专注于服务质量而非竞标[7] - 服务大型企业客户时,单项目金额可达极高水平,因其能带来业务规模1%以上的提升[8] - 交付周期较长,通常以数月到年为单位,包含深度共创和结果承诺[8] 技术部署与竞争优势 - 采用高定制化服务模式,算法工程师亲自驻场客户所在地完成部署[9] - 公司强调其服务能力是核心竞争力,目前市场上少有算法工程师会亲赴客户现场[5] - 产品毛利号称行业最高,不依赖烧钱模式,而是通过高价值服务获得合理回报[9] 行业生态与合作策略 - 公司定位为行业合作性最强的企业,愿意采用任何优秀模型和芯片[12] - 认为Agent与模型是互补关系,模型提供大脑能力,Agent需要额外具备记忆和工具调用能力[11] - 在实际业务中较少遇到直接竞争,因市场空间巨大且公司选择了差异化路径[12][13] 行业趋势观察 - 2025年AI行业出现明显分化,大模型"六小龙"重新洗牌,部分企业寻求上市,部分转型[4] - Agent已成为行业主流,但各公司对其战略优先级不同[6] - 零一万物是"六小龙"中唯一宣布All in ToB的企业[5]
推开「窄门」后,讯飞办公本走上大路
36氪· 2025-07-22 21:22
核心观点 - 科大讯飞通过智能办公本X5切入高端办公市场,以本地大模型和极致安全性能满足企业高管未被满足的需求 [3][9][14] - 公司采用"窄门思维"策略,从细分场景突破并预判社会办公终局,目标将AI办公从高管刚需扩展为社会普适需求 [6][18][33] - 技术路线注重人文价值而非单纯效率提升,通过30人专项小组耗时1年打磨会议纪要功能达到职业秘书水平 [25][26] 产品迭代 - **第一代X1(2019)**:首创可读写墨水屏办公本,解决纸笔记录难查找痛点 [11][22] - **第二代X3(2023)**:接入云端大模型升级为智能办公本,语音转写准确率从2014年60%提升至98% [11][17] - **第三代X5(当前)**:全球首款本地大模型办公本,集成8核9T算力,支持8种外语互译和200+方言识别 [9][12][23] 技术突破 - 硬件创新:10.65英寸最轻薄机身,快刷技术提升综合速度50%,配备8麦克风阵列应对复杂会议场景 [12][22] - 安全体系:独创物理"一键离线"拨键,实现计算/存储/访问全链路安全防护 [14][30] - 交互体验:联合Wacom研发接近真实纸笔的压感笔,语音+手写实现"思维自由" [14][26] 市场定位 - 核心用户:企业高管群体,2023年用户留存率达70%与PC持平,618期间AI硬件销售额同比增42% [8][23][28] - 场景延伸:从会议场景向差旅场景自然扩展,飞机高铁使用率显著提升 [22] - 终局预判:未来人人拥有智能办公本,解决职场人会议侵占思维连贯性的痛点 [19][20] 战略布局 - 技术路线:2023年ChatGPT发布半月内即确定"1+N"路线,早于行业共识1年 [31] - 国产化突破:构建"飞星一号"国产算力平台,实现大模型全栈自主可控 [31] - 竞争壁垒:拒绝功能堆砌,专注场景深耕,在医疗/教育/金融行业落地应用保持第一梯队 [29][31]
专访AWS大中华区总裁储瑞松:Agentic AI在爆发前夜
21世纪经济报道· 2025-07-22 18:09
Agentic AI技术发展 - Agentic AI具备感知、推理、决策与执行能力,成为全球科技巨头重点押注方向[1] - OpenAI推出ChatGPT Agent,xAI发布Grok 4,强调多智能体协同、原生联网、超大上下文能力[1] - 技术要素已集齐:大模型推理能力、标准协议支撑、低幻觉高效率运行、多智能体协同[3] - MCP协议成为Agent访问企业数据与调用API的通用接口[3] - 过去两年推理成本下降280倍,每百万token成本大幅降低[4] - 大模型幻觉率一年内降低50%,最领先模型幻觉率低于1%,结合RAG后可降至0.3%[4] 云厂商战略转型 - AWS发布Amazon Bedrock AgentCore、AI Agents Marketplace、Amazon S3 Vectors等关键产品,建立"智能体即服务"基础设施[2] - 云厂商角色从算力服务商变为智能服务商,从底层基础设施扩展为AI Agent新阵地[3] - 未来竞争焦点在于让Agent真正跑起来并在真实世界"做成事",而非仅比较模型强弱[3] - AWS引入Automated Reasoning Checks技术,通过数理逻辑判断拒绝幻觉结果[5] 行业应用进展 - 软件开发领域效率成倍提升,Amazon Q Developer支持从需求文档到部署全流程自动化[8] - 先进企业已实现90%新代码由AI生成,研发效率显著领先[14] - 编程工作从传统团队模式转向"产品经理+AI开发者"一对一协作[13] - 企业分为Speed 1(主动拥抱AI)和Speed 2(观望犹豫)两类,落地节奏差异显著[9][10] 市场预测与趋势 - Gartner预测到2028年代理型AI自主决策比例将从0%升至15%,企业软件应用比例从不足1%增至33%[2] - 技术采用曲线显示早期采用者已通过AI实现业务价值,观望企业可能丧失竞争力[14] - AWS在中国服务近万家客户,涵盖出海、入华及本土创新企业[14] - 多智能体协同开发代码量从3000行缩减至20行,技术门槛大幅降低[7]
李开复的AI公司怎么样了?
虎嗅· 2025-07-22 17:40
公司战略转型 - 零一万物在2025年初宣布全面转向ToB战略 成为大模型"六小龙"中唯一All in ToB的企业 推出万智企业大模型一站式平台[3][5] - 转型决策源于2024年下半年内部对模型梯队划分的讨论 早于DeepSeek模型的出现[5] - 2025年初完成组织架构调整 包括业务分拆和联创离职 保留团队需全力投入ToB业务或加入与阿里云的联合实验室[6] 产品发布与定位 - 正式发布企业级Agent并升级万智平台至2.0版本 定位为"一把手工程" 强调CEO驱动的AI战略转型[6][8][9] - 产品差异化体现在深度服务能力 算法工程师驻场客户现场完成部署 自称行业唯一提供此类服务的企业[6][11][12] - 平台设计为两种客户路径:与大型企业深度共创(交付周期数月到年)或由具备IT能力的企业自主部署[10][15] 商业化模式 - 采用高价值服务策略 避免价格战 客户多为数百亿规模企业 服务费基于业务提升效果按比例收取[10][13] - 宣称项目毛利率行业最高 通过可衡量的业务指标转化实现收入 否认烧钱模式[13] - 标杆客户案例重点打造"灯塔效应" 计划将经验复制到同类需求企业[9][15] 技术生态合作 - 采用开放合作策略 兼容多厂商模型(如阿里通义千问)和芯片[16][17] - 定义模型与Agent关系:模型作为"大脑"提供基础能力 Agent需叠加记忆、工具调用等场景化功能[16] - 强调在实际业务中较少遭遇直接竞争 因市场足够大且路径选择独特[18] 行业竞争格局 - 2025年AI行业出现洗牌 Agent成为主流但各公司战略优先级不同[7] - 对比智谱(企业级智能体平台)和MiniMax(API调用模式)等竞品 零一万物侧重全流程深度服务[6][7] - 认为Agent不会被模型取代 二者如同飞机发动机与整机的关系[16]
贵州省副省长罗强:省内24个重点产业已打造近100个大模型应用场景
快讯· 2025-07-22 14:16
贵州省副省长罗强7月22日在2025中国国际大数据产业博览会新闻发布会上表示,贵州已经在省内24个 重点产业,打造了近100个大模型应用场景。(上证报) ...
最近,程序员的招聘市场已经疯掉了。。。
程序员的那些事· 2025-07-22 11:48
行业趋势与职业发展 - 传统Java、C++、前端等技术开发者面临职业转型压力,大模型技术兴起引发行业焦虑 [1] - AI与传统技术结合成为关键趋势,掌握AI能力的Java工程师更具市场竞争力 [1] - 大模型方向是实现职业升级和薪资提升的重要机遇,AI应用落地是未来趋势 [1] 课程内容与结构 - 课程采用「代码逐行解构+实战项目操练」双轨模式,覆盖从0到1的AI应用开发全流程 [1] - 五大模块构建完整学习路径:基础→工具→进阶→竞赛→实战 [8] - 核心技术包括RAG、AI Agent、Transformer架构、Fine-tuning等 [8] - 热门项目拆解涵盖金融行业支小助、知乎直答等商业化案例 [15] 技术应用与实战 - 主流大模型微调技术(如DeepSeek、Qwen)针对制造、医药、金融等领域优化 [10] - RAG技术应用于法律文档分析、医疗诊断辅助、金融报告生成等垂类场景 [10] - AI Agent开发实现多任务协同与自主决策,案例包括制造业故障诊断、金融投资分析 [10] 学员成果与资源 - 课程已开班58期,服务20000+学员,多人获得高薪offer [10] - 提供一手数据资源和项目资料,学员可复现全流程积累实战经验 [15] - 完课赠送《大模型应用案例集》《AI商业落地白皮书》等资料 [19] 职业支持与机会 - 行业大佬深度解析大厂招聘行情、薪资水平及技术迭代方向 [17][19] - 提供企业内推+直聘权益,简历直达大厂面试官 [14][19] - 课程限时免费预约,名额仅限200人,24小时后关闭通道 [12][19]