Workflow
智能模型
icon
搜索文档
博世加码人工智能投入自动驾驶是关键应用领域
新浪财经· 2025-06-30 20:26
投资计划与销售预测 - 公司计划2027年前在人工智能领域投资超过25亿欧元 [1] - 预计到2035年软件、传感器技术、高性能计算单元、车载通讯类零部件销售额将翻倍,超过100亿欧元 [1][3] 人工智能技术应用 - 公司将辅助驾驶与自动驾驶作为人工智能优势的关键应用领域 [1] - 早期在摄像头和雷达上部署人工智能用于物体识别和环境感知 [1] - 未来重点是将所有传感器数据输入大模型,融合环境信息并提升预判能力 [1] - 生成式人工智能模型可模拟不同驾驶场景(如雨天、夜间) [2] 数据与技术优势 - 公司累计超过200PB(2亿GB)全球交通场景数据用于训练人工智能模型 [2] - 采用"联邦学习"技术实现全球数据训练而不共享原始数据 [2][3] - 通过联邦学习解决全球数据跨境传输的复杂要求 [3] 市场合作与全球化 - 公司与奇瑞合作成功,为中国市场建立人工智能计算集群 [3] - 中国团队具备完整产品开发能力,使用本土云服务器和数据 [3] - 辅助驾驶技术在中国市场对吸引消费者至关重要 [3] - 预计自动驾驶技术将在2035年实现长期商业成功 [3]
Nature报道:谷歌新模型1秒读懂DNA变异!首次统一基因组全任务,性能碾压现有模型
量子位· 2025-06-26 22:11
核心观点 - 谷歌DeepMind推出突破性生物模型AlphaGenome,能够从1兆碱基的DNA序列中预测数千种功能基因组特征,并以单碱基分辨率评估变异效应[3][4] - AlphaGenome在基因表达、剪接、染色质可及性等任务上性能全面超越现有模型,为解析基因组调控代码提供强大工具[5][7] - 该模型是首个统一基因组任务的单一模型,将多模态预测、长序列背景和碱基对分辨率统一于单一框架[10][11] - AlphaGenome在临床上有潜力帮助理解疾病原因、发现治疗靶点,例如在T细胞急性淋巴细胞白血病研究中解析致癌变异[29] 模型架构与技术细节 - 模型架构受U-Net启发,处理1兆碱基DNA输入序列,生成一维和二维嵌入,分辨率分别为1bp/128bp和2048bp[13] - 内部结合卷积层和Transformer块,通过8个张量处理单元实现完整碱基对分辨率训练,最终输出11种模态,涵盖5930条人类或1128条小鼠基因组轨道[13] - 采用预训练和蒸馏两阶段训练,在NVIDIA H100 GPU上推理时间可达1秒以内[15][17] 性能表现 - 在24项基因组轨道评估中,AlphaGenome在22项保持领先,例如在细胞类型特异性LFC预测上相对改进+17.4%[16][19] - 在26个变异效应预测基准中,24项达到或超越现有最强模型,例如表达QTL方向预测提升25.5%,可及性QTL提升8%[19][21] - 在剪接模态方面首次实现全方位预测,在7项基准测试中的6项实现最先进水平,auPRC达0.54[25][27][28] 应用与未来发展 - 可帮助研究人员更精准理解疾病潜在原因,例如解析T-ALL中TAL1基因附近的致癌变异[29] - 未来可通过扩展数据提升预测精度并涵盖更广泛物种,科学家只需微调即可快速生成和测试假设[29] - 目前提供预览版并计划正式发布,代码已开源[30]
速递|三年可省百万美元!ChatGPT最高20%折扣,企业客户正在“叛逃”微软,销售恐痛失大单
Z Potentials· 2025-06-19 11:54
OpenAI企业折扣策略 - 公司为购买附加产品的企业客户提供10%至20%的ChatGPT企业版折扣,前提是签署多年协议购买其他工具(如Deep Research智能体、Codex编程智能体)或承诺API消费金额[2] - 折扣实际将ChatGPT企业版价格从每位用户每月30美元降至25美元左右[8] - 部分企业获得AI模型价格折扣的条件是承诺一年内投入数百万美元[8] 企业业务增长预期 - ChatGPT企业版2023年收入1亿美元,占ChatGPT总收入3%-4%[6] - 公司预测2025年企业版收入达4亿美元(200万用户),2026年10亿美元(400万用户),2030年62亿美元(1600万用户)[6] - ChatGPT Teams产品2023年收入2亿美元(100万用户),预计2024年底达8亿美元(400万用户),2030年85亿美元(2200万用户)[6] - 2030年Teams和Enterprise总用户预计3800万,贡献147亿美元收入,占ChatGPT总收入620亿美元的四分之一[6] - 企业版、团队版及高校订阅付费用户已突破300万(2024年2月为200万,2023年9月为100万)[7] 与微软的竞争关系 - 微软Copilot聊天机器人起售价同为每用户每月30美元,但最大折扣仅5%-10%,无法匹配OpenAI折扣导致交易流失[2][10] - 某软件公司因OpenAI提供20%折扣(三年节省100万美元)转向直接采购[10] - 私募股权公司考虑3000个Copilot席位(原价超100万美元/年)时,OpenAI报价20%折扣(80万美元/年)[10] - 微软通常仅对年消费数百万美元的客户提供5%-10%折扣[11] 行业背景与客户选择 - 企业采用AI技术驱动客服机器人、内部工具以降低成本或替代员工[4] - 部分客户(如Notion、Salesforce)因优先获得Codex工具和工程师支持选择OpenAI而非微软[9] - 其他客户(如Intuit、Fidelity)因现有云服务合同选择微软[9] 技术成本与定价趋势 - AI公司通过降低数据中心模型运行成本后将部分节省让利给客户[2] - OpenAI与Anthropic等公司在过去一年将前沿模型API价格下调90%以上[8] - 公司表示折扣策略源于模型效率提升,旨在将成本节省回馈客户[8]
拆解特斯拉机器人供应链:30 多位从业者看到的泡沫和希望
芯世相· 2025-06-13 18:30
核心观点 - 特斯拉人形机器人Optimus已进入量产阶段,成为全球唯一具备完整供应链的人形机器人产品,带动A股机器人概念板块上涨93%(同期沪深300仅涨1%)[2][3][4] - 行业面临硬件成本高企(单台6万美元)、生产效率低下(仅为人工20%-30%)、耐用性不足(灵巧手平均寿命1-3个月)等核心挑战[26][30][31] - 技术路线呈现两极分化:特斯拉采用行星滚柱丝杠+直线关节的精密制造方案,中国创业公司则押注具身智能模型的软件突破[11][32][37] - 当前应用场景局限在展示性功能(车模/表演)和简单工业搬运,尚未证明商业可行性[45][46] 技术方案 硬件架构 - 执行器占硬件成本55%,特斯拉采用14根行星滚柱丝杠(单根4000元)实现直线关节,承重达半吨[7][11] - 减速器将电机扭矩放大200倍,供应商为哈默纳科和绿的谐波[12][16] - 六维力传感器(单价1.2万元)测量误差<0.2%,但特斯拉尝试用软件替代[15][18] - 灵巧手复刻22个自由度,采用钢丝绳驱方案,但耐用性仅1-3个月[17][19][31] 软件系统 - 主流训练方案VLA模型需1000万条真机数据(当前不足100万条),单条采集成本10元[39][40] - 仿真数据通过Real-to-Sim流程建模物理交互(如开冰箱门的力学参数)[41] - 端到端训练存在延迟问题,演示视频普遍加速播放[38] 供应链生态 - 全球超1000亿元投入,2024年预计出货2万台(相当于劳力士周产量)[3][4] - 特斯拉重构7000个零件中的大部分,关键供应商包括舍佛勒(丝杠)、三花智控(热管理)、旭升股份(结构件)[11][23][25] - 中国供应商通过送样获取技术参数,即使未中标也可服务其他机器人公司[22][25] 商业进展 - 特斯拉2024年目标产量5600台,主要用于自有工厂搬运4680电池[4][46] - 成本6万美元/台(目标降至2-3万),相当于美国搬运工15个月薪资[26][27] - 中国公司探索情绪价值场景(如车模),部分对标泡泡玛特商业模式[45][47] 行业动态 - 智元机器人(成立2年)估值超宇树科技(成立9年),具身智能公司Physical Intelligence估值20亿美元[43] - 波士顿动力CTO批评行业过度依赖数据而简化模型设计[44] - 马斯克将百万台量产目标从2027年推迟至2029年[47]
借助生成式人工智能构建知识生产新体系
新华日报· 2025-06-13 08:14
生成式AI技术演进 - 生成式人工智能(GAI/GenAi)基于算法模型生成文本、图像、音频等多模态内容,是AI领域关键分支[2] - 技术发展历经三阶段:20世纪50-80年代奠定概率模型理论基础(马尔可夫链等),2014年GAN网络实现图像生成突破,2018年后大语言模型(GPT系列)推动自然语言生成跨越式发展[2] - 2022年ChatGPT上线标志大规模商业化应用开启,2023-2024年全球政策框架加速形成(中国工信部/联合国标准)[2] 行业应用价值 - **效率提升**:处理海量数据生成文献综述/科普素材,学术研究场景可缩短70%文献梳理时间,科普内容创作周期压缩50%以上[3] - **创新驱动**:多模态模型(如DALL-E)打破学科壁垒,通过跨领域知识关联分析助力科研突破点发现,设计行业创新效率提升40%[4] 技术局限性 - **知识产权风险**:训练数据70%涉及未授权内容,生成成果归属存在开发者/用户/模型三方争议,学术领域署名纠纷增长300%[5] - **数据质量缺陷**:因逻辑推理局限导致15%生成内容含事实错误,医疗/金融领域错误信息传播可能引发决策失误率上升25%[5] 生态发展方向 - 需建立数据授权/内容溯源技术体系,通过联邦学习降低30%隐私泄露风险,同时开发事实核查算法将错误率控制在5%以内[6]
拆解特斯拉机器人供应链:30 多位从业者看到的泡沫和希望
核心观点 - 特斯拉人形机器人Optimus的研发带动了全球产业链投入超1000亿元,但当前量产仍面临高成本、低效率问题,硬件技术尚未突破瓶颈[2][25][30] - 行业出货量预计2024年仅2万台,单台成本6万美元,效率仅为人工20%-30%,远未达到替代蓝领工人的经济性[2][35][40] - 软件端采用VLA模型训练机器人,但数据采集成本高(单条10元),真机数据不足制约模型泛化能力[52][54] 技术路径 硬件设计 - 采用行星滚柱丝杠(单价超4000元/根)替代传统旋转关节,单腿承重达半吨,精度误差小于6微米[10][36] - 灵巧手复刻22个自由度,绳驱结构模拟肌肉组织,但耐用性差(3个月需更换),双手更换成本10万元[18][20][42] - 传感器方案包含六维力传感器(误差<0.2%)、电子皮肤(单指节100+力传感器),但感知精度仍落后人类[15][16][22] 软件系统 - 放弃波士顿动力的规则控制路线,转向VLA模型训练端到端动作,需1000万条真机数据(当前不足100万条)[45][52][54] - 数据采集依赖物理交互仿真,如开冰箱门需建模质量/摩擦力等参数,通过Real-to-Sim生成多场景训练数据[56] 产业链现状 供应商格局 - 核心部件由舍弗勒(滚柱丝杠)、哈默纳科(RV减速器)、ATI(六维传感器)等国际龙头主导[10][11][16] - 中国供应商如三花智控、拓普集团累计投入超50亿元,特斯拉提供技术图纸扶持代工厂[27][28] - 行星滚柱丝杠产能严重受限(月产仅300根),迫使特斯拉降低精度标准至C3级[36][37] 商业化进展 - 特斯拉2024年目标产量5600台,实际应用仅数十台用于搬运电池,效率不及工业机械臂[30][59] - 中国公司宇树/智元预计出货5000台,但主要场景转向车展模特、情绪价值产品[59][60] - 行业估值分化明显:具身智能公司Physical Intelligence成立15个月估值超20亿美元[57] 性能参数 - 第三代Optimus身高1.72米/重55公斤,50+自由度,双臂负载20公斤,续航5小时[30][34] - 行走速度8-10公里/小时,但60%概率1.5公里内摔倒,关节温度超70℃会降频[35][39] - 硬件成本中执行器占比55%,灵巧手复杂度超其余部件总和[6][18]
拆解特斯拉机器人供应链:30 多位从业者看到的泡沫和希望
晚点LatePost· 2025-06-04 22:53
人形机器人行业发展现状 - 特斯拉人形机器人Optimus进入量产阶段,成为唯一拥有完整供应链的产品[5] - 全球风险投资者、特斯拉及供应商已投入超1000亿元,但2024年预计出货仅2万台[4] - A股机器人概念板块自2022年10月以来上涨93%,远超沪深300指数1%的涨幅[3] 核心技术突破 - 执行器占机器人55%硬件成本,特斯拉采用30个执行器模拟人体动作[6] - 行星滚柱丝杠技术突破力量限制,单根可承重半吨但误差要求小于6微米[10][26] - RV减速器可将电机扭力放大200倍,六维力传感器测量误差小于0.2%[13][15] 供应链建设 - 特斯拉联合全球数百家公司搭建供应链,包括舍佛勒、哈默纳科等精密制造巨头[21][22] - 三花智控和拓普集团等中国供应商累计投入超50亿元支持研发[22][23] - 行星滚柱丝杠月产能仅300根,关键部件产能严重制约量产进度[26] 商业化挑战 - 单台成本6万美元,效率仅为人类20-30%,使用寿命仅3年[30][31] - 灵巧手每3个月需更换,成本达10万元人民币,耐用性成主要瓶颈[31] - 实际应用场景有限,部分公司转向提供情绪价值对标泡泡玛特[46] 技术路线分歧 - 波士顿动力采用控制理论路线,依靠工程优化实现高难度动作[32][34] - 主流公司押注VLA模型,但训练数据严重不足,真机数据采集成本高昂[39][40] - 仿真数据供应商尝试通过物理建模解决数据瓶颈,效果尚未验证[42] 量产进展 - 特斯拉第三代产品硬件设计80%定型,计划2029年实现年产100万台[25][47] - 当前主要用于工厂简单搬运,但工业机器臂成本更低效率更高[45] - 中国公司宇树、智元预计2024年出货量分别为4000台和超千台[4]
DeepSeek-R1更新,官方说明来了!多项表现已接近其他国际顶尖模型
每日经济新闻· 2025-05-29 21:13
5月29日晚间,深度求索微信公众号公布了 DeepSeek-R1-0528 更新的详细升级内容,DeepSeek-R1-0528 仍然使用 2024年12月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的 R1 模型在数学、编程与通用逻辑 等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 其他能力更新比如: 1.幻觉改善:新版 DeepSeek R1 针对"幻觉"问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降 低了 45~50% 左右,能够有效地提供更为准确、可靠的结果。 2.创意写作:在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的 长篇作品,同时呈现出更加贴近人类偏好的写作风格。 3.工具调用:DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用)。当前模型 Tau-Ben ...
DeepSeek R1,新升级!
第一财经· 2025-05-28 22:15
DeepSeek模型更新 - DeepSeek R1模型已完成小版本试升级 用户可通过官方网页 App 小程序测试新版本 [1] - DeepSeek R1模型API接口和使用方式保持不变 现有用户无需调整接入方式 [1] - DeepSeek R2模型仍处于开发阶段 公司未透露具体发布时间 [1]