AGI
搜索文档
GOOGL Rally "Long Overdue," Gemini 3.0 & Cloud's Long-Term Prospects
Youtube· 2025-11-28 22:00
公司股价表现与驱动因素 - 谷歌母公司Alphabet股价近期大幅上涨,过去一周左右涨幅约17%,市值超越微软成为全球第三大公司[1][2] - 此轮上涨始于7月底8月初,当时公司赢得搜索引擎垄断诉讼案件,推动股价显著走高和估值倍数重估[3] - 近期上涨由优于预期的消息流和过去几个月的业务执行共同驱动[5] 人工智能业务进展 - Gemini 3模型的发布表现卓越,被视为重大升级,展示公司在该领域并非只有OpenAI一个参与者[3][6] - 公司过去在AI领域进展缓慢的担忧得到缓解,近几周表现显示其已转向进攻姿态[5] - 公司与Meta就潜在使用其芯片进行对话,可能在AI芯片领域挑战英伟达[10][11] 核心业务基本面 - 基于第三季度财报后基本面分析,公司的广告业务(包括YouTube和更重要的搜索业务)预计未来两三年将以两位数速度增长,高于市场此前预期的中高个位数增长[6] - 云业务表现令人乐观,第三季度云预订量表现优异,同时云业务利润率正扩大至接近微软和亚马逊的水平,且预计利润率将继续扩张[7] - 尽管资本支出将持续上升,但公司仍能保持强劲的顶线增长[8] 市场信心与验证 - 伯克希尔·哈撒韦公司对Alphabet建立了相当大持仓,这被视为对公司股票的额外验证,表明市场情绪可能已转变[8][9] - 伯克希尔通常投资于那些自由现金流生成能力强且可能相对于历史水平和竞争对手存在折价的高科技公司,此次选择投资Alphabet而非增持其他大型科技公司,是对公司基本面的认可[9] 市场竞争格局展望 - 在AI计算市场,预计英伟达的市场份额将从目前的90%以上降至本十年末的70%中期水平[12] - Alphabet有望获得部分市场份额,预计在某些时间点可能达到中个位数百分比,这一目标是现实的[12] - 虽然与Meta的合作是新的潜在机会,但预计这不会完全终结英伟达的市场主导地位[13]
谷歌CTO兼首席AI架构师揭秘:谷歌如何用两年半完成AI逆袭
36氪· 2025-11-28 18:48
公司战略与组织变革 - 公司从坦诚技术落后转变为实现市场逆袭,两年半前AI Studio仅有3万用户且零收入,团队承受巨大压力[1] - 公司战略发生三个关键转变:从实验室思维转向战场思维,建立每六个月重大迭代的更新节奏;放弃大而全,聚焦三大杀手锏;激活谷歌的终极武器,调动六大洲2500名专家,实现从芯片层到亿级产品的端到端协同[5][20] - 组织层面形成独特能力,从早期25人合作论文到Gemini 3涉及2500名贡献者,实现研究思维与工程思维的深度融合,并具备从芯片设计到算法研发的全栈专家深度整合能力[20][21] 技术进展与模型能力 - Gemini 3模型在基准测试和预发布验证中达到预期,实际应用场景获得用户认可,在精准意图理解、全球化服务能力及工具化与创造能力方面有核心提升[4][7] - 在号称“人类最后考试”的HLE基准测试中,早期模型仅达1%或2%水平,如今先进模型如DeepThink已突破40%水平,而GPQA Diamond等挑战性基准性能仍在逐步提升中[4] - 模型聚焦三大核心维度:精准的意图理解,建立真正的任务理解与执行能力;全球化服务能力,在多个非优势语言场景表现突破;工具化与创造能力,具备函数调用、工具运用等核心能力,其中工具调用能力具有独特的指数效应[7] - 代码能力被视为数字世界的构建基石,通过自然语言编程(氛围编程)新范式,将技术门槛降至前所未有的程度,让创新成为每个人可触及的能力[7][8] 产品开发与市场应用 - 产品平台如AI Studio、Anti-Gravity构成技术演进的重要基础设施,通过真实用户反馈提供最直接的技术优化方向,建立产品与研究的闭环以重塑研发范式[8] - 技术价值最终通过产品体验实现,公司致力于构建完整的技术赋能体系,将尖端模型能力转化为产品价值,同时通过真实用户场景获取改进方向,形成双向循环[9] - 产品驱动的技术演进建立持续改进的飞轮,产品团队不仅是技术使用者,更是共同定义技术方向的战略伙伴,使公司能够快速将实验室创新转化为用户价值[11] 多模态技术与未来方向 - 多模态融合成为技术发展必然趋势,文本与视觉模型正共享底层架构,这种技术汇流创造更符合人类直觉的交互体验,Nano Banana模型展现出同时处理视觉和语言信号的能力[14][15] - 基于Gemini 3 Pro架构升级的新一代模型在理解复杂文档并生成信息图方面展现惊人能力,实现从文本到图像的流畅转换,标志着多模态交互迈向成熟[16] - 实现统一模型架构的核心挑战在于解决文本的结构化信号与图像生成所需的像素级精确、概念级连贯之间的双重标准,这需要找到关键创新点让模型融会贯通不同模态能力[18] 研发理念与行业展望 - 衡量技术进步的根本标准在于实际应用而非基准测试分数,当工具真正融入人类知识工作的各个环节时才实现真正进步,基准测试仅为进步提供可量化的参照维度[6] - 构建AGI不是封闭的实验室研究,而是必须通过与真实世界的持续交互来共同构建的工程实践,产品平台提供宝贵的连接通道以收集亿万用户的反馈信号[9][10] - 公司持续平衡基础科学研究与模型规模化扩展,认为创新源泉的枯竭是最大风险,因此坚持广泛布局探索,不局限于某一种架构或方法[22] - 公司保持“逆袭”心态,强调诚实面对差距,借鉴他人所长并坚持自主创新,通过不断学习与创新达到领先位置,目标始终是构建真正的智能[25][26]
90后华人科学家:超一亿美金年薪背后的权力游戏
创业邦· 2025-11-28 18:14
公司核心战略转向 - Meta AI战略从FAIR实验室代表的学院派长期理想主义全面转向以产品化与商业落地为导向的实用主义[5] - 公司斥资143亿美元收购数据标注巨头Scale AI并成立Meta超级智能实验室(MSL)向AGI发起全面冲刺[15] - 公司暂停MSL除关键岗位外的所有招聘以在制定新战略的同时更审慎地规划未来[27] 关键人物变动与影响 - 图灵奖得主杨立昆宣布于2025年底离开效力12年的Meta标志公司AI战略路线彻底转向[5] - 前OpenAI核心开发者赵晟佳空降Meta被授予首席科学家头衔其年薪方案高达超一亿美金[6][20] - 杨立昆离职后FAIR实验室被整体并入MSL体系在汇报关系上图灵奖得主需向28岁的Alexandr Wang汇报[26] 组织架构与人才管理挑战 - MSL内部出现资源分配不公官僚作风盛行承诺的算力资源未能兑现导致赵晟佳入职数日即萌生去意[19] - 与赵晟佳同期加盟的两位前OpenAI研究员Ethan Knight与Avi Verma在入职不到一个月内相继离职重返OpenAI[22][23] - 统管Meta AI全局的Alexandr Wang年仅28岁此前无人工智能研究经验引发内部资深科学家困惑与不满[25] 技术竞争与行业态势 - 赵晟佳在OpenAI期间主导的o1系列模型将思维链从理论概念转化为可规模化部署的产品使AI具备类人逻辑推理能力[13] - 公司为MSL团队承诺使用计划于2026年建成的普罗米修斯计算集群该集群拥有高达1000兆瓦的电力供应[17] - Meta寄予厚望的Llama 4模型发布后表现平平并因性能评测造假争议而声誉受损[15]
MiniMax和月之暗面:中国AI创业公司的两种路径和共同难题
创业邦· 2025-11-28 18:14
公司核心发展历程与战略演变 - 月之暗面与MiniMax是中国大模型领域的明星创业公司,创始人杨植麟和闫俊杰被称为“双子星”,均以追求AGI为目标 [9] - 两家公司起步方式不同:MiniMax由闫俊杰于2021年底创立,首轮融资获高瓴领投2000万美元,投后估值达2亿美元 [12][13];月之暗面由杨植麟于2023年初推动团队独立成立,起步融资遇挫后由红杉、真格等机构投资 [13][17] - 公司均通过C端产品实现早期爆发:MiniMax的Glow上线4个月注册用户超500万 [17];月之暗面的Kimi连续数月月活用户环比增长超100% [19] - 2024年初两家公司获得大额融资:月之暗面获阿里投资近8亿美元,估值达23.4亿美元 [19];MiniMax获阿里投资6亿美元,估值超月之暗面 [20],两笔融资合计超14亿美元(100亿元人民币) [20] 技术路线与产品策略 - MiniMax技术路线选择多模态模型,是中国最早推出MoE模型的团队之一,闫俊杰将AGI视为“普通人每天都会用的一个产品、一个服务” [9][12] - 月之暗面更执着于无损的语言模型本身的力量,一度不怎么在意MoE,杨植麟提出“Lossless long context is everything” [9][35] - 2024年面临竞争压力时两家公司曾扩张产品线:MiniMax同时推进多条产品线,员工增至400人 [22];月之暗面定下覆盖多个方向的目标,员工翻一番 [22] - DeepSeek爆火后两家公司重新聚焦模型研发:月之暗面发布并开源万亿参数MoE模型Kimi K2,宣称部分维度超过DeepSeek-V3和阿里Qwen3 [28];MiniMax将重点从“模型与产品并重”收缩到“模型优先”,10月开源语言模型M2在OpenRouter使用量进入前五 [29][31] 创始人管理风格与组织能力 - 闫俊杰崇尚“系统理性”,将公司视作可设计和优化的函数,管理核心是找到“梯度下降最快的方向”,决策如不做3D、选择MoE属于“算出来的结果” [9][34] - 杨植麟相信人才的力量和“共识驱动”,倾向于先达成共识再迅速行动,愿意为招揽技术人才投入大量时间 [9][34] - MiniMax组织经历密集流动:早期一百名员工已走一半,对齐团队两年内换三任负责人 [31];闫俊杰明确表示“不是同路人的同事会请他们离开” [32] - 月之暗面精英策略在视频模型和出海产品上未达预期,视频模型仅联合创始人在朋友圈发布几条视频,出海产品Ohai和Noisee几个月后停止运营 [25] 行业竞争格局与资本环境 - 大模型是资本密集游戏,OpenAI估值达5000亿美元,xAI和Anthropic估值逼近2000亿美元,而MiniMax和月之暗面估值均在40亿美元左右 [36] - 中国巨头公司成为主要竞争对手:字节跳动发动饱和式进攻,产品线覆盖一切,并严格控制外部AI产品在抖音上的投放 [26] - 资本意志深度介入公司经营,投资人频繁提供增长建议,部分美元基金退潮后,拥有大规模资金的巨头不愿为创业公司持续输血 [26][36] - 创业公司面临根本挑战:在巨头林立、算力稀缺、资本收缩的市场中,是否还有空间容纳既做基础研究又不属于任何巨头的AI公司 [38]
聚焦当下:Chaterm致力于打造20年经验的SRE副驾驶
钛媒体APP· 2025-11-27 14:05
AI Agent在运维领域的发展与应用 - AI应用端快速落地,AI Agent角色日趋多样化,从基础的客服、营销、内容创作向更垂直、专业度更高的运维专家等场景延伸[1] - 合合信息推出的Chaterm定位为具有"20年经验的运维专家",能够根据用户模糊描述快速定位并解决服务器集群疑难问题[3][4] 现代运维工作面临的新挑战 - AI发展导致基础设施规模爆发式增长,LLM训练和推理带来海量GPU集群、高性能网络和存储需求,基础设施异构性复杂度成倍增加[6] - 微服务和K8s体系下故障从"点"变为"面"甚至"体",运维人员需在网络、存储、应用等多领域反复跳跃排查,根因分析难度显著提高[7] - 人类排查思路是线性的,而AI Agent可多维度并行分析,在数秒内完成人类需要数小时才能实现的关联分析,对缩短MTTR具有革命性意义[7] Chaterm的产品定位与核心能力 - 产品目标成为管理复杂AI基础设施的智能层,在云原生CNCF Landscape中定位为Automation & Configuration工具[8] - 采用"开箱即用"设计理念,显著降低B端客户落地成本,避免传统Agent交付成本远超开发成本的问题[8] - 通过MCP和RAG技术将孤岛状态的非标知识沉淀为可复用实践能力,学习运维专家的排错SOP、最佳实践和脚本,实现20年经验赋能[15] 技术生态与合作优势 - 与亚马逊云科技深度整合,使用EKS、KMS、Bedrock等托管服务构建安全可靠的AI服务端[10] - 作为Amazon Advanced级合作伙伴享有优先技术接入权限,可在新服务正式发布前进入Private Beta阶段,获得抢先开发优势[11] - 获得专属Partner SA支持和技术通道,与亚马逊内部服务团队直接对话,攻克技术难题可节省数周甚至数月时间[12] 市场反馈与发展态势 - GitHub开源项目star数量超过1.8K,Fork达到160+,代码提交次数超2700次,显示活跃的社区参与度[10] - 客户反馈显示在降低MTTR、优化效率降低成本、提升业务安全性方面均有成功落地案例,部分案例为用户创新性用法[9] - 产品聚焦云原生K8S、FINOPS成本优化、安全合规等最高频、最痛场景,通过技能树系统持续扩展专业领域能力[14] AI Agent技术演进路径 - 参照OpenAI的AGI五级模型划分,当前AGI处于2.5阶段(Reasoners向Agents过渡),类似自动驾驶技术发展路径[14] - AI Agent在标准化知识基础上,能迅速掌握基于实践的非标化经验,对处理复杂多变的物理世界需求具有更大实操意义[15]
腾讯研究院AI速递 20251127
腾讯研究院· 2025-11-27 00:11
ChatGPT语音与文本交互升级 - OpenAI将语音模式全面整合至主聊天界面,实现语音应答、视觉呈现与文字转录服务的同步获取,用户无需切换模式[1] - 新版本在用户查询时能提供自然流畅的语音回应,同时实时生成地图、图表、图片等视觉内容,并自动完成语音转文字转录[1] - 公司在设置菜单中保留模式切换开关,偏好沉浸式音频体验的用户可一键恢复旧版独立语音模式[1] ChatGPT应用生态扩展 - OpenAI在ChatGPT网页端内测全新App Directory,首次系统化展示开发者构建的第三方应用,支持用户浏览、搜索和一键添加使用[2] - 新版目录以卡片形式呈现覆盖购物、生产力、教育、旅行等多场景的AI应用,用户可在ChatGPT内直接调用实现即点即用[2] - 基于ChatGPT 4亿周活用户和每分钟60亿tokens处理量,应用目录推动平台从AI对话工具向完整AI应用商店演进[2] FLUX图像生成模型进展 - 德国黑森林实验室发布FLUX2图像生成模型家族,可同时参考多达10张图片保持字符、产品和风格一致性,支持最高4百万分辨率图像编辑[3] - FLUX2系列发布3款模型,开源的FLUX2 [dev]为32B参数量模型,此前Flux1 [dev]在Hugging Face受欢迎度仅次于DeepSeek-R1[3] - 模型基于潜在流匹配架构,结合Mistral-3 24B视觉语言模型与整流流式Transformer,在超写实图像生成表现突出但暂不支持中文渲染[3] CharacterAI未成年人服务调整 - CharacterAI推出全新故事功能,未满18岁用户将无法使用聊天机器人服务,转而提供更为结构化的引导式互动方式[4] - 公司CEO坦言对于18岁以下用户开放式聊天可能并非合适产品,决策基于对AI聊天机器人可能带来心理健康风险的担忧[4] - 加利福尼亚州成为美国首个对AI伴侣进行监管的州,联邦层面有议员提出全国性法案旨在全面禁止未成年人使用AI伴侣[4] TRAE国内版开发工具升级 - TRAE国内版正式上线SOLO模式,带来SOLO Coder、Plan模式、多任务并行、代码变更工具DiffView、上下文压缩等核心能力[5][6] - SOLO模式定位为响应感知的编程智能体,支持检索10万个代码文件的超大上下文,通过全新三栏布局实现多任务并行开发[6] - 核心设计理念是All in One统一开发过程中所有元素,让开发者专注于指导和监督AI工作,而非实时配对AI编程助手[6] 腾讯混元3D引擎国际化推进 - 腾讯混元3D创作引擎正式推出国际站,模型API在腾讯云国际站同步上线面向国际用户开放,社区下载量超300万是全球最受欢迎的3D开源模型[7] - 最新Hunyuan3D 30版本首创3D-DiT分级雕刻模型,建模精度较前代提升3倍,支持1536³几何分辨率与36亿体素超高清建模,效果保持业界SOTA[7] - 目前已有超过150家企业通过腾讯云接入,涵盖游戏制作、电商宣传、影视特效、3D打印等领域,传统3D制作周期从数天缩短至分钟级[7] Skywork专业数据服务拓展 - 天工Skywork全新上线专业数据模式,已连接430家权威机构数据源,覆盖政府开放数据、国际组织、学术科研、金融市场、气象环境等关键领域[8] - 接入世界银行、IMF、WHO、FDA、Google Scholar、NASA等核心数据源,通过跨源统一回答与聚合实现一次检索整合权威数据[8] - 支持指定特定专业数据库回答确保无幻觉内容生成,所有答案自动附上数据来源信息确保回答可追溯、更透明,提升决策和报告可靠性[8] AI技术发展路径展望 - Ilya Sutskever提出Scaling时代已终结,我们正走向研究时代,认为当前技术路线无法实现AGI[9] - 他指出模型泛化能力是核心瓶颈远逊人类,即便用所有编程竞赛题目训练模型仍无法形成真正解题直觉,评估分数光鲜但实际性能滞后[9] - 预测5-20年内将出现能像人类一样学习并超越人类的AI系统,强调需要为模型内置类似人类的判断直觉和稳定价值感受器[9] AI芯片市场竞争态势 - 谷歌开始向Meta等大型机构推介在其数据中心部署TPU方案,Meta计划2027年斥资数十亿美元使用TPU,谷歌云预测此业务可拿下英伟达10%年营收[10] - 英伟达强调自己是唯一能够兼容所有AI模型、覆盖所有计算场景的硬件平台,并积极通过投资拉拢Anthropic、OpenAI等大客户[11] - 黄仁勋在内部会议坦言英伟达撑着整个地球,业绩好被说助长泡沫、业绩差会被当作泡沫破裂证据,市场预期难以满足[11]
立讯精密:预计2026年至2027年,AI硬件将迎来显著的变革和爆发式的增长
证券日报之声· 2025-11-26 19:35
公司对AI硬件载体的观点 - 公司认为眼镜和耳机因其佩戴特性是目前最接近AI载体的硬件产品,而手机常置于口袋会隔绝部分信息[1] - 许多客户正积极在眼镜和耳机两类产品上进行新尝试,预计2024年将有多种形态产品面世[1] - 当前尚未出现能完美匹配AGI的单一产品形态,最终产品形态仍处于探索阶段[1] AI硬件发展趋势预测 - 公司预计2026年至2027年AI硬件将迎来显著变革和爆发式增长[1] - 当前AI能力可能匹配特定硬件形态,未来3-5年AI进入新发展周期时硬件形态也可能随之改变[1] - 产品形态演进与AI技术的发展周期紧密相关,现在判断最终形态为时尚早[1] 公司战略与产品成功要素 - 公司将持续紧密关注主要客户的战略布局以制定未来发展策略[1] - AI硬件产品成功关键在于能够随时随地使用且不会给用户带来负担,并兼顾隐私性[1]
谷歌用Gemini 3同时革了OpenAI和英伟达两家的命
36氪· 2025-11-26 18:39
谷歌Gemini 3发布对AI行业格局的冲击 - 谷歌Gemini 3和Nano Banana Pro的发布打破了AI领域由英伟达和OpenAI主导的双赢局面,标志着谷歌全面觉醒[1][3] - 该发布被描述为一次降维打击,左手打掉OpenAI的模型护城河,右脚踢翻英伟达的算力神坛[10] - 事件导致OpenAI首席执行官罕见承认在某些关键维度上落后,英伟达股价应声下挫并被迫公开辩护[5][7] Gemini 3的技术突破与核心优势 - 模型实现原生多模态终极形态,感官天生互通,能像人类一样直接理解光影和动态而非翻译成文字[20] - 首次在硅基芯片上实现系统2慢思考的常态化,具备动态计算能力,自动判断使用直觉秒回或逻辑推演[20][23] - 在代码生成、复杂数学和长逻辑链任务上对OpenAI构成代际优势,生成内容提示词极其简单且质量惊艳[12][23] - 完全在谷歌自研TPU集群上训练,软硬一体优化使算力利用率突破行业天花板[26][27] 谷歌TPU技术对英伟达算力垄断的挑战 - 第七代TPU Ironwood专为AI推理打造,单芯片性能较上一代提升逾四倍,成为谷歌最强大高能效芯片[30][34] - Ironwood内存带宽达7.37 TB/s,可扩展至9,216颗芯片互联,芯片间互联网络速率达9.6Tb/s[30][35] - 谷歌启动TPU@Premises计划,直接向巨头销售算力,目标夺取英伟达10%营收,Meta已倒戈使用TPU[24] - 自研TPU使谷歌训练成本仅为对手一半以下,对英伟达80%毛利率构成直接威胁[26][27] 谷歌全栈AI能力与战略调整 - 公司是唯一全栈人工智能企业,覆盖数据、算法、硬件、云服务器全链条自研[38] - 组织架构整合DeepMind和Google Brain,解决内耗问题,创始人谢尔盖·布林回归亲自参与代码开发[41][43] - 拥有YouTube全球高质量视频数据、谷歌搜索实时世界知识、Android数十亿端侧场景的数据飞轮优势[42] - DeepMind禁止对外发表最新成果论文,暗示公司可能隐藏大量未公开技术储备[60][62] AI行业竞争态势演变 - Gemini 3终结AI线性增长叙事,证明模型架构与定制硬件协同可带来非线性能力突破[56][57] - 行业从Scaling Law暴力美学转向研究驱动,Transformer架构可能过时,需新架构突破[48][50] - 英伟达试图用资本手段维持优势,今年自由现金流预计970亿美元,超越谷歌的650亿美元,计划投资Meta换取芯片使用承诺[63][66] - AI战争进入下半场,竞争焦点从算力堆砌转向芯片、全栈能力、架构创新等综合实力[44][45][53]
雷军挖来特斯拉Optimus成员,负责小米灵巧手
搜狐财经· 2025-11-26 18:30
公司人才引进与团队建设 - 前特斯拉Optimus灵巧手团队成员卢泽宇加入小米机器人团队,担任灵巧手负责人,负责加速灵巧手技术路径收敛和工程化落地[2] - 团队正在招聘机械、电子、本体控制、仿真、系统整合等相关岗位以支持灵巧手研发[2] - 前DeepSeek研究员罗福莉加入小米,致力于构建从语言迈向物理世界的AGI[6] - 小米招聘官网与机器人相关的在招岗位达到257个,涉及多模态大模型、具身智能算法等,其中灵巧手相关岗位有12个[6] 公司技术研发与项目进展 - 小米发布并全面开源具身大模型MiMo-Embodied,该模型同步支持具身智能三大核心任务与自动驾驶三大关键任务[6] - 北京小米机器人技术有限公司为第三代人形机器人CyberOne完成美术类作品著作权登记[6] - 公司2020年9月立项做机器狗,初期与追觅团队合作[12] - 2021年小米内部成立机器人实验室,并在2022年8月发布全尺寸人形机器人CyberOne[12] - 2023年北京小米机器人技术有限公司成立,同年11月小米成为北京人形机器人创新中心有限公司的共同持股方[12] 公司战略投资与产业布局 - 小米大力投资机器人相关企业,据不完全统计已投资近30家,涉及核心零部件、灵巧手、机器人整机等领域[6] - 小米在机器人研发领域的布局时间与小鹏相差无几,但近两年动作相对低调[12] - 2023年6月,北京小米机器人技术有限公司乔迁至北京亦庄小米汽车工厂[12]
马斯克机器人团队又少一员大将,这次去了小米
搜狐财经· 2025-11-26 18:24
核心人事变动 - 前特斯拉高级机器人工程师Zeyu (Zach) L正式加入小米,担任灵巧手研发负责人,其于2025年10月入职小米 [1][6][13] - 该工程师在特斯拉工作约1年3个月(2024年8月至2025年10月),主要负责特斯拉Optimus机器人的手部设计,涉及灵巧抓取与操作、触觉皮肤早期开发与集成、触觉传感器概念评估与原型测试等 [6][7][9] - 其离职特斯拉是出于个人和职业成长考虑,决定返回亚洲,并获得了多位特斯拉前同事的公开祝福 [13][16][17] 人才背景与技术专长 - 该工程师拥有新加坡国立大学机器人博士学位,并在A*STAR研究所有过7个月的研究经历,专注于机器人算法开发与实验验证 [6][11][12] - 其技术专长涵盖灵巧手研发、触觉传感、硬件设计及C++、机器学习等超过13项技能,并在IEEE等顶级期刊发表过多篇学术论文,例如关于仿生触觉传感器GTac的研究 [6][10][17][19] 公司战略与行业布局 - 小米近期在机器人领域持续加码,本月21日披露了具身大模型MiMo-Embodied并宣布开源,月初还引进了被称为“AI才女”的罗福莉,目标直指AGI(通用人工智能) [20][21] - 公司通过引进具备硬件(如灵巧手研发)和软件(如大模型)背景的人才,正在同步布局机器人领域的软硬件技术 [20][21] - 灵巧手作为人形机器人与物理世界交互的关键部件,技术难点集中于触觉感知、精细操作和多自由度控制,该工程师强调的“工程化落地”可能意味着小米机器人正从研发阶段转向产品化阶段 [20][21]