Workflow
通用人工智能(AGI)
icon
搜索文档
宇树科技王兴兴:我一直不认为机器人一定要做成人形
21世纪经济报道· 2025-06-06 16:33
21世纪经济报道记者孔海丽 北京报道 "过去几年,我一直不坚持(认为机器人)一定要做成人形......但在当下,人形机器人在数据采集、训练和落地方面有很大优势。"6月6日,宇树科技CEO王 兴兴在智源大会上就 "机器人做成人形的必要性" 发表了观点。 王兴兴表示,人形机器人形态成为当下优选的原因在于两个方面,一是契合AI数据驱动特性,便于数据采集与训练。当前AI大多基于人的数据采集与训 练,人形机器人上半身与人的动作保持一致,能极大方便数据采集,为AI训练提供有力支持。例如,在进行各类动作相关的AI训练时,人形机器人可直接 模拟人类动作,减少数据转换与适配的成本和难度,使AI能更高效地学习和掌握相关技能。 二是满足特定场景需求。在舞蹈、格斗、比赛等场景中,人形机器人具有不可替代的优势。若采用其他形态,可能根本无法完成这些任务。以格斗场景为 例,人形的身体结构使其具备类似人类的移动、攻击和防御方式,能够更好地适应格斗的规则和要求,展现出丰富的战术和动作。 王兴兴认为,随着 AGI(通用人工智能)的发展,机器人的形态将变得百花齐放。在工厂场景中,会有各种大小不同的机器人,它们可能根据不同的生产 任务设计成特定的形 ...
为何钟情于机器人炫技?王兴兴:展示技术现状 释放商业价值
南方都市报· 2025-06-06 16:26
公司战略与商业化路径 - 宇树科技CEO王兴兴表示人形机器人进入家庭或工厂执行实际工作为时尚早 当前通过表演和赛事展示技术发展水平并探索商业化[1] - 公司2024年上半年人形机器人租赁市场火爆 已为行业带来实际商业价值[1] - 预测机器人格斗未来可能成为受欢迎的全球性体育赛事[1] 技术展示与公众影响 - 公司自2024年春晚爆火后持续通过回旋踢、跳舞、武术、格斗比赛等形式"炫技" 引发对机器人实用价值的讨论[1] - 王兴兴强调跳舞、搏击、家务操作均属于人形机器人"全身动作"组成部分 最终目标是让AI掌握各类动作解放生产力[1] - 4月19日北京亦庄机器人半程马拉松中 客户使用宇树科技G1机器人参赛时出现故障 公司澄清未参与该赛事[2] 行业形态与发展趋势 - 业内普遍认为人形机器人因适应人类设计的环境而具备优势[2] - 王兴兴指出当前"人形"结构的优势:便于采集人类行为数据训练模型 且适合跳舞格斗等特定活动呈现[2] - 长期来看当AGI实现后 具身智能机器人形态可能多样化[2]
仙工智能CEO赵越:打造智能机器人开放平台 让更多企业低门槛拥抱智能未来
证券日报· 2025-06-06 00:43
公司概况 - 上海仙工智能科技股份有限公司是一家以控制系统为核心的智能机器人公司,专注于人工智能与机械工程的结合,致力于提高机器人的智能性及泛化性 [1] - 公司计划通过香港交易所18C章程在港挂牌上市,成为第一家以该章程公开赴港上市的上海特专科技企业 [1] - 公司成立于2020年,创始人为赵越,其早年"弃医从工",曾三次获得RoboCup小型足球机器人比赛世界冠军 [2] 业务与技术 - 公司核心业务为机器人控制系统,被誉为机器人的"大脑",包括内置于机器人本体的控制器和运行于云端的软件,实现从感知定位到智能决策再到运动控制的全流程自主运行 [4] - 技术优势体现在三个核心维度:高可靠性、高易用性与高泛化性,通过"技术+平台"双飞轮驱动模式构建技术和生态壁垒 [4] - 公司产品包括安全型机器人控制器SRC-3000FS、一体化具身智能控制器以及覆盖"设备控制—物流调度—数据可视化"的完整数字化体系 [3] - 截至目前,公司控制器已适配超过300种零部件,支持超过1500家集成商与终端客户 [4] 市场表现 - 2022年至2024年,公司营收分别为1.84亿元、2.49亿元和3.39亿元,复合年增长率达35.7%,综合毛利率保持在45%以上 [5] - 公司亏损幅度逐步收窄,2022年至2024年经调整净亏损分别为3074.8万元、2090.7万元、1063.1万元 [5] - 2024年公司机器人控制器市场份额达到23.6% [4] 研发投入 - 2022年至2024年研发费用分别为3931.7万、6374.9万、7131.1万元,占营收比例均超过20% [5] - IPO募集资金将用于推进尖端AGI及具身智能技术的研究及开发,建立专门的AGI软硬件开发团队 [1] - 公司计划与国内外顶尖大语言模型及多模态AI团队合作,加速AGI、具身智能相关产品的研发进程 [6] 全球化战略 - 公司服务的客户已覆盖全球超过30个国家及地区,2024年海外收入占比达14.5% [7] - "本地化"是公司"出海"战略的关键,已与全球多地集成商达成深度合作伙伴关系 [7] - 公司智能叉车产品成功落地飞利浦总部荷兰工厂,为施耐德电气提供生产车间智能化升级解决方案,并与一汽—大众签署战略合作协议 [7] 未来规划 - 公司将持续加大研发投入,扩建内部AGI、具身智能专业研发团队,夯实技术研发实力 [6] - 计划建设全球销售体系,提高市场占有率并支持国际业务增长,增强品牌知名度、扩大营销渠道 [7] - 公司愿景是打造智能机器人开放平台,让更多企业低门槛拥抱智能未来 [8]
科技巨头裁员潮中逆势扩军!Alphabet(GOOGL.US)CEO:AI人才明年继续增长
智通财经网· 2025-06-05 14:25
公司战略与人才投入 - Alphabet首席执行官皮查伊表示公司将在2026年前持续扩大工程师团队规模,强调"人才仍然是关键"[1] - 公司近期将继续加大对工程团队的投入,以把握更多市场机会[1] - 皮查伊认为AI是提升工程师生产力的工具,可帮助其摆脱日常琐事[1] AI发展现状与挑战 - 皮查伊指出AI在代码编写等领域表现优异,但模型仍会犯基本错误[1] - 对于是否处于通用人工智能(AGI)的明确路径上,皮查伊表示尚无定论[1] - 美国科技巨头(如微软)今年裁员部分原因是为AI领域投资腾出资源[1] 搜索引擎与内容生态 - 谷歌将更多AI功能融入搜索引擎,引发出版商对网站流量减少的担忧[1] - 皮查伊强调谷歌仍致力于为网络内容引流,设计展示链接的体验[1] - 公司通过AI概览(AI Overviews)测试优先选择能带来高质量外部流量的方案[1]
奥特曼眼中的下一代AI模型:理解力和推理性更好且足够稳定
36氪· 2025-06-04 20:41
通用人工智能(AGI)的核心观点 - 相较于纠结AGI的准确定义和实现时间节点,更应关注人工智能技术持续呈现的指数级进步趋势及其带来的实质性突破 [2] - AGI的定义因人而异且随时间变化,定义之争意义有限 [2] - 技术发展的速度与轨迹才是关键,过去5年的进展速度在未来至少5年很可能持续 [3] AGI的核心能力标准 - 能自主发现新科学或独立进行科学探索 [3] - 成为超级工具,将全球科学发现速度提升数倍(例如翻两番) [3] - 按早期标准如图灵测试,现有模型"早就通过了" [3] 下一代AI模型的突破性进展 - 将实现"上一代模型完全无法企及"的突破 [4] - 具备四大核心能力:超强上下文理解、无缝连接工具系统、卓越推理能力、自主执行复杂任务的鲁棒性 [4] - 应用场景包括芯片设计、疾病攻克等,且"并非遥不可及" [4] AI的理想形态 - 体积小巧但具备超人类推理能力 [5] - 运行速度极快,支持高达一万万亿token的上下文窗口 [5] - 能够访问任何想象得到的工具 [5] 千倍算力时代的应用前景 - 构建强大推理引擎将改变人类能力边界,整合企业/个人全部背景信息 [5] - 算力投入方向:开发更强大模型(元层面)或提升测试阶段模型表现(应用层面) [5] - 采用"幂律法则"针对关键问题大幅提升算力投入 [5] AI与生命科学的融合 - Arnone项目展现AI解析RNA表达机制的潜力 [6] - 精确掌握RNA调控DNA表达机制有望攻克大量疾病 [6] - 千倍算力将对生命科学等基础研究产生深刻影响 [6]
又撞了!Kimi和DeepSeek为什么总爱盯同一块蛋糕?
核心观点 - Kimi当前战略重心转向模型能力提升和垂直领域布局,包括法律、医疗和学术搜索等方向,以增强专业性和减少幻觉 [4][5][6] - 国内AI原生应用竞争格局变化,Kimi从TOP3降至第四位,同时暂停投流营销,转向自然增长和用户留存策略 [14] - DeepSeek与Kimi在垂类赛道布局高度重合,均通过招聘专业数据标注人员提升模型在医疗、法律等领域的可靠性 [8][10] - 行业共识认为AI在生产力场景有商业化潜力,但垂类领域表现仍需突破60-70分瓶颈,需强化模型能力和专业数据挖掘 [12] - AGI仍是多家公司的长期目标,技术路径包括算法优化(如DeepSeek R1模型幻觉率降低45-50%)和算力迭代 [14][16][17] 公司动态 Kimi - 2023年11月月活用户达3600万,位列国内AI原生应用TOP3 [2] - 2024年专注模型能力提升,K1 6模型在LiveCodeBench代码生成测试中超过GPT系列部分版本 [5] - 近期上线学术搜索功能,并与财新传媒合作提升财经内容真实性 [6][12] - 暂停投流营销,转向自然增长策略,2024年Web端曾长期保持用户量第一 [12][14] DeepSeek - 5月招聘医学方向数据标注人员(百晓生),强化医疗内容索引能力 [8] - 6月升级R1模型,基于V3 Base增加算力投入,编程测试表现对标GPT-4和Gemini 1 5 Pro,幻觉率降低45-50% [16] 行业趋势 - 垂类赛道成为竞争焦点,法律、医疗等专业领域需求凸显,需解决模型幻觉和专业性不足问题 [10][12] - 创新驱动市场格局变化,如Kimi曾因200万字长文本出圈,DeepSeek近期通过技术突破跃居行业前列 [14] - 基础模型能力进入新阶段,阿里云认为技术门槛降低使更多企业站上同一起跑线 [16][17] - OpenAI计划推出GPT-5,或引发行业新一轮技术跃升 [17][18] 技术路径 - 算法优化:DeepSeek通过后训练提升模型推理能力,Kimi通过垂类数据专家优化专业场景表现 [5][16] - 数据挖掘:专业标注(如法律、医疗)成为减少幻觉的核心手段,需深度理解用户诉求 [8][10][12] - 算力与算法平衡:杨植麟提出当前需突破算法瓶颈而非单纯增加算力,类似"荡秋千"式发展 [15][16]
OpenAI CEO 奥尔特曼示警,AI 时代企业不行动就出局
搜狐财经· 2025-06-04 07:47
Ramaswamy 补充,上下文和计算能力是提升可靠性的核心。他特别提到"检索"和"记忆"不再是空洞术语,而是基础设施。 奥尔特曼以 OpenAI 新推出的编码代理 Codex 为例,称其让人"感受到 AGI 的气息"。目前,Codex 就像一个能工作数小时的实习生,但未来可能成为能持续 工作数天的资深软件工程师。 关于通用人工智能(AGI)的实现时间,奥尔特曼并未给出明确答案。他认为,AI 能力正在以"令人震惊的平滑指数曲线"增长。 如果将 ChatGPT 展示给 2020 年的人看,大多数人会认为这就是 AGI。Ramaswamy 则用潜艇是否"游泳"作比喻,指出当我们真正定义 AGI 时,目标早已再 次前移。 IT之家 6 月 4 日消息,在 Snowflake Summit 峰会上,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)直言不讳地对企业领袖发出呼吁:"Just do it"(立 即行动)。他强调,在 2025 年快速演变的 AI 领域,等待技术"稳定"已不再是明智之选,快速迭代的企业正在占据先机。 在交流对话中,奥尔特曼毫不留情地指出,企业在 AI 领域的成功取决于迭代速度。他 ...
图灵奖得主杨立昆:中国人并不需要我们,他们自己就能想出非常好的点子
AI科技大本营· 2025-06-02 15:24
大语言模型的局限性 - 当前大语言模型仅擅长信息检索和已有解决方案的复述 无法进行真正的抽象思考、推理和规划 [3][5][6] - 模型通过统计规律生成答案 本质是模式匹配游戏 无法创造新事物或提出正确问题 [5][6][18] - 训练数据已达边际效益递减 天然文本数据接近耗尽 合成数据成本高且回报有限 [11][13][14] AI发展的新范式方向 - 未来AI系统需具备理解物理世界、持久记忆、推理和规划四大核心能力 [29][37][38] - JEPA架构通过非生成式方法学习世界抽象表征 可预测物理规律并实现真正规划 [44][47][49] - 视频数据训练比纯文本更高效 儿童通过10^14字节视觉数据即可掌握基础物理规律 [36][37] 开源与闭源竞争格局 - 开源生态创新速度显著快于闭源 全球协作可加速技术突破 [50][53] - DeepSeek案例证明中国团队具备独立创新能力 2015年ResNet论文成为全球被引最高单篇论文 [3][53] - 实际部署中开源模型成本更低且可控 Llama等开源引擎正被广泛采用 [51] 行业投资与商业化前景 - 当前AI投资主要用于推理基础设施扩建 而非短期技术突破 [19][20] - 消费级AI应用已获验证 Meta AI用户达6亿 但企业级部署仍面临可靠性挑战 [21][24] - 专家系统历史表明AI需避免过度炒作 新范式需3-5年才能成熟应用 [25][30]
GPT-Kline:MCoT与技术分析
华泰证券· 2025-05-31 18:25
报告行业投资评级 未提及 报告的核心观点 - 多模态思维链(MCoT)将大模型的多模态与推理能力相结合,提升其应对复杂多模态任务的表现 [1][121] - 尝试将 MCoT 应用于 K 线技术分析场景,构建智能化、自动化技术分析平台 GPT - Kline,实现技术分析全流程自动化 [1][121] - GPT - Kline 能基于 K 线图像准确识别和深入推理,实现可靠走势分析、精准指标及形态标注、逻辑连贯报告输出 [1][121] 根据相关目录分别进行总结 大模型如何基于图片思考 - 多模态协同是大模型通往通用人工智能的必经之路,多模态大模型致力于将智能从文本单模态泛化至多模态领域 [17] - 早期多模态大模型仅增加图像输入,未充分挖掘多模态潜力,MCoT 可让大模型从“感知理解图片”到“通过图片思考” [12] - 计算机视觉底层技术突破和大语言模型能力迭代促成多模态大模型飞速发展 [18] 多模态思维链:从 CoT 到 MCoT - CoT 方法通过提示引导模型“一步一步思考”,提升其在复杂任务上的表现,与 TTS 方法结合让“思考”成为内生能力 [21] - TTS 为大模型测试阶段分配更多计算资源,如 DeepSeek - R1 模型通过强化学习提升推理表现 [23] - MCoT 是 CoT 在多模态领域的扩展,让大模型在图像问答任务中表现提升,扩展多模态大模型能力边界 [27][31] O3:从 Think Over Image 到 Think By Image - 2025 年 4 月 OpenAI 上线“满血版”O3 模型,展现惊艳图像推理能力,实现真正的“多模态推理” [37] - O3 模型在推理中调用工具应对复杂多模态任务,无需用户提示,自主规划流程 [37] - O3 在多模态推理和工具调用方面表现优异,但在文本写作、编码领域较弱,幻觉现象严重,未达通用人工智能标准 [39] MCoT 在投研中的应用初探:自动化技术分析 - 股票 K 线图与技术分析符合多模态、逻辑推理特征,是 MCoT 能力圈的应用场景,可构建大模型自动化技术分析应用 [42] O3 在技术分析任务中的表现 - O3 模型接收技术分析任务后,对图像建立感知,估算尺寸和坐标,裁剪图像,建立对应关系,规划标注内容 [46][50] - O3 调用 Python 工具在图像上绘制支撑/压力线和趋势线,标注较清晰完整,写代码规范可运行 [54][60] - O3 最终生成的技术分析报告结构清晰,分析有理有据,与标注呼应,给出走势判断和操作建议 [63] GPT - Kline:全自动技术分析流程的手动实现 模型选择 - O3 模型存在输出不稳定、内容有限、使用门槛高的问题,需构建专业版 O3 模型 GPT - Kline [65][69] - 选用的大模型需具备多模态输入和工具调用能力,截至 2025 年 5 月,GPT - 4o、GPT - 4.1、Gemini - 2.5 - Pro 等模型符合要求 [66][69] 工具调用 - 为大模型设计与图像交互的工具,让其具备画图、标注能力,工具调用流程包括用户提供工具、模型决定调用、用户执行代码等步骤 [70][73] 流程设计 - 为大模型设计指令输入、读取数据、绘制图像、图像分析、图像标注、输出报告的技术分析全流程,实时反馈结果并保留对话记忆 [79] 应用封装 - 基于 Gradio 设计网页端应用,提供手动选择和自然语言指令两种分析模式,界面左右两栏分别显示标注 K 线图和分析过程 [83] 结果 - 模型对比发现,OpenAI 模型标注“消极”且位置偏差,豆包系列模型标注丰富但内容偏差大,指令跟随效果不稳定 [95] - 以 Gemini 2.5 Flash 模型为例展示全自动技术分析流程,包括绘制 K 线、初步分析、技术指标标注、生成技术分析报告 [96] 总结 - 研究深入探索多模态大模型推理能力及其在投研中的应用,构建 GPT - Kline 平台 [121] - 研究存在支持资产品类有限、长周期 K 线分析能力待探索、投研其他场景应用潜力待挖掘等未尽之处 [125]
最新研究:AI情商测试完胜人类,准确率高出25%
36氪· 2025-05-29 16:23
人类情绪测试 - 伯尔尼大学与日内瓦大学研究评估六种最先进语言模型的情商能力 包括ChatGPT-4 Claude 3 5 Haiku等[2] - 测试采用五项心理学和工作场所评估标准 包含复杂现实场景如职场创意纠纷处理[2] - 标准答案"向上级反映"体现健康情绪管理方式 测试聚焦情绪理解与调节能力[2] AI情商表现 - 五项测试中AI平均准确率达81% 显著超越人类参与者56%的平均水平[3] - AI不仅理解情感 更掌握高情商行为核心要义 答案展现对情感复杂性的深刻理解[3][6] - ChatGPT-3 5曾在"情绪意识水平量表"测试中优于人类平均水平[6] 情商重要性 - 高情商者能建立更融洽人际关系 取得更优异工作表现 保持更健康精神状态[3] - 职场中情绪管理能力直接影响专业形象 管理不当易引发冲突或抑郁倾向[3] - 情感计算成为AI发展重点方向 应用于聊天机器人 数字助理及医疗辅助工具[3] 技术演进 - 自20世纪90年代情感机器概念提出后 AI情绪识别技术已取得长足进步[4] - 现代AI能精准分析语音语调 面部表情和用词选择 准确度常超越人类[4] - 相关技术已在医疗 教育和心理健康领域实现实际应用[4] 测试创新 - 研究团队验证AI能否突破情绪侦测 实现真正情感理解 测试包含情绪因果推理和调节能力[5][6] - ChatGPT-4成功生成全新情商测试题 在清晰度 可信度方面媲美心理学家开发的版本[7] - AI生成题项在表述清晰性 情境真实性和情感层次感方面获参与者高度评价[7] 应用前景 - 发现为开发情感辅导类AI工具铺平道路 可提供个性化情绪应对方案[8] - 推动高情商虚拟导师 治疗师研发 能根据情绪信号动态调整互动策略[8] - 技术虽无法替代人类共情 但预示通用人工智能在情感领域的潜力[8] 行业影响 - 情感智能使未来工具不仅能理解言语 更能读懂情绪 模糊人机界限[9] - 大语言模型或成为人类情感探索领域的可信伙伴 需审慎开发和负责任应用[9] - 研究显示机器智能与人类情感理解能力正逐渐趋同[9]