Workflow
通用智能
icon
搜索文档
北极光创投林路:从AI教育看AI创业
创业邦· 2025-09-15 18:11
AI与移动互联网时代的差异 - AI时代大模型公司追求通用智能而非单一垂直应用 与移动互联网时代操作系统厂商难以颠覆应用市场形成鲜明对比[2] - 大模型公司采用"模型即应用"战略 模型能快速扩展能力到任意领域并以更高维度直接竞争[2] - 大模型公司单位经济(UE)不理想 驱动其向周边场景渗透延伸能力寻找变现路径[2] 初创公司防御策略 - 行业know-how足够复杂难以被通用模型复制是抵御大模型渗透的关键[3] - 长期积累的用户数据能持续优化产品体验形成竞争壁垒[3] - 教育行业因know-how复杂性和数据积累特性成为抵御渗透的典型赛道[3] 教育行业核心know-how - 学习动机问题需要通过游戏化设计解决 如心流曲线设计保证挑战与能力平衡[5] - 教材设计需要精细编排 单词和句子结构呈现需循序渐进控制难度递增[8] - 正向反馈机制需要科学节奏安排与行为触发 而非简单语言赞美[9] - 传统教育公司通过数十年修订打磨形成教学体系 AI难以短期复制[8] 大模型在文科与理科的应用差异 - 大模型在理科领域仍会犯基础错误 如分不清3.11和3.8大小[13] - 大模型在文科领域表现突出 特别是在语言处理方面已超越人类水平[13] - 大模型能轻松完成新闻分级改写等传统需大量教研资源的工作[16] AI语言教育的突破点 - 大模型能提供个性化语言学习体验 如生成多样化例句展示词汇不同用法[22] - 结合配图与动画 AI能显著提升语言学习效率[23] - 系统能持续追踪学习轨迹 准确掌握知识点盲点构建个性化学习画像[23] - 大模型能模拟真实场景对话 解决"学会了却不会用"的核心痛点[26] AI对教育行业服务模式的变革 - AI能替代部分标准化服务工作 如通过学习数据提供个性化学习规划[32] - 基于用户行为数据 AI能给出专业学习建议建立信任关系减少销售干预[32] - 理想状态下教育公司只需保留教研和技术团队 其他服务由AI完成[34] 行业创业投资启示 - 深入具体行业探索AI实际改变比在大模型上修补更重要[36] - 行业know-how是基础大模型难以跨越的壁垒[36] - 找到比过去更好解决用户核心问题的方式是关键成功因素[36]
非夕科技高云帆:真正的通用智能依赖具身化与仿人化的深度融合
新浪科技· 2025-09-11 15:56
他表示,真正的通用智能,不仅需要算法的突破,更依赖具身化与仿人化的深度融合。通过在外滩大会 上的展示与交流,非夕希望让更多行业伙伴看到通用机器人在未来产业与社会中的广阔前景。 高云帆认为"仿人化"对于机器人迈入通用化至关重要,阐述了其作为通用智能发展的必经路径,如何通 过模仿人类的感知、动作与认知方式,推动机器人从单一任务走向跨场景的通用能力,从而成为智能时 代的下一站。 新浪科技讯 9月11日下午消息,在Inclusion·外滩大会现场,非夕科技携两大创新演示亮相展区。 在展区,非夕围绕仿人化,带来了两项极具代表性的应用:蛋雕演示、机器人按摩&数采演示。 非夕科技副总裁高云帆发表题为"通用智能的下一站:仿人化"的主题演讲。 蛋雕演示此前就一直备受外界瞩目。由自适应机器人拂晓Rizon担纲"雕花老师傅",通过灵敏的力觉感 知与先进的力控能力,实时调整力控参数,对生鸡蛋表面进行雕刻,还能随时切换图案。每一笔雕花既 是对末端力控精度的挑战,也是对机器人在柔性、易碎物体上实现动态建模与自适应响应能力的综合考 验。 机器人按摩&数采演示中,自适应机器人则化身按摩老师,依托自适应机器人遥操作应用,非夕还带来 了机器人按 ...
24小时高温行走直播后 智元机器人全系开售 卖这个价
南方都市报· 2025-08-18 23:48
技术突破与产品验证 - 远征A2人形机器人完成24小时高温户外自主行走挑战,实测气温37℃、地表温度61℃,创下全球首次人形机器人高温户外极限挑战纪录[1] - 机器人通过7种路面材质、12类障碍测试,验证其在昼夜温差(22℃-37℃)、强光逆光等复杂环境下的全自主能力[2] - 搭载多模态感知系统、大模型融合算法和20秒热插拔换电技术,单台累计行走超3000小时,通过8台机器60小时压力测试和120小时连续行走测试[2] - 采用"正向设计"工程思维,通过T1/T2版迭代优化,标配预留算力与传感器冗余,为算法迭代留空间[3] 商业化布局与产品矩阵 - 六大产品线同步登陆智元商城与京东商城,价格覆盖9 8万至45万元区间,包括远征A2系列、灵犀X2系列、精灵G1等[3] - 远征A2旗舰版配备百万级企业知识库和多语言对话能力,青春版定价16 8万瞄准文娱商演市场[5] - 灵犀X2系列覆盖情感交互需求,青春版支持30余种微表情,探索版开放二次开发权限,旗舰版具备自主导航导览功能[5] - 四足机器人D1系列细分市场:D1 Pro主打3 7m/s奔跑速度的商演租赁,D1 Edu定位教育科研,D1 Ultra以2kW/kg功率密度服务工业检测[5] 行业拐点与战略路径 - 公司采用"由易至难"策略,中标中国移动订单,将远征A2应用于企业大厅接待,未来拓展至文娱商演、康养陪伴场景[6] - 商业化优先选择ROI明确的商业服务场景(如品牌宣传),工业场景聚焦核心需求,当前机器人能力达人类60%-70%,目标年底接近100%[8] - 行业国产化率超95%,技术迭代依赖算法、传感器、硬件协同进步,2025年或成人形机器人"实用化元年"[8] - 行业逻辑从"技术参数极致"转向"场景适配精度",需满足降本增效、危险替代、体验升级三大需求[8] 行业发展趋势 - 人形机器人实用化落地关键从实验室转向真实世界,需应对高温、颠簸、突发状况等复杂条件[9] - 通用智能的核心是泛化性,需在仓库移位、宠物干扰等多元场景中灵活应对[7] - 行业从"概念热炒"进入"实干期",标志性事件包括24小时直播验证和线上开售[1][8]
破解「长程智能体」RL训练难题,腾讯提出RLVMR框架,让7B模型「思考」比肩GPT-4o
机器之心· 2025-08-14 09:26
腾讯混元AI数字人团队RLVMR框架研究 核心观点 - 提出RLVMR框架解决长程智能体存在的低效探索和泛化脆弱难题,通过奖励"思考过程"而非仅结果,实现端到端强化学习[4][6][26] - 7B模型在ALFWorld和ScienceWorld的L2任务中成功率高达83.6%,超越GPT-40等SOTA模型[11][12] - 智能体动作效率提升28.1%,训练收敛速度更快[13][14] 技术突破 - **元推理状态机制**:要求智能体行动前标记认知阶段(规划/探索/反思),使思考过程可追踪[7][15] - **可验证过程奖励**:轻量级验证规则实时评估思考质量,杜绝"瞎蒙"行为[8][15] - **双阶段训练**:冷启动SFT学习基础推理概念+强化学习RL内化能力,形成成长曲线[22][23][25] 实验数据 - **成功率对比**: - ALFWorld L2:RLVMR 83.6% vs GPT-40 68.8% vs DeepSeek-V3 53.9% [12] - ScienceWorld L2:RLVMR 32.2% vs GPT-40 41.0% vs GiGPO 25.8% [12] - **效率提升**: - ALFWorld L2动作数从28.9降至15.4(降幅46.7%)[14] - ScienceWorld L1动作数从27.9降至18.8(降幅32.6%)[14] 认知科学应用 - **反思机制**:使智能体主动识别问题而非盲目重试,重复动作率显著降低[18][19] - **元问题解决框架**:建立跨任务的通用思维方法论(规划-探索-反思),L2任务表现提升56.3%[20][21] - **过程奖励必要性**:移除元推理奖励(AMC)导致ALFWorld L2性能下降45.3%→12.5%[23] 行业意义 - 实现从结果导向到过程导向的范式革新,推动AGI向可解释、鲁棒性方向发展[26][27] - 验证"思维模式强化"路径的有效性,为构建具备真正推理能力的智能体提供方法论[21][26]
蛋白质基座的GPT时代来了?!
量子位· 2025-08-10 12:11
蛋白质基座模型AMix-1的核心突破 - 首次以Scaling Law、Emergent Ability、In-Context Learning和Test-time Scaling系统化方法论构建蛋白质基座模型,实现从BERT时代到GPT时代的跨越[1][2] - 模型具备通用智能特性,能自主学习并设计新蛋白质,最优变体蛋白质活性提升50倍[3][4][6] - 模型权重、代码和技术细节已全部开源,支撑虚拟生物实验室的蛋白质生成与进化[7][44][46] 四大技术超能力 - **Scaling Law**:通过多尺度模型组合(800万至17亿参数)精确拟合性能与计算量的幂律关系,资源投入与性能提升可预测[13][15][16] - **Emergent Ability**:训练过程中涌现"结构感知能力",自动理解蛋白质折叠方式与空间结构,实现从序列识别到结构理解的质变[18][19][21] - **In-Context Learning**:无需微调即可通过示例推理蛋白质规律,生成结构与功能一致的新蛋白(如高温酶设计)[23][24][27][29] - **Test-time Scaling**:通过EvoAMix-1算法实现验证预算增加时的持续优化,设计酶活性迭代提升[31][32][35][41] 实验验证与行业影响 - 湿实验验证显示,AmeR转录调控因子变体DNA结合活性提升50倍,超越现有方法77%[40] - 虚拟生物实验室实现全自动化蛋白质设计闭环,大幅降低传统试错成本[43][46] - 技术范式革新推动蛋白质设计从任务专用转向通用智能,类比NLP领域ChatGPT的突破[9][10][12]
爆冷,首届大模型争霸,Grok 4下出“神之一手”?DeepSeek、Kimi惨遭淘汰
36氪· 2025-08-07 09:16
赛事概况 - 谷歌旗下Kaggle平台举办首届全球AI国际象棋争霸赛 旨在通过游戏竞技评估通用大模型智能水平[1][3] - 参赛模型包括8款顶级语言模型:闭源阵营为Gemini 2.5 Pro、OpenAI o4-mini、Grok 4、OpenAI o3、Claude 4 Opus、Gemini 2.5 Flash 开源阵营为DeepSeek R1和Kimi K2 Instruct[1] - 比赛采用单败淘汰制 首日进行8进4淘汰赛 胜者以4-0全胜战绩晋级半决赛[2] 首轮赛果 - OpenAI o4-mini以4-0击败DeepSeek R1 后者在脱离开局模板后出现瞄准不存在棋子、防守无威胁空格等严重认知错误[11][13] - OpenAI o3因对手Kimi K2连续4局非法走子自动晋级 最短对局不足8回合 Kimi K2在脱离套路后出现棋盘误读[9][10] - Gemini 2.5 Pro以4-0淘汰Claude 4 Opus 后者在第十回合主动敞开防线送出突破口 成为首轮最接近真实对抗的对局[14][15][16] - Grok 4以4-0碾压Gemini 2.5 Flash 被业内评为开赛最佳表现 其精准识别弱点能力获马斯克在X平台转发[17][20] 赛事价值 - 游戏竞技具备无限扩展性和思维可视化优势 可完整追踪模型决策链并评估策略推理能力[3] - 明确输赢信号为AI智能评估提供理想试验场 尤其考验复杂推理任务中的长期规划与动态适应能力[21] - 真实评分标准基于数百场未公开对局 本次公开赛仅为测试通用智能的开局小规模测试[22] 赛程安排 - 半决赛对阵为OpenAI o3-mini对战同门o3 Gemini 2.5 Pro对战Grok 4[3] - 半决赛将于太平洋时间次日上午10:30举行[5]
安徽:未来产业已来 青年“加速进场”
中国青年报· 2025-08-03 09:59
未来产业布局 - 安徽聚焦量子科技、空天信息、通用智能、低碳能源、生命科学、先进材料、未来网络7个重点领域和第三代半导体、先进装备制造、区块链、元宇宙等N个兼顾发展领域 [1] - 目标到2027年未来产业规模突破2000亿元 2030年达5000亿元 [1] - 未来产业具备四大特征:科技含量足、转化周期长、研发投入大、政策需求高 [1] 核聚变产业 - 合肥汇集核聚变能源产业企业近60家 涵盖超导线材生产、主机设备制造等全产业链 [3] - 合肥综合性国家科学中心能源研究院孵化核聚变相关企业30余家 部分企业互为上下游 [3] - 安徽出台《以创新模式加速推进聚变能商业应用战略行动计划(2022-2035年)》 确立"三步走"发展战略 [2] 量子科技产业 - 合肥高新区集聚超70家量子产业链企业 [4] - 中电信量子集团推出"量子+"科技产品30多项 包括量子密话密信平台 [3] - 合肥加快建设量子信息未来产业先导区等公共服务平台 拓展"量子+"场景示范应用 [4] 人工智能产业 - 2024年合肥市人工智能产业总营收约千亿元 集聚上下游企业超千家 [5] - 智象未来与广告营销、影视制作等领域客户合作 对接新能源汽车、机器人等优势产业 [5] - 企业培养"AI+"复合型人才 融合计算机、人工智能与艺术、设计等专业背景 [5] 航空航天产业 - 中电科芜湖钻石飞机制造有限公司是国内无人机领域细分市场主要供应商 [6] - 中科星图在合肥布局9家子公司 建立超1000人团队 [6] - 发起"航天青年科学家培养计划" 每年为重点高校提供若干重点岗位 [6] 半导体产业链 - 芯聚德科技量产半导体封装核心材料IC载板 填补安徽省技术空白 [7] - IC载板项目全部建成后预计提供3000余就业岗位 [7] - 广德集中安徽省三分之二以上PCB企业 打造专业产业园降低企业运营成本 [7] 新材料产业 - 中研院集团量产0.12毫米"世界最薄触控玻璃" 实现从"跟跑"到"领跑"跨越 [9] - 研发30微米超薄柔性玻璃 实现全链条国产化 [9] - 研发团队35岁以下青年占比超过80% [9]
AI比人类还聪明!马斯克预测:不到两年AI将超越人类个体智慧,2030年前超越全人类智能总和【附人工智能行业市场分析】
搜狐财经· 2025-07-15 12:28
人工智能发展速度与预测 - 特斯拉CEO埃隆·马斯克预测AI智能水平将在不到两年内超越人类个体智慧,五年内超过全人类智能总和,若AI能力每年提升十倍,四年后智能将达当前十万倍水平[2] - 当前AI已超越多数人类但未超越顶尖个体或专业团队,发展遵循"加速回报定律",算力、算法与数据形成正向循环推动AI从专用向通用智能跃迁[2] - GPT系列从GPT-3到GPT-4参数规模增长10倍但综合性能提升超百倍,下一代模型可能通过多模态融合和自主进化机制实现质变[2] 全球人工智能行业格局 - 人工智能行业通过大模型突破实现语言、视觉与推理通用能力,算力、算法与数据驱动自动驾驶、AI制药、智能制造等万亿级场景[3] - 中美欧竞逐技术标准与生态主导权,全球80%以上AI专利和90%独角兽企业集中在美国和中国[3] - 美国凭借Google、OpenAI等在基础研究、硬件生态和开源社区领先,中国以"应用驱动创新"模式在计算机视觉、语音识别等领域形成竞争力[3] 领先企业人工智能布局 - Google开发TPU芯片支持深度学习运算,Meta组建芯片团队减少对外依赖,亚马逊为ALEXA硬件开发专用芯片[5] - 微软为HOLOLENS研发芯片并开展第三方授权,苹果发布A16 BIONIC芯片,百度发布昆仑芯片并收购芯片初创公司[5] - IBM拥有类脑芯片TRUENORTH和深度学习芯片LAKECREST,英特尔推出LOIHI等具有自我学习能力的AI芯片产品[5] 中国人工智能发展现状 - 中国已建立涵盖理论方法和软硬件的AI研发体系,截至2024年Q1累计发布478个大模型,数量仅次于美国[5] - 2024年9月中国人工智能核心产业规模接近6000亿元人民币,大模型技术被视为推动经济高质量发展的重要驱动力[6] - 专家建议通过"AI+实体产业"形成新质生产力,加大基础研究投入促进良性循环,空间智能视觉可推动机器人产业智能跃迁[6]
李建忠对话 KK 凯文.凯利:通用智能是个伪命题,AI 不应该模仿人类 | AI 进化论
AI科技大本营· 2025-06-23 16:38
AI 的人机交互、单一设备 VS 多元设备 - 凯文·凯利预测智能眼镜将在25年后取代智能手机成为个人计算中心设备,但需攻克储能技术等五项关键突破 [5][6] - 镜像世界的构建不依赖眼镜,特斯拉自动驾驶汽车和TikTok等已在扫描真实世界训练AI的空间智能 [6][7] - 技术发展呈现钟摆效应,未来设备可能回归专业化,但智能手机是例外,AR眼镜或成为通用平台连接专业化应用 [7][8][9] AI 的路线之争、通用智能 VS 专用智能 - 技术路线呈现从专用模型向通用模型统一趋势,大语言模型已统一文本任务,但应用层面专用AI更实用 [10] - AI发展路径存在巨大不确定性,分为"扩展派"(持续扩大模型规模)和"专业化派"(终端小模型、领域专用AI) [11][12] - 凯文·凯利个人倾向专业化路线,认为需为不同场景做好准备,避免垄断生态 [12] AI 哲学思辨、"异人智能"与人类智能 - AI智能与人类智能本质不同,AI意识将是"异人意识",其智能构成和演进环境(人类需求)决定差异 [13][14][16] - 人类价值在于责任承担能力,未来工作核心是管理AI并为其决策担责,人性本身成为稀缺资产 [15][16] AI 的创新 VS 人类的创新 - AI创造力分为日常创新(当前可实现)和颠覆式创新(25年内或部分实现),后者将开辟全新领域 [17][18] - AI创新呈现"异人"特质,如AlphaGo第37手,但社会消化现有AI技术仍需10年,重大突破尚需时间 [17][19] Agent 的生态与入口之争 - Agent生态将推动互联网从"信息网络"升级为"行动网络",入口之争涉及超级AI助理、操作系统或新型设备 [20] - 智能眼镜可能成为Agent交互界面,需支持多模态交互(语音、手势、表情),苹果等公司正探索相关设备 [20][21] AI 时代的操作系统 - AIOS需定义自然语言交互标准,实现跨Agent协作,开源属性可避免垄断,责任是规范人机交互协议 [23] AI 变革内容创作与内容消费 - 未来内容向3D/4D沉浸式体验迁移,AI将具备情绪反应能力,引发人机情感联结革命 [24][25] - AI成为内容主要消费者,催生为AI创作的新模式,如传记专供AI阅读,重塑互联网商业模式 [26][27] AI 时代的创业公司与巨头竞争 - 科技巨头面临创新者窘境,OpenAI等创业公司更可能主导AI变革,因巨头难以冒险投入高风险新业务 [28][29] - 突破窘境需强决断力领导者,如盖茨和乔布斯,但成功概率极低 [29][30] 人形机器人 VS 专用机器人 - 绝大多数机器人非人形但适配人类尺寸基础设施,仅家用机器人可能拟人化,工作场景优先普及 [31][32][33] AI 时代的组织变革 - 小公司AI应用速度快于大公司,因需重构组织而非简单添加AI工具,亚马逊要求15万员工强制实验AI [34] - 成功关键为持续试错(容忍10次失败)、量化评估人机协同效果,中层管理者受影响最大 [34][35] 行业活动与趋势 - 《AI进化论》系列直播吸引超50万人观看,聚焦DeepSeek等前沿技术,构建高信噪比思想策源地 [1][37]
李飞飞的世界模型,大厂在反向操作?
虎嗅APP· 2025-06-06 21:56
公司概况 - 李飞飞创办的World Labs专注于开发具备"空间智能"的下一代AI系统,探索AI对三维世界的理解与重建能力[2] - 公司在短短三个月内完成两轮融资,累计筹集资金约2.3亿美元,估值突破10亿美元,成为AI领域新晋独角兽[2] - 投资方包括a16z、Radical Ventures、NEA、英伟达NVentures、AMD Ventures和Intel Capital等科技与风投界重量级机构[2] 技术方向 - 公司致力于从语言模型向世界建模转变,认为真正的智能需要能理解和构建三维世界[5][8] - 核心技术包括NeRF(从二维图像到三维重建)、高斯平面表示法(快速描绘三维场景)、扩散模型(提升三维内容精细度)以及多视角数据融合技术[17][19][20][21] - 物理仿真与动态建模是另一关键技术方向,使AI能预测物体运动变化[23] - 这些技术组合旨在让AI获得类似人类的空间感知能力[24] 应用场景 - 游戏行业:AI可根据照片或视频自动生成逼真三维世界,替代传统手工建模[25] - 建筑行业:几分钟内生成完整空间立体结构,模拟不同光照效果[26] - 机器人领域:赋予机器人三维视觉,解决二维视觉下的空间判断问题[26] - 数字孪生:为工厂、建筑或城市建立虚拟世界进行预测测试[27] - 创意产业:辅助艺术家、设计师进行空间理解和创作[28][29] 行业挑战 - 数据问题:获取足够多包含深度信息、空间结构的真实场景数据成本高[31] - 算力限制:NeRF等技术计算资源需求大,难以大规模落地应用[32] - 泛化能力:现有模型在陌生场景中表现不佳,需要更强适应性[33] - 需要硬件、软件、数据、应用场景的全链路打通,非单一公司能完成[33] 团队优势 - 团队汇聚计算机视觉、图形学、扩散模型、物理仿真和机器人控制等多领域专家[34] - 采用多学科融合的研究范式,探索AI理解三维世界的新路径[35] - 团队背景多元,能从技术、人文、社会等多角度思考AI发展[37] 未来愿景 - AI终极目标是成为人类在物理世界中的智能延伸,而非替代人类[43] - 医疗、建筑、教育等领域将受益于AI的空间理解和操作能力[44] - 世界模型被视为实现通用人工智能(AGI)的第一步,需具备空间感知、动态推理等能力[46] - 代表AI从语言到世界、从二维到三维的演进方向,重新定义人机关系[47]