数据
搜索文档
这个 30 克的挂件,是 AI 的眼睛丨100 个 AI 创业者
晚点LatePost· 2025-12-10 15:37
文章核心观点 - 2025年可能是未来十年AI最被低估的一年,当前价值被低估的领域在于为AI提供物理世界数据输入和记忆工程的底层建造与探索性工作 [3][16] - AI硬件创业公司Looki的核心逻辑是:大模型是共识,但数据仍是非共识,创业者的机会在于通过硬件采集互联网之外的物理世界原子数据,为AI装上感官 [5][9] - Looki并非简单的AI相机或行车记录仪,其长期愿景是成为连接物理世界与数字服务的AI时代入口级平台,商业模式将从卖设备转向信息分发和生成式广告 [10][15] 公司背景与产品定位 - 公司创始人孙洋拥有CMU AI与计算机硕士学历,曾在谷歌、Momenta、美团负责AI与硬件相关业务,联合创始人刘博聪拥有CMU电子工程硕士学历及高通、百度、小马智行、美团等软硬件复合背景 [5][12] - 产品Looki L1是一款佩戴在胸前的可穿戴AI硬件,能持续记录用户第一视角视频,并生成漫画或视频总结,被比喻为“人生回看器” [4] - 产品设计追求“生命感”,采用不规则“猫耳”外观,为此牺牲了近30%的内部堆叠空间,使产品比理想状态更大 [10] - 产品于2024年8月在海外上市,首批几千台迅速售罄,计划于12月16日在国内正式发售且不再限量 [4][10] 产品战略与技术路径 - 公司对AI硬件的思考基于对移动互联网的复盘:移动互联网的本质是网络节点移动,而AI的底层逻辑是模型和数据 [9] - 公司放弃了等待终极硬件形态和目前技术不成熟的AI眼镜两条路径,选择了“第三条路”:先做纯粹的感知设备,再逐步追求形态的“无感化” [9] - 产品核心是给AI“看”的感知设备,追求感知的连续性而非高画质,下一代产品甚至可能为续航降低像素 [10] - 产品价值在于AI提供的服务,如记忆、知识压缩和高效率信息处理,可视为用户的“第二大脑” [10] 市场验证与用户反馈 - 首批产品售罄,核心用户包括Google、Meta高管以及一线好莱坞影星 [10] - 用户平均日使用时长从最初的6.2小时增长至7.9小时 [11] - 在Discord社区中,用户自发探索出生活顾问、健康助手等多种使用场景,表明产品与市场匹配度已初步跑通 [11] 融资历程与团队建设 - 2024年公司曾遭遇资本冷遇,一笔大额美元融资在最后一刻毁约,经历极度困难时期 [12] - 转机出现在2024年底,随着多模态大模型进步和硬件雏形显现,获得BAI、同歌创投的天使轮投资,随后阿尔法公社、钟鼎资本等机构接连入局 [13] - 产品上市后表现推高估值,出现投资人争抢份额的“超募”现象 [13] - 公司目前团队规模不到30人,完成了软硬件全栈研发,CEO将一半以上时间用于招聘,坚持亲自面试所有候选人,信奉招募最聪明的人并充分放权的Google式文化 [13][14] 商业模式与竞争壁垒 - 短期(两三年内)商业模式依靠销售硬件设备和订阅费 [15] - 长期商业模式在于“信息分发”和“生成式广告”,目标是成为物理世界与数字服务的连接器 [15] - 公司认为硬件本身没有壁垒,华强北可在4个月内完成复制,真正的竞争壁垒在于软件构建的“网络效应” [15] - 预判大厂可能在2027年对这一入口发起全面进攻,公司目前的优势在于时间窗口 [16] - 公司正通过每日洞察、九宫格漫画等功能增加用户粘性,并计划在用户量达到一定规模后推出基于软件层面的网络效应玩法 [16]
群星闪耀时:黄仁勋、李飞飞、杨立昆、G.Hinton、Y.Bengio、B.Dally深度对话|Jinqiu Select
锦秋集· 2025-11-10 15:44
AI发展的核心驱动力 - AI飞跃的关键并非算法突破,而是数据规模与算力基础设施的长期积累[6][9] - 数据匮乏曾是核心瓶颈,ImageNet数据集的创建(1500万张图片)成为深度学习黄金时代的起点[7][8] - 算力等待期长达40年,早期理论(如1984年的微型语言模型)因缺乏算力与数据而无法实现[9][10][32] AI技术范式的现状与分歧 - 当前AI热潮与互联网泡沫存在本质区别,几乎所有GPU都处于全负载运行状态,需求真实且持续增长[16][49] - 算力繁荣具备坚实基础,但大语言模型范式能否通向人类级智能存在显著分歧,需要全新科学突破而非简单扩展[17][18] - 模型能力持续进化,已从记忆概括向推理分析及智能体特征演进,技术演化速度惊人[49][53] 下一代AI的发展方向 - 大语言模型主要处理语言而非世界,下一次飞跃将源于机器对物理世界的理解与互动能力[20][22] - 空间智能(连接感知与行动的能力)是当前模型的核心短板,也是未来机器人与具身智能的关键突破点[21][56] - 自监督学习重新成为重要方向,将从语言数据扩展至视频、传感器等非语言数据领域[44][48] AI的产业影响与基础设施需求 - AI正在从工具向"智能工厂"演进,GPU集群成为生产智能的基础设施,需要上万亿美元投资支撑数万亿美元产业[50] - AI应用仅开发了1%潜力,几乎人类生活的每个方面都将因AI提升效率,使用量呈指数增长[55][52] - 传统软件是预编译的,而AI必须实时计算生成智能,这种生产方式本身创造了庞大的算力需求[50] 对智能本质的重新定义 - AI的目标不是超越或取代人类,而是增强人类能力,让机器承担人类不擅长的任务(如识别上万种物体)[12][13] - 机器智能与人类智能是两种并行、互补的存在,如同飞机与鸟类的飞行方式差异[14][60] - 行业应关注AI如何增强人类在创造力、共情力等独特领域的优势,而非单纯追求"人类级智能"指标[13][15]
香港金管局余伟文:Ensemble项目沙盒试点即将进入下一阶段
第一财经· 2025-11-03 15:23
文章核心观点 - 香港金融管理局总裁余伟文在“香港金融科技周2025”宣布,金融科技已深入整合至香港银行业,未来3年该领域年开支将超过1000亿港元 [1] - 香港即将推出的金融科技2030策略将聚焦数据、人工智能、韧性、代币化四大战略支柱 [1] 人工智能 - 人工智能已从实验性前沿发展为日常创新驱动力,超过四分之三的银行已在用例中部署或试点人工智能解决方案 [1] - 人工智能应用范围包含风险管理、信用评估及客户互动 [1] - 未来将联合不同金融领域及跨境创新者推进高影响力人工智能用例,并与业内合作创建共享的金融人工智能基础设施及安全数据环境 [1] - 将为银行提供实用工具和指南以推动负责任的人工智能落地 [1] 代币化 - Ensemble项目沙盒即将进入下一试点阶段,将允许使用数字资产和代币化存款进行实际价值交易 [2] - 将与其他监管机构共同孵化成熟的真实价值用例,初期将从代币化货币市场基金入手 [2] - Ensemble项目沙盒于去年8月推出,旨在通过央行数字货币支持代币化资产的银行同业结算,并验证代币化存款在交易中的技术可行性 [2] 韧性 - 行业正在探索新兴的高性能计算如何增强金融建模和实时风险评估的能力 [3] 数据 - 未来几年将进一步扩大商业数据通的可用数据集,包括政府黄金来源数据 [3] - 将与业界合作开发更多数据分析能力与实际应用场景 [3] - 通过跨境征信互通等方式,构建互联且可信的跨境数据生态系统 [3]
余伟文:金融科技2030策略聚焦四大战略支柱 旨在引领香港迈向金融科技3.0时代
智通财经网· 2025-11-03 11:47
文章核心观点 - 香港金管局提出金融科技2030策略 聚焦数据、人工智能、韧性与代币化四大战略支柱 旨在引领香港迈向金融科技3.0时代 [1] 人工智能战略支柱 - 超过四分之三的银行已部署或试行AI解决方案 应用范围涵盖风险管理、信贷评估到客户互动 [1] - 当局透过升级版生成式AI沙盒 推进高影响力的AI应用场景 [1] 代币化战略支柱 - 代币化是当局重点优先事项 透过Project Ensemble探索扩展至更广泛的金融应用 [1] - 下一阶段Ensemble试点将允许使用代币化存款与数位资产进行真实价值交易 连接本地业界与全球伙伴 [1] 数据战略支柱 - 未来几年将进一步扩大商业数据通可用数据集 包括政府黄金来源数据 [1] - 与业界合作开发更多数据分析能力与实际应用场景 [1] - 透过跨境征信互通等 构建互联且可信的跨境数据生态系统 [1] 韧性战略支柱 - 当局正强化核心金融市场基础设施的韧性 [1] - 转数快等平台将扩大覆盖与能力 [1]
推动人工智能全方位赋能千行百业(专题深思)
人民日报· 2025-11-03 06:21
文章核心观点 - 人工智能作为战略性技术正以前所未有的深度和广度重塑人类生产生活方式,加快发展新一代人工智能是中国抢占科技竞争制高点、推动产业转型升级的战略选择 [1] - 国家层面正全面实施“人工智能+”行动,旨在全方位赋能千行百业,推动人工智能技术与产业创新深度融合,赋能经济社会高质量发展 [1][4] - 人工智能的发展由数据、算法、算力复合驱动,三者的协同共振为其广泛应用构筑了坚实底座 [2][3] 人工智能的驱动要素 - 人工智能主要由数据、算法、算力复合驱动发展 [2] - 数据作为新型生产要素具有非竞争性使用、规模报酬递增等特点,用户规模越大、数据积累越丰富,模型训练效果越好 [2] - 深度学习等算法的突破使机器具备学习推理能力,能发现数据中的复杂模式,提供定制化的智能决策支持 [2] - 算力是激活数据要素潜能的关键动能,能支撑通用大模型训练迭代,并对经济社会发展效能产生放大、叠加、倍增作用 [2] “人工智能+”的应用与影响 - 人工智能已展现出解决现实场景复杂问题的核心能力,例如在科学研究中催生科研新范式,解决过去无法解决的重大科学难题 [3] - 在经济发展方面,人工智能通过优化资源配置和创新生产要素组合,能重塑生产函数、显著提升全要素生产率,并催生个性化、定制化生产和服务等新模式 [3] - 在社会建设方面,人工智能融入日常工作、学习、生活,在提升效率、优化流程、便捷服务等方面优势显著 [3][4] - 实践案例包括企业利用人工智能进行工业视觉检测提升生产效率,人工智能辅助诊断系统提升基层医疗水平,“城市大脑”改善城市运行等 [4] 政策支持与发展方向 - 国家通过完善顶层设计、加强工作部署,出台一系列政策措施推动人工智能综合实力整体性、系统性跃升 [4] - 具体发展方向包括在技术层面加强基础研究和关键核心技术攻关,如高端芯片、基础软件、大模型训练算法 [6] - 在基础设施层面统筹推进算力基础设施建设,构建全国一体化算力网络,并深化数据资源开发利用和开放共享 [6] - 构建政产学研用协同创新体系,鼓励企业等微观主体不断创新,并引导高校科研院所加强基础研究和人才培养 [6]
“现阶段就差数据了”Figure 03登《时代》最佳发明榜封面,CEO放话了
36氪· 2025-10-11 18:18
公司核心观点与战略 - 公司认为数据是解决机器人当前发展阶段几乎所有问题的关键,通过输入更多数据可显著提升操作速度并降低错误率,使其表现接近人类水平[6][7] - 公司的发展路线核心重点之一是让机器人最终进入全球每一个消费者家庭,承担洗衣、洗碗、打扫等日常家务[4][7] - 公司展望人形机器人未来需求接近100亿台,其成本极低且可每周工作7天,每天工作20到24小时[11] 产品性能与演示 - 公司向《时代周刊》演示的绝大多数操作策略在家庭场景处理极具挑战任务时实现了高性能运行[4] - 产品Figure 03被《时代》杂志评为2025年最佳发明之一并登上封面[14] 行业竞争与认可 - 除该公司外,宇树科技、DeepSeek、华为、比亚迪等公司的产品也入选了《时代》2025年最佳发明榜单[17] - 云服务巨头Salesforce作为《时代》杂志所有者之一参与了公司最新一轮十亿美元融资[16] 技术挑战与安全 - 公司目前关注的机器人安全领域有15个,首要解决物理安全与网络安全问题,例如大规模加密[9] - 公司正投入大量精力研究如何安全地进入美国家庭并保证机器人高效完成任务[10]
“现阶段就差数据了”Figure 03登《时代》最佳发明榜封面,CEO放话了
量子位· 2025-10-11 12:09
公司核心观点与战略 - 公司认为数据是解决机器人技术现阶段几乎所有问题的关键,通过输入更多数据可显著提升机器人操作速度并降低错误率[9][10] - 公司的发展路线核心重点之一是让机器人最终进入全球每一个消费者家庭,承担洗衣、洗碗、打扫等日常家务[11][12] - 公司对人形机器人市场的全球总需求量预期接近100亿台,并预见未来人形机器人的数量可能超过人类[15][16] 产品技术与性能 - 公司主要设计和制造人形机器人,其目标是将AI赋予身体,让机器人在现实世界中完成人类能做的事情[6][7] - 在演示中,机器人通过数据学习,其表现从频繁出错进步到错误率大幅下降,接近人类水平,可稳定运行数小时[10] - 公司目前重点关注约15个安全领域,包括物理系统安全工程和网络安全,以确保机器人能安全进入家庭[13][14] 市场认可与行业动态 - 公司的第三代机器人Figure 03被《时代》杂志评选为2025年最佳发明之一,并登上该榜单的封面[20] - 公司最新一轮融资规模达十亿美元,云服务巨头Salesforce是参与者之一,而Salesforce的CEO也是《时代》杂志的所有者[22][23] - 除该公司外,宇树科技、DeepSeek、华为、比亚迪等企业的产品也入选了《时代》的年度创新榜单[23]
Waymo自动驾驶最新探索:世界模型、长尾问题、最重要的东西
自动驾驶之心· 2025-10-11 07:32
Waymo自动驾驶技术框架 - 公司开发名为Waymo基础模型的大规模AI模型,该模型支持车辆感知环境、预测其他车辆行为、模拟场景并做出驾驶决策[5] - 模型功能类似于ChatGPT等大型语言模型,基于海量数据集训练学习模式并进行预测,能够整合多源传感器数据理解周围环境[5] - 车端部署较小模型,通过知识蒸馏技术从云端大型教师模型提炼而来,针对速度和效率优化,在每辆车上实时运行[5] - 感知和行为任务包括物体感知、行为预测和行动规划均可实时在车上执行[7] - 云端大模型可模拟真实驾驶环境,在部署前进行虚拟测试和验证决策[7] 世界模型技术特性 - 世界模型能够编码所有传感器数据(摄像头、雷达、激光雷达)并内置世界知识,解码所有驾驶相关任务[11] - 通过蒸馏缩小后放置在车端进行感知和控制,在云端进行虚拟仿真,实现强大泛化能力和快速适应不同平台[11] - 该模型基本解决自动驾驶日常问题,重点转向解决长尾问题[11] 长尾问题解决方案 天气挑战 - 雨后路况水坑及不常发生洪水需要算法判断水深和大量上下文信息,对精确度和召回率要求极高[12] - 采用视觉语言模型解法,但需要大量此类语料库支持[12] - 雪地驾驶对硬件要求高,传感器需加热和清洁功能应对堵塞,挑战包括行驶路线决策、车辙识别和摩擦力估计[14] 能见度与遮挡处理 - 极端低能见度情况下如夜间高速公路,需要多模态传感器协同检测[15] - 凤凰城沙尘暴环境中激光雷达可在尘暴中清晰看到行人[15] - 遮挡推理需解决视线不佳区域物体存在状态判断,挑战包括定义不明确、非确定性、缺乏真值基准等[18] - 解决方案包括估计不确定物体先验信息(通过驾驶数据统计和微弱传感器线索)以及准确估计自车速度先验[21] 复杂场景理解 - 施工场景需识别标志、推理驾驶几何形状,根据锥筒等物体调整路线[24] - 动态场景如交通警官手势需要实时响应动态信号[24] - 活跃事故现场涉及大量应急车辆和路况堵塞,需要整体场景理解而非单个物体识别[24] - 复杂场景需使用大语言模型理解场景内容并做出决策,公司表示仍在探索阶段[24] 自动驾驶核心要素 - 自动驾驶作为人工智能落地场景,核心要素为数据、算法、算力三大件[25] - 公司特别强调数据重要性,认为大量数据是基础,但数据筛选和整理更为关键[25] - 高效高质数据能确保模型专注于解决正确问题[25] - 数据挖矿中视频搜索能力对理解事件含义至关重要,如汽车碰撞、漂移等[30] 系统响应性能要求 - 快速实时决策被强调为安全性和流畅性关键,算法到执行链路用时越短越优[30] - 响应速度拆解为传感器输入响应、算法运算结论输出、底盘执行机构三个环节[30] - 当前快速响应决策主要受限于各家算法处理输出响应频率[31] - 摄像头帧率大于24Hz,算法输出帧率需达到10Hz或20Hz,底盘刹车ESP响应频率达上百Hz[36] 运营基础设施 - Depots运营停车场和改装工厂被公司视为L4运营最重要设施[33] - 车辆可自动进入停车场寻找充电空位,充完电拔枪后自动驶出运营[33] - 改装车间完成传感器安装后,车辆可自动驶出生产线,直接进入运输卡车或开始运营[33] 行业发展趋势 - 辅助驾驶与自动驾驶产业最终将交叉融合,因算法软件底层逻辑相同[4] - 中国辅助驾驶算法公司如Momenta、元戎、大疆与L4公司共同在欧洲和中东市场拓展[4] - 工程落地是行业较大壁垒,需要协同汽车开发与测试运营,优秀自动驾驶公司多挖角传统汽车工程师[34]
Gemini灵魂人物加盟xAI,马斯克亲自夹道欢迎!
量子位· 2025-09-26 17:12
核心观点 - 前谷歌DeepMind资深研究员Dustin Tran加入xAI 其作为Gemini系列核心开发者将助力xAI技术发展 马斯克亲自欢迎体现其重要性[1][4][6][8] - Tran在谷歌期间主导多项突破性AI项目 包括Gemini系列开发及早期TensorFlow等框架构建 其学术论文引用超2.4万次[11][15][18][25] - Tran加入xAI主要因算力资源(数十万张GB200芯片)、数据策略及马斯克企业理念三大优势 预计将加速Grok系列模型迭代[29][30][31][33][35] 人才流动与行业影响 - 顶级AI研究员从谷歌流向xAI 反映头部科技公司人才竞争加剧 核心人才对技术路线具有决定性影响[4][27] - Tran在谷歌8年期间主导关键项目转型 包括100天内基于LaMDA开发Bard(Gemini前身) 并最终推动Gemini系列实现技术反超[12][13][15][16] - 其早期参与OpenAI Dota 2 AI项目 具备多平台经验 跨公司技术积累可能促进xAI技术融合创新[19][21] 技术成就与里程碑 - Tran团队开发的Gemini 1.5 Pro在LMArena霸榜超一年 帮助谷歌重新确立AI领域竞争力[15] - 其2016年发表的校准度量论文开创深度学习评估基准 论文引用671次 直接影响LLM可信度评估标准[23][24] - 参与构建TensorFlow、Vision Transformer(参数量达220亿)等基础框架 相关论文引用超700次[18] 公司战略与资源对比 - xAI算力优势显著 Tran称人均芯片数量远超谷歌 且数十万张GB200芯片尚未完全部署[29][30] - xAI数据策略聚焦RL与后训练规模化 结合专业数据标注团队扩张 预示训练方法升级[31][32] - 马斯克强调"一阶导数和二阶导数"理念 公司发展加速度被视作核心竞争优势[35] 行业竞争动态 - OpenAI被指曾通过提前发布囤积点子抢占头条 但当前创新储备可能见底[37] - 谷歌在GPT-3.5发布后启动"红色警报" 反映头部企业对技术迭代速度的危机响应机制[12] - Gemini系列成功扭转谷歌市场预期 股价曾因Bard发布单日蒸发近千亿美元[14][15][16]
预不预制,好不好吃?
虎嗅· 2025-09-12 14:21
核心观点 - 文章核心观点在于区分和阐明事实、猜测、观点、情绪、数据、定义、共识、争论和程序等概念在公共讨论中的不同作用与意义 [21][23] 概念定义与区分 - 事实是指客观存在的实际情况,例如一家餐厅是否使用了预制菜 [1][2] - 猜测是基于个人感觉而非证据的判断,例如在不确定的情况下认为一家餐厅使用了预制菜 [3][4] - 观点是个人主观的看法,例如认为一家餐厅不好吃或很贵,这种看法没有对错之分 [5][6][7][8] - 数据是通过测试或调查得出的量化结果,例如通过1万人的测试发现51%的人认为好吃而49%的人认为不好吃,这也是一种事实 [9][10] - 情绪是基于个人观点产生的强烈感受,例如因认为餐厅贵且不好吃而感到气愤 [11][12] - 公开传播与事实不符的言论可能构成诬陷,而私下表达则可能仅是情绪发泄 [13][14] - 定义是由国家或权威机构制定的标准,例如国家对预制菜制定的标准 [15][16] - 共识是在没有官方标准时被大众普遍认同的某种标准 [17][18] 讨论与程序 - 争论源于不同个体基于主观观点的分歧,例如对餐厅口味好坏的争执 [19][20] - 有效的讨论应遵循特定程序:先确定定义或标准,再基于事实进行判断,最后公开结论 [21] - 纯粹基于个人观点的争论通常没有结果,因为主观看法无法达成客观一致的结论 [23]