Workflow
深思SenseAI
icon
搜索文档
李飞飞世界模型爆火后,我们实测后发现离「真可用」还很远
深思SenseAI· 2025-11-14 20:40
产品核心功能与技术特点 - World Labs公司发布“世界模型”,可根据单张图片和提示词创建3D世界 [1] - 支持两种使用方式:直接通过提示词生成世界,或上传图片由系统自动生成提示词和世界 [1] - 在初始视角下生成效果颇为亮眼,画面质量和精美程度表现良好 [1][2] 当前技术局限与性能瓶颈 - 空间范围扩展后质量快速下降,远离起始区域后场景出现模糊、扭曲、拉伸等失真现象 [3] - 现实输入与生成空间之间存在明显质量断层,从图像视角稍作移动后质量显著降低 [4] - 世界越大细节越稀疏,难以维持足够的密度和几何连续性,大范围探索时沉浸感不足 [5] - “世界延展”功能存在严重几何扭曲与纹理拉伸,画面偏向高度抽象化 [6] - 多图生成功能运行效率低下,实测中任务运行两个多小时仍停留在初始loading状态 [8] 用户实际体验反馈 - 多图合成功能经常长时间卡在生成中,在Reddit和小红书等平台被用户反馈“形同摆设” [8][12][14] - 官网展示的游戏项目效果与普通用户实际使用体验存在明显落差 [17] - 对于不具备专业背景的个人用户而言,产品能力的可享受程度有限 [17] 行业定位与发展前景 - 该产品被视为AI生成游戏与虚拟空间的早期雏形,技术概念前沿但距离成熟应用尚有距离 [19] - 在技术路径上为虚拟世界构建、机器人仿真、数字孪生等应用打开了新的想象空间 [19] - 作为标志性起点,展示了下一代空间计算与内容生产工具的轮廓 [19]
当 AI 在耳机里主动和你说话,BeeBot 正在开启下一代社交形态
深思SenseAI· 2025-11-14 09:34
BeeBot产品概述 - 产品是一款名为BeeBot的个性化电台机器人,已登陆美区iOS应用商店测试,通过耳机提供基于位置的语音播报,在用户步行时告知朋友动态、本地新闻及附近活动 [1] - 产品定位为音频优先、主动式的社交实验,由Foursquare创始人Dennis Crowley推出,旨在探索现实世界的数字连接新形态 [1] - 产品支持任何有线或无线耳机及蓝牙音频设备,包括扬声器、车载音响和Meta的Ray-Ban智能眼镜,虽然应用标注为AirPods版但具备广泛兼容性 [3] 核心功能与运作机制 - 产品常驻后台待机,戴耳机自动唤醒,摘耳机休眠,听音乐时调低音量插入播报,听播客时智能暂停/续播,通话或视频场景零干扰 [3] - 用户每天会收到数次更新推送,避免高频打扰,内容整合实时位置信息、用户分享动态及本地网站活动数据,根据兴趣关键词智能推荐附近地点与活动 [3] - 产品开创地面级地点标记新玩法,允许用户精准标注具体点位并留下语音彩蛋,实现沉浸式地理社交,如标记涂鸦墙或分享小众景点路线 [10] - 产品具备突发新闻功能,覆盖街区至全球视角,内容经本地运营团队审核真实性后精准触达相关区域,目前仍在实验阶段 [11] 内容生成与个性化体验 - 每日首次佩戴耳机时提供城市晨报,用1-2句精炼语音播报所在城市新鲜事,内容结合团队人工精选全城热点与AI引擎基于用户行为的个性化推荐 [5] - 社交提醒功能整合好友打卡动态、本地新闻与周边活动数据,通过大模型分析生成专属生活摘要,例如通知好友行踪或地铁延误等实用信息 [6] - 基于用户画像(如发布内容、去过地点、个人资料关键词)持续扫描周边区域,推荐可能感兴趣的现实活动,例如根据喜好提示沙士汽水供应点或F1赛车展览 [7] - 当用户移动至新区域时,产品会提示附近好友及活动,受《塞尔达传说》游戏设计启发,增强现实探索感,如进入中城区时通知好友位置及公园观鸟活动 [8] 技术基础与创始人背景 - 创始人Dennis Crowley长期践行让数字软件走上街头的理念,2004年开发Dodgeball实现手机现实互动签到,后被谷歌收购,随后联合创立Foursquare推广签到概念全球 [12] - 2024年联合创立新公司Hopscotch Labs,BeeBot作为首个项目融合其过去所有想法,包括将曼哈顿变为吃豆人游戏等线下快闪项目经验 [13] - 技术依赖Foursquare积累的海量用户签到数据构建的地点位置能力,为Uber、Apple等提供底层位置服务,其路径感知、地点触发等方法论可直接迁移至BeeBot机制 [14] - 产品继承Marsbot for AirPods技术逻辑,如自动调低音乐音量、无缝暂停播客等细节工程,并借鉴Foursquare对频率与时机控制的经验,优化播报优先级与口吻生成 [16] 产品哲学与行业愿景 - 产品定位为面向街头的AI,旨在将用户从虚拟信息流拉回现实,通过语音播报身边事促进人与人真实连接,减少手机屏幕依赖 [17] - 核心灵魂是主动式人工智能,根据情景触发机制主动提供服务,如走到咖啡馆提示优惠,探索主动式AI与环境感知的交汇点 [18] - 契合可穿戴AI硬件普及趋势,支持耳机、智能眼镜等设备始终在线收集环境信息,致力于开发无需手动交互的主动式人工智能产品 [18] - 产品设计强调无需使用应用,戴耳机自动开启,摘耳机关闭,反对通过诱导用户停留提升月活/日活指标,主张减少手机触碰以激发好奇心 [20] - 创始人试图通过BeeBot重现早期社交软件注重人际链接的氛围,结合简单状态更新与便捷音频方式,将人们从算法信息流解放,增加现实世界感知 [21]
a16z对话Nano Banana团队:2亿次编辑背后的"工作流革命"
深思SenseAI· 2025-11-12 09:02
产品定位与核心能力 - 产品定位为通用创作平台,旨在重构创作全过程,整合对话式编辑、角色一致性与多图叙事功能[1] - 核心能力包括高度一致的角色生成、一键迁移的风格、拖拽完成的复杂编辑,将原本耗时数周的角色设计和分镜绘制压缩到几分钟内完成[1] - 模型具备多模态对话能力与高质量视觉效果结合的优势,支持生成图像的同时生成文本,并可进行对话式编辑[4] 技术开发与模型特性 - 开发过程重点优化定制化能力和角色一致性,并将其作为关键监测指标[12] - 模型具备交互式对话的迭代特性,支持长对话中像创意搭档一样陪伴创作,但长指令遵循能力仍有提升空间[12] - 采用多模态架构,模型在内部可能学习到潜在的世界表示,对3D理解已相当出色,可对生成视频进行三维重建[21] - 底层表示目前以像素为主,但未来可能发展混合表示以提升可编辑性,如支持矢量图等结构化格式[27] 市场反响与用户需求 - 产品发布后用户请求量远超预期,不得不一再上调每秒请求数配置,表明市场价值超预期[6] - 个人化应用激发强烈情感共鸣,当用户生成自己、家人或宠物的图像时,使用活跃度爆发式增长[7] - 创作者最看重控制感,特别是角色物体一致性和多图风格迁移能力,这些是维持有说服力叙事的关键[11] - 评估发现当模型在角色一致性上超过某个质量阈值后,应用场景会突然起飞,目前已达实用临界点[22] 未来发展方向 - 未来创作工具将呈现光谱状分布,专业端侧重创意爆发与枯燥工作自动化,消费端涵盖从娱乐分享到任务代理的多种场景[8][9] - 不认为会出现单一模型统治一切的局面,未来将是多模型共存状态,不同类型模型服务不同用户偏好[16] - 关键能力倍增器包括低延迟(如10秒而非2分钟响应)和信息可视化,后者要求模型保证事实准确性[30] - 视频被视为终极方向,因视频本质是时间轴上连续的动作,当前图像编辑可视为低帧率视频互动[30] 行业影响与创作演变 - 技术正推动创作者角色从执行者转变为与AI长期对话的创意导演,聚焦故事与情感打磨[1] - 艺术创作的核心是人的意图和品味,模型作为工具赋能艺术家,但不会取代几十年积累的专业手艺和设计语言[10][36] - 专业用户界面可能趋向复杂节点式工作流(如ComfyUI),而大众界面则可能更智能,能根据上下文提示下一步操作[15] - 图像生成与代码生成能力交叉产生新可能,例如用代码模型在Excel中复刻图像,展示出零样本迁移的问题解决潜力[28]
未来已来!AI飞行器时代,将代替大部分人工
深思SenseAI· 2025-11-06 12:46
Infravision公司及其创新技术 - 公司开发了一套集成无人机、地面电动绞盘和专用牵引器具的完整系统,旨在实现对传统人工作业和直升机架线模式的全面自动化替代[3] - 系统的核心创新在于地面电动绞盘的自动放线技术,绞盘能随无人机的飞行姿态自动收放牵引绳,实现与空中牵引作业的精准同步,使系统获得堪比直升机的牵引能力与作业高度[3] - 自2018年成立以来发展迅速,在2025年完成了9100万美元的B轮融资,业务从澳大利亚起步,正逐步扩展至北美等全球市场[1] 无人机架线方案的优势 - 避免了人员高空作业和直升机飞行的安全隐患,不受地形限制,并实现了在超长距离跨度上的连续架线,无需人工干预[5] - 无人机体积小噪音低,对沿线环境和土地的影响更小,减少了施工对土地权属方造成的干扰[6] - 效率更高、成本更低,由于省去了出动大型直升机及大量人力的需求,每条线路的架设速度明显提升,整体项目周期缩短,同时施工成本也降低[6] - 优势在于提供成套解决方案,不仅有硬件,还包含软件和服务支持,使客户能够以租赁服务的方式快速采用这一新技术[6] 实际应用案例与效果 - 在澳大利亚Powerlink电网建设项目中,为一个抽水蓄能电站敷设约50公里长的275千伏高压输电线路,无人机系统展现了更高的施工效率和安全性[7] - 传统方法需要出动直升机反复架设导引绳,而Infravision的方案一次性连续铺设了超长距离的线路[7] - Powerlink的CEO评价称,无人机架线更灵活多能,且对土地的影响更小,安全性更高,相较直升机等传统手段具有显著优势[7] Infravision公司的成功战略 - 战略上精准聚焦于高价值细分场景,即电力传输线路架设,这个市场痛点明显且随着新能源大发展急需扩容升级[8] - 选择从澳大利亚本土切入,在本国广袤地形和能源项目中验证技术,从而建立了样板工程,用有限资源撬动了重要客户需求[8] - 注重提供端到端解决方案而非单纯卖产品,通过租赁设备并提供作业服务的模式,深入参与客户项目,形成长期合作关系[9] - 积极拓展全球版图,在澳洲市场验证成功后,迅速将目光投向电网升级需求巨大的北美市场,与美国PG&E等龙头客户建立联系[10] - 组织扩张上执行力强,预计2025年底员工将从70人增至150-200人,以满足订单和项目需求[10] 空中具身智能赛道概述 - “空中具身智能”指的是赋予飞行机器人以自主认知和物理交互能力的前沿领域,研究主体是各类AI驱动的、能自主决策、感知环境并直接操作物理世界的无人机群体[11] - 其技术基础是视觉-语言-动作模型,流程为感知(通过摄像头、激光雷达等)→认知(理解环境、对齐任务目标、规划行动路径)→行动(向飞行器底层控制系统发送指令并执行)[11] - 价值在于灵活行动、学习、决策,能挂载机械臂或专用工具直接执行带电喷涂、清洗等需要物理接触的任务,承担重复、危险的作业环节[12] 无人机集群控制与技术应用 - 无人机集群控制是指协调多架自主无人机为完成共同任务而协同工作的技术,控制方式可以是集中式或分散式[12] - 带来的实际好处是多机并行覆盖,使同样的巡检、测绘、搜救任务可以更高效[12] - 典型应用场景覆盖电力设施巡检(包括国家电网的室内变电站、地下电缆及发电厂燃烧炉)、森林资源调查与应急消防任务等[12] 行业主要参与者 - 微分智飞是国内代表性的创业公司,专注于打造通用空中机器人具身智能“大脑”及集群系统,核心技术涵盖自主导航、环境感知、机器学习决策和群体协同[13] - 该公司推出了P300自主探索无人机等产品,可在无GPS信号环境下自主完成矿洞、隧道等复杂空间的测绘巡检任务[13] - 其定位在于提供通用型平台,赋予各类无人机独立智能和群体协作能力[14] - 北京威斯博科技专注于GNSS拒止环境下自主定位、避障、导航、跟踪、识别的无人机及蜂群的研发[15] - 美国的Exyn Technologies开发了能在地下矿井自主飞行的无人机,拉脱维亚的Aerones公司使用系留多旋翼无人机为风力发电机叶片清洗和维护[15] - 传统无人机巨头如大疆开始入局具身智能领域,发布了具备更强负载和智能避障能力的机型,如可载重30公斤的FlyCart30物流无人机[15] 当前市场创新热点 - 通过强化学习训练无人机掌握特技飞行技能,在算法上达到或超越人类飞手水平[17] - 利用数字孪生和仿真环境对无人机进行大规模试错训练,缩短开发周期[18] - 将新型软体机器人技术引入飞行器设计,使其在发生碰撞时更具弹性以保护自身[19] 未来发展愿景 - 电网只是第一块被改写的拼图,微分智飞等在矿业、轨道交通和应急管理等垂直领域已有了一些标杆场景[20] - 微分智飞未来将拓展更多行业应用场景、完善产品线提升通用性、并探索海外市场[20] - 行业提供的并非“一台更专业的无人机”,而是一种全新的作业范式,将危险与重复性工作解构为一系列可被机器自主执行的标准化任务[20]
B轮融资2000万美金:Archy 用云 OS + AI Agent重写牙科运营
深思SenseAI· 2025-11-04 10:38
公司概况与市场定位 - 公司是一家面向牙科诊所的一体化云操作系统提供商,产品定位为云端PMS(诊所管理系统)与原生AI Agent的结合[6] - 公司成立4年,业务已覆盖全美45个州,服务250万患者,累计处理3500万张X光,年化支付处理总额超过1亿美元[3][6] - 典型中型诊所每月可节省约80小时人力,团队规模约为57人[6] - 2025年10月30日完成2000万美元B轮融资,由TCV领投,Bessemer、CRV、Entrée及25位执业牙医跟投,累计融资额达4700万美元[3][6] 产品核心模块与技术优势 - 产品设计基于数据分析优化用户操作路径,减少点击次数,将多软件功能整合并内置自动化任务[4] - 核心产品形态为四个可直接采购的模块:Cloud PMS、Archy Intelligence、Payments & A/R、Imaging & Clinical[5] - Cloud PMS提供开箱即用的一体化后台,一个账号覆盖预约、病历与影像、保险理赔、收费支付、患者沟通、经营报表等核心环节,采用分层订阅计费方式[7] - Archy Intelligence包含五个原生AI Agent:Insight(数据中枢与自然语言查询)、Verify(保险资格核验)、Scribe(口述生成病历)、Connect(自动化沟通)、Revenue(应收管理与Text-to-Pay)[7][8][9][10] - Payments & A/R模块整合触达、收款、对账流程,支持现场支付、在线支付及Text-to-Pay短信支付,旨在缩短应收账款天数[12] - Imaging & Clinical模块实现影像采集、历史比对、病灶标注同屏完成,支持离线拍片,并与临床影像AI伙伴深度集成[12] 市场竞争与差异化策略 - 公司核心差异化在于同一数据底座和权限体系,AI在流程内直接执行动作,以回款闭环压缩应收账款天数,并注重合规留痕和标准化迁移以降低风险[6] - 竞争优势体现在快速迭代与自主研发能力,将核心模块全部自研,减少外包拼接,以小步快跑节奏优先优化80%诊所的高频流程[16] - 产品原则强调极简化操作,降低使用门槛,使新人无需厚手册和长培训即可上手,帮助诊所摆脱软件学习成本对团队扩张的制约[17] - 产品迭代机制以客户实际反馈为核心,形成从临床一线到设计迭代的闭环,确保功能真正解决诊所实际痛点[18] 未来发展规划 - 公司未来愿景是重写诊所的操作系统,将后台和AI能力融合为可进化的实践伙伴,目标远不止于做一款PMS[25] - 工程取舍明确,下一阶段重点不是增加聊天功能,而是深化“问-判断-执行”的可落地产品力,为每个岗位打造懂上下文的AI同事[27] - 未来12个月将重点发展按岗位拆分的多角色Agent,沿人手紧、理赔慢、回款慢三大行业难题深化,目标是让应收更快回笼、前台更少回拨、医生更专注看诊[28]
288亿独角兽!复旦女学霸创业3年,被黄仁勋和苏妈同时押注
深思SenseAI· 2025-10-30 09:04
公司概况与市场地位 - 公司是AI推理服务提供商与推理层基础设施平台,定位为让模型运行更快、更便宜、更稳定,把推理变成类似云计算的计量服务 [5] - 成立3年时间,年收入已达2.8亿美元,公司估值达40亿美元,是AI推理赛道增长最快的独角兽 [1] - 目前已服务超过10,000家企业客户,每天处理超10万亿tokens,客户包括Cursor、Notion、Uber、Samsung、Shopify等明星产品 [1][5] 融资情况 - 2025年10月28日,公司宣布完成2.54亿美元C轮融资 [1] - 本轮融资由Lightspeed、Index Ventures和Evantic领投,英伟达、AMD、红杉资本、Databricks等知名机构跟投 [1][5] 创始团队与技术渊源 - 创始人乔琳是PyTorch框架的核心创建者,职业生涯始于IBM研究,后在LinkedIn担任技术主管,在Meta担任AI平台架构关键负责人,领导超300人工程师团队 [3][5] - 创始团队由六位参与过Meta PyTorch项目的资深工程师与一位前谷歌AI专家组成,堪称“梦之队” [6] - 公司核心洞察是“训练是科研的浪漫,推理才是产业的现金流”,创新焦点从“构建”转向“应用” [1][8] 核心产品与服务 - 第一类产品是Serverless推理云,面向开发者提供“即开即用”的API,按token计费,兼容数百个开源与私有模型 [11] - 第二类产品是专属部署方案,针对金融、医疗等高合规行业,提供独立GPU资源和专用网络隔离,按GPU秒计费 [11] - 第三类产品是微调与评测服务,提供从数据治理、训练微调到在线评测的一体化能力,按训练token计费 [12] 技术优势与性能表现 - 自研的Fire Attention推理引擎与Fire Optimizer可在硬件与算法之间自动搜索超过十万种配置组合,使推理速度提升10–40倍、成本下降数十个百分点 [12] - 以客户Cursor为例,在公司的推测解码技术支持下,模型处理代码的速度提升13倍,从“等半天”变成“几秒钟” [14] - 技术底座建立在深度GPU优化与架构级创新上,把延迟、吞吐、成本这些工程参数转化成企业可以签约的服务条款 [9][12] 市场竞争与差异化 - 直接竞争对手包括Together AI、Replicate、Groq、Baseten Labs等初创公司,以及AWS、Google Cloud、Azure等云巨头 [15] - 差异化优势不是“最快”或“最便宜”,而是“最优化”和“最易用”,支持数百个开源模型,跨多云多区域运行 [16] - 护城河是“客户数据+定制化能力”的飞轮,每个客户的微调数据都在优化系统,越用越好 [16] 行业趋势与未来战略 - 生成式AI带来的范式转移让创新焦点从“构建”转向“应用”,推理的市场规模将远超训练 [8] - 公司预测2025年将成为“Agent年”和“开源模型年”,各行业将涌现大量解决垂直问题的AI智能体 [20] - 未来核心战略是强化Fire Optimizer系统,特别强化在推理质量上的能力,通过个性化定制提升模型效果 [20] - 终极愿景是让每个开发者都能定制模型、注入数据,全面提升推理能力,让AI控制权回到构建者手中 [21][22]
全天候无劳动力限制,AI经济正在到来
深思SenseAI· 2025-09-28 09:36
人类经济活动的数字化进程 - 人类经济活动数字化始于1946年计算机发明 计算能力远超人类脑力 例如1874年人工计算圆周率至707位耗时15年 而2019年谷歌云平台将圆周率计算至31.4万亿位[2] - 数字化进程分为两个阶段:第一阶段是互联网和移动互联网时代 实现物理世界数字化但决策依赖人脑 第二阶段是AI经济时代 算法可完成决策并交付工作成果[7] - 互联网和移动互联网通过全局搜索和个性化推荐极大提升匹配效率 信息匹配从报纸书籍升级至今日头条 商品匹配从小卖铺升级至拼多多 社交匹配仍待突破[8][9][10] - 当前数字化集中于消费端 企业端数字化程度不足 且仅优化"收集信息"环节 "决策-行动"环节仍待开发[11] AI经济的核心特征 - AI经济始于2017年 但2025年成为关键转折点 AI智商超过人类平均水平100分 例如OpenAI o3达"天才级" 字节豆包模型达清华北大录取线[15] - AI具备泛化工作能力 可完整参与"收集信息-决策-行动"链条 在决策环节比移动互联网时代更精准 在行动环节可完成数字世界工作(如编程、设计)和物理世界工作(如家务、物流)[13][14] - 经济系统可实现全天候自动运行 假设AI与人类能力相同 单日工作量提升3倍 单周提升4.2倍 单年提升4.32倍[21] - 计算能力成为新劳动力供给 可无限复制且边际成本低 突破生物性劳动(人类/牲畜)和机械性劳动(机器)的供给限制[25][26][27] 经济系统变革影响 - 非稀缺经济可能诞生 数字世界服务业产出提升N倍 物理世界通过具身机器人提升工业和农业产出 最终总产出或超过总需求[30] - 交易成本显著降低 AI构建"数字层"精准匹配供需 降低企业内部组织成本和市场交易成本(信息搜集/谈判/执行成本)[34][35] - 非理性决策减少 AI基于成本收益分析决策 规避行为经济学中的心理账户、情绪波动等问题 提升经济系统效率[38][39] - 历史经验可被AI调用 人类可同时从当世和历史中寻求"时空最优解" 突破传统经验局限[40][41] 未来社会展望 - AI可能引发第三次理性化浪潮 继希腊文明和启蒙运动后 "数字层"全面辅助人类理性化进程[43] - 非稀缺经济下个人可聚焦全面发展与自我实现 AI充当普惠导师帮助个体成为"最好自己"[42][44] - 需解决两大挑战:确保AI系统受人类控制 避免安全风险 保障AI创造的生产力由全人类共享而非少数人垄断[44]
OpenAI入局,立讯3日涨22%,算法巨头为何入局AI硬件?
深思SenseAI· 2025-09-24 08:03
文章核心观点 - 算法巨头OpenAI布局硬件是出于打造从云端到设备完整AI体系的战略考量 旨在掌握从模型、数据、算力到终端的每一个环节 [3] - 传闻中OpenAI与立讯精密的合作引发资本市场强烈反应 立讯精密总市值突破4000亿元 单日飙升近400亿元 [1] - AI硬件竞争已进入深水区 将重新定义产业格局 但创业公司仍可通过聚焦垂直场景和轻资产模式找到机会 [17][18] 入口之战:从软件到物理世界的战略考量 - **抢夺数据入口**:高质量公开训练数据预计在2026至2032年间面临枯竭 AI下一轮进化需要来自物理世界的实时多模态个人数据 微软、谷歌、Meta、苹果等巨头均已展开对个人行为数据的争夺 [4] - **重新定义硬件设计**:硬件设计核心逻辑从“以服务人为中心”转向“为大模型服务” 硬件首要任务是为AI提供理解世界的“感官” 产品形态可能趋向无屏化、轻量化和始终在线 [8][9] - **抢占交互新入口**:大模型的突破使“对话”有望成为主流计算界面 OpenAI凭借强大的对话AI能力 有机会定义不依赖屏幕、以自然语言为核心的新交互范式 创造独立于手机和PC的“第三核心设备” [10][11] 布局之战:AI需要“定制化”的载体 - **能力构建**:OpenAI通过收购与合作构建硬件能力 2025年斥资65亿美元收购Jony Ive创立的IO Products公司 吸收55人顶尖硬件工程团队 并从苹果等公司吸引消费硬件专家 [12] - **产品定位**:与立讯精密等供应商接洽 目标锁定一款“口袋大小的便携设备” 形态类似iPod Shuffle 产品核心特征为无屏化、始终在线、环境感知 主打语音交互与环境感知能力 [14] - **长期愿景**:OpenAI早在5年前就发表机器手相关论文 探索物理世界交互能力 表明其硬件野心是为长期的AGI愿景进行前瞻性布局 [16] 破局之战:巨头的重资产与创业者的轻突围 - **巨头路径**:平台级巨头需大量资金投入、深度整合全球供应链以及从芯片到OS的全栈自研能力 竞争将重新定义整个产业格局 [17] - **创业机会**:精悍小团队可借助成熟供应链 以更轻资金投入快速推出定义精准的AI硬件产品 生存法则在于切入巨头忽视但重度用户愿意付费的垂直场景 [17][18] - **核心壁垒**:创业成功的关键在于硬件能采集手机无法获得的独家“第一视角”数据 并以此优化垂直AI模型 形成“硬件-数据-模型”的闭环 [18]
优质活动报名 | 九坤创投「AI创业引力场」第二期
深思SenseAI· 2025-09-23 23:51
活动概览 - 九坤创投将于2025年10月25日在北京主办“AI创业引力场”活动,主题聚焦“AI前沿技术趋势与应用落地” [4] - 活动将邀请6位AI领域的创始人及技术领军者进行分享,并设置1对8的小组深度交流环节 [4] - 线下活动席位限制40个,同时首次开放线上参与通道 [1][4] 参与嘉宾及公司背景 - **九坤投资**:成立于2012年,资产管理规模约700亿人民币,使用科学方法进行投资决策并深度融合AI前沿成果 [6] - **AIBEE爱笔智能**:人工智能独角兽公司,为线下空间提供高精度数字化与智能化解决方案,创始人林元庆曾任百度研究院院长 [8] - **POKEE AI**:2024年成立的强化学习基础模型AI Agent公司,2025年完成1200万美元种子轮融资,已进入公开测试阶段 [10][11] - **极睿科技**:成立于2017年,致力于打造全链路电商内容生成引擎,2024年销售额超10亿GMV,2025年完成亿元级B系列多轮融资 [13] - **与爱为舞**:成立于2023年,通过AIGC技术打造AI教育新范式,核心产品为个性化AI导师 [15] - **KUSE AI**:由前Meta、英伟达和YC团队创立的AI初创公司,主打“视觉化上下文工程”,在0融资情况下已服务60多国20万专业用户 [17] 人才招聘信息 - 多家参与公司同步开启招聘,岗位涵盖算法工程师、产品经理、市场运营等多个方向 [21][22] - 招聘支持全职、应届、实习岗位一键联合投递,并为实习生开放最低1个月的灵活实习机会 [21] - 申请截止日期为2025年10月24日,被邀请参加活动的同学有机会与嘉宾CEO进行1对1沟通 [21][22]
致AI创业者的一封信:相信AI的力量,与年轻人共塑未来
深思SenseAI· 2025-09-18 17:39
公司背景与定位 - 公司是一家于2025年新成立的、专注于人工智能领域的早期风险投资基金,由两位合伙人创立 [1] - 公司定位为创业者的“编外员工”,致力于为创始人提供简单高效、直接的支持,避免大公司的形式主义和漫长审核 [5] - 公司名称“Creekstone”由AI生成,寓意着如小溪般源源不断的生命力和如磐石般坚实可靠的支持 [1] 投资理念与策略 - 公司坚信人工智能的颠覆性潜力、认知驱动的创新以及年轻人改变世界的能力 [2] - 投资策略专注于早期阶段,提供灵活的资金支持,包括50万美元的过桥融资或100万美元的Pre-seed轮融资 [14] - 公司采取长期主义,认为AI技术的成熟需要耐心,强调与“斜率陡峭”的人为伍,做有长期价值和复利的事 [17] - 公司致力于资源赋能,搭建了全球化的顾问网络,涵盖技术专家和行业领袖,参与被投企业从产品Demo到获得首批核心用户的每一个里程碑 [15] 行业趋势与宏观洞察 - 人工智能驱动的智力供给改革,可能彻底改变人类掌握能源和劳动力的能力,进而引发生产关系的底层变革 [9] - 未来将见证一个由无数智能体(agent)组成的、规模远超人类的高速高带宽网络,人类在其中将成为贡献上下文和结果评估的少数节点 [9] - 在此背景下,将催生面向智能体网络的基础设施、无国界的支付系统、多个价值百亿美金的垂直行业超级智能(ASI)以及软硬件结合的常开型智能体入口 [9] - 创业公司应选择垂直领域切入,追求在细分市场的垄断地位,这是值得打赢的第一场战役 [20] 目标创业者画像 - 年轻人被视为AI浪潮的领航者,YC研究显示75%的AI初创公司创始人拥有深厚技术背景,20%毕业于顶尖高校 [11] - 公司投资的项目中,大部分创始人为95后,越来越多的98后及00后创始人涌现 [11] - 年轻人的优势在于不受传统思维束缚,敢于挑战行业惯例,进行破坏式创新 [11] 未来机遇与方向 - 中国的基建优势、巨大用户规模以及互联网周期积累的人才密度和产品运营经验,为从消费者端演进、进行破坏性创新并进军全球市场提供了机会 [19] - 在模型技术不断发展的过程中,面向智能体的基础设施建设需要动态塑造,工程能力和社区影响力将驱动长期价值 [20] - 结合新硬件有无限可能,中国低成本且弹性高的产业集群能够满足创新产品的高速迭代,软硬件结合是工程师红利的二次释放 [20]