Workflow
VideoTutor
icon
搜索文档
我,22岁,用AI帮4万学生备考,拿到赵长鹏投资
36氪· 2025-11-04 19:07
公司融资历程 - 2025年9月,VideoTutor创始人赵凯与币安创始人赵长鹏首次线上会面,一个月后顺利完成首轮外部融资,由赵长鹏旗下的YZi Labs领投[1] - 近期,公司完成一轮超过1100万美元的新融资,由YZi Labs领投,BV百度风投、锦秋基金、Amino Capital、BridgeOne Capital及多位知名投资人联合参投,是近期北美学生创业中融资金额颇高的天使轮融资[5] - 融资完成后,创始人赵凯正式办理辍学手续,开始全职创业[2] 产品与服务 - VideoTutor是一个AI解题应用,学生可通过拍照或文字输入数学题(目前以SAT、AP等标准化考试题目为主),数十秒后生成一段带有流畅解题动画和清晰步骤拆解的视频[3] - 产品处于前期测试阶段,首次生成解题视频免费,此后每生成4条视频收费3.99美元[4] - 产品上线20天,注册用户已超3万人,视频播放量破千万,生成了超10万条视频[5][11] - 公司未来计划从SAT、AP数学拓展到更多学科,从解题环节延伸到学习路径规划、效果评估,目标是成为每个学生的专属AI导师[17] 技术与创新 - 产品内置几何解析器,能将三角形、平面几何、线形等图形转化成大模型能理解的机器语言,准确描述点、线、面之间的几何关系[8] - 团队从底层重写了一套动画引擎渲染协议,能将不同元素精确放置在不同位置,通过代码可控地渲染每一帧画面,解决动画元素错位问题[9] - 采用两层模型(Claude和Gemini)对比答案,答案一致才输出,以保证准确性,并已微调了数千个SAT和AP的样本视频[9][10] - 组建了由SAT和AP高分学生组成的团队,负责标注AI生成视频的错误部分,用真实反馈重新训练模型[9] 市场定位与商业模式 - 公司瞄准备考人群(如SAT、AP考试),用户有主动学懂、学会的强烈需求,与旨在快速完成作业的日常辅导App(如Chegg、Gauthmath)形成差异[16] - 商业模式上,希望用AI替代部分线下家教环节,线下家教价格每小时100-400美金,线上网课约100美金,而VideoTutor生成四条视频仅收费3.99美元,价格降低数十倍[16] - 未来计划C端和B端市场同时发力,已获得第一批B端合作意向订单,如与一家拥有6万名学生的印度教培机构签署合作协议,并与美国校园社交平台Fizz(覆盖超350所大学)达成合作[18] 团队与发展战略 - 团队规模不到10人,以天为单位迭代功能,强调保持小团队规模以减少沟通成本,保证产品快速迭代[13] - 公司发展早期遵循"势能为王"原则,注重保持产品迭代、用户留存、人才和资金吸纳的持续增长势头[13] - 公司曾拒绝高额收购要约,认为解题只是起点,未来能拓展到更多科目和学习环节,超越多邻国等头部教育应用[7]
赵长鹏投了一个华人大三学生,1100 万美元种子轮,做教育 Agent
Founder Park· 2025-10-30 14:30
融资与公司概况 - 公司完成1100万美元种子轮融资,由YZi Labs领投,百度风投、锦秋基金、Amino Capital、BridgeOne Capital等机构及多位知名投资人联合参投[2] - 该轮融资是硅谷学生创业项目中目前融资额最高的产品之一,从5月14日产品上线到完成融资用时不到5个月[3] - 公司获得超过10份投资意向书,最终选择了当前的投资方组合[3] 产品核心定位与市场机会 - 产品主打通过一句话生成个人专属教学/讲解视频,是面向K12教育领域的AI Agent产品[2] - 产品专注于美国高考SAT和AP考试培训市场,该市场每年有约260万考生,其中37%的学生有付费意愿,付费需求强劲[17][23] - 美国线下SAT培训课程收费昂贵,平均每小时150美元起步,大部分在230美元左右,为公司产品提供了巨大的价格替代空间[17] - 产品定位为主动学习场景,与市面上的被动学习产品形成差异化,解决了K12领域80%内容涉及函数、微积分等需要复杂图像渲染的知识痛点[14] 产品技术与创新 - 核心技术是自研的数学动画渲染引擎,能够实现图形渲染的精确度达到100%,解决了可视化学习的核心难题[11][19] - 技术方案结合大语言模型生成文本和动画指令,再通过自有动画引擎进行精准渲染,而非单纯依赖大模型API[36] - 产品支持实时交互,用户可在视频播放过程中随时提问,系统会在5秒内生成新的教学内容,目标实现零延迟渲染[39][47] - 公司已积累超过10万条视频数据,其中8000多条SAT样本用于训练微调模型,采用Claude、Gemini等多模型校对方案确保答案100%正确[45][46] 商业模式与增长策略 - 采用订阅制收费,月费69美元起步,并探索按学习结果付费模式,如保证SAT数学满分收费799美元[26][29] - 增长核心依赖C端用户口碑传播,通过学生考取高分后的成功故事在TikTok、Facebook等平台形成自发性分享,目前已拥有20名高中生校园大使[49][51] - 产品已收到1000家企业的API请求,包括美国知名教育机构,C端用户付费意愿非常强烈[20] - 市场扩展路径明确,在巩固美国市场后可平移到加拿大、英国的A-Level考试等付费需求大的市场[25] 团队与执行能力 - 团队为典型的“小天才团队”,创始人Kai Zhao有三次教育创业经历,CTO James Zhan来自谷歌Gemini团队,具备强大的工程化能力[10][12] - 团队共6人,采用集中居住办公模式,强调快速迭代和执行速度,第一版产品开发仅用时两个多月[30][60] - 公司正计划将团队扩充至9-10人,优先招聘有国内大厂如字节、美团工作经验的工程师,以利用中美两地的工程能力优势[63][67] 行业趋势与竞争壁垒 - 硅谷大学生创业成为新趋势,成功案例如Cursor、Mercor、Pika等均聚焦细分领域,采取高度差异化竞争策略[5][68] - AI时代技术迭代以天为单位,年轻创业者因更贴近00后用户、学习速度快、敢于试错而具备优势[71][73] - 公司核心壁垒在于数据飞轮效应、动画引擎的技术优势以及在北美家长圈中建立的品牌信任度[53][54] - 产品护城河还包括对用户学习行为数据的长期积累,能针对不同学生的薄弱知识点进行个性化教学[53]
教育 Agent 崛起:AI 正在重塑学习产品的逻辑
36氪· 2025-10-15 08:47
文章核心观点 - 生成式AI正在将教育软件从碎片化的问答工具重塑为能承担教学规划、反馈与组织功能的连贯学习系统,使“辅助工具”进化成“教学同伴” [1] - AI的角色从“内容生产者”转向“思维合作者”,其意义在于让教学系统本身更具自我调节能力,将学习过程变为数据化、可追溯的思维成长过程 [1][3][5] - 教育Agent的发展标志着教育信息化进入新阶段,即从“管理信息化”走向“教学智能化”,未来将是人类教师与AI Agent协同的新图景 [16][17] 学习Agent(面向学生的智能学习伙伴) - VideoTutor可将学生的自然语言问题实时生成一段60至90秒的短视频讲解,配有语音和动画,并支持随时打断和从任意节点续播,使学习行为可回放、可分析 [2] - VideoTutor让解题过程变得可操作、可复盘,将知识封装为可复用的学习资产,使学习成为数据化、可追溯的思维成长过程 [2][3] - Khanmigo通过启发式提问引导学生自己发现思考路径,其核心价值在于“认知陪伴”,记录学生的卡点和误解作为教师的教学决策依据 [3][5] 教学Agent(面向教师的智能助教) - Brisk Teaching直接嵌入教师熟悉的Google Docs与Slides环境,可一键生成教案、修改作文或检测原创性,让AI自然融入教学流程以保持教学连续性 [6] - Brisk Teaching于2025年3月完成1500万美元A轮融资,其无缝整合到教师现有工作流的能力是获得投资的关键因素 [8] - MagicSchool采用组件化设计,将教案生成、课堂活动设计等高频任务做成可插拔的AI组件,官网称已服务600万教师,部分教师自报告每周可节省7–10小时备课与批改时间 [8][12] 平台Agent(教育系统级的智能中枢) - Google在2025年开放Gemini for Workspace(教育版),将AI深度集成至Workspace教育生态,教师可基于NotebookLM与Gems构建课程专属AI助教,将静态课件变为可对话的学习伙伴 [14][15] - 微软通过Copilot for Education在Teams环境中重构课堂互动流程,平台级方案的价值在于将AI从“可选工具”转化为有统一管理框架的“默认环境” [14][15] - 平台竞争焦点从单一功能转向谁能更自然地将AI融入教育的组织肌理与日常节奏,这是一次教学环境的架构重组 [15]
腾讯研究院AI速递 20250527
腾讯研究院· 2025-05-26 23:53
海光信息与中科曙光并购 - 海光信息通过换股方式吸收合并中科曙光,两家企业总市值合计超4000亿元 [1] - 海光为国产CPU及GPU龙头,中科曙光为服务器及算力基础设施龙头,两家有频繁关联交易 [1] - 此次重组旨在抢抓信息技术产业发展机遇,实现产业链互补,形成多元算力业务整合 [1] Lilian Weng新公司Thinking Machines - OpenAI前安全副总裁Lilian Weng分享其新公司产品——用于AI训练的手动调参仪表盘 [1] - Thinking Machines由多位OpenAI核心员工组建,未发表论文但估值已达90亿美元 [1] - OpenAI计划在2026年前推出能让ChatGPT"无处不在"的硬件设备 [1] Google基于Gemma模型的变体 - Google发布三款基于Gemma的模型变体:MedGemma、SignGemma和DolphinGemma,分别面向医疗、手语和动物语言领域 [2] - MedGemma包含4B多模态模型和27B文本模型,能处理医学图像分类、报告生成和临床文本推理,可在单GPU上运行 [2] - SignGemma用于手语翻译,DolphinGemma是400M参数模型,用于预测和生成海豚语言信号 [2] AI教育工具VideoTutor - VideoTutor面向K12教育,输入问题或主题后可自动生成类似可汗学院风格的短视频课程 [3][4] - 该工具提供结构化脚本、动态视觉效果和专业旁白,支持100多种AI语音和40多种语言,生成时间仅需1-3分钟 [3][4] - 技术结合大语言模型、AI动画引擎和高级文本转语音技术,覆盖数学、科学、语言等学科,支持个性化定制 [4] 企业微信智能机器人升级 - 企业微信"智能机器人"基于企业内部资料结合DeepSeek与混元等大模型深度思考回答员工问题 [5] - 新功能支持添加在线文档、微盘文件夹等到知识集,知识维护更灵活,并可通过API接口与业务系统打通 [5] - 支持单聊和群聊对话,企业管理员可在一分钟内配置专属智能机器人,适用于企业百事通、AI导师等多种场景 [5] 人形机器人格斗比赛 - 杭州举行全球首个人形机器人格斗比赛,机器人们展示打拳、闪避、肉搏等动作,采用三回合赛制 [6] - 最终小黑(AI策算师)击败小绿获得冠军,机器人们展示了直拳、勾拳、扫腿等十种动作组合 [6] - 格斗涉及机体设计、动作控制等多方面挑战,背后采集了职业搏击选手的数据,但仍由人类操控 [6] iOS 19设计更新 - 苹果将在WWDC 2025发布iOS 19等系统的重大设计更新,代号"Solarium",是自iOS 7以来最大规模的视觉更新 [7] - 新设计语言借鉴visionOS元素,使用更多透明度效果、新图标和修订导航方式,实现跨设备和操作系统的视觉统一性 [7] - 更新将涵盖iOS、macOS、watchOS和tvOS等系统,可能特征包括Frosted Glass元素、更圆润的"squircle"图标和浮动UI元素 [7] Anthropic对AI自动化的预测 - Anthropic核心技术成员Douglas预测,到2027-2028年,AI模型将有能力自动化几乎所有白领工作 [9] - Claude 4在软件工程领域表现突出,能处理极其模糊的需求,自主完成任务,AI工具已将资深工程师效率提升1.5-5倍 [9] - 未来趋势指向AI Agent普及,到2025年底,通用型AI Agent能处理各种浏览器内事务将变得明显 [9] 红杉中国推出Agent基准测试xbench - 红杉中国推出双轨评估体系"xbench",追踪AI模型的理论能力上限与Agent在真实场景的落地价值 [10] - xbench分为AGI Tracking与Profession Aligned两条路径,前者测试模型关键能力边界,后者关注垂直领域实际价值 [10] - 评估设计能跟踪Agent能力的技术-市场契合点(TMF),预测AI接管现有业务流程的时间点,分析成本效益与专业能力提升速度 [10]