Workflow
Vibe Coding
icon
搜索文档
AI首胜人类博士,顶会论文秒变代码,港大90后开源刷爆8k星
36氪· 2025-11-03 13:14
在AI领域,学术论文往往承载了算法、模型架构等方面的最前沿突破。 但想要真正理解论文的核心知识,并成功复现其中的算法和实验结果,却经常面临巨大挑战。 问题的主要症结,在于「关键实现细节」上的缺失! 现实中论文作者通常将复杂的算法逻辑高度抽象化为几行数学公式,省略了真正影响成败的核心细节,比如: 近日,香港大学黄超教授团队开源的DeepCode,为这一难题的解决提供了超强的AI利器。 它不仅能够分析论文内容,理解算法逻辑,还可以自动生成可运行的代码。 在基准测试中,DeepCode在复现成功率和代码质量方面表现出众,在多项指标上超过了顶级大学的机器学习博士。 DeepCode自今年7月发布首个版本——DeepCode v1.0.0以来便备受关注,并登上 GitHub Trending榜首,斩获近8千星标(截至11月1日数据)。 开源链接: https://github.com/HKUDS/DeepCode 四大基准测试全面领先 研究人员将DeepCode放在以下四大基准测试中进行比较: 人类专家; 最先进的商业代码智能体; 科学代码智能体; 基于大模型的智能体。 结果显示,DeepCode均拿到了最高分。 在O ...
美团的这种技术面试形式,会成为新的趋势吗?
猿大侠· 2025-10-16 11:44
公司AI技术应用进展 - 公司CEO在会议上表示目前新代码中有52%左右由AI生成且有90%以上工程师团队成员广泛使用AI编码工具[7] - 公司于6月份发布名为NoCode的AI编程产品主打零基础用户通过对话生成网站和软件[8] - 公司在校招环节已引入AI面试官用于考察应聘者的专业能力和通用能力[6][10] AI面试实施细节 - AI面试共包含8道题目其中6道为技术基础知识考察题2道为通用能力考察题[12] - 面试过程提供每道题15-16秒思考时间全程监控作弊行为如替考切屏等[12][16] - 面试问题涵盖技术八股如TCP协议Java集合框架以及场景设计如音乐播放系统功能测试等[12][14][15] Vibe Coding面试创新 - 公司允许面试者在二面环节使用AI进行Vibe Coding即通过自然语言提示引导AI工具生成代码[26][29] - 该方法将面试重点从考察知识记忆转向评估与AI协作完成任务的能力强调理解与创造力[34][38] - 针对不同级别开发者设定差异化要求如初级需掌握基础AI工具使用高级需具备团队级AI流程制定能力[36][37] 行业面试范式转变 - AI面试可帮助技术面试官分担60%以上工作量显著提升招聘效率[18] - 未来面试趋势将进化为新八股模式一半考察技术原理一半考察AI工具实践应用[43][44] - 面试形式转向筛选能适应AI协作的开发者而非仅测试记忆与熟练度[35][45]
百度秒哒负责人朱广翔:AI开发革命的终局,是让创意本身成为唯一的“代码”
AI科技大本营· 2025-10-13 18:14
应用开发模式的演进与瓶颈 - 传统应用开发受困于“不可能三角”,即低成本、高质量、个性化三者难以兼得 [1] - 传统编码模式能保证高质量与个性化,但成本高昂,全球80亿人口中仅约3000万专业程序员 [8] - 模板化低代码平台降低了成本,但牺牲了个性化,用户创意被限制在有限模板库中 [8] - 聊天机器人模式成本低且具个性化,但交互体验简陋,难以达到高质量应用标准 [8] AI驱动的开发革命:Vibe Coding与AI UI - Vibe Coding理念的核心是开发者通过自然语言描述想法,AI将创意变为现实,流程从“规划->编码->审查”变为“自然语言描述->AI生成代码” [1][10] - AI时代的生产力公式为AI UI + Agent = AI App,AI UI是需求驱动的交互界面,Agent是执行复杂任务的智能体 [3][12] - AI原生应用需具备两大要素:由AI驱动生成、以用户需求为中心的交互界面,以及背后执行任务、连接工具的智能体 [3][12] - 秒哒通过多智能体协作模拟高效软件开发团队,包含产品经理、架构师、程序员等角色的AI智能体协同工作 [3][25] 市场机遇:释放长尾需求与全民创造 - 全球软件市场规模预计以11.8%的年复合增长率,从2023年的6592亿美元增长至2034年的22483亿美元 [5] - 传统软件开发聚焦于10%的高频刚需场景,而秒哒类工具将释放90%被忽视的长尾应用需求 [3][13][16] - 新产品重塑用户习惯,如AI写作已改变学生写作方式,从零到一创作变为在AI生成基础上修改 [7][30] - 用户群体从3000万专业程序员扩展到全球80亿人,对应应用需求从高频到长尾的转移 [13][16] 技术实现路径与产品哲学 - 秒哒通过多智能体协作破解“不可能三角”,专门智能体负责交互设计、任务执行、开发测试等环节 [25] - 产品不仅生成预期页面,还能补充页面背后应具备的信息和能力,如问卷生成工具会构思专业问题 [26] - 通过工具调用集成丰富服务,如调用百度地图添加导航信息,调用短信服务进行活动预约 [26] - 产品经理智能体的KPI衡量包括意图理解准确率、知识拓展丰富度、澄清沟通效率、PRD文档质量等指标 [27][28] 职业演变与未来展望 - AI不会取代程序员和产品经理,而是将其推向更高级形态,程序员更专注于复杂架构与逻辑设计 [4][20] - 产品经理可借助工具直接对接智能体实现原型,AI成为产品经理与程序员之间的沟通桥梁 [21][23] - 判断AI原生应用的标准是看其业务模式在大模型时代之前是否已存在,如AI写作属于原生应用,智能客服属于+AI应用 [29][30] - 创意和想法是基于行业经验产生的,是大模型短期内甚至长期都无法突破的领域,是人类的核心竞争力 [34]
Exclusive: Supabase raises $100 million at $5 billion valuation as vibe coding soars
Fortune· 2025-10-03 19:04
公司融资与估值 - 开源应用开发平台Supabase在Accel领投的D轮融资2亿美元后 约五个月再次完成由Accel和Peak XV领投的1亿美元E轮融资 公司估值从20亿美元升至50亿美元[3] - Supabase自2020年成立以来总融资额达到5亿美元 此轮融资还引入了Figma Ventures作为新机构投资者 并为开发者社区提供了共同投资的机会[3][4] - 基于AI的企业资源规划系统公司DualEntry获得9000万美元A轮融资 由Lightspeed Venture Partners和Khosla Ventures领投[7] 行业投资动态 - 多家AI与科技公司获得融资 包括DNA合成公司Ansa Biotechnologies筹集5440万美元B轮资金[8] AI可观测平台Dash0筹集3500万美元A轮资金[8] 移动游戏公司Cypher Games筹集3000万美元资金[9] - 网络安全、医疗健康及国防科技领域出现融资活动 网络安全合规平台Oneleet融资3300万美元[9] 慢性病追踪公司Folia Health融资1050万美元[10] 精确打击系统开发商Aventra获得300万美元种子资金[10] - 私募股权领域出现重大交易 Percheron Capital完成对轮胎服务连锁品牌Big Brand Tire & Service的16.3亿美元资本重组[12] Thoma Bravo收购基础设施投资公司SDC Capital Partners的少数股权[13] 市场趋势与用户增长 - vibe coding运动发展至第三阶段 焦点集中于为移动端用户提供无缝的应用开发路径 使其能从手机开始构建应用并扩展到笔记本电脑[1][2] - Supabase作为为AI和无代码平台提供后端基础设施的公司 其用户基数在一年内从100万开发者增长至超过400万 其中约30%的新注册用户为“AI构建者”[2] - 公司CEO对编程普及化持乐观态度 认为未来开发者编码量会减少 但构建事物的兴趣不会减弱 易用性的提升将吸引更多人参与构建 形成顺风效应[5]
Figma MCP + GPT-Codex:新的 Vibe Coding 之王
歸藏的AI工具箱· 2025-09-25 18:25
GPT-5 Codex性能表现 - 美学表现直接拉满,仅修改一次即可获得直接给设计稿链接的结果[1] - 即使没有设计稿,单纯使用提示词,其设计风格也与其他模型有显著区别[3] - 根据Qwen 3 MAX播客文章内容生成的网页效果非常出色[3] Figma远程MCP服务升级 - 最大更新是不再需要复杂的添加流程和本地Figma客户端[5] - 传输信息相当多,连设计稿素材图都变成图片链接返回[15] - 需要订阅用户才能使用,中国暗网"闲鱼"可解决订阅问题[8] 工具集成与配置方法 - GPT-5 Codex已有API,常见AI IDE如Cursor等已集成,选择后可直接使用[5] - Cursor配置需在设置的MCP标签页添加特定JSON代码[5][6] - Claude Code配置需在终端输入命令添加MCP,并使用/MCP命令选择登录选项[9][10] 网页生成优化策略 - 生成HTML时最好加上Tailwind CDN和Apache ECharts 5 CDN以节省Token[13] - 复杂页面可让AI分部分完成,先搭建关键组件和页面框架再填充内容[15] - 设计稿质量影响输出,若未使用自动布局或层级关系有误,生成效果会受影响[16] Vibe Coding基建发展前景 - 成熟设计系统设计稿和对应前端组件库配合MCP可极大降低Token消耗[21] - AI接入后效率提高,但对使用者的审美和基本功知识仍有需求[21] - 基建仍有非常大的增长空间[21]
Vibranium Labs Raises $4.6M To Fix Vibe Coding Failures With AI Agents After Engineers Admit These Apps 'Are Definitely Going To Break'
Yahoo Finance· 2025-09-24 00:01
A 2 a.m. phone alert disrupting an engineer's sleep has become a symbol of outdated IT incident response, Vibranium Labs co-founder and CEO Sang Lee said. The startup last Thursday announced $4.6 million in seed funding to scale Vibe AI, a 24/7 incident response platform built to handle those emergencies before humans log in. Vibranium Labs was founded by Lee, Tim Hwang, Charles Kim, and Tanny Kang, who all have backgrounds spanning Google, Amazon Web Services, Workday, Arnold & Porter, and FiscalNote (NY ...
对话吴穹:软件开发的终局,是我们将迎来自己的“黑灯工厂”
AI科技大本营· 2025-09-15 08:50
软件工程方法论本土化 - 西方敏捷方法论在中国出现水土不服 因国内企业文化偏管控型 强调令行禁止的确定性 而西方崇尚试错和自组织[6][12] - 需将敏捷核心思想与本土实践结合 基于第一性原理重新设计适合中国土壤的农具 而非照搬最佳实践[7][14][15] - 华为在落地IPD时做了管理变革和创新 体现本土化必要性[13] - 推出Adapt方法论框架和《敏稳兼顾:数字化研发管理实战》著作 总结规模化敏捷本土落地经验[15] AI对软件工程的冲击 - AI工具存在悖论:对员工是摸魚神器 对老板却是提效神器 两者本质矛盾[9][35] - 生产力变革触及生产关系根基 需解决员工为何使用AI为公司创造价值而非提前下班的管理问题[9][35] - 私域知识质量差是AI应用短板 大多数软件开发项目有独特金融软件或电商系统实现方式等私域知识[18] - 上下文缺失是AI发挥作用的重要阻碍 老系统缺乏历史信息或历史上下文[18][20] - AI在代码补全场景高效 因已有明确修改点和意图上下文 但让AI纯粹处理任务则需大量上下文[19][20] - 短期困难包括AI幻觉和上下文不足 导致团队效率提升数据在10%-20%体感误差范围内[20] Agent专业化趋势 - 不会有通用Agent 最终会分化成专用Agent 如金融Agent 测试Agent 重构Agent[24] - 工程生产线需差异化 如特斯拉造车产线不会用于生产飞机 否则不经济[24] - 开发语言进一步专业化 自然语言编程提升抽象层次 但最终会出现领域特定语言(DSL)[25][26] - 描述和Agent都会分化 形成更专业化生产线[27] 组织管理变革 - 未来组织是1+N模式 即1位人类小队长带领N个AI特工协同工作[35][38] - 需把Agent当成员工管理 建立注册 KPI考核 任务冲突调解等管理机制[24][35] - 考核体系变化 人的效能不再是个人产出 而是带领多少Agent产出多少[38][42] - 兵种主建 战区主战 类似国家军事改革 在职能线上叠加交付型组织[30] - 科技团队不能孤立谈管理 需与PMO 财务等职能部门深度卷入 为整个公司治理服务[47] 技术债与质量管控 - AI可能加速技术债累积 如果过分强调效率或代码行数等指标 会导致低质代码更快产出[53] - 使用得当AI反而减少技术债 如AI生成单元测试能力非常强 形成自闭环[54] - 布设单元测试像铃铛 代码被不该改的地方触碰就会报警[54] - 需传统度量体系感知质量 如交付效率 缺陷修复时间 代码重复度等[53] 工具与平台演进 - 知微工具平台将Adapt方法论理念变为数字化工具 如分层需求体系 多维组织架构[49] - 知微是可配置零代码平台 像高级定制西装 根据客户情况量体裁衣 而非定制开发或盒装软件[52] - 知微会逐渐中台化 大模型也是其用户 通过API调用 成为组织流程资产中心[60] - 未来IDE和CLI是主入口 界面越来越少 因AI改善工具使用 根据工作上下文自动操作[60] 程序员能力重塑 - 未来重要能力是对AI的了解和沟通协同能力 需学会与AI有效沟通[66] - 程序员需放下对AI戒备和抵制 进行心理角色转换 从种地变为地主[77] - 与人沟通和团队协作能力变得非常重要 需补强[78] - 对业务理解至关重要 程序员现在创业更容易[78] - 有技术底色的程序员更具优势 因懂技术细节可不关心 但产品经理压根不懂则难做精准判断[74] - 马斯克 扎克伯格 比尔·盖茨等有编程能力者最终成为顶尖产品缔造者[75] 行业长远展望 - 软件工程终极图景是黑灯软件工厂 AI自主编码 人类负责指挥和规划[9][81] - 软件不会用后即弃 因承担产生数据使命 有长生命周期 形成领域知识[80][83] - 软件行业类比制造业 产能飞跃后可能解决更高阶问题 产生新需求 如星际旅行 可控核聚变 智能医药[82][83] - AI颠覆原有冯·诺依曼架构 LLM是全新概率引擎 从确定性输出变为合理可能结果 拓展软件能力边界[61][62] - 软件边界和形态发生变化 从服务顾问变为直接服务用户 从确定性软件变为能给出不确定结果的软件[63] - 测试和质量过程都需改变 因软件给出不确定结果[64]
Replit hits $3B valuation on $150M annualized revenue
Yahoo Finance· 2025-09-11 00:54
Replit has raised a $250 million round, valuing the company at $3 billion. Unlike other fast-growing vibe coders, Replit has not been running to VCs every few months, though we’ll see if that changes. Its last raise was in 2023 when it raised about $100 million that valued the company at $1.16 billion post-money. Replit has now raised a total of about $478 million, PitchBook estimates. The company, founded in 2016 by programmers Amjad Masad (pictured), Faris Masad, and designer Haya Odeh, says it’s been ...
AI 研发提效进行到哪儿,谁来守住质量底线?
36氪· 2025-09-01 10:35
AI在研发中的角色演变 - AI应用经历了三个阶段演变:从辅助编程的IDE插件工具到引入Agent的"氛围编程1.0时代",再到CLI模式的"氛围编程2.0时代"[2] - 2022年底ChatGPT推出被视为AI的"iPhone时刻",此后AI迅速介入更多研发环节并影响架构设计与组织协作[1] - 当前AI已深度融入需求调研、PRD评审、技术设计、测试及CI/CD等全交付生命周期环节[4] 研发效率提升数据 - 开发岗位效率提升约30%,主要集中在代码编写和评审环节[13] - 测试岗位提效约25%,涵盖用例编写和自动化测试[13] - 运维岗位提升约25%,尤其在DevOps场景和复杂问题排查方面[13] - 头条和抖音前端团队通过AI工具将设计稿转代码时间从1-2天缩短至几分钟[5] 代码质量与规范 - AI生成代码往往比人工编写更规范,附带详细注释且接口函数遵循统一标准[9] - 超过80%的场景能通过AI自动提升单元测试覆盖率[9] - AI可辅助代码评审,进行变量命名检查、格式规范验证及生成PR总结解释[10] - 采用TDD(测试驱动开发)模式可增强AI生成代码的可控性[10] 企业级应用挑战 - AI生成代码难以直接入库生产系统,需经过严格扫描校验流程[3][6] - 算力和token消耗导致高成本,限制大规模应用落地[20] - 管理层认知偏差可能削弱企业竞争力,需科学量化提效效果[21] - 复杂业务场景中AI难以理解全局业务逻辑,需依赖领域知识库支持[16] 人机协作模式 - AI要求开发者具备更强理解把控能力,最终责任仍在工程师本人[4] - Cursor等工具通过设置checkpoint确保开发者对结果保持掌控[5] - 开发者仅30%时间用于编码,其余用于沟通协作,AI在需求设计等环节作用显著[6] - 辅助模式可带来20%-30%效率提升,优于准确率不足的Agent模式[19] 架构与组织变革 - 出现AOA(AI Oriented Architecture)新架构范式,研发组织向AI中心化转变[24] - 岗位左移(测试向开发靠拢,开发向产品靠拢)和职级上移成为趋势[22] - 前端交互向LUI(Language User Interface)转变,可能推动"无边界体验"发展[23] - 未来Web应用可能消亡,交互方式转向自然语言,企业重点提供后端服务能力[25] 未来发展方向 - AI需从"高级工程师"向"架构师"演进,具备系统理解能力和自我进化能力[26] - 需解决大模型对具体项目业务理解不足的问题,降低知识库构建成本[26] - 可穿戴设备发展可能解决AI缺乏真实世界感知能力的问题,实现研发闭环[27][28] - 全栈开发通过AI辅助变得更易实现,人机协同可快速补齐技术短板[31] 技术实现路径 - 领域知识库普遍采用向量数据库结合Embedding技术[32] - RAG、上下文增强和MCP是搭建开放生态的手段而非目的[18] - 企业需提供高质量内部语料库才能生成符合自有规范的UI代码[30] - Agentic RAG结合自我演进能力可实现更智能的检索召回[32]
硅谷 AI 大转弯与二级市场的牛市|42章经
42章经· 2025-08-31 20:35
AI行业发展趋势 - AI进入高速发展阶段 核心衡量指标从Scaling Law转变为Token消耗量 7月Token消耗量较6月增长20%以上[3] - 行业预期发生变化 从追求AGI转向优化现有智能的可用性和易用性[4] - AI已超越应用阶段 进入产业化和工业化新阶段[6] 模型发展特点 - GPT-5代表重要转折点 通过整合分散的模型能力和前端界面提升可用性而非追求更聪明[5] - 模型智能评估重要性降低 OpenAI和DeepMind模型已获得IMO金银牌[18] - 模型进入瓶颈期 智能提升主要来自各环节增量优化 仍有几十个百分点提升空间[22] 基础设施优化 - Infra优化分为四层:模型与GPU间优化 模型与应用间推理加速 Agentic Infra优化 context层Infra优化[25][26][27] - 推理加速技术壁垒不高 部分开源 毛利空间存在争议[25] - 英伟达需求来自训练和推理两部分 Token消耗增长推动推理需求持续上升[29] 公司战略演变 - 模型 应用和Infra公司边界变得模糊 出现端到端打通全链条的趋势[13][14] - OpenAI招募创业公司创始人 Google加快应用端发力 Manus开展技术工作 Cursor开始训练自有模型[13] - 公司分工新共识:模型公司提升Token价值 Infra公司优化使用效率 应用公司换取数据反馈[11] 投资市场表现 - 英伟达股价上涨核心驱动是Token消耗量持续增长[29] - ASIC厂商和AMD股价表现亮眼 反映市场对降低成本方案的追求[30][31] - 美国AI估值存在泡沫 但发展前景依然被看好[48] 应用场景发展 - RL范式推动Coding 数学等可验证效果场景发展[37] - 垂类公司找到PMF Harvey AI在法律领域实现高ARR 医疗金融保险领域出现成功团队[37] - 视频Token消耗增速远高于文字 但真正多模态原生应用尚未出现[88][89] 二级市场差异 - 美国市场受AI发展预期主导 AI对整体景气度影响占三分之二以上[45] - 中国市场受多重因素影响 包括居民存款 投资意愿 风险偏好和制造业周期[46] - 腾讯成为国内AI板块代表性标的 因AI努力程度和战略高度获得市场认可[56] 一级市场特点 - 美国模型公司估值达到上百亿美元 出现全明星团队加持现象[79] - 第一梯队与第二梯队公司估值差距创历史纪录[82] - 国内一级市场两极分化严重 头部公司可能获得十倍资金[84] 新兴公司关注 - Reddit因社区数据质量高被ChatGPT高频使用 类似美国版知乎+小红书+B站[76] - ServiceNow通过Workflow梳理和软件交付获得500强客户 增长速度加快[76] - Figma凭借协作场景优势和中生代公司地位 有望将AI融入协作场景[77]