Workflow
软件3.0时代
icon
搜索文档
你的下一个AI项目灵感,藏在首届魔搭开发者大会的七大论坛里
机器之心· 2025-07-01 13:01
AI时代背景与魔搭社区发展 - 当前处于AI下半场和软件3.0时代,创造者与AI协同进化重新定义可能性[1] - 魔搭社区(ModelScope)作为开放协作平台,汇聚顶尖智慧连接开发者与用户[1] - 社区成立两年多托管开源模型超7万个增长200倍,用户达1600万增长16倍[1] - 提供全链路服务覆盖LLM、多模态等领域,成为中国最大AI开源社区[2] 技术趋势与创新方向 - 开源生态:中国企业如阿里巴巴(通义千问)推动全球开源创新,Qwen系列成为开发者首选工具之一[8][10] - 多模态与世界模型:AI实现文本/图像/音频/视频跨模态交互,世界模型理解物理规律支撑机器人/自动驾驶发展[11][13] - 边缘AI:模型压缩技术推动端侧部署,清华团队开源Megrez-3B等小模型降低云端依赖[15][17][19] - 具身智能:人形机器人结合视觉语言模型执行仓库分拣等复杂任务,强调感知与行动协同[20][21][22] 行业应用与开发者生态 - 生成式AI深度应用于科学发现(新材料/药物设计)、工程设计(3D模型优化)、软件开发(代码重构)等领域[24] - 魔搭开发者大会覆盖65个主题,吸引通义千问、Gemma等国内外顶尖团队参与[5][6][7] - 推出开发者勋章激励计划,提供免费GPU算力及训练资源促进社区创新[25][26]
AI大神Karpathy演讲刷屏:软件3.0时代已来,提示词就是新代码
36氪· 2025-06-20 20:18
LLM技术演进 - LLM发展经历了三个阶段:软件1.0时代、以数据为核心的2.0时代、通过自然语言指令控制模型的3.0时代[3] - 语言正在演变为控制系统,每个个体都拥有语言接口的一部分[3] - LLM技术分支发展迅速,类似芯片制造业需要巨额资本支出[4] LLM生态系统定位 - LLM更接近操作系统而非公共事业商品,形成日益复杂的软件生态[6] - 闭源LLM提供商类比Windows/Mac OS,开源Llama生态类似Linux[6] - 技术架构上:模型本体相当于CPU,上下文窗口相当于内存,工作流如同操作系统调度资源[6][8] 人机交互优化方向 - 纯文本交互将进化,GUI可视化界面能加速AI工作成果的验证环节(如Cursor的代码高亮功能)[11][13] - 有效自动化需满足三要素:感知(获取信息)、行动(执行操作)、监督(人工介入机制)[15][17] - 当前软件界面设计阻碍AI自动化,需改造为LLM可访问的形式[16] AI代理发展路径 - AI代理发展应是十年周期而非短期爆发,从演示级到工业级需跨越可靠性鸿沟[21] - 现实场景复杂度远超预期,特斯拉经验显示需谨慎对待agent技术[19] LLM特性与局限 - LLM具有类人心理特征,既拥有百科全书式知识又存在幻觉、记忆缺陷等问题[27][29] - 训练数据导致其同时具备超能力与认知缺陷,类似《雨人》角色特征[27] 技术扩散模式创新 - LLM颠覆传统技术扩散路径:先消费级应用普及,后政企采用(如ChatGPT烹饪问答)[31] - 当前是行业进入良机,因技术扩散方向与历史模式完全相反[31] 教育领域应用 - 开放式指令易导致AI教学失控,需结构化课程设计(教师-AI协作制定大纲)[23][24] - 过度反应的代理会产生无效输出,需限制在人类可验证的产出框架内[24]