联结主义
搜索文档
企业家精神是一团淋漓“元气”
36氪· 2026-01-06 14:11
经济增长的驱动因素 - 改革开放后中国经济长期保持接近8%的年均增长率,其中4%—5%可由高投资解释,剩余3%—4%归结于“全要素生产率”的黑箱 [1] - 高投资本身很可能也是全要素生产率黑箱带来的结果 [1] - 经济增长的真正引擎是企业家基于直觉、判断与想象力的“非科学”决策,而非资本、算法或政府规划 [1] 企业家精神的内涵与特征 - 企业家决策依赖个人化、难以言传的“软知识”和直觉,而非基于大数据和统计模型的“科学”计算 [3] - 企业家精神是人类应对不确定性的真本事,能在混沌中发现机会和创造价值 [3] - 企业家不是“做题家”,而是“出题人”,他们通过改写技术、市场、制度等约束条件,把不可能变为可能 [4] - 企业家不只图利润,更看重钱以外的价值,其内在驱动力是心中的“梦”或一团淋漓的“元气” [5] - 激发企业家精神能带来“万类霜天竞自由”的勃勃生机,抑制它则是巨大的浪费,可能导致经济陷入漫长低迷 [5] 对新古典经济学的批判 - 新古典增长理论模型过于“稳态”和确定,缺乏演化视角,常将技术进步作为外生变量,无法理解创新内在的“不确定性” [6] - 在该理论框架中,企业家没有位置,因为如果未来确定,价格机制就能自动配置资源 [6] - 张维迎将新古典经济学比作“地心说”,并指出罗默的“内生增长理论”也仅将创新视为研发投入的必然结果,而非真正的“探索未知” [7] - 政府产业补贴刺激创新的假设是专家能准确预判技术方向,但历史表明专家预测常错,例如20世纪初多数顶尖科学家押注飞艇而非飞机 [7] 创新与产业发展的不确定性 - 人工智能发展史中,长期被视为“村里希望”的符号主义路线,最终被边缘的联结主义路线凭借深度学习和大语言模型实现“弯道超车” [8] - 2009年深度学习先驱建议研究员购买英伟达GPU加速研究,但英伟达当时并未认识到其潜力,婉拒了赠送显卡的请求 [8] - 在开放环境中,技术路线竞争的社会试错成本相对有限,而政府“选冠军”可能增加资源错配风险 [9] - 冷战时期,苏联集中力量攻坚“电子管小型化”,点错科技树,最终在半导体产业竞争中落败 [9] 经济增长的理论框架:斯密-熊彼特理论 - 亚当·斯密指出分工与专业化推动技术进步,是经济增长的奥秘,并以制针为例说明分工使人均日产量从不到1根提高到几千枚 [10] - 分工深度受市场规模限制,形成“市场扩大—分工深化—技术进步—经济增长”的“斯密型增长”链条 [10] - 熊彼特的企业家理论补充了斯密理论,指出市场是企业家用新产品、新创意闯出来和造出来的,需求常在企业家的发现与创造之后才出现 [11] - 历次产业革命的主线是企业家开疆拓土,例如约翰·威尔金森执着于“铁能浮水”的狂想,开创了铁船与现代造船业 [11] 对各国经济现实的启示 - 自20世纪90年代中,美国在人均GDP上把欧洲、日本等发达经济体越甩越远 [12] - 美国从IT革命到AI浪潮,“元气”未散,新企业家和新巨头不断涌现,而欧洲和日本则被政府监管或僵化组织耗散了活力 [12] - 全球新兴产业中,目前只有中国能在人均收入仅为美国1/6左右时与美国掰手腕 [14] - 中国以“杭州六小龙”为代表的科创力量展现了“浙商”精神的薪火相传,但需警惕新增“独角兽”企业减少和年轻人热衷“考公”的现象 [14] 企业家精神与解决“内卷” - 破解“内卷”需依靠企业家精神创造新需求和新市场 [14] - 18世纪末英国钢铁过剩的解决,不靠政府干预,而是靠威尔金森等企业家的“疯劲”,他们用铁造桥、造船、盖房子、做家具,创造了新市场从而消化了过剩产能 [14]
TML 成立7个月首发声:揪出大模型随机元凶,开源方案终结 LLM 推理乱象
36氪· 2025-09-11 17:59
公司概况与融资 - 由OpenAI前CTO Mira Murati于2025年2月创立的Thinking Machines Lab (TML),成立仅七个月,尚未发布任何产品 [3] - 公司已完成20亿美元种子轮融资,估值高达120亿美元,领投方为硅谷风投a16z,英伟达、AMD、思科等科技企业参与投资 [3] - 团队共30人,其中三分之二来自OpenAI,核心成员包括OpenAI联合创始人兼ChatGPT核心技术开发者John Schulman、前研究副总裁Barret Zoph,以及拒绝扎克伯格15亿美元回聘邀请的AI安全专家Andrew Tulloch [4] 公司使命与研究重点 - 公司使命并非追求更强的模型,而是致力于填补AI能力与人类需求之间的差距,解决AI输出结果的不可控性和随机性问题 [5] - 研究重点与主流AI企业不同,不追求扩大模型规模,而是专注于提升AI表现的稳定性和可理解性,旨在让AI决策过程不再像“黑匣子” [13][15] - 公司研究博客命名为“Connectionism”(联结主义),意在通过基础研究深入理解AI的运作机制 [15] 技术痛点与核心发现 - AI行业长期存在随机性技术痛点,例如用AI检查同一份合同或咨询同一问题,可能得到不同的风险提示或答案 [1] - TML研究明确,AI随机性的核心成因并非“随机种子”设置差异,而是“批次处理”的技术细节以及并行计算策略的变化 [6][7] - 具体而言,批量大小、序列长度、KV缓存状态的不同会影响GPU内核选择策略,改变计算执行顺序,加之浮点数计算的细微差异在神经网络中累积放大,最终导致输出不一致 [7] 技术解决方案与验证 - TML提出了“批次不变内核”的创新解决方案,确保无论处理的数据量大小和分组方式如何,AI系统中的关键计算部分都能按照相同步骤得到一致结果 [10] - 方案特别针对RMSNorm、矩阵乘法、注意力机制三个核心模块进行了专门优化,以稳定计算流程 [10] - 使用拥有2350亿参数的Qwen3-235B-A22B-Instruct-2507模型进行测试,传统AI系统对同一问题测试1000次可产生80种不同结果,而采用新方案后,相同输入每次都能输出完全一致的答案,这在大语言模型发展史上尚属首次 [10] - 方案初期使计算速度下降近一半,但经优化后,性能损耗已处于可接受范围 [12] 行业应用与价值 - 该技术突破对医疗、金融等关键行业具有显著实际价值 [12] - 在医疗诊断中,可避免AI对同一患者CT影像产生前后矛盾的分析,干扰临床决策 [12] - 在金融风控领域,可防止AI对相同贷款申请的评估结果出现波动,从而避免风险误判和触及合规红线 [12] - 该技术如同为高风险行业的AI上了一把“安全锁”,使其更可靠、更值得信赖 [12] - 尽管TML尚未公布具体商业化计划,但金融和医疗行业已表现出浓厚兴趣 [15]
开学了:入门AI,可以从这第一课开始
机器之心· 2025-09-01 16:46
AI核心概念与学习方法 - 人工智能通过机器学习从数据中自行学习规律而非依赖预设规则 核心方法包括有监督学习(使用标记数据训练模型) 无监督学习(从未标记数据中发现模式)和强化学习(通过试错和奖励机制优化行为策略) [9][12] - 2012年Google通过无监督学习使神经网络在观看海量YouTube视频后自发识别"猫"的概念 成为深度学习里程碑事件 [11] - AlphaGo击败人类棋手和ChatGPT的崛起标志着AI技术进入爆发期 深度学习依赖算力(GPU) 数据(互联网)和算法三要素共同推动 [6][69] AI技术基础能力 - 数学是AI底层逻辑的核心 线性代数处理向量与矩阵 概率统计管理不确定性 微积分通过梯度下降优化模型参数 [13] - Python是AI开发首选语言 拥有简洁语法和强大生态圈 关键工具库包括NumPy/Pandas(数据处理) Scikit-learn(机器学习) TensorFlow/PyTorch(深度学习) [19][21] - 其他编程语言各有侧重 R语言擅长统计分析 C++适用于高性能计算 Java用于企业级系统开发 [23] 实践与学习路径 - 学习过程需结合理论深度(数学) 工具掌握(编程)和实践高度(项目) 建议通过Kaggle竞赛 GitHub开源项目和复现论文等方式积累经验 [28][47][53] - 建议建立持续学习机制 关注顶级学术会议(NeurIPS/CVPR/ICML) 筛选高质量信息源 避免被技术营销内容干扰 [24][25] - 初学者可从微项目入门 如用Pandas分析天气数据 用Scikit-learn预测泰坦尼克号幸存者 逐步构建可交互的Demo展示能力 [50][51][53] AI应用领域与职业方向 - 核心职业路径包括机器学习工程师(算法落地) 数据科学家(数据洞察) 算法研究员(前沿探索) 具体职位衍生出算法工程师 AIGC工程师等细分方向 [38][40] - AI与垂直领域结合创造新价值 包括艺术设计(生成式AI创作) 金融商业(量化交易/风控) 医疗健康(新药研发/影像分析) 材料科学(分子模拟)等领域 [42][43] - AI技能将成为通识能力 未来差距体现在顶尖人才(创造AI)与普通劳动者(使用AI)之间 需注重培养解决问题能力和人机协同思维 [37][45][55] AI发展历程 - 1956年达特茅斯会议正式提出人工智能概念 早期发展形成符号主义(逻辑推理) 联结主义(模式识别) 行为主义(环境交互)三大流派 [58][64] - 经历两次AI寒冬后 统计机器学习崛起 2012年AlexNet在ImageNet竞赛中以压倒性优势夺冠 标志着深度学习时代的开启 [66][67] - 现代AI正融合三大流派优势 追求兼具学习能力 逻辑推理和行动能力的综合智能体系 [65]