Workflow
多模态交互
icon
搜索文档
魔法原子人形机器人“小麦”落地导购、主持人、理发师等多重场景
北京青年报· 2025-03-27 08:54
公司动态 - 魔法原子首次公开人形机器人"小麦"在商业场景落地的应用视频 展示交通引导 汽车导购 餐饮服务 美容美发等多场景交互能力 [1] - 人形机器人小麦具备42个自由度 能高度模仿人类动作与姿态 通过智能语音 面部表情 肢体动作实现多模态交互 [2] - 公司近期完成1 5亿元天使轮融资 2023年第一代人形机器人曝光 是国内最早探索人形机器人场景落地的公司之一 [2] 产品技术 - 小麦机器人搭载VLM视觉语言大模型 能识别分析用户特征 预测偏好并推荐车型/菜品 [1] - 配备多模态感知算法 超声波传感器 激光雷达 RGB-D相机等硬件 具备复杂环境感知能力 可避免碰撞 [2] - 在工业场景中已实现多台机器人协作 执行产品检测 物料搬运 零件取放 扫码入库等任务 [2] 应用场景 - 商场场景:作为交通疏导员实时感知停车场信息 指挥车流 引导顾客 [1] - 零售场景:汽车导购机器人基于视觉识别推荐车型 理发店场景智能调节吹风机模式 [1] - 餐饮场景:通过大语言模型交流 根据喜好推荐菜品 完成下单上菜 [1] - 家庭场景:正与中国电信合作开发居家养老 日常协助等解决方案 [2]
怎么看美国科技&英伟达GTC大会?
2025-03-19 23:31
纪要涉及的行业和公司 - **行业**:人工智能、数据中心、云计算、通信、芯片制造 - **公司**:英伟达、谷歌、微软、百度、阿里巴巴、腾讯、亚马逊 AWS、微软 Azure、Google GCP、Cisco Systems、T-Mobile US、美国通用动力(GMS)、OpenAI、Ynh Property、Personetics 纪要提到的核心观点和论据 1. **AI 发展前景与趋势** - 全球 AI 支出预计到 2028 年数据中心建设支出达 1 万亿美元,推理与训练结合推动算力需求增长,AI 应用将更广泛深入[2] - 未来几年 AI 产业计算需求持续增长,更多行业采用 AI 技术,跨学科融合增加,软硬件供应商推动行业进步[2][7] - AI 发展经历感知 AI、生成式 AI 和负责任 AI 阶段,新阶段需指数级增长计算资源[2][5] 2. **中美 AI 发展差异** - 美国在基础研究和技术创新领先,有谷歌、微软等巨头;中国凭借大数据和政府支持在应用层进展显著,如百度等企业投入研发[2][6] - 美国科技公司受开源影响但不采取开源措施,中国在算法和模型架构领先,但芯片制造受美国限制[23] 3. **英伟达相关情况** - 从硬件公司转型服务公司,通过 CUDA - X 库等软件服务增加收入,与多家企业合作推进 6G 网络标准[2][12] - 推出 H100 GPU 占据市场份额,CUDA - X 库支持软件利用 GPU 计算,扩展 AI 应用领域[9] - 与美国通用动力在智能化和无人驾驶领域合作,推出 Dynafond[15] - 技术优势无明显边际效应递减,生态系统是核心优势,短期内难以被替代[35] 4. **计算资源需求** - 大型语言模型对计算资源要求高,每个 token 处理需大量浮点运算,GPU 成主流选择[10] - 云计算服务提供商对高性能计算需求显著增加,预计到 2025 年达 3.6 ZettaFLOPS[11] - 未来算力需求因多模态交互发展而增加,处理视频计算量比文字高数百倍[29] 5. **AI 应用发展** - AI agent 应用预计到 2025 年底全面爆发,算力需求指数级上升,AI 会生成数据并自我训练[2][19] - AI 生成数据与代码趋势显现,未来 1 - 2 年将迅速扩展[21] 6. **芯片需求** - 未来 27、28 年间英伟达通用芯片需求更大,定制化芯片缺乏生态系统支持[27] - 数据中心和英伟达芯片需求长期呈指数级增长,短期内难以被取代[37] 其他重要但可能被忽略的内容 1. **AI 模型规模和性能提升**:早期 GPT 模型参数量从数百万到数十亿甚至上百亿,现在 GPT - 3 达数千亿级别,性能和应用范围显著提升[8] 2. **AI 在通信系统应用**:AI 优化 Massive MIMO 通信系统,提升无线通话速度和用户体验,自动化处理信号任务[13][14] 3. **个人电脑 AI 应用**:个人电脑运行大型 AI 模型不现实,计算时间长且效率低,适合云端或专业设备[18] 4. **算力需求选择**:公司规模大且算力需求高可买 GPU 卡,规模小可选云计算服务[22] 5. **美国 Starlink 计划资金用途**:特朗普政府投资 5000 亿美元推动美国 AI 发展,用于扩大模型规模、降低推理成本、科研创新和人才培养[31][32] 6. **量子计算影响**:量子计算对算力市场有潜在影响,但实现通用量子计算还需很长时间[36]
速递丨智谱完成新一轮超10亿元融资,京杭联手重仓押注下一个Deepseek!
Z Finance· 2025-03-03 09:41
杭州AI产业布局 - 杭州国资体系首次在大模型赛道进行战略性布局,智谱AI完成超10亿元战略投资,投资方包括杭州城投产业基金、上城资本等机构 [1] - 杭州数字经济核心产业占GDP比重突破28 8%,正从电商驱动向硬科技驱动转型,提出"全国算力成本洼地、模型生态最优城市和人工智能产业发展高地"三大战略目标 [7] - 杭州与智谱AI的战略合作将推动大模型技术与本地产业生态深度融合,加速人工智能在制造、医疗、金融、政务等领域的应用落地 [8] 开源模式与技术创新 - 开源模式重构全球AI创新格局,DeepSeek通过算法创新降低算力依赖,自研混合专家架构使模型推理成本降至行业平均水平的30% [2] - DeepSeek-R1模型以560万美元成本实现与百亿美元级模型相当性能,打破"算力=竞争力"传统范式,印证算法优化对硬件依赖的替代效应 [2] - 开源策略吸引全球50万开发者参与生态共建,形成技术反哺闭环,推动中国AI产业从应用层创新向底层技术攻坚跃迁 [2] 智谱AI的技术与商业化 - 智谱AI的ChatGLM系列模型将千亿参数压缩至消费级显卡可运行的6B版本,降低开发者门槛,GitHub获超5万星标,全球下载量突破3000万次 [3] - 智谱节后不到一个月收入超1亿,API平台付费增长超30%,商业化进程加速催生新产业生态 [6] - 智谱与三星、荣耀合作,通过预装AutoGLM实现端侧AI能力跃迁,推动AI Agent从单一功能助手向系统级智能体演进 [6] AI Agent技术发展 - 2025年是AI Agent技术发展关键转折点,Gartner将其列为十大战略技术趋势之首,模型架构创新使Agent具备目标导向型特征 [5] - 企业端聚焦效率革命,微软Dynamics 365部署10个自主Agent覆盖客服、财务流程;消费端向个性化服务延伸,如OpenAI Operator实现生活服务闭环 [5] - Gartner预测到2028年15%日常工作决策将由Agent完成,预示组织架构与职业分工将发生结构性调整 [5] 多模态与国产化适配 - 智谱CogVLM-9B在ImageNet分类、VQAv2等10余个国际评测中达到SOTA水平,"小而精"技术路线为边缘计算场景提供新可能 [3] - 智谱GLM-4系列通过昇腾平台实现国产化全栈适配,与全球2万开发者共建CogView3文生图、CogVideoX视频生成等开源工具链 [4] - 国产大模型在多模态融合、复杂任务执行和智能体技术方面不断深化,能同时理解文本、图像、语音等多种输入 [6]