Workflow
后摩漫界M50芯片
icon
搜索文档
三天超150亿!WAIC 2025上海收官;M50芯片 10W功耗干翻英伟达;OpenAI深夜引爆学习革命 | 混沌AI一周焦点
混沌学园· 2025-08-01 20:06
中国AI开源浪潮 - 中国AI巨头智谱、Qwen、腾讯混元等在Hugging Face榜单包揽前10名,全部为开源模型 [2] - 近一个月密集发布超10款创新模型,包括GLM-4.5登顶、Qwen占5席 [2] - 开源浪潮推动全球AI生态向中国倾斜,对比海外闭源涨价趋势,重塑产业竞争规则 [2] OpenAI教育功能革新 - OpenAI推出ChatGPT学习模式,通过交互式提示和个性化支持引导学生主动探索知识 [3] - 该功能免费开放所有用户,或将重塑教育科技竞争格局 [3] - 采用提示词工程构建,强调元认知培养,挑战传统教育辅助工具 [5] Anthropic估值暴涨 - Anthropic获得50亿美元融资,公司估值飙升至1700亿美元,较四个月前增长近三倍 [6] - 预计其2027年营收将达350亿美元并超越OpenAI [6] - 此举将颠覆AI竞争格局,推动主权基金加速入场 [6] WAIC 2025盛会成果 - WAIC 2025吸引800余家企业参展,展区面积达7万平方米,参观人次突破35万 [7] - 现场签约31个项目,投资总额超150亿元 [7] - 展示人工智能从"参数竞赛"向生产力落地的转变,具身智能与智能体应用成为焦点 [7] Surge AI数据标注领先 - Surge AI以120人团队实现10亿年营收,未融资状态下反超ScaleAI [8] - 成为OpenAI、谷歌、Anthropic核心数据供应商 [8] - 创始人提出"高质量人类数据>合成数据"的颠覆性观点 [8] 微软浏览器AI升级 - 微软推出Edge浏览器"Copilot模式",实现跨标签页情境感知、语音控制及自动分组功能 [9] - 该AI智能体可同时分析9个网页内容,支持复杂操作 [9] - 限时免费开放预示浏览器付费时代来临 [9] 智谱模型开源突破 - 智谱开源旗舰模型GLM-4.5,专为Agent应用打造 [10] - 以MoE架构达到开源模型SOTA性能(全球第三/国产第一) [10] - API成本低至输入0.8元/百万tokens,输出速度最高可达100 tokens/秒 [10] AI芯片能效创新 - 后摩智能发布第二代存算一体芯片M50,以10W超低功耗实现160TOPS@INT8算力 [11] - 自研天璇架构最高可提供160%加速效果 [11] - 推出全场景硬件矩阵,颠覆边缘计算领域 [11] AI设计工具革新 - Lovart推出全球首款AI设计Agent"ChatCanvas",实现设计全流程自动化 [12] - 支持实时圈选修改、多图融合生成及视频动态化创作 [12] - 软件体验从以界面为中心的UX转向以Agent为核心的AX [12] 营销AI Agent突破 - 钛动科技发布全球首个营销AI Agent产品Navos [13] - 通过多智能体协同大幅降低企业出海营销成本 [13] - 成熟客户ROI提升3倍以上,中小客户ROI飙升50倍,营销周期效率跃升10-50倍 [13][17] 像素绽放融资扩张 - 像素绽放完成B3轮战略融资,加速全球化布局 [15] - 核心产品AiPPT.cn和AiPPT.com合并月访问量达2347万次 [15] - 锁定全球办公市场——存量5000亿、5年7000亿规模 [15]
死磕存算一体,后摩智能发布重磅新品
半导体芯闻· 2025-07-29 18:29
冯诺依曼架构瓶颈与存算一体技术 - 冯诺依曼架构芯片面临高算力、高带宽和低功耗难以同时实现的矛盾[1] - 存算一体技术通过集成计算和存储单元,从根本上解决数据传输慢、功耗高的问题[1] - 存算一体技术特别适合AI和大模型应用,因其需要算力密集和带宽密集的特点[6] 存算一体技术商业化挑战 - 学术界研究停留在理论层面,量产和软件适配是主要商业化障碍[5][6] - 后摩智能选择存算一体路线基于两个原因:解决功耗/存储墙问题,以及避开与英伟达直接竞争[6] - 公司深耕该技术四年多,2023年起重点研究与大模型的结合[6][7] 后摩漫界M50芯片技术特点 - 采用第二代SRAM-CIM双端口存算架构,支持权重加载与矩阵计算并行[8] - 集成第二代IPU架构"天璇",最高可提供160%加速效果[8] - 物理算力达160TOPS@INT8、100TFLOPS@bFP16,典型功耗仅10W[10] - 支持最大48GB内存和153.6GB/s带宽,能效比传统架构提升5-10倍[10] - 配备新一代编译器"后摩大道",支持自动算子优化和原生浮点运算[11][12] 产品矩阵与应用场景 - 力擎LQ50 M.2卡支持7B/8B模型推理超25tokens/s[14] - 力擎LQ50 Duo M.2卡集成双M50芯片,算力达320TOPS[14] - 力谋加速卡最高集成4颗M50芯片,算力达640TOPS[14] - BX50计算盒子支持32路视频分析与本地大模型运行[14] - 应用场景包括消费终端、智能办公、智能工业等离线本地处理需求[16] 公司战略与技术路线图 - 目标成为端边大模型AI芯片领跑者[18] - 已启动下一代DRAM-PIM技术研发,目标突破1TB/s片内带宽[18] - 新技术预计能使能效较现有水平再提升三倍[18] - 愿景是让大模型走出云端,进入终端设备赋能各行各业[18]