Workflow
Large Model
icon
搜索文档
海天瑞声CEO李科:数据产业正从劳动密集型向技术和知识密集型转变
新浪科技· 2025-09-13 16:30
核心观点 - 数据与AI双引擎融合驱动是智能时代演进方向 数据驱动AI发展 AI推动数据进化[1] - 大模型发展面临数据墙困境 无标签语料贡献减弱 大规模数据训练性价比显著降低[1] - 数据产业正经历从劳动密集型向技术密集型和知识密集型重大转型[2] 数据质量提升方法 - 通过语法复杂度指标和累积分布采样筛选高质量语料 从100亿token财经语料中筛选20%高质量数据训练 领域问答任务准确率提升1.7%[1] - 数据质量分析需从体验质量入手 考虑人类体验和机器体验[2] - 高质量数据集应满足VALID²要求 包括鲜活度 真实性 大样本 完整性 多样性 高知识密度[2] 行业实践案例 - 动捕数据 自动驾驶标注 思维链数据集等高质量数据服务千行百业[2] - 语料数据在方法论 基础设施和行业生态三方面进行体系化重构探索[2] 学术研究进展 - 大模型数据科学需从专家经验阶段发展到量化科学直至自进化阶段[1] - 需要从海量杂乱数据中提取决定模型能力的关键成分[1] - 精炼数据和合成数据都需要质量优先原则[2]
寒武纪智能芯片赋能多模态大模型应用
中金在线· 2025-08-22 10:41
行业发展趋势 - 大模型推动人工智能从弱人工智能阶段向强人工智能阶段演进 处理通用复杂任务 [1] - 2024年中国大模型开发平台市场规模达16.9亿元人民币 [1] - 2024年中国人工智能算力市场规模约190亿美元 2025年将达259亿美元 同比增长36.32% 2028年将达552亿美元 [1] - 智能芯片作为算力基础设施核心 迎来前所未有的发展机遇 [1] 公司技术实力 - 专注于人工智能芯片产品研发与技术创新 掌握智能芯片及基础系统软件研发和产品化核心技术 [2] - 研制多款领先智能处理器及芯片产品 包括终端场景1A/1H/1M系列 云端思元100/270/290/370芯片 边缘思元220芯片 [2] - 智能芯片可高效支持大模型训练及推理 视觉处理 语音处理 自然语言处理和推荐系统等多模态人工智能任务 [2] - 支持主流开源大模型训练推理 包括DeepSeek系列 LLaMA系列 GPT系列 BLOOM系列 GLM系列及多模态Stable Diffusion [2] 业务体系构成 - 智能计算集群系统业务整合自研板卡/智能整机与服务器设备 网络设备 存储设备 配备集群管理软件组成数据中心集群 [3] - 集群核心算力来源为自研云端智能芯片 聚焦人工智能技术在数据中心应用 [3] - 为人工智能应用部署技术能力较弱客户提供软硬件整体解决方案 实现科学配置管理集群软硬件 提升运行效率 [3] 产业生态建设 - 在智能芯片及相关领域开展体系化知识产权布局 [2] - 与产业链上下游环节构建稳固合作关系 共同推进人工智能产业发展 [2]
Meta六个月内第四次全面改革:拆分超级智能实验室,AI团队重组再加速
搜狐财经· 2025-08-17 06:21
Meta AI团队重组计划 - 科技巨头Meta正计划对其人工智能工作团队进行全面重组 这是公司在过去六个月内的第四次AI领域全面改革 旨在调整战略布局以应对行业竞争 [2] - 重组核心动作是将超级智能实验室拆分为四个功能明确的小组 包括TBD实验室 产品团队 基础设施团队和FAIR实验室 [2] 重组后团队职能分工 - TBD实验室聚焦高优先级 待明确落地场景的前沿AI技术探索 可能围绕生成式AI和大模型优化等短期突破目标展开 承担快速试错和验证技术可行性的角色 [2] - 产品团队负责推动AI技术在Meta核心产品矩阵中的落地应用 包括Facebook内容推荐算法 Instagram图像生成功能 WhatsApp智能交互服务等 并反向推动技术团队调整研发方向 [3] - 基础设施团队作为AI业务的技术底座 负责搭建和维护支撑大模型训练与AI应用运行的底层架构 包括算力集群 数据存储与安全体系 算法训练平台等 [3] - FAIR实验室专注于长期基础性AI研究 如通用人工智能(AGI)突破 AI伦理与安全机制构建等 重组后将保持独立研究属性 同时与其他小组建立更紧密协作 [3] 重组动因分析 - 重组旨在应对全球AI行业快速变化 竞争对手如OpenAI 谷歌 微软在生成式AI和大模型应用领域动作频繁 公司需提升研发效率与落地速度 [4] - 过去六个月内三次改革后 超级智能实验室内部存在职责交叉和沟通成本较高问题 拆分后各小组可聚焦核心任务 释放团队战斗力 [4]
自动驾驶之心技术交流群来啦!
自动驾驶之心· 2025-07-29 15:53
自动驾驶技术交流平台 - 公司是国内领先的自动驾驶技术交流平台 专注于自动驾驶产业 学术与职场成长等领域 [1] - 平台提供技术交流群 涵盖大模型 端到端 VLA BEV感知 多模态感知等前沿技术方向 [1] - 交流范围包括感知 规划控制 仿真测试 硬件配置等自动驾驶全产业链环节 [1] - 平台面向企业 高校研究人员开放 需提供公司/学校 昵称和研究方向信息加入 [1]
传统的感知被嫌弃,VLA逐渐成为新秀......
自动驾驶之心· 2025-07-25 16:17
端到端自动驾驶技术发展 - 端到端自动驾驶分为一段式端到端和二段式端到端两大技术方向 [1] - 二段式端到端以PLUTO为代表,专注于模型实现自车规划 [1] - 一段式端到端包括UniAD(基于感知)、OccWorld(基于世界模型)、DiffusionDrive(基于扩散模型)等不同流派 [1] - 基于VLM的方法推动自动驾驶VLA方向,开启大模型时代下的端到端研究 [1] - 传统BEV感知、车道线、Occupancy等研究方向在顶会中逐渐减少 [1] 学术界与工业界研究方向差异 - 工业界仍在优化传统感知、规划方案 [1] - 学术界转向大模型与VLA方向,为新兴研究领域 [1] - 新领域对初学者门槛较高,仅少数科研强者可独立产出 [1] - 论文研究方向建议优先考虑大模型、VLA领域 [1] VLA科研论文辅导课题 - 课程目标包括系统掌握VLA理论体系、提升动手能力、论文写作与投稿方法 [6] - 招生对象涵盖本硕博学生、留学申请者、自动驾驶从业者等 [7] - 课程收获包括经典与前沿论文分析、创新点挖掘、实验方法、写作投稿技巧 [8] - 硬件要求最低4张4090显卡,建议8张或租赁云服务器 [11] - 基础要求包括Python、PyTorch、Linux开发能力 [11] 课程结构与支持 - 12周在线科研+2周论文指导+10周维护期 [10] - 提供导师定制idea、baseline代码、数据集支持 [10][14][15] - 采用"2+1"多师制,含主导师与班主任全程跟踪 [13] - 学习阶段包括基础测试、个性化教学、学术回顾等 [13] - 产出包括论文初稿、结业证书、推荐信(优秀学员) [13] 学习资源与安排 - 提供开源代码库(UniAD、DiffusionDrive、OpenDriveVLA等) [14] - 必读论文涵盖VLA模型综述、Senna、SimLingo等前沿研究 [16] - 数据集采用nuScenes、Waymo、Argoverse等公开资源 [15] - 学习要求包括课前阅读、按时作业、全勤参与、学术诚信 [13]
在财务·客服·营销领域,大模型如何驱动业务提效?| AICon 直播
AI前线· 2025-05-08 13:57
直播主题 - 探讨大模型在财务、客服、营销三大场景中驱动业务提效的策略 [1][3] - 聚焦场景探索、技术落地和未来展望三大方向 [1][4] 直播嘉宾 - 主持人郑岩为华为云AI应用首席架构师 [3] - 嘉宾杨浩为蚂蚁集团高级技术专家 [3] - 嘉宾吴昊宇为明略科技高级技术总监 [3] 直播内容 - 实战场景剖析:精准评估落地价值并量化"价值锚点" [4] - 技术落地秘籍:包括模型选型、评测设计和RAG应用深度优化 [4] - 未来展望:探讨AI Native智能体特质及组织"超能力"布局 [4] 直播信息 - 直播时间为5月9日20:00-21:30 [2] - 可通过扫描海报二维码或预约InfoQ视频号观看直播 [6] - 观众可在文末留言提问,讲师将在直播中解答 [7]