大语言模型

搜索文档
张亚勤:未来电车品牌可能出现整合,2030年将有10%新车具备 L4 级自动驾驶能力
搜狐财经· 2025-06-26 18:04
自动驾驶技术进展 - 自动驾驶领域即将迎来"DeepSeek时刻",去年和今年具有里程碑意义,机器人出租车取得重大进展 [2] - 自动驾驶技术始于十年前,已吸引数百亿美元投资,机器人出租车在旧金山、洛杉矶、奥斯汀、东京等地进行商业化尝试 [2] - 百度Apollo Go系统在武汉试运营成功,超过一千辆车覆盖整个城市,文远知行等中国公司也在该领域发力 [2] - 预计到2025年底,自动驾驶技术将在武汉等复杂城市环境中展现成熟、安全且经过验证的运营能力 [2] 安全与经济效益 - 自动驾驶核心目标之一是提升安全性,目标是比人类驾驶安全十倍或减少90%事故,目前90%交通事故由人为错误导致 [3] - 另一核心目标是变革车辆经济性,人类驾驶员成本占自动出租车总成本约60%,去掉驾驶员后运行经济性有望提升至少两倍 [3] - 目前业务规模已扩展到约150亿美元投资 [3] 生成式AI与大模型的作用 - 生成式AI和大语言模型帮助自动驾驶解决海量数据处理与理解问题,可模拟罕见场景生成大量训练数据 [3] - 借助深度学习和大模型,可构建端到端决策模型,简化大部分规则,迭代速度大大加快,视觉模型和行动模型仍是挑战 [3] 未来预测与行业趋势 - 预计到2030年,新车出货量中10%将具备L4级自动驾驶能力,服务于自动驾驶出租车和消费者市场 [4] - 电动汽车生态系统逐步成熟,但仍需完善充电基础设施和竞争规则,未来电动汽车品牌可能出现整合 [4]
如何做到在手机上实时跑3D真人数字人?MNN-TaoAvatar开源了!
机器之心· 2025-06-25 08:46
技术概述 - TaoAvatar是阿里巴巴淘宝Meta技术团队研发的3D真人数字人技术,支持手机和XR设备上的实时渲染与AI对话[1] - 该技术基于3D高斯泼溅技术,能通过多视角视频输入快速生成高逼真度数字人形象,精准捕捉面部表情、手势动作及衣物细节[8] - 已在中国三维视觉大会上入选"最佳演示Demo候选",并宣布开源3D数字人应用MNN-TaoAvatar[2][9] 核心技术 - 采用3D高斯泼溅技术实现全身互动式数字人解决方案,显著降低建模成本并提高效率[8][9] - 集成语音识别(ASR)、大语言模型(LLM)、语音合成(TTS)和数字人渲染(NNR)等核心模块[11] - 支持端侧实时对话与渲染,ASR模型RTF优化至0.18,TTS模型RTF优化至0.58,A2BS模型RTF优化至0.34[16][17][18] - 自主研发NNR渲染器实现25万点云模型60FPS流畅渲染[18] 性能优势 - 在骁龙8 Elite芯片手机上实现端侧运行,ASR模型281.65M,LLM模型838.74M,TTS模型1.34GB[16] - MNN-LLM在骁龙8 Gen3芯片上预填充速度达165 tokens/s,解码速度41.16 tokens/s[16] - 相比云端方案,可在手机端完成所有算法处理,无需高端显卡支持[13][14] 架构优化 - 采用StyleUnet+MLP混合建模降低计算成本,动态高斯点云技术提升渲染稳定性[50] - 数据同步优化实现GPU内存直接读取,免去数据拷贝时间[40] - 调度优化引入"Dirty机制",仅处理变化数据,将部分模型运行频率降至20fps[41] - 模型量化技术将Qwen2.5-1.5B模型从5.58GB压缩至1.2GB[31] 应用部署 - 推荐配置为骁龙8 Gen3或同级CPU,8GB内存,5GB存储空间[51] - 单个数字人ID存储空间控制在100-200MB,25万高斯点云为最佳平衡点[46] - 支持Android和iOS平台,已开源在GitHub供开发者体验[2][52]
具身领域的目标导航到底是什么?从目标搜索到触达有哪些路线?
具身智能之心· 2025-06-24 22:09
目标驱动导航技术概述 - 具身导航是具身智能的核心领域,涉及语言理解、环境感知、路径规划三大技术支柱,目标驱动导航通过赋予机器人自主决策能力成为最具代表性的方向[2] - 目标驱动导航要求智能体在陌生三维环境中仅凭目标描述(坐标、图片、自然语言)自主完成环境探索与路径规划,实现从"听懂指令走对路"到"看懂世界自己找路"的跃迁[2] - 该技术已在终端配送、医疗、酒店及餐饮场景实现产业化落地,如美团无人配送车、Starship Technologies园区机器人、嘉楠科技服务机器人等[3] 技术发展历程 - 第一代端到端方法基于强化学习与模仿学习框架,在点导航与闭集图片导航任务中SPL指标逼近人类表现[5] - 第二代模块化方法通过显式构建语义地图,在零样本目标导航任务中展现显著优势,未见物体场景成功率提升明显[5] - 第三代LLM/VLM融合方法引入大语言模型知识推理能力,重点解决开放词汇目标导航中的未知类别识别难题[7][8] 产业应用现状 - 人形机器人领域加速渗透目标驱动导航技术,宇树科技Unitree系列、智元机器人、特斯拉Optimus均展示相关能力[3] - 医疗场景中美国Aethon公司TUG系列实现药品自主配送,云迹科技与擎朗智能的商用机器人提升服务响应效率[3] - 社交导航算法使配送机器人具备动态环境应对能力,美团无人车与Starship Technologies产品已在城市与园区部署[3] 技术生态与评测体系 - Habitat仿真生态完整记录领域技术迭代轨迹,评测体系从点导航扩展至图像导航、目标导航及移动抓取任务[4] - 视觉预训练模型提升特征泛化能力,分布式强化学习框架使PointNav任务SPL指标显著提升[4] - Meta AI提出的Sim2Real迁移框架为仿真训练到真实部署提供方法论参考[4] 技术挑战与突破 - 当前PointNav和闭集ObjectNav接近人类表现,但开放词汇物体导航和动态障碍物场景仍面临重大挑战[4] - CMU与Stanford等机构推动动态环境下的语义地图更新技术,领域研究正从仿真优化转向实际部署[4] - 大语言模型通过跨模态对齐解决部分开放词汇导航难题,3D特征编码方法持续优化[23]
一文读懂美国AI之战--“科技五巨头”与“AI三小龙”的战争
硬AI· 2025-06-24 20:28
美国AI军备竞赛格局 - 美国科技行业正经历前所未有的人工智能军备竞赛 传统科技巨头与新兴AI公司竞争格局重新洗牌 [2] - Meta展开疯狂人才争夺战 扎克伯格亲自联系数百名研究人员 单个人才薪酬高达1亿美元 [2] - 传统科技巨头与AI新贵博弈直接影响各自核心商业模式 谷歌搜索业务受威胁 苹果AI作为设备体验补充工具 [2] 苹果AI战略分析 - 苹果在AI领域表现令人失望 Apple Intelligence项目遭遇重大挫折 模型和产品未达前沿水平 [4] - 苹果核心业务未受AI直接威胁 消费者仍需在iPhone/Mac上使用第三方AI应用 [4] - 苹果应效仿微软策略 深化与OpenAI合作 专注于为AI时代构建最佳硬件 包括Apple Watch等AI驱动设备 [5] 谷歌AI优劣势 - 谷歌AI基础设施世界领先 实现从芯片到模型完全整合 Gemini模型在视频生成领域领先 [7] - 谷歌拥有数据优势 Veo视频生成工具可利用YouTube资源 大语言模型受益于网络索引领先地位 [7] - AI对谷歌核心搜索业务构成颠覆性威胁 公司正通过AI搜索概览改善体验 将AI转化为增强工具 [7] Meta战略定位 - Meta核心战略定位稳固 个性化内容和生成式广告可增强社交媒体业务 AI是VR/AR投资回报关键 [8] - Meta争夺稀缺注意力资源 大语言模型消耗大量注意力 对Meta威胁程度不亚于谷歌 [8] - Meta在AI方面缺乏明确方向 扎克伯格对生成式AI影响业务的思考不够成熟 [8] 微软竞争态势 - 微软与OpenAI关系紧张 OpenAI威胁提起反垄断投诉 但微软仍拥有Azure独家优势 [10] - 微软应加深与其他模型提供商关系 考虑投资xAI帮助其继续追求AI模型前沿发展 [10] 亚马逊后发优势 - AI对亚马逊所有业务均非颠覆性 AWS使用量增加 Amazon.com受益于AI产品推荐 [12] - AWS与Anthropic合作关系比微软-OpenAI更稳定 Anthropic缺乏强大消费者业务 [12] AI"三小龙"竞争策略 - OpenAI主导消费级AI市场 ChatGPT成功使其成为"意外消费科技公司" 与微软苹果存在根本冲突 [14] - Anthropic专注开发者群体 编程策略带来强大API收入流 与亚马逊合作关系更稳定 [14] - xAI处境最艰难 坚持自有基础设施成为负担 应积极寻求微软投资 [15]
夏季达沃斯论坛解读发展中国家发展之道
中国新闻网· 2025-06-24 20:08
发展中国家发展路径 - 工业化转型和技术创新是发展中国家谋求发展的关键,新兴经济体与发展中经济体GDP占全球份额达58 9% [1] - 工业化是发展中国家实现富裕的必经之路,但面临实践难题,越南等国难以完全效仿中国路径 [1] - 发展中国家需探索未经验证的方法,因全球化环境变化导致传统路径受阻 [1] 技术创新与工业化 - 工业化未来集中在创新技术领域,中国在该领域进行了大量投资 [2] - 中国大语言模型DeepSeek证明无需巨额资金即可研发,为中小型国家提供机会 [2] - 技术来源多元化是未来趋势,需通过国际交流学习运用外来技术 [2] 市场与技术合作 - 国家不应依赖单一进口市场,需与多地区建立联系以降低风险 [2] - 安哥拉案例显示,技术合作和人才培养对有效运用外来技术至关重要 [2]
赞同科技携金融科技成果亮相2025中国国际金融展
搜狐财经· 2025-06-24 17:20
展会概况 - 2025中国国际金融展在上海世博展览馆举办,主题为"开放创新,科技赋能,共创金融新未来",汇聚400余家国内外金融机构、科技企业及行业组织 [1] 赞同科技创新成果 - 公司与华为、中兴联合推出基于大语言模型驱动的多用途业务轻终端方案,支持平板与终端模式切换,覆盖网点全量业务范围,颠覆传统服务模式 [1] - 轻终端采用大语言模型技术,实现业务自主串接与辅助办理,提升处理效率和智能化水平,推出"赞同智言银行解决方案" [1] - 展示基于HarmonyOS 5.0的手机银行产品,融合鸿蒙原子服务等原生能力,支持用户通过自然语言指令完成业务办理 [3] 行业影响与评价 - 公司创新成果获业界高度评价,参观者对产品表现出浓厚兴趣,体验其便捷性与高效性 [4] - 公司计划持续推出自主知识产权的金融科技产品,推动行业技术发展,提升服务安全性、便捷性和智能化水平 [4]
突发!字节Seed大语言模型负责人被开除损失数千万
是说芯语· 2025-06-24 10:05
公司人事变动 - Seed大语言模型负责人乔木因违反公司"利益冲突禁止场景"规定被立即辞退并扣除全部年终奖金,其与团队HRBP发展亲密关系且未履行申报流程并提供虚假陈述 [1] - 乔木2014年加入字节跳动,职级推测为4-2或5-1,年薪保守估计1000万元以上,参照同团队负责人周畅"4年5000万"级别待遇 [1] 员工薪酬与期权价值 - 字节跳动2014年期权价格5美元/股,最新回购价达189美元/股,涨幅38倍 [2] - 若乔木2014年获得100万元期权且未提前回购,当前价值约3900万元 [2] - 乔木在字节跳动11年累计总收入保守估计超5亿元人民币,包含薪资与多轮期权收益 [2] AI业务发展 - Seed是豆包大模型团队内部代号,创始人张一鸣自2023年下半年起每月参与一次核心技术团队复盘会,显示高度重视 [2] - Seed1 5-VL多模态大模型已发布,在60个评测基准中38个取得SOTA表现,推理成本显著降低并通过火山引擎开放API [3]
人工智能对社会科学研究影响深远
科技日报· 2025-06-24 10:01
人工智能在社会科学研究中的应用 - 人工智能作为引领科技革命和产业变革的战略性技术,正深刻改变人类生产生活方式,并加速各领域科技创新突破 [1] - 大语言模型等生成式人工智能工具正以前所未有的速度改变社会生活,为社会科学研究提供新工具并丰富研究议题 [1] 人工智能重塑社会科学研究方法 - 大语言模型凭借自然语言与人类行为模拟能力,降低研究成本并拓展方法边界,成为可嵌入式研究辅助系统 [3] - 在文本分析方面,大语言模型在情感识别、立场判断等任务中准确率接近人工编码水平,优于传统关键词匹配方法 [3] - 在合成调查数据方面,大语言模型可模拟受访者生成低成本合成数据,填补传统调查缺失值并提升可控性 [4] - 在模拟人类互动方面,生成式人工智能提供低成本、高可控虚拟实验平台,例如斯坦福大学"虚拟小镇"项目展示集体行动自然生成机制 [5] 人工智能技术应用的挑战 - 大语言模型存在"黑箱"特征,缺乏透明度,对提示词敏感且输出不稳定,影响研究可复制性和可验证性 [6] - 模型持续迭代削弱结果再现性,需同步推进对输出一致性与可靠性的系统研究 [6] 人工智能拓展社会科学研究议题 - 人工智能治理成为公共政策核心议题,涉及制度设计、伦理边界、安全审查等研究 [8] - 人工智能作为通用技术,其部署对国际格局、社会结构、经济发展模式等产生深远影响,例如可能加剧技术弱国对强国的依赖 [9] - 大语言模型应用中暴露的社会偏见(如对低教育群体和发展中国家的系统性偏误)为社会科学提供反思人类潜在偏见的新窗口 [9] 人工智能技术偏误的实证研究 - 主流模型在预测低教育群体和发展中国家时误差显著,国产模型在中国语境表现更优,偏误源于训练语料的结构性失衡 [10] - 人工智能并非中性工具,而是嵌入特定社会语境的技术产物,需从理论层面解构其文化背景 [10]
捷利交易宝(08017)拟折让约14.86%发行8000万股配售股份 净筹约4963万港元
智通财经网· 2025-06-24 09:46
配售协议 - 公司与配售代理订立协议,以每股0.63港元配售8000万股新股,占公告日已发行股份总数的13.33%,占配售完成后经扩大已发行股份总数的11.76% [1] - 配售价较协议日收市价0.74港元折让14.86%,较前五个交易日平均收市价0.726港元折让13.22% [1] 资金用途 - 配售所得款项总额5040万港元,净额约4963万港元,每股净价约0.62港元 [2] - 资金拟用于开发DeepTrade实时交易引擎、TradeSeek人工智能互动系统、升级LiveReport大数据产品及暗盘市场交易系统 [2] 执行安排 - 配售股份将根据一般授权配发及发行,并向上市委员会申请批准上市及买卖 [1][2] - 配售对象为不少于六名独立第三方承配人 [1]
字节“开除” Seed 大模型负责人,因亲密关系踩红线
程序员的那些事· 2025-06-24 08:46
字节跳动廉政通报事件 - 字节跳动Seed大语言模型负责人乔木因未申报利益冲突及虚假陈述被辞退,涉事HRBP程某同时被辞退并扣罚全部年终奖 [1] - 涉事双方存在亲密关系且属于公司禁止的利益冲突场景(上下级关系/共同直属上级/HRBP关系)[1] - 乔木原为字节跳动核心高管,直接向CEO梁汝波汇报,负责豆包大模型团队 [1] 事件背景与调查过程 - 事件源于2025年3月乔木妻子罗某的实名举报,曝光婚内出轨及财产隐瞒证据 [1] - 调查初期两人均否认关系,利用HRBP与业务管理者的密切关系及高管话语权暂时隐瞒 [2] - 后续确凿证据导致谎言败露,公司内部系统已删除两人信息 [1] 公司处理方式 - 处理结果被低调置于廉政通报末条,内部飞书系统显示两人状态均为"已离职" [1] - 通报措辞显示处理是"总要给个交代"的结果,暗示事件发酵已久 [1]