大语言模型
搜索文档
字节Seed架构再调整 朱文佳转向吴永辉汇报
犀牛财经· 2025-10-21 10:22
管理层人事变动 - 字节大模型团队Seed负责人朱文佳的汇报对象由CEO梁汝波变更为现任Seed负责人吴永辉 [2] - 今年初字节从谷歌DeepMind挖来研究副总裁吴永辉担任大模型团队Seed基础研究负责人 [2] - 多名原向朱文佳汇报的算法和技术负责人转向吴永辉汇报 朱文佳一度转向负责模型应用 [2] 团队架构调整 - 字节Seed团队发生多次调整 大语言模型负责人乔木因出轨HRBP被辞退 [2] - 视觉大模型负责人杨建朝官宣休息 AiLab主任李航退休后又返聘 [2] - 字节Flow部门进行一轮组织架构重大调整 赵祺转岗至Spring产品部门 直接向朱俊Alex汇报 [2] - 豆包原有的PC和Mobile负责人改为向赵祺汇报 策略产品线的Thomas和陆游同样纳入其管理半径 [2]
中国总会计师协会财务管理专业委员会2025年秋季论坛成功举办
新京报· 2025-10-21 10:08
论坛概况 - 论坛主题为“大语言模型(DeepSeek)与穿透式财务管控”,探讨人工智能时代下财务管理的变革 [1] - 论坛由中国总会计师协会财务管理专业委员会主办,宁波银行北京分行承办,汇聚了国央企、院校、金融机构及科技公司的专家与业界领袖 [1] 财务管理转型趋势 - 财务管理职能正经历深刻重塑,从传统的核算监督向价值创造和风险前瞻管控转型 [1] - 大模型技术推动财务职能从“事后核算”跃升为企业的“价值导航系统”和“风险预警雷达” [2] - 财务部门应借助大模型技术,从传统的成本中心转变为驱动业务决策和价值创造的战略伙伴 [3] 宁波银行的战略与实践 - 公司战略为“专业化、数字化、综合化、国际化”,并取得稳健业绩 [2] - 数智化金融实践包括设立总行级“大模型项目部”,推动AI技术在业务场景中落地 [2] - 焕新升级“鲲鹏司库2.0”,为企业提供全球范围的全流程穿透式资金管控,实现“一点接入、全球响应”的智能财资管理 [2][3] - 围绕“五篇大文章”,在科技金融、绿色金融、数字金融等领域持续赋能实体经济 [2] 企业实践案例分享 - 中国通号利用技术手段构建风险管控防线,实现从被动合规向主动风控的升级 [3] - 中国物流结合行业资金流、物流、信息流三流合一的特点,通过穿透式管理提升供应链的财务透明度与运营效率 [3] - 长安汽车分享了在集团层面推进财务数字化转型的路径与成效 [4] - 中国中铁在复杂工程项目管理中应用智能工具,实现财务精准管控和资金高效配置 [4] - 中石油利用大模型技术处理海量数据,实现对遍布全球业务的深度洞察和集中管控 [4] 技术应用与挑战 - DeepSeek大模型在智能对账、风险预警、现金流预测等具体财务场景中有实战应用 [3] - AI在财务管控中的重点在于场景落地和价值证明,难点在于数据质量、模型可信度以及复合型人才的短缺 [6] - 以合同为单位管理现金流对于提升集团整体资金效率有基础性作用 [6] - 大型国有银行在金融科技领域的创新成果可赋能企业财务管理 [6]
刚刚,DeepSeek重要突破,大模型上下文紧箍咒打破
36氪· 2025-10-21 07:22
核心技术路径 - 首次提出“上下文光学压缩”概念,通过将文本转换为图像实现信息高效压缩[1] - 在10倍压缩比下解码精度达97%,20倍压缩比下精度仍保持约60%[3] - 将文本token转化为视觉token后能用更少token表达相近内容,为降低长文本处理算力开销提供新思路[6] 模型性能表现 - 在OmniDocBench上仅使用100个视觉token即超越GOT-OCR2.0(每页256个token)[6] - 使用少于800个视觉tokens情况下性能超过MinerU2.0(平均每页近7000个token)[6] - 生产环境中每天在单个A100-40G GPU上可生成20万页以上训练数据[8] 模型架构设计 - DeepEncoder视觉编码器采用SAM+CLIP双结构设计,支持从Tiny(64 token)到Gundam(795 token)多种分辨率模式[14] - 输入1024×1024文档图片时能将传统模型的4096个token压缩至256个[14] - DeepSeek3B-MoE解码器推理时仅激活6个专家模块,总激活参数量约5.7亿[18] 应用场景能力 - 具备深度解析能力,可识别图表、几何图形、化学结构式及自然图像等[24] - 在金融报告中能自动提取图表结构化信息[24] - 支持处理近百种语言,包括阿拉伯语与僧伽罗语等小语种[34][36] - 保留通用视觉理解能力,包括图像描述、物体检测和目标定位等任务[36] 数据训练体系 - 训练数据包含OCR 1.0数据(3000万页多语言文档)、OCR 2.0数据(图表公式解析)、通用视觉数据和纯文本数据四大类型[19][25] - 训练流程分为DeepEncoder独立训练和完整模型训练两个阶段[20] - 通过600万条采样数据微调获得Gundam-master超高分辨率模式[20] 行业影响意义 - 验证了视觉模态在文本压缩中的有效性,为大模型处理超长上下文提供新路径[39] - 展示通过优化信息表达方式提高模型效率的可能路径[39] - 为VLM视觉token优化、上下文压缩机制等研究方向提供有价值参考[39]
斑马智行拟港股上市 中国证监会要求补充说明股权变动等事项
智通财经· 2025-10-20 15:09
10月18日,中国证监会公布境外发行上市备案补充材料要求(2025年10月12日至2025年10月17日),其中 提到,要求斑马智行补充说明公司股权变动、业务经营等事项。据港交所8月20日披露,斑马智行向港 交所主板提交上市申请书,德意志银行、中金公司、国泰君安国际为其联席保荐人。 证监会请斑马智行补充说明以下事项,请律师进行核查并出具明确的法律意见: 一、关于股权变动:(1)请说明你公司历次增资及股权转让定价依据,定价是否公允,是否实缴出资, 是否存在未履行出资义务、抽逃出资、出资方式等存在瑕疵的情形,并就设立及历次股权变动合规性出 具结论性意见;(2)请说明你公司2025年8月定向减资和增资的工商变更登记办理进展,减资程序合规性、 相关税费缴纳以及减资对价款支付情况。 二、请说明你公司是否存在应办理国有股东标识但尚未完成的情况,并请律师对你公司是否存在国有股 东出具明确结论性意见。 三、关于业务经营:(1)请说明你公司及下属公司经营范围包含"增值电信业务;市场调查;测绘服务;利用 自有媒体发布广告;广告制作;广告发布;广告设计、代理"的具体情况,是否实际开展相关业务及具体运 营情况,是否取得必要的资质许可 ...
斑马智行3年1期经调整净亏损共24.8亿 "里程碑"数据降
中国经济网· 2025-10-20 14:42
六、关于本次发行上市及"全流通":(1)请说明全额行使超额配售权后的预计募集资金量;(2) 请说明本次拟参与"全流通"股东所持股份是否存在被质押、冻结或其他权利瑕疵的情形。 三、关于业务经营:(1)请说明你公司及下属公司经营范围包含"增值电信业务;市场调查;测绘 服务;利用自有媒体发布广告;广告制作;广告发布;广告设计、代理"的具体情况,是否实际开展相 关业务及具体运营情况,是否取得必要的资质许可,是否与第三方开展合作以及合作方名称(合作方是 否持有资质)、合作方式,是否涉及《外商投资准入特别管理措施(负面清单)(2024年版)》限制或 禁止领域,本次发行上市及"全流通"后是否持续符合外商投资准入要求;(2)请说明你公司子公司斑 智云图《试点增值电信业务经营许可证》的办理进展及拟从事相关业务的具体内容;(3)请以通俗易 懂的语言详述业务模式及涉及大语言模型的具体情况,并说明是否完成相关大模型备案。 四、关于规范运作:(1)请说明你公司及下属公司是否涉及开发、运营网站、小程序、APP、公众 号等产品,是否涉及向第三方提供信息内容,提供信息内容的类型以及信息内容安全保护措施;同时说 明收集及储存的用户信息规模,数 ...
淘天 AI 的终极目标:大象无形
晚点LatePost· 2025-10-20 11:51
AI电商战略理念 - 淘宝AI的核心指导思想是将AI功能无缝融入用户现有购物动线中,解决具体问题,目标是让用户感受不到AI的存在,即"大象无形"的理想状态[7][10] - 电商用户"多快好省"的基本需求并未因AI改变,关键在于利用新技术以不同方式满足这些经典需求,而非彻底改变用户习惯[8] - 公司选择将AI产品融入现有用户动线的思路类似Google,而非OpenAI的Chatbot模式,因电商动线长、用户痛点众多[9] 底层数据重构 - 2025年最重要的工作是利用大语言模型系统性优化搜索、推荐和广告环节,核心是解决商品底层数据陈旧问题[11] - 构建AI智能体自动消化行业知识、分析用户行为,为每个品类筛选关键属性,指导商家填写,以解决商品信息匮乏和不规范的历史难题[12] - 启动"SKU引擎"项目,利用AI深入理解每个SKU的完整信息,数据量将从几十亿爆炸性增长到数百亿,挑战在于识别"绝对同款"和"相似款"[13] 技术实施与效果 - 策略是让新老方法协同工作:大模型负责语义理解商品信息,深度学习模型仍负责预测用户点击或购买行为[14] - 在复杂语义下的商品搜索相关性通过AB测试验证可提高20个百分点,对成熟系统是罕见改进[16] - 淘宝是业界唯一在所有搜索请求中都应用大模型的平台,每天处理高达3亿次页面访问量[16] 商家工具应用 - AI美工每月帮助商家自动生成2亿张图片,AI客服每天为商家节省成本约2000万元人民币[18] - 公司不指望通过商家工具直接盈利,而是通过帮助商家降本增效来促进其销售额增长,从而让平台间接受益[17] - 商家工具的关键规模指标是使用人数以及商家利用这些工具完成的工作量[17] 用户侧产品创新 - 推出系列AI导购产品:AI万能搜解析模糊需求、AI帮我挑提供选购建议、AI试穿模拟上身效果、AI清单管理购物、拍立淘优化图片搜索[15][18] - 表达需求是高门槛行为,AI产品难点在于用户不知如何描述,因此策略是让用户输入宽泛词后由系统帮助精确化,而非要求用户输入100个词[10] - 评价AI导购产品的指标与传统产品一致,关注日活跃用户和用户留存[18] 组织与创新管理 - AI产品负责人必须是既懂产品又有算法背景的多面手,形成以产品为单位的高效创业体,避免过时的职能分工生产方式[7] - 公司通过更小、更灵活的团队负责AI方向,以适应AI时代"一步慢步步慢"的竞争节奏[7] - 团队日常讨论超越电商业务范畴,涉及互联网未来、Agent普及等宏观话题,组织氛围更像创新工坊而非作战指挥部[19]
凯文·凯利:AI技术在中国语境下的落地与实践
新浪财经· 2025-10-20 09:33
新浪财经ESG评级中心提供包括资讯、报告、培训、咨询等在内的14项ESG服务,助力上市 公司传播ESG理念,提升ESG可持续发展表现。点击查看【 ESG评级中心服务手册】 2025可持续全球领导者大会于10月16日-18日在上海市黄浦区世博园区召开。上海交通大学上海高级金 融学院副院长、金融学教授朱宁对话科技预言家、《2049》作者、《连线》杂志创始主编凯文·凯利, 共同探讨AI技术在中国语境下的落地与实践。 以下为对话实录: 朱宁:首先,感谢凯文·凯利先生您分享的非常棒的观点以及对未来的想象。 凯文·凯利:我觉得它使得人的能力更加强大。我成长的时候有一个恐惧,计算器会终结人类做算术的 过程和历史,即取代人类的价值,但有一点很明确,计算器可以让算术变得更加快。讲到最后,尤其用 于教育的AI,它会加速学习能力的上升以及学习速度的增加,同时可以扩充学生知识学习的范围以及 能力的提升。 朱宁:过去十年中,因为很多人都提到了AI,您觉得AI是不是成长速度或范围已经超过您的想象了? 还是说它增长得没有您想象得那么好。 凯文·凯利:感谢您的邀请,我非常荣幸来到这里,我非常喜欢来到中国上海,我非常喜欢上海的变 化。 朱宁: ...
今日开课!清华团队带队梳理自动驾驶VLA学习路线:算法+实践
自动驾驶之心· 2025-10-20 07:32
自动驾驶行业技术趋势 - 行业技术焦点已从传统的BEV感知、车道线、Occupancy等相对成熟的方向转向自动驾驶VLA [4] - VLA被视为提供类人思考能力、通过思维链形式展现车辆决策过程的关键技术,旨在实现更可靠安全的自动驾驶 [1] - 自动驾驶VLA目前主要分为模块化VLA、一体化VLA和推理增强VLA三个子领域 [1] 自动驾驶VLA核心技术要素 - 核心技术涵盖视觉感知、大语言模型、Action建模、大模型部署及数据集制作等 [7] - 涉及的最前沿算法包括CoT、MoE、RAG以及强化学习 [7] - 行业主流企业,包括智驾方案供应商和车企,均在发力自研自动驾驶VLA [4] 自动驾驶VLA课程核心内容 - 课程系统讲解自动驾驶VLA三个子领域的前沿算法,并配备两个实战及一个课程大作业 [8] - 课程大纲包含VLA算法介绍、算法基础、VLM作为解释器、模块化与一体化VLA、推理增强VLA及综合大作业 [13][15][16][17][18][21] - 课程设计从原理到实战,包含对开源BenchMark、评测指标及数据集制作专题的详细讲解 [14][15] 自动驾驶VLA算法发展路径 - VLA发展路径显示,Language从被动的场景描述演变为模块化架构中的主动规划组件 [17] - 模块化VLA强调多阶段pipeline,而一体化VLA实现感知到控制的端到端映射 [17] - 推理增强VLA的趋势是向长思维链推理、记忆和交互发展,将VLM/LLM置于控制中心 [18] 行业实践与前沿算法案例 - 课程实战部分选取了华科与小米最新提出的ReCogDrive及清华AIR与博世提出的Impromptu VLA等算法进行代码学习 [17][20] - 重点讲解的算法案例包括DriveGPT4、TS-VLM、ORION、DriveMoE、DiffVLA、S4-Driver等业界前沿工作 [16][18][19][24] - 算法训练涵盖预训练、模仿学习、强化学习GRPO、扩散模型轨迹输出等主流范式 [17]
新股消息 | 斑马智行拟港股上市 中国证监会要求补充说明股权变动等事项
智通财经网· 2025-10-20 06:48
公司上市备案进展 - 中国证监会于10月18日公布境外发行上市备案补充材料要求 涉及斑马智行 [1] - 证监会要求公司就股权变动 业务经营等事项进行补充说明 并由律师核查出具法律意见 [1] - 斑马智行已于2025年8月20日向港交所主板提交上市申请书 [1] 股权结构与合规性 - 证监会要求说明历次增资及股权转让的定价依据 公允性 实缴出资情况以及是否存在出资瑕疵 [1] - 需说明2025年8月定向减资和增资的工商变更登记进展 减资程序合规性 税费缴纳及对价款支付情况 [1] - 需说明公司是否存在应办理但未完成国有股东标识的情况 [1] - 公司需严格对照《境内企业境外发行证券和上市管理试行办法》第八条 说明是否存在境外发行上市禁止性情形 [3] 业务经营与资质 - 需说明公司及下属公司经营范围包含增值电信业务 市场调查 测绘服务 广告等业务的具体情况 是否实际开展 是否取得必要资质 [2] - 需说明相关业务是否涉及《外商投资准入特别管理措施(负面清单)(2024年版)》限制或禁止领域 以及发行上市后是否符合外商投资准入要求 [2] - 需说明子公司斑智云图《试点增值电信业务经营许可证》的办理进展及拟从事业务内容 [2] - 要求以通俗语言详述业务模式及涉及大语言模型的具体情况 并说明是否完成相关大模型备案 [2] 规范运作与数据安全 - 需说明公司及下属公司是否开发运营网站 小程序 APP 公众号等产品 是否向第三方提供信息内容及内容类型和安全措施 [2] - 需说明收集及储存的用户信息规模 数据收集使用情况 以及上市前后个人信息保护和数据安全的安排 [2] - 需说明公司及下属公司未完结诉讼及仲裁案件的最新进展 是否构成本次上市的实质性障碍 [2] 本次发行上市具体安排 - 需说明全额行使超额配售权后的预计募集资金量 [3] - 需说明本次拟参与"全流通"股东所持股份是否存在被质押 冻结或其他权利瑕疵的情形 [3] - 需说明本次分拆上市所履行上市地监管程序情况 [4] 公司核心业务定位 - 斑马智行是一家智能座舱解决方案供应商 致力于将汽车转变为能感知互动的智慧伙伴 [4] - 公司聚焦于智能座舱这一人车互动主要入口 [4] - 公司凭借自研的汽车操作系统与全栈元神AI架构 协助主机厂打造智能汽车 实现自然语音控制和个性化车舱体验 [4]
微博加码扶持中长视频:从注重播放量到以观看时长为分发主导
南方都市报· 2025-10-19 13:05
公司运营与用户数据 - 截至今年6月,微博平台月活跃用户(MAU)达到5.88亿,日活跃用户(DAU)2.61亿 [1] - 全平台日均发博量1.05亿、日均评论量0.63亿、点赞数1.97亿 [1] - 活跃用户中30岁以下人群占比70.7%,四线及以下人群占比达到31.5%,31-40岁中青年月活跃用户占比22.9% [1] - 截至今年9月,平台"金橙V"创作者总量达12.5万,其中"金V"作者1.8万,"橙V"作者大幅提升至10.7万,同比增长57% [1] 产品战略与视频生态改革 - 公司今年围绕关系流、推荐流、热点三大核心场景以及视频消费共四部分展开升级改造,以强化产品差异化优势 [2] - 自今年6月起,微博视频分发政策由原来以播放量主导转变为以观看时长为主导 [1][2] - 平台持续加大对1分钟以上中长视频的现金激励与流量倾斜,推动视频内容质量与消费时长增长 [2] - 今年第三季度,"金橙V"生产的时长超30秒且"质量分"超3分的"优质视频"生产量同比提升51%,全站视频观看时长同比增长12% [2] 技术赋能与内容分发机制 - 近两年,公司在传统机器学习基础上重点引入大语言模型,利用AI能力提升内容理解和用户体验水平 [3] - 平台推荐内容分发机制依赖三大引擎:兴趣、社交和热点,通过兴趣探索帮助用户发现新领域,通过热点提供新话题 [3] - 社交推荐被定位为依托社交深入理解人与人之间的关系,让推荐更有"温度",平台投入挖掘直接"关注"关系、间接关系及复杂协同关系 [4] - 公司利用神经网络算法对用户社交关系做扩展,寻找好友、同好及所属社群,并进行跨圈层推荐 [4]