百度文心一言
搜索文档
阿里AI双线炸场:千问硬刚ChatGPT ,二十年铺垫藏暗棋
搜狐财经· 2025-11-24 11:49
公司战略与产品发布 - 蚂蚁集团发布全模态AI助手“灵光”,支持30秒生成可编辑、可交互的小应用 [4] - 阿里“千问”App开启公测,凭借免费优势和生活场景生态直接对标ChatGPT进军C端市场 [6] - 公司通过“千问”从B端API服务转向独立C端App,并与蚂蚁“灵光”协同,意图补齐AI生态短板 [6] - 退休多年的马云低调现身蚂蚁集团园区,被解读为向团队和市场注入信心的战略站台行为 [4][6] 技术投入与历史积淀 - 公司宣布未来三年将投入3800亿元用于云和AI硬件基础设施建设,金额超过过去十年总和,创下民企最大规模投资纪录 [13] - 自2009年“飞天”系统立项以来,公司长期投入云计算基础设施,为当前AI大模型训练积累了深厚的技术沉淀和数据资源 [15] - 公司对云计算和AI的长期主义投入,在追求短期流量的互联网行业中形成差异化优势 [15] 业务成效与市场影响 - 在刚结束的双11大促中,AI应用成效显著:近600个品牌成交破亿,3.4万个品牌成交翻倍,1.3万个品牌成交翻五倍以上,“AI万能搜”解答了5000万个问题 [8] - AI与平台战略的结合帮助公司电商业务重拾增长势头,应对了来自拼多多崛起和直播电商分流的竞争压力 [10] - 全球AI市场规模已达2792.2亿美元,未来几年预计将以35.9%的复合年增长率扩张 [23] 行业竞争格局 - AI赛道竞争白热化,国内已有百度“文心一言”、字节“豆包”等产品深耕C端市场 [6] - AI时代的竞争核心是技术、生态与长期主义的综合实力,公司从电商、云计算到AI的全面布局体现了其战略 [21] - 公司的巨额投入和战略转向为行业树立标杆,表明AI已成为企业生存的必答题而非选择题 [21][23]
大模型技术学习过程梳理:Agent、RAG、通用大模型等......
自动驾驶之心· 2025-11-23 10:04
社区定位与目标用户 - 社区旨在为大模型技术领域的学习者提供交流平台,解决其在学术、应用和工程上遇到的问题 [5] - 目标用户包括从刚入门的研究生到已有基础希望进一步提升的学习者,社区内容设计可帮助小白快速入门,并支持进阶者系统性学习 [2][6] - 社区已构建包含技术路线分享、直播、问答、求职、赛事等多版块的闭环生态,致力于培养行业人才并提供展示机会 [3] 社区资源与合作伙伴 - 社区嘉宾团队正在快速扩张,已邀请来自上海交通大学、清华大学、北京大学、上海人工智能实验室、香港科技大学、香港大学等顶尖高校及科研机构的专家 [5][67] - 工业界合作伙伴涵盖阿里通义千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等头部公司 [5][67] - 社区内部已汇聚40多位学术界和工业界专家,未来计划打造为大模型前沿技术聚集地 [67] 核心技术路线覆盖 - 社区提供全面的大模型全栈学习路线图,核心领域包括RAG(检索增强生成)、AI Agent和多模态大模型 [5][6][12] - RAG技术路线细分为Graph RAG、Knowledge-Oriented RAG、多模态RAG、Reasoning RAG等子领域,并提供BenchMark、综述及开源仓库等资源 [13][19][21][22][24][26] - AI Agent技术路线涵盖前沿综述、Agent评测、强化学习、多模态Agent、Agent通讯、基座Agent汇总、自进化Agent及Multi-Agent等方向 [28][30][33][35][37][39][40][42][44] 多模态与模型优化技术 - 多模态大模型训练内容包含多模态大模型(MLLM)、视觉语言模型(VLM)、大模型微调、强化学习与RLHF、MoE(混合专家模型)等关键技术点 [46][49][51][52][53][54] - 模型部署方面提供大模型量化、推理及部署的详细技术路线,满足学习者部署自有模型的需求 [60][61][62][64] - 扩展技术领域包括VLM的提示适配器学习、LLM在3D世界中的应用以及科学大语言模型学习路线图 [55][56][58] 社区服务与未来规划 - 社区福利包括第一时间掌握学术进展与工业应用、与行业专家交流工作求职问题、获得岗位推荐及产业投资与项目对接机会 [10] - 未来计划通过不定期邀请国内外顶尖学术界和工业界专家进行直播分享,并允许内容反复观看 [66] - 社区将持续分享独家岗位招聘信息,赋能成员职业发展 [67]
从DeepSeek到千问灵光,杭州AI梦之队引领2025 AI风口
第一财经· 2025-11-18 14:30
阿里系AI应用战略加速 - 阿里巴巴于11月17日推出千问App公测版,旨在借助Qwen模型的海外影响力与ChatGPT争夺海外用户 [1] - 蚂蚁集团于11月18日推出全模态通用AI助手“灵光”,支持30秒生成日常生活小应用,直接对标豆包 [1][3] - 阿里夸克推出“吃豆人”计划,内嵌AI对话式助手,千问App计划覆盖办公、地图、健康、购物等多个生活场景 [6] 主要AI产品能力与市场表现 - 蚂蚁灵光支持3D、音频、图表、动画、地图等全模态信息输出,并能实现信息的可视化 [3][4] - 2025年10月豆包的日活跃用户最高,达到5410万,DeepSeek为2860万 [15] - 2025年9月夸克的月活跃用户在全球总榜排名仅次于ChatGPT,位列国内总榜第一 [16] - 蚂蚁AQ在上线四个月后月活用户规模突破千万,是唯一一款月活超千万的行业专业级AI原生应用 [16] 行业竞争格局与市场动态 - 国内形成“南阿里、北字节”的AI格局,AI应用进一步冲击海外市场,直接对标ChatGPT等 [6] - 2025年被视为“AI应用元年”,C端用户热情升温,大厂迎来场景布局和能力延伸的最佳机遇 [6] - 2025年9月,大陆市场AI产品投放素材量达141.1万组,腾讯元宝、夸克、豆包等位列素材投放榜前五 [16] - 各公司确立差异化方向:千问从B端走向C端,夸克专注“all in one”,豆包依托社交平台流量,AQ深耕医疗垂类场景 [17] 技术积累与战略方向 - 蚂蚁自主研发的百灵大模型已发布18款大模型,跻身万亿参数模型阵营,未来战略方向为聚焦应用、推动普惠 [7] - 蚂蚁已在医疗健康、金融等垂类领域推出AQ、蚂小财等应用,并通过灵光重新定义通用AI助手能力边界 [8] - 阿里巴巴宣布三年3800亿AI基础设施支出,蚂蚁集团早在2023年就提出“AI First”战略 [11] 杭州AI产业集聚效应 - 2025年前三季度浙江省人工智能核心产业营业收入达4944亿元,同比增速22%,研发费用390亿元,同比增长14% [11] - 杭州在AI基础层、技术层、应用层积累了全链路企业布局,并积极推动人才引进和培养 [11] - 2025年第三季度AI产品经理岗位,杭州以平均月薪28659元领跑全国,成为该岗位薪资最高的城市 [13] - 杭州发布多项人工智能发展方案,支持大模型多路线攻关及全产业链高质量发展 [10]
阿里公测千问对标ChatGPT,但9.9和9.11谁大还是“翻车”了
第一财经· 2025-11-17 16:31
大模型能力表现 - 阿里巴巴最新公测的千问APP在回答“数字9.9和9.11谁大”时答错 称“9.11更大” 但在后续问题拆解中经过分析后给出了9.9大于9.11的结论 [1] - 对于同一问题前后答案矛盾 千问解释为处理时出现阶段性错误 属于结论与推理过程不匹配的笔误及认知偏差干扰 [9] - 记者再次提问后 千问展示了自我完善能力 正确回答“9.9更大” [9] - 此前第一财经记者测试12个大模型 阿里通义千问 百度文心一言 Minimax和腾讯元宝答对 但ChatGPT-4o 豆包 kimi都答错 [1] - 该问题由艾伦研究机构成员林禹臣发现 Scale AI的提示工程师莱利·古德赛德变换问法后拷问多主流大模型 ChatGPT-4o 谷歌Gemini Advanced及Claude 3.5 Sonnet均答错 [9][10] 大模型技术特性 - 有AI技术从业人士表示 大模型本质是语言模型 从语言数据中学习统计相关性 使其不擅长规则学习和归纳推理 [10] - 尽管在常识性问题上出现失误 但在技术积累 生态布局和全球拓展方面 包括阿里巴巴Qwen模型在内的中国大模型已具备全球竞争力 [10] 阿里巴巴Qwen模型市场表现 - Qwen系列模型的全球下载量已突破6亿次 [10] - 爱彼迎CEO表态公司已很大程度上依赖阿里巴巴Qwen模型 认为其非常好 速度快且便宜 在实际生产中通常不会大量使用OpenAI最新模型 因为有更快更经济的模型可选 [10] 阿里巴巴AI战略布局 - 阿里巴巴正式宣布“千问”项目 全力进军AI to C市场 计划将地图 外卖 订票 办公 学习 购物 健康等各类生活场景接入千问APP [11] - 基于开源模型Qwen3 阿里管理层将“千问”项目视为“AI时代的未来之战” 意味着阿里巴巴正借力Qwen模型海外影响力 与ChatGPT直接展开海外竞争 [11]
大模型方向适合去工作还是读博?
具身智能之心· 2025-10-16 08:03
文章核心观点 - 文章探讨了大模型领域从业者面临的职业发展选择问题 即继续深造读博还是参与AI Agent创业潮 [1] - 决策需基于个人是否具备扎实的大模型基础以及是否适合扮演“开拓者”的研究角色 [1][2] - 大模型之心Tech知识星球被定位为一个综合性的学习与交流平台 旨在为不同阶段的从业者提供系统化支持 [2][4] 大模型行业现状与人才需求 - 大模型技术范围广泛 涉及生成、多模态、微调、强化学习、基准测试及多个下游应用领域 [1] - 通用大模型研发存在高壁垒 主要由顶级公司主导 [1] - 行业存在导师半路出家、学生基础不扎实的现象 凸显了系统性学习的重要性 [1][2] 大模型之心Tech知识星球资源 - 社区形式为视频、图文、学习路线、问答与求职交流的综合体 [2] - 已邀请40余位来自国内外顶尖高校(如清华、北大、上交、港科大等)和头部公司(如阿里、百度、字节、月之暗面等)的嘉宾 [4][66] - 提供大模型全栈学习路线图 覆盖RAG、AI Agent、多模态大模型等核心方向 [4] 技术路线覆盖详情 - RAG技术路线细分为Graph RAG、Knowledge RAG、多模态RAG、Reasoning RAG等8个子领域 [9][10][16][18][20][22][24][25] - AI Agent技术路线包括前沿综述、评测、强化学习、多模态Agent、通讯协议等7个细分方向 [26][27][29][31][33][35][36][38][40][42] - 多模态大模型训练涵盖MLLM、VLM、微调、RLHF、MoE等9个技术模块 [44][47][49][51][53][54][55][56][58] - 大模型量化、部署及推理被列为独立的技术板块 [60][61][62][63] 社区附加价值 - 提供大模型学术进展与工业应用的最新信息 [7] - 具备工作岗位推荐功能 可第一时间对接企业需求 [7][68] - 计划通过行业大佬直播分享和独家岗位招聘信息进一步赋能社区成员 [64][65][67][68]
具身领域的大模型基础部分,都在这里了......
具身智能之心· 2025-09-21 00:03
社区定位与目标 - 社区旨在打造集视频、图文、学习路线、问答、求职交流为一体的综合类大模型技术社区,为初学者和进阶者提供交流与技术分享平台 [1] - 社区目标是成为大模型前沿技术聚集地,汇集来自国内外知名高校实验室及头部公司的嘉宾,高校包括上交、清华、北京大学等,公司包括阿里千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等 [3][68] 核心学习路线与内容 - 社区汇总了大模型全栈学习路线图,核心领域包括RAG、AI Agent和多模态大模型 [3] - RAG学习路线细分为Graph RAG、Knowledge RAG、多模态RAG、Reasoning RAG等8个子领域 [3][9][10][12][14][16][18][20][22][23][24] - AI Agent学习路线涵盖前沿综述、评测、强化学习、多模态Agent、Agent通讯等7个子领域 [25][26][28][30][32][34][35][37][39][41] - 多模态大模型训练路线包括开源数据集、MLLM、VLM、大模型微调、RLHF、MoE等9个技术方向 [42][43][45][47][49][51][53][55][56][57][59] - 社区扩展了大模型量化、部署及推理相关内容,以满足成员部署自有模型的需求 [61][62][63][64] 社区资源与福利 - 社区已邀请40余位学术界和工业界专家,来自国内外知名高校和头部公司 [68] - 成员福利包括第一时间掌握学术进展与工业应用、与行业大佬交流工作与求职问题、获得大模型相关岗位推荐及投资与项目对接机会 [7][70] - 未来计划不定期邀请行业大佬进行直播分享,内容可反复观看,旨在邀请国内外顶尖学术界和工业界专家 [66]
但我还是想说:建议个人和小团队不要碰大模型训练!
自动驾驶之心· 2025-09-21 00:03
大模型应用策略 - 对于小规模团队,部署开源大语言模型结合检索增强生成技术已能满足99%的需求,在触及开源模型性能边界前不建议进行模型微调[2] - 若开源模型在特定垂直领域效果不佳,应优先尝试检索增强生成技术和上下文学习等低成本方案,而非直接进行模型微调[3] - 建议将最复杂的任务分配给o1系列模型,将需要较高智能的任务分配给4o等第一梯队模型[3] - 除付费模型外,可考虑采用DeepSeek、豆包、Qwen等国产开源大模型[4] - 基础模型能力的每次重大提升都如同一次技术版本更新,从业者需敏锐识别现有模型能力与业务需求的差异[6] - 应避免在低收益赛道进行无意义投入,采取错位竞争和降维打击策略更为有效[7] 核心技术趋势与人才需求 - 检索增强生成和智能体技术是当前大模型领域最具代表性的技术,企业对掌握这些技能的人才需求高涨[8] - 行业正积极构建技术社区,汇集来自上海交通大学、清华大学、北京大学、上海人工智能实验室、香港科技大学、香港大学等顶尖高校及阿里千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等头部企业的专家[10][43] 技术社区资源体系 - 社区提供集视频、图文、学习路线、问答、求职交流为一体的综合型大模型技术平台[8][10] - 技术学习路线图全面覆盖检索增强生成、智能体、多模态大模型三大方向,包括Graph RAG、知识导向RAG、多模态RAG、推理RAG、智能体强化学习、多模态智能体、多智能体等细分领域[10] - 社区已邀请40余位学术界和工业界专家,计划不定期举办行业大佬直播分享活动[41][43] - 提供大模型相关工作岗位推荐和行业机会挖掘服务,助力职业发展[13][44]
真的花了好久才汇总的大模型技术路线......
具身智能之心· 2025-09-16 08:03
大模型技术发展趋势 - 大模型已成为推动社会生产的重要工具,广泛应用于日常办公、自动驾驶、具身智能和AIGC生成等领域 [2] - 大模型产业正经历技术普惠化、应用垂直化和生态开源化的深度变革 [2] - RAG和AI Agent技术成为AI从业者核心竞争力,相关岗位需求旺盛且算法岗位年薪领先行业 [2] 技术社区建设 - 创建了集视频、图文、学习路线、问答和求职交流为一体的综合型大模型社区 [2] - 社区已邀请40+来自国内外知名高校和头部企业的专家,包括上交、清华、北大、上海AI实验室、港科大、阿里、美团、深度求索、字节、百度和月之暗面等机构 [4][66] - 社区提供学术进展追踪、工业应用交流、求职对接和行业机会挖掘等服务 [7] RAG技术体系 - 提供完整的RAG学习路线,包括Graph RAG、Knowledge-Oriented RAG、Reasoning RAG等子领域 [4][9] - 汇总了最新综述、开源仓库和BenchMark,涵盖RAG在视觉理解和AIGC中的应用 [11][12][14][16][18][21][23] - 包含个性化RAG工作汇总和专业技术资料,适合从入门到进阶的系统性学习 [4][11] AI Agent技术体系 - 详细解析AI Agent核心技术,包括前沿综述、强化学习、多模态应用和通讯协议 [25][27][29][31][32] - 汇总基座Agent、自进化Agent和Multi-Agent的最新研究成果 [34][36][38] - 提供Agent评测框架和开源工具链,覆盖工业界与学术界需求 [4] 多模态大模型训练 - 涵盖多模态大模型(MLLM)和视觉语言模型(VLM)的训练方法,包括微调、RLHF和MoE技术 [40][44][45][47][49][50] - 汇总开源数据集和提示适配器学习方案,支持3D世界应用开发 [42][51][53] - 持续扩展强化学习与模型优化模块,满足科研和工业落地需求 [40] 模型量化与部署 - 提供大模型量化、推理和部署的完整技术方案 [55][56] - 涵盖参数优化、推理加速和部署实践,助力模型高效落地 [58][60][62] - 扩展社区内容至工程应用领域,满足开发者对模型部署的需求 [56] 社区发展计划 - 计划邀请国内外顶尖学术界和工业界专家进行直播分享,内容可回放 [64] - 持续扩展专家网络,打造大模型前沿技术聚集地 [66] - 提供独家岗位招聘信息,赋能社区成员职业发展 [67]
虚拟数字人:在技术迭代中进化
经济日报· 2025-09-15 05:53
行业演变历程 - 虚拟数字人行业从2021年资本追捧阶段转入理性调整期 初期因虚拟美妆数字人"柳夜熙"爆红引发品牌虚拟代言人热潮 A股概念股轮番涨停 [2] - 行业曾流行"3个月造星 6个月回本"口号 但高昂成本逐渐显现 单条短视频制作成本达数十万元 前期研发投入达百万元级别 [2] - 用户新鲜感退潮导致虚拟代言人大量撤下 虚拟主播GMV不足真人主播1/5 抖音平台虚拟主播平均观看时长从15分钟降至5分钟 粉丝流失率超40% [3] 技术发展与成本结构 - 早期数字人依赖动作捕捉与图形渲染技术 存在表情僵硬 交互延迟等技术同质化问题 [3] - 高质量3D数字人制作成本居高不下 2D数字人因模板泛滥陷入价格战 [3] - 生成式人工智能推动产品升级为"数智人" 运用自然语言处理 语音识别 图像识别与情感分析等技术实现智能交互 [4] 商业化应用转型 - 行业从C端偶像经济转向B端实用场景 包括金融 医疗 教育 企业服务等领域 通过SaaS平台降低制作门槛 [4] - 罗永浩数字人直播吸引超1300万人次观看 GMV突破5500万元 部分品类带货单量超真人首秀数据 [4] - 京东618期间数字人带货能力超越80%真人主播 1.7万家品牌商家使用数字人直播 百度二季度数字人收入环比增长55%达约5亿元 [5] 市场规模与资本动态 - 2025年中国虚拟数字人核心市场规模预计突破480亿元 带动相关产业规模超6400亿元 [6] - 截至2025年7月7日虚拟数字人领域发生23起投融资 总金额达35.07亿元 平均每起融资超1.5亿元 [6] - 上海等地出台政策支持数字人关键技术攻关 多地政府部门上线数字人提供公共服务 [6] 法律规范与平台治理 - 虚拟数字人形象被认定为具有独创性的美术作品 受著作权法保护 技术内核中的代码可作为计算机软件受保护 [7] - 抖音平台累计处理超17万个录播直播间 封闭3万多个账号 打击2800多个黑商团伙以治理AI主播冒充真人问题 [7] - 行业需应对数据隐私 版权争议等伦理法律问题 北京互联网法院已出现虚拟数字人著作权侵权判例 [6][7] 技术演进方向 - 多模态大模型发展推动虚拟数字人效果优化 未来需实现从功能复刻到情感共鸣的技术跨越 [4][5] - 数字人直播通过技术驱动重构电商价值链 竞争核心在于场景化创新与用户体验优化 [5] - AI大模型如GPT-5 百度文心一言为虚拟数字人注入智慧灵魂 未来5年将向智能制造 文娱消费领域深度赋能 [7]
从算力到应用:港股“科技七巨头”如何接棒AI浪潮第三阶段?
搜狐财经· 2025-08-18 19:46
横向对比:显著低估 - 恒生科技指数动态市盈率约25.8倍,较纳斯达克100指数折让约20%,中美科技龙头估值差达10-20倍,腾讯和阿里动态PE不足20倍远低于美股同类企业 [5] - 恒生指数整体PE为10.2倍,低于标普500的22.3倍和日经225的18.6倍,科技板块估值优势更为突出 [5] - 港股科技股因稀缺性和流动性差异,估值普遍低于A股同类型企业,存在跨市场套利空间 [5] 纵向历史:处于低位区间 - 恒生科技指数PE处于近五年分位数的8%,显著低于历史中位数,互联网板块估值泡沫已充分消化 [5] - 部分龙头股如阿里巴巴和百度因AI业务转型,估值中枢正从消费股向科技成长股切换,但股价尚未充分反映技术升级潜力 [5] 驱动因素:修复与成长双逻辑 - 2025年Q2腾讯和联想等企业财报超预期,显示降本增效成果,AI商业化加速有望打开第二增长曲线 [5] - 国内经济温和复苏叠加政策支持,科技企业基本面边际改善 [5] - 南向资金2025年累计净买入超3000亿港元,港股科技ETF年内涨幅近40%,反映资金配置需求 [5] - 美联储降息预期下美元走弱,推动全球资金增配新兴市场,港股作为离岸中国资产直接受益 [5] 结论:战略性配置窗口已至 - 港股科技板块兼具低估值、高成长和政策催化三重优势,是中长期资金布局的理想选择 [5] - 当前估值水平隐含较高安全边际,若盈利增速兑现,板块有望迎来戴维斯双击 [6] - 建议关注恒生科技ETF和港股通科技指数基金,以及AI算力、平台经济和硬科技细分龙头 [6]