通义听悟

搜索文档
华为云“All in ”大模型 盘古3.0登场加速百“模”大战
新华网· 2025-08-12 13:54
全球大模型发展现状 - 全球已发布数百个大模型 中国年内已发布80多个大模型 [1] - 人工智能发展因ChatGPT进入快进状态 科技企业争相布局大模型作为"一把手工程" [1] - 华为在7月开发者大会提出"All in大模型"战略 目标帮助千行百业拥有专属大模型 [1] 华为盘古大模型战略架构 - 盘古大模型3.0采用"5+N+X"三层架构:L0层含自然语言/视觉/多模态/预测/科学计算5大基础模型 L1层为行业大模型 L2层为场景化模型服务 [2] - 模型采用分层解耦设计 支持行业客户按需调用NLP大模型的知识问答/文案生成/代码生成及多模态模型的图像生成/理解能力 [2] - 提供昇腾AI算力云服务 支持企业基于自有数据训练专有大模型 [2] 华为AI算力基础设施 - 构建鲲鹏和昇腾为基础的AI算力云平台 提供分布式并行加速/算子编译优化/集群通信优化等能力 [3] - 大模型训练效能达业界主流GPU的1.1倍 单集群2000P Flops算力云服务在乌兰察布和贵安上线 [3] - 昇腾AI全球开发者超180万 孵化和适配30多个大模型 支持国内约50%大模型创新 [3] - 拥有30多家硬件伙伴/1200多家ISV 推出超2500个行业解决方案 [3] 行业竞争格局 - 盘古大模型已在金融/制造/医药研发/煤矿/铁路等行业应用 [4] - 阿里云发布通义千问大模型/通义听悟AI音视频模型/通义万相绘画模型 与头部企业联合打造专属大模型 [4] - 百度文心系列累计发布11个行业大模型 覆盖电力/燃气/金融/航天/传媒等领域 [4] - 腾讯将生成式AI定位为社交游戏"倍增器" 加速推进混元大模型 [5] 生态建设与资本动向 - 华为启动2023开发者大赛 设立云底座和产业赛道推动AI应用创新 [5] - 联合多家机构成立大模型高质量数据联盟 打造行业级数据集 [5] - 阿里向创业公司提供智能算力/开发工具/资金支持 蚂蚁集团领投生数科技近亿元天使轮融资 [5] 政策与标准化进展 - 中国信通院/工信部电子五所/华为等联合成立"大模型产业工作组" 推进应用落地与产业孵化 [6] - 国家网信办4月起草《生成式人工智能服务管理办法》 国务院6月将人工智能法草案纳入立法计划 [6] - 国家标准委5月启动大模型标准化工作 7月由上海AI实验室与360/百度/华为/阿里等联合组建专题组 [6] 市场规模预测 - IDC预测2026年中国人工智能软件及应用市场规模达211亿美元 人工智能进入大规模落地应用关键期 [6]
刘强东挖走马云一员大将
搜狐财经· 2025-08-06 09:46
京东纳入一员大将,大厂AI人才大变动 今年的大厂,正在上演人才流动的戏码。 据业内消息,原阿里通义千问语音团队负责人鄢志杰,于近期正式加入京东探索研究院。 此前,鄢志杰担任阿里通义实验室语音 团队负责人 今年2月15日,鄢志杰从阿里离职,后短暂加入腾讯AI Lab出任副主任,约三个月后离职。如今,鄢志 杰出任京东语音实验室负责人,向京东集团副总裁、探索研究院院长何晓冬汇报。 公开资料显示,鄢志杰2008年毕业于中国科学技术大学语音实验室,获得博士学位,师从科大讯飞联合 创始人王仁华教授,先后任职微软亚洲研究院、阿里巴巴达摩院、腾讯AI Lab。 在阿里期间,鄢志杰曾先后担任阿里IDST智能语音交互团队总监、达摩院机器智能语音实验室负责 人,成为达摩院最初核心成员——十三位"扫地僧"之一。 早在今年3月,就有消息传出京东已切入具身智能领域,侧重家用场景,已成立相关业务部门。 后又开始担任通义听悟技术负责人,他主导开发的"通义听悟"成为阿里第一个对C端用户开放的语音大 模型应用。 作为在阿里语音领域深耕了10年的AI技术人才,鄢志杰的加盟无疑为京东的AI语音领域研究提供了强 劲的支持,有望大幅提升语音交互的精准度 ...
可能是2025-2026年的最佳投资
佩妮Penny的世界· 2025-07-22 18:44
创投行业工具大礼包 - 海外AI工具大礼包价值超过15000美元,包含Cursor、Perplexity、Notion等产品,订阅newsletter年费约200美元,学生可享50%教育优惠 [1] - 国内创投社群推出价值超6000元的工具礼包,包含一级市场数据平台、AI投研工具等,社群会员免费获取体验资格 [2] - 烯牛数据提供个人版APP月卡(价值188元/月)及机构版30天免费试用(年费16800元,约合1640元/月) [3][4][5] - IT桔子为个人用户提供半月卡试用(价值54元/月),涵盖创投事件、产业链图谱等数据服务 [7][8] - 执中ZERONE数据库机构版30天免费试用(年费3万元,约合2500元/月),开放最高权限数据 [9] - Alpha Engine投研平台提供30天Ultra版本体验(价值约1650元),支持DeepResearch功能 [11] - 沉浸式翻译Pro版7天免费试用(价值约18元),支持浏览器插件形态的海外资讯翻译 [13][14] 社群会员权益体系 - 微信群组包含行业资讯分享、同城聚会、垂直领域专业群(消费/医疗/并购等)及姐妹群 [20] - 线上主题分享覆盖行业讨论、副业转型、经验分享等内容 [21] - 线下活动包括主要城市年度聚会及随机饭局,促进深度交流 [21] - 社群知识库整合历史讨论回放、研究报告库、群友名册、招聘内推等资源 [21] - 会员续费率高达90%,社群强调平等、理性交流,鼓励高质量分享与合作 [23][26] 免费AI生产力工具推荐 - 通用聊天工具:ChatGPT、腾讯元宝(集成公众号数据)、豆包(语音互动) [19] - 语音转写/会议纪要:通义听悟、飞书妙计(实时记录)、百度网盘(直接转存) [19] - 深度研究工具:秘塔、Kimi(新版本优化)、DeepSeek [19] - PPT生成工具:Kimi、天工、Genspark [19] 社群运营核心理念 - 社群以成员需求为中心构建平等网络,无层级结构,规则统一适用 [23] - 通过线上线下活动促成合作机会,已有案例包括求职对接、投资人匹配等 [24][25] - 运营方强调时间自由价值,社群形成跨城市人际网络,支持成员生活与工作平衡 [30] - 用户反馈显示社群对创业者、投资者具有持续学习价值,潜水成员亦能获得行业洞察 [31][32]
CEO可立即执行的10步AI行动方案
搜狐财经· 2025-07-13 13:12
人工智能在企业中的应用现状 - 当前许多企业引入AI系统但未能真正融入运营流程 形成"雷声大雨点小"现象 [1] - CEO需亲身参与AI实践才能推动企业转型和效率提升 [1] - 资深投资人任鑫提出10项具体行动帮助CEO建立AI"体感" [1] CEO实践AI的十项行动 基础体验层面 - 下载10个主流AI应用并置顶常用工具 培养使用习惯 [3] - 通过微信添加AI助手并置顶对话 实现零门槛日常交互 [5] - 购买ChatGPT/Claude/Gemini等海外AI账号 体验最先进技术 [6] 深度应用层面 - 进行3次DeepResearch深度研究 获取高质量分析报告 [8][10] - 创建基础AI Agent智能体 实现提示词复用和工作流程标准化 [11][13][16] - 利用AI实现知识过滤与深挖 提升学习效率20倍以上 [22][23] 管理赋能层面 - 录音全天会议对话交由AI分析 获取沟通优化建议 [23][26] - 撰写1500字母提示词 为AI提供全面个人背景信息 [27][29][30][32] - 3天内完成20条自媒体内容生产 验证AI规模化能力 [33][34][35] 组织推动层面 - 安排AI全流程工作日 测试各业务环节AI替代可能性 [36] - 举办"我用AI做的10件事"主题分享 推动组织AI文化 [38] AI技术发展特征 - 新一代AI具备自主研究能力 DeepResearch可替代50%情报工作 [10] - 提示词工程发生范式转变 从详细指令转向提供上下文 [27][29] - AI已能完成播客制作全流程 内容生产效率提升10倍 [34] 企业转型关键 - AI应用需突破"执行层"局限 聚焦战略决策支持 [35] - CEO需重新定位角色 从运营管理者转为愿景定义者 [35] - 组织AI能力建设应自上而下启动 自下而上扩散 [38][39]
CEO可立即执行的10步AI行动方案
混沌学园· 2025-07-11 15:53
人工智能在企业中的应用现状 - 当前许多企业引入AI系统但未能真正融入运营流程,导致效率提升有限[1] - CEO需亲身参与AI实践才能深刻理解其潜力与局限,推动企业转型[1] CEO实践AI的十项具体行动 基础体验 - 下载10个AI应用并置顶常用工具,培养使用习惯[5][6] - 在微信中置顶AI对话窗口(如腾讯DeepSeek),实现即时交互[8] - 购买海外AI账号(ChatGPT/Claude/Gemini),月费约20美元,体验国际一流AI能力[9][10][12] 深度应用 - 使用3次DeepResearch功能,获取深度分析报告(耗时15-20分钟/次)[13][14] - 创建AI Agent处理重复工作(如笔记优化、口语翻译),初期投入3小时可节省每周3小时[19][20][25][28][31] - 用AI完成学习闭环:信息过滤(2-5分钟筛选播客)+深度挖掘(扩展知识点应用场景)[32][33][35][36][37] 管理赋能 - 全天会议录音交由AI分析(推荐通义录音+Gemini),获取关系洞察与改进建议[41][42][44][45] - 撰写1500字母提示词(Custom Instructions),包含个人背景/目标/偏好,提升AI输出相关性[47][48][50][51][53] 战略实践 - 3天内产出20条自媒体内容:AI完成选题研究/内容生成/剪辑等50%工作量[54][55][56][58][59] - 安排AI全流程工作日,测试AI在战略会议/GEO项目研究/热成像领域分析等场景的应用[60][61][62][63][65][66] - 举办"我用AI做的10件事"分享会,推动组织级AI实践[67][68][69] 实施效果与行业启示 - 通过CEO示范可打破认知壁垒,将AI从"昂贵摆设"转化为运营助力[70][71] - 人机协同需从小事切入建立"体感",逐步实现智能化转型[70][71]
2025年,我在投行工作中使用AI的41个技巧分享
梧桐树下V· 2025-06-14 00:02
AI工具在职场应用的现状 - 约80%职场人在工作中使用AI工具 30%的00后每天依赖AI [2] - AI工具对各类工作场景渗透率达72% 覆盖日常办公到专业领域 [2] - 主流AI工具包括Deepseek 豆包 ChatGPT Gemini 即梦等 [2] AI工具使用痛点与需求 - 56.7%用户遇到生成内容不准确问题 近40%担忧数据安全 [2] - 行业急需系统化AI工具课程提升使用效率 [2] 投行AI应用课程内容架构 - 课程包含ChatGPT注册使用 模型原理解析 8大行业场景应用(金融/法律/自媒体等) [9] - 演示Midjourney绘图 Gamma生成PPT等10+工具实操 [9] - 覆盖AI辅助商业决策 管理难题解决等实战场景 [9] 提示词技术专项培训 - 课程构建"基础框架-复杂任务-场景实战"体系 [10] - 包含财经新闻爬取 上市公司财报整理等10+案例 [10] - 提供通义听悟 Kimi等工具的提示词模板 [10] 本地化部署解决方案 - 基于CherryStudio平台实现DeepSeek专属知识库搭建 [12] - 教授AI定制化检索技术 ChatGPT驱动法律助手部署方法 [12] 课程促销信息 - 限时5折活动价299.5元(原价599元) [4][14] - 包含10小时AI提效教学内容 [5][6][14]
微软CEO放弃听播客,AI技术又一“受害者”出现了
搜狐财经· 2025-05-20 21:01
AI对播客行业的冲击 - 微软CEO萨提亚・纳德拉表示已不再直接收听播客,而是通过Copilot AI助手处理播客文字稿并与AI讨论,直观展现了AI技术对播客媒介的冲击[1][3] - 播客是传统广播与互联网技术结合的产物,其诞生源于本世纪初传统广播衰落及数字媒体兴起,以数字音频形式通过互联网传播[3] - 2004年苹果发布iPodder被视为播客出现的标志,该软件允许用户下载互联网广播内容到iPod,奠定了播客订阅和下载的基础[5] AI对播客创作的影响 - 2023年播客行业曾乐观认为AI将赋能创作,2024年数据显示中文播客创作者每期节目平均净工作时长12.9小时,其中剪辑耗时4.5小时,AI音频工具如Descript、Auphonic可大幅简化制作流程[7] - AI数字人技术被应用于播客,如谷歌NotebookLM的"语音摘要"功能可生成情感表达接近真人的对话音频[7] - AIGC提升了播客行业产能,但也暴露了播客信息密度低的缺陷,相比视频和图文,播客成为互联网世界最低效的信息获取媒介[9] 播客行业的未来趋势 - 阿里通义听悟等工具可实现播客链接转写,使用户从"听播客"转向"看播客",进一步削弱传统播客形式[9] - 播客的核心竞争力在于"情绪价值",仅通过声音传递真情实感,这种私密性和伴随性(如通勤、家务场景)使其在短视频时代仍保有用户基础[10] - 知识分享类播客将因AI的信息处理优势而衰退,但情感陪伴类播客凭借AI难以模仿的人类情感表达可能形成差异化优势[12]
梧桐树下受邀参加四川律协活动:AI法律实战17个应用技巧、律师如何看懂财报
梧桐树下V· 2025-05-16 20:12
AI在法律服务中的应用 - 国内主流法律类AI工具分为功能类、通用类、法律类三类,包括通义法容、Metalaw、AlphaGPT、案牍AI、能猫AI、法智、得理法搜、法行宝等,涵盖法律问题解析、类案检索、合同审查等功能 [5][6] - 通用类AI工具如Kimi、腾讯元宝、DeepSeek、豆包等可辅助法律文书起草、法规检索、中英文翻译及PPT制作,其中Kimi单次生成文本达万字,DeepSeek推理能力对标ChatGPT [7][8] - 法律类AI工具如通义法睿、案牍AI依托专业数据库(如AlphaGPT整合1.8亿案例和530万+法规)提供精准服务,但需明确AI仅作为效率工具,无法替代律师 [9] 财务报表分析技巧 - 财务报表三大核心为资产负债表、利润表、现金流量表,其中资产负债率、流动比率等指标可评估企业偿债能力,利润表需关注非经常性损益等概念 [13] - 现金流量表通过经营活动、投资活动、筹资活动三部分分析企业现金流状况,结合案例可评估盈利效率与经营风险 [13] 行业活动与趋势 - 四川省律协联合举办"人工智能助力法律服务"沙龙,梧桐树下专家分享AI工具实操与财务分析技能,吸引资深律师参与探讨行业创新方向 [1][4][14] - 法律行业面临新人培训成本上升问题,梧桐课堂推出《律师助理入门培训》课程,由6家律所10名律师联合开发,强化实务能力 [15]
速递|阿里通义高管再现离职、前达摩院「十三罗汉」鄢志杰出走或为AI创业?
Z Finance· 2025-03-14 19:39
文章核心观点 - 阿里通义实验室语音团队负责人鄢志杰于2024年2月15日离职,此前通义大模型技术负责人周畅也已跳槽至字节跳动,鄢志杰离职或对达摩院语音技术布局和通义听悟产品迭代产生影响,行业推测其可能加入AI大模型创业潮,这对阿里和行业都有潜在影响 [1][2][3][10] 分组1:人员离职情况 - 阿里通义实验室语音团队负责人鄢志杰于2024年2月15日离职,原职级为P10 [1] - 此前字节跳动以4 - 2职级和八位数年薪挖走原阿里通义大模型技术负责人周畅,周畅2017年加入阿里,职级P9,去年7月离职8月加入字节跳动,字节4 - 2对标阿里P11,跳槽连升2级 [1] 分组2:鄢志杰个人背景 - 鄢志杰师承科大讯飞创始人之一王仁华,2008年获中科大语音实验室博士学位,奠定语音识别、合成等领域学术根基 [4] - 2008 - 2015年任职微软亚洲研究院语音组主管研究员,积累国际一线技术经验 [5] - 2015年加入阿里后,历任IDST智能语音交互团队总监、达摩院语音实验室负责人,主导技术成果在阿里系及微软产品中落地 [5] - 发表多篇顶会论文,拥有多项国际专利,长期担任语音领域顶级会议评审,技术能力获行业广泛认可 [6] 分组3:达摩院相关情况 - 2017年10月马云发起创办达摩院,分为机器智能、数据计算、机器人、金融科技、X实验室5大领域,机器智能是核心板块,下设语音等五大实验室,专注颠覆性人机交互技术研发 [7] - 通义实验室为达摩院技术商业化出口,通义听悟、通义千问等产品由其推动,语音团队是关键支撑 [8] - 鄢志杰领导的语音团队是达摩院机器智能语音实验室,2023年开始担任通义听悟技术负责人,聚焦核心技术,为阿里业务提供底层能力,技术护城河效应显著 [8] 分组4:离职影响及未来动向 - 鄢志杰离职正值国内大模型商业化竞争关键期,或对达摩院语音技术布局产生连锁影响,影响通义听悟产品后续迭代 [2][3] - 行业推测鄢志杰可能加入AI大模型创业潮,潜在方向为音视频生成式AI工具、垂直领域大模型应用或AI底层技术基础设施 [10] - 短期阿里语音技术领军人物空缺,可能延缓通义系列产品技术攻坚节奏,长期达摩院需加速内部人才梯队建设或引入外部专家维持领先地位 [10] - 达摩院核心人才流失可能倒逼其优化研发与业务协同模式提升技术转化效率,鄢志杰动向或影响行业资源分配格局 [11]