CoCo

搜索文档
100万token!全球首个混合架构模型M1开源了!近期AI新鲜事还有这些……
红杉汇· 2025-06-25 19:06
MiniMax-M1模型技术突破 - 开源全球首个混合架构模型M1 支持100万token输入和8万token输出 成为全球最长上下文窗口模型 [3] - 采用Lightning Attention混合注意力架构 通过分块技术降低计算复杂度 生成10万token时仅需DeepSeek R1 25%的算力 [5][6] - 在多项基准测试中表现优异 在工具使用和软件工程等复杂任务上超越OpenAI o3和Claude 4 Opus [4] - 训练成本仅380万元 耗时3周完成 性价比显著 [3] 企业级AI应用案例 - 微软发布700+智能体应用案例 覆盖金融/医疗/教育等各行业 埃森哲智能体降低客户销售未清天数20% 毕马威ComplyAI改善合规控制描述70% [10][12] - 智谱AI推出企业级助手CoCo 具备记忆能力 可集成企业知识库 支持全流程任务规划与修改 实现千人千面服务 [14] - XP使用AI节省9000小时 提高审计效率30% Architecht平台将原型制作时间从2天缩短至25分钟 [15] 行业技术进展 - OpenAI推出o3-pro模型 在AIME 2024数学测试超越Gemini 2.5 Pro 在GPQA Diamond科学测试击败Claude 4 Opus [17] - 智源开源Video-XL-2视频理解模型 支持万帧视频处理 编码2048帧仅需12秒 在多项评测中领先开源模型 [21][22][23] - 谷歌发布手机本地AI运行器Google AI Edge Gallery 可离线运行Hugging Face模型 支持图像生成/代码编辑等功能 [27]
如何用AI Agent让企业效率翻倍?
搜狐财经· 2025-06-10 00:35
AI行业趋势 - 2025年红杉资本AI峰会达成共识:下一轮AI竞争核心转向为用户创造实际收益而非工具本身,Agent技术重要性凸显[1] - 硅谷大厂加速布局AI Agent领域,微软CEO宣布进入"AI Agent时代",OpenAI推出面向开发者的Codex Agent并称其为编程史最大变革[1] - 国内AI Agent面临实用性困境,被用户比喻为"AI实习生",难以满足企业数字化转型深水区的场景细化需求[1] 智谱CoCo产品特性 - 定位企业级AI Agent,以"懂你的企业,能干能交付"为核心理念,接入企业工作流/知识库/数据库提供定制化服务[2] - 独创记忆机制可记住员工职能与工作重点,通过一键编排工作流将重复性任务封装为MCP小应用[2] - 实现从单点应答到全链路交付的突破,产品价值体现在能力×信任×频率三维度的平衡[3] 小红书监测案例表现 - 在月活3亿的小红书平台监测任务中,10分钟内生成包含数据比对/执行方案设计/合规考量的完整解决方案[4] - 输出两种可行性方案:自建监测系统与第三方监测,包含功能模块设计/技术架构/合规要点等全要素[8][9][10] - 系统采用分层架构(数据采集/处理/分析/预警/安全五层),支持多关键词监控/情感分析/合规校验等12项核心功能[14][16] 工作流封装功能 - 「一键封装工作流为MCP」功能实现零代码开发,测试中成功将Meta AI新闻自动生成微信/微博/知乎/LinkedIn多平台适配文案[21][23] - 该功能可解决内容创作公司多平台分发时的二次创作痛点,已完成合规性检查的直接可用结果交付[23] 产品差异化价值 - 突破传统AI工具单点应答局限,实现需求输入-流程规划-结果交付的全链路自动化,使AI从辅助工具升级为责任主体[26] - 具备"核心引擎+场景插件"生态属性,可与企业OA/CRM/ERP系统打通,孵化报销审批/供应链优化等专属智能体[27] - 记忆机制实现从"用户做了什么"到"用户是谁"的认知转变,能按职能定制AI日报并给出差异化视角[18] 行业影响 - 推动AI从技术概念期向价值兑现期跃迁,重新定义产业端实用价值坐标,降低企业AI应用门槛实现平权竞争[26][27] - 作为数字化转型"智能中台",帮助大型企业打破数据孤岛,避免流程僵化,加速传统业务与AI融合[28]
腾讯研究院AI速递 20250610
腾讯研究院· 2025-06-09 22:06
ChatGPT 4o更新 - ChatGPT 4o在回答复杂问题前会先停顿几秒"思考",页面显示"Thought for a few seconds",然后再决定搜索或直接回答 [1] - 这种"先理解后搜索"的能力提高了回答准确性,但用户需要等待更长时间,移动端触发率更高 [1] - OpenAI已将这种思考能力扩展到GPT-4.1和GPT-4.5等非推理模型中 [1] 谷歌Veo 3更新 - 谷歌Veo 3模型新增"360°"关键词功能,能生成3D环绕效果视频,但在物理真实性上仍有缺陷 [2] - 推出Veo 3-Fast版本,支持文生视频和自动生成配音,速度更快且价格降低80% [2] - Fast版本生成8秒720P视频仅需20 credits(比标准版便宜5倍),但面部细节和光照效果略有下降 [2] 智谱AI发布CoCo - 智谱AI推出CoCo企业自主Agent,具备"记忆能力"的AI助手,能记住员工互动、根据部门职能提供差异化服务 [3] - CoCo可集成企业知识库、数据库和系统工具,通过MCP平台实现与企业原有工作流的整合 [3] - 提供完整私有化部署方案确保数据安全,支持MCP小应用一键自动化工作流,已开放申请通道 [3] MiniCPM 4.0发布 - MiniCPM 4.0模型只关注重要内容,像人类阅读一样选择性处理信息,让手机等设备上的AI速度猛增220倍 [4] - 创新的"草稿+验证"机制让模型生成更快,同时用极致压缩技术将模型体积缩小90%但保持高性能 [5] - 自研专用软件系统和"小模型先试错"策略,让小模型用较小训练量就能超越同类产品,支持超长文本处理 [5] 小红书开源文本大模型 - 小红书hi lab开源dots.llm1大模型,采用MoE架构,总参数142B但仅激活14B,经11.2T高质量数据训练后性能可媲美Qwen2.5-72B [6] - 团队首次开源完整训练过程中每1T token的检查点,包括Pretrain与Instruct阶段共14个checkpoint [6] - 通过优化数据处理流程、AlltoAll通信重叠和Grouped GEMM实现,大幅提升训练效率,使用更少算力达到同等性能水平 [6] 即梦图片3.0 - 即梦智能参考3.0可用于海报重绘设计,上传图片后保持较好一致性,适合制作各类海报 [7] - 设计海报提示词结构公式:产品描述+布局+色调+背景+风格定位+情感氛围+标题设置+字体特色 [7] - 系统功能包括商业促销海报制作、活动展览海报设计及效果转换,可通过局部重绘精准修改文字内容 [7] DreamTech发布Direct 3D-S2 - Direct3D-S2 3D大模型刷新HuggingFace 3D建模趋势榜,被全球开发者广泛关注 [8] - 模型仅用8块GPU训练,效果超越闭源商用模型,训练效率提升近20倍,token吞吐量提高64倍 [8] - 核心创新为空间稀疏注意力机制(SSA),支持超大规模体素生成,已全面开源且采用MIT协议允许商业使用 [8] Meta投资Scale AI - Meta正与Scale AI洽谈超过100亿美元投资,将成为Meta最大外部AI投资和私企最大融资之一 [9][10] - Scale AI成立于2016年,由华裔Alex Wang和Lucy Guo创立,2024年5月获10亿美元F轮融资,估值138亿美元 [10] - 公司主要提供数据标注服务,包括图像视频标注、3D点云标注和NLP处理,客户包括OpenAI、微软、谷歌等科技巨头 [10] 荣耀进军机器人 - 荣耀进军机器人领域,首秀机器人奔跑速度达4m/s打破行业记录,展示其AI技术实力 [11] - 荣耀已发布阿尔法战略(HONOR ALPHA PLAN),将从智能手机制造商向AI终端生态公司转型,五年投资100亿美元 [11] - 荣耀组织架构已调整,成立AI&软件业务部、新产业孵化部,推进AI能力与产品线深度融合,通过HONOR AI Connect平台开放生态能力 [11] Ilya Sutskever演讲 - Ilya Sutskever在多伦多大学毕业典礼演讲中表示,AI最终将能完成人类所有工作,不是部分而是全部 [12] - 他解释称,人类大脑是生物计算机,数字计算机(AI)最终也能做到同样的事情,这将带来人类有史以来最大的挑战 [12] - Ilya呼吁人们密切关注AI发展,培养对AI能力的直觉,为即将到来的深刻变革做好准备 [12]