豆包大模型1.6系列

搜索文档
字节打响Agent基建之战
华尔街见闻· 2025-06-16 20:56
字节跳动AI战略布局 - 公司正押注AI Agent作为新一代技术范式,试图通过换道超车实现技术突破 [1] - 火山引擎发布豆包大模型1.6系列,综合成本降低63%,支持256K上下文处理能力 [8][10] - 公司CEO梁汝波明确表态将长期投入AI技术研发,追求智能突破与产业应用结合 [1] AI Agent行业趋势 - AI Agent被视为继PC时代的Web、移动时代的APP后的下一代技术主体 [1][5] - IDC预测2025年将成为中国Agent落地元年,图像/视频类大模型调用量将显著增长 [6] - Agent技术将重构互联网入口格局,传统超级App可能面临边缘化风险 [3] 字节技术产品进展 - 豆包1.6系列包含三个版本,其中thinking模型在GPQA测评集达81.5分,达到国际第一梯队水平 [8][9] - 视频生成模型Seedance 1.0 pro价格低至3.67元/5秒视频,性能登顶全球榜单 [10] - 实时语音模型全量开放,AI云原生服务新增MCP、PromptPilot等工具链 [10][11] 云计算市场竞争格局 - 火山引擎在大模型调用量市场占比46.4%,但整体云计算市场尚未进入第一梯队 [4] - 公司通过价格战策略将大模型成本降至"厘时代",日均tokens调用量达16.4万亿 [13][14] - 2024年火山引擎收入增速三位数,目标规模超百亿并实现翻倍 [16] 行业生态与挑战 - 公司发起V-START加速器计划,扶持AI初创企业弥补B端生态短板 [17] - Agent落地面临基础设施成本、多平台验证等瓶颈 [17] - 竞争对手包括阿里/腾讯等全栈布局大厂及智谱AI等创新公司 [18]
一粒「扣子」,开启了Agent的全生命周期进化
机器之心· 2025-06-13 17:22
Agent行业发展趋势 - 2025年被视为Agent爆发元年,将显著改变PC、移动端人机交互范式并提升多任务自动执行能力[1] - 互联网大厂和AI初创企业将Agent作为竞争焦点,通过MCP、A2A等协议扩展能力边界[2] - 火山引擎Force 2025大会将Agent列为焦点,展示其重塑生产力的潜力[3][4] 扣子平台升级 - 扣子平台从单一开发平台进化为覆盖Agent全生命周期的四大组件体系[5] - 四大组件包括:低代码开发平台、Eino开源框架、效果调优罗盘、Agent协作空间[7] - 平台适应大模型时代多样化需求,提供智能化开发体验[5] 扣子开发平台功能 - 支持零代码开发并一键发布至飞书、微信等主流渠道[8] - 提供智能体IDE、应用IDE、插件模板和企业级安全四大赋能模块[9] - 预置上千插件和工作流模板,支持搭建知识库并连接火山方舟多模型[9] - 应用IDE支持拖拉拽GUI开发,企业级安全支持VPC私网连接[10] - 提供开箱即用的智能客服、文章转换等预置模板[12] Eino开源框架 - 采用Go语言编写,融合LangChain等社区框架优点[13] - 标准化Chat Template、文档解析等核心模块为可调用组件[14] - 支持可视化编排复杂任务流程,具备流处理能力和工具链[15] - 字节内部已有300+系统采用,GitHub获4.3k星标[16] - 抖音电商智能客服应用效率提升50%以上[16] 扣子罗盘全生命周期管理 - 贯穿开发、评测、观测、优化四阶段闭环[16] - 评测阶段支持Prompt/Agent量化评估,首家商业化支持轨迹评估[22] - 观测阶段实时分析token消耗、请求量等运行数据[19] - 支持自动上报数据,适配LongChain等框架数据接入[19] - 与火山方舟Prompt优化和模型微调能力贯通[23] 扣子空间协作平台 - 国内AI产品增速榜首,整合多领域专家Agent协同[25] - 支持市场分析、高考咨询等场景,通过MCP协议扩展能力[26] - 未来将上线更多行业专家Agent强化生态[26] 行业基础设施展望 - 扣子平台有望成为大模型时代Agent发展的基础支撑[27]
实测豆包1.6,最火玩法all in one!Seedance登顶视频生成榜一,豆包APP全量上线
量子位· 2025-06-12 15:11
海淀区高考模拟卷,豆包1.6文理科成绩全部突破700分,理科成绩更是比去年的豆包提升了154分。 | 海淀模拟全卷 | | | --- | --- | | 豆包大模型1.6: | 豆包-240615: | | 理科: 656+50=706 | 理科: 502+50=552 | | 文科:662+50=712 | 文科:572+50=622 | 视频领域, Seedance 1.0 Pro 亮相即登顶全球竞技场文生视频、图生视频双料第一。 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 不愧是字节,一发大模型,各模态榜单格局全部被重构! 最新豆包大模型1.6系列 ,"小版本"更新但推理、数学、多模态能力全部冲入 全球第一梯队 。 | Artificial Analysis Video Arena Leaderboard | | | | | | Artificial Analysis Video Arena Leaderboard | | | | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | | Text to Video | ...
腾讯研究院AI速递 20250612
腾讯研究院· 2025-06-11 22:31
OpenAI发布推理新模型o3-pro - OpenAI发布推理新模型o3-pro,以推理能力最强、速度最慢为卖点,输入价格20美元/百万tokens,输出80美元/百万tokens [1] - 在科学分析、写作、编程和数据分析领域,o3-pro比o3领先约14%,但在ARC-AGI-2测试中几乎无提升,成本却大幅增加 [1] - 用户测试显示o3-pro擅长复杂推理任务且环境感知能力强,但推理速度极慢,不适合简单问题,主要面向专业用户 [1] Mistral AI发布强推理模型Magistral - Mistral AI发布强推理模型Magistral,包括企业版Medium和开源版Small(24B参数),在AIME2024等多项测试中表现优异 [2] - Magistral通过自主研发的可扩展强化学习流水线实现多语言保真推理,适用于英法西德意阿俄中等语言 [2] - 利用Flash Answers技术,Magistral Medium实现比竞品快10倍的token吞吐量,定价策略更具竞争力(输入2美元/百万token,输出5美元/百万token) [2] Figma推出官方MCP服务 - Figma推出官方MCP服务,直接将设计文件中的变量、组件、布局等信息导入IDE,实现真正的所见即所得,比第三方MCP还原度更高 [3] - 部署简单,只需更新Figma客户端,启用Dev Mode MCP Server,并在支持MCP的编辑器中配置本地服务URL [3] - 使用时只需在Figma中复制设计链接到对话框,一轮交互即可生成高保真页面,无需复杂配置或API申请 [3] Krea AI推出首款原生模型Krea 1 - Krea AI推出首款原生模型Krea 1,专注解决AI图像"同质化"和"塑料感"问题,提供高美学控制力与专业级画质输出 [4] - 该模型支持风格参考和自定义训练,原生支持1.5K分辨率且可扩展至4K,提供实时编辑功能,适用于电商、插画、影视分镜等多种场景 [5] - Krea 1目前提供免费测试版,无需注册或付费即可使用,旨在加速数字艺术创作流程,降低制作成本,有望成为AI图像生成领域的重要参与者 [5] 字节推出豆包大模型1.6系列 - 字节推出豆包大模型1.6系列,包括Seed-1.6综合模型、1.6-thinking强化思考版和1.6-flash极速版,支持256k上下文和多模态推理 [6] - 豆包1.6具备增强推理能力,支持"边想边搜"和DeepResearch功能,多模态理解出色,可进行GUI操作,综合成本降低63% [6] - 同步发布的Seedance 1.0 pro视频生成模型支持多镜头切换和高品质1080P输出 [6] Tolan AI陪伴应用 - Tolan作为外星AI陪伴应用获500万下载量及400万美元ARR,独特之处在于选择"外星人"形象而非模拟人类,强调"非浪漫型、非工具性"陪伴 [7] - 产品设计融合陪伴与游戏化元素,用户可定制外星人伴侣外观,并通过互动发展独特星球环境,形成情感连接,团队特意避免让AI回应过于像人类 [7] - 与国内猫箱等AI陪伴应用相比,Tolan专注普遍"孤独感"而非"恋爱幻想",通过限制聊天时间等机制追求健康使用节奏,因此在用户留存方面表现更好 [7] 理想汽车设立机器人部门 - 理想汽车新设立"空间机器人"和"穿戴机器人"两个二级部门,均隶属于产品部,分别由早期员工帅一帆和张文博负责 [8] - 空间机器人部门与理想"智能空间"战略相关,旨在将车内乘员舱打造为"第三空间",提升车内智能化体验,这已成为公司三大战略之一 [8] - 穿戴机器人部门可能专注于智能眼镜等穿戴设备开发,目标是将"理想同学"AI体验扩展至车机、手机、电脑及眼镜等多终端,实现全场景一致性体验 [8] Figure机器人公司战略 - Figure CEO认为人形机器人是"赢者通吃"行业,目标不是销售硬件而是提供完整"劳动力"系统,强调完全自主运行 [9] - 公司已建立年产1.2万台产线,产品成本较初代降93%,未来四年计划交付10万台,同时面向商业和家庭市场 [9] - Figure采用"共享神经网络"让所有机器人共享学习成果,资金充足,相信最终胜出者将是"最聪明、最便宜"的参与者 [9] Altman未来技术预测 - Altman博文称人类已进入AI加速发展阶段,预测2025年AI胜任认知工作,2027年机器人执行物理任务,2030年人类生产力大幅提升 [10] - 他认为奇点将逐步渗透,AI加速自身研发是最大突破,能提升科学家2-3倍生产力,智能成本终将接近电力成本 [10] - 超级智能发展路径应先解决对齐问题,再使其廉价易得且不过度集中,"廉价到无需计量的智能"将在2030年触手可及 [10] OpenAI Codex团队观点 - OpenAI Codex团队引领软件开发范式从同步"结对编程"转向异步"任务委派",构建能在独立环境中完成整个开发任务的AI代理 [11] - 新版Codex经强化学习微调,注重专业软件工程品质,团队预测开发者角色将从编码者转为审查者和规划者 [11] - 团队认为2025年将是"智能体元年",未来交互界面将融合同步与异步体验,可能演变为类"TikTok"信息流,供开发者快速审批AI工作成果 [11]