Workflow
Seek .(SKLTY)
icon
搜索文档
火山引擎总裁谭待:豆包大模型1.6综合成本只有DeepSeek R1的三分之一
犀牛财经· 2025-06-19 16:17
火山引擎AI产品更新 - 公司发布豆包大模型1.6 支持多模态理解和图形界面操作 能处理真实世界问题如酒店预定和购物小票整理 [2] - 视频生成模型Seedance 1.0 pro支持文字与图片输入 可生成1080P高品质多镜头视频 主体运动稳定性和画面自然度较高 [2] - 豆包1.6首创按输入长度区间定价 综合成本仅为豆包1.5深度思考模型或DeepSeek R1的三分之一 [2] 火山引擎AI云业务战略 - 公司推出Agent开发平台等AI云原生服务升级 展现AI技术实力和云业务决心 [2] - 公司强调技术研发和成本控制优势 为AI技术普及奠定基础 [2] 行业竞争与定价策略 - 公司明确表示不参与亏本换市场的价格战 以保证毛利为前提 [3] - 公司认为当前吸引用户的关键在于模型效果、稳定性和吞吐量 而非单纯低价 [3]
金融助力科创,涌现更多“DeepSeek时刻”
21世纪经济报道· 2025-06-19 01:48
科创板深化改革政策 - 中国证监会宣布推出"1+6"政策措施 更加精准服务技术突破大 商业前景广阔 研发投入高的优质科技企业 [1] - 设置科创板科创成长层 重启未盈利企业适用第五套上市标准 支持人工智能 商业航天 低空经济等前沿科技领域企业 [1] - 科创板上市公司已达588家 总市值6.80万亿元 成为新兴产业和未来产业聚集地 [1] 第五套上市标准的历史与现状 - 第五套标准是2019年设立科创板的创新制度 支持未盈利但高成长的科技企业 [1] - 2023年6月后采用第五套标准的IPO实质性暂停 2024年"科创板八条"明确支持硬科技企业 2025年已有4家未盈利企业IPO申请获受理 [2] - 资本市场提供从风险投资到上市融资的全链条服务 满足企业不同阶段需求 [2] 风险资本与科技企业发展 - 风险资本在科技产业发展中起重要作用 但2023~2024年美元风险资本流入减少 国内IPO收紧影响创投机构退出 [3] - 当前人工智能 生物科技 商业航天 低空经济等前沿技术蓬勃发展 需要构建适配的金融服务体系 [3] - 应吸引社保基金 保险资金 产业资本等参与私募股权投资 促进科技与产业创新融合 [3] 科技初创企业与资本市场 - 互联网革命期间成长的巨头多由美元资本投资并在境外上市 高盛中国十大民营上市公司中一半是互联网公司 [4] - 新一轮科技革命加速演进 科技初创企业遍地开花 资本市场制度包容性提升有助于金融资源助力科技创新 [4] - 资本市场应支持更多"硬科技"企业成为未来巨头 实现科技创新事业跃升 [4]
巧用DeepSeek构建多元资产配置框架!“最会用AI做研究的策略首席”王开教你”新套路”
华尔街见闻· 2025-06-18 20:42
DeepSeek大模型对金融行业的影响 - DeepSeek大模型具备动态自我修正能力,可基于现实情况优化历史数据权重,提高预测精度 [1] - 大模型的高度数据挖掘能力可挖掘更多关联性数据,打破传统线性思维,避免"黑箱"问题 [1] - 大模型强大的推理能力和复杂决策能力可提升策略整体智能化水平 [1] - 接入大模型后,国信证券模拟盘年化收益率上升0.27%,夏普比上升1.08倍 [3] 课程《DeepSeek重构策略投资新范式》内容 - 课程包含11个部分,涵盖多元化资产配置框架优化、风险平价策略复现、大盘择时与行业轮动等实战技巧 [3] - 重点探讨如何利用DeepSeek理解中美政策语义,包括中国货币财政政策取向和特朗普关税政策的行为逻辑 [11] - 分享DeepSeek在股债轮动效应分析、财务造假识别等实战应用中的关键技巧 [11] - 课程结合AI技术与投资策略深度融合,重塑全维度投资方法论 [15] 讲师背景与课程价值 - 讲师王开为国信证券首席策略分析师,硕士毕业于北京大学经济学院,发表专业期刊文章40余篇 [3][13] - 2025年连续发布十余篇DeepSeek在投研领域应用的深度报告,引发行业高度关注 [10][13] - 课程帮助学员掌握AI驱动的长期投资决策框架,构建全天候多维度AI投资模型 [16] - 课程包含互动问答环节,学员可与讲师面对面探讨核心问题 [19] 行业趋势与AI应用 - 自2022年ChatGPT问世后,AI以难以想象的速度改变金融行业,量化投资凭借算法模型优势异军突起 [10] - DeepSeek的推出为突破短期策略局限、构建前瞻性长期决策体系提供新机遇 [10] - 传统投研模式面临颠覆性变革,AI技术红利持续释放推动行业进入新周期 [10]
MiniMax追着DeepSeek打
经济观察网· 2025-06-18 19:32
模型技术规格 - MiniMax M1模型支持100万个token的上下文长度,是DeepSeek R1(12.8万Token)的8倍,仅次于谷歌Gemini 2.5 Pro [1] - MiniMax M1总参数量为4560亿,每个token激活459亿参数,而DeepSeek R1总参数量6710亿但每个token仅激活370亿参数 [1] - 采用混合专家(MoE)架构,与DeepSeek R1相同 [1] 性能与成本优势 - 生成10万个token时仅消耗25%的浮点运算,64000个token推理任务计算能力需求不到DeepSeek R1一半 [2] - 强化学习阶段仅使用512块H800 GPU,耗时3周,成本53.5万美元,比预期低一个数量级 [2] - 核心技术包括线性注意力机制(Lightning Attention)和强化学习算法CISPO,后者通过裁剪采样权重提升效率 [2] 商业化定价策略 - API服务采用分级计费:0-32k Token档输入0.8元/百万Token,输出8元/百万Token;32k-128k档输入1.2元/百万Token,输出16元/百万Token;128k-1M档输入2.4元/百万Token,输出24元/百万Token [3] - 前两档定价低于DeepSeek R1(输入3.95元/百万Token,输出15.4元/百万Token),第三档为独有超长文本服务 [3] 行业动态与开源计划 - 宣布未来5天内每天发布一项新产品或新技术 [1] - 模型代码和权重已在Hugging Face和GitHub开源,支持透明检查与本地部署 [3] - DeepSeek R1曾以500-600万美元GPU成本训练出对标OpenAI o1的模型,引发行业争议 [2]
科、创两板打通未盈利企业IPO之路, 一揽子新政精准服务“DeepSeek时刻”
21世纪经济报道· 2025-06-18 15:47
资本市场改革开放与科技创新 - 证监会宣布全面深化资本市场改革开放,推动科技创新和产业创新融合发展[1] - 资本市场通过风险共担、利益共享机制激发企业家精神和创新活力,服务传统产业升级、新兴产业壮大和未来产业培育[1] - 新一轮科技革命加速演进,科技创新从点状突破向系统集成推进[1] 科创板改革措施 - 推出"1+6"政策措施,包括设置科创成长层并重启未盈利企业适用第五套标准上市[3][4] - 6项改革措施涵盖引入专业机构投资者、试点IPO预先审阅、扩大第五套标准适用范围至人工智能等领域[4] - 优化再融资制度、战略投资者认定标准,增加投资产品和风险管理工具[4] 创业板改革 - 正式启用创业板第三套标准,支持优质未盈利创新企业上市[5] 股债联动与融资创新 - 强化股债联动优势,发展科创债并优化发行交易制度,推出科创债ETF[7] - 支持科技企业利用知识产权、数据资产开展资产证券化和REITs融资[7] 长期资本培育 - 推动社保基金、保险资金等参与私募股权投资,拓宽资金来源[8] - 优化基金份额转让、实物分配股票试点等退出机制[8] - 编制更多科技创新指数,开发科创主题公募基金产品引导中长期资金[8] 上市公司提质 - 完善全链条监管制度,落实"并购六条"和重组管理办法[8] - 研究优化股权激励程序,提升上市公司核心竞争力和回报能力[8] 资本市场对外开放 - 优化QFII制度准入管理和投资运作安排[9] - 拓展QFII可交易期货期权品种至100个,研究推出人民币外汇期货[9] - 推动液化天然气期货期权等产品上市,提升外资参与便利度[9]
MiniMax新模型对标DeepSeek;豆包上线AI播客;美参院通过稳定币法案
观察者网· 2025-06-18 08:49
AI模型与技术创新 - MiniMax开源推理模型MiniMax-M1,多项基准测试比肩DeepSeek-R1、Qwen3等开源模型,接近海外领先模型 [1] - MiniMax-M1训练仅用3周时间、512块H800 GPU,算力租赁成本仅53.47万美元,比预期少一个数量级 [1] - 豆包电脑版上线AI播客功能,用户上传PDF或网页链接可一键生成双人对话播客,秒级转化 [3][4] 数字人与AI应用 - 百度发布高说服力数字人四大突破:双数字人互动直播间、文心4.5T升级剧本模式、多模态高度融合、多任务复杂场景带货效果媲美真人 [4] - 亚马逊CEO表示生成式AI工具将改变工作方式,未来几年企业员工总数将减少 [6] - 苹果AI部门负责人约翰•詹南德雷亚或因项目推进缓慢遭降职,与高层理念分歧 [5] 资本市场与AI布局 - 软银出售T-Mobile股份筹资48亿美元,计划向OpenAI注资至多300亿美元,合作投入数千亿美元建设数据中心 [6] - 蓝思科技H股发行获中国证监会备案,拟发行不超过4.31亿股境外上市普通股 [6] - 兆芯集成科创板IPO获受理,拟募资41.69亿元投向处理器研发项目,研发人员占比75.97%,拥有1410项发明专利 [8] 稳定币与加密货币 - 美国参议院通过《天才法案》,首次批准主要加密货币立法,为稳定币建立监管框架 [7] - 京东计划在全球主要货币国家申请稳定币牌照,目标降低跨境支付成本90%,效率提升至10秒内 [7] 其他行业动态 - 名创优品创始人叶国富分享IP运营四步方法论:签约/孵化IP、开发产品、门店销售跑数据、数据好的IP推广 [9] - 上海成为2024年全球最具影响力电竞城市,中国女性电竞观众比例从2020年36%升至2024年71.8% [9]
DeepSeek R1-0528在WebDev竞技场与Claude Opus 4并列第一
快讯· 2025-06-18 07:00
大模型web开发竞技场排名 - DeepSeek R1-0528与谷歌Gemini 2 5 0605 Claude opus 4共同排名第一 [1] - 综合文本能力排名第6 编程领域排名第2 高难度提示排名第4 数学类排名第5 [1] - MIT开源许可 当前榜单最强开源模型 [1] 行业表现 - LMArena发布最新大模型web开发竞技场排名 显示行业顶尖水平竞争激烈 [1] - 开源模型DeepSeek R1-0528在多领域表现突出 体现开源技术竞争力 [1]
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿
虎嗅· 2025-06-17 20:15
模型发布与性能表现 - 月之暗面发布开源代码模型Kimi-Dev-72B,在SWE-bench Verified基准测试中取得60.4%的成绩,创开源模型新纪录,超越DeepSeek等竞争对手 [1] - Kimi-Dev-72B基于阿里巴巴Qwen团队的Qwen2.5-72B模型二次开发,明确标注Base model为Qwen/Qwen2.5-72B [2] - 模型创新主要体现在训练方法上,采用大规模强化学习技术,在Docker环境中自主修复真实代码仓库问题,确保生成代码符合实际开发标准 [3] 技术细节与许可协议 - Kimi-Dev-72B采用MIT协议发布,但其基础模型Qwen-2.5-72B需遵守《通义千问许可协议》,形成"delta权重"发布模式 [4][5] - Qwen2.5系列采用分级许可体系,72B模型包含商业限制条款,要求月活跃用户超1亿时需申请商业授权 [6][7] - Qwen团队后续澄清此为"历史遗留问题",Qwen3系列已全面转向Apache 2.0协议,取消商业限制 [8][10][12] 行业趋势与协作模式 - 训练70B参数级别模型成本达数百万美元,月之暗面选择基于Qwen2.5-72B进行二次开发,集中资源强化核心优势 [15] - 开源策略从限制性许可向完全开放转变,Apache 2.0协议促进商业友好、无限制使用和社区驱动 [17] - 基于优秀基础模型的"二次创新"兴起,大厂与创业公司在开源生态中形成新协作模式 [16][18] 模型应用与改进空间 - 尽管Kimi-Dev在基准测试中表现优异,实际应用中生成的代码有时需调试,对复杂需求理解仍有不足 [16] - 开源社区认为Kimi-Dev的开放权重和透明分享对社区有益,但模型消费者仍需遵守基础模型许可 [15]
MiniMax发布开源混合架构推理模型M1,M1所需的算力仅为DeepSeek R1的约30%
快讯· 2025-06-17 16:32
公司动态 - 上海AI独角兽MiniMax正式开源推理模型MiniMax-M1(M1)[1] - M1是全球首个开放权重的大规模混合注意力推理模型[1] - 模型采用混合门控专家架构(Mixture-of-Experts,MoE)与Lightning Attention结合技术[1] 技术突破 - M1在性能表现和推理效率方面实现显著突破[1] - 实测数据显示M1系列在长上下文理解、代码生成等生产力场景中超越多数闭源模型[1] - 与顶尖闭源系统相比仅存在微弱差距[1]
MiniMax开源首个推理模型,456B参数,性能超DeepSeek-R1,技术报告公开
36氪· 2025-06-17 16:15
智东西6月17日报道,今日凌晨,"大模型六小虎"之一MiniMax发布全球首个开源大规模混合架构的推理模型MiniMax-M1,并官宣了为期五天的连更计 划。 M1参数规模为4560亿,每个token激活459亿参数,原生支持100万上下文输入以及业内最长的8万token推理输出,输入长度与闭源模型谷歌Gemini 2.5 Pro 一致,是DeepSeek-R1的8倍。此外,研究人员训练了两个版本的MiniMax-M1模型,其思考预算分别为40k和80k。 MiniMax在标准基准测试集上的对比显示,在复杂的软件工程、工具使用和长上下文任务方面,MiniMax-M1优于DeepSeek-R1和Qwen3-235B等开源模 型。 其博客提到,在M1的整个强化学习阶段,研究人员使用512块H800训练了三周,租赁成本为53.74万美金(折合人民币约385.9万元),相比其一开始的成 本预期少了一个数量级。 M1在MiniMax APP和Web上支持不限量免费使用。API价格方面,第一档0-32k的输入长度时,输入0.8元/百万token, 输出8元/百万token;第二档32k- 128k的输入长度时,输入1.2 ...