Workflow
Seek .(SKLTY)
icon
搜索文档
陈天桥联手清华教授代季峰首发最强开源AI模型项目,全力打造下一个DeepSeek
钛媒体APP· 2025-08-11 07:52
核心观点 - 清华大学电子工程系副教授代季峰与陈天桥联手筹备一家致力于打造通用人工智能(AGI)的新公司,目标是成为下一个OpenAI或DeepSeek [2][8] - MiroMind团队发布了首个开源深度研究项目Miro ODR,其V0.1版本GAIA测试达82.4分,超越OpenAI的DeepResearch等模型,成为当前开源最强Deep Research模型 [3][4] - 公司使命是打造具备自我意识的数字生命体,与社区共同进化以实现安全、有益的AGI [12] 技术成果 - Miro ODR包含四个子项目:MiroFlow(Agent框架)、MiroThinker(深度思考模型)、MiroVerse(数据开源项目)、MiroTrain(训练基础设施),全部开源且可复现 [10] - MiroMind-M1开源推理语言模型基于70亿参数的阿里Qwen-2.5 RLM,在AIME24、AIME25和MATH500测试中超越DeepSeek-R1蒸馏版和小米的MiMo-7B-Base [9][11] - 项目采用监督式微调(SFT)在71.9万个问题集上训练,并通过可验证奖励的强化学习(RLVR)在6.2万个示例上优化 [8] 团队背景 - 代季峰是清华AI专家,曾在微软亚洲研究院和商汤科技担任要职,发表80余篇论文,总引用超6万次 [7] - 其研发的Deformable ConvNets系列被纳入多所世界一流大学课程,R-FCN被评为"三大目标检测元模型之一" [7] - 开源多模态基础模型InternVL在十多个重要指标上与GPT、Gemini相当,累计下载超500万次 [8] 战略布局 - 公司研发重点包括AI商业决策智能化、突破算法茧房的内容分发、面向老龄化和青年发展的AI服务 [12] - 陈天桥承诺盛大内部孵化的所有AI企业的一半利润将分给团队 [5] - 陈天桥加速布局AI和脑科学赛道,投资了脑机接口企业Synchron并支持多项脑科学研究 [13][16] 行业影响 - Miro ODR开放了深度研究的各个阶段,包括模型、数据、训练流程等,计划每月更新一次 [5][10] - 项目提出CAMPO框架(上下文感知的多阶段策略优化),证明7B模型可用更少token获得比Skywork更好的性能 [9] - 陈天桥呼吁中国科创投资人不要将脑机接口仅视为赚钱风口,强调需要"耐心资本"支持长期创新 [16][17]
欧洲版DeepSeek,估值700亿
虎嗅· 2025-08-10 16:16
公司发展历程 - Mistral AI正在进行新一轮10亿美元融资 估值将达到100亿美元(约合人民币700亿元) 成立两年估值翻了近50倍 [2] - 公司成立一个月即凭借7页PPT融资1亿美元 刷新欧洲种子轮纪录 [3] - 2023年9月发布首个开源大模型Mistral 7B 仅73亿参数规模却在多个基准测试优于Llama2 [7] - 2023年底完成4.15亿美元A轮融资 估值20亿美元 跻身独角兽 [22][23] - 2024年2月获微软1630万美元投资 6月完成6.4亿美元B轮融资 估值飙升至60亿美元 [24] - 2024年5月与MGX等成立合资企业 建立欧洲最大人工智能园区 [28] 创始团队背景 - 三位90后创始人Arthur Mensch、Guillaume Lample和Timothée Lacroix均来自巴黎顶尖学府 曾在谷歌DeepMind和Meta人工智能实验室任职 [5] - 创始人26岁获得机器学习博士学位 是Llama架构核心奠基人 [5] - 创始人表示"目标是未来10年处于领先地位" [8] 商业模式与竞争格局 - 坚持开源策略 与封闭的OpenAI和Anthropic形成差异化 [8] - 2024年推出聊天机器人Le Chat和推理模型Magistral 试图对标DeepSeek [12] - Le Chat曾登顶法国iOS下载榜首 但国际市场表现平平 [13] - 年收入有望首次超过1亿美元 最近一年增长数倍 [14] - 开源领域竞争加剧 OpenAI时隔六年发布新开源模型 腾讯、阿里等密集推出新一代开源大模型 [11] 行业趋势 - AI赛道涌现大批90后创业者 Perplexity估值180亿美元 Genesis AI完成1.05亿美元种子轮融资 [30][31] - Anysphere完成9亿美元融资 估值90亿美元 创始团队来自麻省理工 [32] - 国内90后创业者如宇树科技王兴兴、月之暗面杨植麟等崭露头角 [33] - 创始人认为AI将像水电般普及 对未来国家GDP产生两位数影响 [28]
GPT-5登场!国产大模型“扎堆上新”,DeepSeek得加速了
华夏时报· 2025-08-08 13:04
GPT-5发布 - OpenAI正式推出GPT-5,CEO山姆·奥特曼称其为迈向通用人工智能(AGI)的重要一步 [2] - GPT-5在编程能力、创意写作和健康咨询三个关键领域实现显著提升,能够创建网站、应用程序和游戏,处理复杂写作任务,解析医疗结果 [3] - GPT-5共有四款模型:GPT-5、GPT-5 mini、GPT-5 nano和GPT-5 chat,面向普通消费者免费开放但有额度限制,Plus会员每月20美元,Pro会员每月200美元 [5] - 开发者端提供三款模型的API服务,价格比GPT-4更低,输入输出价格分别为每百万token 1.25美元/10美元、0.25美元/2美元、0.05美元/0.4美元 [6] 行业竞争格局 - GPT-5上线后迅速屠榜大模型竞技场LMArena,在所有细分类目中位列第一 [3] - ChatGPT今年7月访问量增速6.14%,月活用户近7亿,月访问量59.1亿,预计9月超过Instagram成为全球第四大网站 [7] - 国内大模型厂商竞争激烈,月之暗面发布Kimi K2,阶跃星辰推出Step-3,阿里发布通义千问3,智谱带来GLM-4.5 [9] DeepSeek现状与挑战 - DeepSeek访问量连续4个月下降,平均每月降低9.63%,6月访问量3.8亿,7月月活用户下降11.87%至8293万 [8] - 字节豆包和腾讯元宝月活用户分别达到1.32亿和4473万,持续增长 [8] - DeepSeek R2模型迟迟未推出,业内期待但面临压力,部分观点认为其已落后OpenAI两步(GPT-4.5和GPT-5) [10] - 创始人梁文锋被指在憋大招,行业认为大模型竞争呈螺旋式上升状态,没有绝对领先者 [9][10]
技术应用 | DeepSeek赋能经营洞察,助力专业决策——北银金科小京财智建设实践
搜狐财经· 2025-08-08 13:00
行业趋势 - 市场竞争加剧促使企业需要快速处理财务信息、敏锐洞察运营状况、精准支持决策制定 [1] - 传统财务分析手段受限于数据处理时效性、分析维度单一性和人工操作繁琐性 [1] - 大模型技术发展显著提升人工智能在数据处理、模式识别、自然语言处理等方面的能力 [1] - 银行业作为数字化转型先行者积极应用人工智能技术探索日常办公、客户服务、运营管理等场景 [1] 技术发展 - DeepSeek-R1推理大模型具备强大自然语言处理能力、跨领域学习能力和思维推理能力 [2] - 大模型技术推动财务分析智能化、高效化和精准化开辟崭新维度 [2] - AI大模型技术趋于通用化与专用化垂直领域成为企业落地主战场 [13] 产品建设 - 小京财智通过私有化部署DeepSeek-R1结合高质量知识库和提示词工程打造金融垂直领域财务分析工具 [2] - 产品融合多方数据源建立专家知识库和预处理算法集构建财报知识网络实现知识融合和深度思考能力 [3] - 平台采用"检索+图谱"融合方案增强系统准确性和时效性迭代优化提示工程提升大模型行为可控性 [4] 系统架构 - 协同引擎作为核心调度模块实现任务自动化调度执行和信息无缝对接 [5] - 知识库覆盖11个金融垂直子领域提供高质量金融知识支持 [5] - 提示工程为应用场景量身定制提示词指导模型输出精准内容 [5] - 模型工厂微调大模型提升金融领域专业能力实现复杂场景精准处理 [5] 核心功能 - 智能财报分析支持秒级分析42家A股上市银行近10年财报数据实现指标、增速、排名及对比分析 [6] - 智能报告生成支持一键生成A股上市银行年报、半年报、季度报分析报告提升智能化水平 [6] - 智能体应用包含波士顿矩阵助手、SWOT分析助手等业务、战略、管理、办公智能体支持用户自助创建 [8] 应用成效 - 策略复盘助手帮助业务人员在1分钟内掌握关键指标节省超过90%时间准确率提升30%以上 [12] - 智能尽调助手提升报告撰写自动化水平节约30%报告撰写时间 [12] - 产品实现财报分析专业化、报告撰写高效化和决策辅助精准化 [11] 未来展望 - 小京财智将依托智能化大模型评测体系引入先进模型能力深入业务场景释放大模型潜能 [13] - 产品通过自动识别、提取、分析财报关键信息为企业经营决策提供全面支持展现大模型数据分析潜力 [13]
DeepSeek、Kimi 首轮淘汰,马斯克 Grok 4 杀进决赛,首届全球 AI 对抗赛连爆冷门
36氪· 2025-08-07 16:27
比赛概况 - 由Google旗下Kaggle平台举办的首届AI国际象棋锦标赛 为期三天 聚集八款全球主流语言模型 采用"Chess-Text Harness"规则体系测试纯粹推理能力[3][8][9] - 比赛结果:OpenAI的o3以4:0横扫o4 mini晋级决赛 xAI的Grok 4通过加时赛以3:2险胜Gemini 2.5 Pro 两者将在决赛相遇[1][8][22] - 月之暗面Kimi k2和DeepSeek R1在首轮均以0:4被淘汰 未进入四强 Kimi赛前公开质疑匹配机制称其推理版本尚未发布[1][5][9] 参赛模型 - 八款参赛模型包括:Anthropic的Claude Opus 4 DeepSeek的DeepSeek-R1 Google的Gemini 2.5 Pro和Gemini 2.5 Flash 月之暗面的Kimi k2 OpenAI的o3和o4-mini xAI的Grok 4[3] - 首轮比赛结果:Gemini 2.5 Pro o4-mini Grok 4和o3均以4:0战绩分别淘汰Claude Opus 4 DeepSeek R1 Gemini 2.5 Flash和Kimi k2[9] 技术规则 - 比赛禁止模型调用任何工具(如Stockfish引擎) 系统不提供合法走法列表 模型需自主判断[9] - 非法走法给予最多3次重试机会 四次尝试失败直接判负 每步走法有60分钟超时限制[9] - 模型仅通过文本符号理解棋盘状态 无法依赖图像识别 重点测试战略规划 推理 记忆和适应能力[9] 赛事细节 - 半决赛中o3展现出压倒性实力 识破o4 mini设置的罕见将死陷阱并用一步棋化解威胁 通过精准战术组合获胜[11][12] - Grok 4与Gemini 2.5 Pro的五局激战:首局Grok 4犯下低级错误白送主教 第二局开局白送骑士但中后盘逆转取胜 第三局展现Stockfish水准通过精妙战术组合获胜[13][15][17] - 决胜局采用"Armageddon"赛制:执黑的Grok 4只需和棋即可获胜 Grok在多吃皇后情况下因重复移动导致和棋 最终凭借规则晋级决赛[19][22] 行业动态 - Kaggle推出全新Game Arena基准测试平台 支持模型间实时对决与回放 未来将加入更多游戏和模型[8] - 马斯克在社交媒体评论xAI"在国际象棋上几乎没花什么心思" 映射其与奥特曼的竞争关系[1][22]
外媒:OpenAI发布开源模型与DeepSeek展开竞争
中国新闻网· 2025-08-07 16:09
OpenAI发布开源模型 - OpenAI发布两款"开放权重"模型GPT-oss-120b和GPT-oss-20b 支持文本生成但不支持图像或视频 [1] - 这是公司自2019年推出GPT-2以来首次发布开源模型 [1] - 首席执行官奥尔特曼承认此前在开源战略上"站在了历史的错误一边" [1] 行业竞争格局 - 英国《金融时报》认为OpenAI此举旨在与中国公司DeepSeek展开竞争 [1] - 深度求索(DeepSeek)今年1月推出开源大模型DeepSeek-R1 [1] - 中国人工智能系统如阿里巴巴的通义千问和月之暗面的Kimi在开源领域表现突出 [1] 技术发展趋势 - 中国在开源人工智能技术领域已超越美国 [1] - 开源模型激发了全球开发者的巨大需求 [1]
首届大模型象棋争霸赛:Grok 4与o3挺进决赛,DeepSeek、Kimi落败
36氪· 2025-08-07 14:16
比赛概述 - Google旗下Kaggle平台主办的"棋局竞技场"AI国际象棋表演赛半决赛中,Grok 4和o3分别击败Gemini 2.5 Pro和o4-mini,晋级决赛 [1] - 比赛为期三天,参赛者为八个大型语言模型(LLM),包括Grok 4(xAI)、Gemini 2.5 Pro(谷歌)、o4-mini(OpenAI)、o3(OpenAI)、Claude 4 Opus(Anthropic)、Gemini 2.5 Flash(谷歌)、DeepSeek R1(DeepSeek)和Kimi k2(月之暗面)[1] - 比赛采用单败淘汰制,规则聚焦AI对棋局的理解力与问题解决能力,不比算力 [1] 首日比赛结果 - 首日四场比赛均以"4-0"比分结束,Gemini 2.5 Pro、o4-mini、Grok 4和o3晋级半决赛 [3][11] - Gemini 2.5 Pro以4-0完胜Claude 4 Opus,展现稳健的棋盘掌控力 [12] - o4-mini以4-0击败DeepSeek R1,DeepSeek R1因连续失误落败 [14] - Grok 4以4-0击败Gemini 2.5 Flash,表现引发xAI创始人埃隆·马斯克在X平台上的热议 [19] - o3以4-0战胜Kimi k2,Kimi k2因连续四次无法作出合法移动而连输四局 [22] 半决赛表现 - 半决赛中,Grok 4与Gemini 2.5 Pro的对决以2-2平局进入加赛,Grok 4最终因平局胜权晋级 [8] - o3以4-0完胜其轻量版o4-mini,展现压倒性优势,并在第三局中走出两招妙棋 [5] - Chess.com指出此次赛事暴露出AI模型整体缺乏语境理解,难以执行基本战术序列等问题 [22] 决赛预告 - 决赛将于美国东部时间8月7日13时(北京时间8月8日1时)举行,由xAI的Grok 4对阵OpenAI的o3 [22] - Gemini 2.5 Pro与o4-mini将争夺三、四名 [22]
爆冷,首届大模型争霸,Grok 4下出“神之一手”?DeepSeek、Kimi惨遭淘汰
36氪· 2025-08-07 09:16
AI国际象棋对抗?这次玩真的!谷歌Kaggle推出首届全球AI象棋争霸赛,八款顶级语言模型正面对抗,胜负只在一步之间! 国际象棋全球AI争霸赛来了! 首战即放狠招:让全球八款最强语言模型,国际象棋正面对抗: 闭源的大模型:Gemini 2.5 Pro、OpenAI o4-mini、Grok 4、OpenAI o3、Claude 4 Opus、Gemini 2.5 Flash; 开源的大模型:DeepSeek R1和Kimi K2 Instruct。 首战落幕 今日凌晨1点,这场大赛正式打响了8进4淘汰战: Gemini 2.5 Pro、o4-mini、Grok 4、和o3,以4-0的碾压式战绩横扫对手,进入半决赛。 而Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash和Kimi K2没能撑过中盘,就已纷纷崩溃退场。 第二天的半决赛,OpenAI的o3-mini和o3将「自相残杀」,而Gemini 2.5 Pro和Grok 4则狭路相逢 整场赛事由谷歌旗下的Kaggle举办。为此,他们专为通用大模型打造了竞技平台——「Game Arena」。 谷歌表示游戏是评估模型与智能体的理 ...
战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2被喊冤
36氪· 2025-08-06 16:41
比赛概况 - 谷歌举办首届Kaggle AI国际象棋竞赛 旨在测试AI的涌现能力 比赛时间为8月5日至8月7日每天10:30(太平洋时间)并全程直播 [5][6] - 参赛模型包括OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2 Instruct、Gemini 2.5 Pro和2.5 Flash、Claude Opus 4、Grok 4共8个顶级模型 [6] - 直播特邀国际象棋特技大师中村光担任讲解 其为全美冠军及GM头衔持有者 现任EWC国际象棋锦标赛季军 [7] 赛程安排 - 比赛周为8月4日至10日 其中周二至周四为AI展览锦标赛 具体时段为EDT时间10:30 AM或1:00 PM(对应印度时间9:00 PM或11:30 PM) [9] - 首日比赛后 Gemini 2.5 Pro、Grok 4、ChatGPT的o4-mini和o3晋级半决赛 [9][12] 首日赛果分析 - 所有八分之一决赛均以4-0的完美比分结束 体现明显实力差距 [12] - Grok 4表现最佳 被网友评价为"在战术策略和速度上超越所有其他模型" 其与Gemini 2.5 Flash对局中展现GM级水平 轻松获胜 [13][14] - OpenAI o4-mini战胜DeepSeek R1 虽双方均有失误 但o4-mini率先抓住R1的推理错误及棋盘局势误判 [16] - Gemini 2.5 Pro与Claude Opus 4的对局被评为当日最佳 两者展示高水平棋艺 Gemini Pro展现强大战术视野但分析冗长 Claude则出现失误 [18] - Kimi K2 Instruct因反复走非法棋步被o3弃权击败 成为最快结束的四分之一决赛 有观点认为Kimi作为非推理模型需长思考才能发挥性能 [20] 模型预期变化 - 赛前网友投票显示Gemini 2.5 Pro以22%支持率最被看好 o4-mini以3%支持率紧随其后 [28][31] - 首日后Grok 4支持率呈现压倒性优势 远超其他模型 [30] 比赛意义 - 国际象棋因规则明确但复杂度高(10^120种可能局面)成为测试AI决策能力的理想场景 重点考察涌现能力而非暴力计算 [21][23] - 网友普遍认为国际象棋是可靠评估AI能力的方式 其反映模型的一致性泛化能力而非领域特定训练 [24]
DeepSeek终于把OpenAI逼急了
凤凰网· 2025-08-06 16:21
摘要: 中国开源模型的爆发式发展很难不触动OpenAI的神经,以及硅谷的神经。 北京时间8月6日凌晨,OpenAI突然发布了其首个开源语言模型 GPT-OSS,在全球科技圈投下了一枚炸弹。 具体来看,gpt-oss-120b采用了MoE架构,拥有1170亿参数,其中激活参数约51亿,仅需在单张80GB的GPU上就能运行,其性能与闭源的o4-mini十分接 近。 而gpt-oss-20b同样基于MoE架构,有210亿参数,激活参数约36亿,可在配备16GB内存的设备上流畅运行,性能表现接近o3-mini。 其实,回顾过去几年,OpenAI一直在走"闭源+收费"的路线。无论是GPT-4还是GPT-4o,核心模型始终没有开放。业界也一度认为,"最强模型永远不会开 源"。 但GPT-OSS的出现,打破了这一共识。 据OpenAI官方称,GPT-OSS是一款"小型但高效"的语言模型,训练数据涵盖多语种、多领域。 更重要的是,OpenAI声称该模型"可以免费用于商业用途",这对中国乃至全球的AI初创企业来说,简直是"天降神兵"。 准备向国产模型宣战? 作为ChatGPT世代的开创者,OpenAI此举意味着一个巨大的转向: ...