Workflow
开源模型
icon
搜索文档
网易有道开源首个专注数学教育的模型
快讯· 2025-06-23 17:15
公司动态 - 网易有道正式开源"子曰3"系列大模型的数学模型 英文名称为Confucius3-Math [1] - 该模型是国内首个专注于数学教育的开源推理模型 [1] - 模型可在单块消费级GPU上高效运行 [1] 行业影响 - 开源数学教育大模型填补了国内该领域的技术空白 [1] - 消费级GPU适配特性降低了技术应用门槛 [1]
刚刚,LMArena最新模型榜单出炉!DeepSeek-R1网页编程能力赶超了Claude Opus 4
机器之心· 2025-06-17 08:10
DeepSeek-R1(0528)模型升级与性能表现 - 核心观点:DeepSeek-R1(0528)在开源模型中表现突出,多项基准测试排名靠前,尤其在编程领域与闭源模型性能相当 [1][2][3][4] 模型升级与功能改进 - DeepSeek-R1(0528)为最新升级版本,改进基准测试性能,减少幻觉,支持JSON输出和函数调用 [3] - 模型及权重已公开,采用MIT开源协议 [2][8] LMArena基准测试排名 - 在文本基准测试(Text)中整体排名第6,开放模型中排名第一 [5] - 细分领域表现: - 硬提示词(Hard Prompt)排名第4 - 编程(Coding)排名第2 - 数学(Math)排名第5 - 创意性写作(Creative Writing)排名第6 - 指令遵循(Instruction Following)排名第9 - 更长查询(Longer Query)排名第8 - 多轮对话(Multi-Turn)排名第7 [6] WebDev Arena编程竞赛表现 - 与Gemini-2.5-Pro-Preview-06-05、Claude Opus 4(20250514)并列第一,分数超过Claude Opus 4 [7] - WebDev Arena评分: - Gemini-2.5-Pro-Preview-06-05:1433.16(±13.78/-16.08) - DeepSeek-R1(0528):1408.84(±16.75/-15.04) - Claude Opus 4(20250514):1405.51(±12.56/-12.44) [8] 行业影响与用户反馈 - DeepSeek-R1(0528)在AI编程领域与Claude Opus性能相当,被视为开源AI的关键里程碑 [10] - 模型在完全开放的MIT协议下提供领先性能,可能影响更广泛的编程领域 [10] - 实际用户体验仍需更多验证,以确认是否媲美闭源模型 [10]
互联网女王报告揭秘硅谷现状:AI指数级增长,中国厂商在开源竞争中领先 | 企服国际观察
钛媒体APP· 2025-06-11 10:33
人工智能发展速度 - ChatGPT仅用17个月突破8亿用户,远超互联网时代任何产品的增长速度 [3] - ChatGPT不到三个月达到1亿用户,截至今年4月每周用户量达8亿,每年处理超过3650亿次搜索 [8] - 人工智能相关职位空缺自2018年起增长448%,显示行业对人才的强劲需求 [19] 技术成本与效率 - 模型训练成本高达10亿美元,但推理成本在两年内下降99%(按每百万token计算) [4] - 2022年至2024年期间,运行大语言模型的每个token成本下降99.7% [17] - 英伟达2024年Blackwell GPU的单位功耗较2014年Kepler GPU降低10.5万倍 [4][14] 开源与闭源模型竞争 - 闭源模型(如GPT-4、Claude)性能卓越但缺乏透明度,受企业和政府机构青睐 [6] - 开源模型(如Llama、Mixtral)低成本且功能增强,推动主权AI和本地语言模型发展 [10][13] - 中国在开源竞赛中领先,2025年将发布DeepSeek-R1、阿里巴巴Qwen-32B和百度Ernie 4.5 [12] 市场与应用 - 印度成为AI平台重要市场,贡献ChatGPT移动应用用户的13.5%,超过美国的8.9% [10] - AI应用拓展至汽车驾驶、工厂机器人、医疗保健等领域,成为职业"副驾驶" [18] - 行业从垂直SaaS转向横向整合,如微软集成Copilot、Zoom和Canva融入生成式AI [21] 基础设施与投资 - 云端芯片(谷歌TPU、亚马逊Trainium)规模化开发推动AI基础设施快速迭代 [7] - 风险投资加速流入AI领域,但企业与云服务商仍需高额基础设施投入 [7] - 全球范围内针对芯片、数据中心的争夺战激烈,堪比冷战时期太空竞赛 [21]
DeepSeekR2发布预期升温,英伟达有望研发全新中国特供芯片
华西证券· 2025-06-08 21:05
报告行业投资评级 - 行业评级为推荐 [4] 报告的核心观点 - DeepSeek发布R1更新,R2模型发布预期升温,R1更新展现其在开源模型领域的持续创新能力,为R2模型发布奠定基础,推测R2可能具备更大上下文窗口和原生多模态功能 [2][24] - 英伟达正在研发全新中国特供芯片B30,这是其在美国出口管制下的折中方案,反映出对中国人工智能市场的高度重视 [3][25] - 外部贸易争端不确定性上升,扩大内需重要性凸显,科技创新与自主可控是中长期发展关键方向,维持对中国科技龙头的谨慎看好态度,关注中概股回流港股进度,建议关注港股互联网龙头、游戏行业、电影及文旅产业的投资机会 [3][26] 根据相关目录分别进行总结 本周市场行情 - 2025年第22周(2025.6.3 - 2025.6.6),上证指数上涨1.13%,沪深300指数上涨0.88%,创业板指数上涨2.32%,恒生指数上涨2.16%,恒生互联网指数上涨3.46%,行业领先恒生指数1.3pct,SW传媒指数上涨2.59%,领先创业板指数0.27pct,在申万一级31个行业涨跌幅排名中位列第6位 [1][12] - 子行业中影视、互联网服务和广电位列涨幅前三,分别上涨12.91%、3.94%和3.29% [1][12] - 本周传媒行业个股涨幅前5为歌华有线、湖北广电、新迅达、*ST大晟和巨人网络;跌幅前5为蓝色光标、时代出版、元隆雅图、广博股份和广西广电 [17][18] - 恒生资讯科技业在十二个恒生综合行业涨跌幅排名中位列第12位 [18] 行业新闻 宏观动态 - 6月2日,数字货币概念港股活跃,连连数字等领涨,中国香港特别行政区政府5月30日《稳定币条例》正式生效,完善数字资产监管框架,将为稳定币相关产业链公司带来机遇 [28] 游戏行业新闻 - 莉莉丝研发的《远光84》今年4月开启CBT2测试,投入10亿打造,成绩走高,项目组升级底层动画方案,实现“左右手分离的动作系统” [29][30] - 6月5日,快手旗下可灵AI与网易《逆水寒》达成深度合作,将AI视频生成技术内置于游戏提升社交玩法 [32] - 6月5日,腾讯游戏打造“VISVISE”游戏创作AI全链路解决方案业务,此前发布混元游戏视觉生成平台 [32] - 6月6日,腾讯手游《无畏契约:源能行动》上架苹果App Store,预计11月25日推出,全网预约人数冲破2000万 [33] - 任天堂Switch 2上市售罄,由英伟达定制芯片驱动,图形处理性能是一代的10倍,任天堂预计到2026年3月售出1500万台,分析师预计可达1700万台 [34] 人工智能行业新闻 - 6月4日,OpenAI对ChatGPT进行重大更新,推出会议记录模式,支持MCP协议,旨在打造智能协作平台 [35][36] - 6月5日,高通CEO表示公司已做好与苹果“分手”准备,双方授权协议2027年到期,高通预计逐步退出苹果供应链 [36] - 6月6日,亚马逊采用DeepSeek、阿里通义千问等开源大语言模型进行机器人操控,组建团队推进“物理AI”研发 [37] 影视及视频行业新闻 - 截至6月2日12时47分,2025年端午档档期票房破4亿元,大幅超去年同期 [38] - 6月2日消息,爱奇艺自6月1日起限时大幅下调虚拟制作系统使用价格,最低降至3.5万元/天,旨在降低使用门槛 [38] - 红果短剧发布“掘金计划”,投入数亿元扶持“拉新好剧”,已有20余家合作方获百万额外激励,还对剧本创作者设立扶持活动 [39] 互联网行业新闻 - 本周一,300多名微软员工被裁员,此次是继上月6000人裁员计划后的又一次裁员 [40] - 6月3日,雷军表示小米汽车业务2025年三四季度将盈利,小米YU7售价不是网传的23.59万元,小米反内卷“不打价格战”,将做汽车芯片,机器人领域投资研发已有成果 [40] - 近期小红书估值飙升至260亿美元,通过金沙江创投旗下股份交易文件曝光 [40] - 6月5日,美团副总裁透露2025年旅游业迈入AI时代,美团计划发布国内首个B端AI工具,6月推出AI旅行助手 [41] - 6月5日,京东618上线京东五金城主推日,单日成交金额同比增长161%,成交用户数同比增长87% [43] 文旅行业新闻 - 端午假期,上海线上线下消费近200亿元,同比增长4.1%,离境退税销售额和退税额同比增长约1.1倍,家电家居和3C产品以旧换新带动销售额增长 [44] - 携程报告显示,2025年端午假期出入境游双向火热,入境游订单涨幅近九成,入境游门票GMV同比暴涨1.5倍 [45] 子行业数据 电影行业 - 本周票房排名前三的电影为《碟中谍:最终清算》(9516.5万元,票房占比44.7%)、《时间之子》(3268万元,票房占比15.3%)、《哆啦A梦:大雄的绘画奇遇记》(1958.7万元,票房占比9.2%) [47] 游戏行业 - iOS游戏畅销榜排名前五为《王者荣耀》《和平精英》《绝区零》《金铲铲之战》《向僵尸开炮》;安卓游戏热玩榜排名前五为《心动小镇》《杖剑传说》《我的休闲时光》《崩坏:星穹轨道》《王者荣耀》 [48][50] 影视剧集行业 - 综合播映指数,《藏海传》《折腰》《陷入我们的热恋》位列播映指数榜前三,艺恩播映指数分别为84.4、81.8和78.1 [53][54] 综艺及动漫 - 综合艺恩播映指数,综艺排名前三为《哈哈哈哈哈第五季》《奔跑吧第九季》《无限超越班第三季》 [55] - 本周动漫播放量指数排名前三为《沧元图之斩妖除魔》及同系列七部(播放量指数348)、《仙逆》(播放量指数246.8)、《遮天》(播放量指数202) [56]
最新必读,互联网女皇340页AI报告解读:AI岗位暴涨,这些职业面临最大危机
36氪· 2025-06-03 21:32
AI行业趋势 - ChatGPT仅用2个月达到1亿用户,17个月后月活增至8亿,订阅用户超2000万,年营收近40亿美元,成为商业化速度最快的AI产品[5][6] - 2024年AI相关资本支出达2120亿美元,同比增长63%,为十年内最高[6][11] - AI模型训练成本8年内暴涨2400倍,单个模型训练成本可能在2025年达10亿美元,未来或突破100亿美元[6][20] - 开源模型如DeepSeek、Qwen等在推理和编程能力上已逼近顶级闭源模型[36][37] 基础设施投资 - 苹果、英伟达、微软、Google、亚马逊、Meta等科技巨头2024年AI相关资本支出达2120亿美元[11] - 英伟达占据数据中心投资预算的25%,成为AI浪潮最大受益者[12] - 英伟达GPU推理单个Token能耗10年间下降约105000倍,有利于规模化部署[27] 技术发展 - AI在图灵测试中表现超越人类,GPT-4.5被73%测试者误认为人类[43][46] - Midjourney图像生成质量从v1到v7显著提升,达到商品级水平[50] - ElevenLabs语音克隆技术月访问量从0飙升至2000万,音色克隆+实时翻译趋近商用级别[57] 应用场景 - Waymo自动驾驶出租车在旧金山市场份额已达1/3[59] - AI相关岗位2018-2025年增长448%,传统IT岗位需求下降9%[67][69] - AI Agent成为新型数字劳动力,能执行多步骤任务如在线购物、界面导航等[72][74] 区域发展 - 美国发布超100个训练计算量超10²³ FLOPs的大语言模型,中国紧随其后不断缩小差距[40] - ChatGPT北美之外用户普及率超90%,呈现全球同步爆发特征[9]
黄仁勋谈中美AI竞争:中国的Deepseek和千问是开源模型中最好的
快讯· 2025-05-30 19:47
开源AI模型竞争 - 英伟达CEO黄仁勋评价中国开源AI模型DeepSeek和阿里通义千问(Qwen)是目前最好的开源AI模型 [1] - 这两款开源AI模型在免费发布后获得了美国、欧洲及其他地区的巨大关注 [1] - 黄仁勋认为赢得AI开发者的平台将最终赢得AI领域的竞争 [1] AI人才与政策影响 - 黄仁勋指出出口限制政策应该加强美国平台而非将全球一半AI人才推向竞争对手 [1]
美国法院叫停特朗普大部分进口关税;特斯拉股东们的愿望实现了:马斯克离开DOGE丨百亿美元公司动向
晚点LatePost· 2025-05-30 19:08
美国法院叫停特朗普大部分进口关税 - 美国法院判定特朗普政府绕过国会加征10%基准关税和更高对等关税的行为越权,要求行政部门在10日内撤回相关关税 [1] - 法官认为《国际紧急经济权力法》不赋予总统无限关税权力,相关解读违宪 [1] - 汽车关税等基于其他法案加征的关税不受影响,特朗普政府已上诉 [1] 高盛对关税裁定的分析 - 高盛分析师认为裁定增加了特朗普政府关税计划的不确定性,但可能不会改变主要贸易伙伴的最终结果 [2] 马斯克离任及特斯拉动态 - 马斯克宣布离开特朗普政府,不再担任特别政府雇员 [3] - 特斯拉计划6月交付自动驾驶版Model Y,比原计划提前一个月 [4] - 特斯拉在奥斯汀公共街道测试自动驾驶版Model Y期间未发生事故 [4] LVMH中国市场表现 - LVMH高管表示中国顾客更青睐本土珠宝品牌,未指明具体品牌 [5] - 除日本外的亚洲市场一季度可比收入同比收缩11%,二季度预计难改善 [5] - LVMH葡萄酒和烈酒部门产品售价不会继续提高 [5] 国内航线燃油附加费调整 - 6月5日起800公里以下航线免征燃油附加费,800公里以上收取10元,较4月下调10元 [6] - 4月航空煤油价格较3月下跌约4% [6] - 一季度民航客座率恢复至疫情前水平,但航司利润同比下滑 [6] DeepSeek开源新版R1 - DeepSeek开源R1最新0528版本,性能媲美OpenAI o3模型高版本 [7] - 新版R1风格与OpenAI o3模型相似 [7] 英伟达一季度业绩 - 一季度营收441亿美元,净利润188亿美元,环比下降15% [8] - 数据中心业务营收391亿美元,环比增长10% [8] - 因出口管制导致H20芯片需求减少,产生45亿美元费用 [8] 理想汽车一季度业绩 - 一季度营收259亿元,同比增长1.1%,净利润6.47亿元,同比增长9.4% [9] - 一季度交付量9.28万辆,上年同期为8万辆 [9] - 预计二季度营收325~338亿元,不及市场预期 [9] 锂电池原材料价格 - 碳酸锂期货主力合约跌破6万元/吨,最低至5.95万元/吨 [10] - 2022年初碳酸锂价格曾从20万元/吨涨至60万元/吨,三年内跌去90% [10] 中美集装箱运输需求激增 - 中美互降关税导致商家加足马力发货,上海港美线出口装箱量环比增长49.4% [12] - 上海港此前停航的美线班轮已全部恢复,6月上旬亚洲到美国运力预计恢复至100% [12]
模型下载量12亿,核心团队却几近瓦解:算力分配不均、利润压垮创新?
猿大侠· 2025-05-30 11:59
Meta AI团队重组 - Meta将AI团队重组为两个部门:由Connor Hayes领导的AI产品团队(专注消费者产品如Facebook/Instagram/WhatsApp的AI功能)和由Ahmad Al-Dahle与Amir Frenkel共同领导的AGI基础部门(专注Llama模型等宏观技术)[2] - FAIR研究部门保持独立但多媒体团队并入AGI基础团队 重组不涉及高管离职或裁员 目的是通过拆分大组织加速产品开发并提升技术领导力灵活性[3] - 首席产品官Chris Cox强调新架构赋予团队更多自主权 同时减少跨团队依赖[3] 人才流失危机 - Llama原始论文14位作者中11人离职 包括核心架构师Guillaume Lample和Timothée Lacroix(创立竞争对手Mistral AI 估值60亿美元)[7][16] - FAIR前负责人Joelle Pineau离职 继任者Robert Fergus曾离开Meta加入DeepMind五年[8][10] - 离职研究人员平均任职超五年 非短期聘用 部分加入苹果等公司或创立竞品[23] Llama模型发展困境 - Llama 4发布后遭批评 被指性能指标虚高且落后于DeepSeek/Qwen等开源竞争对手[8][13] - 原FAIR团队开发的Llama 1/2推动开源LLM浪潮 但Llama 4改由GenAI产品部门主导 FAIR被边缘化[15][16] - Meta推迟史上最大AI模型Behemoth发布 内部对其性能和领导力存在担忧[8] FAIR实验室地位变化 - FAIR曾为Meta AI研发核心 2022年并入Reality Labs元宇宙部门引发人才流失 2024年又与GenAI合并进一步削弱独立性[14][16] - 前员工指出FAIR计算资源少于GenAI团队 探索性研究被产品导向项目取代[17][21] - 扎克伯格战略转向生成式AI商业化 FAIR从"皇冠明珠"沦为"缓慢死亡"状态[20][21] 行业竞争与投入 - Meta推出"Llama for Startups"计划 并在LlamaCon活动展示与OpenAI竞争实力[3] - 2025年计划投入650亿美元于AI项目 部署1.3万块NVIDIA H100 GPU 新建2GW数据中心[22] - 但缺乏专用推理模型 落后于谷歌/OpenAI在多步复杂任务处理能力[22] 开源生态影响 - Llama 1/2使用公开数据训练 优化效率使单GPU可运行 曾推动开源LLM合法化对抗GPT-3/PaLM等专有系统[11] - 人才流失导致Meta在开源创新领域领先优势下滑 Mistral等竞品加速发展[7][10]
速递|Meta AI人才流失危机:Llama原始论文14位作者中11人已离职,或动摇开源根基?
Z Potentials· 2025-05-27 10:37
Meta AI团队人才流失 - Llama模型核心团队严重流失 14位原始论文作者中仅剩3人留任 离职率达785% [1] - 离职人员平均任职超5年 多为深度参与AI研究的核心成员 部分完成Llama3项目后离职 [1] - 人才流向竞争对手明显 前Meta研究员创立Mistral等公司 直接挑战Meta开源模型 [2] 竞争格局变化 - Mistral等新兴开源对手快速崛起 开发者转向Deepseek/Qwen等替代方案 [2] - 行业技术迭代加速 Meta缺乏专用推理模型 落后于谷歌/OpenAI的多步骤问题解决能力 [4] - Llama4市场反响平淡 对比两年前开源领导地位显著下滑 [2][4] 内部管理动荡 - FAIR团队领导层更迭 执掌8年的乔尔·皮诺卸任 由创始人罗伯特·弗格斯接替 [3] - Behemoth大模型发布推迟 内部对其性能与领导力存在质疑 [2] - 原始架构师集体离职 公司面临创始团队缺失下的技术延续挑战 [3] 技术战略影响 - Llama系列仍被定位为AI核心战略 但开源创新优势已被竞争对手蚕食 [3] - 2023年Llama论文确立开放权重LLM合法性 曾为专有系统的有效替代方案 [3] - 训练数据限于公开来源 优化单GPU运行效率的策略失去技术领先性 [4]
Meta CEO X 微软 CEO 对话解读:「蒸馏工厂」为何成为开源的魅力之源?
机器之心· 2025-05-23 23:30
AI 正在让文档、应用程序和网站之间的界限消失 - Meta CEO Mark Zuckerberg 和微软 CEO Satya Nadella 在 LlamaCon 2025 闭幕会议上探讨 AI 对技术平台和生产力提升的影响 [1] - Nadella 认为 AI 时代文档、应用和网站界限模糊化 传统计算机系统将人类连续需求割裂为独立功能 不符合人类认知 [2-2] - 微软 90 年代 OLE 技术尝试打破应用障碍 实现复合文档 允许 Word 嵌入 Excel 或 PowerPoint 并保留原功能 [5] - 现代 AI 作为通用转换器 能理解用户意图而非机械执行命令 可提供信息、组织文档甚至生成可执行代码 [6] - AI 推动从面向工具计算到面向意图计算的范式迁移 信息形态由使用场景动态决定 用户体验回归自然思维流程 [6] - Nadella 将 AI 浪潮定位为继客户端服务器、互联网和云计算后的重大技术平台变革 需重构整个技术栈 [7] - 微软内部 20%-30% 代码由 AI 生成 AI 应用扩展至代码补全、聊天功能、智能体工作流和代码审查等领域 [7] - Meta 预计到 2026 年一半开发工作将由 AI 完成 [8] 开源与闭源模型的战略价值 - 微软采取灵活策略 同时支持开源和闭源模型 开放权重模型在企业蒸馏和定制化有优势 闭源模型有特定场景 [9] - Azure 云平台同时支持两类模型 为开发者提供多样化选择 [10] - Meta 通过 Llama 系列开源模型实践 推动社区协作演进 [10] 蒸馏工厂概念及其对 AI 生态系统影响 - 两位 CEO 认为建立支持模型蒸馏的基础设施和工具链是未来关键发展方向 [10] - Nadella 强调多模型应用趋势 标准化协议对实现多智能体多模型协作至关重要 [10] - Zuckerberg 提出蒸馏工厂概念 认为微软在多模型协同基础设施有独特优势 [10] - Nadella 将蒸馏工厂描述为开源最大魅力之一 是开源模型能发挥巨大作用的领域 [11]