Workflow
开源大模型
icon
搜索文档
张朝阳谈AI发展:科技进步带来惊喜和挑战,人类要时刻保持清醒;禁用AI代写作业,教育部规范推进中小学AI教育丨AIGC日报
创业邦· 2025-05-19 07:55
微软裁员与AI自动化 - 微软副总裁杰夫·赫尔斯管理的400名软件工程师团队中,AI生成代码占比将从20%提升至30%,显示公司加速整合AI技术 [1] - 作为6000人裁员计划的一部分,赫尔斯团队中十几名工程师被解雇,工程师岗位受冲击程度高于其他职位 [1] - 微软高层强调通过AI提升销售、工程及客户支持岗位的生产率,与向企业客户推销AI以降低人力成本的战略一致 [1] AI技术发展与行业影响 - 搜狐创始人张朝阳指出2024-2025年AI进展进入快车道,具身智能领域百花齐放,但需警惕技术进步带来的信息真实性挑战 [1] - 诺贝尔经济学奖得主斯宾塞认为开源AI模型(如中国DeepSeek)涌现,中美技术差距迅速缩小,小模型依赖大模型但成本更低的现象对全球经济产生积极影响 [1] 教育领域AI规范 - 教育部2025版指南明确禁止学生直接复制AI生成内容作为作业答案,并限制小学生独立使用开放式生成功能 [1] - 教师不得将生成式AI作为替代性教学主体,体现对AI教育应用的审慎监管态度 [1] 行业动态与资源 - AIGC产业日报提供精选行业新闻,会员服务涵盖人形机器人、商业航天等热门赛道分析及行业图谱 [2]
夸克升级“深度搜索”功能,AI应用方向催化丰富,关注影视、游戏景气度回暖
华创证券· 2025-05-12 08:15
报告行业投资评级 - 推荐(维持) [1] 报告的核心观点 - 当下传媒板块明线为AI应用起势,暗线为哪吒带来的文化自信,需锐度和配置并重;看好2025年成为中国开源大模型的爆发及应用格局重塑之年,分三步发展,建议关注游戏、港股互联网、开源大模型应用、IP衍生品、分众传媒、教育等领域相关公司 [6] 根据相关目录分别进行总结 上周市场表现回顾 - 上周传媒(申万)指数整体上涨1.40%,同期沪深300指数整体上涨2.00%,板块跑输沪深300指数0.61%,位列所有板块第24位;宝通科技、惠程科技等领涨,中广天择、万达电影等领跌;港股互联网科技板块中,美团 - W、理想汽车 - W等领涨,华虹半导体、中芯国际等领跌 [9][10][13] - 游戏市场方面,2025年5月3日至9日游戏iOS畅销排行显示腾讯系产品领先,网易系紧随其后,其他厂商部分产品排名靠前;新游方面,《英勇之地》《王者荣耀世界》《踏风行》等有上线或测试计划 [16][17] - 电影市场方面,截至5月9日,2025年电影大盘票房(不含服务费)239.0亿元,观影总人次5.70亿人,票房大盘已恢复约102%,观影人次已恢复约90%;5月4日 - 9日整体票房18915.0万元(不含服务费),观影人次516.7万人,平均票价37元;上周院线上映电影TOP5为《水饺皇后》等,票房及占比各有不同;2025.5.12 - 2025.5.18待上映重点影片有《独一无二》等 [20][23][27][29] 行业重要新闻与重点公司公告 - 行业重要新闻包括2025年五一档总票房7.48亿元,同比去年下降五成;谷歌发布Gemini 2.5 Pro“I/O”模型;苹果公司考虑在浏览器中集成AI搜索功能;腾讯元宝、阿里夸克、HeyGen、腾讯混元等有相关AI功能升级或产品发布 [30][31][32] - 公司公告方面,完美世界发布2025年员工持股计划草案;易点天下向激励对象首次授予限制性股票;盛天网络、奥飞娱乐发布回购公司股份进展公告;万达电影持股5%以上股东杭州臻希投资管理有限公司计划减持股份 [33][34][36][37][38]
贸易战下的产业韧性(二):AI大模型的商业“回旋镖”,重新落到了云计算
36氪· 2025-05-12 07:28
行业现状与挑战 - 本土大模型行业正试图冲破困局重构秩序,但不稳定的市场环境可能成为重大风险 [1] - DeepSeek凭借全球影响力颠覆行业对开源模式的认知,促使OpenAI重新评估开源策略 [1] - 阿里、百度、商汤科技等厂商加速推进开源,但面临美国关税壁垒、开源激励不足、硬件适配和标准碎片化等问题 [1] 开源模式的商业化困境 - 开源被认为是应对技术"卡脖子"的关键,但商业化博弈复杂,开源项目缺乏直接收入 [2] - 厂商需投入人力物力适配国产芯片,但难以从中直接获益,纯粹"为爱发电"不可持续 [2] - 投资者态度谨慎,担忧投入巨额资金后模型被开源导致回报落空,金沙创投主管合伙人朱啸虎曾表达这一顾虑 [4] 开发者与企业的实际挑战 - 开源大模型虽降低技术门槛,但实际应用需大量定制化,涉及数据预处理、模型微调等高成本工作 [4] - 中小企业面临数据获取、清洗、标注及后训练所需计算资源的高昂成本 [4] - 投资者仍以传统软件销售模式评估大模型,与开源路径不匹配,盈利模式不明确制约发展 [5] 厂商的商业化路径探索 - 百度、阿里、腾讯等厂商采用"免费引流+增值服务"模式,通过开源模型吸引用户并增加云收入 [6] - 百度开源文心大模型,通过智能云服务实现商业变现,形成"开源引流-算力消耗-云收入"飞轮 [8] - Meta通过Llama API提供云计算服务,吸引开发者迁移至其生态体系 [8] - Hugging Face通过开源Transformer库吸引开发者,再向企业提供付费私有化解决方案 [9] 行业未来发展方向 - 开源大模型对开发者的吸引力取决于云服务质量,如开发工具链、数据存储、AI调优等支持 [9] - 开源被视为突破技术封锁的最优路径,但需兼顾商业可持续性,开发者更关注云平台选择 [10] - 行业生态需整体跨越,开源发展涉及技术、商业与制度的多重博弈 [5][10]
9点1氪:5月10日起结婚离婚都无需出示户口本;贾跃亭主动回应还债回国时间;心相印客服辱骂顾客并送冥币
36氪· 2025-05-09 23:30
婚姻登记条例修订 - 修订后的《婚姻登记条例》自2025年5月10日起施行 主要包含增加婚姻家庭服务内容 实行婚姻登记"全国通办" 优化婚姻登记服务三方面内容 [3] - 办理结婚 离婚登记无需再出示户口本 结婚登记需出具居民身份证和无配偶声明 离婚登记需出具居民身份证和结婚证 [3] 公司动态 - 厦门吉宏科技股份有限公司通过港交所上市聆讯 中金公司和招银国际担任联席保荐人 [2] - 松下集团计划于2025年度至2026年度在全球范围内裁员1万人 其中日本和海外员工各5000名 [6] - 珠城科技控股股东 实控人张建春和施乐芬解除婚姻关系 张建春拟将直接持有的87675万股公司股份分割过户给施乐芬 按5月8日收盘价计算市值约为381亿元 [6] - 王健林新增1条股权冻结信息 冻结大连万达商业管理集团股份有限公司股权数额约3亿人民币 冻结期限自2025年5月8日至2027年5月7日 [7] - 上海微软裁员 网友爆料赔偿达N+8 老员工可拿20个月工资 赔偿金额可达几十万甚至上百万 [7] - 宁德时代据称为香港上市寻求筹资至少40亿美元 [7] 科技与互联网 - 阿里通义千问Qwen3智能水平位列全球前五 开源第一 推理成本不到DeepSeek-R1的三分之一 是Claude 3.7的二十分之一 开源一周下载量超过330万次 [10] - 腾讯混元团队发布并开源多模态定制化视频生成工具HunyuanCustom 主体一致性效果超过现有开源方案 可媲美顶尖闭源模型 [11] - 夸克将推出"深度搜索Pro" 在学术 商业 科学 人文 法律 计算机 医学等多个领域达到专家级水平 [12][13] - 百度地图被指"见缝插针"植入广告 网友反映进入线路模式会出现"累了困了 喝东鹏特饮"的广告语 影响行车安全 [8] - SpaceX星链疑似被东南亚电诈园区滥用 缅甸妙瓦底一带至少有8个电诈园区部署了星链 过去一年约3000台设备处于活跃状态 [8][9] 投融资 - 分布式存储解决方案供应商"泛联信息"完成数千万元PreA+轮融资 由信芳资本领投 荔湾产投等机构跟投 资金将投向产品研发和销售体系升级 [14] - 娱美德及其游戏产业基金Finewill Capital向中国游戏开发团队"究极火花工作室"投资数百万美元 支持其开发美式卡通风格地牢战棋SRPG《代号:M》 [15] - 新能源检测技术企业"川源科技"完成数千万元A轮融资 由广州产投独家投资 资金将用于产品升级和智能检测云平台开发 [16] 消费与零售 - 胖东来和田玉商品吊牌标注进货价和毛利率 工作人员确认从5月8日起吊牌会明确标注进货价和售价 [9] - 美国关税政策导致自行车制造商成本大涨 一个车轮成本飙涨近3倍 儿童用品商店婴儿推车 座椅等商品进货成本显著上升 大部分产品涨价50到300美元不等 [6] 电子产品 - 折叠屏iPhone将首发全新三星面板 采用in-cell触控技术 展开后折痕几乎不可见 [17] - 苹果计划于2025年9月推出iPhone 17 Air 采用66英寸OLED屏幕 支持120Hz高刷新率和全天候显示功能 [18] 法律与监管 - 意大利Moltiply集团起诉谷歌母公司Alphabet 索赔297亿欧元 理由是谷歌滥用市场主导地位阻碍其子公司7Pixel发展 [5] - Celsius Network创始人兼前首席执行官亚历克斯·马辛斯基因证券欺诈和商品欺诈罪被判入狱12年 [9]
中国电子:国产开源模型千帆竞发,阿里 Qwen-3、小米 MiMo、DeepSeek Prover 集中发布
海通国际证券· 2025-04-30 23:15
报告行业投资评级 未提及 报告的核心观点 - 阿里 Qwen 当前位列开源大模型排行榜首,凭借领先性能及完善开源策略,未来有望在能力与生态变现方面持续领先,且部署成本显著降低 [2] - 随着国产模型开源增多,未来应用和商业化会面临同质化竞争问题,开源模型将向定制化演进,成熟 Agent 会改写行业格局,是 AI 商业化下个突破口 [5] 根据相关目录分别进行总结 事件 - 2025 年 4 月 28 日,阿里发布新一代 Qwen - 3 系列大语言模型,含多个量级版本 [1] - 2025 年 4 月 30 日,小米发布并开源首个专为推理任务设计的大语言模型 Xiaomi MiMo;DeepSeek 团队在 Hugging Face 平台发布最新大语言模型 DeepSeek - Prover - V2 - 671B [1] 阿里 Qwen - 3 - 具备多尺寸覆盖能力,推出多个参数规模模型,能满足不同场景推理需求 [1] - 性能显著提升,在多项公开评测基准上,相较前代模型准确率提升 10–30% [1] - 引入先进稀疏注意力机制和推理加速技术,相同硬件资源下推理速度提高 20%–40%,增强实用性和部署效率 [1] 小米 Xiaomi MiMo - 70 亿参数规模,在数学推理和代码生成等任务中性能卓越,超越部分更大规模模型 [3] - 采用三阶段逐步提升难度训练方法,总计训练 25T tokens 增强推理能力 [3] - 后训练阶段引入“测试难度驱动奖励”机制,结合“简单数据重采样”策略和“无缝推出系统”,提升强化学习稳定性和训练效率,使强化学习训练速度提升 2.29 倍、验证过程加快 1.96 倍 [3] DeepSeek - Prover - V2 - 671B - 在数学定理证明任务中表现出色,特别是形式化数学证明领域 [4] - 发布展示了 DeepSeek 在大模型领域技术实力,预示其在形式化推理和专业领域应用的战略布局 [4] - 上线可能为即将发布的 DeepSeek - R2 模型做能力验证或预热,显示推动 AI 技术向更深层次发展的决心 [4]
Qwen3真香!通义App满血接入,一手实测在此
量子位· 2025-04-30 12:10
开源大模型Qwen3发布 - 开源大模型Qwen3发布后引发全球关注,被称为"开源界新王者"[1][6] - 模型包含8款混合推理模型,参数量从0.6B到235B全面覆盖[11] - 32B模型性能超越OpenAI o1和DeepSeek R1,在编程基准测评中超过Gemini 2.5 Pro[11] - 支持119种语言和方言,加强对MCP支持[11][56] 模型性能表现 - 在代码生成测试中,Qwen3-235B模型用时1分钟生成100多行代码[19] - 逻辑推理测试中,Qwen3正确解答经典过河问题[42][43] - 解答普特南数学竞赛难题用时5分38秒,快于Grok 3的8分钟[50][53] - 多语言能力测试显示可翻译莎士比亚作品,参考优秀译本避免侵权[58][59] 应用场景拓展 - 通义App集成Qwen3后支持多种智能体玩法[10][14] - 可实现旅游规划、购物比价、AI写歌等功能[64][69][71] - 开发者社区反应热烈,Reddit等平台讨论热度高[80][81] - 模型生成速度快,体验丝滑,擅长推理和代码实现[75] 技术发展历程 - Qwen系列5个月内快速迭代,从QwQ到Qwen3实现技术突破[82] - 采用Apache 2.0协议,更加开放和商用友好[83] - 代表中国开源力量的发展速度,与DeepSeek形成行业格局变化[81][82] 实测数据对比 - 代码能力测试中Qwen3-235B得分为95.6,优于Grok 3 Beta Think的96.4[24] - 在AIME'25测试中Qwen3-235B得分为81.5,高于OpenAl-o1的70.2[24] - CodeForces Elo Rating显示Qwen3-235B为2056,接近Gemini2.5-Pro的2001[24] - 32B密集模型在AIME'24测试中得分为81.4,优于OpenAl-o1的74.3[7]
Qwen 3 发布,开源正成为中国大模型公司破局的「最优解」
Founder Park· 2025-04-29 20:33
阿里Qwen 3大模型发布 - Qwen3-235B-A22B评测成绩与DeepSeek R1、Grok-3、Gemini-2.5-Pro相当,支持混合推理和增强Agent能力 [1] - 全系列模型实现全参数(0.6B-235B)和全模态覆盖,成为HuggingFace最受欢迎开源模型,衍生模型数量突破10万超越Llama系列 [16][17][23] - 采用"思考模式/非思考模式"无缝切换技术,优化MCP工具调用成功率,官方明确从"训练模型"转向"训练Agent"的战略方向 [5][6][7] 中国开源模型全球竞争格局 - DeepSeek+Qwen形成开源"双子星"格局,取代Llama+Mistral成为全球主流开源生态 [1][13] - 开源策略突破地缘政治壁垒:模型权重和训练细节全公开,开发者可自托管定制,建立全球开发者社区信任 [10][12][15] - 两种差异化商业模式:DeepSeek通过技术突破提供低价API服务(成本降低80%),Qwen通过开源带动阿里云商业闭环 [19][20][21] MaaS模式创新 - 阿里云构建"模型-云-行业应用"飞轮:Qwen开源降低AI创业门槛,百炼平台提供MCP服务接入 [2][24] - 实际案例显示Claude+Qwen2.5组合成为创业公司主流方案,混合使用闭源与开源模型平衡成本能力 [25][27][30] - 行业专用模型在医疗、金融等高壁垒领域仍具优势,但需结合本地化服务和数据闭环 [14] AI创业者实践洞察 - 模型选择策略:ToB企业倾向Qwen32B微调(单卡可部署),ToC企业采用API组合(Gemini+DeepSeek) [27][45] - 四大核心挑战:长文本处理衰减(播客场景)、多模态情感理解(心理场景)、国产芯片适配(机器人场景)、并发稳定性(服务场景) [36][40][41] - 创业方法论验证:70%成功案例遵循"X+AI"而非"AI+X"模式,留存率取决于真实需求解决而非技术指标 [48][50] 开源模型技术趋势 - 能力差距持续存在但应用门槛降低:2025年开源模型已满足PMF验证需求,微调价值向窄领域迁移 [25][43] - 三大技术方向:混合推理架构(成本控制)、Agent工具调用(实用化)、多模态融合(场景适配) [5][7][23] - 社区驱动创新:Qwen生态含完整工具链(vLLM/SGLang),DeepSeek聚焦前沿技术(MoE/多模态) [32][49]
致远互联入选中国信通院“开源大模型+”软件创新应用典型案例
证券时报网· 2025-04-25 12:12
行业认可与标杆地位 - 公司凭借AI-COP数智化协同运营平台及全价值链产品的技术突破与场景创新,入选中国信通院《"开源大模型+"软件创新应用典型案例(2025年第一期)》,成为该领域示范标杆 [1] - 案例征集聚焦人工智能技术场景化落地,围绕DeepSeek、通义千问等主流开源大模型,从技术突破性、场景创新性、生态协同性三大维度遴选标杆 [3] - 公司以"大模型+垂直领域模型+场景智能体"深度融合的实践成果,成功打造可复制、可推广的行业范式 [3] 技术架构与产品创新 - 公司以AI为核心战略,推出新一代智能体产品家族"CoMi Family",采用"大模型+协同运营领域模型+场景+智能体+知识库"策略 [4] - CoMi整合主流AI大模型(如DeepSeek、通义千问等)和自研协同运营垂直领域模型,从单一流程工具升级为多任务AI Agent [4] - 开放定制能力,伙伴和客户可基于行业经验创建专属Agent,形成应用场景丰富的智能体生态,支持独立运行或嵌入其他系统 [4] 场景应用与商业价值 - CoMi Family已推出十余款垂直场景智能体Agent,包括企业智能问数、协同工作助理、企业知识问答、组织效能专家、合同风险助理等 [5] - 企业智能问数场景下,智能体精准洞察用户意图,提供即时准确的查询与分析结果,加速企业数据决策流程 [5] - 合同风险助理场景中,智能体融合深度学习与自然语言处理技术,深度剖析合同文本,精准定位潜在风险并提供专业建议 [5] - 推出致慧泉一站式企业AI普及服务平台,整合50余个主流大模型,支持私有化部署与信创适配,覆盖金融、制造等行业 [5] - 形成"大模型+场景"应用,包括AI综合门户、智能文档、智能会议、智能数据分析等,覆盖综合执法、智能检测及合规管理等多个场景 [6]
中国AI模型全面爆发,AI大模型技术体系综合开源影响力榜单重磅发布!
AI科技大本营· 2025-04-18 13:53
大模型技术体系概述 - 大模型不仅是单一程序,而是由模型、数据、系统、评测平台等多要素构成的"技术共同体",需依赖大规模高质量数据、先进模型架构、训练策略及底层系统能力[1] - 开源大模型正崛起为AI普惠化的重要力量,但需解决选型难题并理解不同技术体系的优劣势[1] 榜单评估框架 - 评估覆盖模型、数据、系统、评测四大维度,设置53项核心指标,包括模型使用量、模态覆盖度、芯片适配数量、贡献者活跃度等[4] - 数据采集覆盖全球17个主流开源平台的11673个链接,统计周期为2025年1-4月,采用标准化方法确保可比性[6] - 模型指标筛选标准:仅统计月下载量>50的Transformer架构模型,排除参数量<500M的语言模型[7][8] - 系统指标侧重异构训练支持、芯片厂商接入、生命周期管理能力[11] - 评测平台指标要求公开可查且持续更新,排除临时性榜单[11] 分榜单核心发现 百亿参数大语言模型 - DeepSeek表现突出,R1模型以954万次下载量居首,前十名中独占四席[12] - 百亿级模型因性能与成本平衡成为产业焦点,国内机构加速追赶[12] 模型分榜单 - Meta连续四个月蝉联榜首,阿里巴巴稳居第二,DeepSeek凭借V3/R1等新模型跃居第四[16] - 评估维度包括下载量、开源数量、多模态覆盖(语言/视觉/语音等)及社区活跃度[15] 数据分榜单 - Ai2凭借C4数据集登顶,该数据集是多个主流语言模型的训练基础[19][20] - Google在语音数据集表现突出,Hugging Face通过FineWeb保持活跃[23] - 国内BAAI布局CCI语言数据集和Infinity多模态数据集,上海AI Lab聚焦视觉/多模态领域[24] - 多模态数据加速发展,具身感知类交互数据集受关注[25] 系统分榜单 - 智源研究院在通信库和AI编译器领域差异化领先,百度/华为跻身十强[26] - 六家机构覆盖四项关键技术:智源、百度、华为、Google、OpenAI、微软[26] - Meta和Google在算子库和并行训练框架上优势显著[26] 评测平台分榜单 - 上海AI Lab、Hugging Face、智源研究院领跑,Hugging Face评测模型达4576个[29] - BAAI的FlagEval平台评测覆盖能力紧随Hugging Face[29] 综合影响力总榜 - Meta因LLaMA系列模型和PyTorch生态位居第一,Google凭借Gemma 3和TensorFlow/JAX工具链排名第二[35][36] - 四家中国机构进入Top 10:BAAI(第三)、阿里巴巴(第四)、DeepSeek(第九)、上海AI Lab[32][36] - BAAI打造FlagOpen开源体系,目标成为大模型领域的"Linux"[36] - DeepSeek通过MoE架构创新和完整开源策略快速崛起[36] - OpenAI因"有限开源"策略排名第十,早期开放的GPT-2/Whisper仍被广泛应用[36] 行业动态与未来方向 - 多模态技术扩展推动评估体系优化,将引入动态权重调整机制适应具身智能等新趋势[37] - 《人工智能大模型技术体系开源影响力评估方法》白皮书将于2025年5月发布[37] - 评估框架已在GitHub/GitCode开源,鼓励生态共建[38]
后DeepSeek时代:六小虎向左,BAT向右
投中网· 2025-04-09 10:27
国内大模型竞争格局变化 - DeepSeek开源大模型DeepSeek-R1以性能比肩GPT-4o、成本仅为十分之一的优势改写行业规则,引发技术门槛崩塌与B端客户分流[4][7] - 政企市场快速转向DeepSeek,45%央企已完成部署,传统IT服务商(如联想、中兴)抢占订单,部分订单明确要求支持DeepSeek接口[9] - 开源模型推动国产芯片替代趋势,DeepSeek代码库显示其对英伟达CUDA框架的适配性可能加速这一进程[11] AI六小虎现状与分化 - 智谱10天内融资15亿人民币,但团队规模从高峰期1000余人收缩,多名高管离职(如李惠子、张阔)[5][7] - 百川智能转向垂类医疗领域,联合创始人焦可离职;零一万物放弃超大模型训练,拆分业务寻求融资[11] - 月之暗面调整Kimi投流策略,暂停部分安卓渠道投放;阶跃星辰成为六小虎中唯一未现高管离职的企业[11] 互联网大厂应对策略 - 腾讯全线接入DeepSeek,微信、腾讯文档等产品倒戈;百度云、阿里云等春节加班上线DeepSeek版本[13] - 大厂云服务价格战加剧,DeepSeek-V3训练成本仅4070万人民币(Llama 3的7%),采用阉割版H800芯片[13] - 字节旗下豆包坚持未融合DeepSeek,周活用户1845万仅次于DeepSeek,显示流量优势的差异化竞争[14] 商业化与市场影响 - 智谱2024年商业化收入增长超100%,中标32个ToB/ToG项目(金额1.3亿元),但DeepSeek冲击其私有化部署市场[7][9] - 行业从狂热转向理性,开源成为生存必需,商业化需扎根真实场景而非依赖政府订单或资本泡沫[14]