开源生态
搜索文档
2025南京软件大会三大亮点提前看
南京日报· 2025-06-11 08:18
2025南京软件大会三大亮点 亮点1:主打"工业软件"特色品牌 - 大会开幕式将发布《中国工业软件产业发展研究报告(2025)》和《软件产业高质量发展紫金指数(2025)》[2] - 南京工业软件应用创新中心和南京工业软件云工程应用创新中心将发布最新应用创新成果并开展合作签约[2] - 邀请工信部电子五所、赛迪研究院、华为、中兴通讯、埃斯顿等30余家行业领军企业和机构参会[2] - 主会场特设展示区,重点展示工业软件应用创新中心建设成果及国产工业软件最新实践[2] - 同期举办4场工业软件供需对接活动,主题包括工业操作系统、机器人产业等[3] 亮点2:集聚高端产业资源 - 大会联合龙头企业举办信创产业、人工智能、开源生态、智能机器人等特色产业活动[4] - 举办2025"与宁同行"重点城市软件产业发展交流活动、AI赋能信息技术应用创新办公新势力等活动[4] - 中兴通讯、京东工业等将举办数字生态暨软件专场推介活动、具身智能机器人操作系统创新发展大会[4] 亮点3:突出产业发展实效 - 集中展示EDA软件、基础软件、人工智能、工业软件等重点领域最新发展成果[5] - 国家集成电路设计自动化技术创新中心、中国科学院软件研究所将发布最新科研成果[5] - 南京市今年通过国家网信办备案的人工智能大模型及工业软件创新平台成果将集中发布[5] - 一批软件重点项目将集中签约,并策划工业软件发展生态行活动促进产业融合[5]
北美老牌基金突袭硅谷,5家隐身华人AI公司获千万级“战略押注”
36氪· 2025-05-21 11:42
Manus平台发展 - Manus宣布向海外用户开放注册,取消等候名单机制,用户每日可免费执行一项任务并获得积分奖励 [1] - 母公司蝴蝶效应完成由Benchmark领投的7500万美元融资,估值飙升至36亿美元,较年初增长近5倍 [1] - 公司正在组建海外团队,新融资将用于加速底层技术研发及全球化布局,并酝酿推出面向企业级市场的"AI自动化工作流"新产品线 [1] Manus技术特点 - 采用"混合架构多模型协同推理"技术,在GAIA基准测试中以86.5%准确率超越OpenAI同类产品 [2] - 产品使用基于阿里千问大模型、Claude等其他模型的微调模型 [2] - 实现"异步处理+自动执行"的产品思维,将规划Agent+执行Agent+验证Agent协同推理,完成AI从"思考建议"到"闭环执行"的跨越 [3] 行业影响 - Manus爆火引发硅谷对华人AI团队的关注,硅谷创投内部流传着标注顶尖院校华人博士主导的AI Agent初创团队的加密名单 [1] - 华人AI团队正将技术突破与硅谷场景需求嫁接,以较为完整的商品化形态快速占领市场 [1] - 形成"中国迭代速度×硅谷产品思维"的双循环壁垒,打破硅谷对"参数规模决定论"的迷信 [3] 相关AI创企 - HeyGen:主攻AI视频生成与翻译,支持40+语言口型同传,年经常性收入突破3500万美元,付费客户达4万家企业 [5] - Opus Clip:AI视频剪辑平台,2025年Q1企业订阅收入占比提升至40%,全球用户突破1000万 [8] - Trae:基于AI IDE打造"真正的AI工程师",兼容VS Code,是Cursor的有力竞争对手 [10] - Notta:多语言会议纪要自动生成工具,2024年收入1800万,估值3亿,正进行B轮融资 [12] 行业趋势 - 华人团队从规则的追随者蜕变为新秩序的书写者,展现"生态破壁"野心 [14] - 多个项目正在构建新型技术联盟,如将国内外大模型与自研工具链结合打造垂直Agent [14] - "中国速度×硅谷场景"模式展现出强大杀伤力,AI商业化的胜负手在于现有技术的极致应用 [14]
每周一问大模型 | 基模“五强”谁最水,谁最强?
搜狐财经· 2025-05-19 15:26
中国基础大模型五强竞争格局 - 字节跳动、阿里巴巴、阶跃星辰、智谱AI和DeepSeek被列为国产基础大模型领域的核心力量,形成"基模五强"竞争格局 [1] 阿里巴巴 - 综合实力最强,通义千问模型在MMLU、CMMLU等权威评测中排名靠前,Qwen-72B能与GPT-4正面抗衡 [47][53] - 开源生态领先,Qwen系列在Hugging Face上持续维护,下载量超3亿次,社区活跃度高 [47][64] - 商业化能力突出,通过阿里云"百炼平台"服务超29万家企业,API调用量高 [61] - 资金投入巨大,近三年AI战略投入达3800亿元人民币,未来三年计划继续投入3800亿元 [39][61] - 技术布局全面,覆盖文本、图像、视频、语音等多模态领域 [64] 字节跳动 - 生态整合能力强,依托抖音、今日头条等平台,将AI嵌入内容推荐、协同办公等场景 [61] - C端落地领先,豆包APP日活跃用户数高,月活超1亿,产品交互体验优于竞品 [50][61] - 资金投入充足,2025年拨出超1500亿元战略支出,张一鸣亲自推动AI战略 [39][61] - 多模态能力覆盖电商、医疗、教育等场景,视频生成工具"即梦"在电商直播、虚拟偶像场景落地 [9][61] - 技术团队强大,整合光年之外、零一万物等团队,吸纳吴永辉等技术大牛 [39][61] DeepSeek - 技术突破显著,DeepSeek-R1在代码能力上超过Gemini 2.5,推理性能接近甚至超越其他模型 [39] - 极致性价比,训练成本仅为行业头部1/10,API定价低至OpenAI的1/30 [24][61] - 工程创新突出,通过降秩KV矩阵、混合专家架构优化计算效率 [24] - 开源策略获得开发者青睐,DeepSeek-Coder等模型性能极强,在GitHub社区影响力迅速上升 [39][47] - 在LMSYS Org榜单中数学、代码生成任务排名第一 [24] 阶跃星辰 - 多模态技术领先,发布22款基座模型,其中16款为多模态模型,覆盖文本、图像、视频、语音、音乐等 [11][24][39] - 视频生成技术突出,Step-Video-T2V为全球参数量最大、性能最优的开源视频生成模型 [61] - 商业化增长迅速,2024年多模态API调用量增长45倍,聚焦智能体与终端结合 [13] - 获得头部客户,在智能终端领域与OPPO、吉利、智元机器人等合作 [13][24] - 融资顺利,B轮融资数亿美元,有上海国有资本等强力支持 [39] 智谱AI - 政企市场优势明显,中标32个政府及企业项目,金额达1.29亿元,覆盖金融、医疗、政务等20余行业 [14][24] - 学术背景深厚,背靠清华大学,GLM系列模型在中文问答、代码生成等领域表现优异 [14][21] - 商业化收入增长显著,年增长超100%,是首个启动IPO的大模型公司 [14] - 技术布局全面,构建基座模型、推理模型、多模态模型全栈产品体系 [24] - 开源策略启动较晚,计划2025年启动,生态建设落后于阿里巴巴 [12] 未来竞争焦点 - 智能上限竞争,聚焦模型推理能力、长链思维链突破,如DeepSeek的RL机制、阶跃的多模态融合 [15][23] - 多模态与智能体落地,多模态能力是AGI基础,智能体落地将决定技术溢出价值 [23] - 商业化路径验证,需要持续验证开源生态、垂类场景、性价比策略的市场接受度 [23] - 成本控制关键,DeepSeek的工程优化、阿里的算力基建将是规模化决胜关键 [15] - 技术架构突破,阶跃星辰需要解决多模态理解与生成一体化架构难题 [11][13] 行业竞争排名 - 综合实力排名:阿里巴巴最强,字节跳动次之,DeepSeek和阶跃星辰最具潜力,智谱AI相对短板 [15][44][64] - 技术专长排名:DeepSeek在数理推理领域领先,阶跃星辰在多模态技术突出,阿里巴巴在开源生态领先 [20][33][44] - 商业化能力排名:阿里巴巴和字节跳动商业化成熟度最高,智谱AI在政企市场有优势,DeepSeek商业化路径待验证 [15][22][61]
DeepSeek和李飞飞之后,英伟达也看上阿里千问?
新浪财经· 2025-05-14 09:07
开源大模型生态 - 阿里通义千问成为全球开源大模型生态圈的核心焦点,英伟达、DeepSeek、李飞飞团队等顶级机构均基于其模型进行开发 [2][4] - 英伟达开源OCR系列模型(7B/14B/32B)均采用通义千问基础模型,其中OCR-Qwen-32B-Instruct在LiveCodeBench评测中pass@1达61.8%,超越OpenAI闭源模型O3-Mini和O1 [5] - 李飞飞团队基于Qwen2.5-32B-Instruct训练的s1-32B模型,数学及编码能力对标OpenAI o1和DeepSeek R1 [5] 模型性能与成本优势 - 千问3在AIME25奥数测评获81.5分(开源纪录)、LiveCodeBench突破70分超越Grok3、ArenaHard测评95.6分超越OpenAI-o1 [10] - 千问3部署成本为同类模型的1/3,推理成本不足DeepSeek-R1三成、Claude3.7的二十分之一 [11] - 中美模型性能差距从2023年17.5%缩至0.3%,阿里6大模型入选《2025 AI指数报告》,贡献度全球第三、中国第一 [6] 开源生态与开发者支持 - 千问全球下载量超3亿,HuggingFace社区占比超30%,衍生模型数量突破10万,超越Llama成全球第一开源模型 [8] - 提供200多款全模态/全尺寸开源模型(0.5B-235B),覆盖文本/视觉/语音/视频等,支持119种语言 [13][15] - 千问3获SGLang/vLLM/Ollama等主流平台适配,英特尔/高通/华为昇腾等产业链企业连夜接入 [18][19] 阿里AI战略布局 - 未来三年将投入3800亿元建设云和AI基础设施,超过去十年总和 [21] - 千问3在BFCL评测中Agent能力达70.8分,原生支持MCP协议和工具调用功能,降低Agent开发门槛 [21] - 阿里云百炼推出全生命周期MCP服务,魔搭社区上线MCP广场,计划开放AI Agent Store生态 [22][23]
北京人形机器人创新中心:以丰硕开源成果引领产业变革
机器人圈· 2025-05-08 18:00
具身智能产业发展现状 - 具身智能产业已进入加速期,是集人工智能、机械工程、传感器、新材料、脑科学等前沿学科于一体的综合性产业,开源生态对创新尤为重要 [1] - 北京人形机器人创新中心作为国家级平台,通过开源通用机器人平台"天工"、数据集"RoboMIND"和算法训练工具链构建领先的具身智能技术开源体系 [1] - 2025年4月北京人形机器人开源社区正式上线,包含博客、论坛、技术文档、开源项目等丰富功能,促进全球开发者协作创新 [1] "天工"机器人平台技术突破 - "天工"是全球首个全尺寸纯电驱实现拟人奔跑的人形机器人,实测平均时速10公里/小时,最高速度达12公里/小时,领先全球 [2] - 可在斜坡、楼梯、草地、碎石、沙地等多种复杂地形中平稳移动,具备出色的兼容扩展性,可灵活扩展软硬件功能模块 [2] - 已向行业开放软件开发文档、结构设计文档、URDF文档等关键技术资料,成为产学研协同创新的重要硬件平台 [2] 产业合作与数据生态建设 - 已有上百家合作伙伴基于"天工"平台进行二次开发,涌现出"天工行者"等应用型机器人产品 [4] - 北京大学、华中科技大学等顶尖学府通过联合实验室模式,在具身大脑等前沿领域展开深度合作,形成"基础研究-技术转化-产业应用"创新闭环 [4] - "RoboMIND"数据集已在官网、HuggingFace等平台累计下载15000余次,用户包括清华、中科大、宾夕法尼亚大学等高校及百度、阿里云等企业 [4][5] 开源成果与行业认可 - "RoboMIND"数据集获OS2ATC 2025"最佳开源智能突破奖"和"2025年度具身智能数据集构建奖",并被机器人顶级会议RSS 2025接收 [5] - 开源了对接成熟算法框架的训练工具链X-Humanoid training toolchain,简化开发者流程,降低开发门槛 [5] - 未来将逐步开源基础强化模仿学习框架、WFM具身世界模型、VLM具身视觉语言模型等一系列算法与工具 [6] 产业生态发展展望 - 以"平台+数据+生态"三位一体模式为核心零部件、系统集成、场景应用等产业链赋能 [6] - 将持续开放和维护更多高质量数据集,引领产业变革,推动具身智能向通用化落地加速演进 [6] - 随着"天工"与"RoboMIND"的持续迭代,更具活力的具身智能产业生态正在逐步完善 [6]
未知机构:国海汽车理想VLA司机大模型从动物进化到人类理想AITalk第二季核心-20250508
未知机构· 2025-05-08 10:20
纪要涉及的行业和公司 - 行业:汽车、人形机器人 - 公司:理想 纪要提到的核心观点和论据 VLA司机大模型 - 核心观点:VLA司机大模型是实现全自动驾驶的“生产工具级”技术突破[3] - 论据:三阶段进化,1.0规则算法和高精地图能力受限(昆虫智能);2.0端到端(E2E)模仿人类能力提升(哺乳动物智能);3.0融合3D/2D视觉、语言推理和行动控制,类人决策[1] - 论据:训练体系,训出云端VL基座模型,蒸馏成3.2B端侧MoE模型;后训练加入Action模仿学习模型规模近4B;强化训练融入人类驾驶习惯,产出车端运行的VLA模型[1] AI发展新认知 - 核心观点:AI价值升级需从“信息工具”迈向“生产工具”[3] - 论据:AI工具三级价值论,信息工具存在数据失真与效率瓶颈;辅助工具提升局部效率,但需人类干预;生产工具独立完成专业任务[1] - 核心观点:技术合作与开源加速行业进步[3] - 论据:开放自研四年的整车操作系统,推动技术共享,目标成为汽车领域的“安卓生态”[1] 创业逻辑与个人成长 - 核心观点:创业要聚焦“解决问题”与“人的能量” - 论据:创业核心方法论是坚持解决行业痛点,技术积累不可跳跃,规则算法到E2E再到VLA,需扎实基本功[2] - 论据:团队与自我成长方面,组建互补型团队,关注成员优点与成长;接受优缺点,以“成长”替代“改变”;能量源于亲密关系与团队连接[2] 业务抉择与市场愿景 - 核心观点:不做Robotaxi,专注家庭用车,参与人形机器人研发,争夺空间智能和语言智能市场前列位置 - 论据:预判L4自动驾驶后家庭用车更受青睐;参与人形机器人研发可攻克L4自动驾驶难题;立足中国有机会争夺市场前列位置[2] 其他重要但是可能被忽略的内容 - AI时代需保留人性多样性并关注“人的连接”[1][3]
构建开放协同创新生态
经济日报· 2025-05-07 05:59
政策支持 - 广东省每年择优支持一批开源社区和开源生态中心,每个给予最高800万元资助 [1] - 政策核心是从"单项扶持"转向"生态构建",以高能级平台和生态建设驱动产业整体升级 [1] - 推动广州、深圳数据交易所打造国家级数据交易场所,打造广东省数据要素集聚发展区 [1] 产业现状 - 广东去年人工智能核心产业规模超2200亿元,稳居全国第一方阵 [1] - 人工智能核心企业超过1500家 [1] - 全球产业链重构和核心技术"卡脖子"风险凸显,依赖企业单点突破不足 [1] 生态建设 - 开源社区通过代码共享、协同开发可加速技术迭代,降低企业自主研发成本、投入和风险 [1] - 开源生态建设嵌入"创新链—产业链—资金链—人才链"四链协同体系,成为连接枢纽 [2] - 推动形成"基础研究—技术攻关—成果产业化—科技金融—人才支撑"全过程创新生态链 [2] 挑战与机遇 - 需避免开源社区"重建设轻运营",平衡数据开放与安全、隐私、版权保护问题 [2] - 建立包容审慎监管机制,推动人工智能与机器人领域立法工作 [2] - 全球竞争转向生态体系较量,开源生态培育具前瞻性和现实意义 [2]
当AI竞赛进入深水区,阿里千问3靠什么赢下AI下半场?
21世纪经济报道· 2025-05-01 07:39
技术突破与性能优势 - 新一代通义千问模型Qwen3参数量仅为DeepSeek-R1的1/3,成本大幅下降但性能全面超越R1、OpenAI-o1等全球顶尖模型 [1] - Qwen3采用"混合推理模型"设计,集成"快思考"与"慢思考"模式,可根据任务复杂度动态调整计算资源 [5] - 预训练数据量达36万亿token(Qwen2.5为18万亿),涵盖119种语言和方言,数据规模翻倍 [5] - 总参数量235B,激活仅需22B,部署成本显著降低,仅需4张H20即可部署满血版,显存占用为同类模型的1/3 [6] - 在AIME25测评中获81.5分(刷新开源纪录)、LiveCodeBench突破70分(超越Grok3)、ArenaHard达95.6分(超越OpenAI-o1及DeepSeek-R1) [6][10] 开源生态与行业影响 - 采用Apache 2.0许可证开源,允许免费商用,直接对标Meta的Llama系列 [7] - 通义千问模型家族全球下载量突破3亿次,衍生模型超10万个,超越Llama成为全球最大开源模型生态 [7] - Qwen3发布后在Hugging Face、GitHub迅速获得反响,GitHub星标数突破19k [9] - 开源策略降低技术门槛,加速AI技术渗透率,为行业发展注入活力 [9] 商业化落地与产品矩阵 - MoE架构显著降低推理成本,支持"思考预算"设置,开发者可自定义深度思考的token消耗 [13] - 推出多参数模型矩阵:包括235B/30B的MoE模型及0.6B-32B的6款密集模型,覆盖手机端(4B)、电脑/汽车端侧(8B)、企业级部署(32B) [14] - Qwen3-4B性能媲美上一代72B模型,Qwen3-30B-A3B激活参数仅为QwQ-32B的10%但表现更优,降低中小企业使用门槛 [14] - 在BFCL评测中创70.8分新高(超越Gemini2.5-Pro、OpenAI-o1),降低Agent工具调用门槛 [14] - 原生支持MCP协议及强大工具调用能力,结合Qwen-Agent框架简化编码复杂性 [15] 战略投入与财务表现 - 公司宣布未来三年投入3800亿元加码AI与云计算基础设施,超过过去十年该领域投入总和 [1] - 云智能集团2024Q4收入317.42亿元(43.49亿美元),同比增长13%,AI相关产品收入连续六个季度实现三位数增长 [17] - 技术方向将强化智能体能力、拓展多模态技术、加强金融/医疗/制造等垂直行业应用 [17]
WeShop唯象总经理吴海波:AI创业已非“套壳应用”时代 | 2025 AI Partner大会
36氪· 2025-04-27 13:45
文章核心观点 - 2025年被视作AI应用爆发的元年,行业的核心命题在于如何跨越从AI技术到规模化应用的鸿沟,并寻找下一个颠覆性的AI超级应用 [1] - 大模型时代对创业公司构成生存危机,但技术快速迭代与开源生态的崛起也为创业者提供了弯道超车的机会 [4][5] - 创业公司应选择具有“战略纵深”的高复杂度专业场景,并打造“模型友好型”业务,通过借力开源生态实现快速技术迭代,从而在AI浪潮中生存和发展 [8][9][6] 行业趋势与竞争格局 - 大模型领域呈现“模型即应用”的趋势,依赖外部API接口的“套壳”业务模式面临被技术提供方瞬间颠覆的风险 [4] - 图像、视频及语言模型领域的技术迭代速度极快,没有模型能长期占据技术巅峰(SOTA魔咒),例如京东的HiDream模型在数月内从无名之辈跃居Hugging Face排行榜第二 [4] - 开源生态(如Meta的Llama)迅速崛起,任何闭源模型的“黑科技”大概率在2-3个月内出现开源替代品,这为中小团队提供了机会 [5][6] - AI时代用户对工具的忠诚度几乎为零,市场尚未形成真正垄断,新产品可通过技术创新低成本获取用户,这与传统互联网时代依赖巨额预算争夺流量的逻辑有本质区别 [11] WeShop唯象公司业务与模式 - WeShop唯象是国内首家、全球首批推出AI商拍工具的团队,专注于为电商企业提供AI商拍解决方案 [3] - 公司通过自研AI工具,帮助商家一键换模特、换背景,高效生成商品展示图,以替代传统高成本的模特拍摄、场地租赁和摄影师聘请 [3] - 公司业务脱胎于蘑菇街的时尚电商基因,目前主要面向海外客户,采用SaaS订阅模式收费 [3] - 公司团队规模在20人以下,其技术迭代几乎完全受益于开源生态的推动 [6][8] 技术演进与产品进展 - 2023-2024年:初期版本生成的商品图存在细节瑕疵,如服装褶皱不自然、人物面部“AI感”过重、背景合成生硬 [6] - 2025年:借助最新开源模型和微调技术,实现了质的飞跃,生成图能精准还原服装细节并模拟真实光影效果,在2K分辨率下与实拍图质感几乎难以区分 [6] - 具体场景对比:在商场陈列商品图生成中,2025年模型能生成更逼真的光影和更自然的商品摆放角度;在婚纱拍摄场景中,其生成图在服装纹理、褶皱细节上优于GPT-4o的结果 [7] - 公司技术策略是深入分析通用模型(如GPT-4o)的技术缺陷,预判开源社区突破方向,并快速整合优化,以在高分辨率(2K、4K)场景下持续拉开与通用模型的差距 [9] 创业公司的生存与发展策略 - 策略一:选择有“战略纵深”的场景,即复杂度高、对专业能力要求强、技术门槛高的场景,例如电商商品图需要100%精准还原实物细节,这非通用AI模型能轻易满足 [8] - 策略二:打造“模型友好型”业务,避免与大模型正面竞争,核心是让模型成为助力业务的“Beta”,而非自研大模型 [9] - 关键认知:创业者必须深入研究AI模型结构、技术演进方向和论文,以理解大模型能力边界并预判趋势,从而提前布局 [10] - 总体策略:创业公司无需追求“大而全”,应聚焦细分场景,在巨头“射程之外”寻找机会,通过持续创新与技术迭代“留在牌桌上”,为未来赢得可能性 [11]