Workflow
Gemma3
icon
搜索文档
计算机ETF(512720)涨超1.6%,国产大模型技术突破或催化算力需求
每日经济新闻· 2025-08-11 11:56
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容 的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱: news_center@staff.hexun.com 注:如提及个股仅供参考,不代表投资建议。指数/基金短期涨跌幅及历史表现仅供分析参考,不 预示未来表现。市场观点随市场环境变化而变动,不构成任何投资建议或承诺。文中提及指数仅供参 考,不构成任何投资建议,也不构成对基金业绩的预测和保证。如需购买相关基金产品,请选择与风险 等级相匹配的产品。基金有风险,投资需谨慎。 每日经济新闻 (责任编辑:董萍萍 ) 8月11日,计算机ETF(512720)涨超1.6%。 华创证券指出,最新发布的Kimi K2模型以320亿激活参数实现万亿级规模扩展,采用自研 MuonClip优化器突破训练稳定性瓶颈,在代码、数学、工具调用三大核心赛道全面超越Gemma3、 Llama4等国际开源模型,并跻身大模型竞技场总榜TOP5。该模型通过ACEBench启发的智能体数据合成 技术覆盖数千种工具场景,显著提升任务泛化能力,可自主生成复杂前 ...
OpenAI将启动5000万美元基金,支持非营利组织和社区组织;Kimi K2登顶全球开源模型冠军丨AIGC日报
创业邦· 2025-07-20 09:15
Manus联合创始人总结经验教训 - Manus联合创始人季逸超发布技术解析长文 复盘公司从年初爆火至今的开发思路与教训 [1] - 公司近期被曝裁员、清空国内多平台账号等消息 [1] 中国开源模型全球领先 - 全球开源模型排行榜中 Kimi K2、DeepSeek R1、Qwen3等3个中国模型排名前三 [2] - Kimi K2成为全球最强开源模型 领先谷歌Gemma3和Meta旗下Llama4 [2] - 榜单由数千位开发者通过动态盲测进行投票 [2] OpenAI启动5000万美元基金 - OpenAI宣布启动5000万美元初始基金 支持非营利组织和社区组织 [3] - 基金将用于教育、经济机遇、社区组织和医疗保健等领域 扩大AI影响力并促进创新 [3] - 公司还将支持社区主导的研究和创新 利用AI促进公共福祉 [3] Perplexity挑战谷歌移动市场地位 - Perplexity正与移动设备制造商洽谈 希望在智能手机上预装Comet AI移动浏览器 [4] - 公司CEO表示说服OEM将默认浏览器从Chrome改为Comet并不容易 [4] - 强调了移动平台上用户惯性带来的挑战 [4]
首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」
量子位· 2025-06-09 17:27
视觉语言模型(VLM)技术突破 - 视觉语言模型正经历从「感知」到「认知」的关键跃迁,实现多模态交互的全新可能 [1][2] - 传统VLM依赖文本token间接翻译视觉信息,导致在高清图像微小物体、视频动态细节等场景中表现不足 [2] - 研究团队提出「像素空间推理」范式,将推理战场从文本空间拓展到像素空间,实现原生视觉操作 [2][3] 像素空间推理的核心优势 - 模型可自主触发视觉变焦、时空标记等原生操作,在像素矩阵上直接完成闭环推理,避免信息衰减 [6] - 视觉主导推理机制使模型能捕捉传统方法难以处理的空间关系与动态细节,如具身视觉导航、复杂视频理解等场景 [6] - 打破文本对视觉语义的「翻译牢笼」,实现与人类视觉认知同构的推理能力 [7] 学习陷阱与激励机制 - 指令微调模型面临「认知惰性」挑战,表现为负面反馈循环和路径依赖惯性 [8] - 研究团队设计内在好奇心激励配合外在正确性激励的强化学习方案,鼓励模型练习视觉操作 [9][10] - 通过像素推理率约束和操作效率约束,在探索与计算成本间找到平衡 [10][11] 性能表现与行业影响 - 基于Qwen2.5-VL-7B构建的Pixel-Reasoner在四大视觉推理基准测试中表现优异:V* Bench 84.3%准确率,超越GPT-4o和Gemini-2.5-Pro [13][15] - 在TallyQA-Complex、InfographicsVQA、MVBench等测试中均实现显著性能提升,展现「小模型大能力」特性 [19][20] - 像素空间推理为VLM开启「第二思维通道」,推动多模态模型真正理解世界复杂性 [21]
三星芯片,大搞AI
半导体芯闻· 2025-05-09 19:08
三星电子DS部门AI战略调整 - 公司DS部门近期宣布将内部AI运营模式改为"开放的多模型环境",打破此前以自主技术构建的封闭式AI系统"DS Assistant"为主的策略 [1] - 该调整旨在将AI应用扩展到半导体设计和开发领域,以提升工作效率 [1] - 继上月引入Meta模型后,本月新增谷歌"Gemma3"和微软"Phi-4"模型,形成包含不同参数版本的开源模型组合 [1][2] 外部AI模型应用细节 - 公司采用轻量级小型语言模型(sLM)作为内部AI主要架构 [1] - 根据不同工作场景灵活调用模型:处理数字数据时优先使用Phi-4,分析图像信息时采用Gemma3 [2] - 对Meta的Llama4评估显示其在语言混合问题改进、知识推理及代码生成等任务中表现优异 [2] 技术路线演变背景 - 2023年3月曾短暂允许使用ChatGPT,但因半导体数据泄露风险在三周内叫停 [2] - 同年12月推出自研DS Assistant解决安全问题,但封闭架构导致外部数据利用受限 [2] - 内部反馈指出需要整合外部AI以增强半导体设计等核心业务竞争力 [2] 数据安全实施方案 - 所有外部AI模型均采用内部部署(On-premise)方式运行,通过在工作场所安装数据服务器避免信息外泄 [3] - 公司表示将按工作类型持续评估并引入有助于效率提升的开源模型 [3]