灵光AI - 财报，业绩电话会，研报，新闻

灵光AI

搜索文档

2025年AI的温柔转身：从颠覆行业到生活“缝补匠”

36氪· 2025-12-26 18:06

行业年度回顾与趋势 - 2025年AI行业完成了从单点技术突破到全生态构建的关键一跃，大模型竞争从单纯比拼参数转向追求极致效率，智能体告别概念演示迈入规模化落地新阶段 [1] - 2025年初，DeepSeek凭借高效推理迅速出圈，Meta持续深耕开源生态，中国模型厂商在算力受限环境下通过算法优化交出瞩目答卷 [1] - 2025年9月，阿里云在云栖大会发布Qwen3系列，万亿参数级别的Qwen3 Max正式亮相，定位为“AI时代的Android”，拉开生态竞争序幕 [1] - 2025年末，AI技术已渗透日常生活，Nano Banana的AI生图让创意生成成为全民日常，灵光的“全民开发”生态让普通人零门槛搭建应用，豆包手机让智能体验融入掌心 [1] 辅助技术与无障碍应用 - 灵光AI应用帮助用户创建沟通工具，例如为偏瘫失语老人创建带有大按钮的语音应用，上线仅1个月用户已成功创建1200万个闪应用 [2] - Be My Eyes应用覆盖全球上百个国家，汇聚超过820万名明眼志愿者与74万名视障用户，2025年全面接入GPT-4o，通过实时视觉描述帮助视障用户独立决策 [2][3] - 2025年12月13日，集成视觉语言大模型与3D体素神经网络的智能导盲犬“小蒜”在深圳黄木岗交通枢纽试点，视障乘客可通过口头指令激活路径规划 [3] - 深圳地铁在黄木岗枢纽设置智能导盲服务点，通过视觉语言大模型驱动的服务填补人工引导无法覆盖的24小时空白 [4] 教育普惠与AI应用 - 豆包推出的AI英语外教Owen已陪伴超过700万人次在线练习口语，服务覆盖偏远山区留守儿童及城市儿童 [5] - 在贵州石阡困牛山红军学校，希沃提供的算力“盒子”将普通教室变为实时响应的AI空间，自动生成深度反馈报告以精准指出学生薄弱环节 [5] - 在甘肃会宁，快手公益捐建的数字教室利用可灵AI的生成能力，帮助乡村孩子将画作变成动画并编写代码，截至2025年底已有超过1.4万名乡村学生通过此类教室接触前沿科技 [5] 医疗健康与AI赋能 - 浙江的医院使用AI医生分身在线上解答老人高血压用药疑问并提醒定期复查 [5] - 蚂蚁的阿福能回答健康医学疑问、解读报告、生成运动打卡计划，实现一对一对话与量身定制 [6] - 中国电信贵港分公司与贵港市人民医院打造的AI医学影像远程诊断云平台，使乡镇卫生院的CT影像能瞬间呈现在三甲医院专家眼前，至今已完成3000例辅助诊断 [6]

Artificial Intelligence

Artificial Intelligence

东北证券：AI应用进入发展新纪元行业有望迎来重估

智通财经网· 2025-11-26 15:56

行业整体观点 - 2025年第三季度计算机板块基本面已发生变化云基建 AI 信创板块表现更为突出[1] - 2026年计算机行业AI商业化落地叠加基本面修复预期和国产大模型迅速突破行业有望迎来重估[1] 谷歌模型进展 - Gemini 3 Pro在LMArena排行榜以1501 Elo分数位居榜首显著优于2.5 Pro[1] - 在Humanity's Last Exam和GPQADiamond测试中分别取得37.5%和91.9%的高分展现博士级推理能力[1] - 在多模态测试MMMU-Pro和Video-MMMU上表现分别达到81%和87.6% 重新定义多模态推理[1] - Nano Banana Pro可可视化想法和设计内容凭借Gemini 3先进推理能力创建图像和实用内容[2] - Nano Banana Pro可连接谷歌搜索知识库快速创建食谱快照或可视化天气体育等实时信息[2] 阿里巴巴模型进展 - 千问APP是阿里巴巴基于通义大模型推出的C端AI应用定位为智能个人助手[3] - 千问APP公测版上线标志阿里大模型技术从B端向C端用户进一步渗透[3] - 截至2025年11月24日千问APP下载量已突破1000万[3] - 灵光AI具备灵光对话闪应用及灵光开眼三大功能[3] - 灵光对话支持语音朗读 3D数字模型生成式插图图表数据可交互地图等[3] - 灵光闪应用可一句话生成 30秒至1分钟完成实现实时交互[3] - 灵光开眼通过实时视频流解析理解物理世界支持双向语音交互及文生图/视频等多种功能[3]

马斯克、奥特曼都忍不住夸好的 Gemini 3，到底多强？

搜狐财经· 2025-11-24 15:33

行业竞争格局 - 谷歌Gemini 3 Pro在LMArena排行榜上以1501的Elo评分位列第一，显著领先于竞争对手Grok-4.1-thinking（1484）和Grok-4.1（1465）[1] - 在多个核心基准测试中，Gemini 3 Pro表现突出，例如在Humanity's Last Exam学术推理测试中达到37.5%（无工具）和45.8%（使用搜索和代码执行），远超Gemini 2.5 Pro的21.6%和GPT-5.1的26.5%[7] - 在数学能力测试AIME 2025中，Gemini 3 Pro达到95.0%（无工具）和100%（使用代码执行），优于GPT-5.1的94.0%和Claude Sonnet 4.5的87.0%[7] 技术能力突破 - Gemini 3在多模态理解方面表现卓越，在MMMU-Pro测试中获得81.0%的成绩，高于GPT-5.1的76.0%和Gemini 2.5 Pro的68.0%[7] - 在屏幕理解能力测试ScreenSpot-Pro中，Gemini 3达到72.7%的准确率，远超Gemini 2.5 Pro的11.4%和GPT-5.1的3.5%[7] - 长上下文处理能力显著提升，在MRCR v2（8-needle）测试中，128k上下文平均准确率达77.0%，1M上下文点准确率达26.3%，明显优于其他模型[7] 产品应用创新 - Gemini 3实现了从"写代码"到"生成应用"的跨越，能够根据截图快速生成完整可交互的网页应用，包括游戏和工具类产品[11][13] - 具备生成交互式SVG动态界面的能力，可在30多秒内创建带开关功能的可交互小灯泡等复杂UI元素[20] - 谷歌计划在Gemini App中引入"生成式UI"功能，用户查询将获得可互动的界面响应，如动态旅游杂志和可编辑的dashboard[20] 市场影响与用户反应 - Gemini 3发布后在社交媒体引发广泛关注，各种测评和试玩内容大量涌现，形成现象级传播效应[2][6] - 用户实测反馈积极，能够快速生成《我的世界》网页版、3D乐高编辑器和MacOS网页版等复杂应用[13][16] - 行业领袖如埃隆·马斯克对Gemini 3的表现给予肯定，标志着谷歌在AI行业竞争力的显著提升[25] 生产力变革 - Gemini 3将AI从"智能搜索框"升级为"万能生产引擎"，显著改变了内容创作和软件开发的工作流程[24][25] - 该技术使非专业用户也能通过自然语言指令快速创建功能性应用，降低了软件开发的技术门槛[21][22] - 生成式UI的出现预示着交互式AI从概念走向实际应用，可能对设计师和程序员的工作方式产生深远影响[20][21]