Workflow
灵光AI
icon
搜索文档
2025年AI的温柔转身:从颠覆行业到生活“缝补匠”
36氪· 2025-12-26 18:06
行业年度回顾与趋势 - 2025年AI行业完成了从单点技术突破到全生态构建的关键一跃,大模型竞争从单纯比拼参数转向追求极致效率,智能体告别概念演示迈入规模化落地新阶段 [1] - 2025年初,DeepSeek凭借高效推理迅速出圈,Meta持续深耕开源生态,中国模型厂商在算力受限环境下通过算法优化交出瞩目答卷 [1] - 2025年9月,阿里云在云栖大会发布Qwen3系列,万亿参数级别的Qwen3 Max正式亮相,定位为“AI时代的Android”,拉开生态竞争序幕 [1] - 2025年末,AI技术已渗透日常生活,Nano Banana的AI生图让创意生成成为全民日常,灵光的“全民开发”生态让普通人零门槛搭建应用,豆包手机让智能体验融入掌心 [1] 辅助技术与无障碍应用 - 灵光AI应用帮助用户创建沟通工具,例如为偏瘫失语老人创建带有大按钮的语音应用,上线仅1个月用户已成功创建1200万个闪应用 [2] - Be My Eyes应用覆盖全球上百个国家,汇聚超过820万名明眼志愿者与74万名视障用户,2025年全面接入GPT-4o,通过实时视觉描述帮助视障用户独立决策 [2][3] - 2025年12月13日,集成视觉语言大模型与3D体素神经网络的智能导盲犬“小蒜”在深圳黄木岗交通枢纽试点,视障乘客可通过口头指令激活路径规划 [3] - 深圳地铁在黄木岗枢纽设置智能导盲服务点,通过视觉语言大模型驱动的服务填补人工引导无法覆盖的24小时空白 [4] 教育普惠与AI应用 - 豆包推出的AI英语外教Owen已陪伴超过700万人次在线练习口语,服务覆盖偏远山区留守儿童及城市儿童 [5] - 在贵州石阡困牛山红军学校,希沃提供的算力“盒子”将普通教室变为实时响应的AI空间,自动生成深度反馈报告以精准指出学生薄弱环节 [5] - 在甘肃会宁,快手公益捐建的数字教室利用可灵AI的生成能力,帮助乡村孩子将画作变成动画并编写代码,截至2025年底已有超过1.4万名乡村学生通过此类教室接触前沿科技 [5] 医疗健康与AI赋能 - 浙江的医院使用AI医生分身在线上解答老人高血压用药疑问并提醒定期复查 [5] - 蚂蚁的阿福能回答健康医学疑问、解读报告、生成运动打卡计划,实现一对一对话与量身定制 [6] - 中国电信贵港分公司与贵港市人民医院打造的AI医学影像远程诊断云平台,使乡镇卫生院的CT影像能瞬间呈现在三甲医院专家眼前,至今已完成3000例辅助诊断 [6]
东北证券:AI应用进入发展新纪元 行业有望迎来重估
智通财经网· 2025-11-26 15:56
行业整体观点 - 2025年第三季度计算机板块基本面已发生变化 云基建 AI 信创板块表现更为突出[1] - 2026年计算机行业AI商业化落地叠加基本面修复预期和国产大模型迅速突破 行业有望迎来重估[1] 谷歌模型进展 - Gemini 3 Pro在LMArena排行榜以1501 Elo分数位居榜首 显著优于2.5 Pro[1] - 在Humanity's Last Exam和GPQADiamond测试中分别取得37.5%和91.9%的高分 展现博士级推理能力[1] - 在多模态测试MMMU-Pro和Video-MMMU上表现分别达到81%和87.6% 重新定义多模态推理[1] - Nano Banana Pro可可视化想法和设计内容 凭借Gemini 3先进推理能力创建图像和实用内容[2] - Nano Banana Pro可连接谷歌搜索知识库 快速创建食谱快照或可视化天气体育等实时信息[2] 阿里巴巴模型进展 - 千问APP是阿里巴巴基于通义大模型推出的C端AI应用 定位为智能个人助手[3] - 千问APP公测版上线标志阿里大模型技术从B端向C端用户进一步渗透[3] - 截至2025年11月24日 千问APP下载量已突破1000万[3] - 灵光AI具备灵光对话 闪应用及灵光开眼三大功能[3] - 灵光对话支持语音朗读 3D数字模型 生成式插图 图表数据 可交互地图等[3] - 灵光闪应用可一句话生成 30秒至1分钟完成 实现实时交互[3] - 灵光开眼通过实时视频流解析理解物理世界 支持双向语音交互及文生图/视频等多种功能[3]
马斯克、奥特曼都忍不住夸好的 Gemini 3,到底多强?
搜狐财经· 2025-11-24 15:33
行业竞争格局 - 谷歌Gemini 3 Pro在LMArena排行榜上以1501的Elo评分位列第一,显著领先于竞争对手Grok-4.1-thinking(1484)和Grok-4.1(1465)[1] - 在多个核心基准测试中,Gemini 3 Pro表现突出,例如在Humanity's Last Exam学术推理测试中达到37.5%(无工具)和45.8%(使用搜索和代码执行),远超Gemini 2.5 Pro的21.6%和GPT-5.1的26.5%[7] - 在数学能力测试AIME 2025中,Gemini 3 Pro达到95.0%(无工具)和100%(使用代码执行),优于GPT-5.1的94.0%和Claude Sonnet 4.5的87.0%[7] 技术能力突破 - Gemini 3在多模态理解方面表现卓越,在MMMU-Pro测试中获得81.0%的成绩,高于GPT-5.1的76.0%和Gemini 2.5 Pro的68.0%[7] - 在屏幕理解能力测试ScreenSpot-Pro中,Gemini 3达到72.7%的准确率,远超Gemini 2.5 Pro的11.4%和GPT-5.1的3.5%[7] - 长上下文处理能力显著提升,在MRCR v2(8-needle)测试中,128k上下文平均准确率达77.0%,1M上下文点准确率达26.3%,明显优于其他模型[7] 产品应用创新 - Gemini 3实现了从"写代码"到"生成应用"的跨越,能够根据截图快速生成完整可交互的网页应用,包括游戏和工具类产品[11][13] - 具备生成交互式SVG动态界面的能力,可在30多秒内创建带开关功能的可交互小灯泡等复杂UI元素[20] - 谷歌计划在Gemini App中引入"生成式UI"功能,用户查询将获得可互动的界面响应,如动态旅游杂志和可编辑的dashboard[20] 市场影响与用户反应 - Gemini 3发布后在社交媒体引发广泛关注,各种测评和试玩内容大量涌现,形成现象级传播效应[2][6] - 用户实测反馈积极,能够快速生成《我的世界》网页版、3D乐高编辑器和MacOS网页版等复杂应用[13][16] - 行业领袖如埃隆·马斯克对Gemini 3的表现给予肯定,标志着谷歌在AI行业竞争力的显著提升[25] 生产力变革 - Gemini 3将AI从"智能搜索框"升级为"万能生产引擎",显著改变了内容创作和软件开发的工作流程[24][25] - 该技术使非专业用户也能通过自然语言指令快速创建功能性应用,降低了软件开发的技术门槛[21][22] - 生成式UI的出现预示着交互式AI从概念走向实际应用,可能对设计师和程序员的工作方式产生深远影响[20][21]