Software and Internet
搜索文档
超过ChatGPT!“灵光”上线4天下载突破100万;谷歌否认拿用户邮件训练AI模型丨AIGC日报
创业邦· 2025-11-23 09:09
谷歌AI数据政策澄清 - 谷歌否认使用用户Gmail内容训练其Gemini AI模型,称相关报道不准确且未更改任何设置[2] - 公司澄清Gmail智能功能已存在多年,用户无需通过禁用功能来避免数据被用于AI训练[2] 蚂蚁集团AI助手“灵光”市场表现 - 蚂蚁集团通用AI助手“灵光”上线4天下载量突破100万,成为App Store中国区免费榜第六[2] - 该产品百万下载速度超越ChatGPT(首周60.6万)和Sora2(破百万用5天),创下新纪录[2] AI搜索用户行为趋势 - 德国Bitkom调查显示50%受访者有时通过AI聊天而非传统搜索引擎查找信息,16-29岁年轻用户中该趋势更显著[2] - 年轻网民中5%完全依赖AI搜索,11%主要使用AI,20%使用AI与搜索引擎比例相当,30%至少偶尔使用AI[2] 苹果AI多模态感知研究 - 苹果新研究使大语言模型能通过分析音频和运动数据文本描述,零样本识别如洗碗等12种用户活动[2] - 采用“后期多模态传感器融合”技术,结合LLM推理与传统传感器数据,提升活动识别精度[2]
Washington man spent 31 years at Microsoft only to be fired on a call with 120 others. Here's how he's rebuilding at 60
Yahoo Finance· 2025-11-23 00:30
公司裁员事件 - 微软一名任职31年的首席产品经理负责人迈克·科斯特西茨在事先未获任何通知的情况下被裁员,其所在约120人的团队职位被取消 [1][2] - 科斯特西茨曾担任Azure Kubernetes Service on Azure Stack HCI团队的负责人 [2] 行业裁员趋势 - 科技行业在2025年10月宣布裁员33,281人,较9月的5,639人出现急剧跃升,并且是该月所有私营部门中录得的最高裁员数字 [5] - 2025年迄今,科技公司已宣布裁员141,159人,较2024年同期增长17% [5] - 除微软外,亚马逊于10月裁员14,000人,Meta在其“超智能”部门裁减约600个职位,Alphabet也削减了云部门员工 [3] 裁员驱动因素 - 根据高管再就业公司Challenger, Gray & Christmas的数据,成本削减和人工智能是雇主在10月提及的裁员首要原因 [4] - 所谓的“DOGE影响”是2025年整体裁员的主要原因 [4] - 亚马逊提及裁员原因在于向AI自动化转型 [3] 就业市场影响 - 尽管美国整体失业率保持相对低位,但自年初以来已出现上升 [6] - 科技职位的竞争加剧,报告显示数千名技能娴熟的专业人士正在竞争更少的职位空缺,这些职位通常要求具备AI、数据科学和自动化方面的更新技能组合 [6]
Google's AI momentum begins to worry OpenAI's Sam Altman
Youtube· 2025-11-22 03:24
谷歌的财务实力与AI战略优势 - 谷歌母公司Alphabet是当周唯一上涨的“科技七巨头”股票,其重获的人工智能发展势头令竞争对手感到担忧 [1] - 谷歌拥有强大的财务指标,包括32%的毛利率、1120亿美元的现金储备以及上季度240亿美元的自由现金流 [3] - 谷歌能够利用其搜索业务的利润来资助整个AI战略,而竞争对手OpenAI尚未盈利且正在快速消耗现金 [3] AI竞赛中的竞争格局与市场叙事 - OpenAI的Sam Altman在内部备忘录中承认,谷歌近期的进展可能为其带来暂时的经济阻力,这反映了AI领域“炒作 vs 硬经济”的叙事 [2] - 谷歌的财务实力使其能够承受市场下行,但市场泡沫的破裂或消退对OpenAI而言可能是生存性威胁 [3] - 谷歌高管近期关于“泡沫”的言论引发市场关注,可能影响竞争格局 [4] 谷歌的全栈能力与产品分发优势 - 谷歌在面向消费者的产品方面拥有丰富经验,其AI产品易于小型企业主、工厂工人、创业者等普通用户使用 [4][5] - 公司具备全栈能力,包括分发渠道、生态系统、芯片、模型和产品,这是当前看好其前景的核心论点 [5] - 谷歌本周发布的Gemini 3模型并未仅限于订阅用户,而是通过AI模式向全球数十亿潜在用户推送,触及大量非主动寻找聊天机器人的用户 [6][7]
腾讯元宝上线视频生成能力
观察者网· 2025-11-21 16:58
产品发布与核心能力 - 公司于11月21日正式发布并开源HunyuanVideo 1.5模型,该模型基于Diffusion Transformer架构,参数量为8.3B,是一款轻量级视频生成模型 [1] - 模型支持生成5-10秒的高清视频,用户可通过输入文字描述实现文生视频,或上传图片配合文字描述将静态图片转化为动态视频 [1] - 模型具备全面核心能力,支持中英文输入的文生视频与图生视频,图生视频能力展现出图像与视频的高度一致性 [4] - 模型具备强指令理解与遵循能力,能精准实现多样化场景,包括运镜、流畅运动、写实人物和人物情绪表情等多种指令,并支持写实、动画、积木等多种风格 [4] 技术规格与画质 - 模型可原生生成5–10秒时长的480p和720p高清视频,并可通过超分模型提升至1080p电影级画质 [4] - 模型还支持在生成的视频中嵌入中英文文字 [4] 性能基准对比 - 在文生视频任务GSB评测中,相较于Seedance pro模型,HunyuanVideo胜率为+11.02% [6] - 在文生视频任务GSB评测中,相较于Kling2.1模型,HunyuanVideo胜率为+12.6% [6] - 在文生视频任务GSB评测中,相较于Wan2.2模型,HunyuanVideo胜率为+17.12% [6] - 在图生视频任务GSB评测中,相较于Kling2.1模型,HunyuanVideo胜率为+9.72% [6] - 在图生视频任务GSB评测中,相较于Wan2.2模型,HunyuanVideo胜率为+12.65% [6]
Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会
创业邦· 2025-11-21 14:05
产品核心升级 - 公司在Gemini 3 Pro之后,迅速推出其最强文生图模型Nano Banana的Pro版本,展现出持续的技术领先优势[3] - 新产品Nano Banana Pro又名Gemini 3 Pro Image,整合了Gemini 3 Pro的多模态理解能力以及谷歌搜索的知识库,能理解现实语义与物理逻辑[6] - 此次升级不仅仅是提升图像生成质量,其技术进步被行业观察者认为使AI图像创作迈入了新阶段[6][12] 核心技术特性 - 模型支持最多14张输入图片的混合,并能保持角色和场景的一致性[7] - 文字渲染能力大幅提升,能准确生成清晰可读的文字和艺术字,并支持多种语言的直接渲染[9][14] - 模型具备强大的文本理解与翻译能力,可将图片中的英文文字翻译成韩文、中文等语言,同时保持原有设计风格[9] - 产品支持2K、4K高清分辨率,能满足专业制作要求,并支持从社交媒体方形图片到电影级2.76:1超宽画幅等多种宽高比[25] - 用户可自由调整生成图像的光线、镜头、对焦、色彩调校等物理属性和构图[26] 多模态与知识集成 - 功能背后是Gemini 3 Pro的强大推理能力,模型能理解图像内容和文字的语义上下文[19] - 模型与Google Search深度集成,可基于庞大的知识库和实时信息生成准确的图表、地图和信息图[19] - 结合高级推理能力,模型能生成针对性强、专业的信息图,帮助用户将复杂知识可视化,例如生成准确的生物机制解释图或生态系统能量转移图[22][24] 应用场景与工作流 - 模型支持从创意到生产的完整工作流,营销团队可用其快速设计生成营销素材,实现创意快速迭代[13][17] - 模型能根据指定角色和主题生成定制化图片,例如生成以雪人为核心角色进行各种节日活动的系列场景图片[27][29] - 产品工作流可与Veo 3视频生成模型整合,用户能以生成的图片作为关键帧继续一键生成视频[30] 市场发布策略 - 公司发布策略全面,覆盖从开发者到普通用户的各个层面[33] - 对于普通用户,模型将通过Gemini应用提供,免费用户有限额配额,Google AI Plus、Pro和Ultra订阅用户享有更高配额[33] - 对于开发者,模型已通过Gemini API在Google AI Studio和Vertex AI中提供,企业级用户可享受预配置吞吐量、按需付费及高级安全过滤器等功能[33] - 模型定价为每张图像$0.139(1K/2K分辨率)或$0.24(4K分辨率),作为对比,Gemini 2.5 Flash Image的定价为每张图像$0.039[34] - 技术还将集成到新的AI开发平台Google Antigravity以及Adobe Photoshop和Figma等第三方设计工具中[34] 内容安全与验证 - 公司在Gemini app中推出AI图像验证功能,依托其2023年推出的SynthID数字水印技术,用户可上传图像查询是否为AI生成[36] - 即日起,在Gemini app、Vertex AI、Google Ads、Flow等平台上由Nano Banana Pro生成的图像将被嵌入C2PA元数据,具备可追溯来源和创作信息的“数字档案”[37]
腾讯元宝迎来重大更新:可一句话生视频
新浪科技· 2025-11-21 12:42
产品发布 - 公司官宣推出“一句话生视频”能力,用户无需视频剪辑基础即可将文字构思或静态照片转化为生动视频 [1] - 用户可通过“文字生视频”和“图生视频”两种方式体验新功能,例如输入文字描述“一只猫在赛博朋克城市中漫步”或上传照片并配以简单指令 [1] - 新功能旨在为用户带来“人人都是视频创作者”的全新体验,使静态画面动态化变得轻而易举 [1] 技术基础 - 新能力的底层技术基于腾讯混元最新开源的HunyuanVideo 1.5模型 [1] - 模型支持中英文的文生视频与图生视频,能实现图像与视频在色调、细节上的高度一致性,并精准遵循运镜、流畅运动等多样化指令 [1] - 模型以仅8.3B的轻量尺寸,实现开源最强的效果,可在14G显存的消费级显卡上流畅运行 [1]
别再肝了!Google 发布 SIMA 2,你的下一个游戏搭子可能是个 AI
深思SenseAI· 2025-11-21 12:14
SIMA 2核心能力突破 - 新一代通用智能体SIMA 2与Gemini深度集成,能够在虚拟世界理解并执行自然语言指令,执行连续多步操作[1] - SIMA 2超越简单指令执行,通过Gemini作为推理中枢具备思考和推理能力,能够解释意图并描述下一步行动[2] - 智能体可以理解复杂细致指令,执行冗长任务并给予反馈,互动体验接近真实玩家[5] 技术实现与训练方法 - 训练使用大量带语言标注的人类演示视频,结合Gemini自动生成标注进行强化学习[2] - 具备初步对话式协作能力,能用自然语言向用户解释意图并描述行动计划[2] - 通过反复试验加Gemini反馈评估的闭环实现自我改进,不断学会完成更复杂新任务[11] 多模态与环境适应能力 - 借助Gemini出色多模态能力,可以理解图像、表情符号和简洁语言进行互动[6][7] - 在《我的世界》学会挖矿后,能将采集能力迁移到其他未训练过的游戏中[7] - 在Genie 3新生成的3D模拟世界中,即使未受专门训练也能正确辨别方向并执行指令[9][10] 行业意义与发展路径 - SIMA 2是迈向通用交互式具身智能的重要一步,为机器人领域智能具身化提供核心能力模块[15][16] - 通过大规模多世界数据训练叠加Gemini推理能力,将分散的专用系统能力整合进统一通用智能体框架[15] - 虚拟3D世界为具身智能提供可控低成本训练环境,Gemini加SIMA 2组合让会思考的LLM迈向会动手做事的Agent[14]
广州南沙软件与互联网产业高质量发展大会举行
证券日报网· 2025-11-20 14:24
行业活动与平台建设 - 广州南沙举行“互联湾区·驱动未来”软件与互联网产业高质量发展大会 [1] - 广州市垂类大模型服务中心(南沙)、广州市南沙区数据出境综合服务中心等一批高能级平台现场落地 [1] - 12家优质企业签约落户南沙,汇聚创新资源 [1] 产业发展与业绩表现 - 人工智能正深刻重塑全球产业格局和竞争态势 [1] - 软件与互联网产业作为数字经济核心部分,对建设现代化产业体系意义凸显 [1] - 南沙互联网软件信息技术服务业今年前三季度营收同比增长23.2% [1] - 南沙全年互联网软信产业预计实现营收近200亿元 [1] 产业集聚区规划 - 南沙区游戏产业集聚区、微短剧产业集聚区揭牌成立 [2] - 在南沙街道以环宇城数创中心为枢纽,培育“游戏研发创新高地” [2] - 在东涌镇以越秀iPARK粤港智谷为核心,打造“游戏发行运营枢纽” [2] - 在港湾街道以蒲州广场为依托,打造微短剧产业集聚区 [2] - 形成“一园两区”功能互补、链条协同的产业生态 [2] 产业载体与基础配套 - 南沙在南沙街道、港湾街道、东涌镇等区域建设全要素配套+高品质载体 [1] - 加速软件企业在南沙集聚与裂变,为工业企业带来“数”“智”启蒙 [1]
广州南沙软信营收剑指两百亿,工信部四大院所护航有何深意
南方都市报· 2025-11-19 23:36
行业增长态势 - 今年前三季度,广州南沙的互联网、软件和信息技术服务业营收同比增长23.2% [1] - 自2020年以来,南沙规上互联网软信企业从43家增至125家,预计今年全年营收近200亿元 [1] - 目前,亿元级企业已突破40家,产业集中度不断提升,结构持续优化 [4] 产业发展阶段与政策演变 - 2015-2020年为起步阶段,产业政策以培育市场主体、构建基础生态为主 [4] - 2021年起,产业步入规模化发展期,逐步从基础软件延伸至工业互联网、智能网联汽车、智慧城市等融合应用领域 [4] - 政策支持从普惠性转向精准化,例如对首版次软件研发、数据跨境流动等关键环节实施差异化奖励 [5] 国家级战略支持与高能级平台 - 获得国家工业信息安全发展研究中心、工信部电子第四研究所、工信部电子第五研究所、工业和信息化部中国信息通信研究院四大国家级院所大力支持 [1][5] - 广州市垂类大模型服务中心(南沙)落地,为人工智能垂类大模型研发应用提供一站式服务 [8] - 广州市南沙区数据出境综合服务中心为企业提供数据出境全链条服务,降低合规成本 [8] 产业生态构建与空间布局 - 产业发展从注重单个企业引进转向全产业链生态构建,形成“一园两区”特色载体 [9][11] - 越秀iPARK粤港智谷作为广州市软件特色园,已吸引三七互娱子公司、立功科技等一批龙头企业落户 [9] - 揭牌游戏产业集聚区与微短剧产业集聚区,南沙街道、东涌镇、港湾街道进行功能互补的产业布局 [11] 企业案例与协同效应 - 联想懂的通信入驻南沙三年来,收入实现翻番,并在首年即扭亏为盈 [5] - 联想推动产业链企业文石科技落户南沙,预计相关设备将于明年实现本地生产,形成“以商招商”的良性互动 [9]
Google releases Gemini 3.0 model, closes gap on ChatGPT
Youtube· 2025-11-19 03:06
公司评级与股价表现 - Loop机构将Alphabet评级上调至买入,认为对人工智能的热情已消除了市场的担忧之墙[1] - Alphabet股价今日上涨,部分原因在于伯克希尔哈撒韦公司披露了对其的大量持股[6] - 公司在过去三个月的表现优于其他大型人工智能参与者[3] 产品与市场动态 - 流向Gemini的流量份额同比翻倍,使市场对搜索业务的担忧不再成立[1] - Gemini 3.0模型发布,这是一个在多项基准测试中领先的模型[4][9] - Gemini应用月活跃用户数达6.5亿,正缩小与OpenAI ChatGPT的差距,后者在8月宣布周用户数为7亿[5] 技术与生态系统优势 - 公司拥有从芯片到云生态的深度整合能力,包括自研TPU芯片,这为Gemini的发布提供了支撑[4][7] - 有传闻称Gemini 3.0模型是使用谷歌TPU开发的,若属实将标志着其定制芯片能力的重大突破[7][8] - 公司在推理领域的能力可能成为英伟达的潜在重要竞争者[8][9] 行业竞争与市场情绪 - 万亿美元规模的人工智能热潮存在非理性成分,若泡沫破裂没有公司能免疫[3] - 市场当前不仅关注模型质量或流量,更关注资本支出、债务上升的作用以及循环融资等问题[2] - Gemini模型将通过谷歌的默认体验集成给数十亿搜索用户,使其融入人工智能生态,这是其他参与者不具备的分布优势[4][7]