Software and Internet

搜索文档
只因一个“:”,大模型全军覆没
自动驾驶之心· 2025-07-17 20:08
大模型漏洞研究 - 研究发现大模型(如GPT-4o、Claude-4、LLaMA3-70B)普遍存在被简单符号(如冒号、空格)或推理开头语(如"Thought process:"、"解")欺骗的问题,导致假阳性奖励信号 [4][5][7] - 实验显示GPT-4o对符号":"的假阳性率达35%,LLaMA3-70B对"Thought process:"的假阳性率高达60%-90% [22] - 漏洞具有跨语言普遍性,中文、日语等语言的开头语同样能诱发高假阳性率 [23] 对抗性攻击与模型表现 - 专用生成式奖励模型(如Multi-sub RM、Omni-Judge)和通用LLM在5个推理基准测试中均未能抵御对抗性响应 [17][19] - 模型大小与假阳性率无单调关系,7B-14B参数模型表现最佳,32B-72B模型因倾向自主解题导致假阳性率回升 [32] - 通过嵌入相似度搜索可自动生成新对抗性响应,使漏洞无限繁殖 [26] 解决方案与模型改进 - 腾讯AI Lab等机构构建增强训练数据集,结合2万条对抗样本与原始数据训练Master-RM模型 [29][30] - Master-RM基于Qwen2-5-7B-Instruct微调,跨数据集测试中对"万能钥匙"的假阳性率接近0%,与GPT-4o评估一致性达0.96 [31][33] - 研究团队包括腾讯AI Lab首席科学家俞栋、普林斯顿大学博士生Yulai Zhao等业界与学术专家 [38][39][41] 行业影响与研究方向 - 生成式奖励模型的核心机制漏洞暴露,依赖验证器反馈的RLVR流程面临挑战 [27][28] - 未来需加强模型稳健性研究,严格对抗评估RLHF工作流程 [35][36] - 相关论文与模型已开源,数据集和模型链接发布于Hugging Face平台 [48]
扎克伯格:我相信AI,所以不惜一切代价,投入数千亿美元,打造最强算力和团队
华尔街见闻· 2025-07-16 14:08
Meta的AI战略布局 - 公司提出"个人超级智能"新愿景,计划将AI技术直接提供给数十亿用户,与其他科技巨头专注企业级AI应用形成差异化 [1][7] - 创始人强调AI将成为生活中最重要的技术,将支撑公司所有开发并广泛影响社会 [4] - 公司价值观始终是将技术力量直接交到用户手中,关注个人生活需求而非仅经济生产力 [7] 基础设施投资 - 正在建设多个千兆瓦级数据中心集群,包括普罗米修斯和亥伯龙项目,后者将扩展至5吉瓦规模 [2][11] - 亥伯龙项目占地面积相当于曼哈顿相当部分区域 [2][11] - 采用创新建设方法如防飓风级别帐篷以加速部署 [10] 人才竞争策略 - 为50-70位顶尖研究人员展开激烈争夺,提供高额薪酬包(报道达1-2亿美元) [5][6] - 采用"最少人员配最多GPU"策略,提供研究员人均最高算力作为核心吸引力 [12] - 白手起家建立新团队,同时从其他实验室引入关键人才 [13] 产品形态与交互 - AI眼镜被视为未来最佳交互形态,能观察用户生活并实时提供信息支持 [8] - 眼镜将具备全息显示功能,生成用户界面,未来可能成为认知必需品 [8] - 产品方向侧重娱乐、文化和个人关系,而非单纯生产力工具 [7][8] 资本优势与竞争格局 - 公司现金流可完全自主支持数千亿美元AI投资,无需外部融资 [11] - 资本实力转化为基础设施优势,可能形成对资金受限竞争对手的壁垒 [10][11] - 强化学习领域的大规模资本投入可转化为服务质量提升 [10] 技术发展预期 - 观察到AI模型自我改进迹象,认为超级智能可能在未来2-3年内实现 [3][5] - 基于Llama的模型已能自主改进公司算法和AI系统 [9] - 工程师效率将因超级智能显著提升,改变软件开发进程 [9]
Google inks $2.4B AI licensing deal with Windsurf
Proactiveinvestors NA· 2025-07-14 22:08
关于作者背景 - 作者Emily Jarvie曾担任澳大利亚社区媒体的政治记者 后转战商业、法律及新兴迷幻剂领域报道 具备跨洲际媒体工作经验[1] 关于出版商定位 - 出版商Proactive专注于为全球投资者提供快速、可操作性的财经新闻 内容覆盖中小市值公司及蓝筹股、大宗商品等多元化投资领域[2][3] - 新闻团队分布于伦敦、纽约、多伦多等全球主要金融中心 形成跨时区报道网络[2] 内容覆盖领域 - 重点报道生物科技、制药、矿产、电池金属、油气等传统行业 同时追踪加密资产、电动汽车等新兴技术赛道[3] 技术应用策略 - 采用自动化工具与生成式AI辅助内容生产 但所有成品均经过人工编辑审核 符合搜索引擎优化标准[4][5] - 团队在保留数十年专业经验基础上 通过技术手段优化工作流程[4]
腾讯混元A13B用130亿参数达到千亿级效果,Flash Attention作者点赞
量子位· 2025-07-14 17:08
Hunyuan-A13B团队 投稿 量子位 | 公众号 QbitAI 腾讯混元,在开源社区打出名气了。 最新的 Hunyuan-A13B 模型仅凭借130亿激活参数,能和千亿级大模型掰手腕,引发全球开发者热议。 Flash Attention作者、普林斯顿大学计算机系教授 Tri Dao 都来赞叹它的性能和效率优势。 ArtificialAnlysis 团队还提供了具体性能数据,指出混元A13在其评测基准中领先于Qwen3 8B和14B,但落后于更大模型。能在单H200 GPU上以FP8精度运行。 模型API已经在腾讯云上线,输入价格每百万Tokens仅需0.5元,输出价格为每百万Tokens 2元。 精准卡位"甜蜜点",一张中端GPU就能跑 当前大模型圈有个让人纠结的现象:想要效果好就得用满血版大模型,但一看推理费用直接劝退一大批业务。 腾讯混元这次推出的Hunyuan-A13B,瞄准的就是这个痛点。 这款模型采用了细粒度MoE(混合专家)架构,总参数规模达到800亿,但每次推理只需激活130亿参数。这种设计让它在保持强大智能的同 时,推理吞吐量比同类前沿模型提升超过100%。 再加上原生支持的256K超长 ...
一年上线超 10 款产品,AI 时代如何做独立开发
AI前线· 2025-07-14 15:42
核心观点 - AI时代独立开发者可通过快速迭代、垂直切入和流量运营实现产品商业化 重点方向包括AI Coding、Agent和MCP生态 [7][16][51] - 开发者需平衡"快速验证"与"长期深耕" 通过标准化开发流程(SOP)实现高效产出 典型案例如一小时上线的AI红包封面生成器 [7][29][35] - MCP生态蕴含平台级机会 包括应用市场、服务路由和消费终端三大方向 其中MCP.so应用市场月访问量已达百万级 [64][67][69] 产品开发策略 速度与深度 - 采用"先起飞再加油"策略 AI搜索引擎ThinkAny首个版本仅用周末开发 上线后高峰月访问量达数十万 [4][7] - AI应用开发框架ShipAny预售4小时销售额突破1万美元 主打一小时快速部署SaaS网站 [4][9] - 过度追求速度导致部分产品浅尝辄止 如早期chatbot客户端未能持续运营错失机会 [10][12] 市场定位 - 通用型产品面临巨头竞争压力 ThinkAny曾对标Perplexity但受限于token成本和资源压力 [13][15] - 垂直赛道更适独立开发者 如CopyWeb专注网页复刻 Wegic主攻Landing Page生成 [16][56] - 建议采用"农村包围城市"策略 从细分场景切入再扩展 如Same从网页复刻转型全场景Coding Agent [16][56] 技术实现路径 开发方法论 - 建立标准化开发流程:Typescript+React技术栈 Stripe支付集成 Supabase数据存储 [31] - 开源项目github.com/all-in-aigc提供模板 商业模板ShipAny可缩短60%开发周期 [36][38] - 程序化SEO使MCP.so登顶谷歌搜索 关键步骤包括数据清洗、AI摘要和长尾词页面构建 [44][45] 效率工具 - 推荐NextJS/Remix框架和Shadcn组件库 配合Vercel部署实现小时级上线 [35][39] - AI套壳项目可通过Replicate+OpenRouter快速集成AI能力 典型变现模式为订阅+广告 [50] - 全栈开发社群1024.is提供技能培训 已孵化多个出海项目 [32] 行业机会分析 AI Coding赛道 - 商业化最成熟领域 Cursor等产品年营收达数千万美元 细分场景存在机会 [53] - 四类产品形态:编辑器(Cursor)、编程助手(Github Copilot)、智能体(Bolt)、垂类Agent(Wegic) [54][57] - 网页复刻工具CopyWeb已完成PMF验证 展示细分领域潜力 [8][56] Agent生态 - 通用Agent由Manus等头部企业主导 垂直Agent如Lovart(设计) ClipClap(视频)更具机会 [58][60] - Agent基础设施包含工具链、记忆存储等方向 类似K8S基建需求旺盛 [61][65] - 建议用Agent重构传统SaaS 如营销视频生成工具ClipClap月活增长300% [58] MCP平台经济 - MCP.so应用市场三个月平均月访问量百万 获a16z引用显示全球影响力 [8][67] - 三大商业方向:服务器开放标准(dxt扩展)、能力路由平台(OpenRouter模式)、消费终端(ChatWise等) [64][68][69] - 类比"AI时代豌豆荚" 应用市场可解决MCP服务器分发需求 [67] 运营增长手段 冷启动策略 - ProductHunt打榜使ThinkAny获日榜第四 后续获YouTube大V自发传播 [42] - 关键打榜技巧:提前提交产品、争取Featured标签、社群动员投票 [42] - 买量冲榜可作为辅助手段 部分第三方服务专攻此领域 [42] 流量运营 - 社交平台内容输出构建影响力 ShipAny预售获用户自发传播 [19][20] - 程序化SEO使MCP.so占据关键词搜索首位 需持续更新sitemap [44][45] - 建议加入"哥飞的朋友们"SEO社群学习长效运营方法 [44] 典型产品数据 - ThinkAny:2023年3月上线 东南亚市场月访问量峰值数十万 [4] - ShipAny:2023年12月发布 预售4小时销售额1万美元 [4] - MCP.so:2023年11月上线 近三月月均访问量百万 [8] - AI红包封面生成器:1小时开发完成 春节档流量增长500% [7]
阿里副总裁叶军确认已离职
第一财经· 2025-07-14 14:27
阿里巴巴高管变动 - 阿里巴巴集团副总裁、前钉钉总裁叶军已离职,已走完审批流程,具体离职日期未定 [1] - 叶军2007年加入阿里,历任多个部门负责人,曾带领团队打造办公云、阿里大脑、宜搭、"浙政钉""浙里办"等产品 [1] - 叶军离职背景与钉钉创始人陈航回归有关,陈航将出任阿里集团钉钉CEO [2] 叶军个人背景 - 叶军2001年本科毕业于四川大学材料科学与工程学院凝聚态物理专业,2004年硕士毕业于同校同专业,2007年博士毕业于四川大学计算机学院计算机应用专业 [1]
报名开启|7月27日,世界人工智能大会腾讯论坛邀您共探AI新纪元
腾讯研究院· 2025-07-11 15:20
人工智能发展趋势 - 人工智能已从理论设想发展为变革世界的核心力量,驱动产业升级、革新用户体验、重构人机协同[1] - 2024年生成式AI实现深化融合与爆发式应用,多模态大模型和具身智能等新范式拓宽AI能力边界[1] - 2025年人工智能将进一步突破认知极限,更深度助力千行百业并塑造科技未来[1] 2025世界人工智能大会腾讯论坛 - 论坛将于7月27日在上海举办,由腾讯华东总部、腾讯优图实验室等多家腾讯系机构联合支持[1] - 主题为"智能涌现",聚焦AI技术与产业深度融合趋势,围绕大模型垂直落地、场景创新突破、生态共建协同三大议题[2] - 将系统展示腾讯在多元场景中的AI应用成果,体现"科技向善"的立体化实践[2] - 腾讯将分享Agent领域最新进展,与行业领军人物共话智能时代新机遇[2] 腾讯AI布局 - 腾讯通过优图实验室、Robotics X实验室等机构在AI领域进行多维度布局[1] - 公司在AI应用场景中已取得显著成果,涉及云智能、游戏、浏览器、输入法等多个产品线[1][2]
谷歌将Gemini人工智能助手引入Wear OS智能手表
环球网资讯· 2025-07-10 11:19
Gemini AI助手扩展 - 谷歌计划在未来几周内将Gemini人工智能助手引入运行Wear OS 4及更新系统的智能手表 涉及品牌包括Pixel、三星、OPPO、一加和小米 [1] - 用户可通过语音指令、长按手表侧边按钮或点击应用图标启动Gemini 功能覆盖烹饪建议、天气查询等实用场景 [1] - Gemini支持跨应用任务执行 如邮件总结、日历事件添加 以及信息记录(停车位置提醒、购物清单等) [3] AI搜索功能升级 - Circle to Search功能升级 用户通过圈选、高亮、涂鸦或点击触发AI Mode 搜索结果直接呈现AI概览并支持深度追问 [3] - Google Lens的AI Mode流程简化 安卓和iOS版谷歌应用均已支持 游戏场景中可识别角色或获取策略 [3] - AI概览界面优化 关键信息更突出且视觉元素更丰富 [3] 订阅服务与生成式AI - Pixel 9 Pro用户将免费获得一年Google AI Pro订阅 包含Veo 3功能 可通过文字生成带自然音频的短视频 [3]
腾讯3D生成模型上新!线稿可变“艺术级”3D模型,鹅厂内部设计师也在用
量子位· 2025-07-08 17:11
腾讯混元3D模型更新 - 腾讯推出艺术级3D生成模型Hunyuan3D-PolyGen 支持生成面数上万的复杂几何模型 [1] - 该模型可将3D模型转化为资产 应用于游戏开发后美术师建模效率提升超70% [2] - 拓扑功能已在混元3D工作台上线 每日提供20次免费使用额度 [3] 艺术级3D生成模型特性 - 美术级模型需满足游戏实时加载需求 面数少于普通3D生成Mesh [4] - 要求布线质量高效规整 便于后续UV展开和骨骼绑定 [4] - 采用组件式结构 支持后期编辑拆分 [4] 模型实测表现 - 支持文字或1-4张参考图输入 提供三角面/四边形拓扑选项 [7] - 波音747测试案例显示 拓扑后细节保留且表面划分更精细 [10][12][14] - 毛绒玩具线稿和奔驰车模测试中 模型能降低面数并保持结构完整 [15][17][18] - 相比竞品 该模型能以更低面数实现更优细节 [20] 技术实现原理 - 采用自回归网格生成框架 通过顶点与面片建模进行空间推理 [24] - 核心流程:网格Token化→自回归模型处理→网格还原 [25][27][30] - 创新BPT压缩技术 使表征mesh的token数量减少74% 单面所需token从9个降至2.3个 [33][36] - 结合强化学习后训练 提升生成稳定性与布线规整度 [40][41][43] 应用与行业影响 - 模型已直接应用于公司内部游戏工作室开发流程 [2] - 支持复杂物体建模 可处理2万+面的高细节模型 [37] - 技术突破可能重塑游戏/影视等行业的3D内容生产模式 [1][2][20]
插件式AI应用异军突起 手机厂商原生智能助手陷增长瓶颈
中国产业经济信息网· 2025-07-08 08:02
AI应用市场格局变化 - 国内AI应用主要分为四大类型:插件形态AI应用、手机厂商原生AI类APP、互联网及AI科技企业原生APP和PC端网页AI应用 [1] - 插件形态AI应用用户规模爆发式增长,5月月活跃用户达5.8亿,同比增速106.0%,跃居四大类型首位 [1] - 插件形态AI应用深度融入微信、抖音、百度等超级APP,月人均使用次数达34.7次 [1] 插件形态AI应用 - 抖音、腾讯凭借AI搜索服务等入口扩展功能快速抢占市场,月活用户分别达2亿和1.6亿 [1] - 业内专家认为这种模式形成"产业基础设施+多元生态应用"的发展路径,推动各行业升级并孕育新竞争模式 [1] - 巨头正优化插件AI的入口位置和形态,如QQ浏览器和京东的AI入口分别增加至3个和2个 [3] 手机厂商原生AI类APP - 5月月活跃用户规模为5亿,同比增速仅为9.5%,面临增长瓶颈 [2] - 华为小艺、OPPO小布助手等应用因功能差异化不足导致用户增长和使用频次放缓,月人均使用次数为17.7次 [2] - 正面临互联网企业原生APP强力拉新造成的用户分流 [2] 互联网及AI科技企业原生APP - 5月整体月活用户规模2.7亿,呈现两极分化 [2] - DeepSeek和豆包两大应用月活跃用户数分别突破1.68亿和1.3亿 [2] - 83.8%的中小AI应用月活用户不足百万,且大部分用户数量持续下滑 [2] PC端网页AI应用 - 5月整体月活跃用户数1.9亿,同样呈现分化态势 [2] - 随着巨头加码AI插件布局,缺乏核心竞争力的中小开发者将面临更大生存压力 [2] AI应用生态构建 - 玩家将自身优势能力绑定AI插件构建"新护城河",如腾讯布局AI搜索、社交互动、文案插件,抖音发力AI搜索、图像及视频处理插件 [3] - 巨头插件AI的布局不仅在细分领域挤压手机厂商等AI原生APP的市场份额,更改变用户搜索、获取新闻、处理图像等传统习惯 [3]