Workflow
Software and Internet
icon
搜索文档
8 月、上海,每年一度的谷歌开发者大会来了
Founder Park· 2025-07-22 20:27
AI创业者大赛 - 本月有三场AI创业者大赛值得关注 包括两场AI低代码大赛和一场人工智能硬件科创大赛 [1] - 美团NoCode社区举办「晒作品 赢奖励」比赛 提交创意应用或实用工具可赢取美团卡 活动时间为2025年7月 [6] - YouWare举办AI App Challenge 设置2000美金奖金池 活动时间为2025年7月10日至7月31日 [7][8] - 外滩大会人工智能硬件科创大赛由蚂蚁集团主办 提供近30万奖金和头部资源链接机会 报名截止时间为8月4日 [8][9] Google开发者活动 - 2025 Google开发者大会将于8月13日至14日在上海举办 聚焦Android AI web和cloud技术领域的创新成果 [8][10] - Founder Park联合Google推出「从模型到行动」AI工作坊 最后一站北京站活动将于7月26日举办 [2][4] - 工作坊活动面向AI产品开发者 技术决策者和工程师 提供Gemini技术落地实践和多模态融合方式解析 [7][10] 活动参与信息 - NoCode社区比赛作品提交链接为https://feedback.nocode.cn/posts/_y0pzfAQjVM3PyTnFRwP [6] - YouWare挑战赛报名链接为https://www.youware.com/project/youware-ai-app-challenge-nlop1gtqlv [8] - 外滩大会官网报名通道为https://www.inclusionconf.com/aiCompetition 提交后截图可加速审核 [8] - Google开发者大会专属报名链接为https://googleads.link/25iopucngeekpark [10]
繁花有声|高德与阿里云一起,开启智慧出行新范式
搜狐网· 2025-07-22 14:22
合作背景与核心产品 - 高德开放平台与阿里云合作,作为“繁花计划”首批标杆伙伴,面向企业开发者推出地图服务产品MCP Server [1] - 合作旨在通过技术能力与生态资源的深度协同,助力开发者高效构建标准化地图服务,加速智能化场景落地 [1] 技术能力与创新 - MCP Server基于阿里云通义千问系列大模型,利用其领先的自然语言处理与多模态交互能力 [1] - 产品实现从文本指令到可视化地图的精准转化,用户可通过自然语言生成个性化出行方案(如智能路径规划)[1] - 生成的出行方案可一键同步至高德地图APP,支持实时浏览及动态调整路线,以提升交互效率与体验 [1] - MCP Server提供12大核心功能,包括步行、驾车、骑行路径规划、距离测量、周边搜索、定位服务、地理编码等,实现全场景开箱即用 [2] 市场生态与渠道 - 依托阿里云云市场广泛的开发者覆盖能力,MCP Server可快速触达数百万开发者与企业用户,加速技术落地与市场渗透 [1] - 开发者可通过阿里云百炼平台的可视化配置工具,无需编写代码即可快速生成连接高德MCP的专属智能体,灵活适配复杂业务场景需求 [1] - 产品在阿里云云市场开放购买 [2] 未来发展规划 - 高德与阿里云计划继续深化在AI领域的合作,共同推进高德AI能力在阿里云云市场的开放 [1] - 双方将携手开拓海外市场,助力中国企业出海 [1]
只因一个“:”,大模型全军覆没
自动驾驶之心· 2025-07-17 20:08
大模型漏洞研究 - 研究发现大模型(如GPT-4o、Claude-4、LLaMA3-70B)普遍存在被简单符号(如冒号、空格)或推理开头语(如"Thought process:"、"解")欺骗的问题,导致假阳性奖励信号 [4][5][7] - 实验显示GPT-4o对符号":"的假阳性率达35%,LLaMA3-70B对"Thought process:"的假阳性率高达60%-90% [22] - 漏洞具有跨语言普遍性,中文、日语等语言的开头语同样能诱发高假阳性率 [23] 对抗性攻击与模型表现 - 专用生成式奖励模型(如Multi-sub RM、Omni-Judge)和通用LLM在5个推理基准测试中均未能抵御对抗性响应 [17][19] - 模型大小与假阳性率无单调关系,7B-14B参数模型表现最佳,32B-72B模型因倾向自主解题导致假阳性率回升 [32] - 通过嵌入相似度搜索可自动生成新对抗性响应,使漏洞无限繁殖 [26] 解决方案与模型改进 - 腾讯AI Lab等机构构建增强训练数据集,结合2万条对抗样本与原始数据训练Master-RM模型 [29][30] - Master-RM基于Qwen2-5-7B-Instruct微调,跨数据集测试中对"万能钥匙"的假阳性率接近0%,与GPT-4o评估一致性达0.96 [31][33] - 研究团队包括腾讯AI Lab首席科学家俞栋、普林斯顿大学博士生Yulai Zhao等业界与学术专家 [38][39][41] 行业影响与研究方向 - 生成式奖励模型的核心机制漏洞暴露,依赖验证器反馈的RLVR流程面临挑战 [27][28] - 未来需加强模型稳健性研究,严格对抗评估RLHF工作流程 [35][36] - 相关论文与模型已开源,数据集和模型链接发布于Hugging Face平台 [48]
扎克伯格:我相信AI,所以不惜一切代价,投入数千亿美元,打造最强算力和团队
华尔街见闻· 2025-07-16 14:08
Meta的AI战略布局 - 公司提出"个人超级智能"新愿景,计划将AI技术直接提供给数十亿用户,与其他科技巨头专注企业级AI应用形成差异化 [1][7] - 创始人强调AI将成为生活中最重要的技术,将支撑公司所有开发并广泛影响社会 [4] - 公司价值观始终是将技术力量直接交到用户手中,关注个人生活需求而非仅经济生产力 [7] 基础设施投资 - 正在建设多个千兆瓦级数据中心集群,包括普罗米修斯和亥伯龙项目,后者将扩展至5吉瓦规模 [2][11] - 亥伯龙项目占地面积相当于曼哈顿相当部分区域 [2][11] - 采用创新建设方法如防飓风级别帐篷以加速部署 [10] 人才竞争策略 - 为50-70位顶尖研究人员展开激烈争夺,提供高额薪酬包(报道达1-2亿美元) [5][6] - 采用"最少人员配最多GPU"策略,提供研究员人均最高算力作为核心吸引力 [12] - 白手起家建立新团队,同时从其他实验室引入关键人才 [13] 产品形态与交互 - AI眼镜被视为未来最佳交互形态,能观察用户生活并实时提供信息支持 [8] - 眼镜将具备全息显示功能,生成用户界面,未来可能成为认知必需品 [8] - 产品方向侧重娱乐、文化和个人关系,而非单纯生产力工具 [7][8] 资本优势与竞争格局 - 公司现金流可完全自主支持数千亿美元AI投资,无需外部融资 [11] - 资本实力转化为基础设施优势,可能形成对资金受限竞争对手的壁垒 [10][11] - 强化学习领域的大规模资本投入可转化为服务质量提升 [10] 技术发展预期 - 观察到AI模型自我改进迹象,认为超级智能可能在未来2-3年内实现 [3][5] - 基于Llama的模型已能自主改进公司算法和AI系统 [9] - 工程师效率将因超级智能显著提升,改变软件开发进程 [9]
Google inks $2.4B AI licensing deal with Windsurf
Proactiveinvestors NA· 2025-07-14 22:08
关于作者背景 - 作者Emily Jarvie曾担任澳大利亚社区媒体的政治记者 后转战商业、法律及新兴迷幻剂领域报道 具备跨洲际媒体工作经验[1] 关于出版商定位 - 出版商Proactive专注于为全球投资者提供快速、可操作性的财经新闻 内容覆盖中小市值公司及蓝筹股、大宗商品等多元化投资领域[2][3] - 新闻团队分布于伦敦、纽约、多伦多等全球主要金融中心 形成跨时区报道网络[2] 内容覆盖领域 - 重点报道生物科技、制药、矿产、电池金属、油气等传统行业 同时追踪加密资产、电动汽车等新兴技术赛道[3] 技术应用策略 - 采用自动化工具与生成式AI辅助内容生产 但所有成品均经过人工编辑审核 符合搜索引擎优化标准[4][5] - 团队在保留数十年专业经验基础上 通过技术手段优化工作流程[4]
腾讯混元A13B用130亿参数达到千亿级效果,Flash Attention作者点赞
量子位· 2025-07-14 17:08
模型性能与效率优势 - 仅130亿激活参数实现与千亿级大模型竞争的性能表现 [2] - 推理吞吐量比同类前沿模型提升超过100% [11] - 在单张H200 GPU上以FP8精度运行 [4] - 原生支持256K超长上下文窗口 [12][20] 技术架构创新 - 采用细粒度MoE架构,总参数量达800亿但仅激活130亿参数 [11] - 支持SGLang、vLLM和TensorRT-LLM等主流推理框架 [14] - 提供多种量化格式支持,单张中端GPU即可部署 [14][15] - 具备"快慢思考"双模式,支持推理时动态切换效率与深度模式 [37] 训练策略与数据构建 - 基于20T Tokens高质量训练数据,专项强化STEM领域数据 [19] - 采用三阶段训练策略:基础训练、快速退火和长文本训练 [19][20][23] - 后训练分两阶段:第一阶段专注数理代码能力,第二阶段提升对话创意能力 [22][24] - 通过多角色合成数据引擎生成五角色(用户/规划师/工具/智能体/检查员)训练数据 [29] 核心能力表现 - 在AIME2024数学竞赛获87.3分,超越OpenAI-o1-1217的74.3分 [37] - BBH推理测试达89.1分,优于Deepseek-R1-0120的83.7分 [37] - Agent能力在BFCL v3评测获78.3分,显著超过OpenAI-o1-1217的67.8分 [36][37] - 在C3-Bench评测取得63.5分,领先于Qwen3-A22B的51.7分 [37] 商业化应用进展 - 腾讯云API定价为输入每百万Tokens 0.5元,输出每百万Tokens 2元 [7] - 已在腾讯内部400多个业务场景完成实际验证 [38] - 模型权重、代码和技术报告已在GitHub和Hugging Face开源 [38] - 在RULER长文本评测中表现出优异稳定性 [37]
一年上线超 10 款产品,AI 时代如何做独立开发
AI前线· 2025-07-14 15:42
核心观点 - AI时代独立开发者可通过快速迭代、垂直切入和流量运营实现产品商业化 重点方向包括AI Coding、Agent和MCP生态 [7][16][51] - 开发者需平衡"快速验证"与"长期深耕" 通过标准化开发流程(SOP)实现高效产出 典型案例如一小时上线的AI红包封面生成器 [7][29][35] - MCP生态蕴含平台级机会 包括应用市场、服务路由和消费终端三大方向 其中MCP.so应用市场月访问量已达百万级 [64][67][69] 产品开发策略 速度与深度 - 采用"先起飞再加油"策略 AI搜索引擎ThinkAny首个版本仅用周末开发 上线后高峰月访问量达数十万 [4][7] - AI应用开发框架ShipAny预售4小时销售额突破1万美元 主打一小时快速部署SaaS网站 [4][9] - 过度追求速度导致部分产品浅尝辄止 如早期chatbot客户端未能持续运营错失机会 [10][12] 市场定位 - 通用型产品面临巨头竞争压力 ThinkAny曾对标Perplexity但受限于token成本和资源压力 [13][15] - 垂直赛道更适独立开发者 如CopyWeb专注网页复刻 Wegic主攻Landing Page生成 [16][56] - 建议采用"农村包围城市"策略 从细分场景切入再扩展 如Same从网页复刻转型全场景Coding Agent [16][56] 技术实现路径 开发方法论 - 建立标准化开发流程:Typescript+React技术栈 Stripe支付集成 Supabase数据存储 [31] - 开源项目github.com/all-in-aigc提供模板 商业模板ShipAny可缩短60%开发周期 [36][38] - 程序化SEO使MCP.so登顶谷歌搜索 关键步骤包括数据清洗、AI摘要和长尾词页面构建 [44][45] 效率工具 - 推荐NextJS/Remix框架和Shadcn组件库 配合Vercel部署实现小时级上线 [35][39] - AI套壳项目可通过Replicate+OpenRouter快速集成AI能力 典型变现模式为订阅+广告 [50] - 全栈开发社群1024.is提供技能培训 已孵化多个出海项目 [32] 行业机会分析 AI Coding赛道 - 商业化最成熟领域 Cursor等产品年营收达数千万美元 细分场景存在机会 [53] - 四类产品形态:编辑器(Cursor)、编程助手(Github Copilot)、智能体(Bolt)、垂类Agent(Wegic) [54][57] - 网页复刻工具CopyWeb已完成PMF验证 展示细分领域潜力 [8][56] Agent生态 - 通用Agent由Manus等头部企业主导 垂直Agent如Lovart(设计) ClipClap(视频)更具机会 [58][60] - Agent基础设施包含工具链、记忆存储等方向 类似K8S基建需求旺盛 [61][65] - 建议用Agent重构传统SaaS 如营销视频生成工具ClipClap月活增长300% [58] MCP平台经济 - MCP.so应用市场三个月平均月访问量百万 获a16z引用显示全球影响力 [8][67] - 三大商业方向:服务器开放标准(dxt扩展)、能力路由平台(OpenRouter模式)、消费终端(ChatWise等) [64][68][69] - 类比"AI时代豌豆荚" 应用市场可解决MCP服务器分发需求 [67] 运营增长手段 冷启动策略 - ProductHunt打榜使ThinkAny获日榜第四 后续获YouTube大V自发传播 [42] - 关键打榜技巧:提前提交产品、争取Featured标签、社群动员投票 [42] - 买量冲榜可作为辅助手段 部分第三方服务专攻此领域 [42] 流量运营 - 社交平台内容输出构建影响力 ShipAny预售获用户自发传播 [19][20] - 程序化SEO使MCP.so占据关键词搜索首位 需持续更新sitemap [44][45] - 建议加入"哥飞的朋友们"SEO社群学习长效运营方法 [44] 典型产品数据 - ThinkAny:2023年3月上线 东南亚市场月访问量峰值数十万 [4] - ShipAny:2023年12月发布 预售4小时销售额1万美元 [4] - MCP.so:2023年11月上线 近三月月均访问量百万 [8] - AI红包封面生成器:1小时开发完成 春节档流量增长500% [7]
阿里副总裁叶军确认已离职
第一财经· 2025-07-14 14:27
阿里巴巴高管变动 - 阿里巴巴集团副总裁、前钉钉总裁叶军已离职,已走完审批流程,具体离职日期未定 [1] - 叶军2007年加入阿里,历任多个部门负责人,曾带领团队打造办公云、阿里大脑、宜搭、"浙政钉""浙里办"等产品 [1] - 叶军离职背景与钉钉创始人陈航回归有关,陈航将出任阿里集团钉钉CEO [2] 叶军个人背景 - 叶军2001年本科毕业于四川大学材料科学与工程学院凝聚态物理专业,2004年硕士毕业于同校同专业,2007年博士毕业于四川大学计算机学院计算机应用专业 [1]
报名开启|7月27日,世界人工智能大会腾讯论坛邀您共探AI新纪元
腾讯研究院· 2025-07-11 15:20
人工智能发展趋势 - 人工智能已从理论设想发展为变革世界的核心力量,驱动产业升级、革新用户体验、重构人机协同[1] - 2024年生成式AI实现深化融合与爆发式应用,多模态大模型和具身智能等新范式拓宽AI能力边界[1] - 2025年人工智能将进一步突破认知极限,更深度助力千行百业并塑造科技未来[1] 2025世界人工智能大会腾讯论坛 - 论坛将于7月27日在上海举办,由腾讯华东总部、腾讯优图实验室等多家腾讯系机构联合支持[1] - 主题为"智能涌现",聚焦AI技术与产业深度融合趋势,围绕大模型垂直落地、场景创新突破、生态共建协同三大议题[2] - 将系统展示腾讯在多元场景中的AI应用成果,体现"科技向善"的立体化实践[2] - 腾讯将分享Agent领域最新进展,与行业领军人物共话智能时代新机遇[2] 腾讯AI布局 - 腾讯通过优图实验室、Robotics X实验室等机构在AI领域进行多维度布局[1] - 公司在AI应用场景中已取得显著成果,涉及云智能、游戏、浏览器、输入法等多个产品线[1][2]
谷歌将Gemini人工智能助手引入Wear OS智能手表
环球网资讯· 2025-07-10 11:19
Gemini AI助手扩展 - 谷歌计划在未来几周内将Gemini人工智能助手引入运行Wear OS 4及更新系统的智能手表 涉及品牌包括Pixel、三星、OPPO、一加和小米 [1] - 用户可通过语音指令、长按手表侧边按钮或点击应用图标启动Gemini 功能覆盖烹饪建议、天气查询等实用场景 [1] - Gemini支持跨应用任务执行 如邮件总结、日历事件添加 以及信息记录(停车位置提醒、购物清单等) [3] AI搜索功能升级 - Circle to Search功能升级 用户通过圈选、高亮、涂鸦或点击触发AI Mode 搜索结果直接呈现AI概览并支持深度追问 [3] - Google Lens的AI Mode流程简化 安卓和iOS版谷歌应用均已支持 游戏场景中可识别角色或获取策略 [3] - AI概览界面优化 关键信息更突出且视觉元素更丰富 [3] 订阅服务与生成式AI - Pixel 9 Pro用户将免费获得一年Google AI Pro订阅 包含Veo 3功能 可通过文字生成带自然音频的短视频 [3]