人工智能编程

搜索文档
马斯克入局AI编程!xAI新模型限时免费用:256K上下文,主打一个速度快
搜狐财经· 2025-08-29 09:32
产品发布与定位 - xAI推出智能编程模型Grok Code Fast 1 主打快速和经济性 支持256K上下文 并限时7天免费[1] - 新模型适用于多步骤、工具调用密集的复杂自动化任务 定位为轻量级智能编码助手[14] - 与GitHub Copilot、Cursor、Cline、Kilo Code、Roo Code、opencode和Windsurf等平台深度合作 可在IDE中快速理解开发者指令[1][4] 性能表现 - 在ToyBench基准测试中整体排名第5 得分62.67% 仅次于GPT-5(93.67%)、Claude Opus 4(84.94%)、Gemini 2.5 Pro(65.00%)和DeepSeek Reasoner(73.83%)[2] - 在内部基准测试SWE-Bench-Verified的完整子集上成绩达70.8% 性能处于编程模型中较为领先水平[4] - 支持256K上下文窗口 每分钟最多处理480个请求 约200万token[6] 技术特点 - 采用全新模型架构 使用专门代码语料库预训练 并通过真实世界拉取请求与编码任务数据微调[4] - 具备优秀的指令遵循能力 思考时长在几秒内 指令缓存命中率超过90%[3][4] - 支持多种编程语言包括Type、Python、Java、Rust、C++和Go 可完成从创建项目到点对点bug修复的全流程任务[4] 定价策略 - 输入tokens每百万收费0.2美元(约1.4元人民币) 输出tokens每百万收费1.5美元(约10.7元人民币) 缓存调用tokens每百万仅需0.02美元(约0.14元人民币)[11][15] - 价格仅为Claude Sonnet 4(10.05美元)和GPT-5(18.77美元)的十分之一 性价比显著[1][2][16] - 相比同系列产品Grok-4(3.00-15.00美元)和Grok-3(3.00-15.00美元)具有明显价格优势[11] 市场竞争力 - 在编码代理任务(agentic coding)方面表现优异 性能比肩Claude Sonnet 4和GPT-5[1][7] - 通过开发者主观评估与自动化行为监控确保模型快速可靠 满足日常编码任务需求[6] - 与Grok-4形成差异化定位 Grok-4更适合单次问答类场景如复杂概念解析或深度调试[14]
Anthropic发布Claude 4.1编程测试称霸
搜狐财经· 2025-08-07 11:01
技术升级与性能表现 - Anthropic发布Claude Opus 4 1模型 在SWE-bench Verified基准测试中达到74 5%的成绩 超越OpenAI的o3模型69 1%和谷歌Gemini 2 5 Pro的67 2% [2] - 新模型增强了研究和数据分析能力 特别是细节跟踪和自主搜索功能 采用混合推理方法 支持64 000个Token处理复杂问题 [4] - 模型被归类为AI安全等级3ASL-3 实施最严格的安全协议以防止盗用和滥用 [4] 收入增长与客户风险 - 公司年度经常性收入7个月内从10亿美元增长至50亿美元 增幅达五倍 [2] - API收入31亿美元中49%14亿美元依赖两个客户Cursor和GitHub Copilot 后者由竞争对手微软控制 [2][3] - 行业专家警告客户集中风险 单一合同变更可能对公司造成重大冲击 [3][6] 市场竞争与行业动态 - 此次发布被视为应对OpenAI即将推出GPT-5的防御性举措 业界质疑其发布紧迫性 [3] - 编程助手市场倾向快速模型切换 开发者可通过简单API更改测试新系统 [5] - GitHub Copilot报告新模型在多文件代码重构中性能显著提升 乐天集团称赞其在大型代码库中的修正精度 [5] 市场前景与潜在挑战 - AI编程市场已成数十亿美元规模战场 开发者工具是生成式AI最明确的即时应用场景 [5] - 硬件成本下降和推理优化可能在未来5年内推动行业利润 加剧竞争并导致AI能力商品化 [5] - 行业分析师指出Anthropic增长高度依赖编程领域优势 若GPT-5挑战成功 市场份额可能逆转 [5]
国产AI编程技术力量跻身全球第一梯队!信创ETF(562570)平收
每日经济新闻· 2025-08-01 16:10
国新证券认为,在人工智能编程领域,国产技术力量已跻身全球第一梯队,展现出强大的创新与突破能 力。AI编程正从单一的代码辅助工具向覆盖软件全生命周期的智能体协作范式进化。未来竞争核心在 垂直场景Agent适配与开源协作。投资聚焦:算力层、工具链、应用层。中国通过开源生态与架构创新 突破制裁限制,有望实现赛道超车。 公开信息显示,信创ETF(562570)跟踪中证信息技术应用创新产业指数。该指数聚焦自主可控头部公 司,覆盖人工智能、数据算力、工业软件、信息安全等前沿科创产业。信创ETF(562570)为跟踪该指 数规模最大的ETF。 (文章来源:每日经济新闻) 8月1日,中证信息技术应用创新产业指数上涨0.24%,成分股普元信息上涨10.30%,品高股份上涨 7.60%,卓易信息上涨5.52%,中望软件上涨5.02%,安恒信息上涨5.01%。信创ETF(562570)多空胶 着,最新报价1.34元。拉长时间看,截至2025年7月31日,信创ETF近1周累计上涨2.37%。 流动性方面,信创ETF盘中换手11.54%,成交7308.83万元,市场交投活跃。拉长时间看,截至7月31 日,信创ETF近1周日均成交641 ...
智通港股早知道|香港金管局下周公布“稳定币发行人发牌制度”的摘要说明 大摩预测美联储今年不降息
金融界· 2025-07-24 08:29
香港稳定币监管 - 香港金管局将于下周公布"稳定币发行人发牌制度"摘要说明,阐述牌照申请安排[1] - 《稳定币条例》8月1日生效后,向香港公众宣传推广无牌稳定币属违法行为[1] - 近期出现借数码资产和稳定币进行的诈骗行为,导致民众损失[1] 美股市场表现 - 道琼斯指数上涨507.85点至45010.29点,涨幅1.14%[2] - 标普500指数上涨49.29点至6358.91点,涨幅0.78%[2] - 纳斯达克指数上涨127.33点至21020.02点,涨幅0.61%[2] - 纳斯达克中国金龙指数上涨0.75%,爱奇艺涨超4%,拼多多涨近3%[2] 代币化货币市场 - 高盛与纽约梅隆银行将为机构投资者创建代币化货币市场基金购买渠道[3] - 项目已吸引贝莱德、富达投资等基金巨头参与[3] - 代币化货币市场基金规模达7.1万亿美元,将为持有者提供收益[3] 美联储政策预测 - 摩根士丹利预测美联储今年不降息,可能延至2026年3月[4] 印度旅游市场 - 印度自7月24日起恢复向中国公民发放旅游签证[5] - 去哪儿平台印度德里机票搜索量瞬时增长最高达10倍以上[5] - 香港至德里机票平均含税价格862元[5] - 今年以来赴印度商务签证量同比增长63%[5] 多晶硅价格 - n型复投料成交均价4.68万元/吨,周环比上涨12.23%[6] - n型颗粒硅成交均价4.40元/吨,周环比上涨7.32%[6] 生猪养殖 - 全国生猪出场价格14.96元/公斤,较前期下降0.53%[7][8] - 生猪养殖头均盈利48.96元[8] - 猪料比价为5.50,环比下跌0.54%[8] 海南自贸港政策 - 海南自贸港内企业生产含进口料件加工增值达30%以上货物进入内地免征进口关税[9] - 涉及港股海南封关板块[9] 香港新股市场 - 2025年上半年香港新股融资额达141亿美元,同比增长695%[10] - 港股平均每日成交金额同比增长82%至2400亿港元[10] - 恒生指数期内上涨超过20%[10] 能源投资 - 国网新源控股增资规模365亿元,创国资产权交易史上现金募资规模之最[11] - 投资者包括中国石油、中国人保等大型央国企和金融机构[11] 人工智能 - 阿里云百炼上线Qwen3-Coder API,每百万Tokens最低输入和输出价格分别为4元和16元[12] - 推出低至5折的限时优惠[12] 半导体产业 - 时代电气宜兴IGBT芯片产线预计年内达产[13] - 株洲产线预计2025年底拉通,为8英寸SiC晶圆[13] - IGBT一期、二期产线已经满产[13] 企业动态 - 马可数字科技拟认购稳定币支付平台鲲KUN优先股,代价总额600万美元[14] - 中创新航预期上半年净利润7.09亿至7.93亿元,同比增长70%至90%[15][16] - 优必选推出工业人形机器人Walker S2,可实现7×24小时不间断作业[17] - 西部水泥预期中期股东应占溢利同比增长80%至100%[18] - 商汤-W拟向无极资本发行约16.67亿股新B类股份,净筹约24.98亿港元[19] 造纸行业 - 玖龙纸业7月第三次发布涨价函,涨幅30元/吨[20] - 新版国标加强能耗限制,或催化行业供给端出清[20] - 头部纸企新旧产能较中小纸企有明显优势[20]
看似加速,实则拖慢:AI 写代码让开发者效率倒退19%
36氪· 2025-07-14 17:48
美国METR研究所完成了一项针对AI编程工具影响的实验研究。他们发现,经验丰富的开源开发者在使用AI编程工具时,完成任务的时间平均增长了 19%。 这与开发者自己的感知完全相反。毕竟,参与研究的开发者普遍都相信,AI将提升他们的效率。 在任务开始前,他们预测AI能让自己提速24%。可现实数据冷冷地指出:AI让他们"看似飞快,实则拖慢"。 图注:当研究参与者可以使用像 Cursor Pro 这样的AI工具时,任务实际上耗时增加了19%。 图注:实验设计。在分配条件前定义任务,通过屏幕录制验证执行情况,并利用专家与开发者的预测衡量预期与实际结果的差距。 实验共追踪了16名高级开发者,这些开发者在各自的开源项目中完成了246个实际任务,任务涵盖复杂模块的开发与修复,工作负载真实而具体。 每个任务被随机分配到两个组:一组使用AI工具,另一组不使用。 AI组开发者主要使用的是Cursor Pro,集成了Claude 3.5和Claude 3.7 Sonnet等主流大模型。 开发者在整个过程中录屏,并记录完成每个任务所花费的时间。为了剔除任务难度差异的干扰,研究人员采用了统计方法,引入开发者对任务时间的预估 值作为参考。 ...