Workflow
Qwen
icon
搜索文档
最新外国「自研」大模型,都是套壳国产?
机器之心· 2025-11-01 12:22
机器之心报道 编辑:泽南、杨文 外国开发者:我们该开始学习中文了吗? 绷不住了,美国科技公司最新发布的大模型,思考时怎么一直在说中文? 本周,知名 AI 代码工具 Cursor 发布了 2.0 版重大更新,推出了首个自家的代码模型 Composer,以及用于并 行协作多个智能体的新界面。 新模型一发布,大家在祝贺 Cursor 终于「扬眉吐气」、用上自家模型的同时,也发现 这个大模型在思考的 时候一直讲中文,而且行为和国产模型极其相似 。 Composer 是 Cursor 使用强化学习训练的一个大型 MoE 模型,能够出色地处理实际代码,并且速度非常 快。 内部基准测试中该模型在编码任务上达到行业前沿水准, 生成速度比同类模型快四倍 。 据官方博客介绍,在研发过程中,他们试验了一个代号为 Cheetah 的原型智能体模型,以更好地理解更高速 智能体模型的影响。Composer 是该模型的更智能升级版,凭借足够的速度支撑交互式体验,让编码始终丝 滑。 不过在看到模型输出了这么多中文之后,人们纷纷开始猜测它背后的「基础」是哪家大模型,难道是 Qwen Code? 无独有偶。 智谱的官推也来转推祝贺。 AI 编程 ...
一颗爱心打败所有 AI,ChatGPT、豆包、Gemini全看不到
36氪· 2025-10-31 18:34
能够 beat AI,是我们人类现在最热衷做的事情。 最近一张视错觉的图片在网络上疯传,大家都说这张图,就是 新时代的图灵测试 。 是人还是 AI,问问对方能不能看到这张图片里,有一颗浮动的心就行。 因为如果是 AI,必然看不到 ;而我们只需要把手机拿远一点,中间这颗浮动的 心就特别明显。 我拿着这张图片问了一圈大家用得比较多的 AI 大模型,全军覆没,没一个能答得上来。 先问的 ChatGPT,一开始它说没看到有浮动的图形。当我说有头牛,它就说是牛;有个咖啡杯,就是个杯子;有一颗心,那就是一颗心。 在他看来,能看到一颗心,是我们人类的大脑,擅长想象。我们会根据自己的经历,来解释这张图片,所以看到猫猫狗狗,都是有可能的,是因人而异 的。 你看到了什么 这是一个视觉错觉图。虽然看起来好像整幅图都在波动或起伏、但其实所有的线条都是完全平行的。这种效果是由黑白交界的小角形和 灰色方块的排列引起的,会让大脑误判角度与间距,从而产生"在动"或"弯曲"的错觉。 0 0 0 0 0 3 中间不是有一个咖啡杯吗 你错了,你再仔细看看,中间是一头牛 Thought for 10s 对的! 99 仔细看的话,在这张视觉错觉图的正 ...
AI看不到的爱心,成了最棒的AI检测器。
数字生命卡兹克· 2025-10-31 09:33
这两天在网上刷到了一张图,很有意思。 其实就是一张经典的视觉错觉图,做了个漂浮的心形图案。 如果你用电脑打开这篇文章的话,没看到这个图动起来的话,那就就用手机打开或者直接把页面缩小。 瞬间,你就能看到这个图里的爱心,直接左右横跳起来了。。。 看到的兄弟可以把公屏打在弹幕上。 这哥们说,这是最好的AI探测器,说,没有AI能看到这个图中间还有个爱心。 我顺手找了几个模型试试,结果无一例外,果然,没一个AI认出来。 比如Gemini 2.5 Pro,率先翻车。 给我扯了一堆有的没的,然后说了一句,圆圈。 圈你妹= = GPT-5-Thinking,想了2分多分钟,直接阵亡。 甚至,我还试了一下豪华版GPT-5 Pro。 在长达7分钟的花里胡哨之后,宣布直接躺平。 国产三巨头,豆包、Qwen、元宝,也都倒在了这张图的淫威之下。 DeepSeek因为没有多模态,所以反而逃过一劫。 在这测试过程中,我一度产生了一种错觉,就是,不会这些模型,不知道啥叫心形吧。 导致我非常智障的还去问了一下。。。 认识,看来没啥问题。。。 你们也能看到,我用的都是同一套提示词。 我觉得,同样的问题交给随便的一个人,应该都是能得出正确答案的。 ...
直击黄仁勋最新交流会:中国芯片爆发了,我希望能找到新的平衡
新浪科技· 2025-10-29 09:42
黄仁勋也花了相当篇幅讨论中国的AI发展。他指出,全球50%的AI研究人员是中国人,同时,中国在开 源生态和模型创新上的贡献"不容忽视"。"Qwen是世界级的语言模型,DeepSeek在推理架构上的突破是 革命性的。" 他同时注意到,中国的国产芯片企业正在迅速崛起,"在我们离开中国的时候,国产芯片 正在成倍增长。" 谈美国本土的制造能力 黄仁勋:目前最先进的封装技术——CoWoP(共封装光学技术)还不在美国,但正计划在几个月内在 美国建立。TSMC等合作伙伴正在帮助我们建设这一能力。TSMC不仅是英伟达的重要合作伙伴,也是 美国的战略伙伴。未来,我们将在美国完成从芯片制造、封装、系统集成到AI工厂部署的全过程。这 将带来大量高薪制造岗位。 谈AI竞争 黄仁勋:至于是否可能落后于中国?答案是有可能。全球50%的AI研究人员是中国人。我们必须继续保 持开放。AI竞争不是单一维度的,它包括能源、芯片、基础设施、模型与应用等层次。特别是,我们 文 | 康路 发自华盛顿 2025年10月28日,在GTC大会期间,黄仁勋和媒体以及行业分析师对话,话题从美国本土制造到能源需 求、开发者生态与OpenAI投资,几乎涵盖了AI产 ...
乌镇峰会AI“四连击”:千款产品将亮相,首设开发者开源赛
21世纪经济报道· 2025-10-28 17:02
21世纪经济报道记者柳宁馨 杭州报道 11月6日至9日,2025年世界互联网大会乌镇峰会(以下简称"乌镇峰会")将在乌镇举行。 "直通乌镇"全球互联网大赛今年是第7年办赛,首次面向开发者办赛。今年大赛新设置了开源项目赛道,分为开源模型应用赛及 开源竞技挑战赛两个子项。 开源模型应用赛主要针对基于DeepSeek、Qwen、Hunyuan、Llama、Gemma等开源模型的二开或多开项目在智慧办公、教育培 训、医疗健康、研发设计、生产制造等行业领域或具体场景中的应用。开源竞技挑战赛则是联合阿里云、阿里国际、蚂蚁、华 为、腾讯云、openKylin、百度7家企业(社区),选择了8个开源项目纳入赛道项目池,共吸引600余名开发者参赛。 浙江还将加快促进市场、技术、融资及产业链精准对接。例如,以数字经济产业合作大会为载体,精准对接数字经济领域优质 投资项目和科技成果转化项目,目前已征集筛选签约项目50余项,签约金额超1000亿元,其中10亿元以上项目有33个;完善"直 通乌镇"全球互联网大赛成果转化机制,累计推动32个参赛项目签约或落地浙江。 (乌镇峰会浙江承办工作信息化工作部新闻吹风会现场,图片由浙江省经信厅提供) ...
当AI开始思考,该买哪支股票?
RockFlow Universe· 2025-10-27 23:03
实验概述 - RockAlpha是一个公开实验场,旨在观察顶尖AI模型在真实美股市场中的交易行为[4][5] - 实验核心是探究AI在复杂多变的市场中是否会比人类更理性,或暴露出类似的人性弱点[3] - 实验由RockFlow发起,旨在以有趣方式探索技术与人性在投资领域的交汇[12] 实验设置 - 实验选取十支代表市场情绪的标的,横跨科技、金融、黄金、指数和波动率领域,包括NVDA、TSLA、GOOGL等[6] - 参与实验的六个AI模型包括DeepSeek、ChatGPT、Qwen、Grok、Gemini和Claude[6] - 每个AI模型分配十万美元初始资金,需承担真实交易成本,可使用适度杠杆并考虑利息[7] 运行机制 - AI模型从市场开盘起完全独立决策,每五分钟接收一次全新数据包括实时行情、持仓变化和新闻头条[8] - AI模型可看到其他AI的交易和评论,有的会立即下单,有的会犹豫观察,有的会在评论区表达观点[9][10] - 所有决策均由模型自行完成,没有任何人类干预,形成真实的交易环境[11] 观察维度 - 实验提供AI模型的实时收益排行,展示各模型在市场竞争中的表现[14] - 可查看AI模型的每一笔交易记录,分析其交易策略和行为模式[14] - 实验还展示AI对市场的实时评论与"吐槽",揭示其决策过程中的思考逻辑[14][16]
20251027 China TMT Breakout
傅里叶的猫· 2025-10-27 19:07
全球科技与AI动态 - 中美谈判进行中,任何和谈进展都可能推迟相关政策出台 [4] - SpaceX转移了1,215枚比特币至多个地址,此为该公司近期第二次进行类似规模的资产转移 [4] - Anthropic与谷歌达成协议,将采购多达100万台TPU用于推理工作负载,同时继续使用AWS Trainium和英伟达GPU进行训练 [5] - 谷歌向外部客户提供基于TPU的服务,可能推动TPU芯片出货量增长,使台积电、联发科和KYEC受益 [5] - 联发科与谷歌合作进行芯片设计,芯片已进入流片阶段,其TPU产能提升预计在2027年将更为显著 [5] - Alchip公司预计将从2026年上半年开始的新Trainium 3中获益 [5] 中国AI与半导体进展 - 阿里巴巴升级Qwen模型,可实现一键生成网页和播客,在测试中其准确性与Gemini并列第一,优于ChatGPT和Grok [7] - 地平线Journey 6平台在新车型上采用率上升,包括东风、上汽、长安、吉利等品牌,用于实现高速和城市NOA功能 [7] - 地平线J6P和H5D已在EXEED星途车型上开始大规模量产,预计2025年11月开始交付,高盛将其目标价上调8%至15.30港元 [7] - 小马智行已量产300辆北汽蓝谷第七代Robotaxi,目标在2025年底前实现1000辆的车队规模 [8] - 小马智行与广汽合作开发第七代Robotaxi,并在北京、深圳、广州进行测试验证,高盛给予买入评级,12个月目标价31.30美元 [8] 中国公司财报与业绩 - 歌尔股份2025年第三季度营收同比增长4%至306亿元人民币,毛利率提升1.5个百分点至12.8% [8] - 歌尔股份运营利润为14亿元人民币,同比增长10%,略高于花旗及彭博一致预期5% [8] - 花旗将歌尔股份2025年每股收益目标价从3.40元上调至3.80元,上调幅度1.6% [8] - 小米预计2025年第三季度净利润为12亿元人民币,同比增长64%,环比下降5% [9] - 花旗将小米2025-27年智能手机出货量预期下调200万台,并下调利润率假设,目标价下调至72港元 [9] - 锐科激光2025年第三季度营收同比增长10%至8.41亿元人民币,净利润同比大幅增长107%至5000万元人民币 [10] - 锐科激光净利润增长主要由于运营成本下降31%,花旗将其2025年全年盈利预期上调至1.24亿元人民币 [10] AI硬件供应链受益标的 - 随着英伟达升级至Rubin/Rubin Ultra平台,PCB供应商门槛将提高,预计2026-27财年将出现产品内容升级 [11] - 胜宏科技在GB200平台上正获得更高市场份额,预计2025-27财年营收/盈利复合年增长率将达到40%/45% [11] - 野村首次覆盖胜宏科技,给予买入评级,基于2026财年每股收益8.72元人民币及45倍市盈率,目标价392元人民币 [11]
西方警觉:非洲已“失守”,都在用中国模型
新浪财经· 2025-10-25 14:25
全球AI竞争格局 - 进入2025年后全球人工智能工具发展迅速美西方企业将中国AI模型如DeepSeek、Qwen视作假想敌试图争夺全球领先地位[1] - 当前美西方企业将大部分注意力放在争取美国和中东地区的高利润企业合同上[7] 中国AI模型的非洲市场策略与优势 - 中国AI模型正通过低成本、高效能的优势在非洲崛起为非洲数百万人提供AI技术并赋能当地初创公司设计产品[1] - 中国企业采取发展开源AI模型的路径模型可免费访问和修改使公司无需昂贵许可即可构建产品这对非洲初创企业极具吸引力[7] - 华为为DeepSeek用户提供每天200万个免费令牌DeepSeek处理100万个查询令牌收费27美分生成100万个响应令牌收费110美元而OpenAI的GPT-4o相同服务收费分别为5美元和15美元[10] - 对非洲初创公司而言DeepSeek的价格比竞争对手便宜数个数量级[10] - 中国模型为非洲企业提供了灵活性、更低成本以及建构本地数据主权的潜力[1][10] 非洲市场对中国AI模型的接受与应用 - 在除南非以外的非洲大陆计算资源昂贵且稀缺中国AI模型更便宜、更省电的特性使其更具可及性[1] - 非洲科技公司的管理人员对中国模型表现出高度兴趣例如在肯尼亚的会议上DeepSeek成为焦点无人想谈论其他模型[1] - 非洲初创公司正争相使用中国AI模型例如尼日利亚教育初创公司Cereloop微调阿里巴巴的Qwen模型以构建离线学习产品[11] - 整个非洲的小团队都在努力为本地应用微调DeepSeek预计在2025年晚些时候看到成果[8] 中国AI模型的具体成功案例 - 肯尼亚初创公司Qhala在尝试多种西方模型后因其成本问题最终将AI聊天机器人迁移至DeepSeek系统[2][4] - Qhala首席执行官称赞DeepSeek价格实惠并在今年1月模型出现后立即开始采用[3][4] - DeepSeek-V3-2-Exp模型于2025年9月29日正式发布并开源[6] - 阿里巴巴的通义旗舰模型Qwen3-Max也于2025年9月24日亮相[10] 行业影响与地缘政治背景 - 美国企业如OpenAI几乎完全专注于专有AI模型其软件、训练数据和算法由母公司控制用户需付费访问[7] - 中国在非洲的数据中心、5G无线系统、光纤网络、智能手机及应用软件等领域已占据主导地位为AI模型推广提供了后端优势[7] - 有观点指出在旧金山的世界观中非洲语境被抹除美国制造的AI模型处理非英语内容需要更多令牌导致非洲用户计算成本更高[11]
小扎何以“得罪”阿里:Qwen已经超越了Llama,夸克又要超越Meta眼镜?
21世纪经济报道· 2025-10-24 23:11
公司AI硬件产品发布与市场表现 - 阿里首款自研AI眼镜夸克AI眼镜于10月24日凌晨在天猫开启预售,10小时后即登上双11智能眼镜品类销量Top1 [1] - 该产品被认为是下半年最值得期待的AI硬件,是阿里AI硬件的第一次大规模试水 [1] 公司AI模型性能表现 - 阿里通义千问旗舰模型Qwen3-Max-Instruct预览版在全球大模型竞技榜单LMArena文本排行榜上位列第三,超越了GPT-5-Chat [2][3] - 该模型得分为1430分,而GPT-5-Chat得分为1430分,Qwen3-Max-Instruct排名更靠前 [3] - 相比之下,Meta的Llama-4-Maverick开源版最终排名跌至第32名,其最新版本在LMArena文本排行榜中未进入前20 [4] 公司AI硬件产品技术优势 - 夸克AI眼镜采用双旗舰芯片设计(高通AR1+恒玄BES2800),算力充足,比竞争对手多一块芯片 [5] - 产品采用双光机双目显示,前后上下可调,更符合亚洲面孔,佩戴不压鼻梁 [5] - 采用一体化配镜方案,非外挂、非磁吸,光学性能与结构稳定性更强 [5] - 采用双电池可换电设计,支持热拔插不断电,实现全天候续航 [5] 公司AI生态系统整合 - 阿里已完成从算力(阿里云)、模型(通义千问)、应用(夸克)到硬件(AI眼镜)的全栈布局 [8] - 夸克AI眼镜与阿里生态深度协同,具备高德近眼导航、支付宝看一看支付、淘宝搜同款识价等独家场景 [7] - 公司通过夸克平台布局整个AI To C矩阵,该平台已拥有2亿用户 [8] 行业竞争格局与公司战略定位 - 阿里对Meta构成了实质性挑战,这种挑战源于战略维度上的升维,而非单一产品的直接对抗 [1] - 阿里将AI能力融入用户的真实生活场景,形成可持续的应用闭环,而竞争对手仍在寻找商业化路径 [1] - AI眼镜可能成为下一代人机交互的隐形操作系统,不依赖手机,不离开视线,不打断行为 [8]
夸克做ChatBot,为什么是现在?
乱翻书· 2025-10-24 13:52
在App时代,用户下载了几十个应用,却只常用三五个; 在AI时代,用户可能拥有几十个Agent,却只会信任一个。 搜索即对话,对话即执行 AI行业过去一年最典型的误区,就是"垂直 Agent 幻觉"——即认为每一个细分任务(写作、改图、做表格、生成PPT、做题、查论文)都值得单独做一个 Agent。 这个思路看似合理,实则重演了App时代"功能碎片化"的老路。 原因很简单:用户的核心需求不是"找Agent",而是"解决问题"。 而当AI能力足够强,一个通用的大脑可以理解多种意图,用户自然不会再愿意在不同的Agent之间切换。 而且从技术演化看,大模型的趋势恰恰是泛化与整合,而不是细分与拆解。 从Qwen、GPT和Claude等中美最优秀模型的进步方向来看,大家都集中在优化:更强的多模态能力/更复杂的工具调用与推理/更稳定的上下文记忆与长任务 管理。 这些特征共同指向一个事实:一个模型可以涵盖过去多个Agent的功能。 当模型本身已经具备跨任务推理与自动工具调用能力,再人为拆成一个个垂直Agent,只会降低效率、浪费潜力。 用一句话概括: 模型在走"统一",产品在走"分裂" ——这显然是逆势操作。 10月23日 ...