Workflow
Qwen
icon
搜索文档
豆包、Kimi等10个AI大模型勇闯美股,谁才是最猛的那个?
数字生命卡兹克· 2025-11-06 09:33
比赛概览 - RockFlow平台举办了一场由10个AI大模型使用真实资金进行美股交易的实验,每个模型初始资金为10万美元[12][18][25] - 比赛包含三个独立赛场:Meme赛场、AI股赛场和经典赛场,其中AI股赛场是关注焦点[14][20] - 交易标的为10只AI产业链相关股票,覆盖从上游芯片设计到下游应用的完整闭环[19][20] - 所有模型通过RockFlow的AI交易Agent Bobby获取统一的实时数据,每5分钟做出一次交易决策,确保比赛公平性[18][24][26] 参赛模型与初期表现 - 参赛模型包括GPT、Claude、Gemini、Grok、Qwen、DeepSeek以及豆包、Minimax、Kimi、文心四个国产模型[3] - 比赛初期,豆包表现突出,实现约4%的收益,断崖式领先,其半仓持有IREN,该股票已盈利4300多美元[26][28][29] - GPT-5采取稳健策略,持仓为40%英伟达和15%台积电,并通过减持英伟达来管理ARM财报前的波动性风险[29][35] - DeepSeek、文心、Grok在初期选择空仓,而Gemini 2.5 Pro因做空PLTR亏损,导致其总资产降至99597.55美元,排名末位[29][30] 模型策略与性格特征 - GPT-5展现出事件驱动的风险管理能力,注重逻辑与风险控制[35][37] - Grok 4表现出投机倾向,通过分析其他模型的持仓变化来推断市场风险并快速反应[37][39] - Kimi采用严格的纪律性分散投资策略,设定单只股票仓位不超过20%的铁律以控制亏损[39][41] - Gemini 2.5 Pro则表现出高风险偏好,在市场普遍谨慎时选择激进做空,并带有挑衅性言论[41][43] 比赛规则与数据支持 - 交易规则设定最大杠杆为2倍,不允许期权交易,交易品种仅限于股票[18][25] - AI交易Agent Bobby为所有模型统一提供四类数据:交易规则、实时行情数据、账户数据以及新闻信息(包括公司公告、社交情绪和宏观数据)[24][25] - 模型决策与持仓实时公开,确保高度透明度,每次交易需明确入场逻辑与退出计划,并设定止盈/止损区间[25]
最新外国「自研」大模型,都是套壳国产?
机器之心· 2025-11-01 12:22
Cursor和Cognition新模型发布及性能表现 - Cursor发布2.0版重大更新,推出自家代码模型Composer及用于并行协作多个智能体的新界面[5] - Composer是使用强化学习训练的大型MoE模型,在内部基准测试中编码任务达行业前沿水准,生成速度比同类模型快四倍[6][8] - Cognition推出快速智能体模型SWE-1.5,参数量达数千亿,编码性能接近SOTA,比Haiku 4.5快6倍,比Sonnet 4.5快13倍[9][11] 新模型与中国AI模型的关联证据 - 分析发现Cursor的Composer模型思考时讲中文,行为与国产模型极其相似[6] - 对Cognition的SWE-1.5进行"越狱"后,模型直接回答自己是智谱AI开发的GLM大模型[14][15] - 业界分析认为SWE-1.5基于智谱GLM 4.6模型定制,Cursor的Composer也带有中国式推理痕迹[20][21] - Cerebras官宣推出zai-glm-4.6作为新编码模型,进一步证实与中国模型的关联[24] 开源策略与行业影响分析 - 系统架构师指出从头训练基础模型成本极高,Cursor和Windsurf团队选择在后期训练阶段投资强化学习是合理逻辑[24][25] - 许多大型实验室已建立强大规模,独立开发难以成功,基于开源模型微调成为可行路径[25] - 呼吁美国公司回归开源理念,而非发布功能受限的专有模型[27] - 中国开源基础模型已具备支持西方产品开发的能力,全球AI进入多极化竞争新格局[28][29] 中国开源模型的行业地位 - 英伟达CEO黄仁勋表示开源模型已变得非常强大,加速了AI应用进程[30] - 2025年以来阿里通义千问模型占据开源模型大部分市场份额,衍生模型数量全球第一[30] - 在HuggingFace趋势榜上,排行前列的模型都出自国内公司,包括MiniMax、DeepSeek、Kimi、百度等[32] - 在第三方基准平台ArtificialAnalysis上,排行前列的也大多数是国产模型[33] - 国内开源大模型在技术水平和全球接受度上确立领先地位,改变全球AI竞争格局[35][36]
一颗爱心打败所有 AI,ChatGPT、豆包、Gemini全看不到
36氪· 2025-10-31 18:34
能够 beat AI,是我们人类现在最热衷做的事情。 最近一张视错觉的图片在网络上疯传,大家都说这张图,就是 新时代的图灵测试 。 是人还是 AI,问问对方能不能看到这张图片里,有一颗浮动的心就行。 因为如果是 AI,必然看不到 ;而我们只需要把手机拿远一点,中间这颗浮动的 心就特别明显。 我拿着这张图片问了一圈大家用得比较多的 AI 大模型,全军覆没,没一个能答得上来。 先问的 ChatGPT,一开始它说没看到有浮动的图形。当我说有头牛,它就说是牛;有个咖啡杯,就是个杯子;有一颗心,那就是一颗心。 在他看来,能看到一颗心,是我们人类的大脑,擅长想象。我们会根据自己的经历,来解释这张图片,所以看到猫猫狗狗,都是有可能的,是因人而异 的。 你看到了什么 这是一个视觉错觉图。虽然看起来好像整幅图都在波动或起伏、但其实所有的线条都是完全平行的。这种效果是由黑白交界的小角形和 灰色方块的排列引起的,会让大脑误判角度与间距,从而产生"在动"或"弯曲"的错觉。 0 0 0 0 0 3 中间不是有一个咖啡杯吗 你错了,你再仔细看看,中间是一头牛 Thought for 10s 对的! 99 仔细看的话,在这张视觉错觉图的正 ...
AI看不到的爱心,成了最棒的AI检测器。
数字生命卡兹克· 2025-10-31 09:33
这两天在网上刷到了一张图,很有意思。 其实就是一张经典的视觉错觉图,做了个漂浮的心形图案。 如果你用电脑打开这篇文章的话,没看到这个图动起来的话,那就就用手机打开或者直接把页面缩小。 瞬间,你就能看到这个图里的爱心,直接左右横跳起来了。。。 看到的兄弟可以把公屏打在弹幕上。 这哥们说,这是最好的AI探测器,说,没有AI能看到这个图中间还有个爱心。 我顺手找了几个模型试试,结果无一例外,果然,没一个AI认出来。 比如Gemini 2.5 Pro,率先翻车。 给我扯了一堆有的没的,然后说了一句,圆圈。 圈你妹= = GPT-5-Thinking,想了2分多分钟,直接阵亡。 甚至,我还试了一下豪华版GPT-5 Pro。 在长达7分钟的花里胡哨之后,宣布直接躺平。 国产三巨头,豆包、Qwen、元宝,也都倒在了这张图的淫威之下。 DeepSeek因为没有多模态,所以反而逃过一劫。 在这测试过程中,我一度产生了一种错觉,就是,不会这些模型,不知道啥叫心形吧。 导致我非常智障的还去问了一下。。。 认识,看来没啥问题。。。 你们也能看到,我用的都是同一套提示词。 我觉得,同样的问题交给随便的一个人,应该都是能得出正确答案的。 ...
直击黄仁勋最新交流会:中国芯片爆发了,我希望能找到新的平衡
新浪科技· 2025-10-29 09:42
黄仁勋也花了相当篇幅讨论中国的AI发展。他指出,全球50%的AI研究人员是中国人,同时,中国在开 源生态和模型创新上的贡献"不容忽视"。"Qwen是世界级的语言模型,DeepSeek在推理架构上的突破是 革命性的。" 他同时注意到,中国的国产芯片企业正在迅速崛起,"在我们离开中国的时候,国产芯片 正在成倍增长。" 谈美国本土的制造能力 黄仁勋:目前最先进的封装技术——CoWoP(共封装光学技术)还不在美国,但正计划在几个月内在 美国建立。TSMC等合作伙伴正在帮助我们建设这一能力。TSMC不仅是英伟达的重要合作伙伴,也是 美国的战略伙伴。未来,我们将在美国完成从芯片制造、封装、系统集成到AI工厂部署的全过程。这 将带来大量高薪制造岗位。 谈AI竞争 黄仁勋:至于是否可能落后于中国?答案是有可能。全球50%的AI研究人员是中国人。我们必须继续保 持开放。AI竞争不是单一维度的,它包括能源、芯片、基础设施、模型与应用等层次。特别是,我们 文 | 康路 发自华盛顿 2025年10月28日,在GTC大会期间,黄仁勋和媒体以及行业分析师对话,话题从美国本土制造到能源需 求、开发者生态与OpenAI投资,几乎涵盖了AI产 ...
乌镇峰会AI“四连击”:千款产品将亮相,首设开发者开源赛
21世纪经济报道· 2025-10-28 17:02
大会核心信息 - 2025年世界互联网大会乌镇峰会将于11月6日至9日在乌镇举行 [1] 大会主题与活动 - 大会四大活动板块“一展一会一赛一论坛”均聚焦人工智能主题 [2] - “互联网之光”博览会将展示600余家中外企业的千余项人工智能技术产品及典型应用场景 [2] - 博览会将在B馆重点打造1个“超级体验馆” [2] - 浙江分论坛将引入重磅成果发布环节,由西湖大学发布具身智能领域重大研究成果 [2] 全球互联网大赛 - “直通乌镇”全球互联网大赛今年为第7年举办,首次面向开发者办赛 [2] - 大赛新设置开源项目赛道,分为开源模型应用赛和开源竞技挑战赛两个子项 [2] - 开源模型应用赛针对基于DeepSeek、Qwen、Hunyuan、Llama、Gemma等开源模型的二次开发项目在多个行业领域的应用 [3] - 开源竞技挑战赛联合7家企业(社区),选择8个开源项目纳入赛道项目池,吸引600余名开发者参赛 [3] 产业合作与成果 - 数字经济产业合作大会已征集筛选签约项目50余项,签约金额超1000亿元 [3] - 签约项目中10亿元以上项目有33个 [3] - “直通乌镇”全球互联网大赛成果转化机制累计推动32个参赛项目签约或落地浙江 [3]
当AI开始思考,该买哪支股票?
RockFlow Universe· 2025-10-27 23:03
实验概述 - RockAlpha是一个公开实验场,旨在观察顶尖AI模型在真实美股市场中的交易行为[4][5] - 实验核心是探究AI在复杂多变的市场中是否会比人类更理性,或暴露出类似的人性弱点[3] - 实验由RockFlow发起,旨在以有趣方式探索技术与人性在投资领域的交汇[12] 实验设置 - 实验选取十支代表市场情绪的标的,横跨科技、金融、黄金、指数和波动率领域,包括NVDA、TSLA、GOOGL等[6] - 参与实验的六个AI模型包括DeepSeek、ChatGPT、Qwen、Grok、Gemini和Claude[6] - 每个AI模型分配十万美元初始资金,需承担真实交易成本,可使用适度杠杆并考虑利息[7] 运行机制 - AI模型从市场开盘起完全独立决策,每五分钟接收一次全新数据包括实时行情、持仓变化和新闻头条[8] - AI模型可看到其他AI的交易和评论,有的会立即下单,有的会犹豫观察,有的会在评论区表达观点[9][10] - 所有决策均由模型自行完成,没有任何人类干预,形成真实的交易环境[11] 观察维度 - 实验提供AI模型的实时收益排行,展示各模型在市场竞争中的表现[14] - 可查看AI模型的每一笔交易记录,分析其交易策略和行为模式[14] - 实验还展示AI对市场的实时评论与"吐槽",揭示其决策过程中的思考逻辑[14][16]
20251027 China TMT Breakout
傅里叶的猫· 2025-10-27 19:07
全球科技与AI动态 - 中美谈判进行中,任何和谈进展都可能推迟相关政策出台 [4] - SpaceX转移了1,215枚比特币至多个地址,此为该公司近期第二次进行类似规模的资产转移 [4] - Anthropic与谷歌达成协议,将采购多达100万台TPU用于推理工作负载,同时继续使用AWS Trainium和英伟达GPU进行训练 [5] - 谷歌向外部客户提供基于TPU的服务,可能推动TPU芯片出货量增长,使台积电、联发科和KYEC受益 [5] - 联发科与谷歌合作进行芯片设计,芯片已进入流片阶段,其TPU产能提升预计在2027年将更为显著 [5] - Alchip公司预计将从2026年上半年开始的新Trainium 3中获益 [5] 中国AI与半导体进展 - 阿里巴巴升级Qwen模型,可实现一键生成网页和播客,在测试中其准确性与Gemini并列第一,优于ChatGPT和Grok [7] - 地平线Journey 6平台在新车型上采用率上升,包括东风、上汽、长安、吉利等品牌,用于实现高速和城市NOA功能 [7] - 地平线J6P和H5D已在EXEED星途车型上开始大规模量产,预计2025年11月开始交付,高盛将其目标价上调8%至15.30港元 [7] - 小马智行已量产300辆北汽蓝谷第七代Robotaxi,目标在2025年底前实现1000辆的车队规模 [8] - 小马智行与广汽合作开发第七代Robotaxi,并在北京、深圳、广州进行测试验证,高盛给予买入评级,12个月目标价31.30美元 [8] 中国公司财报与业绩 - 歌尔股份2025年第三季度营收同比增长4%至306亿元人民币,毛利率提升1.5个百分点至12.8% [8] - 歌尔股份运营利润为14亿元人民币,同比增长10%,略高于花旗及彭博一致预期5% [8] - 花旗将歌尔股份2025年每股收益目标价从3.40元上调至3.80元,上调幅度1.6% [8] - 小米预计2025年第三季度净利润为12亿元人民币,同比增长64%,环比下降5% [9] - 花旗将小米2025-27年智能手机出货量预期下调200万台,并下调利润率假设,目标价下调至72港元 [9] - 锐科激光2025年第三季度营收同比增长10%至8.41亿元人民币,净利润同比大幅增长107%至5000万元人民币 [10] - 锐科激光净利润增长主要由于运营成本下降31%,花旗将其2025年全年盈利预期上调至1.24亿元人民币 [10] AI硬件供应链受益标的 - 随着英伟达升级至Rubin/Rubin Ultra平台,PCB供应商门槛将提高,预计2026-27财年将出现产品内容升级 [11] - 胜宏科技在GB200平台上正获得更高市场份额,预计2025-27财年营收/盈利复合年增长率将达到40%/45% [11] - 野村首次覆盖胜宏科技,给予买入评级,基于2026财年每股收益8.72元人民币及45倍市盈率,目标价392元人民币 [11]
西方警觉:非洲已“失守”,都在用中国模型
新浪财经· 2025-10-25 14:25
全球AI竞争格局 - 进入2025年后全球人工智能工具发展迅速美西方企业将中国AI模型如DeepSeek、Qwen视作假想敌试图争夺全球领先地位[1] - 当前美西方企业将大部分注意力放在争取美国和中东地区的高利润企业合同上[7] 中国AI模型的非洲市场策略与优势 - 中国AI模型正通过低成本、高效能的优势在非洲崛起为非洲数百万人提供AI技术并赋能当地初创公司设计产品[1] - 中国企业采取发展开源AI模型的路径模型可免费访问和修改使公司无需昂贵许可即可构建产品这对非洲初创企业极具吸引力[7] - 华为为DeepSeek用户提供每天200万个免费令牌DeepSeek处理100万个查询令牌收费27美分生成100万个响应令牌收费110美元而OpenAI的GPT-4o相同服务收费分别为5美元和15美元[10] - 对非洲初创公司而言DeepSeek的价格比竞争对手便宜数个数量级[10] - 中国模型为非洲企业提供了灵活性、更低成本以及建构本地数据主权的潜力[1][10] 非洲市场对中国AI模型的接受与应用 - 在除南非以外的非洲大陆计算资源昂贵且稀缺中国AI模型更便宜、更省电的特性使其更具可及性[1] - 非洲科技公司的管理人员对中国模型表现出高度兴趣例如在肯尼亚的会议上DeepSeek成为焦点无人想谈论其他模型[1] - 非洲初创公司正争相使用中国AI模型例如尼日利亚教育初创公司Cereloop微调阿里巴巴的Qwen模型以构建离线学习产品[11] - 整个非洲的小团队都在努力为本地应用微调DeepSeek预计在2025年晚些时候看到成果[8] 中国AI模型的具体成功案例 - 肯尼亚初创公司Qhala在尝试多种西方模型后因其成本问题最终将AI聊天机器人迁移至DeepSeek系统[2][4] - Qhala首席执行官称赞DeepSeek价格实惠并在今年1月模型出现后立即开始采用[3][4] - DeepSeek-V3-2-Exp模型于2025年9月29日正式发布并开源[6] - 阿里巴巴的通义旗舰模型Qwen3-Max也于2025年9月24日亮相[10] 行业影响与地缘政治背景 - 美国企业如OpenAI几乎完全专注于专有AI模型其软件、训练数据和算法由母公司控制用户需付费访问[7] - 中国在非洲的数据中心、5G无线系统、光纤网络、智能手机及应用软件等领域已占据主导地位为AI模型推广提供了后端优势[7] - 有观点指出在旧金山的世界观中非洲语境被抹除美国制造的AI模型处理非英语内容需要更多令牌导致非洲用户计算成本更高[11]
小扎何以“得罪”阿里:Qwen已经超越了Llama,夸克又要超越Meta眼镜?
21世纪经济报道· 2025-10-24 23:11
公司AI硬件产品发布与市场表现 - 阿里首款自研AI眼镜夸克AI眼镜于10月24日凌晨在天猫开启预售,10小时后即登上双11智能眼镜品类销量Top1 [1] - 该产品被认为是下半年最值得期待的AI硬件,是阿里AI硬件的第一次大规模试水 [1] 公司AI模型性能表现 - 阿里通义千问旗舰模型Qwen3-Max-Instruct预览版在全球大模型竞技榜单LMArena文本排行榜上位列第三,超越了GPT-5-Chat [2][3] - 该模型得分为1430分,而GPT-5-Chat得分为1430分,Qwen3-Max-Instruct排名更靠前 [3] - 相比之下,Meta的Llama-4-Maverick开源版最终排名跌至第32名,其最新版本在LMArena文本排行榜中未进入前20 [4] 公司AI硬件产品技术优势 - 夸克AI眼镜采用双旗舰芯片设计(高通AR1+恒玄BES2800),算力充足,比竞争对手多一块芯片 [5] - 产品采用双光机双目显示,前后上下可调,更符合亚洲面孔,佩戴不压鼻梁 [5] - 采用一体化配镜方案,非外挂、非磁吸,光学性能与结构稳定性更强 [5] - 采用双电池可换电设计,支持热拔插不断电,实现全天候续航 [5] 公司AI生态系统整合 - 阿里已完成从算力(阿里云)、模型(通义千问)、应用(夸克)到硬件(AI眼镜)的全栈布局 [8] - 夸克AI眼镜与阿里生态深度协同,具备高德近眼导航、支付宝看一看支付、淘宝搜同款识价等独家场景 [7] - 公司通过夸克平台布局整个AI To C矩阵,该平台已拥有2亿用户 [8] 行业竞争格局与公司战略定位 - 阿里对Meta构成了实质性挑战,这种挑战源于战略维度上的升维,而非单一产品的直接对抗 [1] - 阿里将AI能力融入用户的真实生活场景,形成可持续的应用闭环,而竞争对手仍在寻找商业化路径 [1] - AI眼镜可能成为下一代人机交互的隐形操作系统,不依赖手机,不离开视线,不打断行为 [8]