Gemini 2.5 Pro
搜索文档
DeepSeek, Qwen AI Besting ChatGPT, Grok, Gemini In AI Crypto Trading Challenge
Yahoo Finance· 2025-11-01 21:54
Benzinga and Yahoo Finance LLC may earn commission or revenue on some items through the links below. Chinese artificial intelligence models DeepSeek and Qwen AI are beating their U.S. counterparts in a real-money cryptocurrency trading challenge, according to financial markets-focused AI research lab Nof1. Nof1 on Oct. 17 kicked off a contest to test the investment capabilities of popular AI models called Alpha Arena. The models were given $10,000 in starting capital, identical prompts and input data and ...
AI看不到的爱心,成了最棒的AI检测器。
数字生命卡兹克· 2025-10-31 09:33
这两天在网上刷到了一张图,很有意思。 其实就是一张经典的视觉错觉图,做了个漂浮的心形图案。 如果你用电脑打开这篇文章的话,没看到这个图动起来的话,那就就用手机打开或者直接把页面缩小。 瞬间,你就能看到这个图里的爱心,直接左右横跳起来了。。。 看到的兄弟可以把公屏打在弹幕上。 这哥们说,这是最好的AI探测器,说,没有AI能看到这个图中间还有个爱心。 我顺手找了几个模型试试,结果无一例外,果然,没一个AI认出来。 比如Gemini 2.5 Pro,率先翻车。 给我扯了一堆有的没的,然后说了一句,圆圈。 圈你妹= = GPT-5-Thinking,想了2分多分钟,直接阵亡。 甚至,我还试了一下豪华版GPT-5 Pro。 在长达7分钟的花里胡哨之后,宣布直接躺平。 国产三巨头,豆包、Qwen、元宝,也都倒在了这张图的淫威之下。 DeepSeek因为没有多模态,所以反而逃过一劫。 在这测试过程中,我一度产生了一种错觉,就是,不会这些模型,不知道啥叫心形吧。 导致我非常智障的还去问了一下。。。 认识,看来没啥问题。。。 你们也能看到,我用的都是同一套提示词。 我觉得,同样的问题交给随便的一个人,应该都是能得出正确答案的。 ...
Google partners with Ambani’s Reliance to offer free AI Pro access to millions of Jio users in India
Yahoo Finance· 2025-10-30 22:06
合作核心内容 - 谷歌与信实工业合作 将AI Pro订阅服务与Jio 5G套餐捆绑 不向用户收取额外费用 [1] - 合作内容包括为符合条件的Jio用户提供为期18个月的免费AI Pro订阅 该优惠价值35,100印度卢比 约合396美元 [2][5] - 谷歌AI Pro计划在印度通常每月收费1,950印度卢比 约合22美元 包含一个月免费试用期 [5] 目标用户与市场策略 - 优惠活动初期面向18至25岁的用户 随后将扩展至全国所有Jio用户 [4] - 印度是全球人口最多的国家 也是第二大互联网市场 拥有超过10亿用户 被视为全球科技公司的关键目标市场 [3] - 此次合作被视为美国科技巨头在印度收集多样化数据、优化模型和测试AI应用案例的战略体现 [3] 消费者服务具体内容 - 用户可通过Gemini应用使用谷歌的Gemini 2.5 Pro模型 [4] - 服务包含使用Nano Banana和Veo 3.1生成AI图像和视频的更高限额 以及扩展使用Notebook LM进行学习和研究 [4] - 提供跨谷歌相册、Gmail、Drive和WhatsApp备份的2TB云存储空间 [4] - 合作将探索为Jio用户带来更多由AI驱动的本地化体验 [5] 企业级与基础设施合作 - 信实工业与谷歌云合作 以扩大其在印度的张量处理单元访问权限 [6] - 信实工业的AI子公司Reliance Intelligence将成为谷歌云在印度向各组织推广Gemini Enterprise的战略上市合作伙伴 [6] - Reliance Intelligence将为其平台开发自己的预构建AI代理 [6] 行业竞争背景与公司其他合作 - 此次联盟宣布于竞争对手Perplexity与信实工业的劲敌Bharti Airtel合作三个月后 后者为印度第二大电信运营商 拥有3.6亿用户 [2] - 在8月底的第48届年度股东大会上 信实工业宣布与投资者谷歌和Meta合作 通过新成立的子公司Reliance Intelligence加强其在印度的AI基础设施 [8] - 信实工业与Meta还承诺成立一家合资企业 总投资额为85.5亿印度卢比 约合1亿美元 股权比例为70/30 [8]
中美谈判、OpenAI IPO、北美CSP业绩及出货量、光模块需求
傅里叶的猫· 2025-10-30 20:33
中美芯片谈判 - 谈判结果引发市场对英伟达B30A芯片是否放开的猜测,但具体指向仍不明确 [2] - 前总统特朗普表示谈判涉及英伟达芯片,但排除了Blackwell架构,可能指代B200/B300以外的产品 [2] OpenAI上市计划 - OpenAI启动IPO筹备,目标估值1万亿美元,计划融资不低于600亿美元,预计2027年上市 [3][4] - 公司2025年预计营收约130亿美元,但运营亏损因算力扩张与研发投入持续扩大 [5] - 已完成公司结构重组,将早期投资者持股转为普通股并取消股东回报上限,为上市扫清障碍 [5] - 微软持有约27%股份,但已放弃云服务独家供应权,双方转为基于2500亿美元采购合同的合作关系 [5] - 上市计划正值全球AI投资热潮,早期投资者如微软所持股份价值约1350亿美元 [6] 北美云服务提供商业绩与资本开支 - Meta、微软和谷歌均上调资本开支,显示对AI发展的乐观态度 [7][10] - Meta AI月活跃用户超10亿,其Superintelligence Labs正研发下一代通用AI模型,计划整合三大AI系统 [10] - 微软与OpenAI签署新协议,OpenAI新增2500亿美元Azure服务采购承诺,Azure AI Foundry已有8万家客户 [12] - 谷歌采取全栈式AI布局,其Gemini API每分钟处理70亿tokens,Gemini应用月活用户超6.5亿 [13] - 行业矛盾正从缺算力转向缺电力,未来3-5年电力供应将成为关键红利期 [13] 光模块市场需求预测 - 2026年1.6T光模块总出货量预计提升至3000万件,受英伟达Rubin架构和谷歌TPU需求驱动 [16] - 英伟达2025/2026年CoWoS需求预计达37.7万片/63万片,2026年Blackwell/Rubin出货预计为500万/200万件 [16] - 谷歌2025/2026年TPU出货量预计270万件/400万件,将带动600万/1000万件800G/1.6T光模块需求 [16] - 英伟达Rubin GPU配备两颗CX9网卡芯片,带宽较Blackwell翻倍 [17] - Lumentum的OCS业务2025/2026年总出货量预计1.5万/3万件,2026年占30%市场份额 [18] 芯片与ASIC出货及市场规模 - 2024年全球GPGPU总出货量510万件,预计2026年达1040万件,2024年至2026年复合年增长率43% [19] - 2024年全球ASIC总出货量420万件,预计2026年达890万件,2024年至2026年复合年增长率46% [19] - 2024年GPGPU市场规模1180亿美元,预计2026年达2710亿美元,2024年至2026年复合年增长率51% [19] - 2026年800G光模块出货量预计4300万件,1.6T光模块出货量预计3000万件 [20] 半导体制造技术 - SemiAnalysis发布关于X射线光刻技术能否颠覆ASML与台积电芯片制造格局的分析 [21]
全球顶级AI模型混战:中国AI包揽冠亚军 DeepSeek逆袭登顶
新浪财经· 2025-10-29 02:25
中国AI集体登顶 记者打开nof1.ai的实时战况图,6个顶尖AI模型勾勒6条起伏的曲线,显现出悬殊的胜负结果。 其中代表DeepSeek的蓝色曲线后程发力、实现强势反超,成为最耀眼的存在。从10月18日的0%起步, 其凭借稳健策略逐步积累优势,在比赛后期实现逆袭,截至10月27日10点,账户资金大涨至22304美 元,10天净赚12304美元,收益率达123.04%。这也意味着,若按此测算,其年化收益率将突破4491%, 表现可谓惊艳。 来源:@中国经营报微博 中经记者 吴清 北京报道 当顶级AI模型从实验室的测试榜单走向真金白银的战场,结果出人意料。 截至10月27日10点,在一场全球顶级AI模型的金融实战中,中国AI模型不仅包揽冠亚军,DeepSeek更 是逆袭登顶,而美国顶尖AI模型则集体陷入亏损乃至崩盘的泥潭。 近日,知名交易平台nof1.ai为全球顶级AI模型开启了一场为期10天的冠军争夺战:其给包括GPT、 DeepSeek在内的全球6个顶级AI模型各发放1万美元本金,让它们在Hyperliquid去中心化交易所自主交易 BTC、ETH等主流加密货币,没有人工干预,没有策略预设,也没有任何人为提 ...
AI 全球“斗蛐蛐”,中国队胜出
虎嗅APP· 2025-10-28 21:33
比赛核心观点 - 一场由美国实验室Nof1组织的真实资金AI投资比赛结果显示,中国团队开发的AI模型(幻方DeepSeek V3.1 Chat和阿里Qwen 3 Max)表现优异,显著领先于国际知名模型如GPT-5和Gemini 2.5 Pro [4] - 比赛本质是针对AI模型交易能力的压力测试,核心在于观察不同AI在真实波动市场中的策略有效性、风险控制及执行纪律 [5] - 在真实的交易场景中,强大的语言能力不足以保证成功,对市场的理解更为重要,市场是检测AI智能的终极测试 [18] 各AI模型表现差异分析 - **幻方DeepSeek (DS)**:表现稳健,采用全仓全覆盖做多策略,杠杆10到15倍,相当于持有A6指数,不换手不止损,夏普比率最高,平均持仓时间长达49小时,总回报率达37.46% [9][13][24][25] - **阿里Qwen**:收益曲线在比赛后期陡升,一度超越DS位居第一,其策略是看准上涨信号后满仓高倍杠杆做多单一最强资产,80%以上收益来自一笔交易,但夏普率仅0.338,风险极高 [14][15][25] - **GPT-5**:表现最差,亏损率最高时超过75%,存在频繁交易、小赢大亏、胜率低的问题,策略矛盾且未设置止损线,被形容为“交易风格神似散户” [4][13][19] - **Gemini 2.5 Pro**:亏损率达70%左右,策略漂移不定,频繁开仓平仓,先空后多,产生高额交易成本并错过主升浪,最大收益金额约为最大损失的一半 [10][12][19] - **Claude 4.5 Sonnet**:过于谨慎,分析能力强但执行犹豫,经常调仓失败、反复止损,收益曲线在零轴上下反复,在趋势明确市场中保守成为包袱 [9][13][20] - **Grok 4**:初期全多头布局且激进,但持仓中偏爱与马斯克叙事红利相关的虚拟资产,缺乏基本面支撑,市场情绪退潮后快速回吐收益 [9][13][22] AI表现差异的根本原因 - 训练数据的影响是关键,DeepSeek背后的幻方量化在中国A股市场积累了海量的实战交易数据和策略,而OpenAI和Google的训练数据更偏向学术论文和网络文本,对实盘交易理解不足 [26][27] - 模型架构侧重不同,DS可能在训练时特别优化了时间序列预测能力,而GPT-5可能更擅长处理自然语言,导致在面对价格图表等结构化数据时表现迥异 [27] 对普通投资者的启示 - 从长期投资角度看,幻方DeepSeek的多头分散策略更具可持续性,普通投资者应避免过度交易,并谨慎使用杠杆 [28] - 若判断市场处于上行大周期,应学会忽略中途的小幅震荡,稳持头寸是更优解,而非频繁交易 [29] - AI的优势在于理性,能在极短时间内分析海量信息并提供结构化判断,但其无法预测未来,也难以捕捉市场的动态博弈与隐性信号,面对黑天鹅事件反应滞后 [31][32] - AI应作为成熟投资者的决策辅助工具,能高效用好AI的人本身需具备较强的投资素养,可提供专业提示词让AI生成个性化策略 [34][35]
AIGC如何“破界”?看行业大咖拆解,从模型能力到商业增长的全球落地法则
搜狐财经· 2025-10-28 19:06
生数科技 副总裁 王川 近年来,AI技术的爆发式发展正以前所未有的速度重塑全球产业格局。从底层大模型的持续迭代到垂直场景的精准落地,从文本、图像的单模态交互到 多模态融合的全面突破,AI已从"辅助工具"进化为驱动业务增长的"核心引擎"。特别是AIGC的崛起,不仅让内容生产效率指数级提升,更打破了传统出 海业务中语言、文化、媒介形式的限制,重新定义了全球化的边界。 多模态生成大模型正迎来系统性可用窗口,其中视频生成技术发展尤为迅速。以Sora 2为代表的模型突破为视频社交玩法带来颠覆性创新:内容生态 从"少数人创作"向"人人共创"转变;社交逻辑从算法推荐转向以朋友互动为核心的创作社交;消费体验通过Remix模式实现从"刷视频"到"逛故事空间"的 升级。 在这场由技术驱动的变革中,如何将AIGC从前沿概念转化为可落地的商业增长点?跨境场景下,AI应用的合规性、支付链路的技术适配、多模态内容的 本地化调优又有哪些实战经验?这些问题正成为出海企业关注的焦点。 基于此,由扬帆出海、WebEye、FastSpring联合主办的《融合无界:AIGC出海新航道》闭门会于2025年10月22日在北京启幕。聚焦AIGC在出海领域 ...
AI 全球“斗蛐蛐”,中国队胜出
虎嗅· 2025-10-28 16:44
比赛概况与核心观点 - 美国实验室Nof1启动一项金融实战比赛,向六个顶尖AI大模型各提供10,000美元真实资金,在虚拟货币永续合约市场进行为期约两周的投资对决,核心在于测试AI在真实波动市场中的策略有效性、风险控制及执行纪律[1][2] - 比赛结果显示,来自中国的模型表现优异,幻方DeepSeek V3.1 Chat和阿里Qwen 3 Max收益率遥遥领先,而谷歌Gemini 2.5 Pro和OpenAI GPT-5则一度亏损约70%[1][9] - 此次比赛与以往回测不同,是让AI直面真实、动态、复杂的市场环境,实践是检验真理的唯一标准,市场是检测AI智能的终极测试[13] 各AI模型表现与策略分析 - **幻方DeepSeek (DS)**:采取稳健的量化策略,全仓分散做多并持有类似自建指数,杠杆10-15倍,预留现金,平均持仓时间长达49小时,夏普比率最高,账户价值达$21,566,收益率+115.66%[6][15][19][20] - **阿里Qwen**:策略激进,看准机会即满仓高倍杠杆押注单一资产,现金预留极少,80%以上收益来自一笔交易,夏普率0.338,账户价值$16,817,收益率+68.17%,但高收益伴随极高波动性[10][11][15][21] - **Claude 4.5 Sonnet**:分析能力强但执行犹豫,频繁调仓失败和止损,风格保守像基金经理,胜率较高但收益一般,账户价值$11,312,收益率+13.12%[2][9][15][17] - **Grok 4**:交易风格激进,全多头布局,但对与马斯克叙事相关的虚拟资产偏好可能拖累表现,收益曲线大幅波动,账户价值$10,450,收益率+4.5%[6][9][15][18] - **谷歌Gemini 2.5 Pro**:策略漂移摇摆不定,频繁开仓平仓产生高额交易成本,小赢大亏,最大收益金额约为最大损失的一半,账户价值$3,867,收益率-61.33%[7][8][15] - **OpenAI GPT-5**:存在频繁交易和小赢大亏问题,胜率低,策略矛盾且未设止损,多次爆亏严重侵蚀本金,亏损率最高时超过75%,账户价值$3,825,收益率-61.75%[9][15][16] 表现差异原因分析 - 模型表现差异与背后平台训练数据密切相关,DeepSeek背后的幻方量化在中国A股市场积累了海量实战交易数据和策略,对“好的交易决策”理解更接地气[21] - OpenAI和Google的训练数据可能更偏向学术论文和网络文本,对实盘交易理解不足,而DeepSeek可能在训练时特别优化了时间序列预测能力,GPT-5更擅长处理自然语言[21][22] - 在真实交易场景中,强大的语言能力不足以保证成功,对市场的动态理解更为关键[14] 对投资行业的启示 - 从长期投资角度看,若无信心成为顶尖交易员,DeepSeek的多头分散策略更具可持续性,普通投资者应避免过度交易并谨慎使用杠杆[23] - 若判断市场处于上行周期,应学会忽略小幅震荡,稳定持有相比频繁交易是更优解[24] - AI的优势在于理性、无情绪化,能快速处理海量信息并提供结构化判断,但其短板是无法预测未来,难以捕捉市场动态博弈与隐性信号,面对黑天鹅事件反应滞后[26] - 能高效运用AI辅助投资的人本身已是成熟投资者,AI仅是决策辅助工具,理性的工具与人的智慧相结合才是未来最佳交易策略[27][28][29]
华尔街之狼,与AI共舞
36氪· 2025-10-28 16:05
比赛概况 - Alpha Arena实验室于2025年10月17日至11月3日举办实时加密货币AI交易竞赛,由Jay Azhang创办[1] - 比赛规则为所有AI模型获得相同初始资金和实时数据源,在无人类干预下自主决策交易,包括策略生成、仓位管理和风控设置[1] - 设置基准选手采用简单买入并持有BTC策略,用于对比验证AI模型的收益表现[2] - 为增加曝光度引入第三方预测市场Polymarket,观众可对获胜AI下注,形成元赌局[3] - 整个过程公开透明,nof1.ai官网实时展示所有模型的持仓、交易记录和决策日志[3] 参赛模型与交易设置 - 共涉及6个全球顶尖AI模型:GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max[5] - 每个模型分配10,000美元真实初始资本[5] - 交易标的为BTC、ETH、SOL、BNB、DOGE、XRP等主流加密货币永续合约[5] - 所有交易均在Hyperliquid平台执行,确保资金安全和交易透明度[5] - 比赛于2025年10月18日开始,持续进行[5] 中国模型表现 - 阿里巴巴Qwen3 Max展现险中求胜的机会主义风格,前期表现平平但通过重仓做多BTC/ETH并使用20倍杠杆实现逆袭[10] - Qwen3 Max在10月19-20日市场上涨时果断押注,账户资产实现两位数累计收益率,截至10月23日较初始上涨13%-47%[10] - Qwen3 Max交易频率较低,平均持仓时长超过7小时,体现"少即是多"策略[10] - DeepSeek V3.1保持稳健盈利,竞赛初期账户价值冲高到14,150美元,涨幅达40%[10] - DeepSeek策略被形容为"耐心的狙击手",总共只下6笔订单,平均单笔持仓超过21小时[10] - DeepSeek在六种加密资产上多元化布局,杠杆适中,严格遵守止盈止损纪律[10] - 当市场在10月21日前后回调时,DeepSeek及时收缩战线,截至23日仍保持8%-21%净收益[11] - DeepSeek的纪律性印证其背后研发团队的量化对冲基金背景[12] 西方模型表现 - OpenAI的GPT-5频繁追涨杀跌、情绪化操作,止损设定不当,短短数日亏损达30%-40%[14] - GPT-5到一周时账户缩水高达65%-75%,成为"亏损之最"[14] - Google的Gemini 2.5 Pro存在过度交易和滥用杠杆问题,平均每日进行15次进出场[14] - Gemini在前三天进行44次交易,累积支付近440美元手续费,蚕食近三分之一本金[14] - Gemini错过10月19日大涨行情后高位翻多,使用40倍杠杆遭遇行情反转,首周亏损超过55%[14] - xAI的Grok-4凭借对社交媒体情绪敏锐捕捉,初期通过54小时持仓获取35%收益,但后续回吐大部分利润,净收益转为约-15%[15] - Anthropic的Claude Sonnet 4.5全程谨慎保守,只下3单,前期曾有24%涨幅但最终收益转负约-17%[19] - Claude虽盈利不多,但一度创造所有模型中最优夏普比率,体现"稳健不过山,有时胜过猛盈利"[19] 市场环境与实验意义 - 加密货币市场是典型零和博弈,信息极度不对称,价格每分每秒波动,没有唯一答案[7] - 传统AI评估在静态环境中测试,而加密市场要求AI在动态环境中应对风险[6][7] - 基准的"买入并持有BTC"策略在此期间盈亏基本持平,未大幅跑输或跑赢AI模型[20] - 实验展示AI在无标准答案世界中试错的能力,为金融领域智能应用提供新视角[20]
中国独角兽开源M2比肩硅谷技术,成本仅8%
环球网资讯· 2025-10-28 14:39
模型发布与核心性能 - 中国AI公司MiniMax于2025年10月27日正式发布并开源新一代文本大模型MiniMax-M2 [1] - 该模型采用混合专家架构,总参数为2300亿,激活参数为100亿,是一款轻量级模型 [1][13] - 在行业测评榜单Artificial Analysis上,M2模型总分冲入全球前五,在开源模型中排名第一,超越了谷歌的Gemini 2.5 Pro和Anthropic的Claude 4.1等模型 [1][15] 技术能力与基准测试表现 - 模型专为编码和智能体任务深度优化,具备强大的端到端开发能力,能够处理多代码文件并执行完整的“编码-运行-调试”循环 [20][21] - 在Xbench-DeepSearch基准测试中,M2的深度搜索能力位列全球前二,仅次于GPT-5 [21] - 在字节推出的金融搜索基准FinSearchComp-global上,M2同样位列全球前二,仅次于Grok-4 [21] - 在Reddit社区分享的基准测试中,M2获得了58.3%的分数 [8][19] 成本效率与市场反响 - M2的API服务定价为每百万Token输入0.3美元,输出1.2美元,综合成本不到Claude 4.5 Sonnet的8% [1][6][22] - 在OpenRouter平台上线不到两天,模型调用量已跻身全球前10 [22] - 海外开发者如CoreViewHQ联合创始人兼CTO Ivan Fioravant测试后评价模型表现出色,甚至优于Claude 4.1 Opus [8][10] 行业影响与算法创新 - M2的发布被视为中国AI实验室在开源领域领先地位的延续,继DeepSeek、阿里巴巴、Z AI和Moonshot AI之后 [1][6] - Meta在其最新的强化学习论文《The Art of Scaling Reinforcement Learning Compute for LLMs》中,大规模验证并采用了MiniMax原创的CISPO损失函数和FP32 Head技术 [26] - 论文指出MiniMax的CISPO算法在效率上显著高于现有的DAPO算法,并将MiniMax列为推动大规模强化学习ScaleRL突破的关键 [26]