Seek .(SKLTY)
搜索文档
DeepSeek陈德里:AI变革短期机遇多,但长期可能风险更大
新浪科技· 2025-11-07 16:51
AI发展时间框架与影响 - AI发展在3-5年短期处于蜜月期 AI作为能力增强工具用于解决复杂问题和创造更大价值 [1] - 在5-10年中期 AI开始取代部分人类工作 风险上升并带来失业风险 [1] - 在10-20年长期 AI将取代人类市场大量工作 对社会秩序构成重大挑战 [2] 科技公司角色演变 - 中期阶段科技公司应扮演吹哨人角色 向社会公众提供风险提醒 说明无法被取代的工作和未来所需技能 [1] - 长期阶段科技公司应守护人类安全并参与社会秩序重塑 [2] AI革命与工业革命对比 - 本轮AI革命与历史上工业革命存在非常大不同 历次工业革命更多是工具 对人类制度影响有限且人类是主体 [2]
两周复刻DeepSeek-OCR,两人小团队还原低token高压缩核心,换完解码器更实用
36氪· 2025-11-07 15:11
技术复刻与核心优势 - 两人小团队在两周内成功复刻了DeepSeek-OCR,复刻版名为DeepOCR,完全开源且无需依赖大规模算力集群,仅需两张H200即可完成训练[1] - 复刻版还原了原版低token高压缩的核心优势,在关键任务上表现接近原版,其设计思想是通过少量视觉token表示大量文本内容,以降低大模型处理长文本的计算开销[3] - 核心压缩逻辑有效,DeepOCR使用约250个视觉tokens,而基线模型Qwen2.5-VL-7B需要3949个tokens才能达到类似效果,压缩比可达7-20倍,在10倍压缩下准确率保持97%[3][15] 架构设计与技术实现 - 复刻版精准还原了原版DeepEncoder编码器的“局部处理-压缩-全局理解”三阶段串联结构,采用SAM-base处理图像、16×卷积压缩器压缩token、CLIP-large进行全局语义理解[6] - 在解码器上做了务实调整,将原版DeepSeek-3B-MoE替换为与VILA训练框架兼容性更好且完全开源的Qwen2-7B-Instruct,降低了技术落地门槛[9] - 采用两阶段训练流程并全程冻结DeepEncoder,大幅降低显存需求,训练方案可在2×H200 GPU上运行,适配中小团队资源条件[13] 性能表现与基准测试 - 在基础任务中,英文文本识别和表格解析表现突出,表格解析甚至优于原版,这得益于对原版2D空间编码的精准还原[15] - 在olmOCR基准测试中,简单文档的基础OCR能力扎实,与原版表现接近,但在复杂任务上因训练数据限制与原版存在客观差距[16][17] - 团队计划通过补充公式、多语言等训练数据,并应用动态温度缩放、RLVR等技术以缩小复杂任务上的性能差距[18] 团队背景与项目信息 - 核心团队成员Ming Liu拥有北京大学物理硕士学位,目前为爱荷华州立大学计算机博士,研究方向为多模态,曾在亚马逊担任应用科学家实习生[19] - 另一成员刘世隆拥有清华大学工学学士和计算机博士学位,现为普林斯顿大学人工智能实验室博士后研究员,研究方向包括LLM智能体、多模态等,曾有字节跳动、英伟达和微软经历[20] - 项目已完全开源,代码和项目主页均已公开[22]
5款AI原生App月活破千万,字节、腾讯、DeepSeek、蚂蚁纷纷落子
经济观察网· 2025-11-05 14:38
中国AI应用市场格局 - 蚂蚁集团旗下AI健康应用AQ月活用户规模正式突破千万,上线仅4个月[1] - 中国AI应用“千万月活”Top5格局成型,包括豆包、Deep Seek、腾讯元宝、即梦AI和AQ[1] - 五款月活千万应用分别来自字节跳动、腾讯、DeepSeek、蚂蚁四家大厂[1] 主要厂商竞争态势 - 豆包、DeepSeek、元宝已形成稳定的“三足鼎立”局面[1] - 在QuestMobile第三季度AI应用榜中,豆包首次超过DeepSeek,登顶下载量、月活双料冠军[1] - 字节跳动推出一站式AI创作平台即梦AI,进一步支撑、丰富其庞大的内容创作生态[1] 细分领域表现 - AQ是月活千万的5款AI应用中唯一一个行业专业级AI应用[1] - AQ月活用户规模复合增长率高达83.4%,远超行业13.5%的平均增速[1] - AQ引领“AI+医疗健康”异军突起,是2025年AI应用市场增长最快的一匹黑马[1]
首届AI实盘投资大赛:阿里千问20%收益率夺冠,DeepSeek第二,美国四大模型均亏损
观察者网· 2025-11-04 22:57
比赛结果概览 - AI大模型实时投资比赛“Alpha Arena”历时17天,于11月4日结束,阿里千问Qwen以超过20%的收益率夺冠,DeepSeek位列第二,成为全场唯二盈利的模型 [1][4] - 美国四大顶尖模型Claude Sonnet 4.5、Grok 4、Gemini 2.5 Pro和GPT-5全部亏损,其中GPT-5亏损超62%垫底 [1][6] - 最终排名及收益率分别为:Qwen3 Max账户价值$12,232(+22.32%)、DeepSeek Chat v3.1账户价值$10,489(+4.89%)、Claude Sonnet 4.5账户价值$6,919(-30.81%)、Grok 4账户价值$5,470(-45.3%)、Gemini 2.5 Pro账户价值$4,329(-56.71%)、GPT 5账户价值$3,734(-62.66%)[8] 比赛过程与策略 - 比赛初期DeepSeek v3.1一直领先,Grok 4通过激进策略一度将差距缩小至1美元 [2] - 10月21日至22日成为转折点,Grok 4和Claude Sonnet 4.5收益大幅下滑由盈转亏,当日六个大模型收益率全部告负 [2] - 在其余四个模型持续亏损的情况下,DeepSeek v3.1和Qwen3-Max自动改写投资策略,净值曲线波动上涨,Qwen3-Max一度超过DeepSeek v3.1并最终夺冠 [4] 比赛设置与行业意义 - 比赛由第三方机构Nof1于10月18日发起,汇集全球六大顶尖模型Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4 [1] - 每个模型获得1万美元初始资金及实时金融市场数据,在真实市场中自主决策交易,全程无人工干预,是AI处理实时现实世界任务的真实评测 [1] - 比赛采用统一输入方式,所有模型接收相同市场数据和提示词,交易记录持仓和账户价值实时公开,保证公平透明 [2] 中国模型行业地位 - 根据OpenRouter 7月榜单,中国DeepSeek和阿里通义千问跻身全球前五,通义千问以10.4%市场份额超越OpenAI的4.7%位列第四 [14] - OpenRouter数据显示成长最快前10大模型中9个是开源的,Qwen3-Coder调用量以近500亿Tokens高居第一,通义千问包揽前三并在前十中占据五席 [14] - 行业人士指出阿里千问和DeepSeek的实战表现证明中国模型在解决实际问题上的强大潜力,AI对场景的深刻理解将成为大模型落地和全球AI竞赛的关键 [14]
投资大赛:阿里千问、DeepSeek赚了,GPT-5大亏
南方都市报· 2025-11-04 21:41
比赛概况与结果 - 首届由美国AI研究实验室nof1发起的AI大模型交易大赛于11月3日结束,比赛为期两周,6家领先大模型各获得1万美元初始资金,在无人类干预的真实市场中进行自主交易[1] - 交易标的为加密货币衍生品(永续期货),币种包括比特币、以太坊、狗狗币等,模型仅能使用数值市场数据输入,无法获得新闻或市场消息[5] - 最终两家国产大模型实现盈利:阿里千问Qwen3 Max以22.3%收益率排名第一,盈利2232美元;DeepSeek Chat V3.1以4.89%收益率排名第二,盈利489.08美元[1] - 其余四家模型均大幅亏损:Claude Sonnet 4.5亏损30.81%,Grok 4亏损45.3%,Gemini 2.5 Pro亏损56.71%,GPT 5亏损62.66%[2] 模型交易行为分析 - 在做空倾向上,Grok 4、GPT-5和Gemini 2.5 Pro的做空频率远高于同行,而Claude Sonnet 4.5几乎从不做空[6] - 在持仓时间上,不同模型差异较大,Grok 4的持仓时间最长;在交易频率上,Gemini 2.5 Pro最活跃(238笔交易),Grok 4最不活跃[3][6] - 在仓位规模上,阿里Qwen 3的仓位规模始终最大,通常是GPT-5和Gemini 2.5 Pro的数倍[6] - 在退出机制方面,Qwen 3的止损与止盈距离最窄,Grok 4与DeepSeek V3.1则最宽;在持仓数量上,Claude Sonnet 4.5和Qwen 3通常一次只维持1-2个活跃仓位[6] 比赛过程与行业意义 - 比赛过程中出现显著波动,DeepSeek V3.1从10月26日起长期保持最高盈利,但在11月4日被阿里Qwen 3反超;Claude和Grok频繁调仓未能返回正区,Gemini和GPT-5持续下滑[7] - 主办方指出举办比赛的原因为:现有静态基准测试存在不足,仅测试固定数据集上的模式匹配能力,忽略了长期决策、运行鲁棒性和适应性,且测试结果易被模型记忆导致价值降低[7] - 比赛旨在真实、动态、竞争激烈的环境中测试模型的决策能力,参赛模型代表中美两国闭源和开源供应商的最新技术水平[5][7]
首届AI交易大赛落幕,6个AI炒币2周:Qwen、DeepSeek赚钱,GPT-5血亏6000刀
36氪· 2025-11-04 19:13
大赛概况 - 首届Nof1 AI模型交易大赛于2025年10月17日启动,11月3日结束,旨在衡量AI投资能力,被誉为“币圈版的图灵测试” [1] - 参赛模型为6款代表中美两国闭源和开源供应商最新技术水平的大模型,包括DeepSeek Chat V3.1、Grok 4、Gemini 2.5 Pro、GPT-5、Qwen3 Max、Claude Sonnet 4.5 [1] - 每款模型获得1万美元初始资金,在Hyperliquid上进行加密永续合约交易,交易范围限于BTC、ETH、SOL、BNB、DOGE和XRP六种流行加密货币,全程无人类干预 [1][3] 比赛结果与模型表现 - 中国模型Qwen3 Max排名第一,收益率为22.3%,胜率为30.2%,总盈亏为$2232,总交易次数为43次 [3][5][9] - 中国模型DeepSeek Chat V3.1排名第二,收益率为4.89%,胜率为24.4%,总盈亏为$489.08,总交易次数为41次 [3][5][9] - 美国模型Claude Sonnet 4.5亏损30.81%,Grok 4亏损45.3%,Gemini 2.5 Pro亏损56.71%,GPT-5亏损62.66% [4][5] - 中国模型在风险控制与趋势识别上更为领先,而美国系模型普遍亏损严重 [12] 交易策略分析 - Qwen3 Max整体偏“进攻型”,Sharpe值为0.273,展现高风险高回报的进取型交易策略,最大盈利达$8,176 [5][9] - DeepSeek Chat V3.1策略理性稳健,Sharpe值为0.359为所有模型中最高,显示出色的风险控制能力,最大盈利$7,378 [5][9] - Gemini 2.5 Pro交易次数达238次为所有模型最高,极度活跃但胜率仅25.6%,Sharpe值-0.566,反映过度交易且回报低效 [5][10] - GPT-5交易存在较大波动且亏损严重,Sharpe值-0.525,最大盈利仅$270.77,缺乏有效的市场判断和风险管理 [5][11] 行业影响与市场观点 - 币安创始人赵长鹏评论认为,若所有人使用相同AI模型交易可能导致同质化操作,影响市场动态,但也可能通过购买力推动价格上涨 [7] - 预计因AI交易表现引起关注,未来将有更多人研究AI在交易中的应用,交易量会大幅增加 [7] - 比赛选择加密资产因市场全天候开放、数据丰富易于获取、Hyperliquid快速可靠且易集成,支持透明审计 [3]
震荡股市中的AI交易员:DeepSeek从从容容游刃有余? 港大开源一周8k星标走红
新浪财经· 2025-11-04 17:15
实验概况 - 港大黄超教授团队于2025年10月启动AI-Trader开源项目实盘测试,六位大模型AI交易员各以1万美元在纳斯达克100市场进行交易[3][4] - 项目上线一周内在GitHub获得近8千星标,展现了社区对AI自主交易技术的高度关注[3] - 实验旨在测试AI系统的交易纪律、市场耐心和信息过滤三项关键能力,反映了现代量化交易的核心挑战[6] 模型表现对比 - DeepSeek-Chat-V3.1以+13.89%的收益率领先,采用逆向情绪交易策略,在市场恐慌时加仓NVDA和MSFT[5][8] - MiniMax-M2获得+10.72%收益,采取稳健持仓策略,月度交易仅28次,通过均衡投资组合分散风险[5][9] - Claude-3.7-Sonnet和GPT-5收益率分别为+7.12%和+7.11%,前者坚持长期持有核心组合,后者尝试动态再平衡但时机把握欠佳[5][10][11] - Qwen3-Max收益+3.44%,因保守观望错失反弹窗口,Gemini-2.5-Flash收益-0.54%,因高频交易和情绪化决策导致亏损[5][12][13] - 同期QQQ(纳斯达克100 ETF)上涨+2.30%,多数AI模型表现优于基准[5] 策略行为分析 - 10月10日市场震荡期间,各AI系统展现出明显的策略差异:DeepSeek实施反向加仓,MiniMax保持低频调仓,Claude坚持长期持有[7][8][9][10] - Gemini-2.5-Flash月度交易73次,仅10月10日就执行5次操作,过度交易导致摩擦成本累积[13] - 实验表明有效的投资决策源于对不确定性的合理管理,而非对市场的完美预测,行动力未必总是优势[14][19] 技术意义与前景 - AI-Trader项目提供了决策行为分析框架,通过量化不同策略在相同市场下的表现,客观理解投资决策本质[19] - 表现领先的DeepSeek和MiniMax均为中国开发的大模型,显示中国AI技术正从对话交互向实际任务执行能力演进[19] - 金融交易作为标准化、数据丰富的场景,为AI决策能力提供理想验证环境,类似系统有望应用于供应链优化、医疗资源配置等复杂决策场景[19] - 项目已在GitHub开源(MIT协议),支持多模型并行回测、自定义市场环境和决策日志全透明回溯等功能[17][18]
AI大模型实时投资比赛落幕,阿里千问Qwen以22.32%的收益率夺冠!Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而四大美国顶尖模型全部亏损
搜狐财经· 2025-11-04 11:41
比赛结果 - 阿里千问Qwen在AI大模型实时投资比赛中以22.32%的收益率夺得冠军 [1][3] - 比赛历时17天,初始资金为一万美元,在真实市场无人工干预自主交易 [1][3] - Qwen和DeepSeek v3.1是唯二盈利的中国模型,四大美国顶尖模型全部亏损 [3] 参赛模型 - 比赛集合全球六大顶尖模型,包括Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4 [1] - 比赛由第三方机构Nof1于10月18日发起 [1] 模型表现对比 - 美国模型GPT-5亏损超62%垫底 [3] - 中国模型在本次投资竞赛中表现显著优于美国模型 [3]
台积电前副总警告:绕过现有架构,大陆说不定走新的路径反超我们,就像DeepSeek把大家都吓到!网友:不是说不定,是一定
新浪财经· 2025-11-03 18:24
文章核心观点 - 大陆半导体行业可能通过新材料、新架构等创新路径实现技术反超,而非一味追随台积电和三星的先进制程竞赛 [1][5] - 利用Chiplet、新型半导体材料、存算一体架构等技术,以成熟制程实现接近先进制程的性能,结合成本低和市场大的优势,是潜在的破局逻辑 [3][5] - 国内新能源汽车、物联网等市场的爆发为“够用就好”的芯片提供了商业化土壤,推动新路径的探索和落地 [5] 绕开现有架构的猜想与破局逻辑 - 台积电前高管提出,大陆或可通过新材料、新架构等方式,用7nm工艺实现5nm工艺的功能,从而绕开先进制程研发的高成本和物理极限 [3][5] - 先进制程研发成本极高,3nm制程研发成本达数十亿美元,且面临晶体管漏电、发热等物理极限问题 [5] - Chiplet技术被视为一条新路径,通过将不同制程的芯片模块组合,无需追求整片晶圆的先进制程即可实现高性能 [5] - 国内企业如长电科技在先进封装技术、华为在芯片设计架构上已有探索 [5] 新路径技术探索的最新动态 - 国内某研究所在氧化镓半导体材料上取得突破,该材料禁带宽度远超传统硅材料,在高频高压场景下性能更强,可能绕开硅基制程瓶颈 [5] - 某头部芯片设计公司正在测试“存算一体”架构芯片,将存储和计算单元整合,能效比为传统架构的数倍,可用7nm工艺实现接近5nm的AI算力 [5] - 本土晶圆厂14nm产线满负荷运转,市场需求更注重芯片性价比而非盲目追求制程数字,为新技术路径提供商业化动力 [5] 行业历史镜鉴与市场共识 - 科技史上存在“换道超车”的成功案例,如日本在存储器领域被韩国反超后,转而押注CMOS图像传感器并取得领先地位 [7] - 大陆半导体的“新路径”探索被视为一次“换道”尝试,当先进制程之路越走越窄时,新材料、新架构和新应用场景可能成为破局关键 [7] - 市场的共识是大陆半导体通过新路径实现反超的可能性存在,且时间不会太远 [7]
诺贝尔化学奖得主迈克尔·莱维特:每天使用DeepSeek和Kimi,要学会向AI提问
环球网· 2025-11-03 15:06
行业观点 - 诺贝尔化学奖得主迈克尔·莱维特表示AI对一切都有帮助 建议自由尝试并保持好奇心以学会向AI提问 [1] - 迈克尔·莱维特每日使用包括中国的DeepSeek和Kimi在内的多种AI软件 同时也使用ChatGPT、Gemini和Claude [1] 行业趋势 - 中国正以远超西方的速度构建科研生态 并且更擅长将技术转化为日常应用 [3] - 迈克尔·莱维特已将研究方向投向人工智能领域 其工作为现代药物设计和AI辅助科研奠定了数学基础 [3]