DeepSeek

搜索文档
AI浪潮录丨人工智能为什么是年轻人的事业?专访95后师天麾
贝壳财经· 2025-05-09 08:52
北京打造全球开源之都 - 北京正积极打造"全球开源之都",研发机构和企业积极拥抱开源,开源已深入到汽车、机器人等行业 [1] - 发展AI是一场科技长征,新京报AI研究院将深度访谈AI浪潮亲历者与见证人 [1] 清程极智联合创始人师天麾 - 师天麾是清程极智联合创始人,高中获信息学奥赛金牌保送清华,博士毕业后成为中科院计算所课程讲师、中国信通院技术专家 [4] - 他拒绝互联网大厂高薪选择创业,认为大厂的KPI和老板安排束缚创新 [5] - 师天麾认为国产芯片只要解决好用问题,凭借国内工业制造能力将以超高性价比胜出 [8] AI行业年轻化趋势 - AI技术活跃人才中30岁以下占比59.90% [6] - 清程极智员工平均年龄不到30岁,团队由清华计算机系师兄弟组建 [7] - 2024年崛起的Kimi由90后杨植麟领军,2025年DeepSeek核心团队由清北应届毕业生组成 [6] 清程极智业务与技术 - 公司专注于AI Infra(人工智能基础设施),连接硬件与AI算法的"中间层" [9][10] - 开源大模型推理引擎"赤兔"实现老旧英伟达GPU和国产芯片对FP8模型的高效部署 [8] - 计算能力扩展到10万台服务器超大规模集群,在多机并行计算、通信优化等方面经验丰富 [15] - 客户生态包括硬件厂商、大模型研发企业和有数字化转型需求的企业 [15] DeepSeek带来的影响 - DeepSeek爆火后,国产公司密集探讨快速适配方案 [14] - 公司提前布局MoE架构技术,推出DeepSeek一体机降低技术门槛 [15] - 目前部署较多模型包括DeepSeek、智谱GLM、Qwen和llama等主流模型 [16] 国产算力发展 - 定位是帮助国产芯片比肩英伟达,而非成为下一个英伟达 [17] - 国产硬件正在成熟过程中,发现底层Bug会及时反馈 [18] - 通过软硬协同让国产显卡更好用,有望实现性价比突破 [19] - 部分前瞻性客户已启动专项采购流程,将国产推理引擎纳入采购 [20] 公司文化与创新 - 团队氛围开放不"内卷",很少加班,重视不受限制的创造力 [25] - 相比大厂更注重创新,认为KPI压力会限制创新 [23][24] - 企业需要从用户角度考虑市场变化并积极适配,与实验室研究有区别 [26]
心智观察所:英伟达对他忍不住了
观察者网· 2025-05-09 08:17
中美AI竞争与Anthropic立场 - Anthropic公开支持美国政府对中国的AI芯片出口管制 认为这是确保民主国家在AI领域领先并捍卫自由价值观的必要手段 [1][7] - Anthropic将中美AI竞争框定为"民主AI"与"威权AI"的对决 警告中国AI可能被用于生成生物武器信息或破坏民主价值观 [7][9] - 英伟达强烈反对Anthropic的立场 认为中国拥有全球47%的AI研究人员和技术实力 监管无法遏制其发展 过度管制反而削弱美国企业竞争力 [1][8] Anthropic公司背景与发展 - Anthropic由前OpenAI研究人员创立 包括达里奥·阿莫迪和丹妮拉·阿莫迪等 团队深受有效利他主义哲学影响 [2][4] - 公司注册为公共利益公司 致力于开发"负责任"的AI Claude系列模型采用"宪法AI"框架确保输出安全性与价值一致性 [4] - Anthropic获得巨额融资 包括亚马逊125亿美元和谷歌50亿美元 推动其技术发展 2024年Claude 3系列在多项测试中超越对手 [5] 技术竞争与市场格局 - 中国AI企业如DeepSeek通过开源模式和价格优势挑战西方AI 其R1和V3模型性能接近美国最先进模型但成本仅为Claude 3.5 Sonnet的十分之一 [7][10] - DeepSeek采用混合专家模型和高效键值缓存技术 在算力优化和工程效率上取得突破 [10] - 中国AI生态在全球影响力扩大 开源模型在东南亚和非洲市场广受欢迎 而Anthropic的封闭生态和高昂费用限制其普及 [11][12] 行业分歧与战略考量 - 美国AI产业链内部分歧明显 芯片供应商如英伟达重视市场开放 模型开发者如Anthropic更担忧技术扩散风险 [8] - Anthropic支持出口管制的背后既有战略考量(延缓中国竞争者步伐) 也有意识形态驱动(民主与威权对决) [8][9] - 出口管制导致英伟达H20芯片预计损失55亿美元 凸显管制对美国企业的经济代价 [9] 全球AI治理与偏见争议 - Anthropic的"宪法AI"伦理标准被批评缺乏对非西方文化的适应性 西方模型被指带有明显美国西海岸偏见 [11][12] - 中国推动全球AI治理倡议和多边技术合作 而Anthropic支持的出口管制政策可能加剧全球AI生态碎片化 [12] - 研究表明AI模型的安全机制问题与开发者意识形态无关 西方模型同样存在生成有害内容的风险 [11]
腾讯研究院AI速递 20250509
腾讯研究院· 2025-05-08 21:47
OpenAI宣布全新AI发展计划OpenAI for Countries - OpenAI推出"OpenAI for Countries"计划,旨在为全球各国提供类似美国"星际之门"的AI基础设施建设 [1] - 计划包含数据中心建设、定制化ChatGPT服务、AI安全措施升级和国家创业基金四大核心服务 [1] - 首阶段将在全球选择10个国家合作,推广"民主的AI"理念以巩固美国AI领导地位 [1] Figma发布2025年重磅升级 - Figma推出五大新功能:Draw绘图工具、Grid响应式布局、Buzz品牌资产引擎、Sites网站构建工具和Make原型生成器 [2] - 新功能覆盖从视觉设计到网站发布全流程,支持AI辅助创作和批量生产 [2] - 产品定位从设计原型工具升级为全链路设计平台,整合插画、界面、网站、资产和上线功能 [2] Mistral AI发布Medium 3模型 - Mistral AI发布Medium 3模型,性能对标GPT-4o和Claude 3.7 Sonnet,价格仅为Sonnet的1/8 [3] - 模型专为企业设计,支持混合部署,在编程及多语言场景表现优异 [3] - 同步推出企业级聊天机器人Le Chat Enterprise,支持跨应用集成和AI智能体构建 [3] 谷歌Gemini图像生成功能升级 - Gemini原生图像生成功能提升视觉质量和文本渲染准确度,支持实时编辑和元素融合 [4] - 每张图片定价0.039美元,生成速度快但在整体效果上或仍不及GPT-4o [4][5] - 新功能可与Gemini 2.5 Pro结合使用,支持将图片转换为代码表示的动态效果 [5] 微软宣布AI Agent支持新协议 - 微软Azure AI Foundry和Copilot Studio支持A2A和MCP协议,旨在打破智能体开发和通信壁垒 [6] - 已有超7万企业通过Azure AI Foundry开发智能体,4个月内超1万家组织采用Agent Service [6] - A2A协议支持智能体跨平台协作,MCP协议提供统一通信框架 [6] HeyGen发布Avatar IV模型 - Avatar IV模型仅需一张照片和语音/文字输入即可生成逼真的AI数字人视频 [7] - 采用基于扩散模型的音频驱动表情引擎,能根据语音节奏和情绪自动生成对应表情与动作 [7] - 付费用户可生成30秒视频,免费用户每月3次10秒视频额度 [7] DeepSeek致谢腾讯技术贡献 - DeepSeek的DeepEP网络通信框架引入腾讯TRMT技术后性能翻倍 [8] - 腾讯优化方案包括拓扑感知的多QP建链、基于IBGDA的多Channel负载均衡传输等 [8] - 优化后的DeepEP已开源,可帮助MoE架构大模型摆脱NCCL依赖 [8] OpenAI人事变动 - OpenAI任命Instacart CEO Fidji Simo为应用部门CEO,负责推动技术落地和商业化 [10] - OpenAI发展为三大核心业务:全球产品服务、基础设施建设和非营利组织 [10] - Sam Altman将专注于研究、计算和安全系统三大支柱 [10] UC伯克利开发VideoMimic系统 - VideoMimic系统让机器人通过观看视频就能学习人类动作,已让宇树G1掌握100多种动作 [11] - 系统不需动作捕捉设备,仅靠视频就能让机器人适应各种地形和完成复杂动作 [11] - 工作流程包括从视频重建人体运动、在仿真环境训练控制策略、部署到实体机器人三个步骤 [11] Meta AI战略布局 - Meta以Llama为核心布局AI,强调开源路线,聚焦广告优化、用户参与度提升等四大方向 [12] - Meta AI月活用户达10亿,认为AI在社交陪伴和内容创作方面潜力巨大 [12] - 将持续推进VR和AR差异化布局,认为AR眼镜是未来手机,VR是未来电视 [12]
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻
虎嗅· 2025-05-08 19:50
公司概况 - 阶跃星辰由前微软全球副总裁姜大昕于2023年创立,总部位于上海,北京办公室距离微软中国办公地仅504米 [1] - 公司核心管理团队包括CEO姜大昕(战略与技术研发)、首席科学家张祥雨(技术研发)、系统负责人朱亦博(AI基础设施) [1] - 公司员工规模达400余人,其中80%为技术研发人员,采用扁平化管理模式,员工可通过私信直接与CEO沟通 [2] - 2024年12月完成B轮数亿美元融资,是"AI六小虎"中少数坚持预训练路线的公司 [3] 技术战略 - 核心聚焦多模态基础模型研发,坚持"理解生成一体化架构"技术路线,认为这是实现AGI的必经之路 [1][11] - 已建立Step系列通用大模型矩阵,涵盖语言模型和多模态模型,2024年下半年多模态API调用量增长超45倍 [1][11] - 2025年1月发布推理模型Step R1-V-Mini,计划未来三个月推出满血版Step-R1 [14] - 近期将算法团队重组为"生成理解"团队,体现对理解生成一体化架构的重视 [1] 行业趋势判断 - 多模态领域尚未出现"GPT-4时刻",核心瓶颈在于缺乏统一的理解生成一体化架构 [1] - 模型演进路径分为三阶段:模拟世界(模仿训练)→探索世界(强化学习)→归纳世界(自主发现规律) [5][7] - 当前两大技术趋势:1) 将长思维链推理能力融入语言/多模态模型 2) 视觉领域理解生成一体化 [18][19] - 智能体(Agent)发展需要两个条件:多模态能力和慢思考能力,2024年这两方面取得突破性进展 [31] 产品应用 - 主要收入来源:面向品牌客户的ToB服务和面向开发者的API接口业务 [3] - 已推出Step 1X-Edit图片编辑模型,采用初级理解生成一体化技术,未来几个月将发布更先进版本 [30] - 重点布局智能终端Agent生态,与手机、汽车、机器人领域头部企业合作,提供云端Agent开发平台 [34][35] - 实际应用案例包括茶百道/瑞幸门店巡店系统,通过视觉推理实现90%以上的操作规范检测准确率 [17] 竞争格局 - 基础模型领域竞争激烈,过去半年仅OpenAI/Google/Meta/Grok/Anthropic就发布不少于8款新品 [3] - 国内竞争对手包括月之暗面、MiniMax等,但阶跃星辰在多模态覆盖广度和原生多模理念上具有差异化优势 [3][12] - 公司认为当前竞争焦点仍是"追求智能上限",将持续投入强化学习和多模态前沿技术研发 [4][15]
26次提公平、平等、同等,这部法律如何保护民营企业利益
新京报· 2025-05-08 19:44
民营经济促进法创下多个"第一":我国第一部专门关于民营经济发展的基础性法律,第一次将坚持"两 个毫不动摇"写入其中的法律,第一次明确了民营经济的法律地位。 根据法律规定,民营经济是社会主义市场经济的重要组成部分,是推进中国式现代化的生力军,是高质 量发展的重要基础,是推动我国全面建成社会主义现代化强国、实现中华民族伟大复兴的重要力量。促 进民营经济持续、健康、高质量发展,是国家长期坚持的重大方针政策。 民营经济促进法共9章78条,涉及企业公平竞争、投融资促进、科技创新、规范经营、服务保障、权益 保护等内容。从首次提出到完成立法,仅用不到18个月时间。 作为一部基础性法律,如此迅速地推出与当前背景有关。王振江表示,民营经济在我国国民经济和社会 发展中的地位、作用持续提升。截至3月底,全国登记在册民营企业超过5700万户,占企业总量的 92.3%。 尽快完成立法,"营造有利于包括民营经济在内的各种所有制经济共同发展的法治环境和社会氛围,坚 定不移办好自己的事,不断巩固中国经济企稳回升、长期向好态势,以高质量发展的确定性应对外部环 境急剧变化的不确定性。"王振江说。 法律的生命在于实施。司法部副部长王振江表示,民营 ...
零一万物联创戴宗宏离职创业 | 智能涌现独家
36氪· 2025-05-08 18:22
公司动态 - 零一万物联合创始人兼技术副总裁戴宗宏近期离职创业,其负责的AI Infra团队曾解决大模型训练系统瓶颈并提升效率[1][2] - 戴宗宏创业项目获创新工场投资,其背景包括华为云AI CTO、阿里达摩院AI Infra总监,组建的团队核心成员来自阿里、华为等头部企业[2] - 2024年下半年公司经历业务探索阻滞,技术路线判断失误导致未及时跟进MoE架构,2024年10月才发布新旗舰模型Yi-Lightning[4] - 2024年12月底模型预训练和AI Infra团队被裁撤后并入阿里通义和智能云团队,戴宗宏离职与此相关[4] - 2024年下半年以来多名联创及核心成员离职,包括李先刚、黄文灏等,2025年初AI视频项目负责人蓝雨川也离职创业[4] 业务表现 - 零一万物2023年成立时以AI Infra团队为行业稀缺资源,曾两个月内完成千卡GPU集群设计搭建[2] - 通过AI Infra优化使Yi-34B大模型训练成本下降40%[3] - 2024年公司整体收入达数亿级别,业务重心转向To C应用Bigo和To B模型解决方案[2][4] - 新模型Yi-Lightning发布后未获市场预期反响,面临字节跳动豆包、DeepSeek V2等竞品挤压[4] 战略调整 - 公司将根据市场PMF快速调整项目,加强有商业化潜力业务投资并鼓励独立融资,同时关停部分项目[2] - 主动退出大模型竞速,采取断臂求生策略[4] - 当前业务方向对技术人才需求减少,团队调整后技术空间受限[4]
【财经早晚报】鸿蒙操作系统电脑端首次亮相;DeepSeek致谢腾讯技术团队;胖东来发布和田玉翡翠退货说明
搜狐财经· 2025-05-08 18:11
跨境电商政策变动 - 商务部反对美国取消对华小额包裹免税政策 认为此举损害两国企业和消费者利益 但强调不影响跨境电商长期发展势头 中方愿与各国合作营造公平政策环境 [1] - 美国自5月2日起正式取消对华小额包裹免税政策 导致部分国家零售商调整或暂停对美业务 [1] 美联储货币政策 - 美联储维持联邦基金利率4.25%-4.5%不变 符合市场预期 2023年累计降息100个基点 [1] - 美联储主席鲍威尔表示当前不计划先发制人降息 因通胀仍高于目标 政策利率处于"适度限制"水平 需等待更多数据 [2] - 香港金管局称港元汇率触发强方兑换保证 银行体系总结余上升 港元流动性增加导致拆息回落 [2] 新职业与工种 - 人社部拟新增17个职业包括跨境电商运营管理师、无人机群飞行规划员等 新增42个工种含生成式AI系统测试员、服务犬驯养师等 [3] 金融市场动态 - 比特币逼近10万美元 美股加密货币相关股票普涨 其中Hut 8涨7.7% Coinbase涨4.3% [4] - A股创业板指涨1.65% 两市成交1.29万亿元 军工板块20余股涨停 ST板块近40股涨停 [4] - 85家财险公司一季度合计净利润256亿元 70家盈利15家亏损 车险业务优化及投资收益释放推动行业表现 [5] 科技公司动向 - OpenAI任命Instacart CEO菲吉·西莫为应用主管 负责产品及业务职能 原CEO奥特曼将更专注研发 [5] - 华为宣布首款鸿蒙电脑5月19日发布 搭载鸿蒙5.0系统 集成AI助理可实现PPT制作、会议纪要等功能 [6] - 腾讯优化DeepSeek通信框架 使大模型训练在RoCE网络性能提升100% IB网络提升30% [7][8] 零售与企业事件 - 胖东来推出玉石无条件退货政策 不扣手续费及税费 需保持商品完好并持购买凭证 [6] - 上海黄金交易所提示贵金属价格波动风险 要求会员单位做好应急预案 [3]
苹果考虑浏览器AI替代方案 Google母公司股价崩9%
经济日报· 2025-05-08 16:26
公司动态 - Alphabet股价周三一度暴跌9%,收盘下跌7.3%,创2月以来最大跌幅 [1] - 苹果股价周三收盘下跌1.1% [1] - 苹果服务部门资深副总裁库伊透露公司正在积极考虑为Safari浏览器引进AI驱动的搜寻引擎,作为Google搜寻的替代选择 [1] - 苹果与Perplexity等多个新创公司洽谈,了解其搜寻工具作为Google替代方案的可能性 [1] - 苹果计划将新创公司的搜寻工具列入选单,供iPhone、iPad用户在Safari浏览器内选择偏好搜寻 [1] - 苹果考虑增加中国AI公司DeepSeek的AI服务到iPhone中 [1] 行业影响 - 苹果若改用新搜寻供应商,将威胁Google与苹果每年约200亿美元的商业关系 [2] - 目前苹果iPhone和Safari浏览器预设搜寻引擎为Google,为Google带来数亿用户并支持其广告事业 [2] - AI的出现使Google在搜寻领域首次面临严峻竞争 [2] - 上个月Safari浏览器搜寻量首次下滑,库伊认为原因是用户转向使用AI工具 [2] - 库伊预期OpenAI、Perplexity、Anthropic等公司提供的AI搜寻将逐渐取代传统搜寻引擎 [2] 商业关系 - 苹果与Google的200亿美元合约使Google成为苹果浏览器预设搜寻引擎 [2] - 库伊作证是司法部控告Google垄断搜寻市场案件听证的一部分 [2] - 苹果动作是为因应与Google长期伙伴关系可能终止的情况 [1] - 苹果的动作代表搜寻服务产业将出现重大变化 [1]
外媒:关税政策压迫 “不确定性”成半导体公司财报主题
环球网· 2025-05-08 12:54
半导体行业不确定性 - 全球半导体公司财报季主题为"不确定性" 主要源于美国关税政策变化和对华出口限制 导致产品需求不明确 [1] - 关税变化已引发全球芯片公司高管焦虑 并对业务产生明显影响 [1] - 半导体股持续承压 主因宏观经济不确定性增加和美国贸易政策影响 [3] 公司具体影响 AMD - 第一季度盈利超预期 但受对华AI芯片出口限制影响 预计本财年末损失15亿美元 [3] 超微(AMD) - 财报不及预期 主因关税和宏观经济不确定性 [3] - 在前景明朗前 拒绝提供2026财年财报指引 [3] - 股价盘前交易下跌4% [3] Marvell - 推迟原定6月10日的投资者日活动至"2026年某日" [3] - 股价盘前下跌4.4% [3] - CEO称推迟决定源于"不确定的宏观经济环境" [3] - 分析师认为该决定在缺乏明确性背景下加剧不确定性 [4] 三星 - 预计需求将出现较大波动 主因关税政策变化和宏观经济不确定性 [4] - 高管表示难以预测政策变化和地缘政治对业务的具体影响 [4] 英伟达 - CEO黄仁勋预测中国可能在2-3年内成为500亿美元规模的AI市场 [5] - 警告若美国公司无法进入该市场 将损失重大收入及就业机会 [6] - 指出美国在AI领域面临中国企业的竞争压力 [7] 行业竞争格局 - 中国企业加大自主研发投入 华为、阿里巴巴等正打造可与英伟达竞争的产品 [7] - DeepSeek、阿里巴巴已推出高性能AI模型 [7] - 分析师指出半导体行业面临"复杂的需求信号和地缘政治逆风" [4] - 即使部分领域需求稳定 芯片制造商仍面临宏观不确定性和出口限制的挑战 [5] 市场表现分化 - 微软等科技巨头在AI产品领域表现强劲 [3] - 但市场对AI产品需求仍存担忧 [3]
梅花创投吴世春:在不确定性中寻找 “确定性切口”
搜狐财经· 2025-05-08 12:06
投资哲学与策略 - 在不确定性中寻找"确定性切口",用长期主义对冲短期波动 [3] - 投资逻辑包括"人-事-时-值"合一,重视创始人个人魅力和团队执行力 [3][22] - 坚持"水下捕鱼"策略,提前布局AI+农业、AI+供应链等未爆发领域 [6] - 投资风格概括为"快准狠",决策迅速、精准识人、敢于冒险 [26] AI行业洞察 - DeepSeek的爆发本质是技术迭代与场景需求共振的结果 [3][4] - 国内在垂直应用层创新速度不逊于海外,但底层芯片、算力架构存在代差 [5] - 通用大模型窗口期已过,更关注SaaS工具应用型公司和垂类模型 [6] - 杭州成功在于"生态滋养",包括人才网络、民间资本活跃度和宽容失败的文化土壤 [7] 重点投资赛道 - 三大确定性较高赛道:AI+实体经济、合成生物、银发经济 [9] - 非传统指标包括数据壁垒、技术外溢性、组织韧性 [9] - 消费投资正在分化,关注新国货和银发消费 [17] - 文化自信回归带来IP商业化、沉浸式体验、非遗科技化机会 [17] 创业者特质 - 最看重三点:"偏执狂"般专注力、技术原创性、快速纠错能力 [8][22] - 80后创始人占硬科技项目80%,正在重构传统行业技术范式 [8] - 年轻创业者优势在于"技术直觉"和"全球化视野",但需补足商业落地能力 [8] 募资与退出策略 - 人民币LP结构重构,政府引导基金占比超70% [12] - 与产业强市共建主题基金,联合上市公司设立产业并购基金 [12] - 退出从"赌IPO"转向多元退出,包括产业并购和Pre-IPO战略配售 [13][14] 市场预测 - 硬科技IPO大年,半导体、AI、生物医药领域将诞生10家以上百亿市值公司 [25] - 政府引导基金从"行政主导"转向"市场化运作" [25] - 跨境投资回暖,人民币基金加速布局东南亚、中东市场 [25] 行业趋势 - A股牛市本质是"经济转型牛",资金从地产、互联网流向硬科技和高端制造 [18] - 科技创新领域将持续蓬勃发展,包括数字经济、人工智能应用、智能制造 [19] - 新能源与环保、生物技术与医疗、商业航天、消费与出海是未来10年机遇 [19] 机构类型 - 专业早期投资机构、产业资本、政府引导基金支持的机构能参与未来机会 [20] - 具备全球视野的投资机构可在全球范围内配置资产 [21]