Workflow
DeepSeek
icon
搜索文档
AI味道太浓?新型教培正在解决这件事
36氪· 2025-06-04 20:52
大模型发展现状 - 当前大模型在标准考题中表现优异,但在处理涉及情感、价值观等非标准问题时仍显不足,被批评"AI味太浓,机器感太重" [1] - 行业已开始招聘名校文科人才训练大模型,目标是提升AI的情感感知能力和表达美感 [1] - 大模型水平提升关键在于掌握标准答案,但现实世界存在大量无标准答案的问题,需基于社会公序良俗建立人类偏好 [2] AI人文训练兴起 - AI人文训练师成为新兴职业,负责解决AI在情感表达、伦理判断等方面的短板 [4] - 小红书成立"hi lab"实验室,团队由985高校研究生组成,学科背景多元且具备强共情能力 [10] - 训练重点包括:情感接入、伦理边界界定、人性化表达等,目标是缩小人机思维差异 [13][14] - 该岗位更看重人文素养和批判性思维,技术占比少,目前从业者数量稀少 [10] 训练方法与案例 - 通过精细化案例研讨,将人类偏好转化为AI的信念体系,保持行为逻辑一致性 [13] - 典型案例包括:癌症患者对话设计、道德困境处理、交通违规情绪安抚等 [5][15][16] - 训练使AI回答质量从50-60分提升至80分,但情感自然流露等难题仍未完全解决 [17] 行业趋势 - AI发展进入下半场,从追求"能用"转向"好用"与"负责任地用" [10] - 后训练阶段受重视,多家公司布局:小红书设人文实验室,Soul招聘"AI灵魂训练师",DeepSeek引入中文系学生提升文学修养 [10] - 行业共识是需建立更深层次的人机情感连接,但过度人性化可能引发新的担忧 [17] 职业发展 - AI训练师在2020年被纳入国家职业分类,初期以数据标注为主,属劳动密集型工作 [6][7] - 随着模型进化,专家型训练师需求上升,要求985学历及专业领域知识 [8] - 一线标注员多为中专/大专学历,工作内容重复枯燥,被视作"dirty work" [6][7]
“多模态卷王”收缩C端业务!大模型“六小虎”战略聚焦谋出路
证券时报网· 2025-06-04 19:14
阶跃星辰业务调整 - 阶跃星辰收缩C端业务,停运角色扮演类智能体产品"冒泡鸭",重心转向终端Agent(智能体)[1] - "冒泡鸭"从2023年12月起已停止大范围投流,团队合并至"阶跃AI"产品团队[1] - 公司C端业务调整是大模型创业企业在DeepSeek和互联网大厂竞争下重新定位的缩影[1] 阶跃星辰公司背景 - 阶跃星辰成立于2023年4月,创始人兼CEO是微软前全球副总裁姜大昕[2] - 公司2024年3月首次公开亮相,发布万亿参数大语言模型Step-2[2] - 专注于多模态领域,已发布22款自研基座模型,涵盖文字、图像、视频、语音、音乐和推理等领域[2] - 被业内称为"多模态卷王",与智谱AI并称基座大模型的"南北双雄"[2] 阶跃星辰业务转型 - 此前采用"模型+应用"两条腿走路策略,推出C端应用"跃问"和"冒泡鸭"[3] - 受DeepSeek影响,重新思考增长路径,认为投流逻辑在AI时代不完全成立[4] - 将资源重心从C端转向多模态大模型研发和终端Agent方向[4] - 2024年2月宣布与吉利汽车集团、OPPO、智元机器人等头部企业合作,推动AI在手机、汽车、具身智能等终端应用[5] 大模型行业竞争格局 - "六小虎"包括智谱AI、MiniMax、月之暗面、阶跃星辰、百川智能和零一万物[6] - 2024年下半年以来,除智谱AI和阶跃星辰外,其余几家无新融资消息[6] - 零一万物和百川智能已放弃基座大模型训练,分别押注AI行业落地和AI医疗[6] - MiniMax专注C端视频生成海外市场,智谱AI布局政企合作并启动IPO,月之暗面Kimi在C端竞争中逐渐落后[6] 行业发展趋势 - 大厂进入和DeepSeek冲击促使大模型创业公司重新定位[7] - 行业面临模型迭代快、C端用户忠诚度低、B端盈利难等挑战[7] - 融资环境趋紧,创业公司需在有限时间内争取更大生存空间[7]
又撞了!Kimi和DeepSeek为什么总爱盯同一块蛋糕?
核心观点 - Kimi当前战略重心转向模型能力提升和垂直领域布局,包括法律、医疗和学术搜索等方向,以增强专业性和减少幻觉 [4][5][6] - 国内AI原生应用竞争格局变化,Kimi从TOP3降至第四位,同时暂停投流营销,转向自然增长和用户留存策略 [14] - DeepSeek与Kimi在垂类赛道布局高度重合,均通过招聘专业数据标注人员提升模型在医疗、法律等领域的可靠性 [8][10] - 行业共识认为AI在生产力场景有商业化潜力,但垂类领域表现仍需突破60-70分瓶颈,需强化模型能力和专业数据挖掘 [12] - AGI仍是多家公司的长期目标,技术路径包括算法优化(如DeepSeek R1模型幻觉率降低45-50%)和算力迭代 [14][16][17] 公司动态 Kimi - 2023年11月月活用户达3600万,位列国内AI原生应用TOP3 [2] - 2024年专注模型能力提升,K1 6模型在LiveCodeBench代码生成测试中超过GPT系列部分版本 [5] - 近期上线学术搜索功能,并与财新传媒合作提升财经内容真实性 [6][12] - 暂停投流营销,转向自然增长策略,2024年Web端曾长期保持用户量第一 [12][14] DeepSeek - 5月招聘医学方向数据标注人员(百晓生),强化医疗内容索引能力 [8] - 6月升级R1模型,基于V3 Base增加算力投入,编程测试表现对标GPT-4和Gemini 1 5 Pro,幻觉率降低45-50% [16] 行业趋势 - 垂类赛道成为竞争焦点,法律、医疗等专业领域需求凸显,需解决模型幻觉和专业性不足问题 [10][12] - 创新驱动市场格局变化,如Kimi曾因200万字长文本出圈,DeepSeek近期通过技术突破跃居行业前列 [14] - 基础模型能力进入新阶段,阿里云认为技术门槛降低使更多企业站上同一起跑线 [16][17] - OpenAI计划推出GPT-5,或引发行业新一轮技术跃升 [17][18] 技术路径 - 算法优化:DeepSeek通过后训练提升模型推理能力,Kimi通过垂类数据专家优化专业场景表现 [5][16] - 数据挖掘:专业标注(如法律、医疗)成为减少幻觉的核心手段,需深度理解用户诉求 [8][10][12] - 算力与算法平衡:杨植麟提出当前需突破算法瓶颈而非单纯增加算力,类似"荡秋千"式发展 [15][16]
阿里巴巴如何帮助中国在开源人工智能领域超越美国 — The Information
2025-06-04 09:50
公司和行业分析 **涉及的行业或公司** - 公司:阿里巴巴集团(Alibaba Group)、DeepSeek、Meta Platforms(Llama)、Nvidia、Aiquris、ReOrc、Abeja - 行业:开源人工智能(AI)、云计算、大语言模型(LLM)、企业AI应用 **核心观点和论据** **1 阿里巴巴在开源AI领域的领先地位** - 阿里巴巴的Qwen模型在全球开源AI领域处于领先地位,在多个基准测试中超越Meta的Llama[9] - Qwen3(2024年4月发布)包含8个不同规格的开源模型,支持“思考模式”和“非思考模式”切换,优于Meta的Llama 4[58][59] - 截至2025年1月,超过29万客户在汽车、医疗、教育等行业使用Qwen模型[10] **2 中国企业在开源AI的全球竞争力** - Qwen和DeepSeek的R1模型被Nvidia CEO黄仁勋评为“最佳开源AI模型之一”[22] - 中国企业通过低成本开源模型加速AI普及,可能重塑全球AI生态[13][21] - 日本AI开发商Abeja使用Qwen开发日语大模型[11] **3 阿里巴巴内部转型与挑战** - 初期(2023-2024年)阿里各业务部门(如电商、娱乐)拒绝使用Qwen,偏好Meta的Llama或DeepSeek的R1[7] - 2023年重组后,业务部门自主权增加,但沟通效率下降,阻碍Qwen推广[41][42] - 创始人马云亲自介入施压,Qwen团队加班推进Qwen3开发[52][54] **4 竞争格局** - DeepSeek的R1模型(2025年2月发布)一度超越Qwen,但Qwen3反超后,DeepSeek又通过更新版R1重新领先[59][60] - Meta的Llama 4因改进有限未达预期,为阿里创造机会[56] **其他重要细节** - **技术基础**:Qwen基于Transformer架构(与GPT相同),早期模型M6发布于2021年[30] - **商业化策略**:阿里云通过开源Qwen吸引企业使用其云计算平台[25] - **内部应用**:飞猪旅行、AI搜索应用Accio等从DeepSeek R1迁移至Qwen3[62] - **行业影响**:开源模型降低企业AI成本,推动中国国企和政府部门采用[21] **数据引用** - 阿里2023年因反垄断被罚款28亿美元[36] - Qwen3发布前,团队成员一周仅睡5-6小时[54] --- *注:部分文档(如2、12、16等)为广告或无关内容,已跳过*
为什么DeepSeek还未能撼动OpenAI
虎嗅· 2025-06-04 08:27
AI行业竞争格局 - 2025年1月DeepSeek发布推理模型R1被视为AI全球竞争展开的标志事件 [2] - DeepSeek R1以开源和更高性价比达到OpenAI o1性能 导致英伟达股价单日下跌6000亿美元 [3] - OpenAI在DeepSeek R1发布后迎来爆发期 估值达3000亿美元 活跃用户从4亿增至8亿 年化收入从37亿美元增至127亿美元 [10] - DeepSeek R1在2月访问量一度超过OpenAI 但后续指标下滑 0528版本性能打平Gemini 2.5 Pro [11] - Anthropic的Claude 3.7成为最佳编程模型 Claude Opus 4支持智能体连续工作7小时 [11] 公司差异化竞争 - OpenAI凭借品牌优势和全球用户心智地位保持领先 [12] - Anthropic成为编程智能体首选 推出模型上下文协议(MCP)推动智能体生态 [11][12] - Gemini凭借统一多模态和视频生成能力 在谷歌用户生态中占据独特地位 [12] - DeepSeek最大程度开源推动AI在中国和国际推广 但模型性能差异性开始不明显 [12] 行业发展趋势 - AI商业化仍处早期 上半年DeepSeek和OpenAI用户均大幅增长 [13] - AI商业化下一阶段可能不是"赢家通吃" 而是融合与重构 关键在于掌握"工作逻辑" [14] - 大模型进入同质化和商品化竞争 性能差距缩小 差异性体现在应用层面 [12] - DeepSeek使命是实现AGI 需通过基础设施和产品验证 或成为超级横向平台 [15]
环球圆桌对话:“中美人工智能决斗”是误导性叙事
环球网资讯· 2025-06-04 07:12
美国核电发展政策 - 美国新政府发布行政命令计划在未来25年内将民用核电产能翻两番通过简化审批程序提供财政支持和推动小型模块化反应堆技术重振核电产业 [1][2] - 美国拥有94座运行中的核反应堆数量全球领先但过去几十年发展因高成本严格监管和公众疑虑放缓 [2][9] - 行政命令动用《国防生产法案》以依赖中俄铀浓缩和核燃料加工为由宣布国家进入紧急状态 [9] 核电与AI发展的关联 - 全球数据中心2022年耗电量占全球电力需求1%-2%预计2030年可能翻倍核电因其高能量密度和低碳特性成为理想选择 [2] - 美国AI年耗电量可能到2028年达全美22%家庭用电量总和数据中心对电力需求量大且稳定性要求高 [11] - 华盛顿将核电与AI发展挂钩旨在通过能源优势巩固美国在AI领域的全球领导地位 [2][12] 中美AI竞争格局 - 2023年全球AI专利申请中国占约40%美国为15%中国在算法优化算力基础设施和应用场景拓展展现优势 [2][12] - 美国通过出口管制供应链重组和投资审查限制中国获取先进AI技术包括AI芯片出口管制和扩散规则 [7][8] - 中国公司DeepSeek突破美国封锁引发美国内对技术封锁政策有效性的质疑 [6][8] 美国核电发展面临的挑战 - 美国铀矿开采加工能力弱制造业空心化导致核能项目成本高企沃格特勒核电项目成本超预算2倍达300亿美元 [13] - 核电建设人才储备不足实操能力受限项目推进受多方利益博弈和资金短缺影响 [13][14] - 基础设施建设依赖进口成本不确定性高近20年仅批准建设一个核电项目 [13][14] 中美核能与AI合作潜力 - 美国在核安全标准和小型模块化反应堆技术领先中国在建设效率和成本控制占优双方可通过技术交流联合研发实现互补 [4] - 中美可建立核能创新联盟聚焦小型反应堆商业化应用降低全球核电建设成本 [4] - AI领域需全球治理合作中美可共同制定国际AI伦理与技术标准应对数据隐私算法偏见等挑战 [4] 历史与战略背景 - 美国战略界沿用冷战思维将中国定位为战略竞争者通过斯普特尼克时刻激发公众焦虑 [6][7] - 拜登政府实施小院高墙政策包括出口管制金融制裁和高额关税限制中美科技交流 [7] - 新政府引入科技界巨头成员但政策仍以对抗中国为主轴未跳出零和博弈思维 [8][9]
AGI的不归之途
虎嗅APP· 2025-06-03 21:52
大模型与智能体进展 - 2025年上半年OpenAI o3、Gemini 2 5 pro、Grok 3 mini和Claude 4等大模型密集发布 智能体协议MCP、A2A的融合推动AGI进程加速 [3] - 硅谷研究机构METR数据显示智能体完成任务复杂程度每7个月翻倍 Claude-opus 4可连续工作7小时 初级白领岗位面临大规模替代风险 [3] - Anthropic创始人预测2026年将出现"一人独角兽公司" 智能体技术正在突破鲍莫尔病对服务业效率的限制 [3] 科技巨头战略调整 - 美国科技七雄大幅增加AI基础设施投入 同时裁撤可替代岗位 OpenAI年化收入达百亿美元 Anthropic收入半年内从10亿增至30亿美元 [4] - 中国科技巨头创始人深度参与技术变革 阿里、腾讯、字节等企业成为创新引擎 [10] - ChatGPT用户增长爆发 显示技术优势与用户体验并非完全正相关 [22] 中美AI竞争格局 - 中国DeepSeek R1 0528性能超越Gemini 2 5 pro 逼近OpenAI o3 在开源模型领域建立成本优势 [5] - 中美前沿大模型差距从ChatGPT发布时的2年缩短至2025年上半年的不足3个月 [11] - 中国在开源社区和国家级基础设施方面快速推进 形成与美国全面对标的竞争态势 [11][36] 下一代技术突破 - OpenAI计划将GPT-5打造为推理与生成统一的原生多模态模型 已陆续拆分部分功能提前发布 [17] - DeepSeek下一代模型V4/R2将采用NSA稀疏注意力机制 支持端到端训练 提升长期记忆能力 [18][19] - 文本扩散生成技术取得进展 Gemini Diffusion实现每秒1500 token输出 中国高校及企业推出LlaDA-8B等创新模型 [31][32] AGI探索新路径 - OpenAI前成员创立SSI(估值320亿)和Thinking Machines Lab(估值90亿) 探索强化学习与思维链等新范式 [24][25] - 程序合成技术被视为突破传统范式局限的关键 AlphaEvolve已展示解决复杂数学问题的能力 [29][30] - 研究显示AI"思考时长"与"思考方式"同等重要 需建立自我规划思考深度的机制 [26] 商业化与生态演进 - AI行业呈现高增长+高投入特征 中国科技大厂增加资本支出准备大规模商业化 [35] - 智能体时代商业模式可能打破"赢家通吃" 横向平台与垂直专家的融合成为关键 [35] - 变现逻辑从使用频率转向注意力、语境与控制权的争夺 地缘竞争成为核心变量 [36]
画图不再手搓!DeepSeek 新版一键生成流程图、时序图、类图~
菜鸟教程· 2025-06-03 18:34
AI生成Mermaid图表工具 核心观点 - AI工具可快速生成专业Mermaid图表 通过自然语言指令替代传统手动编码流程 显著提升开发效率[2][8] - 支持流程图、时序图、类图、甘特图、状态图、API流程图等6类技术图表生成 覆盖主流开发场景[3][10][13][16][18][21] - 生成代码可直接嵌入文档或导入Drawio等编辑器 实现端到端自动化制图[7] 性能表现 - 在AIME 2024数学竞赛中达到91.4 pass@1准确率 与OpenAI-3版本(91.6)相当[2] - 代码生成(LiveCodeBench)和编辑(Aider)任务表现分别为73.3和71.6 pass@1 超过Gemini-2.5-Pro[2] 典型应用场景 流程图 - 用户登录流程包含手机号验证、验证码校验等5个核心节点 代码生成耗时较手动编写减少90%[3] 时序图 - 支付接口调用流程完整展示12个交互步骤 包含同步请求和异步回调双路径[10][11] 类图 - 订单系统类图精准表达Order与OrderItem(1:n聚合)、Order与Payment(1:1关联)关系[13][14] 甘特图 - 用户中心重构项目自动生成包含4阶段6里程碑的排期计划 时间精度达天级[16][17] 状态图 - 工单生命周期状态机支持"待处理-处理中-已关闭"主路径 并允许处理中退回待处理的异常流[18][19] API流程图 - RESTful API交互过程可视化呈现客户端至数据库的全链路调用 包含负载均衡等基础设施节点[21][22]
专访科勒资本北京办公室总经理杨战:创新引领叠加市场沃土,中国硬科技资产吸引力重塑
每日经济新闻· 2025-06-03 17:41
私募股权市场活跃度温和复苏 - 中国私募股权市场存量规模约15万亿元,私募二级市场增长潜力有望加速释放 [1] - 政府引导基金、军民融合基金及银行系AIC基金为市场提供稳定资金来源 [3] - 半导体、AI等硬科技赛道逆势坚挺,退出渠道多元化(港股IPO活跃、并购交易量增加、S交易达成) [3] 外资对中国科技资产的兴趣回升 - 国际资本对中国科技资产兴趣回升,宇树科技份额"一股难求",DeepSeek突破受外资LP关注 [3] - 北美资金受地缘政治影响收缩,欧洲、中东及东南亚资本成为重要补充 [4] - 中国科技企业全球竞争力提升(如DeepSeek、宇树科技),内需市场扩大增强投资吸引力 [5] 外资对中国市场的综合影响 - 外资带来资金、技术理念和全球化视野,推动中国企业从模仿走向创新 [6] - 双币基金管理人促进高端人才回归和国际人才交流,形成良性竞争生态 [6] - 政策确定性是外资关注重点,地缘政治不确定性短期内仍存在 [6] 私募二级市场发展现状与挑战 - 科勒资本完成中国首只外资私募二级市场人民币基金(CCSRMB I)关账,并领投2.29亿元GP主导交易 [7] - 市场呈现早期特征:买方服务能力单一,卖方诉求多元,中介机构专业服务不足 [8] - 有限合伙制份额转让需全体合伙人同意,操作不便制约市场发展 [8] 中国私募二级市场潜力与展望 - 中国私募二级市场发展需要长期资本、专业人才和监管优化共同推动 [8] - 海外成熟市场S基金年交易规模突破千亿美元,中国起步晚但发展速度快 [9]
专访心资本创始合伙人韩彦:全球创新迈入“中国时间”,国际资本重构价值版图
每日经济新闻· 2025-06-03 17:28
每经记者|姚亚楠 每经编辑|李凯 赵云 全球资本正在重新发现"中国价值"。 今年以来,随着DeepSeek等中国硬科技企业在国际舞台的亮眼表现,国际投资界对中国资产的关注度 显著升温。心资本创始合伙人韩彦近期向《每日经济新闻》记者透露,他密集收到了来自世界各地投资 人的交流、咨询请求,其中有家族办公室代表直接"打飞的"来华实地考察,这种热情在以往并不多见。 "2025年很可能成为国际资本配置中国资产的关键转折点。"韩彦预判,深谙中国发展潜力的东南亚资 本、以中东国家为代表的"一带一路"合作伙伴以及在地缘政治重构中寻求新平衡的欧洲资本,将会以前 所未有的热情拥抱中国资产。"这不仅仅是短期的投资热潮,而是一个时代的开始。" 国际资本风向标转向中国 开年以来,随着DeepSeek等中国科技明星项目在全球崭露头角,韩彦开始密集收到来自世界各地投资 人、家族办公室各类交流、咨询请求,"他们迫切希望了解这些中国科技企业的最新发展动态。"韩彦 说,与过去不同的是,如今这些国际投资者不再需要他"科普"中国公司的技术实力,他们早已通过各类 报道和深度分析,清晰地认识到中国科技实力的飞速崛起。 其中,东南亚投资者的热情尤为高涨, ...