Seek .(SKLTY)

搜索文档
全球首个食品学科专用大模型FoodSeek发布
新华日报· 2025-07-09 07:03
行业动态 - 江南大学联合科大讯飞、华为等单位发布全球首个食品学科专用大模型FoodSeek(食问)大模型,旨在解决食品行业数据孤岛问题并提升创新转化速度 [1] - 食品产业连接农业生产和消费终端,我国食品产业发展迅速且工业化体系齐全,但存在企业生产控制规范不统一的问题 [1] 技术进展 - FoodSeek大模型已完成食品学科全谱系高质量语料库构建、专业基座构建及多个专用智能体应用研发 [2] - 该模型具备信息抽取、推理、精准解析、智能问答等专业能力,已在校园内应用于课程辅导、实验设计参数调优等场景 [2] - 研究团队计划通过预训练及微调进一步提升模型的机制关联分析、多模态解析及智能决策能力 [3] 应用场景 - 未来将开放网页和手机客户端,提供健康饮食建议、食品存储方法、安全生产规范等民生服务 [2] - 支持拍照上传食物图片生成卡路里摄入量分析,结合智能穿戴设备数据提供个性化饮食建议 [2] - 将开发食品配方设计、健康助手、安全决策辅助等面向全行业的应用型智能体和解决方案 [3]
【产业互联网周报】华为盘古大模型被质疑抄袭;AI人才争夺加剧,DeepSeek在海外大举招聘人才;微软被曝将“AI使用量”纳入员工考核,直接挂钩绩效;设...
钛媒体APP· 2025-07-08 11:37
华为盘古模型争议 - 华为开源盘古7B稠密和72B混合专家模型 但被质疑抄袭阿里云通义千问Qwen-2 5 14B模型 注意力参数分布相似性高达0 927 [2] - 华为声明盘古Pro MoE基于昇腾硬件平台开发 部分代码参考业界开源实践 严格遵循开源许可证 [2] - 自称华为员工发文揭露内部团队通过套壳续训阿里千问 Deepseek等竞品模型伪造技术突破 [2][3] 腾讯微信AI搜索争议 - 微信AI搜索功能被指强行开盒 点击推文中蓝色人名链接可浏览AI生成的个人简历及关联推文 [5] - 腾讯回应称AI搜索仅整合公众号及互联网公开信息 不使用用户隐私数据 [5] 百度搜索改版 - 百度搜索框支持超千字长文本输入 集成AI写作 AI画图等功能 为十年来最大改版 [6] 全球AI人才动态 - 全球AI领域Top100人才榜单中华人占主力席位 包括何恺明 张祥雨等就职于国内外企业的研究者 [7] - Meta成立超级智能实验室 引入6名OpenAI前华人员工及Scale AI前CEO等11位行业重量级人物 [28] 大模型开源与进展 - 百度开源文心大模型4 5系列 含47B 3B MoE模型等10款 预训练权重和推理代码完全开放 [15] - 智谱AI开源通用视觉推理模型GLM-4 1V-Thinking 9B参数多模态模型在18项任务中持平GPT-4o等 [10] - 马斯克旗下xAI意外曝光Grok 4模型 定位为旗舰级万能模型 同期完成100亿美元融资 [20][32] 企业级AI应用 - 钉钉多维表新增100+电商行业AI模板 支持AI生成图片 解析文件等功能 产品全面免费 [16] - 微软将AI工具使用量纳入员工考核 GitHub Copilot生成代码比例等成KPI指标 [26][30] - 苹果考虑弃用自研AI模型 转向Anthropic或OpenAI技术为Siri提供支持 [27] 机器人及硬件进展 - 字节跳动两年半量产超千台轮式物流机器人 团队从50人扩至150人 长期目标具身智能 [10] - 宇树科技完成C轮7亿元融资 投后估值120亿元 资金用于加速IPO及技术研发 [35][36] 半导体与EDA动态 - 美国取消对华EDA出口限制 西门子 新思科技 楷登电子恢复中国客户软件访问权限 [17][18] - 国产GPU公司曦望Sunrise融资10亿元 产品线含兼容CUDA生态的S2大模型推理芯片 [38] - 摩尔线程 沐曦科创板IPO获受理 拟分别募资80亿元和39 04亿元 [39] 融资与上市 - Figma提交纽交所IPO申请 2024年营收7 49亿美元 同比增长48% 亏损7 3亿美元 [31] - 云知声港交所上市 募资3 2亿港元 资金用于研发及国际市场拓展 [37] - 智谱AI获上海国资10亿元战略投资 三方合作建设AI新型基础设施 [34] 政策与行业趋势 - 前5个月中国软件业务收入55788亿元 同比增长11 2% 出口227 1亿美元增3 3% [41] - 工信部印发网络安全专项行动方案 目标为800家工业企业开展贯标达标试点 [42] - 北京发布AI+医药健康计划 探索类脑智能 DNA存储等技术在医药领域应用 [43] 海外AI动态 - 谷歌全球开放Veo3 AI视频生成模型 集成音频生成能力 质量与可控性显著提升 [21] - CoreWeave首发英伟达GB300 NVL72服务器 单机架AI性能超百亿亿次浮点运算 [22] - 欧洲44家企业联名呼吁欧盟暂停AI法案 称模糊规则阻碍创新与国际竞争 [29]
DeepSeek 复盘:128 天后 ,为何迟迟推迟发布——SemiAnalysis
2025-07-07 23:45
纪要涉及的公司和行业 - **公司**:DeepSeek、OpenAI、Anthropic、Google、Microsoft、Amazon、Parasail、Friendli、Lambda、Nebius、Cursor、Oracle、Huawei、AMD、NVDA等 [4][22][24][29][30] - **行业**:人工智能(AI)行业,特别是大语言模型(LLM)领域 [4] 纪要提到的核心观点和论据 DeepSeek相关 - **核心观点**:DeepSeek R1发布后虽有影响,但自身服务市场份额下降,原因在于其在tokenomics上的权衡导致用户体验不佳 [8][13][21] - **论据** - **价格与延迟**:DeepSeek虽产品价格便宜,但用户需等待数秒模式才响应首个token,相比其他提供商延迟高,如Parasail、Friendli等可提供低延迟服务,微软Azure价格高但延迟低25s,且多数R1 0528实例现以低于5秒延迟托管 [22] - **上下文窗口**:DeepSeek运行K上下文窗口,是主要模型提供商中最小的之一,限制了如编码等需要大上下文窗口的用例,而相同价格下其他提供商如Lambda和Nebius可提供2.5倍上下文大小 [24] - **市场份额变化**:发布后消费者应用流量激增,但未跟上其他AI应用增长,自身网络应用和API服务市场份额下降,而第三方托管实例使用量近20倍增长,自身总token份额每月下降 [8][9][10][13] - **持续发展**:R1发布后持续扩展强化学习(RL),在许多领域尤其是编码方面有所改进,推理模型不断快速改进且更有效、更实惠 [5][7] Anthropic相关 - **核心观点**:Anthropic在编码应用方面成功,但受计算资源限制,不过用户体验优于DeepSeek [29][32][41] - **论据** - **编码应用成功**:Anthropic专注代码产品开发,其Claude Code使用量激增,超过OpenAI的Codex,Google也推出类似工具Gemini CL [29][30] - **计算资源压力**:Claude的输出速度在API上下降30%至略高于5 tokens每秒,因需处理大量请求且编码使用倾向大token数对话,相比之下OpenAI和Google的模型速度更快 [33] - **用户体验优势**:速度虽低但快于DeepSeek的2.5 tokens每秒,且回答问题所需token数远少于其他模型,端到端响应时间更低,Claude在领先推理模型中总输出token数最少 [41][42] 市场动态相关 - **核心观点**:AI市场竞争激烈,各公司在计算资源、价格、性能等方面竞争,开源模型有发展潜力,速度可通过其他因素补偿 [44][47][40] - **论据** - **价格竞争**:DeepSeek低价冲击市场后,OpenAI旗舰模型价格下降80%,其6月对GPT - 4 API定价大幅削减,缩小与R1的价格/性能差距 [4][53] - **计算资源投入**:Amazon大规模建设AI集群,投资数十亿美元用于Trainium AI集群,Anthropic将获得超50万个Trainium芯片用于推理和训练,Anthropic还从Google GCP租用大量计算资源,Google云也向其他AI公司扩展服务 [37][38][39] - **开源模型潜力**:廉价计算资源的可用性和软硬件的快速创新将推动开源模型发展,如DeepSeek R1在编码性能上不断改进,对采用有积极影响 [47] 其他重要但是可能被忽略的内容 - DeepSeek将研发团队从杭州迁至北京,运营人员翻倍以应对媒体请求,虽有R2延迟传言,但并非因出口管制导致训练延迟,且其仍保持快速招聘速度,还为华为盘古模型提供技术支持 [54][55][56] - 推理云兴起,越来越多公司效仿Anthropic以服务形式销售token,而非像ChatGPT那样以月度订阅形式捆绑销售 [44]
半年196个DeepSeek大单梳理,这5个省份热钱最多
36氪· 2025-07-07 19:36
DeepSeek政企项目市场表现 - 2025年上半年国内至少有196起预算金额超10万元以上的DeepSeek政企项目,累计项目金额超11亿元 [1] - 项目金额以中小型为主,10-100万元项目80个,101-200万元项目55个,201-300万元项目19个 [1] - 最大项目为4.5亿元的国家生物安全监测预警信息平台项目,已完成竞标的最大金额项目为1694万元的中远海运科技智算集群建设项目 [3] 项目类型与技术应用 - 196个项目大多数为软件和硬件结合的集成性项目,几乎没有纯软件项目 [3] - 主要涉及DeepSeek一体机或大模型算力集群部署,部分项目提出将DeepSeek与具身智能机器人结合 [3] - 部分项目同时提及可采用Qwen(千问)大模型,Kimi大模型也被个别项目提及 [3] 中标企业格局 - 中标企业分布分散,中国移动、中国电信等运营商中标项目相对较多 [3] - 阿里云、腾讯云、百度、火山引擎、浪潮、京东等厂商频繁出现在竞标和中标候选人名单中 [3] - 云巨头与AI独角兽企业多次在竞标中直接竞争 [3] 典型项目案例 - 国家生物安全监测预警信息平台项目(4.5亿元)将基于DeepSeek、Kimi等处理海量异构数据 [8] - 中远海运科技集团DeepSeek智算集群建设项目(1694万元)由中国电信中标 [17] - 合肥工业大学智能制造技术研究院采购DeepSeek-R1满血版(671B)大模型服务器及高性能集群管理软件(210万元) [6] 行业应用分布 - 医疗健康领域项目占比显著,涉及医院智能诊断、电子病历生成等场景 [6][19][27] - 教育科研机构积极部署,用于教学辅助、科研计算等 [6][21][68] - 政府机关在政务云、智慧城市等领域推进DeepSeek应用 [9][24][73] - 金融行业开始探索OA系统智能问答、风险管理等应用 [54][106][127]
DeepSeek向明星道歉,起底闹剧背后的真相
36氪· 2025-07-07 19:36
就在7月4日凌晨,#王一博相关谣言被DeepSeek永久撤回#突然登上微博热搜榜。作为国产AI大模型代 表的DeepSeek与娱乐明星王一博,这两个风马牛不相及的存在牵涉到一起,着实让不少人感到诧异。 之所以会出现这样的一条热搜,源于前一天下午有相当多主流媒体都发布了题为《演员王一博案,判 了!》的文章。其中显示,DeepSeek方面发布了就AI大模型违规关联王一博与"某腐败案"一事的道歉声 明。 在这一声明中,DeepSeek方面称因内容审核疏漏,平台在回答用户查询时引用未经证实的网络谣言, 将王一博与首创集团原董事长李爱庆的案件进行不当关联,对其名誉造成侵害,并已永久撤回相关失实 信息,还援引了北京市第三中级人民法院(2025)京03刑终174号刑事判决书。 不仅如此,相关媒体的报道中还列举了DeepSeek的整改措施。针对这一谣言,DeepSeek方面指出,部 分自媒体将相关案件通报中"个别顶流"等模糊表述恶意关联王一博,并伪造"同框照片"、"聊天记录"作 为"证据",同时肖战、王一博粉丝群体互撕中互相引述谣言,扩散了不实信息。对此,其已下线所有关 联谣言。 没错,这些媒体援引的道歉声明实际上是AI生成 ...
阿里开源WebSailor,检索性能超DeepSeek R1、Grok-3等模型
快讯· 2025-07-07 16:02
公司技术发布 - 阿里通义开源网络智能体WebSailor 具备强大推理和检索能力 [1] - 该智能体在高难度评测集BrowseComp上超越DeepSeek R1及Grok-3等模型 登顶开源网络智能体榜单 [1] - 构建方案及部分数据集已在Github开源 [1]
DeepSeek又惹祸了?画面不敢想
新浪财经· 2025-07-06 12:24
AI造假与信息污染 - AI幻觉问题导致主动编造事实迎合用户偏好 被利用制造离奇谣言 [3] - 造假范围从明星八卦扩展到涉政涉军领域 如编造官员腐败情节和芯片走私等虚假信息 [4][5][6][7] - 社交媒体传播效率放大虚假信息影响 形成"情绪优先于真相"的传播环境 [8][9][13] AI技术缺陷与滥用 - 模型易被投喂虚假训练数据 缺乏信息鉴别能力 加剧误导风险 [10] - DeepSeek模型幻觉问题显著 需改进逻辑设计和工程架构 [17] - 饭圈文化可能利用AI缺陷进行规模化黑公关操作 [11][12] 行业治理与应对 - 监管部门开展AI虚假信息打击行动 但治理速度落后于造假效率 [18] - 政策层面保持"放水养鱼"原则 避免过度监管新兴行业 [18] - 建议用户区分知识性信息与即时信息 建立分级信任机制 [19][20] 技术发展趋势 - 国外三大主流模型已有效控制幻觉问题 技术优化路径存在参考价值 [17] - AI功能渗透改变全社会信息获取方式 需建立新的信息过滤体系 [19][21]
DeepSeek给王一博道歉被当真,年度AI幻觉/马斯克Grok 4跑分曝光/华为盘古团队回应模型争议|Hunt Good周报
搜狐财经· 2025-07-06 11:35
Grok-4模型性能曝光 - Grok-4在HLE评估中基础得分35%,开启推理功能后提升至45%,显著领先OpenAI o3和Google Gemini系列[1] - 在GPQA测试中得分达87%-88%,代码能力评测SWE Bench得分72%-75%[2] - 新版本支持多模态输入、130k token上下文、结构化输出、数学推理和函数调用等功能[3] - Grok 4 Code将深度集成在Cursor编辑器,具备智能补全、调试和执行功能[3] 华为盘古模型开源争议 - 华为开源盘古7B稠密模型及72B混合专家模型,被质疑与阿里云通义千问Qwen-2.5 14B高度相似[4] - 华为声明盘古Pro MoE模型基于昇腾硬件平台独立开发,采用创新MoGE架构解决分布式训练负载均衡难题[5] - 承认部分基础组件代码参考业界开源实践,但严格遵循开源许可证要求[5] Cluely公司ARR快速增长 - AI面试辅助工具Cluely企业版推出后ARR一周内翻番至700万美元[7] - 产品实时分析用户在线对话生成隐蔽提示,应用于销售、客服和远程教学等场景[7] - 面临免费开源竞品Glass的挑战,增长持续性存疑[9] 特斯拉Optimus项目调整 - 暂停人形机器人零部件采购进行设计调整,预计耗时2个月[10] - 硬件存在关节电机过热、灵巧手负载低等问题,软件计划增加合成数据训练[12] - 原计划年产5000台目标恐难达成,目前仅完成约1000台[13] 百度搜索重大升级 - 搜索框升级为"智能框",支持超1000字文本输入和多模态交互[16] - 集成文心大模型和视频生成技术,可快速生成电影级短视频[17] AI基础设施投资热潮 - Amazon新建1200英亩数据中心与Anthropic合作,目标训练全球最大AI系统[21] - Oracle通过去中心化策略建立高效AI云基础设施[21] - 行业预计新建数据中心总投资超3200亿美元,年耗电量相当于百万家庭需求[23] Meta成立超级智能实验室 - 整合FAIR、大语言模型开发和AI产品团队,由Scale AI前CEO Alexandr Wang领导[24] - 吸引多位来自OpenAI、DeepMind和Anthropic的核心人才加入[26] - 计划未来几年投入数千亿美元发展AI基础设施和模型研发[26] 开源模型进展 - 百度文心4.5系列开源10款模型,包含47B和3B MoE模型及0.3B稠密模型[30] - 苹果开源DiffuCoder-7B-cpGRPO代码生成模型,EvalPlus基准性能提升4.4%[36] - B站开源AniSora V3动画视频生成模型,支持多种风格一键生成[34]
Deep Seek预测:5年后,300万的房子值多少钱?真的是超出了预期
搜狐财经· 2025-07-06 00:02
房价走势 - 2025年6月百城二手住宅均价为13691元/平方米,环比下跌0.75%,同比下跌7.26% [1] - 一线城市限购政策逐步放开,广州明确全面取消限购、限售、限价 [1] - 银行房贷利率降至3%附近,首付比例降至15% [1] 城市分化预测 - 多数观点认为一线城市房价未来5年可能上涨,因政策利好和人口吸引力 [3] - 二三线城市房价预计持续下跌,因吸引力有限 [3] - DeepSeek预测所有大中城市房价进入下跌通道,救市政策仅影响短期波动 [3] 房价下跌原因 - 房价收入比过高:一线城市40倍,二三线城市20-25倍,远超居民收入水平 [5] - 居民收入增长缓慢或减少,难以支撑当前高房价 [5] - 一线城市老破小房产抗跌性差,如上海市中心老破小从9万+/平米跌至6万+/平米 [5] 一线城市房价神话终结 - 一线城市居民收入增长放缓,购房能力削弱 [7] - 北上广深等一线城市人口出现负增长,高房价推高居住成本降低吸引力 [7] - 未来5年房价将逐步回归合理区间,与当地居民收入挂钩 [7] 5年房价预测 - 多数人预期一线城市上涨,二三线下跌 [9] - DeepSeek预测所有大中城市300万房产将价格回归 [9] - 房价泡沫影响社会经济发展,未来5年回归合理价格是大势所趋 [9]
三个臭皮匠顶个诸葛亮:OAI/谷歌/DeepSeek首次合体“AI梦之队”!战力飙升30%,碾压一切单模型
快讯· 2025-07-05 19:30
AI模型整合研究 - Sakana AI的研究发现,在推理过程中整合三种模型的能力,其性能远超单个模型 [1] - 三模合一的性能优于只有两个模型合体的性能 [1]