大模型

搜索文档
这一空白终于被DeepSeek打破
新浪财经· 2025-09-21 14:26
#DeepSeek就是这么大大方方#【#这一空白终于被DeepSeek打破#】近日,由DeepSeek团队共同完成、 梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上国际顶级期刊《自然(Nature)》的封 面。该期刊编辑部直言:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白"终于被 DeepSeek打破"。"同行评审"在学术界属于常见且必要的论文审查程序,为何此次《自然》单独将其提 出,并以"打破空白"来高度评价DeepSeek?事实上,自ChatGPT起,全球范围内大模型发展就犹如一 场"黑箱"里的竞速。业内及公众往往是通过社交媒体、营销发布会等了解产品性能,至于核心训练方法 和数据则属于高度设防的"商业机密",更遑论追问其原创性、方法论和稳健性?而DeepSeek-R1这篇论 文,详尽披露了模型训练细节,并在长达64页的同行评审文件中正面回应,DeepSeek-V3 Base (DeepSeek-R1的基座模型)使用的数据全部来自互联网,没有专门的蒸馏环节。大大方方公布技术, 堂堂正正接受检验,正如《自然》赞扬,"这一切都是AI行业迈向透明度和可重复性的可喜一步。"有人 说, ...
华为:未来5年每年投入150亿,发展鸿蒙、鲲鹏、昇腾等生态
观察者网· 2025-09-21 09:54
公司战略与投入 - 未来5年每年投入150亿人民币生态发展费用、1500P开源社区算力及15000人进行生态平台开发与支持 [1][6] - 提出"四个坚定"战略方向:开源开放、发展人才、全球合作、战略投入 [1] - 业务从"联接"核心扩展至终端、计算等生态型产业 服务群体新增ToD开发者 [1] 开源生态建设 - 作为全球20多个开源基金会创始成员或顶级成员 在300多个上游社区成为核心代码贡献者 [1] - OpenHarmony开源5年汇聚9200多名贡献者 贡献1.3亿行代码 孵化1100多个三方组件库 [2] - 昇腾基础软件全面开源 新增CANN、Mind系列套件等 优先支持PyTorch等主流开源社区 [2] - 将低密度计算HiF8/HiF4数据格式技术捐赠全球计算联盟GCC 显存占用降低50%-75% 矩阵乘算力提升2-8倍 [3] 技术落地成果 - 1300多软硬件产品通过OpenHarmony兼容性测评 应用于金融、交通、能源、航天等行业 [2] - 60多款华为终端设备搭载鸿蒙5 总量超1700万台 9000个应用基于系统创新能力开发70多种体验创新 [2] - 星闪技术吸引1200多家伙伴共建生态 终端设备超1亿台 联合定义HDR Vivid等视听新标准 [3] - 华为云开发者新增200万 累计达850万 支持直接使用鲲鹏/昇腾算力进行云端开发 [3] 人才发展体系 - 与全球高校合作开发3000多门课程 设立3000多所ICT学院 培养超170万名人才 [4] - 启动"基础软件千校行动"覆盖20多国2000多所高校 计划培养1万名教师和100万新型软件人才 [4] 全球合作机制 - 联合开放原子开源基金会等国内机构及Linux Foundation等国际基金会加强开源生态建设 [6] - 通过知识、赋能、开发与激励四大体系支持全球开发者创新 [6]
每周股票复盘:寒武纪(688256)半年净利10.38亿同比扭亏
搜狐财经· 2025-09-21 01:39
股价表现 - 截至2025年9月19日收盘价1349.24元 较上周1488.0元下跌9.33% [1] - 本周最高价1529.4元(9月15日) 最低价1342.0元(9月19日) [1] - 总市值5644.55亿元 位列半导体板块2/163 A股市场24/5153 [1] 财务业绩 - 2025年上半年营业收入288,064.35万元 同比增长4,347.82% [2][4] - 净利润103,808.26万元 同比实现扭亏为盈 [2][4] - 研发投入45,649.02万元 占营收比例15.85% [2][4] 融资计划 - 拟向特定对象发行A股股票募集资金不超过398,532.73万元 [2][4] - 发行数量不超过总股本5%(2,091.7511万股) 发行对象不超过35名 [2] - 发行价格不低于定价基准日前20个交易日股价均值的80% [2] 资金用途 - 募集资金将投向面向大模型的芯片平台项目及软件平台项目 [2][4] - 部分资金用于补充流动资金 [2] - 项目旨在提升公司在大模型时代的芯片与软件技术实力 [2] 公司治理 - 中信证券持续督导报告显示未发现重大问题或违规事项 [2] - 募集资金使用合规 控股股东无持股质押、冻结及减持情况 [2] - 发行计划已获上交所审核通过及证监会注册 [2]
具身领域的大模型基础部分,都在这里了......
具身智能之心· 2025-09-21 00:03
随着具身和自驾领域的发展,基于大模型方案的各类算法层出不穷,占据了各大工作的头条。我们也收到 了很多具身领域同学的诉求,希望把大模型相关内容汇总学习下,学习大模型也是适应大趋势的必然。 『大模型之心Tech知识星球』目前集视频 + 图文 + 学习路线 + 问答 + 求职交流为一体,是一个综合类的大 模型社区。旨在为大家打造一个交流+技术分享的社区,是许多初学者和进阶的同学经常逛的地方。 国内最全的大模型技术栈社区:大模型之心Tech 社区创建的出发点是给大家提供一个大模型相关的技术交流平台,交流学术、应用和工程上的问题。星球 内部的嘉宾正在快速扩张中,我们邀请了来自国内外知名高校实验室、大模型/互联网相关的头部公司,其 中高校和科研机构包括但不限于:上交、清华、北京大学、上海人工智能实验室、港科大、港大等等!公 司包括但不限于阿里千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等 等。未来我们会打造一个大模型的前沿技术聚集地~ 我们为大家汇总了大模型全栈学习路线图,包括但不限于: | RAG学习路线 | AI Agent学习路线 | 多模态大模型学习路线 | | - ...
2025腾讯数字生态大会|腾讯云副总裁吴运声:把智能体做成生产力工具
搜狐财经· 2025-09-20 16:46
智能体发展背景 - 大模型发展突飞猛进但企业面临AI落地难题 智能体在2025年成为产业热词源于实际业务需求推动[1][3] - 企业不需要概念展示而需要能真正解决问题的工具[3] 智能体平台升级 - 腾讯云智能体开发平台3.0版本强化RAG 多智能体协作 长期记忆和插件生态功能[3] - 新平台支持智能体在跨任务 跨场景中持续工作 例如客服智能体能记住用户历史互动并持续跟进需求[3] 场景化应用案例 - 酒店住中服务通过多智能体协同系统实现语义理解 设备控制插件调用和反馈确认 完成从单点服务到全流程覆盖[4] - 工业质检智能体实现流水线实时产品缺陷检测并同步问题给产品团队[4] - 媒体行业全链路内容生产智能体完成资料检索 写作 排版与审核 极大提升效率[4] 开源生态建设 - 腾讯优图实验室开源智能体框架Youtu-Agent 在GitHub获得2700+ Star 成为领域领先开源项目之一[6] - 同步开放内部积累的最佳实践案例 包括解决RAG复杂查询和提升Agent协作效率的参考代码[6] - 与国际框架相比更强调技术加场景结合 重视产业真实数据和场景支撑[6] 技术挑战与未来方向 - 当前首要挑战是提升智能体可信度和可靠性 减少幻觉输出[7] - RAG在跨领域多数据源场景下存在复杂查询的效率与准确率难题[7] - 需建立更成熟的多智能体分工协作机制以形成业务合力[7] - 行业处于探索阶段 突破关键在于逐步解决现实卡点而非概念升级[6][7]
90后北大硕士升任永辉超市CEO;云海肴创始人赵晗去世,年仅40岁;雷军回应小米召回超11万辆SU7;智元披露合伙人名单丨邦早报
创业邦· 2025-09-20 12:39
小米汽车召回事件 - 小米汽车召回116887辆SU7标准版电动汽车 因L2高速领航辅助驾驶功能在极端特殊场景下识别、预警或处置可能不足 存在安全隐患[1] - 通过OTA技术免费升级软件以消除安全隐患 优化辅助驾驶速度控制策略并新增动态车速功能 提升辅助驾驶功能可靠性[2] - 本次召回仅针对2025年8月30日前生产的部分SU7标准版车型 不涉及其他版本[2] 云海肴创始人去世 - 云海肴创始人赵晗因突发心梗去世 享年40岁 名下关联40余家企业 其中21家为存续状态[2] - 业务版图涉及餐饮、投资、企业管理等领域 包括云海肴南京餐饮管理有限公司、上海联馔餐饮集团有限公司等[2] iPhone 17系列发售情况 - iPhone 17系列国行版正式发售 官网送货时间需3-4周 Pro Max 256G可加价600元回收 标准版256G和512G可加价400元回收[4] - 加价回收情况优于去年同期 此前iPhone 16和15系列标准版曾被黄牛拒收[4] 捷豹路虎网络攻击事件 - 捷豹路虎因网络攻击事件延长生产暂停时间至2025年9月24日 全球33000名员工受影响[6] - 公司正评估各环节潜在风险 目前尚未对中国市场交付产生影响 零售合作伙伴仍在正常营业[6] 智元机器人管理层披露 - 智元机器人合伙人团队名单披露 邓泰华为创始人、董事长、CEO 彭志辉为联合创始人、总裁、CTO[7] - 其他高管包括姜青松任营销服总裁 姚卯青任具身业务部总裁 王闯任通用业务部总裁等[7] 追觅科技造车进展 - 追觅科技官宣造车 首款超豪华纯电产品对标布加迪威龙 计划2027年亮相 已组建近千人团队[10] - 团队包括原智能硬件业务核心研发人员和传统整车制造领域资深专家 正在德国特斯拉柏林工厂附近选址建厂[10] 腾讯元宝及美团新功能 - 腾讯元宝全量上线公众号和视频号评论区 具备用户情绪感知与回应能力[10] - 美团试点"热菜现制现炒"信息展示栏 满足消费者对门店信息的知情权 帮助商家展示后厨动态[10] 深圳水贝金料商事件 - 深圳水贝金料商粤宝鑫负责人失联 多名商户支付大额预付款后公司突然停业[12] - 市场传言金料商出现跑路潮 但实地调查未证实 另有金料商发布清算公告[12] 格力回应小米包修政策 - 格力高管朱磊回应小米十年免费包修政策 称十年不用修才是实力 基于30年市场验证和持续下降的售后故障率[12] - 建议小米先修好召回的11万辆车再拍胸脯承诺[12] 阿里游戏及永辉人事变动 - 阿里旗下虎鲸文娱打造小游戏业务"熠点互动" 专注H5和小程序游戏平台运营[12] - 永辉超市聘任90后王守诚为CEO 1991年出生 北京大学硕士 2017年以管培生身份加入永辉[12] Meta及扎克伯格AI战略 - 扎克伯格表示宁愿浪费数千亿美元也不愿在AI领域落后 认为风险是不够激进而非过于激进[14] - AI泡沫可能出现 但人工超级智能提前到来将使技术落后的公司处于不利地位[14] 深圳房地产限购辟谣 - 网传深圳核心区放开限购 官方辟谣称不存在特殊渠道解决购房资格问题[14] - 深圳市9月5日出台房地产调控政策 未放开核心区限购[14] 淘宝闪购及谷歌AI整合 - 淘宝闪购和饿了么上线餐饮团购业务 优先在上海、深圳、嘉兴试点 后续扩展至全国一二线城市[17] - 谷歌将Gemini AI整合进Chrome浏览器 支持网页解释、多标签页信息整合和恢复关闭网站等功能[17] 黄仁勋评论马斯克及微软投资 - 黄仁勋称赞马斯克是优秀工程师 有机会在AI领域占据领导地位 经常使用xAI的Grok聊天机器人[17] - 微软在威斯康星州建第二座数据中心 累计投资超70亿美元 首座数据中心2026年初投运[17] 特斯拉及生数科技融资 - 特斯拉Optimus AI团队负责人Ashish Kumar离职加盟Meta 曾任Optimus项目AI开发负责人[18] - 生数科技完成数亿元A轮融资 由博华资本领投 百度战投等老股东跟投[20] 星际荣耀及瞻芯电子融资 - 星际荣耀完成D+轮融资首批资金7亿元交割 用于可重复使用运载火箭研发和生产基地建设[20] - 瞻芯电子C轮融资获超10亿元投资 由国开制造业转型升级基金领投[20] 英伟达投资及小米开源 - 英伟达拟向英国自动驾驶初创企业Wayve投资5亿美元 已签署意向书[20] - 小米开源首个原生端到端语音大模型Xiaomi-MiMo-Audio 基于上亿小时训练数据实现少样本泛化[20] 追觅手机及腾讯3D平台 - 追觅将推出首款智能手机Dreame Space 海外市场获超亿元人民币预售订单[20] - 腾讯发布一站式工作平台"混元3D Studio" 整合3D生产全流程 将生产周期从天级缩短到分钟级[22] 通义万相及深蓝汽车 - 通义万相开源动作生成模型Wan2.2-Animate 支持驱动人物、动漫形象和动物照片[24] - 深蓝S07正式上市 全系标配华为乾崑ADS SE和3C快充 南京数智工厂年产值超37亿元[24] PC掌机及北京大模型 - 2025年全球PC掌机销量预计达230万台 同比增长32% 2029年销量预计达470万台[26] - 北京备案大模型数量占全国近三成 达159款 全国560款大模型完成备案 注册用户超32亿[26]
18岁天才少年,登上Nature封面!
猿大侠· 2025-09-20 12:11
行业技术突破 - DeepSeek-R1成为史上首个经严格同行评议的大模型 荣登Nature封面 [1][2] - 模型通过强化学习激励推理能力 相关论文引用量达3,691次 [53] 人才与团队成就 - 18岁实习生涂津豪以高中生身份参与DeepSeek-R1项目 成为Nature作者之一 [1][6][10] - 研究员罗福莉作为独立研究者参与项目 学术引用量达10,140次 h指数27 [45][52][53] - 团队核心成员主导多语言预训练模型VECO 并参与DeepSeek-Coder/DeepSeek-V2/DeepSeek-V3等全线产品研发 [54] 技术创新细节 - 涂津豪开发"Thinking Claude"提示词工程 通过80次迭代优化使Claude 3.5实现类o1推理模式 [14][27][35] - 该项目在GitHub获超15,000星 实现思维过程可视化与展开/折叠功能 [35][33] - 研究强调AI需理解谜语/笑话/文化背景等非结构化内容 反映基础语言理解能力 [41][44] 学术影响力 - DeepSeek系列论文广泛发表于arXiv 其中DeepSeek-V3技术报告引用量1,819次 [53] - DeepSeek-Coder论文引用量1,130次 突破代码智能领域闭源模型壁垒 [53] - 混合专家模型DeepSeekMoE论文引用量494次 推动专家专业化研究 [53]
中概互联、恒生科技与港股通科技指数比较分析
新浪财经· 2025-09-20 12:02
指数表现 - 恒生科技指数、港股通科技指数和中概互联指数于2023年9月17日分别上涨4.22%、3.27%和3.40%,均创近四年新高 [1] - 上涨归因于美联储降息预期升温、全球流动性环境改善及国内科技企业在大模型和云计算等前沿技术的持续突破 [1] 指数编制规则 - 中概互联指数基于中证海外中国互联网50指数,权重集中度高,腾讯和阿里巴巴合计占比超50%,调整周期为半年 [1] - 恒生科技指数覆盖30家港股科技公司,个股权重上限8%,采用分散持仓与季度调整策略,能快速捕捉新兴市场机会 [1] - 港股通科技指数含50家科技企业,权重上限15%,通过内地投资者资金形成流动性溢价,推动成分股估值提升 [1] 行业构成 - 中概互联指数聚焦互联网领域,社交、电商和在线娱乐等细分市场占比超90% [2] - 恒生科技指数在互联网与硬科技间保持均衡,硬科技比重超40% [2] - 港股通科技指数覆盖制造业、创新药等领域,成分股需近两年实现10%以上营收复合增长率或研发支出占比超5% [2] 估值水平 - 中概互联指数PE-TTM为21.11倍,处于近十年18.01%历史分位,显示估值底部特征 [2] - 恒生科技指数PE-TTM为24.24倍,位于近十年35.07%历史分位,受益于港股流动性改善 [2] - 港股通科技指数PE-TTM为25.84倍,处于近十年53.31%历史分位,因行业多元化及成长性标的占比高而具流动性溢价 [2] 投资价值 - 中概互联指数适合看好核心资产的投资者,腾讯和阿里占中国数字经济超60%市场份额,并在云计算与大模型领域开辟新估值空间 [3] - 恒生科技指数适合软硬科技均衡配置需求,分散持仓策略降低单一行业风险,尤其在AI与半导体领域潜力显著 [3] - 港股通科技指数适合寻找科技领域多元化增长机会的投资者,成分股经严密筛选确保财务质量 [3] - 均衡配置三大指数可实现对港股"新质生产力"及中国最佳权益资产的一键打包策略 [3]
中概互联、恒生科技和港股通科技有何异同
雪球· 2025-09-20 09:53
核心观点 - 恒生科技指数、港股通科技和中概互联三大指数在9月17日大幅上涨,创近四年新高,主要受美联储降息预期、全球流动性宽松及AI技术突破等多重利好驱动 [4][5] - 三大指数在编制规则、行业构成和估值水平上存在差异,但均处于历史估值低位,具备估值修复潜力 [7][8][9][10][11][12][13][15][16] - 投资价值需根据个人偏好选择:中概互联适合龙头信仰者,恒生科技适合均衡配置,港股通科技适合成长性机会捕捉,也可均配三大指数实现分散投资 [17][18] 指数表现 - 9月17日恒生科技指数涨4.22%至6334.24点,周涨5.76%,年初至今涨41.77% [4][5] - 港股通科技指数涨3.27%至3808.55点,周涨4.52%,年初至今涨58.54% [4][5] - 中概互联指数涨3.40%至10856.74点,周涨4.68%,年初至今涨47.51% [4][5] - 上涨动力来自美联储降息预期升温、全球流动性宽松及AI技术突破带动科技企业表现 [5] 编制规则差异 - 中概互联采用头部集中+低频调整策略:腾讯和阿里合计权重超50%,前十大成分股权重超90%,单一个股权重上限30%,每半年调整一次 [7] - 恒生科技采用分散持仓+高频调整策略:覆盖30家港股科技企业,个股权重上限8%,前十大权重约60%,每季度调整一次 [7] - 港股通科技规则居中:覆盖50家港股通科技企业,权重上限15%,前十大权重约70%,每半年调整一次,受益于内地资金流动性溢价 [8] 行业构成差异 - 中概互联聚焦纯互联网:社交、电商、在线娱乐等占比超90%,硬科技占比几乎为零 [9][10] - 恒生科技均衡布局硬科技+互联网:互联网占比约55%,半导体、新能源车、消费电子等合计占比超40% [10] - 港股通科技覆盖更广:硬科技+互联网+创新药布局,生物科技、新能源设备等新兴领域占比约30%,要求成分股近两年营收复合增长率超10%或研发占比超5% [11] 估值水平 - 中概互联PE-TTM为21.11倍,处于近十年18.01%历史分位,受反垄断政策影响估值处于底部 [15] - 恒生科技PE-TTM为24.24倍,处于近十年35.07%历史分位,受益流动性改善和硬科技景气度 [15] - 港股通科技PE-TTM为25.84倍,处于近十年53.31%历史分位,因行业多元化和流动性溢价估值相对较高 [15] - 三大指数均处于近十年偏低或合理偏低水平,具备估值修复潜力 [16] 投资价值分析 - 中概互联(如ETF 513050)适合核心资产信仰者:龙头确定性高,腾讯和阿里占中国数字经济超60%份额,云计算和大模型打开第二增长曲线,权重集中在牛市中弹性大 [18] - 恒生科技(如ETF 513180、513130、513010)适合均衡配置软硬科技:分散持仓降低单一行业风险,AI和半导体赛道处于爆发前夜,跟踪规模超1000亿流动性充足 [18] - 港股通科技(如ETF 513980、513860、513020)适合捕捉多维度增长机会:成分股经港股通资格双重筛选(科技属性+流动性),兼顾成长性与流动性,AI、半导体和创新药赛道成长空间广阔 [18] - 投资者也可均配三大指数,一键打包中国最好权益资产实现分散投资 [18]
紫东太初4.0发布 国产大模型迈向“边看、边识、边思”新阶段
第一财经· 2025-09-20 00:08
9月19日,首款全栈国产化深度推理大模型"紫东太初"4.0在武汉发布,具备"边看、边识、边思"的类人多模态推理认知能力,特别是在带图思考多模态复杂 推理和工具调用的能力上,全面超过了GPT5。 2024年图灵奖得主理查德·萨顿表示,人类数据正在迅速接近极限,智能体将越来越多通过与世界交互而获得持续学习的能力,潜力远超以往。 中国科学院自动化研究所副总工程师、武汉人工智能研究院院长王金桥在接受第一财经记者采访时介绍,从3.0原生的多模态统一框架到4.0多模态细腻度的 复杂思考,紫东太初完成了国产大模型从"纯文本思考""简单操作带图思考"到"细粒度多模态语义思考"的三重跃迁。 以推理"赢得一场斯诺克需要几步"为例,"紫东太初"4.0通过输入的图片可先定位白球、粉球和红球的位置,再通过台上不同球的得分进行复杂的推理和数 学计算,进一步告诉大家他要做5杆斯洛克才能赢得这场球。 "紫东太初4.0从理解能力、模态推理、动态推理三大能力引入了类人的交叉注意力机制,使大模型能够像人一样,实现对世界的理解从全局到局部再到上下 文交互式的思考过程。"王金桥说,通过视觉注意力关注到某一个区域,然后进行平移、放大、旋转、增强等一系列 ...