大模型

搜索文档
AI潮涌,谁是港股科技最锋利的“矛”?|2025招商证券“招财杯”ETF实盘大赛
搜狐财经· 2025-07-23 14:11
为持续向投资者普及ETF基础知识,招商证券携手十大基金公司,联合全景网共同举办2025年招商证 券"招财杯"ETF实盘大赛系列直播,旨在帮助投资者提升资产配置与风险管理能力,促进ETF市场的健 康发展。 2025年7月10日,"招财杯"ETF实盘大赛系列直播邀请到了汇添富基金指数量化投资部基金经理乐无穹 一起探讨《AI潮涌,谁是港股科技最锋利的"矛"?》。 乐无穹认为,去年以来,港股通持续流入等因素带动港币汇率提升,而套息交易又导致港币汇率下行。 下半年流动性有望达到一定平衡,资本市场存在一定温和提升估值的机会。 这两轮AI浪潮主要由ChatGPT与DeepSeek这两款重磅产品带动,AI大模型成为浪潮的核心,也带动了上 游硬件与下游应用的崛起。目前这一波AI行情还远未结束,模型的迭代还在不断进行,应用还在不断 开花结果。 市面上的港股科技ETF基本上可以归纳为两组关键词:QDII与港股通(投资范围的差异)、科技与互联 网(业务定义的差异),投资者要明白当中的差异,可以根据自己的诉求在2×2组合当中选择合适的指 数。 半年复盘:港股beta与AI革命共舞 今年一季度最火的板块要数港股科技,整个港股Beta在上 ...
如何避免成为AI墓地的一员?
虎嗅· 2025-07-23 13:15
AI项目失败现状 - AI工具聚合网站"DANG!"收录的停止运营AI项目从2024年6月的738个增至2025年2月的1100多个,增长率超50% [1] - 失败项目涵盖通用功能类(AI语音、图片、对话等)和专业功能类(数据分析、编程辅助、影视剪辑等) [1] - 包括OpenAI的Whisperai、Stable Diffusion套壳网站FreewayML、谷歌前高管创立的Neeva等明星项目 [1] 失败核心原因 - 过度追求大模型技术指标,忽视商业模式设计与应用场景挖掘 [2] - 产品价值空间狭窄(如AI Pickup Lines仅满足娱乐性搭讪需求) [8] - 套壳应用缺乏壁垒(如FreewayML被同类产品快速取代) [17] 生存能力评估模型 - **价值空间**:需验证需求真实性与市场增量(存量替代或新增市场) [8][9] - **切入模式**:需匹配刚需场景(如ChatGPT对话形态、AI学习机硬件化) [12][14] - **资源壁垒**:需应对巨头竞争(如谷歌广告大模型碾压创业公司) [18] - **盈利模式**:避免同质化价格战,平衡成本加成与价值分享定价 [19][20] - **生态协同**:需构建技术迭代闭环(如Adobe Premiere渐进优化传统影视链) [29] - **数据安全**:防范泄露与幻觉风险(如Whisperai医疗数据漏洞) [30][32] 典型案例分析 - **Typeface**:估值10亿美元需年营收1亿美元,相当于替代2万名营销人员工作量 [10][11] - **Sora**:计算成本达GPT-4的15000倍,商业闭环尚未成型 [27][28] - **国内挑战**:C端付费习惯弱,需探索硬件化等本土化模式 [13][35] 成本与竞争压力 - GPT-4训练成本超1亿美元,GPT-5单轮训练近5亿美元 [21] - 国内Yi-Lightning模型训练耗资300万美元/2000张GPU/1.5个月 [21] - 开源模型迭代迫使企业重复投入资源(如Llama版本更新) [24]
对话联想创投王光熙:产业方入局有助于具身产业发展,愿在有长期价值的赛道布局激进一些
IPO早知道· 2025-07-23 12:44
联想创投2025 CVC创投周活动 - 以"硅基进化,万物共生"为主题的联想创投2025 CVC创投周于7月22日在联想总部开幕 [2] - 活动携手50余家被投企业打造6大沉浸式展区,展示10年AI投资成果及硅基智能时代的技术与商业落地进展 [4] 联想创投的CVC 2.0模式与投资成果 - 联想创投作为联想集团三级研发体系的关键一环,采用独特的CVC 2.0模式,依托联想全球品牌、渠道和供应链优势构建生态体系 [4] - 成立9年来累计投资超过280家科技企业,其中20家成功上市,培育50余家细分领域独角兽 [4] - 2016年以来A股上市的5家市值超3000亿科创企业中,联想创投捕获3家(寒武纪、宁德时代、海光信息) [4] - 2023年6月30日科创板IPO获受理的摩尔线程和沐曦均为联想创投独家同时布局项目 [4] 机器智能与具身智能领域布局 - 深耕机器智能领域超十年,投资50余家相关企业,覆盖从核心部件研发到具身智能系统突破的全产业链 [6] - 领投企业云迹科技冲刺"机器人服务智能体第一股",服务终端消费者数量全球第一,同时在线机器人最高达3.6万台 [6] - 具身智能领域早期布局星动纪元、跨维智能、逐际动力等明星企业 [6] 投资策略与赛道选择逻辑 - GPU领域采取追赶策略,选择合适时机布局成建制团队,联想集团资源帮助建立业务认知 [8] - 大模型赛道选择智谱和阶跃星辰两家稳健企业,采取"看清后再精准布局"策略 [11] - 具身智能被视为"开天辟地的行业",采用更激进的VC视角布局多元化场景 [11] - 投资组合考虑集团生态合作需求,如GPU企业需覆盖渲染类、显卡类等不同类型 [9] 对具身智能行业的观察 - 多行业入局具身智能反映各垂类领域对其价值的认可,包括互联网大厂、IT企业、能源企业等 [13] - 不同资源方进入行业有助于为具身智能企业提供场景和机会,比单纯资金支持更重要 [16] - 行业存在估值泡沫但属正常现象,最终取决于商业价值与社会价值的兑现速度 [17]
周鸿祎评DeepSeek流量下滑
第一财经· 2025-07-23 12:03
DeepSeek业务战略与市场表现 - DeepSeek官网流量下降源于公司未投入资源优化To C端应用体验 网站速度曾被评价"慢得要死" [1] - 公司战略重心聚焦AGI(通用人工智能)技术研发而非消费级产品运营 [1] - 技术开源免费策略推动其大模型广泛渗透第三方云服务平台 实际调用量维持高位 [1] DeepSeek行业生态影响 - 大模型技术被360智能体等中国企业采用 成为行业基础设施级"武器装备" [1] - 通过B端技术输出实现商业价值 包括为其他公司提供基座模型改造服务 [1]
周鸿祎评DeepSeek流量下滑:梁文锋没花心思做,他一门心思搞AGI
快讯· 2025-07-23 11:57
DeepSeek业务策略与市场表现 - DeepSeek官网流量下降源于公司未投入资源优化To C端应用体验[1] - 公司技术重心集中于AGI(通用人工智能)研发而非消费级产品运营[1] - 第三方云服务中DeepSeek大模型流量持续高位,反映B端技术输出成效显著[1] 行业合作与技术影响力 - 360智能体等中国多家企业采用DeepSeek模型作为基座技术进行改造[1] - 公司通过开源免费策略扩大技术渗透率,成为行业基础设施供应商[1] - 技术输出形态以API或模型授权为主,而非直接面向终端用户[1]
周鸿祎:大模型降低了使用门槛,也降低了被攻击门槛
新浪科技· 2025-07-23 11:26
大模型安全风险与应对措施 核心观点 - 大模型在落地应用中面临三大主要安全风险:幻觉问题、攻击门槛降低、国家级高级威胁攻击 [1][2] - 360集团提出两项解决方案:智能体安全专家实时防御、"大模型卫士"监控指令与输出 [3] 大模型安全风险 - **幻觉问题**:大模型会一本正经地编造错误信息,在工业生产和政务领域可能造成严重后果,尤其是智能体具备工具操纵能力后危害更大 [1] - **攻击门槛降低**:大模型使非编程人员也能发动"注入攻击",例如通过指令窃取企业机密文件,前台人员亦可实施攻击 [2] - **国家级威胁升级**:黑客将经验嵌入大模型后可操纵50-500个智能体,网络安全演变为算力对抗,数字黑客无需休息 [2][3] 360集团解决方案 - **智能体安全专家**:通过算法实时检测和防御攻击,实现"以算法对抗算法" [3] - **大模型卫士**:监控指令输入与输出合理性,结合搜索和企业知识库降低幻觉概率 [3]
明显感觉程序员的面试已经变了。。
猿大侠· 2025-07-23 11:25
行业趋势与职业发展 - 传统技术岗位(如Java、C++、前端)从业者面临AI大模型技术冲击,需将现有技术与大模型结合以提升竞争力 [1] - AI应用落地是未来趋势,大模型方向成为职业升级和薪资提升的关键机遇 [1] - 行业出现裁员、降薪现象,但掌握AI能力的工程师更受市场青睐 [1] 课程内容与结构 - 课程采用「代码逐行解构+实战项目操练」双轨模式,覆盖大模型微调、RAG、AI Agent、Transformer架构等核心技术 [9][11] - 五大学习模块:基础→工具→进阶→竞赛→实战,构建完整学习路径 [9] - 案例拆解包括金融行业支小助、知乎直答等商业化应用,提供一手数据资源和项目复现机会 [16] 技术应用与实战 - 聚焦主流大模型(如DeepSeek、Qwen)的微调技术,优化特定场景(制造、医药、金融)的模型性能 [11] - RAG技术应用于垂类场景(法律文档分析、医疗诊断辅助、金融报告生成),提升信息提取精准度 [11] - AI Agent开发涵盖多任务协同与自主决策,如制造业设备故障诊断、金融投资分析等场景 [11] 学员成果与就业支持 - 课程已服务20000+学员,部分学员通过内推获得高薪offer [11][20] - 提供大厂内推+直聘权益,简历直达面试官,加速职业跃迁 [15][20] - 完课赠送《大模型应用案例集》《AI商业落地白皮书》,助力技术迭代与职业发展 [1][20] 课程附加价值 - AI领域大佬授课,揭秘大厂真实案例(如知乎直答底层原理)并分享商业化项目经验 [18] - 剖析大模型招聘行情(岗位、薪资、技术迭代),规划职业发展路径 [20] - 限时免费预约,名额仅限100-200人,强调紧迫性以吸引潜在学员 [13][20]
一起做些有意思的事情!自动驾驶之心还缺几位合伙人
自动驾驶之心· 2025-07-23 10:12
业务合伙人招募 - 公司计划向国内外招募10位优秀合伙人(个人+企业)负责自动驾驶相关项目对接、课程研发、论文辅导、硬件研发、产品代理 [2] - 主要招募方向包括大模型/多模态大模型、扩散模型、VLA、端到端、具身智能、AI Agent、3D目标检测、世界模型、闭环仿真3DGS、大模型部署与量化感知推理、SLAM等 [2] - 岗位要求QS200以内高校硕士及以上学历,手握顶会论文者优先 [2] 合伙人待遇 - 提供自动驾驶资源共享(求职、读博、出国留学推荐等) [3] - 提供丰厚的现金激励 [3] - 提供创业项目合作与推荐机会 [3] 联系方式 - 咨询需添加微信wenyirumo并备注"机构/公司+自动驾驶合作咨询" [3]
阿里Qwen3-Coder携1M上下文杀来!5分钟生成网站,开发者狂欢:Claude Code可以卸载了
AI前线· 2025-07-23 08:22
阿里发布Qwen3-Coder代码模型 - 核心观点:阿里发布迄今为止最具代理能力的代码模型Qwen3-Coder,具备卓越的代码和Agent能力,支持358种编程语言,在多项评测中取得开源模型最佳效果[1] - Qwen3-Coder采用混合专家MoE架构,参数规模达480B,激活参数35B,原生支持256K token上下文,可通过YaRN扩展到1M token[1] - 模型在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use等任务上表现优异,可与Claude Sonnet4媲美[1] 模型性能表现 - 在Terminal-Bench评测中得分37.5,优于Kimi-K2 Instruct的30.0[2] - SWE-bench Verified得分69.6,SWE-bench Live得分26.3,均领先其他模型[2] - Multi-SWE-bench mini得分25.8,优于Kimi-K2 Instruct的19.8[2] - WebArena评测得分49.9,Mind2Web得分55.8,表现优异[3] - BFCL-v3评测得分68.7,TAU-Bench Retail得分77.5,展示强大工具使用能力[3] 技术特点与创新 - 训练数据总量达7.5T,其中代码占比70%[8] - 采用扩展Code RL训练方法,通过自动扩展测试样例构造高质量训练实例[7] - 实现可验证环境的扩展系统,可同时运行20k独立环境[10] - 利用Qwen2.5-Coder对低质数据进行清洗与重写,提升数据质量[8] 应用场景与效率提升 - 可帮助程序员完成基础编程任务,如写代码、补全代码、修Bug等[14] - 编程工作效率大幅提升,代码测试、查询生成等工作从数小时降至数分钟[14] - 刚入行程序员一天可完成资深程序员一周的工作[4] - 生成一个品牌官网最快只需5分钟[4] 开发者生态与商业化 - 已在魔搭社区、HuggingFace等平台开源,Github获得5.1k stars[5] - 将接入阿里AI编程产品通义灵码,API已上线阿里云百炼[5] - 阿里云百炼提供API服务,输入Token成本从$1/百万到$6/百万不等[20] 开发者反馈 - 开发者称赞模型速度快,可替代每月200美元的Claude Code[13] - 有开发者反馈模型在逐步推理提示下表现更好[19] - 部分开发者遇到基本操作失败的问题[20]