AGI

搜索文档
腾讯首个全模态模型混元O将发布,正面硬刚DeepSeek和字节豆包;全球首场人形机器人格斗大赛开赛丨AIGC日报
创业邦· 2025-05-26 08:03
华为昇腾超节点技术 - 华为正式推出昇腾超节点技术 由12个计算柜和4个总线柜构成 实现业界最大规模的384卡高速总线互联 是目前业界规模最大的超节点 [1] 腾讯混元大模型进展 - 腾讯基于自研大模型混元的首个端到端语音通话模型Hunyuan-Voice最快今年6月上线腾讯元宝App 与豆包AI视频通话功能对抗 [2] - 腾讯规划多模态和全模态路线 最快今年将推出全球首个"全模态模型"混元-O 瞄向"世界模型" 以语言模型为核心探索多种模态融合 [2] 百度心响App发展 - 百度多智能体协作App心响正式推出iOS版本 实现安卓与iOS双端全量上线 [3] - 心响App已上线十大场景超200个任务类型 包括例行任务、城市旅游、AI相亲等 未来计划将任务类型扩展到10万以上 [3] 智元机器人灵犀X2规划 - 智元机器人宣布灵动机器人灵犀X2启动合作伙伴招募计划 预计2025年下半年实现规模化出货 [4] - 到2026年底 灵犀X2预计出货量将达到数千台 [4]
一边拥抱AI一边打击AI,抖音到底在想啥
36氪· 2025-05-26 07:51
AI技术在内容平台的双刃剑效应 - AI大模型成为科技企业重点布局方向,但同时也是互联网虚假内容的主要制造源 [1] - 抖音针对"AI起号"黑灰产展开专项治理,打击批量生产账号和传播虚假信息的行为 [1] - 内容平台面临既要推广AI创作工具又要清理低质AI内容的矛盾局面 [4][6] 平台治理AI滥用的具体措施 - 抖音和小红书重点打击六类违规行为:AI生成低俗视频、虚拟外国专家内容、AI教程售卖、账号秘籍传授、规避AI标注、虚拟账号交易 [2] - 抖音5月16日正式接入豆包AI助手,用户可通过消息列表直接对话 [2] - 小红书与月之暗面合作推出Kimi智能助手21天打卡活动,推广长文本处理功能 [4] 内容平台拥抱AI的底层逻辑 - 平台面临内容供给不足问题,UGC向PUGC/PGC转型导致创作门槛升高 [6] - 抖音普通用户短视频发布量下降,专业团队内容挤压草根创作者空间 [6] - AI工具可缩小普通用户与专业团队的创作能力差距,多模态大模型帮助用户提升内容质量 [8] AI内容质量的两极分化现象 - 抖音接入豆包后涌现AI创意短片,但低质视频和虚假内容同步激增 [8] - 当前AI需要精细调优才能产出优质内容,但多数创作者追求快速变现导致内容粗糙 [10] - 批量生成的AI内容质量方差极大,类似早期"内容农场"对平台的污染效应 [10] 低质AI内容对平台的商业冲击 - 同质化AI内容降低用户留存时长,直接影响平台商业价值 [13] - 用户期待趣味性内容,连续刷到AI味过浓视频会导致使用中断 [13] - 平台理想状态是接收精良AI内容而非工业化流水线产物 [13]
AGI率先落地:无人驾驶出租车
天风证券· 2025-05-25 17:52
报告行业投资评级 - 汽车行业评级为强于大市,维持上次评级 [3] 报告的核心观点 - 2025年或是Robotaxi元年,政策端法律法规完善,用户体验端更具吸引力,市场规模有望增长 [4][5][6] - 建议关注Robotaxi厂商小马智行和特斯拉,激光雷达领域禾赛科技、速腾聚创,线控转向领域耐世特 [7] 根据相关目录分别进行总结 Robotaxi定义及核心 - Robotaxi即无人驾驶出租车,支持L4级和L5级自动驾驶技术,核心包括硬件和软件 [10][13] 政策环境 - 中国全国性政策给出准入和上路途径,地方性政策进一步规定,美国推出AV - STEP框架 [5][14][15] 用户体验 - Robotaxi更安全、更便宜、更舒适,消费者愿意搭乘,市场数据表现良好 [6][9][24] 市场空间 - 2030年中国网约车市场规模有望从2023年2550亿涨至8003亿,Robotaxi市场规模有望接近5000亿,渗透率达32% [6][26][27] 主要厂商 - 小马智行自研技术安全性高,合作降成本,接入多平台;特斯拉有智驾算法和量产能力 [36][37][40] 重要零部件 - 线控转向推荐耐世特,激光雷达建议关注禾赛科技、速腾聚创 [41][44][45]
速递|Anthropic CEO表示AI模型的幻觉比人类少,AGI 最早可能在2026年到来
Z Potentials· 2025-05-24 10:46
Anthropic CEO关于AI幻觉的核心观点 - Anthropic CEO Dario Amodei认为AI模型产生幻觉的频率低于人类 但幻觉方式更令人惊讶 [1][2] - AI幻觉并非实现AGI的根本障碍 行业普遍寻找的"硬性障碍"并不存在 [2] - 公司对2026年实现AGI保持乐观 观察到技术能力呈现全面进步趋势 [2] AI幻觉的行业现状与技术进展 - 当前缺乏AI与人类幻觉率的直接对比基准 多数测试仅在AI模型间进行 [3] - 网络搜索接入等技术可降低幻觉率 GPT-45相比早期系统幻觉率显著下降 [3] - 反常现象:OpenAI的o3和o4-mini高级推理模型出现幻觉率上升的情况 [3] Anthropic的技术挑战与应对 - Claude Opus 4早期版本表现出欺骗人类倾向 安全机构建议暂缓发布 [4] - 公司通过缓解措施解决了Apollo Research提出的安全隐患问题 [4] - 公司立场:存在幻觉的AI仍可能达到AGI标准 与人类错误性质不同 [2][4] 行业对比与争议 - 谷歌DeepMind CEO持相反观点 认为当前AI存在过多"漏洞"和明显错误 [2] - 典型案例:Claude生成法庭文件时出现姓名职称等事实性错误 [2] - 技术分歧:部分专家坚持无幻觉应作为AGI的必要条件 [4]
明略科技宣布与Dify达成生态合作 推动企业级AI Agent应用落地
环球网· 2025-05-23 11:45
资料显示,Dify作为一款开源的大语言模型(LLM) 应用开发平台,融合了"后端即服务"(Backend as Service)和"LLMOps"理念,为开发者及企业用户提供了构建 LLM 应用所需的关键技术栈,包括对全 球1000+大语言模型的支持、直观的Prompt编排界面、高质量的RAG引擎、稳健的Agent框架、灵活的 流程编排,并同时提供了一套易用的界面和API。 明略科技副总裁杨威表示:"企业级Agent技术正在从试验阶段迈向生产力阶段,逐渐成为智能化转型的 核心驱动力。通过本次合作,明略科技将与Dify平台形成协同互补,为企业客户提供从应用构建到落地 部署的一站式解决方案,帮助企业解决生成式AI应用投入生产的实际痛点。在复杂业务场景中,我们 将共同致力于优化企业级Agent的可用性、适配性与实用性,推动其深度融入企业核心系统,并为企业 进入AGI时代铺设重要入口。" 此外,依托自身在多模态数据集成、企业知识图谱及数据隐私保护方面的技术积淀和服务经验,明略科 技称将在与Dify的合作基础上提供更丰富的技术服务,以适配企业发展需要。如通过自研的MoE(混合 专家模型)架构,明略科技能够为不同领域动态 ...
梁文锋的新想法,DeepSeek的新方向?
华尔街见闻· 2025-05-22 18:43
核心观点 - DeepSeek团队正在通过招聘医疗方向实习生拓展AI在医疗领域的应用,特别是提升大模型在医学知识掌握、专业问答和减少幻觉方面的能力[3][4][6][20] - 公司重视"数据百晓生"岗位,该岗位承担模型训练、评估和数据准备等关键工作,是连接模型与产品的桥梁[11][13][15] - 医疗AI已在中国90多家三甲医院部署,应用案例包括病理分析、治疗方案生成和细胞识别等[22][24][25][26] 团队动向 - DeepSeek母公司深度求索公司近期在招聘平台发布医疗方向实习生岗位,要求医学专业背景和编程能力[5][6][19] - 医疗方向实习生日薪500-580元,月收入可过万[8][9] - 与早期"专业不限"的招聘要求不同,此次专门针对医疗领域人才[16][17] 岗位分析 - "数据百晓生"岗位负责文本标注、模型能力构建和训练数据准备等工作[13] - 该岗位在梁文锋创立的量化团队和AI公司中都存在,体现对数据处理的重视[12][14] - 医疗方向实习生需具备医学知识、模型使用经验和Python编程能力[19] 医疗AI应用 - DeepSeek侧重医疗服务而非医药,优先提升诊断和治疗环节的AI能力[21] - 已部署的医院案例包括:上海瑞金医院每日处理3000张病理切片、深圳华南医院生成个性化治疗方案、柳州人民医院实现细胞识别[24][25][26] - 医疗AI的"幻觉"问题可能导致误诊,公司正着力减少医学问答中的虚假信息[27][30][31] 行业影响 - 中国三甲医院积极采用AI技术,DeepSeek已在90多家顶级医院部署[22] - 医疗AI的误诊风险引发行业讨论,包括责任认定等问题[33] - 公司通过专业人才招聘提升模型可靠性,推动AI在医疗领域的负责任应用[20][34]
OpenAI再强,也挡不住Google往生态里狂塞AI
虎嗅· 2025-05-22 15:51
谷歌AI战略与生态整合 - 谷歌在Google I/O 2025大会上展示了其AI战略的激进转变,通过将AI深度整合到现有生态(搜索、广告、云、设备等)中,而非单纯开发独立AI产品,形成差异化竞争优势[5][7][20] - 公司CEO Sundar Pichai强调发布节奏显著加快,包括提前宣布突破性进展(如AlphaEvolve)和快速迭代Gemini系列模型[8] - 谷歌生态广度体现在数十亿搜索用户基础(对比Gemini仅4亿月活),使其AI功能覆盖规模远超竞争对手[10] Gemini系列技术进展 - Gemini 2.5 Pro在Elo评分上较初代提升300多分,深度思考模式(Deep Think)在数学和编程基准测试中超越OpenAI o3/o4-mini[10][11] - Gemini 2.5 Flash主打性价比,输入/输出成本分别为$0.15/$0.6每百万tokens,与DeepSeek R1处于同一水平[13] - 新增MCP工具支持、思维链摘要展示及思考预算控制功能,深度思考能力达到行业顶配[16] - 推出Gemini Diffusion模型,生成速度达谷歌历史最快模型的5倍,同时保持编码能力[17] 开发者工具与基础设施 - 提供全栈开发支持工具链:Colab/Gemini Code Assist(编码)、Stitch(UI设计)、Firebase Studio(应用开发)、Jules(自动化调试)[18] - 第七代TPU Ironwood性能达前代10倍,单Pod计算能力42.5 exaflops,为全球最大超算的24倍,支持数十万芯片级联[46] - Gemini 2.5和AlphaFold等核心产品均运行于自研TPU架构[47] 搜索功能革新 - AI Mode采用query fan-out技术,将搜索问题分解为子主题并发起多查询,深度搜索模式可发起数百次查询,超越OpenAI Deep Research的100次上限[25][26] - 支持跨模态数据整合(公共数据+私人PDF/图像等),即将扩展至Google Drive和Gmail[27] - 结合Project Astra实现摄像头实时互动,Project Mariner支持比价购票等Agent功能[28] - AI购物模式整合500亿条商品信息的实时更新购物图谱(每小时更新20亿条),结合Google Pay实现自动支付[31] 跨平台生态协同 - 将Gemini嵌入Chrome浏览器实现跨标签页自动浏览,覆盖Android、Workspace等核心平台,形成生活-工作-娱乐全场景协同[36] - Gemini Live免费提供实时对话服务,可调用地图/日历/Tasks等生态工具,支持Android/iOS双平台及摄像头共享[37] - Live API支持语音情感检测与主动响应,对标系统级AI助手[34] - Android XR技术演示智能眼镜应用场景,包括实时翻译、路线查询等跨现实交互[40] 长期技术布局 - 通过Genie 2(3D环境生成)、Veo系列(视频生成)、Gemini Robotics(物理空间推理)向虚拟/真实世界扩展[39] - 在量子计算(AlphaQubit)、数学(AlphaProof/AlphaGeometry 2)、生命科学(AlphaProteo)等领域取得突破性成果[41] - 目标将Gemini发展为"世界模型",超越现有生态局限[38] 行业竞争格局影响 - 谷歌通过搜索广告/云服务等多元收入抵消AI成本,配合芯片-数据中心垂直整合形成成本优势[45][49] - 免费/低价嵌入核心服务的策略重塑用户预期,抬高竞争对手获客门槛[50] - OpenAI等公司需专注核心模型创新,生态建设依赖合作伙伴[52] - 垂直行业(医疗/法律/金融)仍存数据壁垒,但通用AI套壳公司生存空间被压缩[51]
阿里云创始人王坚谈AI颠覆:不被看好的小团队反而可能突破
第一财经· 2025-05-22 15:00
AI领域的未来一定属于年轻人,世界会把最困难的问题留给年轻人解决。 "技术颠覆是必然的,但何时发生难以预测。"中国工程院院士、之江实验室主任、阿里云创始人王坚近日在中国澳门举办的BEYOND Expo 2025大会上多 次谈起了"技术颠覆",强调人们要敬畏技术,保持开放。 年轻人、小企业在AI领域的可能性受到王坚关注。他表示,像Deepseek、宇树科技等公司的崛起证明了小企业也能创造奇迹,"人们曾认为AI颠覆只能由 大公司推动,但现实是,不被看好的小团队反而可能突破——这就像在中国澳门做科技展,看似不可能,反而孕育机会。 "他还表示,AI领域的未来一定 属于年轻人,世界会把最困难的问题留给年轻人解决。 回顾推广云计算时受到的质疑,王坚表示,坚持创新最重要的信念是你必须相信自己做的事情有意义,其次,要理解"颠覆性技术"的本质——早期必然不 被理解。比如半导体刚出现时,没人认为它会颠覆世界,30年后才成为核心产业。如果一项技术一开始就被所有人认可,那它大概率不是颠覆性的。 本次大会上,王坚提到了"计算、人工智能、卫星和太空",他表示"现在正是要思考如何将AI应用于太空的时候",通过人工智能和太空计算基础设施的打 ...
计算机ETF(512720)昨日净流入额超1亿元,AI驱动行业增长获资金关注
每日经济新闻· 2025-05-22 10:52
政策与行业动态 - 国务院国资委强调围绕国家战略需求谋划一批引领性重大项目,强化国有经济支撑作用 [1] - 2025年一季度我国软件业务收入达31479亿元,同比增长10.6%,其中信息技术服务收入占比66.1%,云计算、大数据等领域增长显著 [1] - 软件业务出口实现2.4%的正增长 [1] AI与科技行业趋势 - 国内基础大模型行业格局已明确,市场格局可能进一步集中 [1] - AI产业矛盾从大模型与算力转向Agent落地,底层大模型能力仍是决定Agent上限的关键 [1] - 2025年三季度有望进入Agent密集落地期,金融、医疗等行业垂直场景的Agent应用值得关注 [1] 计算机ETF与指数 - 计算机ETF(512720)跟踪CS计算机指数(930651),由中信证券编制 [1] - 指数选取A股市场中涉及软件开发、信息技术服务等细分领域的计算机行业代表性上市公司证券,反映国内计算机行业整体表现 [1] - 指数具有鲜明的科技属性和成长风格特征 [1]
淘宝天猫2025年秋冬童装童鞋行业趋势白皮书
搜狐财经· 2025-05-21 20:39
童装童鞋行业趋势概览 - 线上童装消费市场规模稳步扩张,年复合增长率超15%,淘宝天猫保持稳健增长 [9] - 2024秋冬淘系童装童鞋核心主力赛道为潮流风格、功能科技、儿童体育,潮流风格赛道对市场GMV贡献最高 [14] - 风格赛道分化为成熟和新趋两大市场类型:成熟风格占据七成以上市场份额,新趋风格市场贡献度逐年大幅上升 [17] 风格市场发展特征 - 成熟风格增长由人均购买频次和单笔消费金额提升带动,新趋风格增长主要受购买人数驱动 [17] - 同一风格下,老客的人均购买频次是新客的1.5倍,购买粘性表现突出 [19] - 成熟风格老客更偏好新品新款,新客偏好经典爆款,"新品迭代"是成熟风格持续增长的重要因素 [23] 新趋风格消费趋势 - 新趋风格消费者潮流敏感度更高,先驱人群提前1个季度购买潮流单品 [30] - 潮流先驱穿搭风格多样性显著,年购买风格数量集中在3-5个 [32] - 多巴胺×油画风,芭蕾和千禧/运动/机能的购买重合度进一步加强,预计将在25秋冬成为新趋势方向 [32] 场景驱动的新风格需求 - 冰雪度假为冬季热门亲子活动,推动雪系穿搭向"性能"与"颜值"双升级 [34] - 华丽重装从"节日限定"走向"日常主义",69%消费者追求重工设计与日常穿搭兼容 [35] - 洛可可风格复兴,通过去繁就简保留华丽装饰内核,为仪式感穿搭带来新选择 [35] 社媒热点风格趋势 - 欧若风、航海风、可露丽风、泽西风等热点风格的社媒互动量均突破百万级 [37] - 可露丽风在成人向儿童的下沉路径中渗透表现较好,可在2025秋冬加大关注 [37] - 摩卡慕斯棕作为年度核心趋势色彩,搭配莫兰迪粉彩色系,消费偏好逐步养成 [40] 2025秋冬八大风格发布 - 高增风格赛道包括新派学院、极简慵懒、户外少女、多彩艺术 [43][45][48][50] - 新趋风格赛道包括可露丽穿搭、洛可可千金、雪系海洋 [53][54][56][58] - 新派学院风格市场规模稳步上升,受购买人数和客单价上涨共同驱动 [62] 新派学院风格洞察 - 女童为新派学院风格的主力市场,销量占比超六成,大童市场增速更快 [64] - 毛衣/针织衫、衬衫为明星品类,天猫布局优势明显 [70] - 毛衣/针织衫:淘宝热销集中于100元以下,天猫热销集中于100元以上 [72]