AKOOL Live Camera

搜索文档
AI产业跟踪:Google发布基于Gemma模型的变体,iOS19或将迎来12年最大更新
国泰海通证券· 2025-06-06 21:25
报告行业投资评级 未提及 报告的核心观点 未提及 根据相关目录分别进行总结 AI 行业动态 - 英伟达因美国出口管制在中国 AI 芯片市场份额从 95%暴跌至 50%,推出新款阉割版 Blackwell GPU,售价 6500 - 8000 美元,采用 GDDR7 内存技术,内存带宽约 1.7TB/秒 [4] - 阿联酋将成全球首个让全民免费使用 ChatGPT Plus 的国家,阿布扎比将建 Stargate UAE 高性能 AI 数据中心,支持 1 千兆瓦计算集群,初期目标 200 兆瓦容量,投资总额可能达 200 亿美元 [5] - Salesforce 以 80 亿美元收购云数据管理龙头 Informatica,整合双方 AI 引擎,完善其数据管理领域布局 [6] - SpAItial 获 1300 万美元种子轮融资,组建来自 Meta 和谷歌的豪华技术团队,专注文本生成逼真 3D 环境技术,目标创造可交互 3D 世界 [7] AI 应用资讯 - VAST 升级 Tripo Studio,推出智能部件分割、贴图魔法笔刷、智能低模生成和万物自动绑骨四大核心功能,非专业人士效率提升 10 倍以上 [8] - AI 科学家 Zochi 的论文被顶会 ACL 主会录用,其论文在 GPT - 3.5 上攻击成功率达 100%,GPT - 4 上达 97% [9] - Anthropic 推出 Claude 语音模式,用户可语音讨论文档和图片,可在文本与语音间自由切换,有使用限制 [10] - AKOOL 发布全球首款实时摄像头 AKOOL Live Camera,实现低延迟虚拟数字人等功能,标志 AI 视频进入“智能化响应”时代 [11] - 法国机构 Kyutai 推出模块化语音 AI 系统 Unmute,具备低延迟等功能,未来几周将完全开源 [12] - Google I/O 发布的 Veo3 视频生成模型实现流畅真实动画效果和同步音效,已达近电影级画质 [13] - OpenAI o3 模型在 Linux 内核 SMB 实现中发现远程 0 - day 漏洞,误报率约 1:4.5,标志着 LLM 在漏洞研究领域达实用水平 [14] AI 大模型资讯 - 自动驾驶大牛创立 Odyssey,推出世界模型实现视频实时生成,速度达 40 毫秒/帧,已获 2700 万美元融资 [15] - Google 发布三款基于 Gemma 的模型变体,分别面向医疗、手语和动物语言领域 [16] - Claude 4 采用可验证奖励强化学习范式,预计 2026 年将出现能独立完成实际工作的软件工程 Agent [17] 科技前沿 - 波士顿动力 Atlas 机器人升级,具备 3D 空间感知和实时物体追踪能力,可在汽车工厂执行复杂工业任务 [18] - 苹果将在 WWDC 2025 发布 iOS 19 等系统重大设计更新,代号“Solarium”,实现跨设备和操作系统视觉统一 [19] - 世界首个 AI 科学家团队 2.5 个月内发现治疗干性老年性黄斑变性新药 Ripasudil,将开源 Robin 系统 [20]
腾讯研究院AI速递 20250529
腾讯研究院· 2025-05-28 23:06
云计算与SaaS - Salesforce以80亿美元收购云数据管理龙头Informatica 为其自2021年收购Slack后最大交易 [1] - 此次收购将整合双方AI引擎 打造可信数据基础架构 支持代理式AI系统的企业级部署 [1] - 数据管理能力成为企业AI产品的关键差异化优势 Salesforce通过收购完善其数据管理领域布局 [1] AI模型升级 - DeepSeek R1模型完成小版本升级 编程能力有明显增强 能快速生成高质量的动态天气卡片 [2] - 此次更新可能采用DeepSeek-V3-0324模型 参数达685B 而R2版本仍未发布 [2] AI语音交互 - Anthropic推出Claude语音模式 支持五种音色选择 用户可通过语音讨论文档和图片 [3] - 功能支持文本与语音自由切换 对话结束后可查看文字记录和摘要 但语音对话计入常规使用上限 [3] AI视频技术 - AKOOL发布全球首款实时摄像头AKOOL Live Camera 实现虚拟数字人、多语言翻译等功能 94%盲测无法区分真假 [4] - 该产品通过4D面部映射、神经语音引擎等技术实现环境感知和情感响应 标志AI视频进入"智能化响应"时代 [4][5] - 腾讯混元开源语音数字人模型HunyuanVideo-Avatar 仅需一张图片和一段音频即可生成人物自然说话或唱歌的视频 [6] AI音频生成 - 字节跳动扣子空间推出一键文本生成播客功能 可在几分钟内完成原需数小时的工作 生成无机械感的"真人级"多角色对话音频 [7] - 功能应用场景广泛 可将热点新闻转为播客、课程笔记变为有声课等 实现多功能组合应用 [7] 3D生成技术 - SpAItial获1300万美元种子轮融资 专注文本生成逼真3D环境技术 团队来自Meta和谷歌 [8] - 公司瞄准游戏开发、娱乐产业和建筑可视化等场景 远期目标包括取代CAD软件 [8] AI阅读助手 - 腾讯元宝接入微信读书和起点读书 回答中出现的书名可点击直接跳转阅读 [9][10] - 用户可通过元宝一键获取书单推荐 实现从"囤书"到"读书"的无缝衔接 还能解读概念、生成思维导图 [10] 航天技术 - 星舰"九飞"使用B14 2二手助推器成功复用 但在回收着陆过程中爆炸 S35飞船未完成星链卫星模拟器部署任务 [11] - 本次测试重点验证助推器复用技术及优化减配设计 SpaceX正通过新建发射台和Gigabay总装车间扩充制造发射能力 [11] AI发展趋势 - Claude Opus 4显著提升时间跨度能力 可处理长期任务 强化学习在大语言模型训练中奏效 [12] - 预测两年内将出现"即插即用"AI白领员工 模型可解释性工作是对神经网络的逆向工程 [12]
一口农药一口酒
Datayes· 2025-05-28 18:46
无人物流车行业 - 中邮科技5月涨幅达128% [1] - 长江证券预测2025年头部无人物流车公司总交付量或达万辆级别,渗透率不足可替代市场1% [1] - 若无人车在末端配送市场渗透率达17%以上,市场规模有望超千亿元 [1] 黄金饰品创新 - 黄金企业开始与二次元IP联名推出"痛金"系列饰品 [2] 宏观政策展望 - 预计2025年逆回购可能存在1-2次降息,幅度20-30个基点 [3] - 2025年央行或再降准1次,幅度50个基点 [4] - 地产政策将致力于改善价格预期,关注地方因城施策放松、城中村改造货币化安置及地产收储政策优化 [4][5] 今日A股表现 - 三大指数集体调整:沪指跌0.02%,深成指跌0.26%,创业板指跌0.31% [5] - 全市场成交额10339亿元,较上日放量98亿元 [5] - 可控核聚变概念活跃,融发核电4连板 [5] - 无人物流车板块集体爆发,云内动力等多股涨停 [5] - 大消费概念领涨,非白酒酒类股涨幅居前 [5] 险资ETF配置 - 险资主要投向大盘、中盘和科创/创业板指数的宽基ETF [7] - 策略/主题ETF中红利股息、红利低波、国央企主题持仓规模较大 [7] - 行业ETF持仓最多为电子(97.76亿元)、非银(62.79亿元)、医药(40.43亿元)和电力(28.35亿元) [7][8] - 港股ETF中科技主题持仓规模最大 [7] EDA行业动态 - 西门子EDA部门或暂停对中国大陆支持 [10] - 全球三大EDA供应商中若西门子Mentor实施限制,Synopsys和Cadence可能同步行动 [10] - 华大九天市值652亿元,毛利率91.42% [11] 数字货币 - 全球持币上市公司从89家增至113家,共持有超80万枚比特币,市值约880亿美元 [12] 泛AI技术 - AKOOL发布全球首款实时摄像头AKOOL Live Camera,集成虚拟数字人、实时翻译、人脸替换和视频生成功能 [13] 主力资金动向 - 主力资金净流出151.26亿元,医药生物行业净流出规模最大 [16] - 机械设备(17.5亿元)、食品饮料(14.27亿元)、环保(13.76亿元)获主力净流入居前 [17] - 医药生物(-78.66亿元)、基础化工(-26.5亿元)、计算机(-23.75亿元)主力净流出居前 [17] 北向资金 - 北向资金总成交1039.73亿元 [18] - 比亚迪(15.68亿元)、宁德时代(16.42亿元)、五粮液(7.36亿元)成交额居前 [20][21] 行业估值 - 纺织服饰、环保、煤炭领涨 [27] - 基础化工、农林牧渔、国防军工领跌 [27] - 电力设备、基础化工、机械设备交易热度提升 [27] - 农林牧渔、非银金融、有色金属PE处于历史百分位低位 [27]