Workflow
微软Mu模型
icon
搜索文档
AI产业跟踪海外:海外特斯拉Robotaxi上线,MetaAI眼镜能拍3K视频
国泰海通证券· 2025-07-02 15:53
报告行业投资评级 未提及 报告的核心观点 报告对AI行业近期动态、应用、大模型、科技前沿等方面进行跟踪,展示行业新进展与创新成果,涵盖企业人才流动、融资、产品更新及技术突破等内容,反映AI行业的活跃发展态势 根据相关目录分别进行总结 AI行业动态 - Meta从OpenAI挖走四位华人学者,他们是OpenAI重要模型核心贡献者,专长于模型微调和多模态对齐,或助Meta弥补技术短板 [4] - AI创业公司Delphi获红杉领投1600万美元A轮融资,创建数字化身实现数字疗愈,提供多级订阅服务吸引用户 [5] - OpenAI前CTO创立的AI初创公司Thinking Machines Lab完成20亿美元种子轮融资,估值达100亿美元,业务方向未公开 [6] AI应用资讯 - Anthropic的Claude聊天机器人新增功能,允许用户对话构建AI应用,无需编程知识,功能在所有订阅层级开放 [7] - 谷歌推出开源免费的Gemini CLI,支持终端访问Gemini,功能全面,采用Apache 2.0开源协议,引发开发者社区热议 [8] - 谷歌DeepMind发布AI工具AlphaGenome,能精准预测基因突变影响,填补DNA非编码区域解读空白,推动生物学发展 [9] - 谷歌Gemini Robotics On - Device是首个能在机器人本地运行的视觉 - 语言 - 动作模型,适用于延迟敏感型应用 [10] - 谷歌将Imagen 4和Imagen 4 Ultra文生图模型上线AI Studio和API,生成速度接近实时,未来AI Studio将更新 [11] - ODDY工作室创作的《名作艺术秀》将经典艺术元素以时装秀形式呈现,引发观众情感共鸣 [12] - 斯坦福等机构联合开发通用生物医学AI智能体Biomni,能自主执行跨领域研究任务,已上线免费使用 [13] - 谷歌Gemini推出七段纸艺ASMR解压视频,采用纸质艺术形式,有助放松情绪 [14] - ElevenLabs发布11ai语音助手,主打语音优先设计和多通道处理,集成多种工具,中文能力待提升 [15] - 谷歌真AR眼镜原型曝光,代号"Martha",基于Android XR平台设计,配备相关硬件和功能 [16] - 特斯拉Robotaxi服务在德州奥斯汀启动,仅向受邀用户开放,存在需远程操作介入等问题,马斯克计划扩大规模 [17] - Deezer将对AI生成曲目专辑进行标注,拦截大量AI生成音乐,为检测技术申请两项专利 [18][19] - 多所大学研究者开发出“虚拟社区”,智能体可在开放世界场景交互,在“竞选”任务中展示社交说服能力 [20] - Meta与欧克利合作推出Oakley Meta HSTN智能眼镜,能拍3K视频,具备防水性能和长续航,销量已超200万副 [21] AI大模型资讯 - 微软发布Mu模型,仅3.3亿参数,性能比肩参数量大10倍的Phi - 3.5 - mini,支持Windows智能体功能 [22] - Sakana AI提出“强化学习教师”(RLT)新范式,降低训练成本,缩短训练速度,为构建高效推理模型开辟新路径 [23] 科技前沿 - CMU等团队开发MPK编译器,可将LLM自动编译为优化巨型内核,降低推理延迟,仅需几十行Python代码实现 [24] - Netflix宣布在Netflix House推出沉浸式VR体验,由Sandbox VR提供技术支持,新合作项目已上线 [25] - 微软发布4D拓扑量子纠错码,降低量子比特错误率,减少所需物理量子比特数量,已应用于Azure Quantum平台 [26]
腾讯研究院AI速递 20250625
腾讯研究院· 2025-06-24 23:13
谷歌ASMR纸艺视频 - 谷歌Gemini推出七段纸艺ASMR解压视频,内容涵盖火烈鸟水中起舞、圣托里尼落日等场景,采用高精准提示词生成和定格动画技术 [1] - 视频通过纸质艺术形式结合恰当背景音呈现梦幻效果,研究显示此类内容因帮助放松情绪而广泛传播 [1] - ASMR被视为从生产力工具转向美学与治愈的另类方式 [1] ElevenLabs语音助手11ai - ElevenLabs发布11ai语音助手,主打语音优先设计和多通道处理,支持日程管理、任务安排和信息查询 [2] - 集成Perplexity搜索并与Notion、Linear等工具对接,探索对话式AI在工作流程中的实际应用 [2] - 技术覆盖32种语言,已应用于有声书、游戏配音及医疗训练领域,中文能力待提升 [2] 微软Mu模型 - 微软Mu模型仅3 3亿参数,性能媲美参数量大10倍的Phi-3 5-mini,NPU设备上每秒响应超100 tokens [3] - 采用双重层归一化、旋转位置嵌入和分组查询注意力三大创新,优化Transformer架构效率 [3] - 支持Windows智能体功能,可将自然语言指令实时转化为系统操作,响应时间低于500毫秒 [3] 商汤科技任务规划助手 - 商汤科技推出办公小浣熊"任务规划助手",通过交互式AI将复杂问题拆解为可执行步骤 [4][5] - 工具通过持续对话挖掘需求细节,思维链条可追溯,适用于职业规划、投资分析等领域 [5] - 最终生成逻辑严密的图文规划报告,实测在学业选择等场景表现突出 [5] QQ浏览器AI高考通 - QQ浏览器"AI高考通"可在3-5分钟内生成高考志愿报告,包含院校解读、风险提示等六大板块 [6] - 提供个性化"冲稳保"院校专业清单,含分数线、学费等数据,支持多方案对比 [6] 码上飞AI Agent平台 - "码上飞"平台支持通过自然语言直接生成鸿蒙应用,采用多智能体系统实现全流程自动化开发 [7] - 用户仅需5分钟即可生成完整应用,支持一键发布为小程序、APP或网站并获取源代码 [7] 谷歌AR眼镜Martha - 谷歌AR眼镜开发者版本代号"Martha",基于Android XR平台,配备棱镜显示屏和内置相机 [8] - 配套应用界面类似Pixel Watch,含通知、视图记录等功能,明显针对测试人员设计 [8] 充电宝召回事件 - 安克创新和罗马仕共召回120万个充电宝,因电芯供应商安普瑞斯未经批准变更隔膜材料 [10] - 锂电池隔膜是关键安全组件,安普瑞斯因扩产导致制程管理问题,相关认证已被暂停 [10] 马斯克创业观点 - 马斯克强调第一性原理思维,主张从公理推演而非传统分析,以"效用乘以受益人数"衡量价值 [11] - 预测数字超级智能即将实现,成为多行星物种将显著延长人类文明寿命 [11] AI Native产品理念 - AI Native核心是构建AI与人的新关系,需考虑情商和生命感,而非单纯工具化 [12] - 实现需宽输入(环境感知)和柔输出(分步协同),创业者需同时服务用户与AI [12]