星流Agent
搜索文档
一个月50多家公司被投资,这个赛道已经火了丨投中嘉川
投中网· 2026-02-09 11:16
文章核心观点 - AI投资的重心正从大模型转向应用层 自2022年ChatGPT发布以来 行业拐点渐行渐近 不同背景的资金正密集下注AI应用公司 [6][7][13] AI应用投资趋势升温 - 2025年AI应用投资迎来首个高峰 全年有577家公司完成融资 融资事件达658笔 [7][22] - 2026年1月热度延续 单月已有超过52家AI应用公司获得投资 [7][26] - 自2022年起至2026年1月 全国新成立了788家AI应用公司 其中近六成(约473家)集中在北京、上海、深圳、杭州四城 [7][30] - 新成立公司数量逐年攀升:2022年为91家 2023年受ChatGPT催化增至239家(同比增长2.6倍) 2024年与2025年均保持在220家以上 [19] 多元投资方密集出手 - **顶级VC**:高瓴创投近期连续投资至少4家AI应用公司 包括AI教育公司ThetaWave AI(已获数百万美元天使轮)、多模态操作系统Clipto.AI、AI用户研究平台Trooly.AI及AI代码修复ZAST.AI [6][9][10] - **科技新贵/个人投资者**:小米联合创始人王川投资AI视频公司“一生智能”与AI播客生成公司“火星电波”(其产品ListenHub已获红杉中国天使轮) [6][12] - **产业资本**:字节跳动与奇瑞汽车旗下瑞丞资本投资前斑马智行高管吴小航创立的弋途科技(AI原生车载操作系统) [6][13] - **国资/地方资本**:深创投与南山战新投领投AI玩具厂商上海喜梨数千万元的Pre-A轮及Pre-A+轮融资 [6][13] 代表性融资案例 - **2025年大额融资**:多家公司融资额在2亿至10亿元人民币之间 [22] - **奇点星宇(LiblibAI)**:完成1.3亿美元(约合9.1亿元人民币)B轮融资 投资方包括红杉中国、源码资本等 创始人陈冕曾任字节跳动剪映商业化负责人 [23][24] - **思必驰**:完成5亿元人民币战略融资 这家成立于2007年的AI语音技术公司正筹备IPO [23][25] - **其他案例**:认知边界(4.56亿元)、博拉新媒体(3亿元)、中数睿智(2亿元)、跃然创新(2亿元)、明心数智(2亿元)、悠络客(2亿元)等 [23] - **2026年1月部分新融资**:[26][27] - **心识宇宙**:获2000万美元Pre-A轮融资 投资方为蚂蚁集团、红杉中国 - **自然选择**:获3000万美元A轮融资 投资方包括阿里战投部、启明创投等 - **深度赋智**:获2.2亿元人民币A+轮融资 投资方包括凯辉基金、锦秋基金 - **宇泛智能**:获5.13亿元人民币Pre-IPO融资 - **爱诗科技**:获1420万美元战略融资 地域分布与产业格局 - **北京(146家)**:核心在海淀区(84家 占全市58%) 是AI思想与基础能力发源地 聚集了智谱AI、月之暗面等公司 2024年底设立100亿元人工智能产业投资基金 [33][36] - **上海(124家)**:核心在浦东新区(57家) 徐汇区聚集商汤、MiniMax等大模型公司 浦东政策目标为到2027年集聚800家AI垂类应用企业 [33][36] - **深圳(96家)**:核心在南山区(63家) 依托腾讯、华为等链主企业 形成AI+硬件/终端场景优势 当地已有上千家人工智能规上企业 [34][36] - **杭州(84家)**:分布相对均衡 余杭区最多(26家) 延续互联网时代的产品化与创业传统 [35][36] - **资金端活跃**:2025年及2026年1月 北京、上海、深圳、杭州四地分别有27、42、36、45支相关基金完成备案 其中包括百亿级产业基金 [36]
消灭产品经理后,Lovart活成了Manus的“影子”
36氪· 2026-01-16 20:47
文章核心观点 - 生成式AI行业正从“昂贵玩具”向“可靠生产力工具”的临界点转变,应用层公司Lovart的意外走红是观察此转折的样本[2] - Lovart试图通过接管复杂“工作流”和构建“创意操作系统”来建立独立于底层模型巨头的核心竞争力,但其“专家逻辑”产品策略在赢得专业用户尊重的同时,也可能为大众市场增长设置了天花板[3][7][9][10] - 应用层创业公司在技术变革早期能通过定位锋利的好工具快速获得商业回报,但其长期价值面临底层模型进化、巨头下场以及跨市场扩张等多重挑战[12][18][22] 公司发展历程与现状 - 公司曾陷入极度困境,账上现金仅剩4000元,核心产品遭遇无预警下架[1] - 2025年5月产品发布后迎来转机,推特出现近5000条讨论,官方视频播放量近百万,24小时内等待名单申请人数超过2万[2] - 公司日活跃用户数稳定在5万至20万区间并保持增长,预测年度经常性收入达到3000万美元,其中美国市场贡献了三分之一的用户与收入[7][12] 产品策略与市场定位 - 产品不再满足于单点“内容生成”,而是试图接管复杂的“工作流”,标志着从“单点工具”向“系统化标准作业程序”的进化[3][20] - 公司取消了产品经理职位,认为产品壁垒正从“交互体验”转向“垂直行业知识”的密度,让懂行业的专家主导产品[4][6] - 产品呈现出极客式精致,具备复杂的画布和专业功能,更像为设计师定制的自动化工具,而非面向大众的消费级产品,在追求极致效率的同时牺牲了部分易用性[7][8] - 公司通过构建基于多模态思维链的“创意推理引擎”实现“编排”,将生成式AI的随机性“黑盒抽卡”驯化为稳定、可预期的工业级流程[19] 行业竞争与生态位 - 公司受益于先行者Manus支付的市场教育成本,在风口确认后迅速推出成熟产品,展现了极致的执行力[11] - 在底层模型战争演变为巨头游戏的背景下,具备现金流与数据的应用层公司成为风险投资资金溢出的“避险”选择[12] - 公司目前在Adobe与Midjourney之间占据了一个微妙的生态位,依靠将AI能力无缝嵌入标准作业程序的体验红利[20][24] - 应用层公司面临的紧迫感在于,其建立在API调用上的“编排价值”可能被不断进化的基础模型能力所稀释,例如Anthropic发布的Claude Cowork仅用一周半开发完成[22] 市场扩张挑战 - 公司尝试将海外成功模式“出口转内销”,推出国内版“星流Agent”,但市场表现不佳,在APP Store图形与设计分类仅排名第45位[13] - 海外市场与国内市场存在深层势能差,海外是付费习惯、开放生态与工具价值的复合体,而国内则意味着价格内卷、薄弱付费意愿和巨头生态封锁[17] - 公司在海外习得的“精英工具”打法,在国内大众市场显得曲高和寡[18] 未来挑战与战略方向 - 公司需要完成从“生成驱动”向“交付驱动”的关键跨越,在格式兼容、团队协作等交付闭环上面临挑战,这些是传统软件巨头的腹地[22] - 为避免被上游模型厂商“顺手整合”,公司需要向技术深处下潜,介入LoRA模型、渲染引擎以及私有化数据闭环的自研[24] - 留给应用层公司的时间窗口取决于资本耐心、技术迭代周期以及巨头从观望到下场的节奏[18]
90后字节高管,自立门户募资9亿
搜狐财经· 2025-10-26 07:46
融资信息 - 公司完成1.3亿美元B轮融资,约合人民币超9亿元,由红杉中国、CMC资本等领投,顺为资本、源码资本等追投,是国内AI应用领域规模居前的一笔募资[2] 公司团队 - 创始人为90后创业者陈冕,产品经理出身,曾任职于摩拜单车、360、每日优鲜、字节等公司,28岁晋升至字节最年轻的产品4-1职级[4][5][6][7] - 团队后续重点将放在视频生态和特效能力上,尤其向影视级生成能力迈进[4] 创业历程 - 创始人于2023年初辞职创业,当年7月拿到天使轮融资,选择从工具入手,因新技术革命初期工具端变革最快[8][9] - 公司避开基础模型战场,聚焦AI内容创作与分享,研发多模态生成工具,通过发放补贴快速抢占市场[10] - 上线仅4个月时因未完成大模型备案被下架,前期补贴大战消耗300多万美元,2024年初公司账上只剩4000元,经历低谷后通过收缩队伍和融资挺过难关[11][18] 商业模式与生态 - 公司核心竞争力在于"工具集成+社区生态",通过深度服务模型作者和普通创作者建立早期生态[10][22] - 全球用户已超2500万,成为中国最大的多模态模型与创作社区,在中国每三位设计师就有一位使用过该平台[24] - 平台收录数万款模型,累计生成超5亿张图片,拥有2000万创作者,用户可训练专属模型以节约时间[24][28] - 平台商业化收入稳定增长,已形成健康的内容生产与消费循环,9月收益排名前四的创作者当月累计收益均在2万元以上[35] 产品发展 - 公司推出全球首个设计Agent产品Lovart,Beta版本上线5天吸引超10万人排队体验[31] - 10月中旬发布2.0版本,从模型、工具聚合地进阶为"AI专业创作工作室",提供一站式体验[37] - 产品迭代围绕设计师工作流和需求进行,聚焦降低创作门槛、提高效率,集成所有模型让AI成为创作伙伴[33][35]
单笔融资额超越Manus,这家AI公司瞄向全球化
第一财经· 2025-10-23 15:58
公司融资与估值 - 公司于10月23日完成1.3亿美元B轮融资,为今年国内AI应用赛道最大单笔融资,超过Manus在4月完成的7500万美元融资 [3] - 本轮融资由红杉中国、CMC资本及一战略投资方联合领投,老股东顺为资本、源码资本、明势创投、渶策资本超额增持,远识资本担任独家财务顾问 [3] - 融资将用于加速全球化布局,以接触更多付费群体并应对更广泛的竞争 [3] 公司业务与产品 - 公司主体北京奇点星宇科技有限公司成立于2023年5月,旗下产品包括AI图像生成平台LiblibAI、设计Agent Lovart及本土化产品星流Agent [3] - 核心产品LiblibAI日活跃用户达400万,总用户数约2500万,但目前仍处于亏损投入状态 [3] - 10月公司发布LiblibAI 2.0,定位为模型工具聚合平台及AI专业创作工作室,集成图像与视频生成功能,兼容开源与闭源模型 [4] - 平台整合了Qwen Image、F.1、Kontext、Seedream4、MidjourneyV7等图像模型,以及Kling、Hailuo、Vidu、WAN等视频模型,并拥有全球最大图片风格开源模型库 [4] 用户与市场数据 - 据SimilarWeb数据,公司产品LiblibAI在9月访问量为273万,环比下滑0.63% [5][8] - 竞争对手字节跳动旗下即梦AI在9月访问量为944.6万,环比上涨27.25% [5][8] - 公司旗下产品Lovart日活跃用户约20万,年化预估收入约3000万美元,访问量自5月12日开始爆发,并在7月22日出现激增,9月维持上涨趋势 [8][9] - Lovart的增长得益于字节跳动与谷歌发布新模型带动图片类网站访问量上涨,以及官方补贴活动(如充365天会员可免费使用Nano Banana与Seedream 4.0) [8][9] 行业竞争与战略 - 公司与字节跳动即梦AI处于同一赛道但策略不同:公司侧重“模型超市+专业工作流”,即梦AI侧重“自研模型+一键消费级体验” [5][8] - 字节跳动为即梦AI提供了算力与社交平台资源支持,形成竞争优势 [5][8] - 公司创始人认为巨头平台实力强劲且边界模糊,资本正以史无前例的速度聚集,创业公司需要快速成长以应对冲击 [5][9] - 公司通过模型聚合模式获得头部模型技术支持,并孵化了超过2000万AI创作者,但也面临成本压力 [4] 行业趋势与展望 - 公司创始人判断,面向生产者(To P)的创业窗口期已接近关闭 [8][9] - 预计Agent所需的token成本将逐渐降低,订阅制将成为基础商业模式 [8][9] - 明年或将成为消费类AI To C 应用元年 [1][8][9]
Manus们在“出走”,怎么还有AI产品逆向回国?
36氪· 2025-07-18 17:22
AI创业生态趋势 - AI产品创业生态呈现两极分化趋势 出海团队衣锦还乡与新人寻觅新天地并存 [2] - 10个Agent创业中有9个初始开发英文版本面向全球 注册地多为新加坡或美国加利福尼亚 [3] - 华人创业者推出的AI Agent开始引起硅谷关注 包括OpenAI等巨头 [2] 公司动态与产品策略 - Manus创始人被指"跑路"新加坡 国内社交媒体清空 中文版产品停用 [1] - 爱诗科技海外产品PixVerse积累6000万用户 月活1600万 国内版"拍我 AI"功能类似海外版中翻 [5] - Lovart海外版集成GPT-Image-1等顶流模型 国内版星流Agent调用Flux1并优化中文语义理解 [5] - Manus海外版调用Claude模型 国内曾与阿里通义千问合作但现公告已无法查看 [6] 市场拓展与竞争格局 - 爱诗科技联创表示中国是重要市场 早期因团队规模受限未进入 现为拓展良机 [8] - 国内用户付费意愿接近海外 毒液变身特效吸引小几百万人使用 闲鱼出现代做服务 [9] - 字节内部有4个团队对标Manus 大厂在人力物力上具有明显优势 [11] - OpenAI等巨头在视频图像垂类领域深入竞争 初创企业面临严峻挑战 [11] 商业模式与成本压力 - Manus单任务成本约2美元 与B站用户日均90分钟观看的年度服务器成本相当 [14] - 视频生成功能成本从10美分到75美分/秒不等 用户试用可能造成大量现金消耗 [14] - 大模型公司处于产业链顶层 AI产品交付效果受模型供应商显著影响 [13] 技术挑战与用户体验 - AI产品需面对用户对交付效果的质疑 AI幻觉等问题持续存在 [16] - 产品使用体验存在"抽卡式"不稳定问题 消耗用户热情 [18] - 创业者将AI产品定位为"会写代码的实习生" 尚未达到AGI水平 [16] 行业前景与机遇 - 初创企业在中东等地区存在机会 可通过本地化适配避开巨头竞争 [13] - 类似Kimi和DeepSeek的案例显示 AI创业是长期竞赛 机会始终存在 [18]
吃到Manus红利,这款出海设计Agent让两万人排队申请|涌现NewThings
36氪· 2025-07-08 17:37
产品表现 - Lovart上线当天申请排队人数达2万 邀请码被炒至500元/个 获得马斯克等科技大V点赞[1] - 星流Agent是Manus发布后首个本土化适配的Agent应用 但性能体验存在阉割[1][2] - Lovart在文字理解能力上优于星流Agent 能更准确生成代码和TikTok元素[3][5][7] - 两款产品在国风元素理解上差距不大 但均存在文字渲染错误问题[8][11][13] - 视频生成和图片编辑功能表现接近 星流Agent具备更丰富的社区灵感功能[15][17][18] 技术架构 - Lovart接入GPT image-1等海外顶级多模态模型 文本渲染能力突出[7] - 星流Agent主要调用Flux 1模型 文本渲染能力较弱但一致性表现优秀[7] - 两款产品均整合Kling 2 1和Hailuo 02等视频/3D模型 支持动画生成[15] 市场策略 - 公司采用"验证产品+空白市场"打法 LiblibAI对标Civitai Lovart复制Manus模式[19][20] - Lovart团队3周完成研发 通过邀请码营销快速建立10万Discord用户[20] - 星流Agent旨在承接Lovart流量 其50%用户来自中国[21] 行业竞争 - 公司是国内融资最高的AI图像创业公司 拥有2000万创作者[1] - 星流AI月访问量从100万降至50万 字节即梦AI保持5 92%增长至675万[21] - 设计Agent目前主要满足普通用户需求 专业场景适配度不足[19]
【产业互联网周报】华为盘古大模型被质疑抄袭;AI人才争夺加剧,DeepSeek在海外大举招聘人才;微软被曝将“AI使用量”纳入员工考核,直接挂钩绩效;设...
钛媒体APP· 2025-07-08 11:37
华为盘古模型争议 - 华为开源盘古7B稠密和72B混合专家模型 但被质疑抄袭阿里云通义千问Qwen-2 5 14B模型 注意力参数分布相似性高达0 927 [2] - 华为声明盘古Pro MoE基于昇腾硬件平台开发 部分代码参考业界开源实践 严格遵循开源许可证 [2] - 自称华为员工发文揭露内部团队通过套壳续训阿里千问 Deepseek等竞品模型伪造技术突破 [2][3] 腾讯微信AI搜索争议 - 微信AI搜索功能被指强行开盒 点击推文中蓝色人名链接可浏览AI生成的个人简历及关联推文 [5] - 腾讯回应称AI搜索仅整合公众号及互联网公开信息 不使用用户隐私数据 [5] 百度搜索改版 - 百度搜索框支持超千字长文本输入 集成AI写作 AI画图等功能 为十年来最大改版 [6] 全球AI人才动态 - 全球AI领域Top100人才榜单中华人占主力席位 包括何恺明 张祥雨等就职于国内外企业的研究者 [7] - Meta成立超级智能实验室 引入6名OpenAI前华人员工及Scale AI前CEO等11位行业重量级人物 [28] 大模型开源与进展 - 百度开源文心大模型4 5系列 含47B 3B MoE模型等10款 预训练权重和推理代码完全开放 [15] - 智谱AI开源通用视觉推理模型GLM-4 1V-Thinking 9B参数多模态模型在18项任务中持平GPT-4o等 [10] - 马斯克旗下xAI意外曝光Grok 4模型 定位为旗舰级万能模型 同期完成100亿美元融资 [20][32] 企业级AI应用 - 钉钉多维表新增100+电商行业AI模板 支持AI生成图片 解析文件等功能 产品全面免费 [16] - 微软将AI工具使用量纳入员工考核 GitHub Copilot生成代码比例等成KPI指标 [26][30] - 苹果考虑弃用自研AI模型 转向Anthropic或OpenAI技术为Siri提供支持 [27] 机器人及硬件进展 - 字节跳动两年半量产超千台轮式物流机器人 团队从50人扩至150人 长期目标具身智能 [10] - 宇树科技完成C轮7亿元融资 投后估值120亿元 资金用于加速IPO及技术研发 [35][36] 半导体与EDA动态 - 美国取消对华EDA出口限制 西门子 新思科技 楷登电子恢复中国客户软件访问权限 [17][18] - 国产GPU公司曦望Sunrise融资10亿元 产品线含兼容CUDA生态的S2大模型推理芯片 [38] - 摩尔线程 沐曦科创板IPO获受理 拟分别募资80亿元和39 04亿元 [39] 融资与上市 - Figma提交纽交所IPO申请 2024年营收7 49亿美元 同比增长48% 亏损7 3亿美元 [31] - 云知声港交所上市 募资3 2亿港元 资金用于研发及国际市场拓展 [37] - 智谱AI获上海国资10亿元战略投资 三方合作建设AI新型基础设施 [34] 政策与行业趋势 - 前5个月中国软件业务收入55788亿元 同比增长11 2% 出口227 1亿美元增3 3% [41] - 工信部印发网络安全专项行动方案 目标为800家工业企业开展贯标达标试点 [42] - 北京发布AI+医药健康计划 探索类脑智能 DNA存储等技术在医药领域应用 [43] 海外AI动态 - 谷歌全球开放Veo3 AI视频生成模型 集成音频生成能力 质量与可控性显著提升 [21] - CoreWeave首发英伟达GB300 NVL72服务器 单机架AI性能超百亿亿次浮点运算 [22] - 欧洲44家企业联名呼吁欧盟暂停AI法案 称模糊规则阻碍创新与国际竞争 [29]
DeepSeek给王一博道歉被当真,年度AI幻觉/马斯克Grok 4跑分曝光/华为盘古团队回应模型争议|Hunt Good周报
搜狐财经· 2025-07-06 11:35
Grok-4模型性能曝光 - Grok-4在HLE评估中基础得分35%,开启推理功能后提升至45%,显著领先OpenAI o3和Google Gemini系列[1] - 在GPQA测试中得分达87%-88%,代码能力评测SWE Bench得分72%-75%[2] - 新版本支持多模态输入、130k token上下文、结构化输出、数学推理和函数调用等功能[3] - Grok 4 Code将深度集成在Cursor编辑器,具备智能补全、调试和执行功能[3] 华为盘古模型开源争议 - 华为开源盘古7B稠密模型及72B混合专家模型,被质疑与阿里云通义千问Qwen-2.5 14B高度相似[4] - 华为声明盘古Pro MoE模型基于昇腾硬件平台独立开发,采用创新MoGE架构解决分布式训练负载均衡难题[5] - 承认部分基础组件代码参考业界开源实践,但严格遵循开源许可证要求[5] Cluely公司ARR快速增长 - AI面试辅助工具Cluely企业版推出后ARR一周内翻番至700万美元[7] - 产品实时分析用户在线对话生成隐蔽提示,应用于销售、客服和远程教学等场景[7] - 面临免费开源竞品Glass的挑战,增长持续性存疑[9] 特斯拉Optimus项目调整 - 暂停人形机器人零部件采购进行设计调整,预计耗时2个月[10] - 硬件存在关节电机过热、灵巧手负载低等问题,软件计划增加合成数据训练[12] - 原计划年产5000台目标恐难达成,目前仅完成约1000台[13] 百度搜索重大升级 - 搜索框升级为"智能框",支持超1000字文本输入和多模态交互[16] - 集成文心大模型和视频生成技术,可快速生成电影级短视频[17] AI基础设施投资热潮 - Amazon新建1200英亩数据中心与Anthropic合作,目标训练全球最大AI系统[21] - Oracle通过去中心化策略建立高效AI云基础设施[21] - 行业预计新建数据中心总投资超3200亿美元,年耗电量相当于百万家庭需求[23] Meta成立超级智能实验室 - 整合FAIR、大语言模型开发和AI产品团队,由Scale AI前CEO Alexandr Wang领导[24] - 吸引多位来自OpenAI、DeepMind和Anthropic的核心人才加入[26] - 计划未来几年投入数千亿美元发展AI基础设施和模型研发[26] 开源模型进展 - 百度文心4.5系列开源10款模型,包含47B和3B MoE模型及0.3B稠密模型[30] - 苹果开源DiffuCoder-7B-cpGRPO代码生成模型,EvalPlus基准性能提升4.4%[36] - B站开源AniSora V3动画视频生成模型,支持多种风格一键生成[34]
雷军称松果芯片是心中的痛;Grok 4意外提前曝光;董明珠15年来首次落榜《财富》中国商界女性榜
观察者网· 2025-07-04 09:11
美国政府取消对华芯片软件出口限制 - 美国商务部撤销对三大芯片设计软件供应商(新思科技、楷登电子、西门子)在华业务需申请政府许可的规定 [1] - 西门子已全面恢复中国客户对其软件和技术的访问权限,新思科技与楷登电子正逐步重启服务 [1] 美国总统拟带企业团访华 - 商务部回应称中方态度一贯明确,希望美方与中方相向而行,推动中美经贸关系健康稳定发展 [1] Grok 4意外提前曝光 - Grok 4被定位为"最新、最强大的旗舰模型",在自然语言、数学和推理方面提供无与伦比的性能 [2] - 目前支持文本模态,视觉、图像生成等功能即将推出,包含函数调用、结构化输出和深度思考功能 [2] - 马斯克计划利用Grok 4重写人类知识库,补充缺失内容并纠正错误知识 [2] 新闻出版业受AI搜索冲击 - 谷歌AI概览功能推出后,新闻搜索未转化为网站点击量的比例从56%上升至69% [3] - 新闻网站自然流量从2024年中期的23亿次峰值降至17亿次,ChatGPT新闻相关提示词增长212% [3] LiblibAI推出"星流Agent" - 定位为面向中文创作者的智能设计拍档,支持自然语言生成整套设计物料 [4] - 已接入十余个主流大模型,支持图像、视频、声音、3D一站式生成与导出 [4] OpenAI与Robinhood代币事件 - OpenAI声明与Robinhood推出的"OpenAI代币"无关,未批准任何股权转让 [4] 国家药监局支持脑机接口医疗器械 - 对高端医疗器械实施创新特别审查,优化审查工作并加强技术指导 [5] - 配合相关部门出台基于脑机接口技术的医疗器械产品支持政策 [5] 小米自研芯片与商标动态 - 雷军称松果芯片是"心中的痛",玄戒O1为第二次自研芯片尝试 [5] - 小米近期申请多枚"REDMI"商标,涉及医药、材料加工等分类 [6] 永太科技起诉天赐材料 - 因名誉权纠纷向法院提起诉讼,涉案金额合计5752万元 [6] 董明珠落榜《财富》商界女性榜 - 立讯精密董事长王来春连续三年位居榜首,董明珠15年来首次落榜 [6] - 榜单特点包括"果链"企业女性创始人和AI领域创业者占比提升 [6] 暑假未成年人游戏限玩 - 腾讯与网易规定暑假期间未成年玩家游戏时长不超过27小时 [7]
腾讯研究院AI速递 20250704
腾讯研究院· 2025-07-03 23:31
一、AI游戏引擎Mirage - 谷歌、英伟达等八大机构联合发布全球首款AI原生UGC游戏引擎Mirage,支持通过自然语言指令实时生成游戏内容 [1] - Mirage突破传统游戏局限,支持16FPS流畅体验和5-10分钟连续游玩,画面质量直逼GTA和极限竞速 [1] - 核心技术基于Transformer和扩散模型打造的"世界模型",通过大量游戏数据训练实现动态交互与实时控制 [1] 二、OmniGen2图像生成模型 - 智源研究院发布OmniGen2统一图像生成模型,采用分离式架构与双编码器策略,支持文生图、图像编辑和主题驱动图像生成 [2] - 模型创新性引入图像生成反思机制,显著提升上下文理解能力、指令遵循能力和图像生成质量 [2] - OmniGen2已开放科研体验版,模型权重、训练代码及训练数据全面开源,GitHub星标一周内突破2000 [2] 三、Gemini for Education - 谷歌将Gemini为首的AI工具套件免费提供给全球教育工作者,深度集成到Google Classroom和ChromeOS中 [3] - Gemini in Classroom包含30多个AI工具,可自动生成教案、课堂活动和测验题,节省教师备课时间 [3] - 推出NotebookLM和Gems等教师主导的AI工具,以及全新数据分析功能,实现个性化学习体验和数据驱动教学 [3] 四、星流Agent创作平台 - 星流Agent是一个多功能AI创作平台,可通过自然语言指令一键完成批量表情包、品牌VI设计、视频生成、3D建模等多种创意任务 [4] - 核心功能包括批量高质量内容生成、Kontext智能图像编辑功能和全媒体工作流支持,实现"Vibe designing"设计新范式 [5] - 平台提供免费体验额度和积分,支持多样化创意输出,将设计师角色从"掌握技术"转向"理解需求与表达创意" [5] 五、腾讯元宝新功能 - 腾讯元宝新增一句话搜索功能,能智能匹配图片和视频号内容,支持全部模型使用 [6] - 回答结果可智能引用视频号相关教程,实现文字与视频配合讲解的形式,并支持一键跳转视频号观看 [6] - 用户可在获取初始回答后继续追问,此前5月份元宝已打通微信读书和起点读书,实现搜索直接跳转阅读功能 [6] 六、Blender Fusion框架 - 谢赛宁团队发布Blender Fusion框架,实现通过方向键或滑块精准控制画面中物体的移动、旋转和缩放,无需依赖文本提示词 [7] - 技术核心是三步流程:先用SAM模型分离物体和场景,再用Blender进行3D编辑,最后用扩散模型生成高质量合成图像 [7] - 系统采用双流扩散合成器接收原始场景和编辑后渲染图像,并通过源遮挡和模拟物体抖动等技巧提高泛化能力和真实感 [7] 七、Grok 4新模型 - xAI即将发布新模型Grok 4系列,包括旗舰版Grok 4和专用编程模型Grok 4 Code,预计于美国国庆日后推出 [8] - Grok 4特性包括13万tokens上下文窗口、支持函数调用、结构化输出和推理能力,但仅支持文本到文本模态 [8] - 马斯克表示希望用Grok 4重写人类知识库,补充缺失信息并删除错误,而Grok 4 Code将作为专业编程助手 [8] 八、DeepSeek-R2神秘模型 - 大模型竞技场秘密上线代号为"steve"的神秘模型,通过对话透露来自DeepSeek,引发网友猜测其为DeepSeek-R2或其他新版本 [10] - "steve"模型知识截止时间为2023年10月,通过部分智力测试,但表现不够惊艳 [10] - 此前The Information报道称DeepSeek-R2再度延期,原因是内部对模型表现不满意,同时可能受英伟达H20芯片缺乏影响 [10] 九、EDA行业动态 - 西门子、新思、楷登电子宣布收到美国商务部BIS通知,解除对中国大陆市场的临时禁令,恢复中国客户对其软件和技术的全面访问 [11] - 此前5月下旬BIS对EDA三巨头突然下发出口限制通知且未设缓冲期,导致三巨头股价暴跌,新思科技曾预测中国区收入将同比下降28% [11] - 国产EDA行业面临"成熟度与市占率"困境,中国已有三家EDA公司上市,但芯片设计公司为保证流片成功率仍倾向使用成熟度高的国外产品 [11] 十、AI就业影响 - 世界经济论坛《2025年全球未来就业报告》显示AI与机器学习专家成为增长最快职业,岗位数量预计增长86% [12] - AI将重塑全球劳动力市场,大数据、网络安全和技术素养成为增长最快的三大技能,同时数据录入员和行政助理等传统岗位面临需求下降 [12] - 全球约39%员工技能将在2025-2030年间发生显著变化,但仅50%员工接受过系统培训,63%雇主将技能差距视为业务转型最大障碍 [12]