AIGC
搜索文档
腾讯混元图像3.0全球“盲测”登顶;任天堂否认游说日本政府加强生成式AI监管丨AIGC日报
创业邦· 2025-10-06 09:11
特斯拉机器人技术进展 - 特斯拉擎天柱机器人展示了学习功夫的能力,公司AI工程师称这只是开始[2] - 公司计划将自动驾驶技术与擎天柱机器人的AI模型进行统一整合[2] - 公司正积极招募AI团队成员参与相关产品的研发[2] 腾讯混元大模型进展 - 腾讯混元图像3.0模型在国际大模型竞技场LMArena的全球用户盲测中排名第一,在26款模型中被评为最佳综合文生图模型[5] - 该模型的文生图能力版本已于9月28日开源,图生图、图像编辑及多轮交互等版本将在后续发布[5] 任天堂AI监管立场 - 任天堂公司否认其曾就生成式AI监管事宜游说日本政府[5] - 公司声明无论是否涉及生成式AI,都将对侵犯知识产权的行为采取适当行动[5] 紫东太初大模型迭代 - 中国科学院自动化研究所与武汉人工智能研究院联合研发的紫东太初4.0多模态推理大模型近日发布[5] - 该模型自2021年首次推出以来已完成4次迭代,实现了从纯文本思考到多模态深度推理的跃迁[5][6]
开源仅一周,鹅厂文生图大模型强势登顶,击败谷歌Nano-Banana
机器之心· 2025-10-05 14:42
行业竞争格局 - 腾讯混元图像3.0以1167分登顶LMArena文生图完整榜单第一,超越谷歌Gemini-2.5-flash-image-preview(1151分)、字节跳动Seedream-4-2k(1144分)和OpenAI GPT-Image-1(1126分)等竞争对手 [1][2] - 图像生成领域呈现多模态融合与智能深化趋势,从“能生成”向“能理解、能推理、能控制”演进 [55] - 开源成为核心推动力,国内AI公司通过开放模型权重借助社区协作实现快速迭代 [56] 公司技术实力 - 混元图像3.0参数量达800亿,推理时每个token激活130亿参数,是公司规模最大、性能最强的开源文生图模型 [3] - 模型采用混合式离散-连续建模策略,在统一框架内融合语言建模、图像理解和图像生成三大功能 [42][43] - 基于超百亿规模原始图像库筛选构建近50亿张高质量训练数据集,数据纯净度不足45% [45] - 通过四阶段渐进式预训练和包括SFT、DPO、MixGRPO、SRPO及ReDA在内的后训练策略优化模型表现 [49][53] 产品性能表现 - 模型具备原生多模态架构和世界知识推理能力,能理解复杂提示并生成连贯故事场景,如“曹冲称象”九宫格漫画 [9] - 在精确文字生成和长文本渲染方面表现突出,有效改善文字乱码和字形扭曲问题 [16] - 支持多分辨率图像生成,在文图一致性与视觉质量方面超越Seedream 4.0、Nano Banana、GPT-Image等顶尖模型 [51][54] - 发布一周内GitHub星数突破1.7k,社区热度持续攀升 [6] 公司战略布局 - 公司围绕混元模型家族形成全栈式AIGC体系,涵盖图像领域的混元图像3.0、3D领域的混元3D 3.0、视频领域的HunyuanVideo以及世界模型HunyunWorld-1.0 [56] - 积极布局开源生态,混元翻译模型Hunyuan-MT-7B和世界模型HunyuanWorld-Voyager曾在Hugging Face趋势榜前三占据两席 [56] - 广泛的业务矩阵(社交、内容生产、广告推荐、游戏)为技术落地提供丰富场景和数据支撑 [58]
奥特曼拟通过Sora实现AI视频生成商业化;AI芯片制造商Cerebras撤回IPO计划丨AIGC日报
创业邦· 2025-10-05 09:09
OpenAI的Sora视频生成商业化进展 - OpenAI首席执行官山姆·奥特曼表示用户生成的视频内容数量远超预期且许多视频受众规模非常小公司计划通过某种方式让视频生成业务实现盈利[2] - 公司计划与希望用户生成其角色的版权方分享部分收入具体的盈利模式需经过反复尝试相关计划将很快启动[2] 阿里云通义千问模型开源动态 - 10月4日阿里云通义千问宣布开源Qwen3-VL-30B-A3B-Instruct与Thinking模型并同步推出FP8版本[2] - 公司还推出超大规模模型Qwen3-VL-235B-A22B的FP8版本[2] 富士通与英伟达的AI基础设施合作 - 10月3日日本富士通宣布扩大与英伟达的战略合作将共同构建集成AI智能体的全栈AI基础设施[2] - 合作重点包括开发面向医疗保健制造业和机器人等领域的行业专用AI智能体平台[2] - 双方将通过NVIDIA NVLink Fusion技术无缝集成FUJITSU-MONAKA CPU系列与NVIDIA GPU的AI计算基础设施[2] AI芯片制造商Cerebras的IPO计划变动 - 人工智能芯片制造商Cerebras Systems宣布撤回首次公开募股计划而几天前公司刚宣布完成一轮超10亿美元融资[2] - 在提交给美国证券交易委员会的文件中Cerebras表示目前不打算推进拟议的公开招股但未说明具体原因[2] - 公司发言人透露CEO费尔德曼认为去年提交的原始招股书已过时尤其是考虑到人工智能领域的最新发展动态[2]
AI翻译公司拟明年在美IPO;日本计划明年春季试制纯国产人形机器人丨AIGC日报
创业邦· 2025-10-04 09:09
AI翻译平台DeepL的IPO计划 - 德国AI翻译平台DeepL正与潜在投资者进行IPO初步磋商,可能于明年在美国上市 [2] - 公司此次IPO可能寻求50亿美元(约356.26亿元人民币)的估值,最终估值将取决于投资者需求及市场环境 [2] - DeepL去年以20亿美元估值完成3亿美元融资,但上市地点和时间表等细节仍可能发生变化 [2] 人工智能行业风险投资趋势 - 人工智能初创公司今年以来已吸引创纪录的1927亿美元风险投资,2025年有望成为首个逾一半风投资金流入AI行业的年份 [2] - 最近一个季度,美国风投将62.7%的资金投向人工智能公司,全球风投该比例为53.2% [2] - 今年以来全球风投总额为3668亿美元,其中美国风投达到2502亿美元 [2] 日本机器人技术发展 - 日本村田制作所、早稻田大学及机器人制造商tmsuk计划明年3月试制纯国产人形机器人 [2] - 项目拟于明年年末完成两款试制机,分别重视功率和追求高聪敏度 [2]
万兴科技旗下万兴图示入编大学教材
36氪· 2025-10-03 14:54
公司业务进展 - 公司旗下产品万兴图示成为华为Mate XTS三折叠手机的官方推荐应用 [1] - 万兴图示与电子工业出版社合作推出《信息工程制图》专业教材 [1] - 教材通过12个真实企业案例系统讲解工程制图技巧 [1] 产品应用与市场拓展 - 产品覆盖思维导图、流程图、网络拓扑图、系统架构图、平面布局图等全场景制图方法 [1] - 产品适用于计算机、通信等相关专业师生以及ICT规划、系统集成等领域的技术人员 [1] - 产品成功进驻高等学府课堂 [1]
“抢场地、抢演员、AIGC助力” 记者实探郑州短剧基地
财联社· 2025-10-03 10:09
行业规模与增长 - 微短剧用户规模已达6.96亿[4] - 行业全年市场规模在去年达到500亿元基础上 今年有望实现更大突破[4] - 动画微短剧有望在未来几年内形成千亿级市场空间[22] 产业生态与集群效应 - 郑州已集聚820多家制作企业 约3万从业人员 日均开机短剧约100部 占全国产量近半[18] - 相较于一线城市 郑州制作成本低30%至40%[18] - 聚美航空港竖屏电影基地已产出近500部微短剧 是河南产量最大、置景最优的拍摄枢纽之一[13] - 类似集群效应也出现在西安、青岛、长三角等地 西安累计拍剧超600部 青岛作品全网播放量超220亿次[19] 制作流程与技术变革 - AIGC技术让传统11个制作环节压缩至3个 月产能突破1300分钟 成本显著下降[21] - AI技术介入显著降低了科幻、战争等原本成本高昂场景的生产门槛[21] - 红果短剧通过果燃计划累计立项82部短剧 已上线播出近30部作品[22] - 行业正经历从“快产快上”到“速度退潮、质量进阶”的系统性升级 “精品化”成为关键词[21]
记者实测Sora2,AI视频的GPT-3.5时刻真的来了吗?
第一财经· 2025-10-03 08:03
Sora 2 模型技术更新 - 新一代视频生成模型Sora 2在物理逻辑、画面一致性和真实感上相比初代Sora有显著提升,能够基于一张照片和一句提示词创作有剧情、有文案的短片 [3] - 模型在物理上更加精准和逼真,可控性有巨大飞跃,能够完成之前视频模型难以完成的任务,如精确模拟奥林匹克体操动作和浮力等动态,并配备同步音频 [7] - 测试显示其镜头语言丰富,对话有想象力,音频输出方面口型与发音一致,但生成一个10秒视频需等待数分钟,且分辨率不高 [8] Sora 应用产品特性 - Sora应用被形容为“AI版抖音”,主页为垂直视频流,用户可上下滑动浏览全部由AI生成的视频内容 [7] - 应用采用邀请码注册机制,用户注册后可裂变出4个邀请码,使用邀请码会自动关注邀请对象,从而形成好友网络,具备强社交基因 [7] - 用户可选择上传图片结合文字提示生成视频,或使用“Cameo”功能基于自己或朋友形象进行提示词生成 [7] 产品市场表现与用户反响 - Sora APP在美区iOS免费应用排行榜上空降第三位,仅次于谷歌的Gemini和OpenAI自家的ChatGPT [4] - 由于采用邀请制,国内闲鱼平台出现邀请码交易,单价6.88元的邀请码更受欢迎,界面显示有近50人想要 [4] - 对于普通受众而言,玩AI视频变成一件很接近且很有趣的事情,但技术尚未完全跨越“真实”门槛,对实际生产帮助有限 [3][15] 技术优势与现存缺陷 - 优势在于用户数字人的物理效果和唇型驱动效果很好,应用交互设计友好,能通过很短的音频和视频素材输出不错效果 [14] - 缺陷包括人脸输出效果“似像非像”,在多元素物体交互时会出现手脚和脸糊等细节丢失,动作不符合物理逻辑,中文支持是“重灾区”,会凭空生造文字 [10][12][14] - 虽然相比初代物理理解更好,但模型能力尚未真正解决技术问题,一致性和物理问题仍未彻底解决 [14][15] 行业竞争与产品战略定位 - 行业观点认为Sora 2的技术并无代差领先,谷歌有Veo3、Nano banana及世界模型Genie3,国内可灵、即梦也能与之一战 [15] - OpenAI的优势在于打造互联网产品,Sora应用更侧重于用AI视频完成用户社交,是寻找应用场景的新尝试,采用先完成再完美的互联网迭代打法 [15][16] - 公司不追求画质和时长,而是通过获取消费者面部数据并结合邀请码机制,吸引亲朋好友链式传播,在产品玩法上暂时领先于其他公司 [16]
出门问问涨超22% 近期推出TicNote Color系列 公司AI智能硬件业务高增长
智通财经· 2025-10-02 14:40
股价表现 - 截至发稿,公司股价上涨22.54%至0.87港元,成交额达3811.69万港元 [1] 公司业务与产品 - 公司发布TicNote Color系列产品,并对Shadow AI进行2.0全面升级 [1] - TicNote产品被公司定义为全球首款AgenticAI软硬结合产品 [1] - 新产品TicNote在海外首发获得关注,销量迅速突破1万台,并位居天猫、京东等电商平台相关品类销量前列 [1] - 截至8月20日,TicNote全球销量已突破3万台 [1] 财务表现 - 上半年公司AI智能硬件业务收入为9830万元,同比增长64.8% [1] - 业务增长主要得益于公司加大了战略性市场投入和新产品TicNote的品牌投入 [1] 行业前景与公司优势 - AIGC被视为新兴市场,当前行业格局不确定性较强,中国已推出超过300个处于训练或测试阶段的大模型 [1] - 公司在AIGC应用领域被认为具有显著先发优势 [1] - 在行业空间快速成长下,公司的飞轮效应有望持续 [1] - 预计AIGC相关服务将支撑公司业绩较快增长,同时AIGC能力提升也有望与公司其他两条业务线形成协同效应 [1]
破土·更新·决胜
新浪财经· 2025-10-02 09:22
国庆节的北京,街巷里的五星红旗映照家国欢庆。经济社会重点项目发展步履不停,实干冲刺"十四五"圆满收官。 长安街西延线,北京门头沟。结束千年采煤史,蹚出绿色高质量发展新路。"十四五"期间,这里建成北京规模最大的600P国产 自主算力集群,"煤城"悄然蜕变成"智谷"。 国庆节前夕,完成迭代的"潭柘智空"大模型在门头沟京西智谷亮相。在"千亿参数+时代语料"双重加持下,工作人员输入简要需 求,1分钟后,一段4K/60帧超高清视频生动呈现。这些"所想即所得"的电影级画面中,既有动物迁徙奔腾的场景,也有皮毛纹 理的细节特写,带给人们全新的AIGC视听体验。 记者从门头沟了解到,目前,京西智谷累计链接800余家人工智能企业。10月内,首期17万平方米的中关村(京西)人工智能科 技产业园即将开园,未来将实现年产值超百亿元。 记者了解到,目前京唐城际铁路北京城市副中心段已进入联调联试阶段,为线路开通运营做最后冲刺。检测列车从燕郊站开 出,仅用约15分钟即抵达北京城市副中心站。 "智算赋能、技术创新为老区转型打开了天地。"中关村门头沟园党工委书记、管委会主任谭李丽介绍,园区正全力谋划好"十五 五"规划,将继续聚焦高新产业加速增长 ...
决胜“十四五” 打好收官战丨破土·更新·决胜——北京抢抓项目建设确保“十四五”圆满收官
新华网· 2025-10-02 07:27
门头沟区产业转型 - 门头沟区建成北京规模最大的600P国产自主算力集群,实现从“煤城”到“智谷”的转型 [1] - “潭柘智空”大模型具备千亿参数和时代语料,可在1分钟内根据简要需求生成4K/60帧超高清视频 [1] - 京西智谷已累计链接800余家人工智能企业,首期17万平方米的中关村(京西)人工智能科技产业园即将开园,预计实现年产值超百亿元 [1] 首都核心区城市更新 - 首开首院文化金融产业园通过对老建筑进行改造更新,保留文脉骨架并融入新业态功能 [2] - 园区内设置中国美术馆文创空间、首开书院·景山书社等文化设施,并打造“景山AI食堂”提供智能化餐饮服务 [2] 城市副中心交通枢纽建设 - 北京城市副中心站综合交通枢纽工程标志性主辅帆结构全面建成,地下车站装修接近尾声,预计今年底建成投用 [3] - 枢纽地下一层规划为城市功能层发展商业,地下二层为站厅层供乘客换乘 [3] - 京唐城际铁路北京段已进入联调联试,检测列车从燕郊站至副中心站约需15分钟,年底通车后将加强京津冀地区联系 [3] 北京市经济发展 - “十四五”期间北京市地区生产总值预计将超过5万亿元 [3]