计算机视觉
搜索文档
斯坦福大学:人工智能百年研究报告,2030年的人工智能与生活
欧米伽未来研究所2025· 2025-04-01 23:17
文章核心观点 - 斯坦福大学AI100项目首份报告《人工智能与生活2030》为审视未来十几年AI融入日常提供理性视角,AI虽有潜力带来积极影响,但也会带来社会、伦理和法律挑战,需制定政策引导其发展 [3][18] 百年之约:AI100项目的缘起与使命 - AI100项目源于对AI领域快速发展及其深远社会影响的认识,受2008 - 2009年AAAI组织的“阿西洛马会议”启发而生 [4] - 项目设立常设委员会,计划每五年组织专门研究小组评估AI,目标是为AI研究、开发、设计和政策制定提供指导,确保AI惠及个人与社会 [4] 首份报告研究小组及任务 - 首份报告研究小组由17位AI专家及多领域学者组成,背景多元确保研究广度与深度 [5] - 常设委员会要求研究小组聚焦AI到2030年对“典型的北美城市”生活的影响,选择城市和限定北美是为深入探讨特定背景影响并承认全球城市多样性 [5] 揭开AI的面纱:它是什么,不是什么 - AI是一门科学和计算技术,灵感源于人类神经系统和感知等方式,但运作方式与人类不同,精确定义AI有挑战 [6] - 当前AI在特定任务上进展显著,如深度学习、计算机视觉、自然语言处理、AI规划等,但并非“通用人工智能”,缺乏人类常识等能力,不会对人类构成迫在眉睫威胁,应期待其积极影响 [7][8] AI渗透八大领域:2030年城市生活图景 - 交通运输领域,到2030年自动驾驶汽车将更普遍,会改变城市面貌、缓解交通问题,但面临安全性和可靠性挑战,公众对AI的认知可能由此塑造 [9][11] - 家庭/服务机器人领域,未来十五年会出现更多特定用途机器人,但制造通用型机器人面临技术和成本障碍,近期商业机会集中在特定应用 [11] - 医疗健康领域,AI可利用健康数据进行疾病预测等,有望改善数百万人健康和生活质量,但从实验室到临床应用速度较慢,面临数据隐私等挑战 [11] - 教育领域,AI能为教育带来个性化变革,但设计有效AI系统面临挑战,需关注教育资源平等和内容准确性等问题,人机交互顺畅性和信任度是关键 [10] - 低资源社区领域,AI可帮助优化资源分配等,但应用设计可能忽略社区特殊需求或加剧不平等,确保技术普惠性和建立社区信任至关重要 [10] - 公共安全与安防领域,AI用于犯罪预测等引发隐私和偏见担忧,需在提升安全效率与保护公民权利间取得平衡,公众信任是基石 [12] - 就业与职场领域,AI会自动化部分工作冲击现有岗位,但也会创造新岗位和增强人类能力,社会需适应转变,克服人们对被边缘化的恐惧 [12] - 娱乐领域,AI已深度融入娱乐产业,未来会有更具交互性和沉浸感的形式,但可能带来社交隔离等社会风险 [12] 超越技术:AI的社会挑战与政策前瞻 - AI发展带来公平性与偏见、隐私、安全与可靠性、责任归属、经济影响与分配、人机关系等社会、伦理和法律挑战 [13][14] - 报告提出政策建议,包括提升政府AI专业能力、鼓励对AI社会影响的研究、避免对“AI”笼统监管、促进透明度和公众信任、关注公平与普惠 [14][15][17] 结语:面向2030的理性期待与责任 - 报告描绘了AI融入城市生活带来便利和挑战的未来图景,将讨论焦点拉回现实,提醒人们AI未来掌握在自己手中,需积极引导其发展 [18] - AI100项目才刚开始,当下应理解报告洞察与建议,塑造负责任、可持续、以人为本的AI未来 [18]
“计算机视觉被GPT-4o终结了”(狗头)
量子位· 2025-03-29 15:46
GPT-4o多模态图像生成技术突破 - GPT-4o原生多模态图像生成能力被开发出多种新玩法,包括将表情包转化为语义分割图和深度图[2][3][4] - 该技术对传统AI画图工具、设计师和计算机视觉研究领域产生颠覆性影响[6] - 在自动驾驶领域展现潜力,能识别特斯拉自动驾驶系统无法识别的伪装"隐形墙"[8] 技术实现路径争议 - 应用研究主管提出自动驾驶领域只需训练强大基础模型后微调即可实现[10] - 反对观点认为Stable Diffusion+ControlNet已具备同等能力[11] - 技术突破关键在于通过扩大基础模型规模实现意想不到的效果[12] 模型架构技术细节 - GPT-4o图像生成采用原生嵌入ChatGPT的自回归模型,与DALL·E的扩散模型不同[13][15] - 推测采用多尺度自回归组合技术,首先生成粗略图像再逐步填充细节[17] - 存在争议观点认为解码阶段可能仍使用扩散模型,参考Meta 24年8月论文提出的多模态模型同时预测token和扩散图像的方法[20][24] 行业活动信息 - 中国AIGC产业峰会将于4月16日在北京举行,汇聚百度、无问芯穹等AI领域企业[26]
等待13年,AlexNet重磅开源:Hinton团队亲手写的原版代码,甚至还带注释
36氪· 2025-03-24 19:38
文章核心观点 - 计算机历史博物馆与谷歌合作,正式开源了2012年Hinton团队编写的AlexNet原版代码,代码包含原始注释,为研究现代深度学习的起点提供了珍贵资料 [1][9][11] - AlexNet是深度学习领域的里程碑式模型,其在2012年ImageNet竞赛中以Top-5错误率15.3%的突破性成绩,远超第二名26.2%的水平,直接引爆了深度学习浪潮 [2][3] - AlexNet的成功依赖于两个关键外部条件:ImageNet大规模图像数据集和GPU计算能力的飞速提升,这为深度神经网络训练创造了必要条件 [4][5][6] AlexNet的历史意义与影响 - AlexNet模型由5层卷积层和3层全连接层组成,拥有6000万个参数和65万个神经元,并首次成功采用GPU进行加速训练 [2] - 该模型的成功彻底改变了计算机视觉领域的研究方向,证明了深度学习的巨大潜力,其相关论文被引用次数已超过17万次 [3][7] - 在AlexNet出现之前,神经网络研究曾因计算能力和数据量限制而陷入低谷,其突破为后续AI发展奠定了基础 [4] 代码开源过程与细节 - 开源代码为1.53 KB的原始C++/CUDA代码,并非后期PyTorch或TensorFlow重现代码,完整保留了当年的开发思路和注释 [1][11] - 代码开源过程历时五年,由计算机历史博物馆策展人发起,经与谷歌复杂谈判后最终达成,代码已发布至GitHub官方仓库 [9][11][12] - 此次开源使得研究者和开发者能够亲自体验AlexNet最初的训练和推理过程,更好地理解其技术实现 [11]
【计算机】端侧AI发展迎来重大拐点,计算视觉领导者虹软科技有望实现新增长——AI行业跟踪报告第60期(刘凯/白玥)
光大证券研究· 2025-03-06 17:25
端侧AI行业发展趋势 - 端侧AI技术通过模型蒸馏降低大模型参数量和算力需求 实现高效部署于端侧设备 推动自动驾驶 工业质检 智能家居等领域的低延迟和高效率应用 [2] - 端侧AI硬件能力提升 SoC芯片的高算力与低功耗特性拓展了智能终端设备应用范围 推动教育平板 智能玩具 桌面机器人等新型终端多样化发展 [2] - 隐私保护需求驱动端侧AI发展 本地数据处理减少数据泄露风险 在医疗 金融等敏感领域更具优势 [2] AI眼镜市场前景与格局 - 全球眼镜市场规模庞大 2023年销量约15.6亿副 市场规模约1500亿美元 未来10年销量预计达20亿副 市场规模接近2000亿美元 [3] - AI智能眼镜预计2025年开始快速渗透传统眼镜市场 2035年销量有望达14亿副 [3] - Meta与雷朋联名产品Ray-Ban Meta出货量已超100万台 雷鸟V3 AI拍摄眼镜开启预售 百度计划2025年Q2推出新一代AI眼镜 [3] 虹软科技在端侧AI领域的竞争优势 - 公司拥有"手机+智能汽车+AI眼镜"等丰富的端侧视觉算法产品线 端侧AI计算能力提升带动全方位受益 [4] - 手机侧覆盖三星 小米 OPPO vivo等全球知名厂商 智能汽车领域客户包括长安 赛力斯 本田等国内外知名车厂 [4] - 通过扩充算力中心 升级ArcMuse计算引擎完善AIGC能力架构 与高通 联发科等芯片平台合作推动技术落地 [4] 虹软科技业务拓展与合作伙伴 - 公司发布PhotoStudio AI智能商拍产品 至2024年底已成功入驻淘宝千牛 1688平台 抖店微应用 Tiktok 京东 拼多多等服务市场 [4] - 与雷鸟创新签署AI眼镜视觉技术订单 提供基于计算机视觉的算法功能 进一步拓展业务边界 [4] 虹软科技2024年财务业绩 - 2024年公司实现营业总收入8.15亿元 同比增长22% 归母净利润1.75亿元 同比增长98% 扣非归母净利润1.54亿元 同比增长127% [5] - 2024年Q4收入约2.41亿元 同比增长44% 归母净利润约0.9亿元 同比增长1172% [5] - 2024年前三季度智能驾驶及其他IoT智能设备视觉解决方案营业收入同比增长108% [5]
AI网红,24小时无休,年入7000万
创业邦· 2025-03-01 17:42
AI网红行业概述 - AI网红被描述为新时代的永动机 具备24小时无休 永不塌房和持续创造现金流的特性 被视为资本家眼中的完美打工人[1][2] - 行业正迅速成为一门大生意 预计到2030年市场规模将达到450亿美元 是当前网红市场的近两倍[4][5] - AI网红通过代码重构劳动定义 涵盖从顶奢代言到情感经济订阅服务的多元化生态位[3][5] 变现模式与收入规模 - 时尚颜值博主类AI网红年收入最高达1000万美元 例如Lil Miquela拥有700万粉丝 与三星 Dior Prada等顶级品牌合作[9][10][11] - AI分身代聊服务在NSFW领域表现突出 OnlyFans平台通过AI代聊月收入达1000万美元 年收入超1亿美元 按成单抽成20%[22][23] - 数字资产交易成为重要收入来源 例如德国AI模特Noonoouri年收入50万美元 其中60%来自虚拟资产交易如限量数字手袋[19][21] - AI萌宠博主通过拟人化内容获得高商单报价 小红书AI橘猫单篇笔记报价1.5万元 YouTubeAI狗广告收益达50万美元[25][28] 代表案例与区域发展 - 西班牙AI网红Aitana在Instagram拥有12.1万粉丝 每月最高收入1万欧元(约8万人民币) 每条广告收入超1000欧元[12][13] - 日本AI网红Lmma与资生堂 优衣库长期合作 全球首个黑人AI超模Shudu年收入约500万美元 每条赞助帖收费2000美元[14][16][17] - 中国AI萌宠博主"橙子的橙啦"在小红书积累6万粉丝 获54万赞 通过职场剧情内容获得品牌商单[25][27] 技术基础与量产化 - AI网红技术融合生成对抗网络(GANs) 机器学习 计算机视觉和自然语言处理 实现逼真内容和互动体验[31][32][33] - 美图软件Photo AI支持用户通过文字描述生成AI网红 半分钟内生成人设和头像 30分钟可训练专属一致性模型[34][35] - 技术降低创作门槛 但人设叙事和传播理解成为核心竞争力 例如Miquela通过Z世代混血 虚拟平权运动者等深度叙事增强真实感[36][37] 内容策略与品牌合作 - 跨平台内容矩阵布局包括TikTok换装挑战 X平台争议话题讨论(如AI人权) 以及权威媒体曝光(如《Vogue》《时代》)[38][39] - 品牌合作涵盖顶奢品牌代言 联名创作和元宇宙数字产品 例如Miquela与宝马合作CGI+AI动态视频 Noonoouri与Dior推出数字手袋[10][20][39]
云天励飞:云天励飞首次公开发行股票并在科创板上市招股意向书
2023-03-15 19:31
发行信息 - 公司拟发行8878.3430万股,占发行后总股本的25.00%,发行后总股本为35513.3720万股[8] - 预计发行日期为2023年3月24日[8] - 发行股票类型为人民币普通股(A股),每股面值1元[8] - 拟上市板块为上海证券交易所科创板[8] - 保荐人为主承销商中信证券,联席主承销商为中信建投证券,副主承销商为广发证券[8] 业绩数据 - 2019 - 2022年上半年公司净利润分别为 - 50976.47万元、 - 39834.40万元、 - 38990.29万元、 - 23007.47万元[12][15] - 2019 - 2022年1 - 6月公司营业收入分别为23041.15万元、42633.77万元、56570.09万元、18539.19万元,2022年1 - 6月同比下滑40.01%[39] - 2022年全年实现营业收入54580.77万元,较2021年同比降低3.52%,归属于母公司所有者的净利润 - 43590.42万元,较去年同期亏损增加4611.22万元[42] - 2023年1 - 3月预计营业收入5100.00 - 5700.00万元,同比增长0.30% - 12.10%[45] - 2023年1 - 3月预计净利润 - 13030.00 - - 14086.00万元,亏损收窄3.38% - 10.63%[45] 市场份额 - 2020年和2021年中国计算机视觉行业市场规模分别约为406.3亿元和669.1亿元,公司近两年计算机视觉解决方案市场份额预计在1%左右[21] - 2020年中国云端AI芯片市场规模达111.7亿元,边缘与终端芯片为39亿元,公司2020年AI芯片独立销售收入处于百万量级,2021年增至千万级[21] 研发情况 - 公司自研芯片DeepEye1000于2019年起独立商用,新一代芯片DeepEdge 10报告期内开始流片,芯片市场份额较低[77] - 2019 - 2021年公司研发费用分别为2.00亿元、2.19亿元、2.95亿元,占营业收入比例分别为86.79%、51.42%、52.17%[134] 未来展望 - 公司发展聚焦坚定“端云协同”技术路线,深挖算法、芯片等核心技术[94] - 公司将拓宽AI解决方案服务广度和深度,面向全球受许可市场推广复制[95] - 公司着力构建AI算力、算法服务平台,打造新型智慧城市[95]