Workflow
计算机视觉
icon
搜索文档
“计算机视觉被GPT-4o终结了”(狗头)
量子位· 2025-03-29 15:46
GPT-4o多模态图像生成技术突破 - GPT-4o原生多模态图像生成能力被开发出多种新玩法,包括将表情包转化为语义分割图和深度图[2][3][4] - 该技术对传统AI画图工具、设计师和计算机视觉研究领域产生颠覆性影响[6] - 在自动驾驶领域展现潜力,能识别特斯拉自动驾驶系统无法识别的伪装"隐形墙"[8] 技术实现路径争议 - 应用研究主管提出自动驾驶领域只需训练强大基础模型后微调即可实现[10] - 反对观点认为Stable Diffusion+ControlNet已具备同等能力[11] - 技术突破关键在于通过扩大基础模型规模实现意想不到的效果[12] 模型架构技术细节 - GPT-4o图像生成采用原生嵌入ChatGPT的自回归模型,与DALL·E的扩散模型不同[13][15] - 推测采用多尺度自回归组合技术,首先生成粗略图像再逐步填充细节[17] - 存在争议观点认为解码阶段可能仍使用扩散模型,参考Meta 24年8月论文提出的多模态模型同时预测token和扩散图像的方法[20][24] 行业活动信息 - 中国AIGC产业峰会将于4月16日在北京举行,汇聚百度、无问芯穹等AI领域企业[26]
等待13年,AlexNet重磅开源:Hinton团队亲手写的原版代码,甚至还带注释
36氪· 2025-03-24 19:38
等待13年,AlexNet重磅开源:Hinton团队亲手写的原版代码,甚至还带注释 如果你是一名 AI 开发者或深度学习爱好者,那么你一定听说过 AlexNet——这个在 2012 年凭借 ImageNet 竞赛一战成名、直接把计算机视觉能力拔高了 一个量级的深度卷积神经网络模型。 而就在最近,计算机历史博物馆(CHM)与谷歌合作,终于正式开源了 AlexNet 的源代码!更令人惊喜的是,这次公开的版本是 2012 年 Hinton 团队亲手 编写的原版代码,甚至还保留了当年的注释! | Code 1.53 KB | 修改造新 | <> 源码 | | --- | --- | --- | | آ | # This is a layer configuration file that contains all the | | | 2 | # layer types supported by this code. It's not actually good for anything | | | 3 | # other than demonstrating how layers are specified and ...
【计算机】端侧AI发展迎来重大拐点,计算视觉领导者虹软科技有望实现新增长——AI行业跟踪报告第60期(刘凯/白玥)
光大证券研究· 2025-03-06 17:25
点击注册小程序 特别申明: 本订阅号中所涉及的证券研究信息由光大证券研究所编写,仅面向光大证券专业投资者客户,用作新媒体形势下研究 信息和研究观点的沟通交流。非光大证券专业投资者客户,请勿订阅、接收或使用本订阅号中的任何信息。本订阅号 难以设置访问权限,若给您造成不便,敬请谅解。光大证券研究所不会因关注、收到或阅读本订阅号推送内容而视相 关人员为光大证券的客户。 报告摘要 端侧 AI技术的快速发展正在推动多领域的智能化变革 风险提示: AI技术发展不及预期;AI眼镜落地不及预期;下游需求不及预期。 发布日期: 2025-03-06 根据WellsennXR数据,全球眼镜市场规模庞大,2023年销量约15.6亿副,市场规模约1500亿美元,预计未 来10年销量将达20亿副,市场规模接近2000亿美元。AI智能眼镜在这一背景下展现出巨大潜力,预计2025 年开始快速渗透传统眼镜市场,2035年销量有望达14亿副。目前,Meta、雷鸟、百度、Rokid等企业已推 出多款AI眼镜产品,推动技术迭代与市场成熟。截至2024Q2,Meta与雷朋联名产品Ray-BanMeta出货量已 经超过了100万台;雷鸟V3AI拍摄眼 ...
AI网红,24小时无休,年入7000万
创业邦· 2025-03-01 17:42
以下文章来源于乌鸦智能说 ,作者智能乌鸦 乌鸦智能说 . 人人都能读懂的AI商业 来 源丨乌鸦智能说(ID:wuyazhinengshuo) 作者丨朗朗 图源丨Midjourney 今天带你们见识下新时代的永动机——AI网红。 她们不会疲惫,永不塌房,还能24小时创造现金流,堪称资本家眼中完美的"打工人"。 当所有人还在摸索用AI赚钱的正确姿势,AI网红率先找到了专属的生态位: 从年入千万美元的顶奢代言,到OnlyFans上的AI分身代聊,再到小红书上AI猫狗博主靠"云养宠"狂揽品 牌商单…… 开发超过70产品的硅谷狂人Levelsio说,"AI网红现在正迅速成为一门大生意"。 预计到2030年,AI网红的市场规模将达到450亿美元。这几乎是现在网红市场的两倍。 各位打工人请系好安全带,今天我们要解剖这个赛博奇观:一群不会呼吸的电子生命体,正在用代码重 构"劳动"的定义。 从时尚博主到AI分身 解锁AI网红赚钱姿势 当大部分AI初创公司还在摸索商业模式,AI网红的变现方式早已五花八门:不仅有品牌代言与联名、情 感经济与订阅服务、还有数字资产衍生产品等等。 接下来,就跟着乌鸦君一起来看看吧。 1、时尚、颜值博主 ...
云天励飞:云天励飞首次公开发行股票并在科创板上市招股意向书
2023-03-15 19:31
发行信息 - 公司拟发行8878.3430万股,占发行后总股本的25.00%,发行后总股本为35513.3720万股[8] - 预计发行日期为2023年3月24日[8] - 发行股票类型为人民币普通股(A股),每股面值1元[8] - 拟上市板块为上海证券交易所科创板[8] - 保荐人为主承销商中信证券,联席主承销商为中信建投证券,副主承销商为广发证券[8] 业绩数据 - 2019 - 2022年上半年公司净利润分别为 - 50976.47万元、 - 39834.40万元、 - 38990.29万元、 - 23007.47万元[12][15] - 2019 - 2022年1 - 6月公司营业收入分别为23041.15万元、42633.77万元、56570.09万元、18539.19万元,2022年1 - 6月同比下滑40.01%[39] - 2022年全年实现营业收入54580.77万元,较2021年同比降低3.52%,归属于母公司所有者的净利润 - 43590.42万元,较去年同期亏损增加4611.22万元[42] - 2023年1 - 3月预计营业收入5100.00 - 5700.00万元,同比增长0.30% - 12.10%[45] - 2023年1 - 3月预计净利润 - 13030.00 - - 14086.00万元,亏损收窄3.38% - 10.63%[45] 市场份额 - 2020年和2021年中国计算机视觉行业市场规模分别约为406.3亿元和669.1亿元,公司近两年计算机视觉解决方案市场份额预计在1%左右[21] - 2020年中国云端AI芯片市场规模达111.7亿元,边缘与终端芯片为39亿元,公司2020年AI芯片独立销售收入处于百万量级,2021年增至千万级[21] 研发情况 - 公司自研芯片DeepEye1000于2019年起独立商用,新一代芯片DeepEdge 10报告期内开始流片,芯片市场份额较低[77] - 2019 - 2021年公司研发费用分别为2.00亿元、2.19亿元、2.95亿元,占营业收入比例分别为86.79%、51.42%、52.17%[134] 未来展望 - 公司发展聚焦坚定“端云协同”技术路线,深挖算法、芯片等核心技术[94] - 公司将拓宽AI解决方案服务广度和深度,面向全球受许可市场推广复制[95] - 公司着力构建AI算力、算法服务平台,打造新型智慧城市[95]