深度学习卷积神经网络CNN之MobileNet模型网络模型详解说明(超详细理论篇)

news/2024/12/23 18:21:11 标签: 深度学习, cnn, 网络

1.MobileNet背景
2.MobileNet V1论文
3. MobileNett改进史
4. MobileNet模型结构
5. 特点(超详细创新、优缺点及新知识点)

一、MobileNet背景

  随着移动设备的普及,深度学习模型的应用场景逐渐扩展至移动端和嵌入式设备。然而,传统的深度学习模型在计算和存储资源上的需求较高,不适合在这些资源受限的设备上运行。因此,Google于2017年提出了MobileNet模型,旨在提供一种在性能不大幅降低的前提下,能够显著降低资源消耗的深度学习解决方案。
在这里插入图片描述

  MobileNet的核心目标是优化计算资源的使用,使其能够在移动设备和嵌入式系统中高效运行。这一模型的出现,为图像分类、目标检测、图像分割等任务提供了新的可能,尤其是在需要快速响应和低功耗的环境中。

二、MobileNet V1论文

论文名字 :MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

https://arxiv.org/abs/1704.04861原论文 V1网址

  提出了一类高效的模型,称为 MobileNets,适用于移动和嵌入式视觉应用。MobileNets 基于一种简化的架构,该架构使用深度可分离卷积来构建轻量级深度神经网络。引入了两个简单的全局超参数,可以有效地在延迟和准确性之间进行权衡。这些超参数允许模型构建者根据问题的约束为其应用选择合适大小的模型。在资源和准确性权衡方面进行了广泛的实验,与其他流行的 ImageNet 分类模型相比,它表现出了强大的性能。然后,展示了 MobileNets 在各种应用和用例中的有效性,包括对象检测、细粒度分类、面部属性和大规模地理定位。

MobileNetV2
论文标题:MobileNetV2: Inverted Residuals and Linear Bottlenecks

论文网址:https://arxiv.org/abs/1801.04381

MobileNetV4
论文标题:Searching for MobileNetV4: Cross-Stage Partial Networks for Next-Generation Mobile Vision Applications

论文网址:https://arxiv.org/abs/2404.10518

三、MobileNet改进史

  MobileNet系列至今已发展至V3版本,每一代都在不断优化性能和效率。

1.MobileNet V1

  首次引入了深度可分离卷积(Depthwise Separable Convolution)的概念。这种卷积方式将标准卷积分解为深度卷积和逐点卷积两个步骤,显著减少了计算量和模型大小。同时,V1还提供了可调的宽度乘子(width multiplier)和分辨率乘子(resolution multiplier),使用户可以根据具体应用需求调整模型的大小和输入图像的分辨率。

2.MobileNet V2

  在V1的基础上,引入了倒残差块(Inverted Residual Block)和线性激活函数(Linear Activation)。这些改进使得V2在保持轻量级特性的同时,实现了更高的准确性和更低的延迟。倒残差块的设计有助于保留和增强特征信息,改善了模型在低资源环境中的表现。

3.MobileNet V3

  进一步对V2进行了全面改进,采用了HardSwish激活函数、挤压励磁模块(Squeeze-and-Excitation Block),以及MnasNet和NetAdapt等网络架构搜索(NAS)技术。这些技术使得V3在保持高性能的同时,实现了更快的推理速度和更小的模型尺寸。

四、 MobileNet模型结构

在这里插入图片描述

  以V1为例,其网络结构主要由标准卷积层、深度可分离卷积层、平均池化层和全连接层组成。
在这里插入图片描述

标准卷积层:通常位于网络的首层,用于提取输入图像的低级特征。

深度可分离卷积层:是MobileNet的核心组件,由深度卷积和逐点卷积组成。深度卷积对每个输入通道进行独立卷积,逐点卷积则通过1x1卷积将各个通道的输出合并。

平均池化层:用于降低特征图的尺寸,减少计算量。
全连接层:位于网络的末层,用于将特征图映射到分类结果上。

  V2和V3在V1的基础上进行了改进,引入了倒残差块、线性激活函数和NAS等技术,进一步提升了模型的性能和效率。

五、特点(超详细创新、优缺点)

1.创新点

  深度可分离卷积:MobileNet的核心创新点在于深度可分离卷积的引入。这种卷积方式将标准卷积分解为深度卷积和逐点卷积两个步骤,显著减少了计算量和模型大小。同时,它还能够保留输入特征的空间结构,使得模型在保持高性能的同时,实现了更高效的计算。

  残差块:V2引入的倒残差块设计,使得特征在经过深度卷积时能够保留更多信息。这种结构首先通过一个1x1卷积将输入特征映射扩展,然后使用深度可分离卷积进行特征提取,最后再通过1x1卷积将特征压缩回原始维度。

  NAS技术:V3采用了MnasNet和NetAdapt等网络架构搜索技术,自动寻找最优的网络结构。这些技术使得V3在保持高性能的同时,实现了更快的推理速度和更小的模型尺寸。

2.优点

高效性:MobileNet模型在计算效率和参数数量上都显著减少,使其非常适合在手机等资源受限的设备上运行。
灵活性:用户可以通过调整宽度乘子和分辨率乘子来定制模型的复杂度,以满足不同应用场景的需求。
高性能:尽管MobileNet是轻量级模型,但在标准数据集(如ImageNet)上的表现仍然相对较好。它能够达到与许多重型网络相媲美的准确率。

3.缺点

  相对较低的准确性:虽然MobileNet的性能在轻量级模型中表现良好,但与一些大型、重型模型(如ResNet或Inception)相比,其准确性通常较低。在某些复杂任务中,可能无法达到所需的性能。
  信息损失:深度可分离卷积虽然减少了参数和计算量,但也可能导致信息的损失。因为每个通道是独立处理的,可能无法捕捉到跨通道的特征

4.新知识点

  宽度乘子和分辨率乘子:这两个超参数允许用户根据具体应用需求调整模型的大小和输入图像的分辨率,从而在准确率和效率之间找到平衡。
  NAS技术网络架构搜索技术能够自动寻找最优的网络结构,提高模型的性能和效率。
  HardSwish激活函数:V3采用的HardSwish激活函数相比传统的ReLU激活函数,在某些情况下能够改善模型的学习能力


http://www.niftyadmin.cn/n/5796800.html

相关文章

AI多模态技术介绍:理解多模态大语言模型的原理

本文目标是解释多模态LLMs的工作原理,虽然多模态的输入可以有音频,文本,图像和视频,但这里主要讨论的还是以图文为主的多模态大语言模型。 参考文章:https://magazine.sebastianraschka.com/p/understanding-multimoda…

详解redis哨兵(高可用)

华子目录 为什么会出现redis的哨兵?redis哨兵哨兵机制能做什么?什么是主观下线和客观下线?主观下线客观下线 哨兵的三个定时监控master主节点下线后,怎么进行故障转移?leader哨兵的选举故障转移,选举新的master执行故…

实验6-2 基于二叉链表存储结构实现二叉树的基本操作

题目:计算二叉树中的叶子结点个数 (1)如果二叉树为空,则叶子结点个数为0。 (2)如果二叉树只有根节点,则叶子结点个数为1 (3)左子树叶子结点数+右子树叶子结点数 一、原代码 #include <stdio.h> #include <stdlib.h> #define TRUE 1 #define FALSE 0 #define …

数据可视化echarts学习笔记

目录&#xff0c;介绍 知识储备 一端操作&#xff0c;多端联动的效果&#xff08;开启了多个网页&#xff0c;操作一端&#xff0c;多个网页的效果会跟着改变&#xff09; cmd命令控制面板返回上一级或上上级 在当前目录打开文件&#xff1a; cd 文件名 在Windows命令提示符&am…

[文献阅读] Unsupervised Deep Embedding for Clustering Analysis (无监督的深度嵌入式聚类)

文章目录 Abstract:摘要聚类深度聚类 KL散度深度嵌入式聚类(DEC)KL散度聚类软分配&#xff08;soft assignment&#xff09;KL散度损失训练编码器的初始化聚类中心的初始化 实验评估总结 Abstract: This week I read Unsupervised Deep Embedding for Clustering Analysis .It…

HTTP协议及安全防范

由于图片解析问题&#xff0c;可以点击查看 &#x1f449;&#x1f3fb; 博客原文 HTTP&#xff08;Hypertext Transfer Protocol&#xff09;超文本传输协议是一个用于 Web 应用程序通信的应用层协议。它是一种客户端-服务器协议&#xff0c;客户端通过发送请求到服务器来获取…

Vue 单表 CRUD模板 前端

结合后端CRUD模板食用更佳 后端CRUD模板 js文件 指向了后端的方法 页面基本模板 import request from /utils/request // 查询关键词列表 export function page(param) {return request({url: /systemConfig/page,method: post,params: param}) }// 新增 export function ad…

2024年图像处理、多媒体技术与机器学习

重要信息 官网&#xff1a;www.ipmml.org 时间&#xff1a;2024年12月27-29日 地点&#xff1a;中国-大理 简介 2024年图像处理、多媒体技术与机器学习&#xff08;CIPMT 2024&#xff09;将于2024年12月27-29日于中国大理召开。将围绕图像处理与多媒体技术、机器学习等在…