卷积核

卷积核,也被称为滤波器或特征检测器,是在卷积神经网络Convolutional Neural NetworksCNN)中使用的一个重要概念。它是一个小型矩阵,用于在输入数据(如图像)上进行卷积操作,以提取和学习输入中的特征。

图像处理中,卷积核通过在图像的每个像素上滑动并应用卷积操作,来检测和提取图像中的特定特征。例如,某些卷积核可能专门用于检测边缘,其他卷积核可能用于检测特定形状或纹理。

卷积核的大小和值在训练过程中是可学习的,这意味着网络会自动学习最能提取有用特征的卷积核。例如,3x3、5x5和7x7的卷积核在实践中常常被使用。

深度学习中,使用多个卷积核可以帮助网络从不同的角度理解输入数据,从而提高模型的性能。


理解卷积核

卷积核可视化网站:Image Kernels explained visually --- 图像内核直观解释 (setosa.io)

这个网页是一个很好的资源,它以可视化的方式解释了图像卷积核的概念。这里是一些主要的要点:

有如下图片矩阵:

Pasted image 20230522122241.png

应用一个 3x3 锐化内核应用于上面的人脸图像:

Pasted image 20230522122317.png

这个卷积核会强调相邻像素值的差异,使图像看起来更加清晰。

注:在处理图像边缘的像素时,由于它们没有足够的邻居,我们需要采取一些策略。一种方法是在原始图像中扩展边缘值,另一种方法是在新图像中忽略这些值。

下面,对于左侧图像中的每个 3x3 像素块,我们将每个像素乘以内核的相应条目,然后取总和。该总和将成为右侧图像中的新像素。将鼠标悬停在任一图像上的像素上以查看其值的计算方式。

Pasted image 20230522122434.png

这个网页还提供了一个交互式的工具,你可以选择不同的卷积核,看看它们如何影响原始图像,或者构建你自己的卷积核。你甚至可以上传你自己的图像,或者使用实时视频(如果你的浏览器支持的话)。


本文作者:Maeiee

本文链接:卷积核

版权声明:如无特别声明,本文即为原创文章,版权归 Maeiee 所有,未经允许不得转载!


喜欢我文章的朋友请随缘打赏,鼓励我创作更多更好的作品!