发布时间:2023-04-03 文章分类:电脑基础 投稿人:樱花 字号: 默认 | | 超大 打印

近需要从热力图中找出关键点的坐标,也就是极大值的行和列。搜寻了网上的一些方法,在这里总结一下。使用numpy进行多维数组中最大值的行和列搜寻非常的灵活,有以下几种方法可供参考。

目录

二维数组

方法一:np.max()函数 + np.where()函数

方法二:np.argmax()函数 + np.unravel_index()函数

方法三: skimage.feature.peak_local_max函数

多维数组


二维数组

方法一:np.max()函数 + np.where()函数

如下图所示,x是一个 3×3 的二维np.array,首先使用np.max(x)求出x中的最大值,然后使用np.where函数找出数组x中最大值所在的位置。当然这只是np.where的其中一种用法,np.where是一个非常方便的函数,用法还有很多,具体可自行阅读官方文档。

这里说明一下,这种方法下np.where()返回的是一个元组,元组包含两个元素,这两个元素都是np数组,它们的长度对应,里面的值分别对应最大值坐标的行和列。比如,在下图中第一次x的最大值只有一个,所以返回元组中的两个数组长度都是1,因此最大值的坐标为(2,2),第二次的x最大值有3个,因此返回元组中的两个数组长度都是1,坐标分别是(0,1),(1,0),(2,2)

【Python】Python寻找多维数组(numpy.array)中最大值的位置(行和列)

方法二:np.argmax()函数 + np.unravel_index()函数

下图可以看出,当二维数组中只有一个最大值的时候,使用这种组合方法的结果是正确的,当有多个最大值时,返回的结果就有问题,只返回了第一行最大值的结果。因此这种方法是有弊端的,使用时需考虑实际情况。

原因分析:

np.argmax()函数的正确写法是:numpy.argmax(a, axis=None, out=None), aixs和out是可选参数,np.argmax(x)表示aixs和out是默认,这种情况会将x进行平铺之后,只返回第一次出现的最大值的索引。因此np.argmax(x)=8,np.argmax(y)=1。

np.unravel_index()函数的正确写法是:numpy.unravel_index(indices, shape, order='C'),官方给的解释这个函数的作用是:“convert a flat index or array of flat indices into a tuple of coordinate arrays”,就是找出shape尺寸数组展平后的第indices个数,在原shape尺寸数组中的位置。

【Python】Python寻找多维数组(numpy.array)中最大值的位置(行和列)

方法三: skimage.feature.peak_local_max函数

peak_local_max函数的作用主要是来选出图像中的极大值坐标的,很少用于筛选最大值。该函数的输入往往是一个(h,w)的数组,h,w是图像的高和宽,返回的是图像内部的极大值坐标数组,(n,2), n表示有多少个峰值(极大值)。当时输入的维度为三维(3,h, w)时,返回的维度是(n,3)。函数的官方定义为: "Find peaks in an image as coordinate list or boolean mask. Peaks are the local maxima in a region of `2 * min_distance + 1` (i.e. peaks are separated by at least `min_distance`). If both `threshold_abs` and `threshold_rel` are provided, the maximum of the two is chosen as the minimum intensity threshold of peaks.", 参数为:

peak_local_max(image, min_distance=1, threshold_abs=None, threshold_rel=None, exclude_border=True, indices=True, num_peaks=np.inf, footprint=None, labels=None, um_peaks_per_label=np.inf, p_norm=np.inf)

常用参数解释:

【Python】Python寻找多维数组(numpy.array)中最大值的位置(行和列)

多维数组

在画热力图时,我们得到张量尺寸往往是:(bathsize, n, h, w),  bathsize是每一批量的数量,n是一张图片对应的关键点的数量,h,w分别是关键点对应的热力图的高和宽。我们主要是求最后两个维度上的最大值的坐标以获取关键点在热力图中的位置。因此最直观的方法就是对前面的维度做个循环,然后使用上述的方法找最大值的坐标。当然也可以用peak_local_max()函数来处理。

因有些其他事需处理,没有去深入调研相关更高效的方法,以后找到了再补充。大佬们有更合适的方法也欢迎在评论区交流!