大津法(Python实现),,在计算机视觉和图像处


在计算机视觉和图像处理中,大津法被用于自动获取图像的阈值,或者将灰度图像转换为二值化图像。该算法假设图像包含两个类别的像素(前景像素和背景像素),然后它计算一个最优的阈值用于分离前景和背景,使得前景和背景的类间方差最小。

下面定义类间方差的计算公式:
假设我们使用阈值T将灰度图像分割为前景和背景size:图像总像素个数
u:图像的平均灰度
w0:前景像素点占整幅图像大小的比例u0:前景像素点的平均值
w1:背景像素点占整幅图像大小的比例
u0:背景像素点的平均值
g:类间方差

u = w0 * u0 + w1 * u1 (1)
g = w0*(u - u0)^2 + w1*(u - u1)^2 (2)
将(1)代入(2)得:
g = w0 * w1 * (u0 - u1)^2

采用遍历的方法,遍历所有阈值,当g最大时,该阈值就是我们所求的认为最合适的阈值了。
偷偷告诉你,opencv有自带的使用大津法阈值化的方法,如下:
cv2.threshold(img, th1, max_val, cv2.THRESH_OTSU) 
使用参数cv2.THRESH_OTSU后,前面的th1就无效了。

以下是我自己写的Python版函数:
import numpy as npdef OTSU_enhance(img_gray, th_begin=0, th_end=256, th_step=1):    assert img_gray.ndim == 2, "must input a gary_img"    max_g = 0    suitable_th = 0    for threshold in xrange(th_begin, th_end, th_step):        bin_img = img_gray > threshold        bin_img_inv = img_gray <= threshold        fore_pix = np.sum(bin_img)        back_pix = np.sum(bin_img_inv)        if 0 == fore_pix:            break        if 0 == back_pix:            continue        w0 = float(fore_pix) / img_gray.size        u0 = float(np.sum(img_gray * bin_img)) / fore_pix        w1 = float(back_pix) / img_gray.size        u1 = float(np.sum(img_gray * bin_img_inv)) / back_pix        # intra-class variance        g = w0 * w1 * (u0 - u1) * (u0 - u1)        if g > max_g:            max_g = g            suitable_th = threshold    return suitable_th



大津法(Python实现)

评论关闭