失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 【python 色情图片识别】python检测色情图片

【python 色情图片识别】python检测色情图片

时间:2023-08-02 15:00:38

相关推荐

【python 色情图片识别】python检测色情图片

算法步骤:

本程序根据颜色(肤色)找出图片中皮肤的区域,然后通过一些条件判断是否为色情图片。

程序的关键步骤如下:

遍历每个像素,检测像素颜色是否为肤色

将相邻的肤色像素归为一个皮肤区域,得到若干个皮肤区域

剔除像素数量极少的皮肤区域

我们定义 非 色情图片的判定规则如下(满足任意一个判定为真):

皮肤区域的个数小于 5 个

皮肤区域的像素与图像所有像素的比值小于 15%

最大皮肤区域小于总皮肤面积的 45%

皮肤区域数量超过60个

# -*- encoding=utf-8 -*-import osfrom collections import namedtuplefrom PIL import Imageimport sysimport time"""本程序根据颜色(肤色)找出图片中皮肤的区域,然后通过一些条件判断是否为色情图片。程序的关键步骤如下:遍历每个像素,检测像素颜色是否为肤色将相邻的肤色像素归为一个皮肤区域,得到若干个皮肤区域剔除像素数量极少的皮肤区域我们定义 非 色情图片的判定规则如下(满足任意一个判定为真):皮肤区域的个数小于 5 个皮肤区域的像素与图像所有像素的比值小于 15%最大皮肤区域小于总皮肤面积的 45%皮肤区域数量超过60个"""class yellow_recognition(object):Skin = namedtuple("Skin", "id skin region x y")def __init__(self, path_or_image):# 若 path_or_image 为 Image.Image 类型的实例,直接赋值if isinstance(path_or_image, Image.Image):self.image = path_or_image# 若 path_or_image 为 str 类型的实例,打开图片elif isinstance(path_or_image, str):self.image = Image.open(path_or_image)# 获得图片所有颜色通道bands = self.image.getbands()# 判断是否为单通道图片(也即灰度图),是则将灰度图转换为 RGB 图if len(bands) == 1:# 新建相同大小的 RGB 图像new_img = Image.new("RGB", self.image.size)# 拷贝灰度图 self.image 到 RGB图 new_img.paste (PIL 自动进行颜色通道转换)new_img.paste(self.image)f = self.image.filename# 替换 self.imageself.image = new_imgself.image.filename = f# 存储对应图像所有像素的全部 Skin 对象self.skin_map = []# 检测到的皮肤区域,元素的索引即为皮肤区域号,元素都是包含一些 Skin 对象的列表self.detected_regions = []# 元素都是包含一些 int 对象(区域号)的列表# 这些元素中的区域号代表的区域都是待合并的区域self.merge_regions = []# 整合后的皮肤区域,元素的索引即为皮肤区域号,元素都是包含一些 Skin 对象的列表self.skin_regions = []# 最近合并的两个皮肤区域的区域号,初始化为 -1self.last_from, self.last_to = -1, -1# 色情图像判断结果self.result = None# 处理得到的信息self.message = None# 图像宽高self.width, self.height = self.image.size# 图像总像素self.total_pixels = self.width * self.heightdef resize(self, maxwidth=1000, maxheight=1000):"""基于最大宽高按比例重设图片大小,注意:这可能影响检测算法的结果如果没有变化返回 0原宽度大于 maxwidth 返回 1原高度大于 maxheight 返回 2原宽高大于 maxwidth, maxheight 返回 3maxwidth - 图片最大宽度maxheight - 图片最大高度传递参数时都可以设置为 False 来忽略"""# 存储返回值ret = 0if maxwidth:if self.width > maxwidth:wpercent = (maxwidth / self.width)hsize = int((self.height * wpercent))fname = self.image.filename# Image.LANCZOS 是重采样滤波器,用于抗锯齿self.image = self.image.resize((maxwidth, hsize), Image.LANCZOS)self.image.filename = fnameself.width, self.height = self.image.sizeself.total_pixels = self.width * self.heightret += 1if maxheight:if self.height > maxheight:hpercent = (maxheight / float(self.height))wsize = int((float(self.width) * float(hpercent)))fname = self.image.filenameself.image = self.image.resize((wsize, maxheight), Image.LANCZOS)self.image.filename = fnameself.width, self.height = self.image.sizeself.total_pixels = self.width * self.heightret += 2return ret# 分析函数def parse(self):# 如果已有结果,返回本对象if self.result is not None:return self# 获得图片所有像素数据pixels = self.image.load()# 遍历每个像素for y in range(self.height):for x in range(self.width):# 得到像素的 RGB 三个通道的值# [x, y] 是 [(x,y)] 的简便写法r = pixels[x, y][0] # redg = pixels[x, y][1] # greenb = pixels[x, y][2] # blue# 判断当前像素是否为肤色像素isSkin = True if self._classify_skin(r, g, b) else False# 给每个像素分配唯一 id 值(1, 2, 3...height*width)# 注意 x, y 的值从零开始_id = x + y * self.width + 1# 为每个像素创建一个对应的 Skin 对象,并添加到 self.skin_map 中self.skin_map.append(self.Skin(_id, isSkin, None, x, y))# 若当前像素不为肤色像素,跳过此次循环if not isSkin:continue# 设左上角为原点,相邻像素为符号 *,当前像素为符号 ^,那么相互位置关系通常如下图# ***# *^# 存有相邻像素索引的列表,存放顺序为由大到小,顺序改变有影响# 注意 _id 是从 1 开始的,对应的索引则是 _id-1check_indexes = [_id - 2, # 当前像素左方的像素_id - self.width - 2, # 当前像素左上方的像素_id - self.width - 1, # 当前像素的上方的像素_id - self.width] # 当前像素右上方的像素# 用来记录相邻像素中肤色像素所在的区域号,初始化为 -1region = -1# 遍历每一个相邻像素的索引for index in check_indexes:# 尝试索引相邻像素的 Skin 对象,没有则跳出循环try:self.skin_map[index]except IndexError:break# 相邻像素若为肤色像素:if self.skin_map[index].skin:# 若相邻像素与当前像素的 region 均为有效值,且二者不同,且尚未添加相同的合并任务if (self.skin_map[index].region != None andregion != None and region != -1 andself.skin_map[index].region != region andself.last_from != region andself.last_to != self.skin_map[index].region):# 那么这添加这两个区域的合并任务self._add_merge(region, self.skin_map[index].region)# 记录此相邻像素所在的区域号region = self.skin_map[index].region# 遍历完所有相邻像素后,若 region 仍等于 -1,说明所有相邻像素都不是肤色像素if region == -1:# 更改属性为新的区域号,注意元祖是不可变类型,不能直接更改属性_skin = self.skin_map[_id - 1]._replace(region=len(self.detected_regions))self.skin_map[_id - 1] = _skin# 将此肤色像素所在区域创建为新区域self.detected_regions.append([self.skin_map[_id - 1]])# region 不等于 -1 的同时不等于 None,说明有区域号为有效值的相邻肤色像素elif region != None:# 将此像素的区域号更改为与相邻像素相同_skin = self.skin_map[_id - 1]._replace(region=region)self.skin_map[_id - 1] = _skin# 向这个区域的像素列表中添加此像素self.detected_regions[region].append(self.skin_map[_id - 1])# 完成所有区域合并任务,合并整理后的区域存储到 self.skin_regionsself._merge(self.detected_regions, self.merge_regions)# 分析皮肤区域,得到判定结果self._analyse_regions()return self# self.merge_regions 的元素都是包含一些 int 对象(区域号)的列表# self.merge_regions 的元素中的区域号代表的区域都是待合并的区域# 这个方法便是将两个待合并的区域号添加到 self.merge_regions 中def _add_merge(self, _from, _to):# 两个区域号赋值给类属性self.last_from = _fromself.last_to = _to# 记录 self.merge_regions 的某个索引值,初始化为 -1from_index = -1# 记录 self.merge_regions 的某个索引值,初始化为 -1to_index = -1# 遍历每个 self.merge_regions 的元素for index, region in enumerate(self.merge_regions):# 遍历元素中的每个区域号for r_index in region:if r_index == _from:from_index = indexif r_index == _to:to_index = index# 若两个区域号都存在于 self.merge_regions 中if from_index != -1 and to_index != -1:# 如果这两个区域号分别存在于两个列表中# 那么合并这两个列表if from_index != to_index:self.merge_regions[from_index].extend(self.merge_regions[to_index])del (self.merge_regions[to_index])return# 若两个区域号都不存在于 self.merge_regions 中if from_index == -1 and to_index == -1:# 创建新的区域号列表self.merge_regions.append([_from, _to])return# 若两个区域号中有一个存在于 self.merge_regions 中if from_index != -1 and to_index == -1:# 将不存在于 self.merge_regions 中的那个区域号# 添加到另一个区域号所在的列表self.merge_regions[from_index].append(_to)return# 若两个待合并的区域号中有一个存在于 self.merge_regions 中if from_index == -1 and to_index != -1:# 将不存在于 self.merge_regions 中的那个区域号# 添加到另一个区域号所在的列表self.merge_regions[to_index].append(_from)return# 合并该合并的皮肤区域def _merge(self, detected_regions, merge_regions):# 新建列表 new_detected_regions# 其元素将是包含一些代表像素的 Skin 对象的列表# new_detected_regions 的元素即代表皮肤区域,元素索引为区域号new_detected_regions = []# 将 merge_regions 中的元素中的区域号代表的所有区域合并for index, region in enumerate(merge_regions):try:new_detected_regions[index]except IndexError:new_detected_regions.append([])for r_index in region:new_detected_regions[index].extend(detected_regions[r_index])detected_regions[r_index] = []# 添加剩下的其余皮肤区域到 new_detected_regionsfor region in detected_regions:if len(region) > 0:new_detected_regions.append(region)# 清理 new_detected_regionsself._clear_regions(new_detected_regions)# 皮肤区域清理函数# 只保存像素数大于指定数量的皮肤区域def _clear_regions(self, detected_regions):for region in detected_regions:if len(region) > 30:self.skin_regions.append(region)# 分析区域def _analyse_regions(self):# 如果皮肤区域小于 3 个,不是色情if len(self.skin_regions) < 5:self.message = "Less than 3 skin regions ({_skin_regions_size})".format(_skin_regions_size=len(self.skin_regions))self.result = Falsereturn self.result# 为皮肤区域排序self.skin_regions = sorted(self.skin_regions, key=lambda s: len(s),reverse=True)# 计算皮肤总像素数total_skin = float(sum([len(skin_region) for skin_region in self.skin_regions]))# 如果皮肤区域与整个图像的比值小于 15%,那么不是色情图片if total_skin / self.total_pixels * 100 < 15:self.message = "Total skin percentage lower than 15 ({:.2f})".format(total_skin / self.total_pixels * 100)self.result = Falsereturn self.result# 如果最大皮肤区域小于总皮肤面积的 45%,不是色情图片if len(self.skin_regions[0]) / total_skin * 100 < 45:self.message = "The biggest region contains less than 45 ({:.2f})".format(len(self.skin_regions[0]) / total_skin * 100)self.result = Falsereturn self.result# 皮肤区域数量超过 60个,不是色情图片if len(self.skin_regions) > 60:self.message = "More than 60 skin regions ({})".format(len(self.skin_regions))self.result = Falsereturn self.result# 其它情况为色情图片self.message = "Nude!!"self.result = Truereturn self.result# 基于像素的肤色检测技术def _classify_skin(self, r, g, b):# 根据RGB值判定rgb_classifier = r > 95 and \g > 40 and g < 100 and \b > 20 and \max([r, g, b]) - min([r, g, b]) > 15 and \abs(r - g) > 15 and \r > g and \r > b# 根据处理后的 RGB 值判定nr, ng, nb = self._to_normalized(r, g, b)norm_rgb_classifier = nr / ng > 1.185 and \float(r * b) / ((r + g + b) ** 2) > 0.107 and \float(r * g) / ((r + g + b) ** 2) > 0.112# HSV 颜色模式下的判定h, s, v = self._to_hsv(r, g, b)hsv_classifier = h > 0 and \h < 35 and \s > 0.23 and \s < 0.68# YCbCr 颜色模式下的判定y, cb, cr = self._to_ycbcr(r, g, b)ycbcr_classifier = 97.5 <= cb <= 142.5 and 134 <= cr <= 176# 效果不是很好,还需改公式# return rgb_classifier or norm_rgb_classifier or hsv_classifier or ycbcr_classifierreturn ycbcr_classifierdef _to_normalized(self, r, g, b):if r == 0:r = 0.0001if g == 0:g = 0.0001if b == 0:b = 0.0001_sum = float(r + g + b)return [r / _sum, g / _sum, b / _sum]def _to_ycbcr(self, r, g, b):# 公式来源:# /questions/19459831/rgb-to-ycbcr-conversion-problemsy = .299 * r + .587 * g + .114 * bcb = 128 - 0.168736 * r - 0.331364 * g + 0.5 * bcr = 128 + 0.5 * r - 0.418688 * g - 0.081312 * breturn y, cb, crdef _to_hsv(self, r, g, b):h = 0_sum = float(r + g + b)_max = float(max([r, g, b]))_min = float(min([r, g, b]))diff = float(_max - _min)if _sum == 0:_sum = 0.0001if _max == r:if diff == 0:h = sys.maxsizeelse:h = (g - b) / diffelif _max == g:h = 2 + ((g - r) / diff)else:h = 4 + ((r - g) / diff)h *= 60if h < 0:h += 360return [h, 1.0 - (3.0 * (_min / _sum)), (1.0 / 3.0) * _max]def inspect(self):_image = '{} {} {}×{}'.format(self.image.filename, self.image.format, self.width, self.height)return "{_image}: result={_result} message='{_message}'".format(_image=_image, _result=self.result,_message=self.message)if __name__ == "__main__":time1=time.time()fname='E:/NSFW/QQ图片053419.jpg'n = yellow_recognition(fname)n.resize(maxheight=800, maxwidth=600)n.parse()if n.result is True:print('%s 是色情图片' %fname)else:print('%s 非色情图片' % fname)time2=time.time()print('总共耗时:' + str(time2 - time1) + 's')

\laidefa\python.exe "E:/Program Files/pycharmproject/色情图片识别项目/色情图片识别.py"E:/NSFW/QQ图片053419.jpg 非色情图片总共耗时:0.11771106719970703sProcess finished with exit code 0

如果觉得《【python 色情图片识别】python检测色情图片》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。