Opencv视觉项目VirtualNote（1）----虚拟键盘

时间：2023-05-21

前言

前段时间一直在查官方文档学CV，感觉进度较慢，而且内心空虚感觉什么都没学到，于是产生了边做边学的想法，正好也能借此发发朋友圈装个逼（事后证明效果还是不错滴）

效果

VirtualKeyboard虚拟键盘效果

知识体系库的安装及版本提示

库的版本及其重要，因为不同的版本，库函数的内容也会在做更改。有时，编译器会因此报错

import cv2import cvzoneimport mathfrom cvzone.HandTrackingModule import HandDetectorimport mediapipe as mpfrom time import sleepimport numpy as npfrom pynput.keyboard import Controller #为了使虚拟键盘工作

库的版本

软件包版本cvzone1mediapipe0.8.8numpy1.21.5opencv-python4.1.0.25pynput1.7.6opencv-contrib-python4.1.0.25

注意：

如果mediapipe的版本为最新，那么编译器极有可能报错：TypeError: create_int(): incompatible function arguments、The following argument types are supported: 1.(arg0: int) -> mediapipe.python.

解决方法：mediapipe版本降为 0.8.8

知识点详解 1.链接摄像头

#设定计算机的摄像头为图像输入cap = cv2.VideoCapture(0,cv2.CAP_DSHOW)#设置分辨率为1280*720cap.set(3,1280)cap.set(4,720)

摄像头的编号对应的功能

0、CV_CAP_PROP_POS_MSEC 视频文件的当前位置(毫秒)。1、CV_CAP_PROP_POS_frameS 下一个解码/捕获的帧基于0的索引2、CV_CAP_PROP_POS_AVI_RATIO 视频文件的相对位置3、CV_CAP_PROP_frame_WIDTH 视频流帧的宽度4、CV_CAP_PROP_frame_HEIGHT 视频流中帧的高度5、CV_CAP_PROP_FPS 帧速率6、CV_CAP_PROP_FOURCC 编解码器4字符代码7、CV_CAP_PROP_frame_COUNT 视频文件帧数8、CV_CAP_PROP_FORMAT 由retrieve()返回的Mat对象的格式9、CV_CAP_PROP_MODE 后端特定值，表示当前捕获模式10、CV_CAP_PROP_BRIGHTNESS 图像的亮度(仅用于相机)11、CV_CAP_PROP_ConTRAST 图像的对比度(仅用于相机)12、CV_CAP_PROP_SATURATION 图像的饱和度(仅用于相机)13、CV_CAP_PROP_HUE 图像的色调(仅用于相机)14、CV_CAP_PROP_GAIN 图像的增益(仅用于相机)15、CV_CAP_PROP_EXPOSURE 曝光(仅用于相机)16、CV_CAP_PROP_CONVERT_RGB Boolean标志，指示图像是否应该转换为RGB17、CV_CAP_PROP_WHITE_BALANCE 目前不支持的18、CV_CAP_PROP_RECTIFICATION 立体声相机的校正标志(注意:只有DC1394 v 2支持。x目前后台)

2.绘制键盘使用一个列表存储字符

# 根据键盘的布局创建一个列表数组，并定义一个空字符串来存储键入的键keyboard_keys = [["Q","W","E","R","T","Y","U","I","O","P"], ["A","S","D","F","G","H","J","K","L",";"], ["Z","X","C","V","B","N","M",",",".","/"]]final_text = ""

我们还需要将虚拟键盘接入笔记本上的键盘的功能，使虚拟键盘工作

keyboard = Controller()

绘制键盘

定义按键的属性

class Button(): def __init__(self,pos,text,size=[85,85]): self.pos = pos self.size = size self.text = text

for循环依次定义20个按键的x，y轴坐标

buttonList = []for k in range(len(keyboard_keys)): # 遍历列表元素 for x,key in enumerate(keyboard_keys[k]): # 增加元素到列表的末尾 buttonList.append(Button([100*x+25,100*k+50],key))

draw()函数接受两个参数（图像和按钮列表）输入，同时返回图像

def draw(img,buttonlist): for button in buttonList: x, y = button.pos w, h = button.size # 在每个键的角落绘制矩形边缘。这是为了让我们的键盘布局看起来更好看 cvzone.cornerRect(img, (button.pos[0], button.pos[1], button.size[0], button.size[0]), 20, rt=0) cv2.rectangle(img,(int(x),int(y)), (int(x + w), int(y + h)), (255, 144, 30), cv2.FILLED) # 位置参数：1.图片 2.需显示的文字 3.文字添加到图片的位置 4.字体类型 5.字体大小 6.字体颜色 7.字体粗细 cv2.putText(img, button.text, (x + 20, y + 65), cv2.FONT_HERSHEY_PLAIN, 4, (0, 0, 0), 4) return img

图形绘制可参考这篇博客：

CV3 绘制OpenCV的徽标

3.识别手势

#只在图像中寻找手img = detector.findHands(img)#返回20个手势点的坐标和边界框坐标lmList, bboxInfo = detector.findPosition(img)

detector.findHands（）函数

功能：只在图像中寻找手

输入参数：img（返回也是img，只不过手的节点被标记了）

detector.findPosition（）函数

功能：返回20个手势点的坐标和边界框坐标

输入参数：img

20个手势姿态点分布

4.根据坐标，返回字母

# lmList为手部节点坐标 if lmList: for button in buttonList: x,y = button.pos w,h = button.size # lmList[8]为食指指尖坐标，lmList[12]为中指指尖坐标 if x < lmList[8][1] < x+w and y < lmList[8][2] < y+h: cv2.rectangle(img,(int(x),int(y)),(int(x+w),int(y+h)), (0,255,255),cv2.FILLED) cv2.putText(img,button.text,(x+20,y+65),cv2.FONT_HERSHEY_PLAIN,4,(0,0,0),4) l, _, _ = detector.findDistance(8,12,img,draw = False) # print(l) if l <30: count=1 if count == 1 : keyboard.press(button.text) # 用户UI反馈，选中后修改字体和底部矩形颜色 cv2.rectangle(img,(int(x),int(y)),(int(x+w),int(y+h)),(0,255,0),cv2.FILLED) cv2.putText(img,button.text,(x+20,y+65),cv2.FONT_HERSHEY_PLAIN,4,(0,0,0),4) final_text += button.text # 设定间隔时间，避免多次选择同一字母 sleep(0.2) count=0

5.扩展，修改键盘背景

def transparent_layout(img,buttonlist): imgNew = np.zeros_like(img,np.uint8) for button in buttonlist: x,y = button.pos cvzone.cornerRect(imgNew, (button.pos[0], button.pos[1], button.size[0], button.size[0]), 20, rt=0) cv2.rectangle(imgNew, (int(x),int(y)), (int(x + button.size[0]), int(y + button.size[1])), (255, 144, 30), cv2.FILLED) cv2.putText(imgNew, button.text, (x + 20, y + 65), cv2.FONT_HERSHEY_PLAIN, 4, (0, 0, 0), 4) # 复制一份图像 out = img.copy() alpaha = 0.5 mask = imgNew.astype(bool) # 图像融合：1.图像1 2.图像1的权重 3.图像2 4.图像2的权重 5.融合后，每个像素点加的标量 out[mask] = cv2.addWeighted(img,alpaha,imgNew,1-alpaha,0)[mask] return out

蒙版知识可参考这篇博客：

CV6 图像的算术运算(以简单的抠图为例)

正如astype的中文意思，作为布尔类型，也就是true or false。

mask = imgNew.astype(bool) 将图片转化为布尔值

结果

[[ True True True] [ True True True]] [[False False False] [ True True True]]

程序代码

'''1.链接摄像头2.识别手势3.绘制键盘 3.1创建键盘字母List 3.2通过循环绘制键盘4.根据坐标，取得返回字母 4.1 利用lmList[8]食指之间坐标，判断选中的字母 4.2 利用食指与中指之间的距离，确认输入的字母 5.扩展，修改键盘背景 6.利用pynput模拟真实键盘输入'''import cv2import cvzoneimport mathfrom cvzone.HandTrackingModule import HandDetectorimport mediapipe as mpfrom time import sleepimport numpy as npfrom pynput.keyboard import Controller #为了使虚拟键盘工作#设定计算机的摄像头为图像输入cap = cv2.VideoCapture(0,cv2.CAP_DSHOW)#设置分辨率为1280*720cap.set(3,1280)cap.set(4,720)# 以 0.8 的检测置信度初始化 HandDetector 并将其分配给检测器detector = HandDetector(detectionCon=0.8)# 根据键盘的布局创建一个列表数组，并定义一个空字符串来存储键入的键keyboard_keys = [["Q","W","E","R","T","Y","U","I","O","P"], ["A","S","D","F","G","H","J","K","L",";"], ["Z","X","C","V","B","N","M",",",".","/"]]final_text = ""# 为了使虚拟键盘工作keyboard = Controller()# 绘制键盘（实心）# 接受两个参数（图像和按钮列表），并返回图像def draw(img,buttonlist): for button in buttonList: x, y = button.pos w, h = button.size # 在每个键的角落绘制矩形边缘。这是为了让我们的键盘布局看起来更好看 cvzone.cornerRect(img, (button.pos[0], button.pos[1], button.size[0], button.size[0]), 20, rt=0) cv2.rectangle(img,(int(x),int(y)), (int(x + w), int(y + h)), (255, 144, 30), cv2.FILLED) # 位置参数：1.图片 2.需显示的文字 3.文字添加到图片的位置 4.字体类型 5.字体大小 6.字体颜色 7.字体粗细 cv2.putText(img, button.text, (x + 20, y + 65), cv2.FONT_HERSHEY_PLAIN, 4, (0, 0, 0), 4) return imgdef transparent_layout(img,buttonlist): imgNew = np.zeros_like(img,np.uint8) for button in buttonlist: x,y = button.pos cvzone.cornerRect(imgNew, (button.pos[0], button.pos[1], button.size[0], button.size[0]), 20, rt=0) cv2.rectangle(imgNew, (int(x),int(y)), (int(x + button.size[0]), int(y + button.size[1])), (255, 144, 30), cv2.FILLED) cv2.putText(imgNew, button.text, (x + 20, y + 65), cv2.FONT_HERSHEY_PLAIN, 4, (0, 0, 0), 4) # 复制一份图像 out = img.copy() alpaha = 0.5 mask = imgNew.astype(bool) # 图像融合：1.图像1 2.图像1的权重 3.图像2 4.图像2的权重 5.融合后，每个像素点加的标量 out[mask] = cv2.addWeighted(img,alpaha,imgNew,1-alpaha,0)[mask] return out# 定义按键的属性class Button(): def __init__(self,pos,text,size=[85,85]): self.pos = pos self.size = size self.text = textbuttonList = []for k in range(len(keyboard_keys)): # 遍历列表元素 for x,key in enumerate(keyboard_keys[k]): # 增加元素到列表的末尾 buttonList.append(Button([100*x+25,100*k+50],key))while True: success,img = cap.read()#镜像处理img = cv2.flip(img,1) #只在图像中寻找手 img = detector.findHands(img) # 输入图像 #返回20个手势点的坐标和边界框坐标 lmList, bboxInfo = detector.findPosition(img) img = transparent_layout(img,buttonList) # lmList为手部节点坐标 if lmList: for button in buttonList: x,y = button.pos w,h = button.size # lmList[8]为食指指尖坐标，lmList[12]为中指指尖坐标 if x < lmList[8][1] < x+w and y < lmList[8][2] < y+h: cv2.rectangle(img,(int(x),int(y)),(int(x+w),int(y+h)),(0,255,255),cv2.FILLED) cv2.putText(img,button.text,(x+20,y+65),cv2.FONT_HERSHEY_PLAIN,4,(0,0,0),4) l, _, _ = detector.findDistance(8,12,img,draw = False) # print(l) if l <30: count=1 if count == 1 : keyboard.press(button.text) # 用户UI反馈，选中后修改字体和底部矩形颜色 cv2.rectangle(img,(int(x),int(y)),(int(x+w),int(y+h)),(0,255,0),cv2.FILLED) cv2.putText(img,button.text,(x+20,y+65),cv2.FONT_HERSHEY_PLAIN,4,(0,0,0),4) final_text += button.text # 设定间隔时间，避免多次选择同一字母 sleep(0.2) count=0 # 输入结果显示于图像 cv2.rectangle(img,(25,350),(700,450),(255,255,255),cv2.FILLED) cv2.putText(img,final_text,(60,425),cv2.FONT_HERSHEY_PLAIN,4,(0,0,0),4) cv2.imshow("keyboard", img) if cv2.waitKey(1) == ord('q'): breakcap.release()cv2.destroyAllWindows()

结语

这个小项目需要改进的地方还蛮多的，比如可以按下按键表示输入字母；键盘和笔记软件Markdown，Word，OneNote的联动；手写字的识别这些。希望日后能改进~

上一篇：Devops开发运维基础篇之Jenkins+SonarQube代码审查

下一篇：不同版本的jenkins迁移合并