本项目实现了一个完整的手语识别流程: 从手语视频帧中提取手部关键点序列,训练 Transformer 分类模型,并通过网页实时调用摄像头完成在线识别与文字输出。 离线特征提取:使用 MediaPipe Hands 将每帧图像转换为关键点向量(最多双手,126 维/帧)。 模型训练 ...
基于 MediaPipe + OpenCV 的实时手势识别系统,通过摄像头捕捉手部动作并映射为计算机控制指令(音量调节、PPT翻页、媒体播放、窗口关闭等)。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果