基于opencv的深度学习瞳孔识别 yolo眼球识别与追踪项目

张开发
2026/4/16 14:35:43 15 分钟阅读

分享文章

基于opencv的深度学习瞳孔识别 yolo眼球识别与追踪项目
文章目录基于opecv的眼睛瞳孔追踪项目项目概述数据集与模型训练项目目标结果分析使用说明2. 安装所需依赖3. 运行程序3.1 使用摄像头进行实时追踪3.2 使用视频文件进行瞳孔追踪4. 输出结果未来工作结论基于opecv的眼睛瞳孔追踪项目项目概述该项目是一个基于YOLOv5s模型实现的瞳孔追踪程序。YOLOv5是一个由Ultralytics开发的目标检测模型因其高效且准确的特性而广泛应用于实时目标检测任务中。这个瞳孔追踪程序利用YOLOv5s模型对视频流或摄像头输入进行瞳孔的检测与追踪。该程序的目标是能够从摄像头捕获的实时视频流或预录制的视频文件中检测并跟踪眼睛的瞳孔位置适用于多种领域例如眼动追踪、心理学研究、辅助技术设备以及计算机视觉中的人机交互。数据集与模型训练为了训练该模型本项目使用了数据集进行了Eye Tracking Video Representation进行训练。这个数据集包含了多种不同场景下的人眼及瞳孔图像适合用于眼部检测和追踪任务。数据集中的图片不仅包括不同的眼睛角度还有一定的光照变化这为模型的鲁棒性提供了有力支持。YOLOv5s是YOLOv5系列模型中较小且计算效率较高的版本在本项目中采用YOLOv5s模型进行瞳孔检测能够在保持较高精度的同时提供实时的处理速度。项目目标瞳孔检测与追踪通过摄像头或视频流捕捉人眼的瞳孔进行实时检测和追踪。实时性通过优化的YOLOv5s模型保证程序能够在一般计算资源下例如普通的电脑或笔记本实现实时的瞳孔追踪。高准确率与鲁棒性通过对ETVR数据集的训练保证瞳孔检测在不同光照、角度以及其他干扰因素下依然能够高效准确地进行。结果分析在验证数据集上的评估结果如下精确度Precision0.993精确度表示在所有被模型预测为瞳孔的样本中实际为瞳孔的比例。该模型的精确度非常高达到了99.3%说明模型在大多数情况下能够准确识别瞳孔位置。召回率Recall0.920召回率表示所有实际为瞳孔的样本中模型能够成功检测到的比例。召回率为92.0%表明模型在大部分真实瞳孔样本上都能够成功检测出来。mAP50平均精度均值IoU0.50.956mAP50是目标检测任务中常用的评估指标之一表示在IoU阈值为0.5的情况下模型的平均精度。0.956的结果表明模型在不同的测试数据上表现出了非常高的精度。mAP50-95平均精度均值IoU0.5至0.950.442mAP50-95的指标衡量的是模型在不同IoU阈值下的综合表现。0.442的结果表明模型对于不同重叠度的容忍度适中且在检测精度上有良好的平衡。这些评估结果表明该模型在瞳孔检测任务中具备较高的精度和较强的鲁棒性。使用说明进入项目目录cd2. 安装所需依赖该项目依赖于一些Python包来支持模型训练与推理。你可以使用以下命令来安装所有的依赖pipinstall-rrequirements.txt3. 运行程序程序支持两种输入方式摄像头视频流或本地视频文件。3.1 使用摄像头进行实时追踪如果你希望使用摄像头来进行实时的瞳孔追踪可以使用以下命令来启动程序python main.py00表示使用默认的摄像头设备通常是内置的摄像头。如果你的设备有多个摄像头可以通过更改数字来选择其他摄像头例如python main.py 1表示使用第二个摄像头。3.2 使用视频文件进行瞳孔追踪如果你希望使用一个本地视频文件进行瞳孔追踪可以使用以下命令python main.py /path-to-your-file将/path-to-your-file替换为你的视频文件的路径。程序将读取视频文件并对其中的每一帧进行瞳孔检测与追踪。4. 输出结果程序会在窗口中显示实时的瞳孔检测与追踪结果。你可以看到检测到的瞳孔被框选出来并且模型会在视频流中跟踪这些瞳孔的位置。对于视频文件程序会逐帧展示每一帧的检测结果。此外程序还会打印一些关于检测过程的统计信息如检测到的瞳孔数量、帧率等帮助你了解模型在实际使用中的表现。未来工作尽管当前模型已经能够较好地完成瞳孔检测与追踪任务但仍然有一些提升的空间提高召回率尽管精确度非常高但召回率仍然有提升的空间尤其是在一些特殊场景中如低光照或角度极端的情况下。优化模型大小YOLOv5s已经是一个较小的模型但如果能进一步优化其结构降低模型大小可能会在移动设备或低资源环境下获得更好的表现。多目标追踪当前模型仅支持单一瞳孔的追踪但在一些复杂场景下可能需要同时追踪多个人的瞳孔未来可以考虑扩展到多目标检测和追踪。增强对动态场景的适应性在一些动态场景中背景的变化可能会干扰模型的检测未来可以考虑引入背景抑制或运动补偿等技术提升模型的鲁棒性。结论通过YOLOv5s模型实现的瞳孔追踪程序能够在不同的应用场景下提供高效且准确的瞳孔检测和追踪功能。利用YOLOv5s的高效推理能力和ETVR数据集的多样性项目在精度和召回率上都取得了优异的表现。随着进一步的优化和扩展未来该项目有望在眼动追踪、心理学研究以及智能交互系统等多个领域获得更广泛的应用。

更多文章