ExpressionRecognition-master
所属分类:模式识别(视觉/语音等)
开发工具:Python
文件大小:17785KB
下载次数:3
上传日期:2020-04-22 17:37:01
上 传 者:
芋泥丸子
说明: Python最简易的CNN人脸识别算法,自行下载fer2013,jaffe,ck+等人脸数据库进行识别
(The simplest CNN face recognition algorithm in Python)
文件列表:
asset (0, 2019-12-04)
asset\CNN.png (456913, 2019-12-04)
asset\Kuo_A_Compact_Deep_CVPR_2018_paper.pdf (562057, 2019-12-04)
asset\loss.png (221497, 2019-12-04)
asset\model.png (60653, 2019-12-04)
asset\rst_gui.png (183245, 2019-12-04)
asset\rst_gui2.png (1126895, 2019-12-04)
data (0, 2019-12-04)
data\demo.jpg (1867, 2019-12-04)
data\params (0, 2019-12-04)
data\params\haarcascade_frontalface_alt.xml (919871, 2019-12-04)
data\test (0, 2019-12-04)
data\test\IMG_20190702_105444.jpg (1951613, 2019-12-04)
data\test\anger1.jpg (25544, 2019-12-04)
data\test\disgust1.jpg (17376, 2019-12-04)
data\test\fear1.jpg (152635, 2019-12-04)
data\test\happy1.jpeg (60519, 2019-12-04)
data\test\happy2.png (1603507, 2019-12-04)
data\test\happy3.jpg (21096, 2019-12-04)
data\test\happy4.jpg (139038, 2019-12-04)
data\test\happy5.jpg (1211349, 2019-12-04)
data\test\happy6.jpg (6225, 2019-12-04)
data\test\neutral1.jpg (218370, 2019-12-04)
data\test\sad1.jpg (21654, 2019-12-04)
data\test\surprised1.jpg (25943, 2019-12-04)
data\test\surprised2.jpeg (21821, 2019-12-04)
data\test\zy_gray.png (2033, 2019-12-04)
data\tips.txt (54, 2019-12-04)
dataset-cite.txt (863, 2019-12-04)
fonts (0, 2019-12-04)
fonts\simsun.ttc (18214472, 2019-12-04)
images (0, 2019-12-04)
images\anger.png (14628, 2019-12-04)
images\disgust.png (16186, 2019-12-04)
images\fear.png (16175, 2019-12-04)
images\happy.png (16613, 2019-12-04)
images\neutral.png (12094, 2019-12-04)
... ...
# 表情识别
> 2019.12更新了仓库依赖。
## 简介
使用卷积神经网络构建整个系统,在尝试了Gabor、LBP等传统人脸特征提取方式基础上,深度模型效果显著。在FER2013、JAFFE和CK+三个表情识别数据集上进行模型评估。
## 环境部署
基于Python3和Keras2(TensorFlow后端),具体依赖安装如下(推荐使用conda或者venv虚拟环境)
- `git clone https://github.com/luanshiyinyang/ExpressionRecognition.git`
- `cd ExpressionRecognition`
- `pip install -r requirements.txt`
## 数据准备
数据集和预训练模型均已经上传到百度网盘,[链接](https://pan.baidu.com/s/1LFu52XTMBdsTSQjMIPYWnw)给出,提取密码为2pmd。
## 项目说明
1. 传统方法
- 数据预处理
- 图片降噪
- 人脸检测
- HAAR分类器检测(opencv)
- 特征工程
- 人脸特征提取
- LBP
- Gabor
- 分类器
- SVM
2. 深度方法
- 数据预处理
- 人脸检测
- HAAR分类器
- MTCNN(效果更好)
- 卷积神经网络
- 用于特征提取+分类
## 网络设计
使用经典的卷积神经网络,模型的构建主要参考2018年CVPR几篇论文以及谷歌的Going Deeper设计如下网络结构,输入层后加入(1,1)卷积层增加非线性表示且模型层次较浅,参数较少(大量参数集中在全连接层)。
![](./asset/CNN.png)
![](./asset/model.png)
## 模型训练
主要在FER2013、JAFFE、CK+上进行训练,JAFFE给出的是半身图因此做了人脸检测。最后在FER2013上Pub Test和Pri Test均达到67%左右准确率(该数据集爬虫采集存在标签错误、水印、动画图片等问题),JAFFE和CK+5折交叉验证均达到99%左右准确率(这两个数据集为实验室采集,较为准确标准)。
训练过程见train.ipynb文件
![](/asset/loss.png)
## 模型应用
与传统方法相比,卷积神经网络表现更好,使用该模型构建识别系统,提供GUI界面和摄像头实时检测(摄像必须保证补光足够)。预测时对一张图片进行水平翻转、偏转15度、平移等增广得到多个概率分布,将这些概率分布加权求和得到最后的概率分布,此时概率最大的作为标签。
注意,**GUI预测只显示最可能是人脸的那个表情,但是对所有检测到的人脸都会框定预测结果并在图片上标记,标记后的图片在results目录下**。
- GUI界面
- 运行scripts下的gui.py即可(图片来自百度,侵删。)
- 效果图
- ![](./asset/rst_gui.png)
- ![](./asset/rst_gui2.png)
- 实时检测
- 运行scripts下的recognition_camera.py即可
- 效果图(图片来自百度,侵删。)
- 演示不便
## 补充说明
具体项目代码、数据集、模型已经开源于我的Github,欢迎Star或者Fork。
近期下载者:
相关文件:
收藏者: