用Python搞定WESAD和DREAMER情绪识别数据集：从数据下载、读取到可视化（附完整代码）

张开发

• 2026/6/7 10:51:51 • 15 分钟阅读

分享文章

用Python搞定WESAD和DREAMER情绪识别数据集：从数据下载、读取到可视化（附完整代码）

用Python实战WESAD与DREAMER情绪识别数据集从数据获取到深度分析全流程指南情绪识别技术正逐渐成为人机交互、心理健康监测等领域的热点。对于刚接触该领域的研究者而言如何快速获取标准数据集并提取有效信息成为首要挑战。本文将手把手带你完成WESAD和DREAMER两大经典情绪识别数据集的完整处理流程涵盖数据申请、读取技巧、信号可视化到特征提取的全套Python实现方案。1. 环境准备与数据集获取1.1 基础工具链配置处理生理信号数据需要特定的Python库支持。推荐使用conda创建独立环境以避免依赖冲突conda create -n emotion_analysis python3.8 conda activate emotion_analysis pip install numpy scipy matplotlib seaborn pandas scikit-learn关键库的作用说明Scipy处理.mat格式的MATLAB数据文件Pickle读取Python特有的.pkl二进制格式Matplotlib/Seaborn数据可视化核心工具Pandas结构化数据整理与分析1.2 数据集获取实战WESAD数据集下载WESAD作为公开数据集可直接从官网下载。数据集包含15名受试者的多模态生理信号采样频率高达700Hz特别适合研究压力与情绪状态。下载后解压得到的典型目录结构WESAD/ ├── S1.pkl ├── S2.pkl ... └── S15.pklDREAMER数据集申请DREAMER需要向数据集提供方提交使用申请。该数据集包含23名受试者观看情感诱发视频时的ECG和EEG信号附带详细的情感维度评分效价、唤醒度、支配度。申请通过后会收到.mat格式的数据文件其结构如下DREAMER.mat ├── Data (23 subjects) │ ├── EEG │ ├── ECG │ └── Emotion Scores ├── SamplingRate └── ElectrodesInfo提示DREAMER的申请邮件需包含研究目的和机构信息通常2-3个工作日可获得回复2. 数据读取与解析技巧2.1 破解WESAD的pkl文件WESAD使用Python的pickle格式存储数据但直接读取可能遇到编码问题import pickle def load_wesad_subject(subject_path): try: with open(subject_path, rb) as f: data pickle.load(f, encodinglatin1) # 处理特殊编码 except Exception as e: print(f加载失败: {str(e)}) return None # 数据结构验证 required_keys [label, subject, signal] if not all(k in data for k in required_keys): raise ValueError(数据格式异常缺少必要字段) return { labels: data[label], chest_signals: data[signal][chest], wrist_signals: data[signal][wrist] }典型信号采样率对照表信号类型传感器位置采样率(Hz)数据维度ECG胸部700[n_samples, 1]EDA腕部4[n_samples, 1]ACC双位置32/700[n_samples, 3]2.2 解析DREAMER的mat文件DREAMER采用MATLAB的.mat格式需使用scipy.io特殊处理from scipy.io import loadmat def load_dreamer_data(mat_path): data loadmat(mat_path, simplify_cellsTrue)[DREAMER] # 构建结构化数据 subjects [] for subj in data[Data]: subjects.append({ ECG: { baseline: subj[ECG][baseline], stimuli: subj[ECG][stimuli], sampling_rate: data[ECG_SamplingRate] }, scores: { valence: subj[ScoreValence], arousal: subj[ScoreArousal], dominance: subj[ScoreDominance] } }) return subjects注意设置simplify_cellsTrue可自动转换MATLAB的cell数组为Python列表3. 信号可视化与特征工程3.1 多模态信号可视化ECG信号时频分析import matplotlib.pyplot as plt from scipy import signal def plot_ecg_analysis(ecg_data, fs700): # 时域图 plt.figure(figsize(12, 8)) plt.subplot(2, 1, 1) plt.plot(np.arange(len(ecg_data))/fs, ecg_data) plt.title(ECG时域信号) plt.xlabel(时间(s)) # 频域图 plt.subplot(2, 1, 2) f, Pxx signal.welch(ecg_data, fs, nperseg1024) plt.semilogy(f, Pxx) plt.title(ECG功率谱密度) plt.xlabel(频率(Hz)) plt.tight_layout()多信号同步对比def plot_multimodal_signals(chest_data, wrist_data, start0, duration10): fs_chest 700 fs_wrist 4 fig, axs plt.subplots(3, 1, figsize(12, 10)) # ECG信号 axs[0].plot(np.arange(start*fs_chest, (startduration)*fs_chest)/fs_chest, chest_data[ECG][start*fs_chest:(startduration)*fs_chest]) axs[0].set_title(胸部ECG信号) # EDA信号对比 axs[1].plot(np.arange(start*fs_chest, (startduration)*fs_chest)/fs_chest, chest_data[EDA][start*fs_chest:(startduration)*fs_chest], label胸部EDA) axs[1].plot(np.arange(start*fs_wrist, (startduration)*fs_wrist)/fs_wrist, wrist_data[EDA][start*fs_wrist:(startduration)*fs_wrist], label腕部EDA) axs[1].legend() # 温度对比 axs[2].plot(np.arange(start*fs_chest, (startduration)*fs_chest)/fs_chest, chest_data[TEMP][start*fs_chest:(startduration)*fs_chest], label胸部温度) axs[2].plot(np.arange(start*fs_wrist, (startduration)*fs_wrist)/fs_wrist, wrist_data[TEMP][start*fs_wrist:(startduration)*fs_wrist], label腕部温度) axs[2].legend()3.2 特征提取实战时域特征计算def extract_time_features(signal, fs): features {} # 基础统计量 features[mean] np.mean(signal) features[std] np.std(signal) features[skew] scipy.stats.skew(signal) # Hjorth参数 diff1 np.diff(signal, 1) diff2 np.diff(signal, 2) features[activity] np.var(signal) features[mobility] np.sqrt(np.var(diff1) / features[activity]) features[complexity] np.sqrt(np.var(diff2) / np.var(diff1)) / features[mobility] return features频域特征提取def extract_freq_features(signal, fs): f, Pxx signal.welch(signal, fs, nperseg1024) features { total_power: np.trapz(Pxx, f), lf_power: np.trapz(Pxx[(f 0.04) (f 0.15)], f[(f 0.04) (f 0.15)]), hf_power: np.trapz(Pxx[(f 0.15) (f 0.4)], f[(f 0.15) (f 0.4)]), lf_hf_ratio: None } features[lf_hf_ratio] features[lf_power] / features[hf_power] return features4. 情绪状态分类实践4.1 标签处理与数据集构建WESAD标签转换示例def map_wesad_labels(labels): 将原始标签映射为情绪类别 label_map { 1: neutral, 2: stress, 3: amusement } return np.array([label_map.get(l, unknown) for l in labels])DREAMER三维情感空间处理def discretize_dreamer_scores(scores, bins3): 将连续评分离散化为低、中、高三级 discretized {} for dim in [valence, arousal, dominance]: discretized[dim] pd.cut(scores[dim], binsbins, labels[low, medium, high]) return discretized4.2 机器学习分类流程完整分类示例代码from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report def emotion_classification_pipeline(features, labels): # 数据集划分 X_train, X_test, y_train, y_test train_test_split( features, labels, test_size0.2, stratifylabels) # 模型训练 clf RandomForestClassifier(n_estimators100, random_state42) clf.fit(X_train, y_train) # 评估 y_pred clf.predict(X_test) print(classification_report(y_test, y_pred)) # 特征重要性分析 importances pd.Series(clf.feature_importances_, indexfeatures.columns) importances.sort_values().plot.barh()提示对于生理信号数据建议使用时间序列专属模型如LSTM或Transformer可获得更好效果4.3 结果可视化技巧混淆矩阵增强展示from sklearn.metrics import confusion_matrix def plot_confusion_matrix(y_true, y_pred, classes): cm confusion_matrix(y_true, y_pred, normalizetrue) plt.figure(figsize(8, 6)) sns.heatmap(cm, annotTrue, fmt.2f, cmapBlues, xticklabelsclasses, yticklabelsclasses) plt.xlabel(Predicted) plt.ylabel(Actual) plt.title(Normalized Confusion Matrix)在实际项目中我发现信号质量的预处理对最终分类效果影响极大。特别是ECG信号采用合适的带通滤波(0.5-40Hz)和R波检测能显著提升特征提取的可靠性。对于WESAD数据集将腕部和胸部信号特征融合使用可比单一信号源提升约15%的准确率。

更多文章

前端开发 2026/6/7 10:50:36

颠覆式视频压缩技术：CompressO实现93.91%体积缩减的核心突破

颠覆式视频压缩技术：CompressO实现93.91%体积缩减的核心突破【免费下载链接】compressO Convert any video/image into a tiny size. 100% free & open-source. Available for Mac, Windows & Linux. 项目地址: https://gitcode.com/gh_mirrors/co/compr…

自动锁螺丝机程序三轴龙门架式（Y轴带着X z轴一起动，吸钉式) 显控触摸屏加三菱FX3GA或者FX3U ， 用PLC变址寄存器做配方，程序思路清晰，带详细注解。支持示教调整每颗螺丝位置。可以设定从第几颗开始打，打螺丝…

张开发

前端开发 2026/6/6 6:30:06

技术团队领导一对一沟通指南：打造高效人员管理与反馈机制

技术团队领导一对一沟通指南：打造高效人员管理与反馈机制【免费下载链接】tlroadmap Тимлид – это ❄️, потому что в каждой компании он уникален и неповторим. 项目地址: https://gitcode.com/gh_m…

张开发

用Python搞定WESAD和DREAMER情绪识别数据集：从数据下载、读取到可视化（附完整代码）

最新文章

PAT乙级刷题避坑指南：从‘我要通过！’到‘狼人杀’，那些题目里没说清的隐藏考点

从芯片设计到客户手里：揭秘AE、FAE、PE、VE如何接力完成一颗IC的旅程

用PaddleOCR v3搞定80种语言图片文字提取：从安装到实战避坑全记录

保姆级避坑指南：在ROS Noetic上搞定aruco_ros编译与单目相机定位（解决CV_FILLED报错）

碧蓝航线Alas脚本完整指南：自动化游戏终极解决方案

FUXA工业级可视化监控系统：5天从零构建专业SCADA平台的完整指南

推荐文章

相关文章

分享文章

更多文章

颠覆式视频压缩技术：CompressO实现93.91%体积缩减的核心突破

自动化测试工程师：脚本之外，更需业务洞察

如何实现微信聊天记录的永久保存与智能分析

Phi-3 Forest Lab效果展示：对LLM论文逐段精读+关键结论可视化提取

如何让设计规范传递像聊天一样自然？

实战避坑：如何用Wireshark抓包分析BLE配对降级攻击（附Python脚本）

余姚加工中心编程培训学校怎么选

避坑指南：OpenCV glob遍历图片时你可能忽略的3个细节（路径格式/递归参数/异常处理）

在 Ansible 中，`with_items` 关键词的使用指南

USB2.0协议解析：从物理拓扑到数据流模型

三轴螺丝机配方管理实战：三菱PLC变址寄存器的妙用

技术团队领导一对一沟通指南：打造高效人员管理与反馈机制