答:@ NTU RGB+ D动作识别 数据集 NTU RGB + D动作识别 数据集 由56,880个动作样本组成,包含每个样本的 RGB 视频, 深度 图序列,3D骨架 数据 和红外视频。 此 数据集 由3个Microsoft Kinect v.2相机同时捕获。 RGB 视频的分辨率为1920×1080, 深度 图和红外视频均为512×424,3D骨架 数据 包含每帧25个主要身体关节的三维位置。
答:该数据集包含60个种类的动作(见表1),共56880个样本,其中有40类为日常行为动作,9类为与健康相关的动作,11类为双人相互动作。 这些动作由40个年龄从10岁到35岁的人完成。 该数据集由微软 Kinect v2传感器采集得到,并且使用了三个不同角度的摄像机,采集的数据形式包括深度信息、3D骨骼信息、RGB帧以及红外序列。 NTU数据集在划分 训练集 和 测试集 时采用了两种不同的划分标准。
答:“ NTU RGB + D”和“ NTU RGB + D 120”。 “ NTU RGB + D”包含60个动作类别和56,880个视频样本。 “ NTU RGB + D 120”通过添加另外60类和另外57,600个视频样本来扩展“ NTU RGB + D”,即“ NTU RGB + D 120”总共有120类和114,480个样本。
答:否NTU RGBD包含60个动作种类以及56880个录像。 数据集是由三个kinect V2摄像机实时捕获。 NTU RGBD数据集中的RGB录像大小为1920 1080,深度矩阵和红外录像大小为512 424。 而在3D skeletal数据集中包含志愿者在每一帧的三维坐标(包含每帧25个主要身体关节的三维位置)。