1. 개요 및 연구동기
임상 및 역학 연구 모두에서 정확하고 저렴한 수면 측정도구가 필요하다. 이를 위해 웨어러블 가속도계는 가격이 저렴하고 합리적으로 정확한 estimates of movement 를 제공한다. 고해상도 가속도계 데이터에서 수면을 분류하는 기술은 주로 경험적 알고리즘에서 의존한다. 본 논문에서는 Random Forest를 사용하여 수면을 감지할 수 있는 가능성을 탐구한다.
134명의 성인 데이터를 가지고 실험했다. (수면 장애 70명, 건강한 수면자 64명)
손목에 가속도계를 착용하여 데이터를 수집하였다.
24명의 테스트세트에서 73.93%의 F1 score 로 수면-각성 상태를 구별할 수 있었다.
가속도가 착용되었는지 여부를 예측하는 것도 기계학습을 통해 F1 score 에서 93.31% 의 정확도를 보였다.
가속도계분류만으로는 sleep stage classification은 어려운 것으로 나타났다.
수면다원검사(PSG)는 비요이 많이 들기 때문에 대규모 인구조사에는 적합하지 않다.
반면 수면일기는 침대에 누워있는 시간이 얼마나 되는지에 대한 정보는 얻을 수 있지만 회상편향이 있을 수 있으며 정확한 수면시간을 파악하기 어렵다. 따라서 웨어러블 가속도계를 사용한 수면 모니터링이 대안으로 연구되어왔다.
piezo-electric acceleration sensors 에 의존하는 데이터이다.
2. Results
평가된 30초 간격 중 각성 및 다양한 수면 단계에 해당하는 샘플 수는 표 1에 나타나있다.
2-1. Sleep-wake classification
sleep-wake 분류의 경우 N1, N2, N3 및 REM으로 표시된 샘플은 수면 샘플로 간주된다.
2-1-1. vanHees approach
"방법" 세션에 설명된 vanHees heuristic algorithm 은 가속도계 데이터에 적용되어 각성 또는 수면의 이진 분류를 얻는다. 외부 교차 검증 및 테스트 세트에서 분류 성능은 표 2에 나타냈다.
2-1-2. random forest
5개의 교차 검증 폴드에 각각에 대한 Sleep-Wake 분류를 위해 훈련된 Random Forest 모델에 대해 선택된 하이퍼파라미터는 (trees, max-length) 쌍으로 (400,Full), (500,Full), (400,Full), (200,Full), (200,Full) 이다. 여기서 Full 의 최대 깊이는 종료 기준이 충족될 때까지의 의사결정 트리가 어떤 깊이로든 성장할 수 있음을 의미한다. random forest가 vanhee 보다 성능이 더 좋다는 것을 볼 수 있다.
그림 1의 confusion matrix 에서 볼 수 있듯이 랜덤 포레스트는 vanHees approach 에 비해 각성 감지 성능이 더 뛰어나다. 다만 수면-기상 샘플 수는 불균형이 심하다. 모든 fold 에 걸쳐 분포된 Feature는 supplementary information figure4 에 표시된다. LIDS와 Zangle 에 대한 통계적 측정이 수면-각성 분류의 가장 중요한 특징임을 알 수 있다.
2-1-3. Healthy versus poor sleepers
그림 2는 수면 상태가 좋지 않은지 건강한지 여부에 따라 각 사용자의 수면 시간에 대한 F1 점수 도표를 보여준다. 빨간색 마커는 각 사용자의 수면 F1 점수를 나타내고 녹색 마커는 각성상태의 F1 점수를 나타낸다.
우리는 수면 시간에 대한 상관계수와 건강한 수면자와 건강하지 않은 수면자의 F1 점수를 구했다.
2-2 Nonwear classification
5개의 cross validation fold 각각에 대한 Nonwear 분류를 위해 훈련된 Random Forest 모델에 대해 선택된 하이퍼파라미터는 (trees, max-length) 튜플로 (500,15), (100,15), (200,15), (300,20), (500,15).
테스트세트에 대한 성능은 표2, confusion matrix는 그림 1 에 나와있다.
분류에 대한 중요한 특징은 supplementary material figure 7에 나와있다.
LIDS, Z angle 에 대한 통계 측정이 가장 중요함을 알 수 있다.
2-3 Sleep stage classification
수면 분류의 다양한 클래스는 METHOD 항목에 설명된 대로 클래스 게층 구조로 구성될 수 있다. 이 계층 구조에 따라 가속도계 샘플을 분류하면 비마고 감지, 수면-기상 및 수면 단계 분류를 수행하기 위한 데이터의 식별 속성(있는 경우) 을 이해해는데 도움이 될 수 있다. 36개의 feature 와 랜덤 포레스트를 사용하여 샘플의 계층적 분류를 수행한다.
테스트 성능은 표 3에 있다.
REM, N1, N3 과 같은 리프 노드로 구성된 레벨 3,4,5 에서는 성능이 크게 저하된다. 실제 클래스와 예측클래스의 confusion matrix 는 그림 3에 나와있다. 깊은 수면과 낮은 수면을 구별하기 힘들어한다는 것을 알 수 있다.
2.4 Nap detection
자가보고된 낮잠시간은 가속도계 기반 추정치에 비해 13분 적었고 상관관계는 0.6 이었다. 해당 데이터에 대한 그림은 supplementary materials 참고
2.5 Discussion
우리의 실험을 바탕으로 가속도계 전용 데이터에 적용된 랜덤 포레스트와 같은 기계 학습 접근 방식은 1990년대에 제안된 접근 방식과 vanHees[9]에서 제안한 휴리스틱 알고리즘에 비해 수면-기상 분류를 향상시킨다. 그러나 현재의 연구 결과는 낮잠 감지에 대한 추가 연구를 장려하는 것으로 간주되어야 하며 수면 연구에 즉각적인 적용을 정당화하는 증거는 아닙니다. 가속도계 데이터를 바탕으로 한 수면 단계 분류는 데이터에 차별적 특징이 없기 때문에 더욱 어려운 것으로 나타났습니다. 우리의 수면 분류 접근방식은 [13]과 가장 비슷하다. (중략.. 13의 방법과 비교함)
3. Methods
원시 가속도계 데이터는 R GGIR22 를 사용하여 다양한 가속도계에서 얻은 binary 파일에서 추출되었다.
중력가속도[23]와 관련된 신호 보정과 GGIR 알고리즘을 사용하여 전처리했다. 그리고 수면-기상, 비착용, 수면단계분류를 수행하기 위해 Random Forest 를 사용했다.
3.1 Random forests
모든 분류 작업에서 사용했다.
처음에는 딥러닝을 시도했지만 vanHees 보다 좋지 않았기 때문에 random forest 를 사용했다.
3.1.1 ENMO : Euclidean Norm Minus One
g 에서 0 으로 반올림된 음수 값을 갖는 ENMO 는 가속도의 크기와 인간의 에너지 소비가 상관관계가 있다고 나타났다[16]
3.1.2 Z-angle
피부표면에 수직인 가속도계의 축과 수평면 사이의 각도를 의미한다. 연속적인 시간 간격에 따른 Z 각도의 변화는 자세 변화의 지표일 수 있다.
3.1.3 LIDS : Locomotor Inactivity During Sleep
운동 활동이 커질수록 작아지는 값이다.
3.1.4 Imbalanced data
불균형인 데이터세트에 대해 패키지[26]의 SMOTE[25] 를 사용하여 리샘플링했다.
3.1.7 Sleep-wake classification
vanhees, [6], [5]를 비교군으로 사용했다. vanhees 는 가속도계 데이터에서 추정된 중력 성분을 기준으로 (낮은) 팔 각도를 사용하여 수면 상태와 각성 상태를 구별합니다. 여기서 ax, ay 및 az는 롤링 5초 창에 걸쳐 계산된 세 가속도계 축의 중앙값입니다. vanHees 알고리즘은 자는 상태와 깨어있는 상태를 구별하기 위해 다음 단계를 수행합니다.
1. 5초 마다 Z-angle 의 평균 값 계산
2. 각도가 최소 5분동안 5도 이상 변하지 않는 범위 식별
3. 해당 시간 중에 수면이라는 라벨을 붙임
참가자의 건강상태에 따른 수면-각성 분류를 분석하였다. 수면 불량자는 다양한 수면 장애를 진단받은 참가자이고, 건강한 수면자는 수면 장애가 없는 참가자입니다.
Data availability
https://zenodo.org/records/3752645
Sleep classification from wrist-worn accelerometer data using Random Forests
Accurate and low cost sleep measurement tools are needed in both clinical and epidemiological research. To this end, wearable accelerometers are widely used as they are both low in price and provide reasonably accurate estimates of movement. Techniques to
zenodo.org
'컴퓨터과학' 카테고리의 다른 글
[논문읽기] CROSS-LEVEL CONTRASTIVE LEARNING AND CONSISTENCY CONSTRAINT FOR SEMI-SUPERVISED MEDICAL IMAGE SEGMENTATION (0) | 2023.10.30 |
---|---|
[논문읽기] Semi-supervised Spatial Temporal Attention Network for Video Polyp Segmentation (0) | 2023.10.16 |
[논문읽기] Matching Networks for One Shot Learning (0) | 2023.10.11 |
html <select> 태그의 옵션과 <optgroup> (0) | 2023.10.09 |
numpy.vectorize 함수 (0) | 2023.10.05 |
댓글