-발생일시 : 2011년 8월 6일(토)~ 8월 8일 09:00

-발생노드 :  node004, node009

-장애내용 :

 메모리 Fulll로 인한 노드 HANG

-기타안내 :

 클러스터 계산노드의 실제 메모리는 32G이며,Swap이 16G 가량 잡혀있습니다.

이에 1개의 Job이 실제 사용할 수 있는 메모리는 4G정도가 됩니다.

이 점 숙지하시어, 1개의 잡이 4G 이상의 메모리를 사용하지 않도록 해주시기 바랍니다.

[32G(실제 메모리) / 노드당 8 코어 수(작업 처리 능력)  = 4G ]

 

※이번 메모리 Full의 경우 arongdari계정에서 실행한 잡의 일부가 20G가 이상의 메모리를 사용하고,

다른 잡들에서도 상당한 메모리를 함으로써 Swap최대 영역을 초과하여 노드가 HANG 걸림.