Over the limit

[Datadog] Logs 트러블 슈팅 본문

Devops/Datadog

[Datadog] Logs 트러블 슈팅

ellapk 2024. 7. 6. 18:35

 

효율적인 트러블슈팅을 위해서는 데이터를 적절한 범위에 저장하여 탐색할 수 있도록 하고, 
각화 옵션을 활용하여 의미 있는 정보를 표시하며 관련 패싯을 목록화하여 분석할 수 있어야 합니다.


트러블슈팅 방식은 상황에 따라 달라지며, 저장된 보기를 사용하면 사용자와 팀원이 서로 다른 트러블슈팅 상황 간에 쉽게 전환할 수 있도록 도와줍니다.

 

 

트러블 슈팅을 위해 Logs 툴을 사용할건데, 어떤 기능들을 활용하면 되는지 알아보자.

 

[로그 필터링]

 

 

로그 대시보드에서, 좌측 panel을 통해 필요한 내역들만 필터링한다.

 

 

 

예시로, store-frontend와 discounts-service만 필터링하고, status는 error로 바꿔서 에러가 난 로그만 확인한다.

이제 discounts-service의 로그를 살펴보자.

 

 

 

Event Attributes/Trace/Metrics를 통해 에러 로그에 대한 간략한 내용을 알 수 있다.

각 특징에 대한 설명은 이 곳 참고

 

https://xean.tistory.com/141

 

[Datadog] 로그 관리 시작하기

데이터독에선 metris, traces, logs를 모으고, 처리하고, 분석해서 트러블 슈팅을 처리한다.이때 대답해야 할 것은 When?Where?What?How?Why? 라는 다섯가지의 질문이다. 세개의 지표를 적재적소에 활용해

xean.tistory.com

 

 

 

 

 

 

방금은 filtering으로 접근했는데, search를 통해서 content에 포함된 내용을 통한 검색도 가능하다.

상단의 에시는 filtering 이외로 추가해서 An error occurred를 서치한 상태

 

 


 

[로그 패싯]

 

 

 

 

로그를 분석하다 특정 정보만 모아보고 싶을 때 패싯 기능을 사용하면 적절하다.

원하는 소를 선택 후, Create facet for.. 를 선택하고

 

 

 

 

Path를 요로코롬 지정해주면

 

 

 

 

 

 

 


 

[저장된 보기]

 

 

 

왼쪽 상단의 View를 통해서 필터링한 로그 페이지 그대로 저장하고, 이후에 꺼내볼 수 있다.

 

 

 

+) 추가로, Live tail을 설정해서 현재 진행중인 상태를 확인할 수 있음. 

주로 15min beore상태로 로그 분석하긴한다.

 

 


 

[패턴]

 

 

 

Group into -> Patterns를 통해 로그 분석을 더 수월하게 진행할 수 있다.

 

 

 

 

 

Parsing Rule을 통해 파싱 처리된 로그를 확인한 내용

 

 

 

 

 

 

참고)

https://docs.datadoghq.com/ko/logs/explorer/facets/

 

https://docs.datadoghq.com/ko/logs/explorer/search_syntax/