목록Devops/Datadog (13)
Over the limit

메트릭이란지연, 오류 비율에서 사용자 가입까지 시간에 따른 모든 환경 변화를 추적할 수 있는 숫자 값Datadog에서 메트릭 데이터는 데이터 요소로 수집 및 저장되며, 값과 타임 스탬프를 포함한다. 메트릭이 왜 유용한지?시스템에 대한 전반적인 그림을 제공한다. 메트릭을 사용해 한눈에 환경 상태를 평가할 수 있다.즉, 사용자가 얼마나 빠르게 웹사이트를 로딩하고 서버에서 메모리를 소비하는지 즉각적으로 보여준다.문제를 파악 후, 로그 및 추적을 사용하여 트러블 슈팅 할 수 있다. 메트릭 쿼리 분석 커스텀 메트릭750개 이상의 Datadog 통합 중 하나에서 전송되지 않으면 커스텀 메트릭으로 간주된다.일반적으로 DogstatsD또는 커스텀 에이전트 점검을 통해 전송하는 모든 메트릭은 커스텀 메트릭임 속성..

데이터독 통합은 아래와 같이 크게 세가지 구조로 이루어져 있다. 1. Agent-based : 데이터독 에이전트와 파이썬 클래스 'check'로 수집할 메트릭을 정의함2. Authentication(crawler) based : Integrations은 Datadog에 셋업 되고, 그 안에서 API로 메트릭을 얻을 수 있는 권한을 얻는다. 흔한 예로는 Slack, AWS, Azure 등이 있음3. Library : Datadog API를 사용해서 개발 당시 사용한 언어로 앱을 모니터링 할 수 있도록 한다. 예를 들어 node.js, python이 있음 - 750개 이상이 존재하며, 웬만한 소프트웨어들은 다 있다.. 통합 설정을 하면 시스템, 앱, 서비스를 모니터링 할 수 있다. 하지만 모니터링 하..

실습을 통해 자바스크립트 프론트에서 일어나는 오류를 RUM으로 모니터링해보자. 앱 빌드 과정을 거친 후, 등록된 모의 사이트에 접속한다. Username: olivia.martinez@example.comPassword: password모의 가짜 계정으로 로그인을 시도하면 에러가 발생한다.이 과정동안 RUM 에서는 무슨 일이 일어났을까? Digital Experience > Real User Monitoring > Explorer 로 이동해서 search에 error count를 등록한다. 그럼 다음과 같이 에러만 모아서 확인이 가능하고, Issue로 이동하면 Issue Details 확인이 가능하다.프론트 개발 환경 로그에서 직접 확인해야 볼 법한 오류 내역들을,이처..

Agent의 로그 레벨 설정은 기본적으로 INFO다. 로그 레벨을 DEBUG로 설정해서 더 많은 정보를 알아보자. 로컬 datadog.yaml 파일을 수정하세요. 사용하는 OS에 맞게 구체적인 안내를 받으려면 Agent 주요 설정 파일을 참조하시기 바랍니다.# log_level: INFO를 log_level: DEBUG로 치환합니다(#을 삭제해 라인의 코멘트를 해제하세요).Datadog Agent를 재시작하세요. OS에 맞게 구체적인 안내를 확인하려면 Agent 명령어를 참조하시기 바랍니다.몇 분 기다리시면 로그가 생성됩니다. OS에 맞는 안내를 확인하려면 Agent 로그 파일을 참조하세요. 다음과 같은 설명을 따라서 디버그 모드를 실행시켜보자. 디버그 모드 실행 전의 로그 상태, 디버그 모드 ..
7.4.0 버전부터 에이전트는 호스트 이름을 필요로 한다.호스트 이름이 없으면 에이전트가 시작 된 이후 오류와 함께 종료된다. Error while getting hostname, exiting: unable to reliably determine the host name. You can define one in the agent config file or in your hosts file -> 이 경우 로그에 나타나는 ERROR 메시지 1. Kubernetes 호스트 이름 오류에이전트가 다음 중 하나 이상에 액세스할 수 없음을 나타낸다. - Kubelet API- 클라우드 공급자 메타데이터 엔드포인트- 컨테이너 런타임 API 보통 Kubelet API에 연결할 수 없는 가장 일반적인 오류는 Kube..

Docker 컨테이너에서 Datadog 에이전트를 실행하는 상황을 가정하고 트러블 슈팅을 진행하자 1. 도커 설치https://xean.tistory.com/139 [Docker] 윈도우에 도커 설치https://docs.docker.com/desktop/install/windows-install/ Install Docker Desktop on WindowsGet started with Docker for Windows. This guide covers system requirements, where to download, and instructions on how to install and update.docs.docker.com 해당xean.tistory.com 2. Datadog API 키 생성 ..

docker-compose 실행 시 다음과 같은 오류가 났다. ping으로 해당 사이트와 연결 시도를 해봤을 때 문제가 없었기 때문에DNS 서버 접근 자체에 문제가 없는 것이다.그럼에도 불구하고 Datadog 에이전트가 DNS 오류로 인해 작동하지 않는다면, Datadog DNS 부분 쪽을 손봐야하는 상황 1. conf.d/dns_check.d/conf.yaml.example 파일 수정 DNS 점검은 Datadog 에이전트 패키지에 포함된다.서버에 추가 설치할 필요 없고, 해당 경로를 찾아가면 파일을 발견할 수 있을 것이다. init_config:instances: ## @param name - string - required ## Name of your DNS check instance..

데이터독의 실제 사용자 모니터링(RUM)은 이러한 문제를 해결하는 데 도움이 되도록 개발되었습니다. 1. 응용 프로그램 성능: 소프트웨어가 사용자에게 어떻게 작동하고 있습니까? 빠르게 로딩되고 있습니까? 오류가 있습니까?2. 사용자 세부 정보 및 행동: 실제 사용자들은 소프트웨어와 상호 작용할 때 무엇을 보고 무엇을 하고 있습니까? 어떤 페이지를 가장 많이 방문합니까? 그들은 어떤 장치, 브라우저, 운영 체제를 사용하고 있습니까? RUM을 통해서 확인할 수 있는 정보는 크게 두가지이다. - User journey : 사용자가 한 모든 일, 방문한 페이지, 클릭한 요소에 대한 기록뿐만 아니라 브라우저, 운영체제 와 같이 프로그램에 액세스한 방법에 대한 세부 정보도 포함된다.- Frontend Perfor..

효율적인 트러블슈팅을 위해서는 데이터를 적절한 범위에 저장하여 탐색할 수 있도록 하고, 시각화 옵션을 활용하여 의미 있는 정보를 표시하며 관련 패싯을 목록화하여 분석할 수 있어야 합니다.트러블슈팅 방식은 상황에 따라 달라지며, 저장된 보기를 사용하면 사용자와 팀원이 서로 다른 트러블슈팅 상황 간에 쉽게 전환할 수 있도록 도와줍니다. 트러블 슈팅을 위해 Logs 툴을 사용할건데, 어떤 기능들을 활용하면 되는지 알아보자. [로그 필터링] 로그 대시보드에서, 좌측 panel을 통해 필요한 내역들만 필터링한다. 예시로, store-frontend와 discounts-service만 필터링하고, status는 error로 바꿔서 에러가 난 로그만 확인한다.이제 discounts-service의 로그를 살펴..

데이터독에선 metris, traces, logs를 모으고, 처리하고, 분석해서 트러블 슈팅을 처리한다.이때 대답해야 할 것은 When?Where?What?How?Why? 라는 다섯가지의 질문이다. 세개의 지표를 적재적소에 활용해서 이 질문들을 풀어보자. Metrics, Traces and Logs → When?각각의 데이터 타입은 생성시 타임스탬프를 포함하고 있기 때문에 시기를 알 수 있다. Metrics, Traces, Logs → Where?또한, 시기 뿐만 아니라 어디서 온 데이터인지도 포함하고 있다. 태그를 통해서도 확인이 가능하다. Metrics → What?메트릭을 통해 '무슨 일이 일어나고 있는지' 를 가늠할 수 있다.앱 서비스의 지연성, 웹 페이지를 보고 있는 사용자들, 오토스케일..