No video

Linux: отказоустойчивый мониторинг Thanos + Prometheus

  Рет қаралды 1,393

Digital Studium

Digital Studium

Күн бұрын

В этом видео описывается, как организовать отказоустойчивый мониторинг с помощью Grafana + Thanos + Prometheus + Alertmanager + Node-Exporter/Cadvisor
Репозиторий: git.digitalstu...

Пікірлер: 15
@hoowoo7309
@hoowoo7309 3 ай бұрын
да очень круто обьясняешь много видосов посмотрел, спосибо огромное, продолжай в том же духе!
@kopevar53
@kopevar53 Жыл бұрын
Спасибо за контент! Будет интересно посмотреть на отказоустойчивый кластер VictoriaMetrics.
@AutomationCraft
@AutomationCraft Жыл бұрын
Супер!! комментарий в поддержку канала!
@9Ibis007
@9Ibis007 8 ай бұрын
Так же можно посмотреть в сторону Prometheus Federation + Thanos
@alexbrofman5935
@alexbrofman5935 Жыл бұрын
Реально очень круто, а самое главное качественно и доступно что очень важно!! Спасибо огромное за работу... Слушай а как ти смотриш на то чтоби дополнительно внедрить victoriametrics ? Если есть опыт реально было бы круто показать , такого контента точно ни у кого нету))) Еще раз спасибо
@DigitalStudium
@DigitalStudium Жыл бұрын
Спасибо за столь хороший отзыв! К сожалению, у меня нет опыта работы с Victoria metrics, так что записать видео на эту тему смогу разве что только в перспективе
@user-rp6bi5qj1n
@user-rp6bi5qj1n Жыл бұрын
Здравствуйте. У вас супер канал . Могли бы вы сделать плейлист с нуля по линуксу для девопса необходимую базу и плейлист с нуля девопс ? Просто у вас прекрасная и понятная подача материала ( объясние) . Просто нахватает структурированного, пошагового материала для становления полноценного девопс инженера с нуля . Тем более вы в этом очень хорошо разбираетесь . Просто перелопатил весь ютуб в поисках обучения нет ничего стоящего , а у вас сосвсем другое . Очень надеюсь на обратную связь от вас . Спасибо за ранее
@DigitalStudium
@DigitalStudium Жыл бұрын
Спасибо за хороший отзыв! К сожалению возможность записывать видео у меня появляется нечасто, но я попытаюсь сделать такой плэйлист.
@Pavelbrov
@Pavelbrov Жыл бұрын
Спасибо, интересно! А почему решили отказоустойчивый сбор метрик сделать? Были преценденты или перфекционизм?)
@DigitalStudium
@DigitalStudium Жыл бұрын
Прецеденты, конечно же, были. Простой мониторинга на несколько часов был когда применили неверный конфиг для Прометея, рестартовали (вместо релоада), и не проверили, работает или нет. Но однозначно это не единственный сценарий для простоя. Хотелось бы, отдавая дашборд коллегам, быть уверенным в том, что он точно работает)
@damirmanyapov
@damirmanyapov 9 ай бұрын
А как от таких ошибок кластер спасет? @@DigitalStudium
@user-tl7xk1np1o
@user-tl7xk1np1o 9 ай бұрын
​@@damirmanyapovесли на одном Prometheus нет данных или он не работает, то thanos забирает с другого Prometheus.
@damirmanyapov
@damirmanyapov 9 ай бұрын
Так в примере выше как я понял просто не заработал Prometheus @@user-tl7xk1np1o
@user-tl7xk1np1o
@user-tl7xk1np1o 9 ай бұрын
@@damirmanyapov да, но когда у тебя есть второй, то это никому не мешает. Ну вышел из строя один Прометей, ну и ладно. Второй его страхует. При этом вручную ничего переключать не надо, так как ваша графана смотрит на Танос. Если же у вас просто два Прометея, без Таноса, то графану нужно будет руками переключить на другой Прометей в случае неисправности первого. Если же у вас вообще один Прометей, то дело дрянь - есди он вышел из строя, то придётся его чинить, до момента починки графана будет пустой.
Linux: Мониторинг с уведомлениями в Telegram
10:57
Kids' Guide to Fire Safety: Essential Lessons #shorts
00:34
Fabiosa Animated
Рет қаралды 14 МЛН
КАКУЮ ДВЕРЬ ВЫБРАТЬ? 😂 #Shorts
00:45
НУБАСТЕР
Рет қаралды 3,2 МЛН
黑天使遇到什么了?#short #angel #clown
00:34
Super Beauty team
Рет қаралды 44 МЛН
Approaches to multi-tenant Kubernetes observability with Prometheus
55:30
Intro to Thanos: Scale Your Prometheus Monitoring With Ease - Lucas Serven & Dominic Green
30:28
CNCF [Cloud Native Computing Foundation]
Рет қаралды 27 М.
Gitea + Gitea Actions: свой Git сервер с CI
11:40
Digital Studium
Рет қаралды 4,7 М.
Metrics at Full Throttle: Intro and Deep Dive Into Thanos - Saswata Mukherjee & Filip Petkovski
37:46
CNCF [Cloud Native Computing Foundation]
Рет қаралды 2,3 М.
Kids' Guide to Fire Safety: Essential Lessons #shorts
00:34
Fabiosa Animated
Рет қаралды 14 МЛН