Надёжность и SRE
Внедрение практик SRE и 12 факторов, участие в дежурствах, разбор инцидентов, снижение операционных рисков.
Инфраструктура · Виртуализация · SRE/DevOps
Руководитель инфраструктуры и виртуализации / SRE. Помогаю сервисам работать стабильно: observability, DRP/backup, безопасность внешнего контура, релизные процессы и управление распределёнными командами.
Более 23 лет в ИТ: от системного администрирования и архитектуры до управления гео-распределённой инфраструктурой и командами.
Внедрение практик SRE и 12 факторов, участие в дежурствах, разбор инцидентов, снижение операционных рисков.
Управление мониторингом/логированием/метриками, диагностические карты, прозрачность состояния сервисов для команд и стейкхолдеров.
Жизненный цикл инфраструктуры, резервное копирование и DRP, защита внешнего контура (WAF/anti-DDoS), ИБ-проекты.
Ключевые роли и зоны ответственности по годам.
Примеры задач, где важны надёжность, скорость и качество изменений.
Организация запуска проекта “рободаки” в облаке и пилотном дарксторе: подготовка инфраструктуры, процессы релиза, наблюдаемость.
Запуск биржи самозанятых в облаке: эксплуатационная готовность, интеграции, контролируемые изменения и управление рисками.
Управление observability и резервным копированием/DRP: прозрачность, диагностика, восстановление и готовность к инцидентам.
Сгруппировано для удобства чтения.
Удобнее всего — Telegram. Также доступен звонок и PDF-резюме.
Примечание: на странице намеренно не используется фамилия (включая мета‑теги и ссылки на файлы).