Gerência - Metodologias e Processos

MOF: Monitoramento e Controle de Serviços - SMF (Service Monitoring and Control)

Neste artigo veremos como é possível controlar o ambiente de TI com relação ao seu estado de funcionamento com meios que permitem determinar quando um eventual incidente pode acontecer, logo acompanharemos um fluxo de processo e definiremos uma tecnologia para este fim.

por Cleber Farias Marques



Objetivo

Neste artigo veremos como é possível controlar o ambiente de TI com relação ao seu estado de funcionamento com meios que permitem determinar quando um eventual incidente pode acontecer, logo acompanharemos um fluxo de processo e definiremos uma tecnologia para este fim, desejo uma ótima leitura para todos.

Introdução

Obs.: Achei melhor deixar alguns termos em inglês mesmo porque na maioria das vezes iremos trabalhar com eles desta forma no mercado.

Se não é possível adivinhar quando teremos algum problema em nosso ambiente ao menos podemos monitorá-lo com a intenção de prever eventuais incidentes com base em indicadores de desempenho, sendo assim iremos estudar neste artigo a SMF Service Monitoring and Control - Monitoramento e Controle de Serviços. Os processos distribuídos destacados por esta SMF permitem que nossa equipe acompanhe de forma precisa e em tempo real o status atual, também chamado de saúde, dos serviços de TI, promovendo um controle crítico que assegura que os níveis de serviço estejam de acordo com o planejado, as características monitoradas estão entre o status de trabalho e filas de espera, recursos do servidor, disponibilidade, tempo de resposta e etc.

A principal meta desta SMF é observar a saúde dos serviços de TI e tomar as precauções necessárias para minimizar o impacto dos incidentes no ambiente. Através de seus processos podemos monitorar pró-ativamente serviços por inteiro ou componentes individuais, fornecendo os dados coletados para que outras SMFs melhorem o desempenho dos serviços de TI aumentando a disponibilidade de todos eles, mas assim mesmo o foco é na disponibilidade do serviço e não na de um componente, resultando em uma considerável redução no número de SLAs e nas brechas de OLA. Desta forma podemos conhecer mais a fundo a infra-estrutura da empresa e oferecer soluções rápidas e precisas para os eventuais incidentes aumentando a satisfação dos usuários com uma atuação pró-ativa.

Definições Importantes

Para entendermos melhor este artigo e a documentação oficial para esta SMF vamos conhecer algumas definições importantes que também são recomendadas pela Microsoft na própria documentação do MOF, lembrando também que mesmo algumas definições sendo as mesmas encontradas no mercado muitas delas são feitas com base nesta SMF.

Action/Response: Um script, comando ou qualquer tipo de resposta gerada na maioria das vezes automaticamente que representa um evento necessário alertando sobre um determinado incidente ou iniciando uma tarefa diária, como a inicialização de um aplicativo, por exemplo.

Alert: Uma notificação de que algo aconteceu, gerada quando as ferramentas de monitoramento detectam algo no ambiente que necessite de atenção.

Event Correlation: Procedimento para avaliar a relação entre objetos com o intuito de determinar o quanto uma alteração feita em um pode afetar o outro.

Control: Um resposta ou conjunto de respostas automáticas, os três tipos de controle são: Diagnostic, Notification e Interoperability.

Event: Uma ocorrência, geralmente um incidente, no ambiente de TI descoberta pela ferramenta de monitoramento.

Reporting: Uma coleção de informações sobre o nível e a qualidade do serviço, deverá ser utilizado pelas SMFs Capacity, Availability e Service Level Management.

Resolution Completion: Ponto no processo de controle em que todas as ações para o gerenciamento de incidentes foram executadas com sucesso.

Rules: Uma política pré-determinada que contem a fonte, os critérios e a execução de uma ação.

SMC Tool Agent: Um componente da ferramenta de monitoramento responsável por coletar as informações necessárias à monitoração. Algumas ferramentas de monitoramento não precisam de agentes.

Threshold/Criteria: Um valor de configuração com um nível predeterminado que identificará um estado verdadeiro ou falso que será usado pelas SMFs System e Network management para realizar algumas tarefas.

Monitoring Manager: Pessoa responsável, entre outras tarefas, pelos processos de monitoramento existentes no ambiente de TI, realizando o acompanhamento diário do desempenho nos sistemas em produção junto com sua equipe através das tecnologias para detecção de anormalidades.

Descrição de Processos e Atividades

As atividades da SMF Service Monitoring and Control podem ser representadas por um fluxo de processos que aborda as tarefas fundamentais necessárias para monitorar e controlar serviços de TI com excelência, a seguir iremos conhecer as fases deste processo.

Establish

Nesta primeira etapa nós teremos que planejar e implementar nosso sistema de monitoramento. Aqui devemos coletar, desenvolver e implementar os componentes fundamentais da Service Monitoring and Control, começando com a formalização da saúde dos serviços com as demais SMFs, seguindo com o estabelecimento dos processos e funções de monitoramento e por fim identificando e implementando a tecnologia escolhida para fazer este monitoramento.

Assess

Nesta segunda etapa deveremos analisar e revisar as condições atuais e fazer os ajustes necessários nas funções do nosso sistema de monitoramento. Esta etapa é semelhante à etapa anterior, Establish, mas o que difere aqui é que antes fizemos uma análise para implementar nossa tecnologia de monitoramento e agora devemos fazer uma avaliação contínua para estar sempre alterando e melhorando os processos durante o fluxo.

Engage Software Development

O objetivo desta terceira etapa é fornecer um guia operacional para a área interna de desenvolvimento de aplicações da nossa organização com o intuito de que as aplicações desenvolvidas pela equipe de programadores sejam fáceis de entrarem na rotina de monitoramento existente, em outras palavras, esta é uma forma de fazer com que as aplicações feitas pela nossa empresa sejam fáceis de monitorar.

Implement (Change e Optimize)

Esta quarta etapa é a principal deste fluxo, aqui deveremos implementar as decisões tomadas através das análises realizadas na etapa Assess. As atividades desta fase devem ser executadas pela equipe responsável pelo Monitoramento e Controle de Serviços de acordo com as SMFs de sua responsabilidade, especialmente as do quadrante de Operação. Seguindo as melhores práticas as funções Change e a Release Management que deverão ser responsáveis pelo controle e alteração de ferramentas e infra-estrutura.

Monitor (Continuous Monitoring)

A quinta etapa, de monitoramento, contínuo deve coletar informações em tempo real da saúde do ambiente, registrando e documentando as informações de modo que possam ser utilizadas para provar que os SLAs estão sendo mantidos. Esta fase pode conter também algumas tarefas pré-configuradas que registram (diária, semana ou mensalmente) informações em um histórico que pode ser utilizado por SMFs do quadrante de Otimização (como as funções Availability Management e Capacity Management) entre outros como auxiliar a equipe na investigação de problemas na função Problem Management.

Control (Automated Response)

Nesta sexta etapa devemos estar preparados para corrigir os problemas encontrados durante o monitoramento do ambiente para recuperar um componente ou serviço que esteja impactando as operações por causa de um eventual incidente. Esta tarefa geralmente deve ser automática e iniciada através de um alerta gerado pelo sistema de monitoramento que indicará um incidente e na seqüência o sistema deverá controlar ou corrigir esta eventualidade. Vale lembrar também que estes alertas podem ser utilizados para que tarefas diárias sejam iniciadas a partir de algum evento pré-configurado.

Atenção: Vale lembrar que cada uma das etapas descritas acima oferece muito mais detalhes do que os que vimos aqui, porém detalhar o processo não é o intuito agora, com este artigo nós devemos entender basicamente como funcionam estes passos, mas futuramente iremos estudar estas recomendações na prática, para isso continuem acompanhando os artigos.

Logo abaixo podemos ver o diagrama que representa o fluxo citado acima, os processos neste caso seguem um ciclo iterativo após sua preparação, veja:

Figura 1 – Fluxo de processos da SMF Service Monitoring and Control.


Com as novas tecnologias desenvolvidas pela Microsoft temos muito mais alternativas do que antes para nos apoiar na resolução dos passos descritos acima, um bom exemplo é o System Center, uma família de soluções de gerenciamento de TI que nos ajuda planejar, implantar, gerenciar e otimizar de forma pró-ativa nosso ambiente, temos também o SMS, MOM, ISA, Windows Server 2003 o 2008 entre outros, mas este é assunto para um próximo artigo.

Conclusão

Nesta hora já devemos estar com nosso ambiente sendo monitorado pró-ativamente porque com o que aprendemos neste artigo podemos entender o quão importante é saber a saúdo dos sistemas e componentes da nossa infra-estrutura de TI, se existir alguma dúvida sobre o assunto não deixem de me contatar, por favor, pois no próximo artigo iremos dar mais um passo em nosso estudo e acompanharemos de perto o processo de Administração dos Serviços de Diretório, encontro vocês por lá, muito obrigado.

Cleber Farias Marques

Cleber Farias Marques - Atua na área de TI desde 1997, é graduado em Análise e Desenvolvimento de Sistemas e Pós-graduando em Gestão de TI Aplicada aos Negócios. Possui certificações em ambiente de Infra-Estrutura Microsoft como MCP, MCDST, MCSA, MSFE e também ITIL Foundation, sendo o primeiro certificado MOF Foundation do Brasil. Idealista do projeto MOF Brasil (www.clebermarques.com) que tem como objetivo compartilhar as melhores práticas de ITSM.