Avaliação de Desempenho: O que é e como funciona?

A avaliação de desempenho é o ápice de um ciclo bem estruturado de gestão de desempenho (gestão de desempenho é um processo sistemático de melhoria do desempenho de uma organização através da melhoria no desempenho de seus times e pessoas). Mas estruturar uma avaliação de desempenho eficiente e que produza os resultados desejados (ou seja, que faça a empresa melhorar) é uma jornada cheia de bifurcações e armadilhas. Nesse artigo, você verá um pouco dos fundamentos e das principais escolhas do processo :)

A gestão de desempenho é um processo que se dá em ciclos, que começam com o estabelecimento de expectativas de desempenho (que são metas, indicadores, competências e comportamentos) e terminam com a avaliação desse desempenho, e com o subsequente início de um novo ciclo. A avaliação de desempenho é o encerramento do ciclo de gestão de desempenho, onde se pretende mensurar e avaliar o desempenho do colaborador em relação às expectativas estabelecidas no começo do ciclo.

Avaliação de desempenho é o encerramento do ciclo de gestão de desempenho, onde se pretende mensurar e avaliar o desempenho do colaborador em relação às expectativas estabelecidas no começo do ciclo.

Contexto

A literatura da psicologia organizacional/industrial dedica muito do seu esforço ao estudo da avaliação de desempenho. Grande parte da literatura está focada em como estruturar questionários de avaliação de desempenho que i) aumentem a satisfação com o processo, ii) melhorem a percepção de justiça do processo e iii) aumentem a precisão do processo.

Além disso, a literatura tradicional trata quase que exclusivamente do desempenho sob o seu aspecto individual. No entanto, hoje em dia há diversas ocupações e áreas de atuação dentro das organizações em que a mensuração do desempenho individual do colaborador é muito mais difícil e até por vezes indesejada, como nos casos das empresas que se organizam em times ágeis, como a Spotify.

O que é desempenho?

A grande maioria dos especialistas divide o desempenho de um profissional em duas grandes dimensões:

  • resultados (outcomes), e

  • comportamentos (behaviors)

Uma forma fácil de se entender a diferença entre resultados e comportamentos é pensar que resultados são "o quê" o colaborador faz (ou seja, os resultados que atinge), e os comportamentos são "como" o colaborador produz esses resultados.

A avaliação de desempenho é o ápice de um ciclo bem estruturado de gestão de desempenho

As duas dimensões do desempenho são importantes pois formam a espinha dorsal do ciclo de gestão de desempenho, que vamos discutir mais à frente, e são como a grande maioria das avaliações de desempenho estão organizadas.

A avaliação e o ciclo de gestão de desempenho

O ciclo de gestão de desempenho é formado de duas fases:

  • Definição de expectativas, e
  • Avaliação do desempenho em relação às expectativas definidas

Abaixo, um diagrama que ilustra como funciona tipicamente um ciclo de gestão de desempenho:

Fonte: Qulture.Rocks/Autor

Fonte: Qulture.Rocks/Autor

Avaliação de desempenho

Se o ciclo de gestão de desempenho necessariamente se inicia com algum processo de definição e comunicação de expectativas de desempenho, ele termina com uma avaliação de desempenho.

A avaliação de desempenho tem como objetivos principais:

  • Mensurar o desempenho do colaborador, para fins de tomada de decisões, e

  • Fornecer insumos para que o colaborador se desenvolva, ou seja, melhore seu desempenho no próximo ciclo

Estrutura de uma avaliação de desempenho

A avaliação de desempenho geralmente é composta por uma série de questionários que contêm perguntas a serem respondidas por um ou vários avaliadores a respeito de um avaliado e que tratem de aspectos relacionados às duas dimensões do desempenho que discutimos: os comportamentos ("como") e os resultados ("o que").

Comportamentos

Os comportamentos, que formam uma das duas dimensões do desempenho, são avaliados em uma porção da avaliação de desempenho que é comumente chamada de "avaliação por competências".

O uso de competências e comportamentos na gestão de desempenho ganhou força nas décadas de 70 e 80, quando as empresas vinham de alguns anos de foco enorme no uso de metas e objetivos como medida única de desempenho. O uso das metas (como aliás veremos adiante) nasceu com a moda do Management by Objectives, ou gestão por objetivos. Mas em algum momento os psicólogos organizacionais (os teóricos) e os departamentos de recursos humanos (os práticos) sentiram falta de algum componente comportamental que medisse como as pessoas tinham atingido os resultados determinados nos MBOs, em especial, se os resultados tinham sido atingidos de maneira ética, colaborativa e alinhada com a cultura da empresa. 

Assim nasceu o uso de competências e comportamentos, que já eram amplamente usados na análise de cargos e ocupações, para fins de gestão de desempenho.

Nas avaliações de desempenho modernas, geralmente há um componente da avaliação que trata de "competências", e outro que trata de "resultados". (Aqui, vamos usar os termos "competências" e "comportamentos" de maneira intercambiável.) Os comportamentos são geralmente avaliados um a um e podem ser agrupados com base em temáticas comuns:

Fonte: Qulture.Rocks/Autor

Fonte: Qulture.Rocks/Autor

No caso ilustrado pela imagem acima o questionário possui uma seção intitulada "Valores da Empresa", e dentro dele são listados comportamentos derivados dos valores da empresa, nesse caso, "Pensa Como Dono" e "Se Comunica Bem".

O modelo retratado acima é muito usado em avaliações de competências e comportamentos: um comportamento observável, "Pensa Como Dono", é avaliado de maneira quantitativa no avaliador.

Em algumas empresas, é feita uma composição entre comportamentos derivados dos valores, das competências críticas e das competências funcionais do cargo. Em outras, que optam pela simplicidade, é feita apenas a avaliação das competências críticas.

Escala de avaliação

Outro ponto de definição da avaliação de desempenho, principalmente no seu componente de comportamentos, é a escala de avaliação a ser usada.

A escala tem três grandes variáveis a serem definidas: 

  • A escala a ser usada
  • O rótulo de cada uma das opções da escala, e
  • O uso de réguas comportamentais ancoradas em comportamentos

Algumas empresas discutem os méritos de uma escala par (por exemplo, de 4 opções), pois em uma escala de número par não há "meio termo", como sendo uma forma de evitar a tendência central das avaliações, que leva a maioria dos avaliadores a escolher as opções centrais, ou do meio, em suas avaliações. Portanto a primeira decisão é definir se haverá um número par ou ímpar de opções na escala. Outras empresas discutem os méritos de escalas com mais opções vis-a-vis escalas com menos opções. O argumento do uso de escalas maiores, como a de 5 opções, é tornar as avaliações mais precisas à medida em que cada avaliador pode ser mais preciso na diferenciação das suas avaliações.

Um segundo aspecto importante é o rótulo das opções escolhidas. Em alguns casos, as empresas optam por deixar as opções com rótulos numéricos (por exemplo 1, 2, 3, 4 e 5). Outras empresas optam por substituir os números por uma escala de conceitos (por exemplo, "muito abaixo do esperado", "abaixo do esperado", "dentro do esperado", "acima do esperado" e "muito acima do esperado"). Algumas empresas, ainda, optam por manter números e conceitos lado a lado.

Este aspecto, dos rótulos das opções na escala, nos leva a um terceiro rol de opções, relacionado ao tipo de escala escolhida. Há dois grandes tipos de escalas: as escalas relativas e as escalas absolutas.

As escalas relativas pedem que o avaliador avalie seu avaliado de maneira relativa a algo. Pode ser, por exemplo, de maneira relativa ao que é esperado do cargo (o que achamos bastante eficiente), bem como pode ser de maneira relativa aos seus pares - ou seja, o avaliador avalia a posição relativa de desempenho do avaliado em relação ao grupo (o que achamos bem menos eficiente como rótulo de escala de avaliação). As escalas absolutas, por outro lado, pedem que o avaliador avalie seu avaliado de maneira absoluta, sem relação com o que é esperado ou com outros avaliados. É o caso da escala "ruim", "médio" e "bom").

Empresas mais sofisticadas podem fazer o uso de Escalas de Avaliação Ancoradas em Comportamentos (ou BARS - Behaviorally Anchored Rating Scales) que nada mais são do que descrições dos comportamentos observáveis em cada uma das notas/conceitos da escala de avaliação. Seria como, no caso acima, usarmos a descrição "Pensa como dono na maioria das situações, definindo estratégias de começo a fim e considerando todos os riscos e ameaças possíveis" atrelada à nota 5 do comportamento "Pensa Como Dono".

Réguas comportamentais podem aumentar a precisão das avaliações sendo feitas, mas são muito difíceis de serem feitas sem uma dedicação de tempo enorme e o auxílio de psicólogos especializados.

Resultados

Resultados são uma dimensão do desempenho mais polêmica de ser avaliada. De maneira mais simples, caso a empresa esteja em uma etapa mais básica de maturidade do seu processo de avaliação, o avaliador pode avaliar as responsabilidades e atividades delimitadas no job description em uma dada escala de avaliação. Assim, um analista financeiro poderia ser avaliado em "Produzir os relatórios de posição de caixa sem erros e de maneira pontual" em uma escala de 5 opções, que avaliem seu desempenho em relação ao que é esperado do seu cargo. Nesse caso, a porção "resultados" da avaliação de desempenho acaba se parecendo muito com a porção de "comportamentos" ou "competências".

Nos casos onde as responsabilidades do colaborador são medidas por indicadores (por exemplo, no caso acima, o colaborador pode ser avaliado em relação à quantidade e qualidade dos relatórios produzidos), esses indicadores acabam por servir de aproximação do desempenho do colaborador, e sendo usados nesta porção da avaliação.

Muitas empresas, no entanto, acabam simplificando o processo de avaliação de desempenho em apenas uma seção composta por competências e comportamentos, sem uma distinção super clara entre o que é "resultado" e o que é "comportamento". Para estas empresas, muitas vezes falta a maturidade gerencial para que haja indicadores (e principalmente a infra-estrutura de medição necessária para produzir esses indicadores) suficientes para alimentar o processo de gestão de desempenho.

Algumas empresas, como a Ambev, conduzem a avaliação de resultados de maneira totalmente independente da porção de competências e comportamentos. Na Ambev, as avaliações de resultados são realizadas no fim do ano, e tem como principal produto o pagamento de remuneração variável, na forma de bônus, aos colaboradores. As avaliações de competências, por outro lado, são realizadas em maio, e servem de insumo para as discussões de planejamento de sucessão e promoções (verticais e laterais) da empresa.

Ainda falando da Ambev, lá a porção de "resultados" realizada no fim do ano é absolutamente objetiva e matemática: se um colaborador da empresa bateu 90% da sua meta de market share, por exemplo, ele têm um desempenho equivalente a 90% naquele critério/meta. Vale ressaltar que podem ser definidos gatilhos e aceleradores de desempenho em metas, que definam por exemplo que abaixo de um certo piso de market share o colaborador tem 0% de desempenho, e acima de um certo teto, tem 120% de desempenho.

A vantagem desse modelo é que nele as regras são extremamente claras e há pouco espaço para favoritismos e vieses cognitivos na definição da remuneração variável. Por outro lado, essa relação direta e matemática pode ser extremamente objetiva mas muitas vezes injusta com o colaborador e seus colegas. Por exemplo, podemos pensar em um colaborador da empresa que bate sua meta e tem alto desempenho na avaliação, mas que para atingir tal meta teve de negligenciar algum aspecto importante do negócio da empresa, como a sustentabilidade de longo-prazo da marca (imagine um funcionário que vende seus produtos sem lucro para bater sua meta de market share, minando assim a posição de caixa e de resultado da empresa). Ou um colaborador que tinha uma meta que deixou de ser relevante (por exemplo devido a uma mudança estratégica), e portanto o colaborador sai prejudicado.

Outro risco da conexão direta entre metas e desempenho é que as metas podem se parecer iguais mas terem dificuldades extremamente diferentes na prática. Considere, por exemplo, dois vendedores que possuam cotas de vendas iguais, de R$ 100 mil em um dado ciclo. Por outro lado, considere que no meio do ciclo a carteira de clientes de um deles entra em uma severa recessão causada por aspectos macroeconômicos, que acabam, diferentemente, por favorecer a carteira de clientes do segundo vendedor. Agora imagine que ambos entreguem suas cotas de R$ 100 mil no fim do ciclo. Quem teve melhor desempenho? Por esses e outros motivos, é muitas vezes vantajoso adicionar um aspecto de julgamento do gestor na avaliação, para que sejam compensadas e avaliadas potenciais injustiças e desvios de comportamento/fim.

Para que se resolvam casos como esses, em diversas empresas é usado o julgamento do gestor para definir se a meta foi mesmo devidamente batida. Perde-se um pouco de objetividade numérica, mas ganha-se precisão e justiça na avaliação quando os gestores são bem treinados, tem as motivações certas e contam com o suporte de uma área de RH próxima.

A grande vantagem do uso das metas na avaliação dos resultados de um colaborador está, de um lado, na intuitiva ligação entre as metas e os objetivos estratégicos da empresa, derivada do desdobramento dessas metas, e por outro na adoção de critérios mais objetivos de avaliação, menos sujeitos, portanto, a vieses cognitivos, preferências pessoais e injustiças que possam atrapalhar a precisão dos avaliadores.

Quem avalia quem?

Outro aspecto importante das avaliações de desempenho é a definição de quem serão os avaliadores de um dado avaliado.

O tipo mais básico de avaliação de desempenho é aquele no qual apenas o gestor avalia seus liderados. Muitas empresas chamam isso intuitivamente de "avaliação 90 graus".

Em outras empresas, a avaliação do gestor é complementada com uma autoavaliação do colaborador, cuja existência, a ciência comprova, aumenta a percepção de justiça dos participantes do processo.

Uma forma ainda mais completa de se estruturar uma avaliação de desempenho é adicionar clientes internos, pares e liderados no processo, o que se chama  normalmente de "avaliação 360-graus".

Um dos grandes perigos da avaliação 360-graus é que, se ela for usada para a tomada de decisões (ou seja, se uma das consequências da avaliação é promover, demitir ou dar aumento para seus participantes), seus resultados podem ser significativamente diferentes. Ocorre o fenômeno da inflação das notas e conceitos, em que todos são mais "bonzinhos" em suas avaliações pois temem prejudicar seus colegas.

Calibração dos resultados

Uma etapa muito importante de um processo de avaliação de desempenho é a calibração dos seus resultados.

A calibração dos resultados é uma série de discussões entre os avaliadores e que têm como objetivo tornar as avaliações mais precisas. Em muitas empresas a calibração é uma reunião em que os gestores discutem as avaliações que fizeram dos seus liderados uns com os outros, de modo que sejam trazidas à tona eventuais discrepâncias nos critérios de avaliação usados. Ao comparar-se "ao vivo" as avaliações feitas por diferentes gestores sobre seus liderados, podem ficar muito evidentes eventuais injustiças cometidas, como algum gestor que tende a ser mais "bonzinho" com a sua equipe enquanto outro tende a ser mais exigente com a sua.

A calibração dos resultados é uma série de discussões entre os avaliadores e que têm como objetivo tornar as avaliações mais precisas.

Em algumas empresas, os resultados das avaliações são plotados em algum tipo de "curva" que mostra qual porcentagem dos avaliados recebeu cada banda de notas e conceitos. Por exemplo, nessa hora podem ser identificadas alocações excessivas de avaliados na "parte direita" da curva, de alto desempenho, e que pode não necessariamente refletir a realidade, principalmente quando se considera uma escala de avaliação relativa ao que se é esperado do cargo. É muito improvável que uma empresa tenha, por exemplo, mais de 50% dos seus colaboradores desempenhando "acima" ou "muito acima" do que é esperado para seus respectivos cargos.

Nesse espírito, algumas empresas optam por "forçar a curva", ou seja, obrigar que a distribuição de notas e conceitos de uma avaliação de desempenho tenha um certo formato estatístico.

Este conceito nasceu na GE, sob a liderança de Jack Welch, onde criou-se a curva 70/20/10. Nela, apenas 20% da organização podem ser top-performers em um dado ano. Na outra extremidade, 10% dos colaboradores precisam ser classificados na porção de pior performance, e os 70% remanescentes ficam no "meião".

O produto desse exercício de calibração é a eventual revisão das notas e conceitos avaliados que eventualmente sejam “descalibrados”, para que os resultados da avaliação sejam os mais justos e precisos quanto possível.

Nestes casos, o comum é que seja feito um ranking de todos os avaliados do processo de acordo com seus conceitos ou avaliações. Feito o ranking, se a curva forçada disser que apenas 10% dos avaliados podem ter conceito máximo, faz-se com que os 10% primeiros do ranking (por exemplo os 20 primeiros em uma empresa com 200 colaboradores) recebam seu conceito máximo, e assim por diante até os últimos.

A curva forçada é uma grande fonte de discussões acaloradas e de possíveis injustiças, justamente por forçar que os colaboradores de uma empresa obedeçam a uma distribuição obrigatória de desempenho. Isso faz com que se gere diferenciação onde não necessariamente há diferenças de desempenho. Dessa forma, o uso da curva forçada está caindo bastante entre organizações e áreas de recursos humanos. No entanto, seu uso ainda pode ser útil em casos de turnaround e mudança cultural, onde pode ser importante realizar o desligamento de uma grande parte dos colaboradores com pior desempenho de uma empresa.

O produto desse exercício de calibração é a eventual revisão das notas e conceitos avaliados que eventualmente sejam "descalibrados", para que os resultados da avaliação sejam os mais justos e precisos quanto possível.

Comunicação dos resultados: o famoso "feedback"

A última etapa do processo de avaliação de desempenho, e portanto do ciclo de gestão de desempenho, é a devolutiva do processo, uma reunião em que participam gestor e colaborador (e eventualmente alguém da área de recursos humanos, como um parceiro de negócios) e onde são discutidos:

  • Os resultados da avaliação, ou seja, os comportamentos observados e os resultados atingidos

  • Insumos para o desenvolvimento do colaborador para o próximo ciclo

  • Decisões de promoção, remuneração etc

Uma das principais tendências que vêm se desenvolvendo nas áreas de recursos humanos é a separação dessa reunião de "feedback" em duas reuniões distintas: uma onde se discutem resultados do processo e insumos de desenvolvimento, e outra onde são comunicadas as decisões tomadas no ciclo. No Google, por exemplo, essas duas reuniões são separadas por pelo menos 1 mês. Segundo Laszlo Bock, ex-Vice Presidente de People Operations do Google, os colaboradores fecham seus ouvidos para temas de desenvolvimento quando estão na expectativa das decisões que afetem seu futuro e seu bolso (ou, para este efeito, quando estão digerindo as decisões que possam ter sido comunicadas). Por isso, realizam-se duas reuniões diferentes.

Você deve ter percebido que deixamos o termo "feedback" entre aspas quando ele é usado para denotar essa reunião. Isso pois achamos que essas reuniões - e nisso o Google aparentemente concorda conosco - tem muito menos de feedbacks e muito mais de devolutivas do processo.

A duração do ciclo

Por fim, uma consideração importante sobre o desenho de um ciclo de gestão de desempenho é a sua duração. Tradicionalmente, a maioria das empresas estruturava seus ciclos de gestão de desempenho de acordo com o calendário fiscal - e portanto anual - de suas empresas.

Mais recentemente há uma enorme tendência de encurtar os ciclos de gestão de desempenho para períodos semestrais e até trimestrais. No entanto, processos complexos de estabelecimento de expectativas e avaliação do desempenho podem ser extremamente custosos para a organização e portanto impraticáveis de serem realizados mais do que uma vez por ano. Por isso, algumas empresas fazem ciclos mais simples, geralmente apenas focados no desenvolvimento dos colaboradores e do seu desempenho, com mais frequência, mas mantêm um super ciclo anual onde são tomadas decisões de gente e a partir do qual é realizado o processo de gestão de talentos da empresa.

Veja um vídeo rápido que resume o que falamos até agora.

Conclusão

Chegamos ao fim do nosso artigo. Esperamos que você tenha atingido o objetivo que tínhamos para esse texto, de dar uma base sólida para que profissionais de gestão e recursos humanos entendam o que é gestão de desempenho, o que é avaliação de desempenho, e como esses dois temas se relacionam.

Para entender mais sobre o tema, visite nosso blog. Nele você encontra diversas discussões importantes sobre o tema de gestão de desempenho. Para entender a visão da Qulture.Rocks sobre a gestão de desempenho - o que chamamos carinhosamente de Talent Science -, leia nosso ebook sobre o tema. Por fim, para entender o que diversas empresas que são referência em gestão de desempenho estão fazendo para tornar suas práticas mais ágeis, eficientes e lucrativas, visite nossa Academia da Gestão de Desempenho, e baixe alguns dos nossos estudos de caso. Vale a pena!