Publicada em:: May 16, 2026

PSI no Linux: a métrica que mostra quando seu servidor realmente está sofrendo

Entenda como o Linux mede a pressão real de CPU, memória e disco — e por que o PSI é muito mais útil do que apenas olhar uso de CPU ou RAM.

Authors

Name

Gabriel Novaes

Introdução

Muita gente monitora apenas:

CPU %
uso de RAM
load average

Mas essas métricas nem sempre mostram quando o sistema está realmente “engasgando”.

Foi justamente para resolver isso que o Linux criou o PSI (Pressure Stall Information).

O PSI é uma das métricas mais úteis para identificar:

contenção de CPU
falta de memória
gargalos de disco
lentidão real percebida pelas aplicações

O que é PSI?

PSI significa:

Pressure Stall Information

Ele mede quanto tempo os processos ficaram parados esperando recursos do sistema.

Ou seja:

não mede apenas uso
mede sofrimento real do workload

Isso é extremamente importante.

Por exemplo, você pode ter:

CPU em 40%, mas processos travando esperando I/O
RAM ainda disponível, mas aplicações sofrendo reclaim de memória

O PSI consegue mostrar isso.

Tipos de PSI

O Linux possui 3 categorias principais:

CPU PSI

Mostra tempo em que processos ficaram esperando CPU.

Exemplos:

muitos workers
filas grandes
excesso de concorrência

Sintomas

aumento de latência
respostas lentas
fila de jobs crescendo

Memory PSI

Mostra pressão de memória.

Acontece quando:

falta RAM
kernel precisa fazer reclaim
swap começa a ser usada agressivamente

Sintomas

travamentos aleatórios
OOM Killer
aplicações lentas mesmo com CPU baixa

IO PSI

Mostra espera por disco.

Muito útil para detectar:

SSD saturado
banco lento
excesso de logs
backups impactando produção

Sintomas

APIs lentas
filas acumulando
load alto com CPU baixa

PSI vs uso de CPU tradicional

CPU tradicional mostra:

“quanto da CPU está sendo usada”

PSI mostra:

“quanto os processos sofreram esperando CPU”

Isso muda completamente o diagnóstico.

Exemplo prático

Imagine:

CPU: 50%
Load average: alto
IO PSI: 30%

Nesse caso o problema provavelmente NÃO é CPU.

O servidor está:

esperando disco
travando em I/O
acumulando processos em fila

Sem PSI, muita gente aumentaria CPU à toa.

Como visualizar PSI

No Linux moderno:

Comandos

Exemplo de saída

some avg10=2.15 avg60=1.20 avg300=0.80 total=1234567 full avg10=0.20 avg60=0.10 avg300=0.05 total=12345

O que significa “some” e “full”?

some

Pelo menos um processo ficou esperando recurso.

full

Todos os processos ficaram bloqueados ao mesmo tempo.

“full” normalmente indica gargalo mais sério.

Valores considerados saudáveis

CPU PSI

0–5% → excelente
5–15% → atenção
20%+ → contenção relevante

Memory PSI

Idealmente:

próximo de 0%

Se subir constantemente:

falta RAM
swap excessiva
reclaim agressivo

IO PSI

<5% → saudável
5–20% → observar
20%+ → disco pode estar gargalando

PSI no Grafana

Hoje vários dashboards modernos do:

Node Exporter
Grafana
Netdata

já exibem PSI.

É comum aparecer algo como:

CPU Pressure
Memory Pressure
IO Pressure

Essa é uma das métricas mais valiosas para ambientes:

Docker
Kubernetes
VPS
bancos de dados
filas
workers Laravel Horizon
aplicações Node.js

PSI ajuda a evitar diagnósticos errados

Sem PSI:

CPU sobe → “precisa de mais vCPU”

Com PSI:

talvez o problema seja disco
ou swap
ou concorrência
ou lock interno

Isso evita:

scaling desnecessário
custos maiores
troubleshooting errado

Conclusão

PSI é uma das melhores métricas modernas do Linux.

Ela mostra:

não apenas uso
mas impacto real no sistema

Se você administra:

servidores
containers
workloads em produção

Vale muito a pena acompanhar:

CPU PSI
Memory PSI
IO PSI

Porque às vezes o servidor parece saudável… mas o PSI já está mostrando que ele começou a sofrer.