Inteligência de Dados e Modelagem Preditiva na Gestão Universitária: O Observatório de Dados de Evasão e Baixa Procura da UFPR como Ferramenta de Apoio à Decisão

Resumo executivo

1. O que é a Iniciativa

O Observatório é uma plataforma estratégica de inteligência de dados que institucionaliza a transição de uma gestão universitária reativa para uma atuação preditiva e baseada em evidências para combate à evasão. Ele funciona como o braço tecnológico e analítico da Comissão de Combate à Evasão da UFPR, integrando estatística avançada, ciência de dados e metodologias de pesquisa qualitativa em uma estrutura de quatro pilares:

  • Monitoramento: Painéis interativos (Dashboards) que apresentam séries históricas e diagnósticos em tempo real sobre o fluxo de estudantes.
  • Predição: Uma “Calculadora de Risco de Evasão”, integrada ao sistema de gestão acadêmica (SIGA), que utiliza algoritmos de Machine Learning para identificar alunos com alta propensão ao abandono.
  • Pesquisas: Metodologias ativas para ouvir estudantes evadidos e egressos, humanizando os números e compreendendo as causas subjetivas (financeiras, saúde mental, etc.).
  • Divulgação: Um portal que atua como hub de conhecimento, garantindo transparência e disseminando estudos técnicos para toda a comunidade.

2. O Problema e a Oportunidade

A evasão no Ensino Superior é um desafio estrutural que compromete o investimento público e a missão social das universidades. Na UFPR, este cenário foi agravado significativamente no período pós-pandemia (2021-2022), exigindo uma resposta que superasse o simples registro administrativo de desistências. A oportunidade identificada foi a utilização do vasto volume de dados institucionais para antecipar o fenômeno. Em vez de analisar a evasão como um evento passado, o Observatório permite que a universidade identifique o risco enquanto o aluno ainda mantém vínculo, criando uma janela de oportunidade para intervenções de acolhimento e permanência.

3. Propósito Principal

O objetivo central é fornecer suporte científico à tomada de decisão. O projeto visa otimizar a alocação de recursos públicos e o direcionamento de políticas de assistência estudantil, garantindo que as ações de permanência cheguem de forma prioritária aos estudantes em situação de maior vulnerabilidade. A iniciativa reafirma o compromisso com a ciência aberta, utilizando tecnologias de software livre (R e Python) para assegurar a soberania de dados e a reprodutibilidade dos modelos.

4. Resultados e Impacto

Desde a sua concepção em 2025 e lançamento oficial em março de 2026, a prática alcançou resultados técnicos e institucionais expressivos:

  • Alta Performance Preditiva: O modelo de Machine Learning (baseado em Regressão Logística) atingiu 87% de acurácia, 83% de sensibilidade (capacidade de detectar quem realmente vai evadir) e 91% de precisão.
  • Integração Sistêmica: A Calculadora de Risco foi integrada diretamente à rotina dos coordenadores de curso no SIGA, permitindo uma gestão personalizada e humanizada.
  • Evidências Qualitativas: O planejamento de pesquisas longitudinais permitiu mapear fatores que os dados frios não mostram, como o impacto da saúde mental e as dificuldades de inserção no mercado de trabalho.
  • Cultura de Dados: A iniciativa promoveu uma mudança de paradigma na gestão da UFPR, consolidando um ciclo de planejamento baseado em dados que serve de referência nacional para a gestão pública orientada por evidências.

Em suma, o Observatório não apenas monitora o esvaziamento das salas de aula, mas entrega as ferramentas necessárias para que a universidade atue de forma preventiva, transformando trajetórias acadêmicas através da inteligência de dados.

 
Status Atual
Operação Contínua
Categorias de gestão da informação
Premiações recebidas
Não
Financiamento externo
Não
Website da Prática

Motivação e Justificativa

A motivação para a concepção e implementação do Observatório de Dados de Evasão e Baixa Procura fundamenta-se em um cenário de crise institucional e na necessidade de modernização da gestão pública universitária. Os principais pontos que compõem este cenário são:

1. Agravamento do Fenômeno da Evasão

O desafio central foi o crescimento acentuado das taxas de abandono na UFPR, especialmente no período pós-pandemia de COVID-19. As séries históricas da instituição revelaram que o problema escalou drasticamente após 2019, atingindo picos críticos nos anos de 2021 e 2022. Esse esvaziamento das salas de aula não representa apenas uma perda de recursos públicos investidos, mas a interrupção de trajetórias de vida e o comprometimento da missão social da universidade.

2. Limitações da Gestão Reativa

Historicamente, o tratamento da evasão ocorria de forma reativa. A universidade apenas contabilizava o desligamento do aluno após o fato consumado (o registro administrativo da evasão). Havia uma lacuna crítica de serviço: a ausência de ferramentas que permitissem identificar o risco de abandono enquanto o estudante ainda mantinha vínculo, perdendo-se a janela de oportunidade para intervenções de acolhimento e suporte pedagógico ou financeiro.

3. Fragmentação de Informações e Diagnóstico

Embora a UFPR possuísse grandes volumes de dados nos sistemas, essas informações estavam dispersas. Existia uma dificuldade em converter registros administrativos brutos em inteligência estratégica. A gestão carecia de diagnósticos dinâmicos que permitissem aos coordenadores de curso entender as particularidades de cada setor (fatores como turno, desempenho acadêmico e reprovações acumuladas) de forma visual e integrada.

4. Necessidade de Humanização dos Dados

Identificou-se que os números, por si só, não explicavam as causas subjetivas do abandono. Havia a oportunidade de inovar ao cruzar a Ciência de Dados com a escuta ativa. A motivação passou a ser, portanto, entender não apenas “quem” sai, mas “por que” sai, investigando dimensões como saúde mental, dificuldades financeiras e rigidez curricular, que os dados frios dos sistemas muitas vezes não capturam.

5. Oportunidade de Inovação e Transparência

A prática fez-se necessária para institucionalizar uma Gestão Baseada em Evidências. A oportunidade de inovação residiu na criação de um ecossistema que utiliza Inteligência Artificial e Software Livre para garantir que as decisões de gestão (como a alocação de bolsas e auxílios) fossem direcionadas com precisão técnica e total transparência, otimizando o uso dos recursos públicos em benefício da permanência estudantil.

Objetivos ODS: 
Inovação e diferencial: 

O Observatório qualifica-se como boa prática ao estabelecer um ecossistema de governança digital que une tecnologia avançada e orientação humana. Seus diferenciais são:

  1. Gestão Preditiva: Diferente de relatórios retroativos, a “Calculadora de Risco” usa Machine Learning para identificar a probabilidade de evasão enquanto o aluno tem vínculo, permitindo intervenções preventivas.
  2. Abordagem Multidimensional: Integra a precisão da Ciência de Dados à subjetividade, cruzando alertas algorítmicos com pesquisas sobre saúde mental e fatores financeiros.
  3. Soberania Tecnológica: O uso de Software Livre (R/Python) garante transparência (Ciência Aberta), baixo custo e replicabilidade por outras instituições.
  4. Integração Sistêmica: A ferramenta é nativa do SIGA, inserindo a inteligência de dados no cotidiano dos coordenadores.
  5. Institucionalização: O Hub de Conhecimento garante que a cultura de dados seja um pilar permanente da gestão, e não um projeto isolado.

Contexto e Alcance

Entidade responsável

CECD/PROPLAD (Coordenadoria de Estatística e Ciência de Dados)

Público-alvo

O público-alvo do Observatório abrange diferentes níveis da administração universitária:

  • Gestores Estratégicos (Reitoria e Pró-Reitorias): Utilizam dados agregados para o desenho de políticas públicas, alocação orçamentária e avaliação de impacto das ações de permanência.
  • Gestores Acadêmicos (Diretores e Coordenadores de Curso): Usuários operacionais que, via Calculadora de Risco e Painéis, identificam alunos em vulnerabilidade para intervenções de acolhimento e orientação pedagógica.
  • Comissões Temáticas: Instâncias como a de Combate à Evasão, que usam evidências para propor reformas curriculares e ajustes administrativos.
  • Comunidade Acadêmica e Pesquisadores: Docentes e discentes que acessam o Hub de Conhecimento para fundamentar estudos sobre gestão pública, ingresso e sucesso estudantil.
Beneficiários finais

O público-alvo do Observatório abrange diferentes níveis da administração universitária:

  • Gestores Estratégicos (Reitoria e Pró-Reitorias): Utilizam dados agregados para o desenho de políticas públicas, alocação orçamentária e avaliação de impacto das ações de permanência.
  • Gestores Acadêmicos (Diretores e Coordenadores de Curso): Usuários operacionais que, via Calculadora de Risco e Painéis, identificam alunos em vulnerabilidade para intervenções de acolhimento e orientação pedagógica.
  • Comissões Temáticas: Instâncias como a de Combate à Evasão, que usam evidências para propor reformas curriculares e ajustes administrativos.
  • Comunidade Acadêmica e Pesquisadores: Docentes e discentes que acessam o Hub de Conhecimento para fundamentar estudos sobre gestão pública, ingresso e sucesso estudantil.
Escopo jurisdicional
Federal
Nível de alcance
Intersetorial
Local de implantação

Município: Curitiba (Sede), com abrangência em todos os campi da instituição (Curitiba, Matinhos, Pontal do Paraná, Jandaia do Sul, Toledo e Palotina).

Estado: Paraná (PR).

Resultados e Impacto

  • Institucionalização:
    • Meta: Centralizar o combate à evasão.
    • Resultado: Criado o Observatório e a Comissão (2025).
  • Predição de Risco:
    • Meta: Identificar o risco de abandono antes da evasão.
    • Resultado: Implementada a Calculadora de Risco no SIGA. O modelo de Machine Learning atingiu 87% de acurácia, 83% de sensibilidade e 91% de precisão.
  • Monitoramento:
    • Meta: Interfaces interativas para gestão.
    • Resultado: Lançamento de Painéis de Monitoramento que automatizaram o diagnóstico de séries históricas e fluxos de alunos por curso.
  • Humanização:
    • Meta: Mapear causas subjetivas.
    • Resultado: Pesquisa com 1.783 respondentes identificou saúde mental e questões financeiras como causas críticas, orientando novas políticas de auxílio.
  • Ciência Aberta:
    • Meta: Baixo custo e transparência.
    • Resultado: Uso de R e Python com código público no GitHub.
Critério
Classificação
Justificativa
Escalabilidade
Muito alto

A escalabilidade é 4 (Muito Alto) devido aos seguintes pilares:

  1. Soberania e Baixo Custo: O uso de software livre (R/Python) elimina licenças onerosas, garantindo manutenção a longo prazo com baixo orçamento e replicação sem barreiras financeiras.
  2. Ciência Aberta: Metodologia e códigos públicos no GitHub permitem que outros órgãos adaptem os algoritmos e pesquisas à sua realidade, facilitando a expansão nacional da solução.
  3. Integração Sistêmica: A ferramenta é nativa do SIGA (Sistema de Gestão Acadêmica), tornando-se parte do fluxo de trabalho dos coordenadores. Isso cria uma cultura de dados que independe de mudanças de gestão.
  4. Modularidade: A estrutura de monitoramento e predição é expansível para outras áreas, como gestão de vagas ou alocação de recursos.

A união de tecnologia aberta, integração institucional e suporte de comissão permanente torna a prática um modelo robusto e replicável para todo o sistema de ensino superior.

Replicabilidade
Muito alto
  • Soberania e Acesso Livre: O desenvolviment em R e Python (Open Source) permite que qualquer órgão público adote a solução sem custos de licenciamento, eliminando barreiras financeiras para instituições com orçamentos restritos.
  • Ciência Aberta: Metodologia, roteiros de pesquisa e códigos-fonte estão documentados e disponíveis publicamente. Isso permite que outras universidades adaptem os algoritmos de Machine Learning e as interfaces de monitoramento às suas próprias bases de dados.
  • Modularidade: A prática foi desenhada em pilares independentes. Um órgão pode replicar apenas o monitoramento ou o protocolo de pesquisas qualitativas, facilitando uma implementação gradual.
  • Transferibilidade: O projeto entrega o “know-how” de governança, servindo como guia para a institucionalização da gestão baseada em evidências.
Sustentabilidade
Muito alto
  • Institucionalização: A prática não depende de iniciativas individuais, mas de uma Comissão Permanente e de unidades administrativas (CECD e PROGRAP) com atribuições regimentais para gerir dados e políticas de graduação.
  • Integração Sistêmica: Por ser uma ferramenta nativa do SIGA, o Observatório tornou-se parte do fluxo de trabalho diário dos coordenadores. A dependência positiva gerada pela “Calculadora de Risco” assegura que a prática continue sendo utilizada como rotina de gestão.
  • Custo Zero de Licenciamento: O uso de R e Python elimina a necessidade de orçamentos anuais para licenças de software, permitindo que a ferramenta funcione sem aportes financeiros extraordinários.
  • Cultura de Dados: A transparência dos painéis e o Hub de Conhecimento criaram uma cultura de evidências que sobrevive a trocas de gestão, consolidando o projeto como um ativo estável da universidade.
Impacto realizado ou potencial:
  1. Eficiência Administrativa: A centralização da inteligência de dados e a Calculadora de Risco no SIGA permitem intervenções antes do abandono. Isso otimiza recursos públicos ao reduzir a ociosidade de vagas e refinar a alocação de auxílios.
  2. Desenvolvimento Tecnológico: Criação de um ecossistema robusto em R/Python e um Hub de Conhecimento. O código aberto no GitHub promove a soberania tecnológica e serve de referência para outras instituições (IFES).
  3. Impacto Social: Ao identificar preditores, a prática garantiu que o suporte chegasse a quem mais precisa, promovendo equidade e permanência estudantil.

Informações complementares

Governança, tecnologias e ferramentas:
  1. Governança Institucional e Fluxos de Decisão: A prática é gerida por uma Comissão Multidisciplinar, que reúne as pró-reitorias de Planejamento (PROPLAD) e Graduação (PROGRAP). O modelo segue o ciclo de Gestão Baseada em Evidências, onde diagnósticos extraídos dos dados fundamentam atos normativos e políticas de assistência estudantil, garantindo que a tecnologia sirva à estratégia institucional.
  2. Tecnologias e Ciência de Dados: O desenvolvimento é baseado em Software Livre, utilizando as linguagens R e Python para extração (ETL), modelagem estatística e Machine Learning.
  3. Ferramentas de Gestão e Colaboração:
    • Integração de Sistemas: Conexão direta com o SIGA (Sistema de Gestão Acadêmica) permitindo que a Calculadora de Risco opere em tempo rea.
    • Gestão de Projetos: Metodologias ágeis para o ciclo de vida dos modelos, garantindo atualizações semestrais dos pesos das variáveis preditivas.