Inteligência de Dados e Modelagem Preditiva na Gestão Universitária: O Observatório de Dados de Evasão e Baixa Procura da UFPR como Ferramenta de Apoio à Decisão
Resumo executivo
1. O que é a Iniciativa
O Observatório é uma plataforma estratégica de inteligência de dados que institucionaliza a transição de uma gestão universitária reativa para uma atuação preditiva e baseada em evidências para combate à evasão. Ele funciona como o braço tecnológico e analítico da Comissão de Combate à Evasão da UFPR, integrando estatística avançada, ciência de dados e metodologias de pesquisa qualitativa em uma estrutura de quatro pilares:
- Monitoramento: Painéis interativos (Dashboards) que apresentam séries históricas e diagnósticos em tempo real sobre o fluxo de estudantes.
- Predição: Uma “Calculadora de Risco de Evasão”, integrada ao sistema de gestão acadêmica (SIGA), que utiliza algoritmos de Machine Learning para identificar alunos com alta propensão ao abandono.
- Pesquisas: Metodologias ativas para ouvir estudantes evadidos e egressos, humanizando os números e compreendendo as causas subjetivas (financeiras, saúde mental, etc.).
- Divulgação: Um portal que atua como hub de conhecimento, garantindo transparência e disseminando estudos técnicos para toda a comunidade.
2. O Problema e a Oportunidade
A evasão no Ensino Superior é um desafio estrutural que compromete o investimento público e a missão social das universidades. Na UFPR, este cenário foi agravado significativamente no período pós-pandemia (2021-2022), exigindo uma resposta que superasse o simples registro administrativo de desistências. A oportunidade identificada foi a utilização do vasto volume de dados institucionais para antecipar o fenômeno. Em vez de analisar a evasão como um evento passado, o Observatório permite que a universidade identifique o risco enquanto o aluno ainda mantém vínculo, criando uma janela de oportunidade para intervenções de acolhimento e permanência.
3. Propósito Principal
O objetivo central é fornecer suporte científico à tomada de decisão. O projeto visa otimizar a alocação de recursos públicos e o direcionamento de políticas de assistência estudantil, garantindo que as ações de permanência cheguem de forma prioritária aos estudantes em situação de maior vulnerabilidade. A iniciativa reafirma o compromisso com a ciência aberta, utilizando tecnologias de software livre (R e Python) para assegurar a soberania de dados e a reprodutibilidade dos modelos.
4. Resultados e Impacto
Desde a sua concepção em 2025 e lançamento oficial em março de 2026, a prática alcançou resultados técnicos e institucionais expressivos:
- Alta Performance Preditiva: O modelo de Machine Learning (baseado em Regressão Logística) atingiu 87% de acurácia, 83% de sensibilidade (capacidade de detectar quem realmente vai evadir) e 91% de precisão.
- Integração Sistêmica: A Calculadora de Risco foi integrada diretamente à rotina dos coordenadores de curso no SIGA, permitindo uma gestão personalizada e humanizada.
- Evidências Qualitativas: O planejamento de pesquisas longitudinais permitiu mapear fatores que os dados frios não mostram, como o impacto da saúde mental e as dificuldades de inserção no mercado de trabalho.
- Cultura de Dados: A iniciativa promoveu uma mudança de paradigma na gestão da UFPR, consolidando um ciclo de planejamento baseado em dados que serve de referência nacional para a gestão pública orientada por evidências.
Em suma, o Observatório não apenas monitora o esvaziamento das salas de aula, mas entrega as ferramentas necessárias para que a universidade atue de forma preventiva, transformando trajetórias acadêmicas através da inteligência de dados.
Motivação e Justificativa
A motivação para a concepção e implementação do Observatório de Dados de Evasão e Baixa Procura fundamenta-se em um cenário de crise institucional e na necessidade de modernização da gestão pública universitária. Os principais pontos que compõem este cenário são:
1. Agravamento do Fenômeno da Evasão
O desafio central foi o crescimento acentuado das taxas de abandono na UFPR, especialmente no período pós-pandemia de COVID-19. As séries históricas da instituição revelaram que o problema escalou drasticamente após 2019, atingindo picos críticos nos anos de 2021 e 2022. Esse esvaziamento das salas de aula não representa apenas uma perda de recursos públicos investidos, mas a interrupção de trajetórias de vida e o comprometimento da missão social da universidade.
2. Limitações da Gestão Reativa
Historicamente, o tratamento da evasão ocorria de forma reativa. A universidade apenas contabilizava o desligamento do aluno após o fato consumado (o registro administrativo da evasão). Havia uma lacuna crítica de serviço: a ausência de ferramentas que permitissem identificar o risco de abandono enquanto o estudante ainda mantinha vínculo, perdendo-se a janela de oportunidade para intervenções de acolhimento e suporte pedagógico ou financeiro.
3. Fragmentação de Informações e Diagnóstico
Embora a UFPR possuísse grandes volumes de dados nos sistemas, essas informações estavam dispersas. Existia uma dificuldade em converter registros administrativos brutos em inteligência estratégica. A gestão carecia de diagnósticos dinâmicos que permitissem aos coordenadores de curso entender as particularidades de cada setor (fatores como turno, desempenho acadêmico e reprovações acumuladas) de forma visual e integrada.
4. Necessidade de Humanização dos Dados
Identificou-se que os números, por si só, não explicavam as causas subjetivas do abandono. Havia a oportunidade de inovar ao cruzar a Ciência de Dados com a escuta ativa. A motivação passou a ser, portanto, entender não apenas “quem” sai, mas “por que” sai, investigando dimensões como saúde mental, dificuldades financeiras e rigidez curricular, que os dados frios dos sistemas muitas vezes não capturam.
5. Oportunidade de Inovação e Transparência
A prática fez-se necessária para institucionalizar uma Gestão Baseada em Evidências. A oportunidade de inovação residiu na criação de um ecossistema que utiliza Inteligência Artificial e Software Livre para garantir que as decisões de gestão (como a alocação de bolsas e auxílios) fossem direcionadas com precisão técnica e total transparência, otimizando o uso dos recursos públicos em benefício da permanência estudantil.
O Observatório qualifica-se como boa prática ao estabelecer um ecossistema de governança digital que une tecnologia avançada e orientação humana. Seus diferenciais são:
- Gestão Preditiva: Diferente de relatórios retroativos, a “Calculadora de Risco” usa Machine Learning para identificar a probabilidade de evasão enquanto o aluno tem vínculo, permitindo intervenções preventivas.
- Abordagem Multidimensional: Integra a precisão da Ciência de Dados à subjetividade, cruzando alertas algorítmicos com pesquisas sobre saúde mental e fatores financeiros.
- Soberania Tecnológica: O uso de Software Livre (R/Python) garante transparência (Ciência Aberta), baixo custo e replicabilidade por outras instituições.
- Integração Sistêmica: A ferramenta é nativa do SIGA, inserindo a inteligência de dados no cotidiano dos coordenadores.
- Institucionalização: O Hub de Conhecimento garante que a cultura de dados seja um pilar permanente da gestão, e não um projeto isolado.
Contexto e Alcance
CECD/PROPLAD (Coordenadoria de Estatística e Ciência de Dados)
O público-alvo do Observatório abrange diferentes níveis da administração universitária:
- Gestores Estratégicos (Reitoria e Pró-Reitorias): Utilizam dados agregados para o desenho de políticas públicas, alocação orçamentária e avaliação de impacto das ações de permanência.
- Gestores Acadêmicos (Diretores e Coordenadores de Curso): Usuários operacionais que, via Calculadora de Risco e Painéis, identificam alunos em vulnerabilidade para intervenções de acolhimento e orientação pedagógica.
- Comissões Temáticas: Instâncias como a de Combate à Evasão, que usam evidências para propor reformas curriculares e ajustes administrativos.
- Comunidade Acadêmica e Pesquisadores: Docentes e discentes que acessam o Hub de Conhecimento para fundamentar estudos sobre gestão pública, ingresso e sucesso estudantil.
O público-alvo do Observatório abrange diferentes níveis da administração universitária:
- Gestores Estratégicos (Reitoria e Pró-Reitorias): Utilizam dados agregados para o desenho de políticas públicas, alocação orçamentária e avaliação de impacto das ações de permanência.
- Gestores Acadêmicos (Diretores e Coordenadores de Curso): Usuários operacionais que, via Calculadora de Risco e Painéis, identificam alunos em vulnerabilidade para intervenções de acolhimento e orientação pedagógica.
- Comissões Temáticas: Instâncias como a de Combate à Evasão, que usam evidências para propor reformas curriculares e ajustes administrativos.
- Comunidade Acadêmica e Pesquisadores: Docentes e discentes que acessam o Hub de Conhecimento para fundamentar estudos sobre gestão pública, ingresso e sucesso estudantil.
Município: Curitiba (Sede), com abrangência em todos os campi da instituição (Curitiba, Matinhos, Pontal do Paraná, Jandaia do Sul, Toledo e Palotina).
Estado: Paraná (PR).
Resultados e Impacto
- Institucionalização:
- Meta: Centralizar o combate à evasão.
- Resultado: Criado o Observatório e a Comissão (2025).
- Predição de Risco:
- Meta: Identificar o risco de abandono antes da evasão.
- Resultado: Implementada a Calculadora de Risco no SIGA. O modelo de Machine Learning atingiu 87% de acurácia, 83% de sensibilidade e 91% de precisão.
- Monitoramento:
- Meta: Interfaces interativas para gestão.
- Resultado: Lançamento de Painéis de Monitoramento que automatizaram o diagnóstico de séries históricas e fluxos de alunos por curso.
- Humanização:
- Meta: Mapear causas subjetivas.
- Resultado: Pesquisa com 1.783 respondentes identificou saúde mental e questões financeiras como causas críticas, orientando novas políticas de auxílio.
- Ciência Aberta:
- Meta: Baixo custo e transparência.
- Resultado: Uso de R e Python com código público no GitHub.
A escalabilidade é 4 (Muito Alto) devido aos seguintes pilares:
- Soberania e Baixo Custo: O uso de software livre (R/Python) elimina licenças onerosas, garantindo manutenção a longo prazo com baixo orçamento e replicação sem barreiras financeiras.
- Ciência Aberta: Metodologia e códigos públicos no GitHub permitem que outros órgãos adaptem os algoritmos e pesquisas à sua realidade, facilitando a expansão nacional da solução.
- Integração Sistêmica: A ferramenta é nativa do SIGA (Sistema de Gestão Acadêmica), tornando-se parte do fluxo de trabalho dos coordenadores. Isso cria uma cultura de dados que independe de mudanças de gestão.
- Modularidade: A estrutura de monitoramento e predição é expansível para outras áreas, como gestão de vagas ou alocação de recursos.
A união de tecnologia aberta, integração institucional e suporte de comissão permanente torna a prática um modelo robusto e replicável para todo o sistema de ensino superior.
- Soberania e Acesso Livre: O desenvolviment em R e Python (Open Source) permite que qualquer órgão público adote a solução sem custos de licenciamento, eliminando barreiras financeiras para instituições com orçamentos restritos.
- Ciência Aberta: Metodologia, roteiros de pesquisa e códigos-fonte estão documentados e disponíveis publicamente. Isso permite que outras universidades adaptem os algoritmos de Machine Learning e as interfaces de monitoramento às suas próprias bases de dados.
- Modularidade: A prática foi desenhada em pilares independentes. Um órgão pode replicar apenas o monitoramento ou o protocolo de pesquisas qualitativas, facilitando uma implementação gradual.
- Transferibilidade: O projeto entrega o “know-how” de governança, servindo como guia para a institucionalização da gestão baseada em evidências.
- Institucionalização: A prática não depende de iniciativas individuais, mas de uma Comissão Permanente e de unidades administrativas (CECD e PROGRAP) com atribuições regimentais para gerir dados e políticas de graduação.
- Integração Sistêmica: Por ser uma ferramenta nativa do SIGA, o Observatório tornou-se parte do fluxo de trabalho diário dos coordenadores. A dependência positiva gerada pela “Calculadora de Risco” assegura que a prática continue sendo utilizada como rotina de gestão.
- Custo Zero de Licenciamento: O uso de R e Python elimina a necessidade de orçamentos anuais para licenças de software, permitindo que a ferramenta funcione sem aportes financeiros extraordinários.
- Cultura de Dados: A transparência dos painéis e o Hub de Conhecimento criaram uma cultura de evidências que sobrevive a trocas de gestão, consolidando o projeto como um ativo estável da universidade.
- Eficiência Administrativa: A centralização da inteligência de dados e a Calculadora de Risco no SIGA permitem intervenções antes do abandono. Isso otimiza recursos públicos ao reduzir a ociosidade de vagas e refinar a alocação de auxílios.
- Desenvolvimento Tecnológico: Criação de um ecossistema robusto em R/Python e um Hub de Conhecimento. O código aberto no GitHub promove a soberania tecnológica e serve de referência para outras instituições (IFES).
- Impacto Social: Ao identificar preditores, a prática garantiu que o suporte chegasse a quem mais precisa, promovendo equidade e permanência estudantil.
Informações complementares
- Governança Institucional e Fluxos de Decisão: A prática é gerida por uma Comissão Multidisciplinar, que reúne as pró-reitorias de Planejamento (PROPLAD) e Graduação (PROGRAP). O modelo segue o ciclo de Gestão Baseada em Evidências, onde diagnósticos extraídos dos dados fundamentam atos normativos e políticas de assistência estudantil, garantindo que a tecnologia sirva à estratégia institucional.
- Tecnologias e Ciência de Dados: O desenvolvimento é baseado em Software Livre, utilizando as linguagens R e Python para extração (ETL), modelagem estatística e Machine Learning.
- Ferramentas de Gestão e Colaboração:
- Integração de Sistemas: Conexão direta com o SIGA (Sistema de Gestão Acadêmica) permitindo que a Calculadora de Risco opere em tempo rea.
- Gestão de Projetos: Metodologias ágeis para o ciclo de vida dos modelos, garantindo atualizações semestrais dos pesos das variáveis preditivas.
