Projetos

Trabalhos selecionados

Trabalhos selecionados em infraestrutura de IA, PLN e pesquisa aplicada.

I — Em produção
N° 01

Molcajete

Pipeline de transcrição e análise com IA para pesquisa política qualitativa.

Pipeline completo, do áudio bruto ao insight final, no lugar de transcrição cheia de erros e horas de anotação por projeto. Diarização de falantes, transcrição, classificação de temas e relatórios integrados — tudo numa camada de ferramentas que pesquisadores realmente usam.

1,300+
horas de áudio processadas
<60 min
tempo de entrega por projeto
N° 02

Adapta

Pipeline de pré-processamento de dados e infraestrutura de fine-tuning de LLMs para análise política em espanhol mexicano.

Modelos LLM especializados, fruto de um pipeline reprodutível de fine-tuning e avaliação. Permite a comparação empírica de modelos base e prompts.

40+
métricas de avaliação
100+
execuções de treino
N° 03

Nopalero

Sistema automatizado de triagem de participantes para recrutamento qualitativo.

Pipeline automatizado de triagem que substitui horas de digitação manual por projeto. Combina OCR, detecção de fraude e classificação socioeconômica — para que os analistas foquem nas decisões, não no trabalho burocrático.

48
verificações de validação
0
entrada manual de dados
II — Código aberto

Scraper de processos do Supremo Tribunal Federal (STF).

CLI em Python baseada em Typer, com três etapas cache-first — coleta, download e extração. Suporta execuções massivamente paralelas com rotação de proxy e alimenta um warehouse DuckDB. Vários backends de OCR, incluindo Tesseract auto-hospedado no fly.io para inferência de baixo custo.

R$ 52
varredura anual de HC
0.93/s
vazão de PDFs
0.28/s
vazão de processos
4
backends de OCR

Tem um problema que não entra numa caixinha?

Os projetos acima começaram com alguém dizendo isso.

Conte mais