SchemaAPI
Sobre o Projeto
API para processamento inteligente de documentos (PDFs, DOCX, TXT, CSV, XLSX) com pipeline ML avançado. Features incluem: Sumarização híbrida abstractiva/extractiva com map-reduce para docs longos; Extração de itens de ação com predição de responsável e prazo via NER e classificação; Construção automática de grafo de conhecimento com descoberta de relacionamentos; Busca semântica com embeddings SentenceTransformers e indexação HNSW para <200ms de latência; Detecção de padrões temporais, tendências e anomalias; Classificação multi-label de documentos; Processamento multilíngue (PT, EN, ES) com modelos Transformer unificados. Arquitetura híbrida: Core Rust para parsing de alta performance e I/O, Python para pipeline ML (Hugging Face, spaCy, scikit-learn). Infraestrutura: FastAPI async, Redis cache (75%+ hit rate), PostgreSQL com pgvector, rate limiting, trilha de auditoria, OpenTelemetry. Benchmarks: <3s por documento, >1000 docs/hora em batch.