Informação da Publicação

Título Deteção De Phishing Utilizando Processamento De Linguagem Natural
Autor(es)
Palavras-chave
investiga
phishing
solução
protótipo
email
Data 2025
Resumo
Este trabalho investiga o impacto do phishing na sociedade atual e propõe um protótipo leve, auditável e local para deteção de phishing em e-mail. Parte-se da constatação de que o phishing permanece vetor dominante de acesso inicial e fraude, com multiplicação de táticas como homógrafos Unicode, encurtadores, redireções em cadeia e uso de domínios legítimos comprometidos.
O objetivo geral é desenvolver e avaliar uma solução baseada em Processamento de Linguagem Natural (PLN) e sinais estruturais de URL, com entrega via FastAPI, que permita calibrar o limiar de decisão segundo o apetite de risco operacional. A metodologia combina features de texto com features lexicais/estruturais de URL (comprimento, dígitos, subdomínios, “@”, TLDs de risco, homógrafos, IP literal) e indicadores de HTML/cabeçalhos. Os classificadores de base são Logistic Regression e LinearSVC, com cenário opcional de embeddings compactos. O treino segue divisão 80/20 estratificada e validação cruzada a cinco dobras. A avaliação privilegia a classe positiva (phishing) com Precision, Recall, F1 e PR-AUC; o limiar final é escolhido por varrimento da curva precisão- recall para obter Recall ≥ 0,90 com a maior Precision possível. O protótipo expõe endpoints, /predict_email e retorna {score, label, reasons} com explicabilidade por coeficientes e regras. São relatadas experiências E0–E5 (texto-only; +URL; +headers; +HTML; SVM; embeddings), análises de ablação e testes de robustez (PT-BR, homógrafos, encurtadores, redireções, ausência de URL e de cabeçalhos). A conformidade com RGPD é endereçada por desenho: dados públicos/anonimizados, minimização, logs anónimos, pinning de dependências e scans SCA/SAST, alinhados a OWASP ASVS.
Conclui-se que a combinação de texto, URLs e cabeçalhos estabiliza o desempenho, permitindo calibrar o custo de FP/FN ao contexto.
Tipo Monografia Licenciatura - Monografia
URL_Anexo Acesso Restrito