Identificação de duplicidades de materiais em processos de compras públicas usando PLN

Autores

DOI:

https://doi.org/10.53660/PRW-2539-4555

Palavras-chave:

Análise de Similaridade, Processamento de Linguagem Natural, Compras Públicas

Resumo

Instituições públicas brasileiras necessitam atender a diversas especificidades para realizarem processos de compras idôneos e eficientes, como não comprar produtos e serviços em duplicidade. No entanto, esse é um problema que acontece de forma recorrente nas aglutinações de demandas. Para mitigar esse problema, este trabalho apresenta técnicas de Processamento de Linguagem Natural (PLN) desenvolvidas para identificar duplicidades nas demandas de compras, aplicadas a um estudo de caso com uma universidade pública brasileira. Utilizando técnicas de embeddings estáticos e dinâmicos, a ferramenta desenvolvida foi capaz de detectar termos similares em descrições de materiais, melhorando a eficiência do processo de aquisição. Os resultados mostraram que modelos de terceira geração de embeddings apresentaram maior precisão na recuperação de termos. O agrupamento de itens, baseado nos embeddings das descrições apresentou boas métricas, mas para novos itens a proporção de correspondências corretas foi mediana. A pesquisa permitiu identificar os avanços dos word embeddings dinâmicos, em um contexto e idioma específico, em relação aos modelos anteriores com pouco esforço demandado. Este trabalho contribui para a otimização dos processos licitatórios, reduzindo redundâncias e promovendo maior transparência.

Downloads

Não há dados estatísticos.

Referências

ALVAREZ-RODRÍGUEZ, José María; LABRA-GAYO, José Emílio; RODRÍGUEZ-GONZÁLEZ, Alejandro; DE PABLOS, Patrícia Ordoñez. Empowering the access to public procurement opportunities by means of linking controlled vocabularies. A case study of Product Scheme Classifications in the European e-Procurement sector. Computers in Human Behavior, v. 30, p. 674–688, jan. 2014.

ARTAMONOV, Аlexey; VASILEV, Michael; TUKUMBETOVA, Rufina; ULIZKO, Michael. Multiagent System for Monitoring, Analysis and Classification of Data from Procurement Services. Procedia Computer Science, v. 213, p. 96–100, 1 jan. 2022.

BIFULCO, Ida; CIRILLO, Stefano; ESPOSITO, Christian; GUADAGNI, Roberta; POLESE, Giuseppe. An intelligent system for focused crawling from Big Data sources. Expert Systems with Applications, v. 184, p. 115560, dez. 2021

BRASIL. Lei nº 13.460, de 26 de junho de 2017a. Dispõe sobre participação, proteção e defesa dos direitos do usuário dos serviços públicos da administração pública. Disponível em: https://www.planalto.gov.br/ccivil_03/_ato2015-2018/2017/lei/l13460.htm. Acesso em: 26 dez. 2023.

BRASIL. Lei nº 14.133, de 1º de abril de 2021b. Estabelece normas gerais de licitação e contratação para as Administrações Públicas diretas, autárquicas e fundacionais da União, dos Estados, do Distrito Federal e dos Municípios. Disponível em: https://www.planalto.gov.br/ccivil_03/_ato2019-2022/2021/lei/l14133.htm. Acesso em: 20 jun. 2024.

BRASIL. Decreto n.º 10.947, de 25 de janeiro de 2022c. Regulamenta o art. 11 da Lei n.º 12.527, de 18 de novembro de 2011, e altera o Decreto n.º 8.777, de 11 de maio de 2016, que institui a Política de Dados Abertos do Poder Executivo federal. Disponível em: https://www.planalto.gov.br/ccivil_03/_ato2019-2022/2022/decreto/D10947.htm

BRUCKNER, Tomáš; VENCOVSKÝ, Filip. The Process of Unit Price Extraction from Public Sector Contracts. Acta Informatica Pragensia, v. 9, n. 2, p. 170–183, 31 dez. 2020.

CORTES, Eduardo G; VIEIRA, Renata; BARONE, Dante A. C. Capítulo 16 Perguntas e Respostas. In CASELI, Helena de Medeiros.; NUNES, Maria das Graças Volpe (org.). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. 2 ed. BPLN, 2024. https://brasileiraspln.com/livro-pln/2a-edicao/

CRESWELL, John W. Projeto de pesquisa: métodos qualitativo, quantitativo e misto. 3. ed. Porto Alegre, RS: Artmed, 2010.

FANTONI, Gualtiero et al. Text mining tool for translating terms of contract into technical specifications: Development and application in the railway sector. Computers in Industry, v. 124, p. 103357, jan. 2021.

FEITOSA, David B.; PINHEIRO, Vládia C. Análise de Medidas de Similaridade Semântica na Tarefa de Reconhecimento de Implicação Textual. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 1. , 2017, Uberlândia/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2017. p. 161-170.

FREITAS, Cláudia., Capítulo 14 Dataset e corpus. In CASELI, Helena de Medeiros.; NUNES, Maria das Graças Volpe (org.). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. BPLN, 2023. Disponível em: https://brasileiraspln.com/livro-pln. Acesso em: 12 dez. 2023

GIL, Antonio Carlos. Métodos e técnicas de pesquisa social. 7 ed. Rio de Janeiro: Atlas, 2019.

JACQUES DE SOUSA, Luís; POÇAS MARTINS, João; SANHUDO, Luís. Portuguese public procurement data for construction (2015–2022). Data in Brief, v. 48, p. 109063, jun. 2023.

JURAFSKY, Daniel; MARTIN, James H. Speech and language processing: An introduction to natural language processing, computational linguistics, and speech recognition. Draft of January 7, 2023. Nova Jersey: Prentice Hall, 2023. Disponível em: https://web.stanford.edu/~jurafsky/slp3/. Acesso em: 10 dez. 2023.

KILIMCI, Zeynep H.; AKYOKUS, Selim. Deep learning- and word embedding-based heterogeneous classifier ensembles for text classification. Complexity, 2018. Disponível em: https://doi.org/10.1155/2018/7130146. Acesso em: 10 dez. 2023.

LEE, Gyueun et al. Automatic Classification of Construction Work Codes in Bill of Quantities of National Roadway Based on Text Analysis. Journal of Construction Engineering and Management, v. 149, n. 2, fev. 2023

LIMA, Marcos et al. Inferring about fraudulent collusion risk on Brazilian public Works contracts in oficial texts using a Bi-LSTM approach. Findings of the Association for Computational Linguistics: EMNLP 2020, November 2020. p. 1580 – 1588, 2020.

LIMA, Weslley et al. Methodology for automatic extraction of red flags in public procurement. International Joint Conference on Neural Networks (IJCNN). 2023.

MODRUŠAN, Nicola; RABUZIN, Kornelije; MRŠIĆ, Leo. Improving Public Sector Efficiency using Advanced Text Mining in the Procurement Process. Proceedings of the 9th International Conference on Data Science, Technology and Applications, 2020.

OLIVEIRA, Hugo Gonçalo; ALVES, Ana Oliveira; RODRIGUES, Ricardo. Gradually Improving the Computation of Semantic Textual Similarity in Portuguese. EPIA, 2017. LNAI 10423, pp. 841–854.

PAES, Aline; VIANNA, Daniela; RODRIGUES, Jessica. Capítulo 15 Modelos de Linguagem. In CASELI, Helena de Medeiros.; NUNES, Maria das Graças Volpe (org.). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. BPLN, 2023. Disponível em: https://brasileiraspln.com/livro-pln. Acesso em: 12 dez. 2023

PINHEIRO, Álvaro Farias. Automação de Processos através da RPA para Transformação Digital. Fundação Escola Nacional de Administração Pública, Diretoria de Desenvolvimento Profissional. SAIS - Área 2-A - 70610-900 — Brasília DF. 2022.

PINHEIRO, Anderson et al. Statistical and Semantic Features to Measure Sentence Similarity in Portuguese. 2017. Uberlândia, Brasil. p. 342–347.

RODRIGUES, Ana Carolina. Avaliação de representações embeddings para similaridade sentencial no Português. 2023. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-02062023-105741/. Acesso em: 23 jan. 2024

SANTOS, Joaquim et al. Assessing the Impact of Contextual Embeddings for Portuguese Named Entity Recognition. 2019.

SENO, Eloize Rossi Marques; DE PAIVA, Valéria; PINHEIRO, Vládia. Capítulo 9 Semântica com Técnicas Simbólicas. In CASELI, Helena de Medeiros.; NUNES, Maria das Graças Volpe (org.)a. Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. BPLN, 2023. Disponível em: https://brasileiraspln.com/livro-pln. Acesso em: 12 dez. 2023.

SENO, Eloize Rossi Marques; CLARO, Daniela; MOTA, Laila; RODRIGUES, Jéssica. Capítulo 10 Semântica Distribucional. In CASELI, Helena de Medeiros.; NUNES, Maria das Graças Volpe (org.)b. Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. BPLN, 2023. Disponível em: https://brasileiraspln.com/livro-pln. Acesso em: 12 dez. 2023.

SICILIANI, Lucia et al. AI-based decision support system for public procurement. Information Systems, v. 119, p. 102284, 1 out. 2023.

SILVA, Mariana O. et al. Análise de Sobrepreço em Itens de Licitações Públicas. In: WORKSHOP DE COMPUTAÇÃO APLICADA EM GOVERNO ELETRÔNICO (WCGE), 11. , 2023, João Pessoa/PB. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 118-129. ISSN 2763-8723. DOI: https://doi.org/10.5753/wcge.2023.230608.

TORRES-BERRU, Yeferson; F. LOPEZ-BATISTA, Vivian; CONDE ZHINGRE, Lorena. A Data Mining Approach to Detecting Bias and Favoritism in Public Procurement. Intelligent Automation & Soft Computing, v. 36, n. 3, p. 3501–3516, 2023.

VERGARA, Sylvia Constant. Métodos de pesquisa em administração. São Paulo: Atlas, 2012.

Downloads

Publicado

2024-09-04

Como Citar

Forbici, F., Silva Pinto Junior, J., Faria Culmant Ramos, V. ., & de Souza, J. A. (2024). Identificação de duplicidades de materiais em processos de compras públicas usando PLN. Peer Review, 6(15), 486–509. https://doi.org/10.53660/PRW-2539-4555

Edição

Seção

Articles