A eficiência dos softwares de detecção de similaridade e plágio

A eficiência dos softwares de detecção de similaridade e plágio

Uma pergunta recorrente em minhas palestras sobre o plágio acadêmico é sobre recomendação de softwares para detecção de similaridades e plágio. Também noto nas redes sociais, muitas pessoas publicando indicações de softwares, geralmente gratuitos. Como todo “remédio” ou “exame de diagnóstico”, esta prescrição, para ser minimamente adequada, precisa atender alguns pressupostos, como reconhecimento do paciente, tipo da queixa, levantamento de informações prévias, entre outros, para então avançar na melhor escolha de procedimento a ser adotado.

Sem mais metáforas, de forma geral, os softwares são algoritmos de busca de similaridades que usam todo o acervo de conteúdos disponíveis na internet como parâmetro de comparação com o texto que está sendo verificado. Entretanto, a internet é um repositório global de documentos, em todos os idiomas, de diferentes características, que são veiculados de forma restrita e aberta, em websites, blogs, revistas, repositórios e redes sociais de onde as informações são recuperadas a depender da programação da ferramenta. Por exemplo, ela pode buscar primeiramente aquelas informações que são mais úteis, ou mais populares, que são idênticas ao idioma do texto consultado, privilegiar fontes de acesso público e assim por diante.

Portanto, a eficiência dos softwares de busca de similaridades depende de vários fatores, que caracterizam uma complexidade cuja eficiência depende da qualidade do algoritmo de programação da ferramenta considerando a finalidade do usuário e o repertório de busca do software.

Sendo assim, é muito arriscado ou precipitado recomendar este ou aquele software apenas porque é o mais conhecido ou gratuito. Recomendo prudência! Pode resultar disso, a indicação de um programa que pode gerar um resultado falso negativo, ou seja, dizer para o usuário que o texto verificado não tem nenhuma similaridade com outro texto publicado na internet. Este resultado pode acontecer não porque de fato não exista outra fonte igual, mas porque o software não encontrou a fonte idêntica. E pode até ser um texto que está ali, na Wikipédia, que é uma fonte de acesso público…

Um estudo recente sobre a eficácia desses softwares, analisou treze programas diferentes, todos eles internacionais e procurou identificar os melhores considerando aspectos como quais fontes foram rastreadas, os tipos de plágios que foram encontrados, eficiência do ponto de vista do idioma utilizado nos textos submetidos, extensão dos resultados encontrados, a qualidade dos relatórios de similaridade gerados, entre outros fatores. No resultado da pesquisa aparecem os seguintes programas como sendo os melhores: Ouriginal, Turnitin, Plagscan, PlagAware, StrikePlagiarism, PlagiarismCheck.Org.

Neste estudo não foi incluído nenhum software brasileiro e tampouco foi investigada a eficiência dos programas estudados com textos no idioma português. Este trabalho estou fazendo agora e pretendo divulgar os resultados ainda este ano. Aguarde!

Desde já, algumas observações importantes e prudentes: os softwares gratuitos possuem eficiência reduzida, bem como os softwares pagos variam na eficiência no rastreio da diversidade das fontes. A melhor dica é utilizar mais de um programa e analisar de forma cumulativa os relatórios gerados. Aliás, este é um outro fator importante: a qualidade dos relatórios gerados e a capacidade técnica de análise do usuário, são outros fatores fundamentais. Tenho notado softwares que encontram como fontes similares conteúdos que não correspondem exatamente à fonte de onde foram extraídos. Qual é o problema disso? O usuário admitir como original o texto similar indicado pelo software, mas que na realidade também é um plágio de uma terceira ou quarta fonte, esta sim original, mas que o software não encontrou… Complexo, né?!

Estou desvendando tudo isto e pretendo ajudar mais do que consegui fazer até aqui.

Por enquanto, reforço algumas dicas: se for usar software, use os melhores, com reconhecimento de estudos científicos. Use mais de um. Saiba que mesmo os melhores, não garantem totalmente a integridade do texto verificado. Como tudo na vida, a prevenção ainda é o melhor remédio!

 

Para citar este texto:

KROKOSCZ, Marcelo. A eficiência dos softwares de detecção de similaridade e plágio. Instituto Antiplágio. São Paulo, 16 fev. 2022. Disponível em: https://www.institutoantiplagio.com.br/?p=673&preview=true. Acesso em: dd mês abrev. ano [data do seu acesso a esta fonte]

 

Para mais informações sobre o estudo comentado:

FOLTÝNEK, T.; DLABOLOVÁ, D.; ANOHINA-NAUMECA, A.; et al. Testing of support tools for plagiarism detection. International Journal of Educational Technology in Higher Education, v. 17, n. 46, p. 31, 2020. Disponível em: https://doi.org/10.1186/s41239-020-00192-4. Acesso em: 16 Fev. 2022.