1. O Que E Diff de Textos
Diff (abreviacao de "difference") e o processo de comparar dois textos e identificar as diferencas entre eles. E uma operacao fundamental em controle de versao (Git), revisao de documentos, auditoria de conteudo e deteccao de plagio.
Ferramentas de diff destacam visualmente o que foi adicionado, removido e mantido entre duas versoes de um texto, facilitando a revisao humana.
2. Algoritmo LCS
Esta ferramenta usa o algoritmo LCS (Longest Common Subsequence), que encontra a maior subsequencia comum entre dois textos. A partir dessa subsequencia, e possivel identificar exatamente o que foi adicionado e removido.
O LCS e o mesmo principio usado pelo comando "diff" do Unix e pelo Git para comparar arquivos. Sua complexidade e O(m*n), onde m e n sao os tamanhos dos textos.
"O algoritmo LCS e a base de praticamente todas as ferramentas de comparacao de textos, desde o diff do Unix ate os sistemas modernos de controle de versao."
3. Modos de Comparacao
- Caractere: o mais granular. Ideal para detectar erros de digitacao, espacos extras e pequenas alteracoes. Pode ser lento para textos muito grandes.
- Palavra: equilibra granularidade e performance. Ideal para revisao de documentos e textos em prosa.
- Linha: o mais rapido. Ideal para comparar codigo-fonte, listas e textos estruturados.
4. Casos de Uso Praticos
- Revisao de documentos: comparar versoes de contratos, artigos ou relatorios.
- Verificacao de codigo: identificar alteracoes entre versoes de scripts.
- Deteccao de plagio: verificar similaridade entre textos.
- Auditoria: garantir que apenas as alteracoes autorizadas foram feitas.
- Traducao: comparar textos originais com traducoes para verificar omissoes.
5. Metrica de Similaridade
A metrica de similaridade indica o percentual de conteudo que e identico entre os dois textos. E calculada como a razao entre elementos iguais e o total de elementos (iguais + adicionados + removidos).
Uma similaridade de 100% indica textos identicos, enquanto 0% indica textos completamente diferentes. Essa metrica e util para avaliar rapidamente o grau de alteracao entre versoes.
6. Perguntas Frequentes
Os textos sao armazenados?
Nao. Todo o processamento e feito localmente no seu navegador. Nenhum texto e enviado a servidores.
Qual o limite de tamanho dos textos?
Nao ha limite fixo, mas o algoritmo LCS tem complexidade quadratica. Textos muito longos (acima de 10.000 caracteres no modo caractere) podem causar lentidao. Use o modo palavra ou linha para textos grandes.
Posso ignorar diferencas de formatacao?
Sim. Use as opcoes "Ignorar maiusculas/minusculas" e "Ignorar espacos extras" para comparar apenas o conteudo semantico.
Como funciona o destaque por cores?
Verde indica texto adicionado (presente apenas em B), vermelho indica texto removido (presente apenas em A), e texto sem destaque e identico em ambos.