{"provider_url": "https://projeto.lexml.gov.br", "title": "O LexML e a melhora da Qualidade da Informa\u00e7\u00e3o", "html": "\r\n<p>Todas as informa\u00e7\u00f5es disponibilizadas no Portal LexML s\u00e3o provenientes de sistemas alimentados pelos \u00f3rg\u00e3os que participam da Rede de Informa\u00e7\u00e3o Legislativa e Jur\u00eddica.&nbsp;Na alimenta\u00e7\u00e3o dos sistemas provedores de dados, podem ocorrer erros de transcri\u00e7\u00e3o da informa\u00e7\u00e3o&nbsp;contida na&nbsp;publica\u00e7\u00e3o oficial para o sistema de informa\u00e7\u00e3o. De forma inovadora, o LexML disponibilizou recentemente aos sistemas NJUR (Senado Federal) e LEGIN (C\u00e2mara dos Deputados) relat\u00f3rios contendo a compara\u00e7\u00e3o autom\u00e1tica do campo \"Ementa\" das leis federais do per\u00edodo de 1988 a 2008.</p>\r\n<p>O relat\u00f3rio \u00e9 organizado em duas colunas:</p>\r\n<ul><li>a primeira cont\u00e9m o texto como se encontra no sistema de informa\u00e7\u00e3o;</li><li>a segunda cont\u00e9m o texto com destaques em cores apresentando o resultado da compara\u00e7\u00e3o. Em vermelho, aparece o segmento que foi omitido e, em azul, aquilo que foi inclu\u00eddo.</li></ul>\r\n<p>A figura ao lado apresenta tr\u00eas exemplos do resultado desta compara\u00e7\u00e3o. No primeiro caso (A), nota-se uma troca de palavras; no caso (B), foram detectadas v\u00e1rias discrep\u00e2ncias em uma \u00fanica ementa devido aos erros existentes nas duas fontes de informa\u00e7\u00f5es; e, no \u00faltimo caso (C), um exemplo de omiss\u00e3o de uma express\u00e3o.</p>\r\n<p>Esse processo de melhora da qualidade da informa\u00e7\u00e3o poder\u00e1 se aplicado a quaisquer outras duas fontes. Por exemplo, uma prefeitura e uma c\u00e2mara municipal podem ter dados das leis municipais comparados utilizando essa mesma estrat\u00e9gia.</p>\r\n<p>Procedimento similar poder\u00e1 tamb\u00e9m ser aplicado para a compara\u00e7\u00e3o do texto integral de normas, desde que ocorra previamente a convers\u00e3o do inteiro teor para o formato LexML.</p>\r\n<p>&nbsp;</p>\r\n<table class=\"plain\">\r\n<tbody>\r\n<tr>\r\n<td>\r\n<p>PROCESSO DE GERA\u00c7\u00c3O DO RELAT\u00d3RIO</p>\r\n<p>O processo de gera\u00e7\u00e3o do relat\u00f3rio de compara\u00e7\u00e3o das ementas foi realizado em tr\u00eas etapas:</p>\r\n<ol start=\"1\"><li>normaliza\u00e7\u00e3o dos dados</li><li>compara\u00e7\u00e3o do texto normalizado</li><li>formata\u00e7\u00e3o do relat\u00f3rio utilizando cores</li></ol>\r\n<p>O objetivo da normaliza\u00e7\u00e3o dos dados \u00e9 transformar o texto original em um formato otimizado para compara\u00e7\u00e3o. Para isso, o texto \u00e9&nbsp;convertido em min\u00fasculas, s\u00e3o retirados diacr\u00edticos, espa\u00e7os em brancos m\u00faltiplos s\u00e3o removidos,&nbsp;al\u00e9m de v\u00e1rias outras convers\u00f5es realizadas no intuito de diminuir as discrep\u00e2ncias entre os textos. Na segunda etapa, utilizou-se o software <a class=\"external-link\" href=\"http://sourceforge.net/projects/jndiff\"><u>JNDIFF</u></a>, desenvolvido por pesquisadores da <a class=\"external-link\" href=\"http://www.cs.unibo.it/\"><u>Universidade de Bolonha</u></a>, para realizar a compara\u00e7\u00e3o dos textos. Na etapa final, foram gerados os relat\u00f3rios para cada sistema provedor de dados.&nbsp;</p>\r\n</td>\r\n</tr>\r\n</tbody>\r\n</table>\r\n", "author_name": "", "version": "1.0", "author_url": "https://projeto.lexml.gov.br/author/joaolima", "provider_name": "LexML", "type": "rich"}