A Internet Archive está tornando a Wikipédia mais confiável

A operadora da Wayback Machine permite que os usuários da Wikipédia verifiquem citações de livros como se fossem citações da web.

A Wikipédia se tornou o árbitro da verdade na internet; é através dela que, nos bares, a maioria dos argumentos são resolvidos. Ela fornece respostas para os trechos de informações que você busca no Google ou no Bing, por exemplo. É o primeiro passo para praticamente todo mundo fazer uma pesquisa online.

A razão pela qual as pessoas confiam na Wikipédia, apesar de não ser perfeita, é que supostamente cada afirmação tem uma referência – qualquer sentença que não tenha uma fonte confiável corre o risco de ser retirada pelo aviso “requer citação”. Qualquer pessoa pode querer conferir essas referências para aprender mais sobre o assunto desejado, ou simplesmente verificar se as fontes realmente dizem o que alguém escreveu na enciclopédia digital – mas isso é, se você conseguir achar essas fontes.

Torna-se fácil se as fontes são online, mas muitos artigos na Wikipédia são baseados no old but gold livro. Ao pesquisar por Martin Luther King Jr., por exemplo, são citados 66 livros diferentes. Até recentemente, se você quisesse verificar se os livros dizem o mesmo que o artigo, ou se você só desejasse ler o material citado, você precisaria conseguir um exemplar do livro.

Agora, graças à uma nova iniciativa da Internet Archive, uma organização sem fins lucrativos que reúne bilhões de arquivos da web, você pode clicar no nome do livro e pré-visualizar até duas páginas do material, desde que a citação informe a página do livro na referência. Outra funcionalidade é poder emprestar uma cópia digital do livro, desde que ninguém já o tenha conferido em até duas semanas – bem parecido como se você fosse emprestar um livro de uma biblioteca local. Alguns grupos de autores e editores contestaram a prática do arquivo sobre permitir que usuários emprestem a digitalização de livros não autorizados. A Internet Archive diz que procura ampliar o acesso aos livros de maneiras “equilibradas e respeitosas”.

Até agora a Internet Archive direcionou 130.000 referências na Wikipédia, em vários idiomas, à links de 50.000 livros que a organização digitalizou e tornou disponível para o público. O órgão eventualmente espera permitir que usuários visualizem e emprestem todos os livros citados pela Wikipédia e tem como objetivo final digitalizar todos os livros já publicados no mundo.

“Nosso objetivo é nos tornarmos uma biblioteca útil e alcançável para mais pessoas”, diz Mark Graham, diretor de serviço da Wayback Machine da Internet Archive 

Se isso for bem sucedido, o projeto da Internet Archive seria uma benção na vida dos estudantes, jornalistas, ou qualquer um que queira checar referências de uma página da Wikipédia. O Google Books também tem uma grande coleção de livros digitalizados, mas normalmente mostra somente pequenos trechos do texto.

“Tentei verificar páginas da Wikipédia buscando por comentários de divulgação dos livros no Google Books, mas é muito imprevisível, e você acaba não conseguindo avaliar o uso do material,” diz Mike Caulfield, um especialista em alfabetização digital e diretor de aprendizado na Washington State University Vancouver. “A capacidade de poder ler uma página ou duas do contexto por trás de uma sentença é crucial tanto pros editores que tentam proteger a integridade de seus artigos, quanto para os leitores que precisam chegar a esse próximo passo de verificação”.

Você pode, claro, verificar as informações do jeito tradicional, através de um exemplar físico do livro. Porém, estudantes que passam a noite trabalhando em suas dissertações ou relatórios com prazos de entrega apertados, talvez não tenham tempo de pedir um livro pela Amazon ou esperar que o livro na biblioteca fique disponível. Em outros casos, podem ser difíceis de serem encontrados; como a página da Wikipédia sobre os campos de concentração dos nipo-americanos durante a Segunda Guerra Mundial, nela são citados títulos muito raros, diz o diretor de parcerias da Internet Archive, Wendy Hanamura. Mas, graças à biblioteca digital da encarceração nipo-americana da Internet Archive, criada com a Densho, organização sediada em Seattle, muitos desses raros livros estão disponíveis online.

A Internet Archive embarcou nessa missão de tornar os livros digitais na Wikipédia depois das eleições de 2016. “Não importa quem você apoiasse para presidente, eu diria que praticamente todo mundo concorda que o processo todo foi como um acidente de trem”, disse o fundador da Internet Archive, Brewster Kahle, em um discurso em São Francisco, mês passado. Desde fake news, campanhas inautênticas nas mídias sociais empreendidas por nações estrangeiras, até o próprio sistema de votação ser fraudado, houve muitas maneiras pelas quais os sistemas de tecnologia e informação falharam ao público. Com isso, Kahle convocou um grupo de pessoas para discutirem como melhorar o ecossistema de informação. Um problema que acabou sendo notado foi a fragilidade das citações usadas na Wikipédia. Livros e revistas acadêmicas oferecem as melhores e mais confiáveis informações para os editores da enciclopédia digital, mas essas fontes frequentemente ou estão indisponíveis ou são pagas. Além disso, conteúdos gratuitos e livres na internet muitas vezes desaparecem.

Só havia uma solução para a Internet Archive resolver este problema. O serviço de Wayback Machine da organização já arquivou 387 bilhões de páginas desde 2001. Estão sendo digitalizados também livros impressos e outras mídias análogas, e tem até o momento 3.8 milhões de livros escaneados e ainda restam milhões de livros armazenados.

Graham e companhia criaram a InternetArchiveBot, uma ferramenta que varre uma pesquisa pela Wikipédia à procura de links quebrados, e automaticamente adiciona um outro link para versões que estão arquivadas na Wayback Machine. Por consequência das ferramentas automáticas de edição exigirem permissões especiais para serem utilizadas, Graham tem que trabalhar com as comunidades da Wikipédia que gerenciam versões da enciclopédia em diferentes línguas. “Ao todo, nós editamos 14 milhões de links; mais de 11 milhões deles direcionam para a Internet Archive”, diz ele.

Inserir links aos livros é similar, porém mais desafiador. “Se um livro tem um número de ISBN e a página contém um formato tradicional de citações, é bem fácil”, explica Graham. Mas nem todos os livros possuem um número ISBN, e muitas citações não estão corretamente formatadas. Por exemplo, algumas somente citam o livro e não especificam a página. Podem haver, também, diferenças entre diferentes versões de um livro.

Obviamente, a Internet Archive ainda não digitalizou todos os livros citados pela Wikipédia. É trabalho duro realizar essa atividade para coleções de bibliotecas pelo mundo, juntamente com doações de empresas como a Better World Books. Graham diz que a organização digitaliza mais de 1000 livros por dia. Contudo, ainda resta muito trabalho a ser feito.

Notícia traduzida do site Wired, disponível em [1].

Deixe uma resposta

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.