Inteligência distribuída e catalogação como crowdsourcing

Giselle Beiguelman

Arquivos digitais e Inteligências Artificiais possibilitam novas formas de organização dinâmica dos conteúdos culturais, abrindo possibilidades inéditas para o conhecimento crítico e colaborativo. Essas mesmas dinâmicas implicam desafios significativos, face à obsolescência programada e ao colonialismo dos dados. Nesse contexto, fabular arquivos mutantes, capazes de dar vazão a outras histórias das artes e das sociedades, implica pensar em modos de fomentar usos críticos das redes e outras culturas da memória. Iniciativas de catalogação baseadas em sistemas de crowdsourcing são um ponto de inflexão importante desse debate

Inciativas de catalogação distribuída em sistemas de crowd-sourcing ganham peso na reflexão sobre novos modelos de arquivamento. As iniciativas GLAM (Galleries Libraries Archives and Museums) são um ponto de partida para essa discussão. Elas compreendem as parcerias e atividades realizadas pela Wikipédia com instituições culturais, a fim de levar o acervo dessas instituições ao público online, assegurando que as informações relacionadas a esses acervos (os metadados) estejam devidamente estruturados.

Um dos casos mais bem sucedidos é o do Museu Paulista da da USP (MP-USP) que resultou em: Disponibilização das imagens relacionadas ao acervo do museu (+ de 30 mil até o momento); 6 mil metadados estruturados referentes às imagens e outros itens do acervo; Melhoria de 2.500 verbetes na Wikipédia (Maratonas de edição), relacionados à mulher na História da Arte, à figuração dos indígenas no Museu, e à problematização das lutas pela Independência do Brasil.

Digno de nota, nessa direção, é o projeto Arquigrafia, da FAUD-USP. Criado em 2008 e online desde 2011, o Arquigrafia é um ambiente colaborativo temático com cerca de 10 mil imagens de arquiteturas e espaços urbanos, disponibilizadas para livre acesso, com direitos autorais protegidos por licenças Creative Commons. Em parceria com a Seção de Material Iconográfico da Biblioteca da FAUUSP, sua equipe desenvolve um intenso trabalho de conservação de material fotográfico original, digitalização e difusão web que faculta o acesso público e gratuito a um dos mais relevantes acervos de imagens fotográficas de arquitetura e urbanismo.

Outra iniciativa que vale menção aqui, em sua capacidade de trabalhar o potencial da inteligência distribuída das redes é o projeto By the People, da Library of Congress, dos EUA, um projeto de crow-sourcing que convida o público a transcrever, revisar e taguear páginas digitalizadas das coleções da Biblioteca. As transcrições criadas pelos voluntários melhoram a pesquisa, a legibilidade e o acesso a documentos manuscritos e digitados para todos, incluindo pessoas com deficiência visual.

Todas as transcrições são feitas e revisadas por voluntários antes de serem integradas ao site da Biblioteca. “By the People” é alimentado pela plataforma de transcrição colaborativa de código aberto Concordia, desenvolvida pela Biblioteca do Congresso. Inciado em 2018, o nome desse projeto vem da frase de encerramento do Discurso de Gettysburg de Abraham Lincoln, que afirma: “…governo do povo, pelo povo e para o povo, não perecerá da terra.” Ao delegar a melhoria das coleções digitais da Biblioteca do Congresso aos seus consulentes, a instituição segue um movimento que a Biblioteca Pública de Nova York vem realizando desdes 2012, como o Space/Time Directory.

O projeto, que recebeu uma bolsa de 380 mil dólares, foi anunciado como um “Google Maps do passado”, com uma função de controle deslizante de tempo construída ao juntar e sobrepor mapas históricos. Um recurso semelhante a “Foursquare ou Yelp do passado”, onde qualquer local histórico pode ser encontrado em qualquer ponto no tempo. Um catálogo histórico dos materiais culturais da cidade, como fotografias, artigos de jornal, diretórios de empresas, referências literárias e dados censitários.

Uma “máquina do tempo em forma de código” – uma base de código que outras cidades podem emular para criar interfaces semelhantes. Está fora do ar, comprometido pela obsolescência programada. Porém seu código continua aberto no Git Hub. A disponibilização das formas de fazer é fundamental para pensar no fomento à Inteligência distribuída.