Arquivos digitais: entre a inteligência distribuída e o colonialismo dos dados

Giselle Beiguelman

Arquivos digitais e Inteligências Artificiais possibilitam novas formas de organização dinâmica dos conteúdos culturais, abrindo possibilidades inéditas para o conhecimento crítico e colaborativo. Essas mesmas dinâmicas implicam desafios significativos, face à obsolescência programada e ao colonialismo dos dados. Nesse contexto, fabular arquivos mutantes, capazes de dar vazão a outras histórias das artes e das sociedades, implica pensar em modos de fomentar usos críticos das redes e outras culturas da memória.

[Conferência de abertura do 1o Seminário Sesi Lab. Brasília, 9 de novembro de 2023]

Arquivos digitais, arquivos mutantes

O avanço das tecnologias digitais têm proporcionado novas formas de arquivar e preservar obras de arte. No contexto contemporâneo, apresentam-se diferentes perfis de arquivamento digital. Grosso modo, podem-se diferenciar dois tipos de arquivos digitais: arquivos nativamente digitais e arquivos digitalizados. Arquivos nativamente digitais são aqueles que foram criados e existem em formato eletrônico desde sua concepção inicial. Esses arquivos são produzidos por meio de processos digitais e não têm uma contraparte física correspondente. São exemplos de arquivos nativamente digitais os documentos de texto, planilhas eletrônicas, apresentações de slides, imagens digitais, vídeos, áudios, entre outros. Esses arquivos são criados diretamente em formato eletrônico, sem a necessidade de serem convertidos ou digitalizados a partir de uma versão física.

Por outro lado, os arquivos digitalizados referem-se a documentos ou objetos que foram convertidos de seu formato físico original para um formato eletrônico. Nesse processo, utiliza-se um scanner, câmera ou outro dispositivo de digitalização para capturar uma imagem ou uma representação eletrônica da versão física do documento ou objeto. Os arquivos digitalizados são, essencialmente, cópias eletrônicas de documentos ou objetos físicos, podendo inclusive distorcer as informações principais do original (quanto a cores e escala, por exemplo). 

Nesse sentido, é fundamental entendermos que ao falarmos de arquivos digitais (sejam eles nativos ou digitais), estamos nos referindo a arquivos mutantes. Isso diz respeito não apenas à descartabilidade que os processos de obsolêscencia implicam e à flexibilidade de manipulação dos arquivos digitais.

Falar em arquivos mutantes, no entanto, implica entender o arquivo para além de um espaço de armazenamento de documentos digitais, que não apenas guarda, mas cria arquiteturas para que o usuário possa performar e interagir com os conteúdos. Como deixa claro o Professor Dalton Martins, o modelo de catalogação dos museus foi levado sem questionamento para o meio digital. Isso é um equívoco, pois o objeto digital contem camadas de informações variadas, para além do assunto a que se refere, que se expandem no meio online, enredando-se aos conteúdos que se agregam por meio de comentários, links públicos e programas de buscas, entre outros.

Assim, documentar, hoje em dia, é questionar a lógica de um repositório digital estático e pensar em ecossistemas de organização dinâmicos que permitam, por exemplo, contar outras histórias da arte e da cultura, incorporando criticamente o manancial de conteúdos que são disponibilizados diariamente na internet.

A Wikipedia é um bom ponto de partida para abordarmos os usos críticos das redes. Para tanto, parto do caso de um Museu brasileiro para introduzir a questão. Mais especificamente, falo dos GLAMs da Wikipédia e do caso do Museu Paulista da USP.

Inteligência distribuída

Crowd Sourcing

As iniciativas GLAM (Galleries Libraries Archives and Museums), compreendem as parcerias e atividades realizadas pela Wikipédia com instituições culturais, a fim de levar o acervo dessas instituições ao público online, assegurando que as informações relacionadas a esses acervos (os metadados) estejam devidamente estruturados. 

No caso do MP-USP, isso implicou: Disponibilização das imagens relacionadas ao acervo do museu (+ de 30 mil até o momento); 6 mil metadados estruturados referentes às imagens e outros itens do acervo; Melhoria de 2.500 verbetes na Wikipédia (Maratonas de edição), relacionados à mulher na História da Arte, à figuração dos indígenas no Museu, e à problematização das lutas pela Independência do  Brasil (ALVES, 2020 p. 4) .

Outra iniciativa que vale menção aqui, em sua capacidade de trabalhar o potencial da inteligência distribuída das redes é o projeto By the People, da Library of Congress, dos EUA, um projeto de crow-sourcing que convida o público a transcrever, revisar e taguear páginas digitalizadas das coleções da Biblioteca. As transcrições criadas pelos voluntários melhoram a pesquisa, a legibilidade e o acesso a documentos manuscritos e digitados para todos, incluindo pessoas com deficiência visual.

Todas as transcrições são feitas e revisadas por voluntários antes de serem integradas ao site da Biblioteca. “By the People” é alimentado pela plataforma de transcrição colaborativa de código aberto Concordia, desenvolvida pela Biblioteca do Congresso. Inciado em 2018, o nome desse projeto vem da frase de encerramento do Discurso de Gettysburg de Abraham Lincoln, que afirma: “…governo do povo, pelo povo e para o povo, não perecerá da terra.” Ao delegar a melhoria das coleções digitais da Biblioteca do Congresso aos seus consulentes, a instituição segue um movimento que a Biblioteca Pública de Nova York vem realizando desdes 2012, como o Space/Time Directory.

O projeto, que recebeu uma bolsa de 380 mil dólares, foi anunciado como um “Google Maps do passado”, com uma função de controle deslizante de tempo construída ao juntar e sobrepor mapas históricos. Um recurso semelhante a “Foursquare ou Yelp do passado”, onde qualquer local histórico pode ser encontrado em qualquer ponto no tempo. Um catálogo histórico dos materiais culturais da cidade, como fotografias, artigos de jornal, diretórios de empresas, referências literárias e dados censitários. 

Uma “máquina do tempo em forma de código” – uma base de código que outras cidades podem emular para criar interfaces semelhantes. Está fora do ar, comprometido pela obsolescência programada. Porém seu código continua aberto no Git Hub. A disponibilização das formas de fazer é fundamental para pensar no fomento à Inteligência distribuída.

Salvos pela cópia

É fato que a obsolescência  programada é um dos desafios principais do armazenamento, conservação e publicação dos arquivos digitais. Contudo é preciso levar em consideração que a digitalização pode, tambem salvar o documento perdido pela sua cópia. Há obras físicas que, paradoxalmente, só tem sua existência preservada pelo processo de digitalização. 

Um caso interessante nessa perspectiva, é o da restauração da obra “Formas Únicas da Continuidade no Espaço”, de Umberto Boccioni, que é considerada uma peça seminal da coleção do MAC-USP e possui importância internacional. Essa escultura marca o início do movimento futurista italiano no início do século XX e exerceu grande influência sobre o desenvolvimento da arte moderna posterior.

“O original em gesso, que hoje pertence ao acervo do MAC, é uma das 11 esculturas que Boccioni expôs na mostra de escultura futurista que fez em Paris, em 1913”, explica Ana Gonçalves Magalhães, atual diretora do Museu e pesquisadora à frente da pesquisa sobre a obra. “Com a morte prematura de Boccioni, em 1916, o destino de suas esculturas sofreu reveses, o que fez com que apenas três dos gessos que ele havia apresentado na exposição de 1913 sobrevivessem.”

A famosa figura abstrata, que se destaca pela nítida impressão de caminhar e se movimentar no espaço, acabou se popularizando através de uma série de tiragens em bronze realizadas, inicialmente, por encomenda do líder do movimento futurista, e amigo do artista, Filippo Tommaso Marinetti, nos anos 1930. “O fato de as tiragens em bronze terem ganhado coleções de museus no mundo inteiro, dentre os quais o Museu de Arte Moderna de Nova York, o MoMa, fez com que a historiografia da arte moderna desconsiderasse a importância do gesso para Boccioni na veiculação de seu conceito de escultura futurista” (MAGALHÃES; MCKEVER, 2022). 

Com o apoio da Prefeitura de Milão e do Museo Del Novecento no exterior, e da atuação do FAB LAB Livre SP no município de São Paulo, além das parcerias com o Instituto de Física e a Escola Politécnica da Universidade de São Paulo, foi possível construir um molde 3D da escultura de Boccioni, permitindo que a obra seja preservada e difundida. O processo, que envolveu tecnologias de escaneamento, radiografia e análises de imageamento, consideradas não destrutivas, indica assim outras nuances na discussão de acervos digitais. 

Mesmo não sendo nativamente digital, a construção desse novo molde funciona como um parâmetro relevante para refletir sobre o arquivamento digital de obras não nativamente digitais, mas que só podem circular atualmente devido à existência de sua cópia digital. É um equívoco, no entanto, identificar o arquivo 3D como a própria obra, pois ele é apenas uma representação virtual. Nesse sentido, abrem-se outras questões relacionadas aos arquivos digitais, como saber se esse arquivo pode ser disponibilizado, e se ele representa a obra em si ou se é considerado outra obra.

Afinal, as manipulações podem ser tamanhas que poderemos ter interferências tão grandes e impactantes a cada manipulação dos arquivos que os originais se tornarão irreconhecíveis.

Olhares maquínicos

Rijksmuseum (raiksmuseum)

Algoritmo MosAIc – desenvolvido pelo MIT e Microsoft – usa inteligência artificial para buscar semelhanças entre obras de arte em diferentes mídias e de diferentes origens culturais, identificando conexões visuais ao longo da história.

Metropolitan

Depois de lançar sua iniciativa de acesso aberto em 2017, o museu desenvolveu uma API permitindo que outra instituição integre a coleção do Met em seu site. A primeira parceria foi com o Google Arts & Culture. As obras inseridas na API atualizam, ao mesmo tempo, o site do museu e o GA&C.

Desenvolvimento do Art Explorer que usa a Pesquisa Cognitiva da Microsoft para enriquecer a experiência do usuário com as obras de arte de acesso aberto do The Met, fornecendo novos pontos de acesso à coleção.

Cleveland

Utiliza uma variedade de algoritmos de IA para enriquecer os metadados das obras de arte. Explora o mecanismo do Bing para adicionar dados às informações dos artistas.

  • ArtLensAI: Share Your View é uma ferramenta de pesquisa reversa de imagens que usa IA para combinar imagens dos usuários com obras de arte da coleção do museu.

Barnes Foundation

Recurso de pesquisa baseado em formas e elementos visuais. É possível explorar a coleção fazendo conexões formais de acordo com as linhas, cores, luz e espaço.

Outras usabilidades: 

pesquisa por semelhança visual; visão de conjunto (baseada na metodologia de Albert  Barnes, um teólogo ).

Recursos do Art Explorer: descoberta cognitiva; tagging; enriquecimento de dados; conexões Visuais

A sabedoria das multidões

Neste ponto imagino que vocês devem estar se perguntando: mas esta palestra não contemplava o colonialismo dos dados? Todos os exemplos remetem a projetos milionários, associados às empresas de maior parte na atualidade e museus com boards de doadores superestruturados.

Ou já esqueceram o título e estão suspirando: no Brasil isso não aconteceria nunca…

É bem possível que sim. Mas isso nos abre a possibilidade de partir de outras matrizes.

As redes hoje escoam um manancial de dados que precisamos aprender a reconquistar. Afinal, somos nós os usuários que engrossamos aquele números robustos que adornam o infográgfico que mostrei sobre o que acontece na internet em 1 minuto. E se voltássemos a elas para pensar gradativamente: ou seja, criando dados a partir de outros dados.

Foi esse o norte do Artista Adam Harvey, ao decidir usar o YouTube como referência para criar arquivos que não existem no seu projeto VFRAME  (Visual Forensics and Metadata Extraction) inciado com a ONG Syrian Archive, e hoje com a Mnemonic.org, uma organização dedicada a documentar crimes de guerra, que tem como foco a identificação, em vídeos captados nas zonas de guerra, de bombas de fragmentação. Conhecidas como armas-contêineres, bombas de fragmentação são bombas que carregam outros artefatos explosivos. São uma das criações mais horrendas da Alemanha nazista e que continuam sendo usadas nas guerras do Oriente Médio, especialmente na Síria.

Adam Harvey. VFRAME

O VFRAME é um instrumento para denunciar a presença dessas bombas, que são proibidas em 120 países. Antes que se pergunte, o Brasil não é signatário dos tratados internacionais que as proíbem. Produz e exporta esse tipo de armamento. Um dos maiores problemas por esse tipo de armamento é que as bombas podem permanecer intactas, enterradas por muitos anos, atingindo a população civil. Nos últimos cinco anos, 77% das mortes por bombas de fragmentação ocorreram na Síria. Em 2017, das 289 mortes ocorridas, 187 foram registradas ali.

O VFRAME usa modelagem 3D e fabricação digital, combinados a um software de processamento de imagem com ferramentas de visão computacional e Inteligência Artificial para detectá-las. Seus algoritmos são capazes de organizar, classificar e extrair metadados de 10 milhões de vídeos, feitos nas zonas de guerra e disponíveis on-line, em menos de 25 milissegundos, identificando, nesses vídeos, o uso das bombas de fragmentação. 

O software realiza um trabalho em escala massiva impossível de se fazer manualmente. Apropriando-se de datasets e processos de machine learning, o VFRAME enuncia, assim, um contramodelo à vigilância algorítmica. Ao apostar no uso da IA e do Big Data como poderosos recursos na defesa dos direitos humanos, define também um campo nas práticas de descolonização dos dados que, no quadro de nosso projeto tem importância crucial. 

O que esse estudo nos sugere?

Se quisermos entender como é a cozinha da favela brasileira, não obteremos esses dados no Museu da Casa Brasileira, mas teremos os objetos da Casa Grande… Criar estratégias para não falar por e sim deixar que os sujeitos dos processos históricos falem de si é importante. Mais ainda, compreender que a prioridade não é criar canais de fala, mas sim de escuta. Dito de outra forma: “Resistir ao assentamento do “não-lugar” é uma estratégia de subsistência”. E isto passa por descompreender a favela como lugar de abjetos ou objeto de estudo para entendê-la como lugar de sujeitos.

(De)Composite Collections

Desenvolvido no contexto da residência intelligent.museum (ZKM/ Deutsches Museum), seu ponto de partida são coleções de arte organizadas na primeira metade do século XX e suas questões são: Quais outras histórias da arte podem emergir das leituras de IA das imagens por uma Inteligência Artificial (IA) que lê essas imagens? Como elaborar metodologias baseadas em IA para mapear os elementos constitutivos das representações do colonialismo histórico? Os sistemas de IA podem contribuir para compreender o olhar como uma construção histórica?

Seguindo os estudos do pensamento pós-colonial, que têm questionado essa abordagem, o projeto incorporou metodologias desenvolvidas no projeto demonumenta e abordou as coleções do Museu Paulista da USP e do MAC-USP, compilando datasets, organizados de acordo com alguns temas recorrentes na pintura histórica e no Modernismo brasileiro: povos indígenas, pessoas pretas, pessoas brancas e natureza tropical. Processados algoritmicamente com GANs, esses datasets permitiram identificar alguns elementos comuns e diferenças entre as coleções do MP-USP e do MAC-USP, em obras produzidas entre 1920 e 1955, a despeito das categorias e tipologias da história tradicional da arte. Isso porque as tecnologias de IA leem imagens a partir de imagens, revelando padrões ocultos nos conjuntos iconográficos, incluindo pinturas, gravuras e desenhos, indo além das narrativas historiográficas e estilos formais.

Através das técnicas de aprendizado de máquina, pudemos compreender a persistência da imaginação colonialista nas obras de arte, contradizendo algumas afirmações canônicas sobre as rupturas estéticas e ideológicas do Modernismo brasileiro. Essas continuidades vão desde o corpo negro nu associado ao trabalho nas plantações, a semelhança patriarcal dos homens brancos, geralmente retratados sozinhos e com roupas formais, até os povos indígenas retratados como entidades genéricas sem características particulares. No entanto, as mudanças são evidentes na representação das mulheres brancas. Enquanto a pintura histórica se concentra exclusivamente em seus rostos, a pintura moderna enfatiza o corpo da mulher. No entanto, isso é sempre entendido a partir de um ponto de vista misógino, enfatizando seus seios e o ventre (signos relacionados à maternidade). No que diz respeito às mulheres negras, o estereótipo da escravizada sensual é dominante.

E como fizemos isso? Com uma força tarefa de mais de 100 alunos, trabalhando remotamente. Criamos categorias de análises e passamos a fazer marações, com softwrea livre nas fotos. A partir de uma planilha de excel coletiva, essas coordenadas foram importadas como marcadores, o que nos permitiu treinar uma rede neural para sistematizar essas categorias e chegar aos perfis, como os que vcs viram.

Precisamos reaprender com nossos mestres.

Glauber Rocha, que diza que nossa originalidade é nossa originalidade. Pois “a denúncia das misérias latino-americanas é um prato suculento para o humanismo colonizador.” Somos mais que isso. Até por que Helio Oitica nos ensinou há muito:

Museu é é o mundo. 

Canibalizemos a tela.

Obrigada!

Inteligência Artificial em Museus

Neste seminário, ministrado pela pesquisadora Renata Perim, foram analisados 15 sites de museus que estão utilizando recursos de Inteligência Artificial no tratamento e divulgação de seus acervos.

Sites analisados:

The Museums + AI Network

MoMA & Machine Learning

https://experiments.withgoogle.com/moma

Rijksmuseum + The MET

https://microsoft.github.io/art/app

The Met – Open Access Program

https://www.metmuseum.org/blogs/digital-underground/2017/open-access-at-the-met

The Met – Collection API

https://www.metmuseum.org/blogs/now-at-the-met/2018/met-collection-api

Cleveland Museum of Art 

https://www.clevelandart.org/art/collection/search?i=2

https://www.clevelandart.org/art/collection/share-your-view#

Barnes Foundation – Using computer vision to tag the collection

https://medium.com/barnes-foundation/using-computer-vision-to-tag-the-collection-f467c4541034

Barnes Foundation

https://collection.barnesfoundation.org/

The Met – All at Once

http://www.thegreeneyl.com/allatonce

Harvard Art Museum

https://ai.harvardartmuseums.org/

Cooper-Hewitt

https://labs.cooperhewitt.org/2013/giv-do/

Sarjeant Gallery – Robot eyes

https://medium.com/@armchair_caver/looking-at-sarjeant-gallerys-collection-through-robot-eyes-c7fd0281814e

SFMOMA – sentiment analysis

SFMOMA – send me 

Museu Paulista  (experimentos com IA feitos pelo projeto demonumenta)

http://demonumenta.fau.usp.br/museu-paulista/

Pinacoteca – A voz da arte

Estudos de caso: arquivos contra-hegemônicos

Nossas discussões sobre formatos de arquivos contra-hegemônicos e distribuídos focaram alguns estudos de caso. Esses estudos são fundamentais para nos aproximar do desenho que queremos para formular o acesso a acervos que não existem, especialmente sobre a arquitetura e o design brasileiros nativamente digitais, mas também sobre arte digital. [1]

Estudos de caso

Os estudos de caso em que nos concentramos, para parametrizar o desenvolvimento de arquivos baseados em sistemas de IA são:

  • (De)Composite Collections
  • On Broadway
  • VFRAME

(De)Composite Collections

Giselle Beiguelman, Bruno Moreschi e Bernardo Fontes, 2021

Desenvolvido no contexto da residência intelligent.museum (ZKM/ Deutsches Museum), seu ponto de partida são coleções de arte organizadas na primeira metade do século XX e suas questões são: Quais outras histórias da arte podem emergir das leituras de IA das imagens por uma Inteligência Artificial (IA) que lê essas imagens? Como elaborar metodologias baseadas em IA para mapear os elementos constitutivos das representações do colonialismo histórico? Os sistemas de IA podem contribuir para compreender o olhar como uma construção histórica?

Seguindo os estudos do pensamento pós-colonial, que têm questionado essa abordagem, o projeto incorporou metodologias desenvolvidas no projeto demonumenta e abordou as coleções do Museu Paulista da USP e do MAC-USP, compilando datasets, organizados de acordo com alguns temas recorrentes na pintura histórica e no Modernismo brasileiro: povos indígenas, pessoas pretas, pessoas brancas e natureza tropical. Processados algoritmicamente com GANs, esses datasets permitiram identificar alguns elementos comuns e diferenças entre as coleções do MP-USP e do MAC-USP, em obras produzidas entre 1920 e 1955, a despeito das categorias e tipologias da história tradicional da arte. Isso porque as tecnologias de IA leem imagens a partir de imagens, revelando padrões ocultos nos conjuntos iconográficos, incluindo pinturas, gravuras e desenhos, indo além das narrativas historiográficas e estilos formais.

Através das técnicas de aprendizado de máquina, pudemos compreender a persistência da imaginação colonialista nas obras de arte, contradizendo algumas afirmações canônicas sobre as rupturas estéticas e ideológicas do Modernismo brasileiro. Essas continuidades vão desde o corpo negro nu associado ao trabalho nas plantações, a semelhança patriarcal dos homens brancos, geralmente retratados sozinhos e com roupas formais, até os povos indígenas retratados como entidades genéricas sem características particulares. No entanto, as mudanças são evidentes na representação das mulheres brancas. Enquanto a pintura histórica se concentra exclusivamente em seus rostos, a pintura moderna enfatiza o corpo da mulher. No entanto, isso é sempre entendido a partir de um ponto de vista misógino, enfatizando seus seios e o ventre (sgnos relacionados à maternidade). No que diz respeito às mulheres negras, o estereótipo da escravizada sensual é dominante.

O que este estudo sugere ao nosso projeto:

Os experimentos feitos em (De)Composite Collections mostram que o uso de recursos de IA pode contribuir para análises críticas que metodologias tradicionais na história da arte não são capazes de avaliar. Ao mesmo tempo, as imagens sintetizadas com redes neurais revelam seus limites para lidar com a diversidade social e a diversidade inerente aos procedimentos criativos individuais. Devido à dependência das GANs de padrões existentes, os processos de treinamento apontam para visões genéricas, tendendo a reproduzir os estereótipos da imagética colonial reformulada pelas tecnologias digitais.

On Broadway, 2015

Daniel Goddemeyer, Moritz Stefaner, Dominikus Baur, Lev Manovich (Coord.)

On Brodway” é um arquivo da avenida homônima, em Nova York, construído a partir de dados coletados no Instagram, Twitter, Google Street View, Foursquare, além dos que são provenientes do monitoramento de corridas de táxi e alguns dados econômicos. 

Inspirado em na obra “Every Building on the Sunset Strip” de Edward Ruscha  (1966), um livro de artista que se desdobra em 8,33 metros para mostrar vistas fotográficas contínuas de ambos os lados de uma seção de 1,5 milhas da Sunset Boulevard, avenida de Los Angeles. O pressuposto do projeto é que as ruas tornaram-se ruas de dados e que “Hoje, uma cidade ‘fala’ conosco em dados”:

Muitas cidades disponibilizam conjuntos de dados e patrocinam hackathons para incentivar a criação de aplicativos úteis usando seus dados. Moradores e turistas postam mensagens e mídia que incluem suas localizações no Twitter, Instagram e outras redes sociais. Como podemos utilizar essas novas fontes de informação para representar a cidade do século XXI? (grifos nossos).

O que este estudo sugere ao nosso projeto:

A pergunta formulada por Manovich é central no nosso projeto de pesquisa. A metodologia poderia ser orientada para pensarmos em um arquivo de arte, arquitetura e design com foco nas favelas, por exemplo, que tivesse o YouTube como sua fonte de dados? Um recorte temático, como “favela”, poderia ser um ponto de partida na formulação de um arquivo contra-hegemônico? Que outros recortes são possíveis e que escapam aos acervos institucionais? 

(Por outro lado, isso _ a coleta de dados massivos disponível online_ poderia contornar um problema que identificamos em nossos levantamentos: a carência de arquivos públicos sobre arquitetura e design brasileiros disponíveis online.) 

VFRAME, (2019 – em diante)

A ideia de usar o YouTube como referência para criar arquivos que não existem tem como ponto de partida o projeto VFRAME  (Visual Forensics and Metadata Extraction) de Adam Harvey iniciado com a ONG Syrian Archive, e hoje com a Mnemonic.org, uma organização dedicada a documentar crimes de guerra, que tem como foco a identificação, em vídeos captados nas zonas de guerra, de bombas de fragmentação. Conhecidas como armas-contêineres, bombas de fragmentação são bombas que carregam outros artefatos explosivos. São uma das criações mais horrendas da Alemanha nazista e que continuam sendo usadas nas guerras do Oriente Médio, especialmente na Síria.

O VFRAME é um instrumento para denunciar a presença dessas bombas, que são proibidas em 120 países. Antes que se pergunte, o Brasil não é signatário dos tratados internacionais que as proíbem. Produz e exporta esse tipo de armamento. Um dos maiores problemas por esse tipo de armamento é que as bombas podem permanecer intactas, enterradas por muitos anos, atingindo a população civil. Nos últimos cinco anos, 77% das mortes por bombas de fragmentação ocorreram na Síria. Em 2017, das 289 mortes ocorridas, 187 foram registradas ali.

O VFRAME usa modelagem 3D e fabricação digital, combinados a um software de processamento de imagem com ferramentas de visão computacional e Inteligência Artificial para detectá-las. Seus algoritmos são capazes de organizar, classificar e extrair metadados de 10 milhões de vídeos, feitos nas zonas de guerra e disponíveis on-line, em menos de 25 milissegundos, identificando, nesses vídeos, o uso das bombas de fragmentação. 

O software realiza um trabalho em escala massiva impossível de se fazer manualmente. Apropriando-se de datasets e processos de machine learning, o VFRAME enuncia, assim, um contramodelo à vigilância algorítmica. Ao apostar no uso da IA e do Big Data como poderosos recursos na defesa dos direitos humanos, define também um campo nas práticas de descolonização dos dados que, no quadro de nosso projeto tem importância crucial. 

O que esse estudo sugere ao nosso projeto?

Se quisermos entender como é a cozinha da favela brasileira, não obteremos esses dados no Museu da Casa Brasileira, mas teremos os objetos da Casa Grande… Criar estratégias para não falar por e sim deixar que os sujeitos dos processos históricos falem de si é importante. Mais ainda, compreender que a prioridade não é criar canais de fala, mas sim de escuta. Dito de outra forma: “Resistir ao assentamento do “não-lugar” é uma estratégia de subsistência”. E isto passa por descompreender a favela como lugar de abjetos ou objeto de estudo para entendê-la como lugar de sujeitos.

O YouTube como espaço crítico

A quantidade de vídeos no YouTube que documentam as favelas brasileiras, de acordo com uma busca feita no Google, é de aproximadamente 17.200.000. No que tange à arquitetura moderna, esse número cai para 1.440.000 resultados. Isso não implica uma falsa hierarquia de importância entre a favela e arquitetura moderna, mas enuncia um contraponto que não se pode deixar de problematizar, pois essas assimetrias de números de conteúdos praticamente se invertem quando atentamos para os dados sobre teses e dissertações defendidas no Brasil. Uma busca feita pelos mesmos termos na Biblioteca Digital de Teses e Dissertações, mostra que  presença do termo Arquitetura Moderna é 36.3% maior que o termo Favela.

Ainda que seja necessário depurar esses dados, fica claro que se quisermos fabular um arquivo de consultas sobre arte, arquitetura e design, com recorte temático nas favelas, os dados com maior consistência, estarão nas redes e não nos acervos oficiais, muito menos nos acadêmicos. 

Nesse sentido, pensar formatos de arquivos que combinem as metodologias dos processos citados pode indicar aberturas para outros modelos de arquivos para nosso Projeto Temático, forjando estratégias que vêm das potencialidades do Sul Global.

“Nossa originalidade é nossa fome”

Nessa perspectiva, aderimos a uma frase de Glauber Rocha que nos serve como norte de trabalho. Ao dizer que nossa originalidade é nossa fome, Gleuber não se propunha a referendar a uma certa abordagem que privilegia a apologia do miserabilismo, ou o comodismo do vira-latismo. Pelo contrário, enuncia uma busca por novas formas de conhecimento e engajamento que partam das fragiligilidades de nossas infraestruturas como potência para a vampirização criativa da intelig6encia distribuída e disponível nas redes.

Um aspecto essencial desse processo é o foco na interconexão nos achados que fizemos ao longo do semestre. Em especial, os resultados de nosso workshop sobre metodologias ágeis que revelou claramente nossas prioridades: o rastreamento e a absorção de bancos de dados disponíveis nas redes e a criação de APIs que sejam capazes de fazer a integração de metadados e devolvê-los de forma integrada aos nossos públicos.

Nossa prioridade (e desafio maior) reside na capacidade de absorver diversas fontes e relacioná-las a discursos críticos (o que inclui também a crítica dos próprios dados). Portanto, nosso ponto de partida não é a catalogação, mas sim o machine learning apropriado para pensar a criação de nosso próprio “crawler”.

[1] Texto elaborado por Giselle Beiguelman, a partir da transcrição da reunião on-line,  realizada em 26 de junho de 2023, com a presença de: Ana Magalhães, Bruno Moreschi, Eduardo Costa, Heloisa Espada, Paula Perissinotto, Priscila Arantes, Renata Perim .

 

Definição de funcionalidades e uso de metodologias ágeis

Na construção de um projeto, é essencial ter uma lista clara de funcionalidades e requisitos técnicos para orientar o desenvolvimento. Ao mesmo tempo, definir as funcionalidades de um projeto é uma etapa crucial para garantir que as expectativas sejam atendidas e que o resultado final seja satisfatório 

Workshop de definição de funcionalidades com Metodologias ágeis
Workshop de definição de funcionalidades com Metodologias ágeis

Optamos em nosso projeto por trabalhar de forma colaborativa e utilizar metodologias ágeis, para criar uma lista dinâmica de recursos e requisitos. Essa lista será constantemente revisada e atualizada ao longo do projeto, mas serve como um ponto de partida para identificar os pontos iniciais do projeto e avaliar as suas necessidade de infraestrutura e equipe técnica. Além disso, facilita priorizar os itens, uma vez que recursos e tempo são limitados. [1]

A metodologia ágil é conveniente porque permite avaliar os recursos desejados e focar nas prioridades. É comum, durante o desenvolvimento, perder o foco e se afastar dos objetivos iniciais. Por isso, é importante voltar aos eixos do projeto e definir as funcionalidades que realmente importam. Optamos por trabalhar de forma colaborativa e utilizar como framework o Scrum, para criar uma lista dinâmica de recursos e requisitos.

A dinâmica de trabalho com metodologias ágeis

O uso de métodos ágeis tem ganhado destaque, pois essa metodologia reconhece a impossibilidade de dar conta de todas as demandas e priorizam as mais importantes. Dessa forma, é possível criar níveis de especificações, limitando o escopo do projeto e evitando que ele se torne demasiadamente complexo. Outra vantagem é permitir pensar o projeto a partir de camadas de funcionalidades, evitando que os erros se propaguem, não impactado as outras camadas do projeto.

Ao definir as especificações, é importante ter em mente o que já está documentado, evitando interpretações equivocadas. O desenvolvimento de camadas sistêmicas, demandar clareza sobre o que se espera de cada uma delas, evitando conflitos e garantindo a harmonia do conjunto

A dinâmica que usamos partiu da descrição objetiva, feita por cada membro do grupo, das funcionalidades que pretendemos, buscando explicitar cada recurso que queremos ver implementado, usando post-its em uma parede. Depois, olhamos em conjunto para as funcionalidades, buscando agrupar os iguais, parecidos ou que dialoguem com a mesma temática. 

Por fim, priorizamos os requisitos, com um conjunto de cartas de baralho que simbolizam pontos (10, 7, 3 e 1), alocando as cartas conforme a funcionalidade que pareceu a cada um a mais interessante. 

Aspectos críticos do uso de Inteligência Artificial

Em projetos que envolvem o desenvolvimento de IA, é comum a dúvida sobre a integração com outras plataformas, tornando a definição das APIs que serão utilizadas um ponto crucial. A questão da escolha das APIs, sejam elas comerciais ou de plataformas públicas, é uma decisão que deve ser tomada com base nas necessidades específicas do projeto, mas também de forma crítica. Isso porque a escolha das APIs pode ter um impacto significativo na forma como o sistema funciona, reforçando hierarquias vigentes, ao reproduzir os sistemas hegemônicos,  no desenvolvimento de projetos de IA. 

Essa hegemonia, que implica a dicussão dos mecanismos de produção social do datacolinismo, via o que chamamos de darwinismo social dos dados, se expressa, por exemplo , na tendência a das buscas retornarem bibliografia em língua inglesa e autores melhores posicionados em rankings acadêmicos. 

Uma possibilidade que aventamos para contornar, em parte, esse problema, é superpor várias APIs, privilegiando no dataset os bancos de dados públicos brasileiros, como o Scielo e o Banco Nacional de Teses. Ao superpor várias APIs, podemos promover a clusterização das respostas, fomentando a crítica dos resultados, pois permitimos que o usuário do sistema tenha acesso às respostas de buscas de diferentes plataformas. 

Esse trabalho é também de natureza pedagógica e é importante para criar uma camada de inteligência que permita ao usuário fazer uma curadoria, selecionando aqueles resultados que são mais relevantes para suas necessidades e visualizando os impactos da modelagem dos dados nas respostas dadas pelas buscas, compreendendo melhor o funcionamento do sistema e fazendo escolhas mais informadas.

[1] Texto redigido pelo ChatGPT, elaborado a partir das notas da reunião do projeto temático Fapesp LinCar, realizada no dia 18/04/2023, com a presença de: Bruno Moreschi, Dalton Martins, Giselle Beiguelman, Paula Perissinotto, Priscila Arantes, Renata Perim. Edição final: Giselle Beiguelman

 

Acervos em movimento: Documentação social, IA e Curadoria colaborativa

Catalogação é uma prática essencial para lidar com a documentação social. Com o avanço das tecnologias digitais, a catalogação pode ser aprimorada e diversificada, permitindo a participação ativa de pessoas de diferentes perfis, o uso de inteligência artificial e a colaboração entre diferentes instituições

Partial map of the Internet based on the January 15, 2005
Partial map of the Internet based on the January 15, 2005. Wikimedia

A documentação registrada em arquivos oficiais geralmente é produzida por instituições governamentais, empresas ou outras entidades com poder institucional e autoridade para documentar eventos e processos importantes. Esse tipo de documentação é geralmente formal, focado em questões legais, e muitas vezes limitado ao que é considerado relevante para essas instituições. [1]

Já a documentação social é produzida por indivíduos e comunidades em seu cotidiano, muitas vezes sem uma preocupação formal com a documentação e pode ser encontrada em fotos, vídeos, postagens em redes sociais e outros materiais criados e compartilhados . Esse tipo de documentação fornece um registro mais diverso, incluindo perspectivas e vozes que podem ser ausentes na documentação oficial. A documentação social também pode ser usada para desafiar ou complementar a documentação oficial e fornecer múltiplas visões de um evento ou processo.

Casos de estudo e possibilidades

Um exemplo interessante de catalogação via crowdsourcing é o projeto “By the People” da Biblioteca do Congresso dos EUA. Esse projeto permite que voluntários ajudem a transcrever e marcar manuscritos históricos, tornando esses documentos mais acessíveis, plurais e pesquisáveis.

Outro exemplo de catalogação inovadora é a iniciativa do Metropolitan Museum de Nova York, em parceria com a Microsoft e o MIT, que promoveu um hackathon para desenvolver ferramentas de acesso e uso de sua coleção de arte. Esse evento resultou em soluções criativas e tecnologicamente avançadas para a catalogação e visualização de obras de arte.

O uso de inteligência artificial também vem sendo cada vez mais explorado na catalogação de obras de arte, como é o caso do Harvard AI Explorer. Usando inteligência artificial, os Museus de Arte de Harvard coletaram 39.388.699 descrições, cobrindo 266.309 imagens de obras de arte. As descrições variam do reconhecimento de objetos à análises faciais para prever gênero, idade e emoções nas imagens. Esses dados revelam como as IAs interpretam pinturas, fotografias e esculturas, possibilitando outras formas de compreensão dessas obras.

Outra possibilidade interessante que aventamos no nosso grupo, na direção de expandir a catalogação das obras, é a inclusão de dados do Google Maps, que nos permitiriam, por exemplo, identificar quantas vezes uma obra foi fotografada por visitantes e em quais locais. Essas informações geradas coletivamente podem voltar para a plataforma de catalogação, enriquecendo ainda mais a documentação social.

A inserção de dados na Wikipédia também pode ser uma estratégia eficaz para a catalogação, pois permite, a partir dos verbetes,  estabelecer relações com arquivos análogos através de APIs. No entanto, é importante ressaltar a escassez de informação sobre a Arte Digital brasileira na Wikipedia, o que torna ainda mais relevante a inclusão de dados nessa plataforma para operacionalizar o acesso a essas informações.

Além disso, pensamos que eventos imersivos em coleções de arte, a partir de listas curatoriais feitas pelos museus, podem ser uma oportunidade para a catalogação de obras e a contextualização de sua história e trajetória. Contudo, é necessário criar um ecossistema capaz de equacionar um gradiente de propostas curatoriais, que se abra para outras ramificações não previstas.

Por fim, vale mencionar, como estratégia de catalogação otimizada para a Internet, o site do MoMA, que é uma referência em catalogação de obras de arte e oferece uma ampla variedade de informações e recursos para pesquisadores, curadores e interessados em geral. Através do seu site, é possível acessar informações detalhadas sobre a coleção, exposições passadas e presentes, além de recursos educacionais e ferramentas de pesquisa.

A gestão de acervos aprimorada pelas IAs Generativas

A evolução da tecnologia e da inteligência artificial tem trazido uma nova perspectiva para a gestão de acervos culturais. Instituições como o Cleveland Art Museum e o Cooper Hewitt estão utilizando ferramentas inovadoras para agregar mais informações e contextos às obras presentes em seus acervos.

O Cleveland Art Museum, por exemplo, possui uma busca integrada ao Bing que carrega informações das redes sociais e outras fontes aos objetos do acervo. Já o Cooper Hewitt permite a navegação por cores no acervo, além de cruzar informações, como data de aquisição para gerar curadorias de seu acervo.

Outra possibilidade que antevemos é a inclusão de informações da Wikipédia/Wikimedia nas obras e na biografia dos artistas, a fim de enriquecer a contextualização e fornecer mais referências aos interessados. Seria importante também, ligar as obras aos discursos críticos sobre elas, disponíveis online, a partir do Google Scholar e Academia.edu. Uma estratégia desse tipo foi usada no site do VideoBrasil, ainda que a partir de buscas internas no seu acervo, mas com base em uma curadoria de tags inovadora.

É importante questionarmos como incluir discursos críticos não canônicos e fugir do formalismo institucional, incorporando leituras das exeposições feitas por profissionais da limpeza e seguranças.

Um grande desafio, que gera muita dúvidas diz respeito sobre como criar um ambiente que preserve o rigor contextual e, ao mesmo tempo, a anarquia dos dados. Outro desafio a enfrentar em um modelo de gestão baseado em IAs é evitar o darwinismo dos dados, que tende a reforçar condicionantes de poder.

A gestão de acervos baseadas em IAs generativas é uma tendência que poderá transformar os processos de documentação e preservação da cultura. Ainda há muito a explorar, mas é inegável que as possibilidades de enriquecimento e democratização do acesso ao patrimônio cultural são imensas.

Curadoria colaborativa e acesso à informação em plataformas online de acervos

A curadoria de acervos feita pelo público está se tornando cada vez mais viável com o acesso às plataformas on-line, que oferecem recursos avançados de visão computacional para navegação no acervo. Duas plataformas que se destacam nesse sentido são o MosAIc e o British Museum. O MosAIc oferece recursos avançados de visão computacional para navegação no acervo, permitindo que o usuário possa explorar obras de arte de uma forma mais imersiva e interativa. Já o British Museum possui uma interface de acesso ao acervo que permite diferentes navegações cruzadas via cronologia e conteúdos.

Importante ressaltar que muitos sites utilizam sistemas de indicação de obras semelhantes, seguindo um modelo pautado pelas estratégias de e-commerce, onde um produto indica outros produtos relacionados. No entanto, no campo das artes, a aproximação baseada em palavras-chave pode reforçar hegemonias correntes no campo das artes e apropriações que reforcem discursos de ódio.

Uma forma de evitar isso é criar sistemas parasitários que possam comparar diferentes perspectivas acerca dos verbetes. O Search Atlas é um exemplo disso, pois permite que o usuário possa comparar diferentes resultados de busca em diferentes plataformas, evitando assim discursos de ódio e reforçando a pluralidade de perspectivas.

Outra alternativa que nos parece mais rigorosa e promissora é a introdução de sugestões automáticas de obras pesquisadas por outras pessoas que acessaram um determinado resultado, como faz o Metropolitan Museum de Nova York, indicando um uso mais crítico e criativo das inteligências distribuídas nas redes.

Notas

[1]  Texto redigido pelo ChatGPT, elaborado a partir das notas da reunião do projeto temático Fapesp LinCar, realizada no dia 21/03/2023, com a presença de: Ana Magalhães, Bruno Moreschi, Dalton Martins, Giselle Beiguelman, Heloisa Espada, Paula Perissinotto, Priscila Arantes, Renata Perim. Edição final: Giselle Beiguelman

Leituras relacionadas

BISCHOFF, K. et al. Can all tags be used for search? Proceedings of the 17th ACM Conference on Information and knowledge management. Anais…: CIKM ’08.New York, NY, USA: Association for Computing Machinery, 26 out. 2008. Disponível em: <https://doi.org/10.1145/1458082.1458112>. Acesso em: 22 mar. 2023

DZIEKAN, V.; PROCTOR, N. From elsewhere to everywhere: Evolving the distributed museum into the pervasive museum. Em: The Routledge handbook of museums, media and communication. New York/ London: Routledge, 2018. p. 177–192.

ECONOMOU, M. Heritage in the Digital Age. Em: A Companion to Heritage Studies.  John Wiley & Sons, Ltd, 2015. p. 215–228. <https://doi.org/10.1002/9781118486634.ch15>

LIMA, L. P. B. (ED.). INTELIGÊNCIA ARTIFICIAL NA CULTURA: IMPLICAÇÕES PARA A DIVERSIDADE DE EXPRESSÕES CULTURAIS. 2022. http://www.enecult.ufba.br/modulos/submissao/Upload-607/139278.pdf

Opportunities and challenges of artificial intelligence technologies for the cultural and creative sectors – Publications Office of the EU. Disponível em: <https://op.europa.eu/en/publication-detail/-/publication/359880c1-a4dc-11ec-83e1-01aa75ed71a1/language-en>. Acesso em: 22 mar. 2023.

SCHMIDT, S.; STOCK, W. G. Collective indexing of emotions in images. A study in emotional information retrieval. Journal of the American Society for Information Science and Technology, v. 60, n. 5, p. 863–876, maio 2009. <https://doi.org/10.1002/asi.21043>

SIEBRA, S. A.; BORBA, V. R.; LIMA, M. G.; MIRANDA, M. K. F. O.; TAVARES, L. L. L.; OLIVEIRA, J. N. N. Curadoria digital: além da questão da preservação digital. Disponível em: http://hdl.handle.net/20.500.11959/brapci/185246. Acesso em: 22 mar. 2023.

SRINIVASAN, R. et al. Blobgects: Digital museum catalogs and diverse user communities. Journal of the American Society for Information Science and Technology, v. 60, n. 4, p. 666–678, abr. 2009. <https://doi.org/10.1002/asi.21027>

TRANT, J.; WITH THE PARTICIPANTS IN THE STEVE. Exploring the potential for social tagging and folksonomy in art museums: Proof of concept. New Review of Hypermedia and Multimedia, v. 12, n. 1, p. 83–105, jun. 2006. <https://doi.org/10.1080/13614560600802940>

VLIET, H. VAN; HEKMAN, E.  Enhancing user involvement with digital cultural heritage: The usage of social tagging and storytelling. First Monday, 21 abr. 2012. <https://firstmonday.org/ojs/index.php/fm/article/view/3922/3203>

Webinário “Curadoria em debate: a pesquisa em museus universitários”. Disponível em: <https://sites.usp.br/ciclocuratorial/webinario-curadoria-em-debate-a-pesquisa-em-museus-universitarios/>. Acesso em: 22 mar. 2023.

 

O arquivo do futuro e o futuro do arquivo

Desafios e possibilidades dos arquivos digitais: refletindo sobre a organização dinâmica de conteúdos culturais e a intervenção editorial em sistemas de automação 

o arquivo do futuro em ilustração feita no DALLE-2

O arquivo digital não se limita a ser um espaço de armazenamento de documentos. Ele é um arquivo mutante, que não apenas guarda, mas cria arquiteturas para que o usuário possa performar e interagir com os conteúdos.[1]

O modelo de catalogação dos museus foi levado sem questionamento para o meio digital. Contudo, na internet o objeto é enrredado e conectado a outras informações, o que pode tornar difícil a sua organização em um repositório digital.

Assim, documentar hoje em dia é questionar a lógica de um repositório digital estático e pensar em ecossistemas de organização dinâmicos, com possibilidades de absorver links públicos e das redes sociais, tornando-se um lugar de encontro para pessoas e conteúdos.

Nesse sentido, o arquivo digital permite contar outras histórias da arte, além das já conhecidas. Ele pode ser um espaço de experimentação e interação com as obras, possibilitando novas interpretações e formas de apreciação. Para tanto, é preciso repensar a lógica dos repositórios digitais estáticos e investir em sistemas flexíveis.

Um arquivo dinâmico estruturado a partir das conexões com modelos de IA pode ser um ponto de partida para o modelo de plataforma que queremos desenvolver, incorporarando, por exemplo, funcionalidades presentes nos GLAMs da Wikipedia, que permitem aos usuários visualizar as conexões e apropriações que os conteúdos encontraram ao longo do tempo.

Desafios

Uma das formas de dar visualidade aos conteúdos é por meio de métodos Warburguianos, que buscam pelos elementos das imagens e exploram as suas conexões com outras obras e contextos. Algoritmos como o MosAIc podem ser utilizados para encontrar semelhanças e conexões entre imagens aparentemente desconectadas, gerando novas interpretações e possibilidades de apreciação.

No entanto, é importante lembrar que a visualidade dos conteúdos não se limita apenas à sua representação gráfica. Ela também está relacionada à forma como os conteúdos são organizados e disponibilizados para o público. Por isso, é importante investir em arquiteturas dinâmicas e flexíveis, que permitam aos usuários explorar os conteúdos de forma personalizada e adaptada às suas necessidades e desejos.

Apesar das vantagens do uso de IA para a organização de arquivos e conteúdos culturais, existem diversos desafios a serem enfrentados. Um dos principais é o “darwinismo dos dados”, que se refere ao processo de seleção e valorização dos dados que ocorre dentro dos algoritmos de IA. É preciso entender como a máquina entende e intervir editorialmente no sistema dinâmico de automação para evitar que os algoritmos reproduzam preconceitos e discriminações presentes na sociedade.

Além disso, as lógicas dos modelos proprietários de IA podem interferir nas categorias que criamos e limitar a forma como os conteúdos são organizados e disponibilizados. É importante pensar em ferramentas que possam ser implementadas para identificar dados enviesados e corrigir essas distorções.

Outro desafio é como pensar a catalogação de uma documentação por fazer. É possível pensar em um arquivo que parta da recusa do armazenamento e que privilegie a dinamicidade e a flexibilidade, mas isso significa abrir mão da conservação no processo de gestão. Esse é um princípio contestado por Hal Foster em “The Archives Without Museums“, que argumenta que é importante preservar e conservar os arquivos para garantir a continuidade histórica e a memória cultural.

Portanto, é necessário encontrar um equilíbrio entre o dinamismo e a conservação, pensando em arquiteturas flexíveis e adaptáveis que permitam a personalização da experiência do usuário, mas que também garantam a preservação e a continuidade histórica dos conteúdos. É importante investir em ferramentas que possam identificar dados enviesados e corrigir as distorções, além de intervir editorialmente no sistema de automação para evitar a reprodução de preconceitos e discriminações.

 

Notas

1 Texto redigido pelo ChatGPT a partir da síntese da Reunião do dia 27/02/2023, com a presença de Ana Gonçalves Magalhães, Dalton Martins, Eduardo Augusto Costa, Giselle Beiguelman, Heloisa Espada, Paula Perissinotto, Priscila Arantes, Renata Padilha, Renata Perim. Edição e revisão: Giselle Beiguelman.