Docente estuda o impacto de novas tecnologias na exploração de acervos de arquivos e bibliotecas
Professores de teoria da história procuram investigar como as narrativas históricas foram produzidas, ou seja, como as representações históricas são construídas no tempo e em circunstâncias específicas. O professor Thiago Lima Nicodemo, do Instituto de Filosofia e Ciências Humanas (IFCH) da Unicamp, que vem se dedicando ao estudo da história dos arquivos e bibliotecas nos séculos 20 e 21, decidiu incluir a problemática digital em nova linha de pesquisa, visando entender a representação histórica deste mundo contemporâneo; sua frente de investigação empírica é o desenvolvimento de novas tecnologias para explorar os documentos digitais em arquivos e bibliotecas. O docente ressalta que sua pesquisa já está produzindo resultados e que pleiteia um financiamento da Fapesp para dar maior robustez ao projeto e criar o que seria um dos primeiros laboratório de história digital e humanidades digitais do país.
“Para tratar do conhecimento histórico na era da inteligência artificial precisamos observar como o mundo, as pessoas e, sobretudo, como as formas de produção e arquivamento de documentos mudam com o digital: é esta a pergunta colocada no projeto”, explica Thiago Nicodemo. “Há um parte da disciplina de história preocupada com este fenômeno, autodenominada história digital, que começa a levar em consideração as grandes massas de documentos (metadados) produzidas por Google, Facebook, Wikipédia e outros grandes conglomerados. Alguns historiadores já lidam com a internet como fonte válida para seus trabalhos, o que muda o jeito de fazer e pensar história.”
Na visão do pesquisador, a pergunta mais geral colocada aos historiadores e que interessa à sociedade é sobre o que fazer quando todos os arquivos tiverem como matéria-prima dados do Facebook ou metadados do Google. “O que posso dizer nesse momento é que tudo isso é empolgante, pelo menos para mim, porque vejo uma grande área de conhecimento em formação e que só pode ser consolidada em cooperação, entendendo a universidade da maneira mais múltipla possível. Estamos cada vez mais dependentes de profissionais como de mídia ou das variadas formas de ciências da computação, o que inclui os engenheiros. Por trás desse fenômeno digital existe uma ideia muito viva de universidade, de conhecimento possível.”
Nicodemo observa que o tradicional arquivo em papel também está mudando, apesar de se tratar de uma instituição sólida e de estrutura complexa. “Todo arquivo hoje em dia – seja institucional, privado ou especializado – tem o desafio de digitalizar seu acervo. Ocorre que a documentação, quando transformada para o formato digital, traz novas possibilidades de trabalho a partir dela, inclusive de cruzamentos de dados. Com isso, muda a própria ideia de arquivo, que deve ganhar elevado grau de informalidade. Por exemplo, depois do trágico incêndio no Museu Nacional, a tendência é que o lugar seja reconstruído por fragmentos de registros que as pessoas guardam no digital; é um tipo de arquivo espontâneo, por aglomeração temática, que surge das redes sociais.”
Segundo o professor do Departamento de História, existem amplos projetos de digitalização para arquivos históricos, que são transnacionais, concentrados em universidades de excelência, financiados por grandes agências e que impactam a atuação dos historiadores. “Uma coisa é entrar no arquivo em papel e consultar toda a documentação in loco, num trabalho de formiguinha; outra é entrar online e encontrar toda a documentação da escravidão atlântica, englobando tanto países africanos como do continente americano, o que permite produzir outro tipo de estudo. A pesquisa que conduzo possui seu lado empírico, justamente para estudar o impacto desta transformação que está acontecendo no campo.”
Outra questão posta para o futuro, acrescenta Thiago Nicodemo, refere-se ao que fazer para que as ciências humanas em geral aprendam a lidar com as novas tecnologias e com processamento e armazenamento de dados. “Parte dos cientistas de humanas poderia estudar, por exemplo, o Big Data, que é o processamento em larguíssima escala de uma quantidade inimaginável de informações. O que faz o Google? Junta todos os dados que possui de cada um de nós, criando uma rede conceitual, gerada por um algoritmo que possibilita a avaliação e o processamento desses dados em uma escala sem precedentes e, assim, traçar nossos perfis. Geralmente são perfis de consumo, mas o Big Data já traça perfis psicológicos e políticos, influenciando eleições como nos Estados Unidos e no Brasil, o que é muito perigoso e deve ser investigado.”
O historiador sugere que, em sua área de estudos, seria possível aplicar algoritmos semelhantes na análise de fundos de arquivos e bibliotecas digitais, a fim de pensar e discutir devidamente a questão da digitalização e antever o que será feito com um documento de arquivo no futuro. “Ainda não estamos preparados para esta hipótese. Ao digitalizarmos um documento, imaginamos que ele será utilizado da mesma forma que uma pessoa que vai a um arquivo em papel, só que não: esse documento digital será sub-objeto de um novo conhecimento que ainda nem sabemos qual, mas temos condições de saber. Em resumo, há uma corrida pelo conhecimento digital e isso inclui tanto bancos de dados formados pelas nossas informações pessoais quanto o conhecimento histórico disponível em arquivos e bibliotecas. Temos uma ideia muito vaga do que será feito com esses dados no futuro, precisamos investigar mais”.
Por trás do algoritmo
A contribuição mais importante que a universidade pode oferecer ao debate, acredita o professor da Unicamp, seria combater a falta de transparência sobre os caminhos pelos quais Google, Youtube ou Netflix nos direcionam quando realizamos as buscas. “Não sabemos o que há por trás do algoritmo. Somos mobilizados para um algoritmo dentro da rede de análise de dados em massa e nem assinamos uma adesão a isso. Nesta guerra pela informação, as universidades públicas, que fazem grande investimento em arquivos, bibliotecas e sistemas de informação avançados, são das únicas instituições que podem concorrer com os Big Data, apesar da concorrência totalmente desleal.”
Pela estratégia defendida por Thiago Nicodemo, a universidade precisa desenvolver pesquisa avançada e mecanismos de transparência para uso de algoritmos e, também, empregá-los nos próprios fundos de arquivos, pensando em como armazenar a informação no futuro – uma informação que seja útil para a sociedade, que tenha uma função pública. “Tudo isso é hipotético, já que ainda não temos pesquisas sobre a transparência do algoritmo hoje, pelo menos no campo das humanidades. Mas deveríamos ter, adotando como nosso espectro empírico os arquivos e bibliotecas digitais de que dispomos na universidade. É um debate fundamental para a salvaguarda da humanidade, mas que simplesmente não é feito.”
O historiador atenta que pensar neste tipo de projeto desafia a própria forma como a universidade é organizada hoje. “Minha hipótese é de uma universidade produzindo pesquisa avançada, mas na outra ponta temos o ensino. Tais pesquisas permitiram planejar o treinamento necessário para que o jovem se torne um profissional no futuro, seja historiador, jornalista ou cientista da computação. Há um conjunto de habilidades pertinentes para entender o mundo contemporâneo na formação universitária. Mas entendendo o novo mundo poderíamos desenvolver isso muito melhor. Isso porque pensamos fragmentariamente, mais preocupados em salvar as nossas fronteiras disciplinares do que em avançar sobre elas. Precisamos pensar numa formação global do estudante. Não há retorno possível para uma sociedade analógica.”
Especificamente sobre a Unicamp, Nicodemo defende a criação de uma frente digital em todas as disciplinas para discutir profundamente a formação dos estudantes. “Aqueles de exatas, que ajudam a desenvolver programas, dependem muito de análises qualitativas, por exemplo. Não se trata de uma profissão única e sim da transformação pela qual todas as profissões estão passando. Portanto, a proposta não é inventar um curso, e sim que todos os cursos lidem com este problema de forma aberta. Todo professor de história medieval, de sociologia, de literatura comparada, mas também de ciência da computação e de engenharia civil, pode dizer algo sobre como as profissões estão mudando a partir do digital. Proponho aos meus colegas um mergulho neste mundo.”
Destruição e desigualdade
As novas tecnologias de digitalização vêm alimentando outra discussão, que já chegou ao Congresso Nacional, sobre a possibilidade de destruição dos documentos físicos (em papel), com o pretexto de que já não haveria motivo para assumir os custos com espaço, preservação e pessoal especializado para mantê-los. “A destruição não possui qualquer fundamento técnico. Ao digitalizarmos, jogamos o documento para outra linguagem, que é uma forma de transposição da realidade: seria como tirar a foto de uma paisagem e depois destruir a paisagem alegando que, tecnicamente, ela está preservada. A decodificação de uma mídia analógica em formato digital envolve um conjunto de protocolos que fazem parte de uma linguagem específica – no caso da fotografia, luz, formas, cores, capitação.”
No caso do computador, salienta o historiador, a linguagem é outra e cria uma falsa sensação de transparência e objetividade, com novas formas de convívio e de enxergar o mundo, ou seja, hábitos totalmente diferentes dos que existiam previamente. “Isso significa a exclusão de uma parcela muito significativa da população, que vive em outro tempo em relação às pessoas incluídas digitalmente. A realidade que o digital vem produzindo é a desigualdade social, a concentração da informação, que implica concentração de renda. A exclusão acontece muito em função deste processo de grandes portais (trusts) que detêm a maior parte das informações do mundo. Não conservar o papel é ignorar tudo isso.”
Laboratório de história digital
Segundo o professor do IFCH, o projeto que está propondo à Fapesp vem de uma pesquisa que ele já desenvolve e que vem produzindo resultados, mas em uma escala que ainda não o satisfaz. “Um financiamento mais significativo permitira criar um laboratório formalmente e viabilizar um curso na pós-graduação, convidando pesquisadores de outras áreas, como da ciência da computação, para não ficarmos apenas numa ilha. Este laboratório de história digital e humanidades digitais seria uma iniciativa pioneira da Unicamp no país, quando toda grande universidade norte-americana já possui um centro focado no tema. Minha pesquisa vem mostrando que estamos tocando apenas a ponta do iceberg.”
Thiago Nicodemo afirma que a utilização das técnicas atuais de análise em Big Data e também de inteligência artificial para grandes fundos de arquivos permitiria o processamento de dados em escala jamais vista. “Os indícios são do surgimento de uma área de pesquisa importantíssima. Quando pudermos cruzar metadados do Google ou de qualquer outro grande portal da internet com documentos dos arquivos tradicionais (que seriam analisados sob as mesmas técnicas), estaremos produzindo uma ciência que ainda não conhecemos – acho que este é o ponto.”