quarta-feira, 5 de junho de 2013

"Humanidades Digitais" e interdisciplinaridade

Este palavrão que me custa sempre a escrever (interdisciplinaridade) – e que o corrector ortográfico online não reconhece – tem sido um dos principais resultados da ligação entre o Digital e a História. Só esta relação entre a Informática e a História é já de si interdisciplinar, mas o certo é que o crescente cruzamento de saberes e metodologias entre as disciplinas das Humanidades e entre estas e as outras ciências, Sociais, Naturais ou Exactas, em muito tem beneficiado da globalização tecnológica. Dizer isto não é negar, nem esquecer a forte conexão entre as várias ciências sociais e humanas potenciada pela Escola dos Annales, entre outros. O ritmo e a abrangência agora é que são diferentes.

Por exemplo, a Geografia é cada vez mais chamada a outras área do saber, como a História (algo que não é novo!), a Literatura (que é mais recente), a Saúde, a Política, a Sociologia, a Biologia, etc., etc.. E muito disto, não sendo novidade absoluta, tem sido potenciado pelo incremento no uso dos Sistemas de Informação Geográfica (SIG). A História dá-se muito bem com os Estudos Políticos, com a Literatura, sempre se deu bem com a Geografia, mas até com a Medicina, a Matemática ou os Estudos Ambientais têm sido construídas pontes, para as quais o Digital tem sido uma forte fundação.

No que me diz respeito, julgo que tenho feito uma parte deste caminho. Começando na História e “afunilando” para a História Económica e Social do século XIX, as ligações à Sociologia e aos seus métodos, por exemplo, estiveram sempre presentes, mas desde cedo que a importância da Geografia foi fundamental, fosse através das leituras de Orlando Ribeiro para a tese de mestrado, fosse através do recurso aos SIG, a partir desse momento. O certo é que o Digital, em vez de tornar mais evidentes as diferenças de métodos e perspectivas de análise que resultam da comparação entre o trabalho desse mestre da Geografia portuguesa e as tendências dos modernos geógrafos, tem permitido aproximações e releituras desses dois mundos, na aparência tão distantes, que aproveitam muito para a História, em particular, nas abordagens de longa duração. Mas os caminhos são vários e a ligação ao Digital permitiu sair com muito facilidade do casulo oitocentista e navegar por outros temas e épocas, desde a Idade Média, à Revolução do 25 de Abril. Ao mesmo tempo, possibilitou ligações à Biologia, ao Ambiente, à Economia, aos Estudos Religiosos e à Literatura.

O Digital até podia não ter acrescentado mais nada à História, ou no geral às Humanidades, que só esta maior flexibilidade para o cruzamento de saberes constituiria, por si, uma marca de sucesso.

O que aqui apresentei de uma forma quase idílica, sem entraves, foi sofrendo profundas resistências da/na Academia, em grande medida geradas pelo mesmo factor que travou na década de 1980 a aproximação à Estatística: um excessivo peso dado aos métodos em detrimento dos resultados e um quase monopólio das fontes de cariz quantitativo. Pois o que parece ter aproximado em definitivo esses dois mundos, o Digital e as Humanidades, foi a coincidência de dois factores nos últimos anos. Por um lado, a crescente disponibilização em formato digital de grandes volumes de textos, fonte primária para muitas das disciplinas das Humanidades e fundamental para a História ou a Literatura (de que aqui se falará mais à frente). Por outro, a crescente capacidade das ferramentas digitais tratarem de forma eficaz essa informação não estruturada ou, pelo menos, não estruturada de acordo com as regras da Matemática.

Nesta perspectiva, a ligação entre textos e mapas, feita através do Digital (via bases de dados relacionais, Linguística Computacional, ferramentas Web 2.0, SIG, etc., etc.) tem sido das que mais destaque tem tido nos últimos anos, sendo vários os projectos, nacionais, de âmbito europeu, americanos ou globais que procuram, de várias formas, com vários objectivos e dentro de áreas disciplinares diversas uma nova forma de ler essa imensa volumetria de dados.

O que aqui apresento é apenas mais um exemplo do que é possível fazer, neste caso ligando Literatura, bases de dados relacionais e SIG. No exemplo anterior, o trabalho subjacente à transposição dos textos para os mapas foi relativamente simples, pois a fonte sobre os jornais e revistas portuguesas do século XIX apresentava a informação já razoavelmente estruturada (e as máquinas adoram esse tipo de informação e lidam bem com ela). O próprio objectivo do trabalho ajudava, pois pretendia-se apenas uma análise sobre a evolução cronológica e geográfica da imprensa de oitocentos.

Contudo, noutros casos, nem a fonte apresenta uma estrutura mais “matemática”, nem os objectivos do trabalho se ficam pela simplicidade da descrição. É, por vezes, necessário analisar o conteúdo, extrair dele sentido e significado e, nestes casos, o casamento entre o Digital e as competências de investigação próprias do Humanista tem de ser mais profundo. Na gíria recente das Humanidades Digitais, aplicável quer à Literatura, quer à História ou outra qualquer disciplina que recorra, em massa, à fonte textual, estamos na presença da necessidade de compatibilizar dois métodos: a leitura atenta e a leitura de distância, ou o que os ingleses chamam de “close reading” versus “distant reading” (a tradução está muito livre, obviamente).

Optei por aquilo que me é próximo, conhecido e que facilitaria a “leitura atenta”: o romance “O crime do Padre Amaro” de Eça de Queirós. Para a “leitura de distância” optei também por aquilo que era mais fácil, que melhor dominava: as bases de dados relacionais e os SIG. Objectivo: fazer um mapa de localização e também de algum significado das geografias presentes nesta obra do século XIX. Metodologia: fazê-lo procurando conciliar rigor na análise com rapidez na execução, “close reading” com “distant reading”.

Fica aqui o resultado, partindo de uma versão em PDF do referido texto, que já li há alguns anos na versão papel do Círculo de Leitores, mas que não queria voltar a ler (pelo menos, da forma tradicional), para através dessa leitura produzir um mapa, no fundo, o objectivo deste blogue.

Crime_Padre_Amaro_1

É sabido que a acção decorre, em boa medida, em Leiria, mas são muitas outras as referências geográficas usadas por Eça no seu romance.

Crime_Padre_Amaro_2

Todas podiam ser extraídas, criando uma lista de locais mencionados que depois se poderiam comparar com os já referidos gazetteers (neste caso, com a listagem de locais da carta militar portuguesa).

Crime_Padre_Amaro_3

Para simplificar, foram usados apenas cerca de 4000 locais, correspondendo aos nomes das freguesias portuguesas (o objectivo era produzir um teste).

Era depois necessário encontrar um meio de fazer essa comparação sem ter de ler atentamente toda a obra, mas conjugando a leitura feita pela “máquina” com a leitura de proximidade feita pelo investigador. A solução chama-se VBA (Visual Basic for Applications), uma linguagem “estranha” que aprendi há já alguns anos (na altura sem saber bem para quê, a não ser que poderia ser uma porta de saída para alguma precariedade laboral) e que permite colocar a “máquina” (uma bases de dados relacional) a executar um conjunto de tarefas que se assemelham ao trabalho de leitura atenta de um texto.

Crime_Padre_Amaro_4

Daqui, após seis horas de trabalho (cinco para o código, uma para a leitura), resultou a extracção de 155 referências a locais mencionados na obra (apenas referências a nomes de freguesias e, por vezes, várias para cada freguesia).

O resto já é sabido: importação para o SIG…

Crime_Padre_Amaro_5

… e produção de mapas.

Crime_Padre_Amaro_locais

Desta feita com uma nuance, pois além da localização, procurou-se perceber, através de um mapa de densidades, que locais eram importantes ou pareciam ser relevantes no enredo do romance (os que têm uma cor mais carregada) e aqueles que eram referidos apenas de forma esporádica (os que têm a cor menos carregada). As etiquetas apresentadas referem-se aos nomes dos concelhos de onde vinham maior número de referências às freguesias respectivas.

Crime_Padre_Amaro_densidades

Por fim, perguntar-se-á: mas foram precisas seis horas para extrair essa informação, que ainda por cima não analisa todas as referências geográficas do romance, apenas uma parte? Qualquer bom leitor de Eça consegue fazer isso sem precisar recorrer ao digital! Para além de ter as minhas dúvidas sobre esse possível conhecimento geográfico do leitor “médio” de Eça, é preciso dizer que, a partir do momento em que a base de dados fica preparada para a “leitura”, todos os outros romances de Eça podem passar pelo mesmo crivo, diminuindo consideravelmente o tempo de “leitura”. E neste caso a metodologia é explícita, a margem de erro é controlada e a capacidade de recolha de informação ultrapassa em muito o que qualquer par de olhos bem treinado consegue realizar em tempo útil, ou seja, num dia de trabalho, num Dia das Humanidades Digitais.

Para a próxima, já prometi a uma amiga, falaremos de sobreiros!

Sem comentários:

Enviar um comentário