Sábado, 8 de Junho de 2013

Humanidades Digitais e trabalho colaborativo

Declaração de interesses: esta entrada no blogue, não o sendo formalmente, é também assinada pela Ana Isabel Queiroz, colega que idealizou e coordena o projecto de que vou falar aqui: LITESCAPE.PT. Ela e a Cristina Joanaz dinamizam a linha de investigação em História do Ambiente do IHC, para a qual o texto e mapas seguintes pretendem ser apenas um pequeno contributo da minha parte.

Mas antes gostaria de falar sobre algo que está subjacente ao referido projecto e que em muito tem sido potenciado pelo crescimento das Humanidades Digitais, o trabalho colaborativo, que de alguma forma foi, no projecto referido, associado ao chamado “crowdsourcing”, apesar de não serem conceitos exactamente equivalentes. Tentarei explicar a seguir.

Como vários autores têm referido, análises quantitativas e métodos digitais são extremamente úteis para trabalhar com corpus de textos de grandes dimensões e de grande diversidade, permitindo observar e comparar padrões, definir metas e testar hipóteses. Franco Moretti (Moretti. 2000. “Conjectures on World Literature.” New Left Review: 54–68), usando um exemplo extraído da História Social, defendeu a importância de, nos estudos sobre Literatura, o investigador se afastar de algum modo da metodologia de “close reading” que provavelmente continua a ser a principal metodologia usada nos estudos literários de vários meios académicos. Contudo, o conceito de “close reading” que nós usamos no projecto referido é diferente, uma vez que não compreende uma abordagem linguística, filológica ou de outro tipo especializada e focada num reduzido número de obras literárias, mas mantém a necessidade de uma análise detalhada ao conteúdo dos textos, executada através de uma protocolo de leitura específico, que é seguido por académicos, investigadores e alunos de estudos literários, sobre um grande volume de textos. O processo usado pretende manter todas as vantagens de uma análise detalhada, ou de uma leitura tradicional, e desta forma evitar algumas das desvantagens associadas a abordagens do tipo “distant reading”, como sejam a necessidade de desambiguar nomes de locais, nomes próprios e outros erros que normalmente emergem de processos computacionais de pesquisa e extracção automática de textos (Gregory e Hardie. 2011. “Visual GISting: Bringing Together Corpus Linguistics and Geographical Information Systems.” Literary and Linguistic Computing 26, 5–9), mas de algum modo pretende estabelecer pontes com os métodos digitais e quantitativos que permitam ultrapassar as limitações inerentes à abordagem “close reading”, sejam elas relacionadas com o tempo de pesquisa ou com o volume de dados a tratar. O objectivo é potenciar o estabelecimento de relações ou conexões entre vários excertos dos textos literários e entre vários textos literários à medida que estes são lidos e introduzidos numa base de dados relacional.

Ao pensar nesta abordagem particular, é necessário prestar atenção a alguns problemas específicos colocados pelos textos portugueses e nas dificuldades na utilização de técnicas mais avançadas na sua exploração, como a linguística computacional, por exemplo. Apenas uma diminuta amostra do corpus literário português se encontra digitalizado e validado na íntegra, o que cria dificuldades em termos de tempo gasto e dos recursos financeiros necessários para o desenvolvimento de um corpus estável e de qualidade suficiente para sobre ele ser possível aplicar metodologias automáticas ou semi-automáticas de extracção e análise de texto. Além disso, software de linguística computacional está disponível essencialmente para inglês e embora actualmente uma equipa de investigação portuguesa esteja dedicada a construção de uma versão para português, esta ainda não está totalmente disponível, o que coloca problemas quando estamos a lidar com textos publicados desde o século XIX até ao presente, com todas as variações ortográficas introduzidas numa língua que passou por várias reformas ortográficas desde o início do século XX (Hendrickx e Marquilhas. 2012. “From Old Texts to Modern Spellings: An Experiment in Automatic Normalisation.” In Proceedings of the Workshop on Annotation of Corpora for Research in the Humanities, 1-12. Germany: Heideberg University). Além de tudo isso, era necessário também levar em conta a capacidade de resposta da comunidade académica portuguesa, nem sempre muito aberta ao desafio das Humanidades Digitais, é preciso confessá-lo.

Com isso em mente, tentando superar as limitações ao nível do tempo consumido pelo processo de leitura atenta, as limitações quanto à extensão do corpus literário que aquele processo normalmente abrange e, em simultâneo, mantendo um ambiente de investigação “controlado”, optou-se por uma abordagem que se pode chamar de “crowdsourcing” controlado. O método de “crowdsourcing”, como uma forma eficaz, em termos de tempo, custos e qualidade de resultados, de lidar com a transcrição digital de grandes quantidades de texto a partir do suporte analógico, tem sido abordado em vários trabalhos. Tem a vantagem financeira de se basear principalmente no trabalho voluntário; de ser eficaz porque une o trabalho colaborativo de várias pessoas focadas num conjunto de metas ou objectivos comuns; e, aparentemente, é também capaz de gerar resultados muito interessantes em termos de qualidade final, mesmo tendo em conta que estes resultados emergem essencialmente de trabalho voluntário (Causer, Tonra e Wallace. 2012. “Transcription Maximized; Expense Minimized? Crowdsourcing and Editing The Collected Works of Jeremy Bentham.” Literary and Linguistic Computing 27 (2) (June 1): 119–137).

Uma vez que se pretendia lidar com a questão do tempo e da quantidade de excertos literários usados, num projecto não financiado e onde a possibilidade de utilizar exclusivamente uma abordagem baseada em ferramentas digitais apresentava alguns problemas, a abordagem de “crowdsourcing” controlado parecia fazer sentido. O projecto, contudo, não recorreu ao esforço voluntário do público em geral, como é normal neste tipo de metodologia, mas a um trabalho colaborativo entre professores, investigadores, estudantes e bolseiros de investigação que, através de uma leitura atenta das obras literárias escolhidas, realizaram a selecção dos excertos, elaboraram a sua classificação de acordo com um conjunto de descritores geográficos, temporais e temáticos pré-definidos, e registaram os mesmos numa base de dados relacional, elaborada especificamente para o efeito. Os leitores associados ao projecto têm origem essencialmente no meio académico, entre investigadores e docentes, no corpo de estudantes de graduação e pós-graduação universitária, bem como no meio docente das escolas básicas e secundárias com ligação às disciplinas de Língua Portuguesa, Geografia, História e Ciências. Todos seguiram um protocolo de leitura que visou garantir a coerência e qualidade do processo que foi sofrendo uma validação contínua pelos membros da equipa de investigação.

A base de dados foi desenvolvida em PostgreSQL e conectada aos portáteis dos leitores através de ODBC (Open Database Connectivity). Deste modo, só foi dado acesso à base de dados aos voluntários do projecto, que asseguram uma alta qualidade no processo de leitura e registo dos excertos literários. Uma vez que a base de dados é partilhada entre todos, o tempo consumido na entrada de dados foi substancialmente melhorado, porque qualquer informação registada por um leitor, seja um nome de um escritor, um local geográfico ou um descritor de flora, por exemplo, fica automaticamente disponível para ser usado por todos os outros. Esta funcionalidade permite também reduzir alguma da ambiguidade e subjectividade inerente ao processo de leitura, um aspecto que também é conseguido pelo protocolo referido.

Entre outros, alguns dos objectivos do processo de leitura foram os de identificar os nomes de lugares ou localizações ficcionais e não-ficcionais, e estabelecer a relação destes com a ocupação humana do território, com a caracterização dos diferentes tipos de usos do solo (composição e configuração), com a identificação das transformações da paisagem ao longo do tempo e com o inventário de espécies vegetais e animais presentes em cenários literários. Para todas estas informações, foi estabelecida a correspondente identificação de uma unidade geográfica como o critério mínimo para o registo de um excerto literário na base de dados. Foram consideradas três divisões territoriais. A mais abrangente refere-se aos chamados NUT-III (Nomenclatura das Unidades Territoriais, nível III), territórios formados por um conjunto de municípios, com fins estatísticos, num total de 28 em Portugal continental. Sempre que possível, o processo de identificação geográfica registou outras referências, como municípios ou freguesias. Em alguns casos, nomeadamente em centros urbanos, ou em obras literárias muito descritivas, foi usada uma localização precisa, confrontando ruas e lugares mencionados nos textos, com dados sobre a latitude e a longitude armazenados em gazetteers, uma abordagem metodológica aplicada em várias trabalhos (Southall, Mostern e Berman. 2011. “On Historical Gazetteers.” International Journal of Humanities and Arts Computing 5 (October): 127–145), e já utilizada nos anteriores contributos para este blogue.

O que aqui se apresenta é apenas um exemplo possível retirado dos resultados do LITESCAPE.PT, neste caso sobre a distribuição geográfica das menções a sobreiros e azinheiras nas obras literárias registadas na base de dados.

Sobreiro_Azinheira_1

A todos os excertos literários podem depois ser aplicados critérios de pesquisa padronizados que permitem encontrar, seleccionar e extrair toda a informação e associá-la a dados geográficos.

Sobreiro_Azinheira_2

Neste caso, tendo em conta que estamos a lidar com dados literários, com representações sobre essas duas espécies de Quercus, há todo o interesse em verificar se as mesmas têm uma distribuição geográfica de algum modo comparável com a realidade. Para testar isso foram usados dados do Atlas do Ambiente, da Agência Portuguesa do Ambiente.

Sobreiro_Azinheira_3

A informação “literária” e “ambiental” foi trabalhada no já conhecido SIG…

Sobreiro_Azinheira_4

… dando origem a várias representações gráficas sobre a distribuição de azinheiras…

Azinheira

… sobreiros…

Sobreiro

… e do conjunto de sobreiros e azinheiras.

Sobreiro_Azinheira

Depois, as mesmas podem ser comparadas com a cartografia do Atlas do Ambiente, sendo possível verificar a quase exacta correspondência entre os dois tipos de geografias, a extraída dos textos literários portugueses e a que resulta dos levantamentos realizados pelo Ministério da Agricultura na década de 1980.

Sobreiro_Azinheira_Atlas_Ambiente

Feitos em apenas alguns minutos, como é óbvio, a realização destes mapas, se pensarmos no que lhes deu origem, demorou muito mais do que algumas horas. Eles são o resultado de toda uma equipa de investigação da FCSH (do Instituto de Estudos de Literatura Tradicional e do Instituto de História Contemporânea), que de forma voluntária e colaborativa foram lendo e introduzindo na base de dados milhares de excertos literários, que permitem agora realizar investigação, produzir novos conhecimentos em áreas tão distintas como a Literatura, a História, os Estudos Ambientais, a Geografia, os Estudos Urbanos, a Antropologia, entre outras, mas todas cruzadas através das potencialidades das Humanidades Digitais.

Quarta-feira, 5 de Junho de 2013

"Humanidades Digitais" e interdisciplinaridade

Este palavrão que me custa sempre a escrever (interdisciplinaridade) – e que o corrector ortográfico online não reconhece – tem sido um dos principais resultados da ligação entre o Digital e a História. Só esta relação entre a Informática e a História é já de si interdisciplinar, mas o certo é que o crescente cruzamento de saberes e metodologias entre as disciplinas das Humanidades e entre estas e as outras ciências, Sociais, Naturais ou Exactas, em muito tem beneficiado da globalização tecnológica. Dizer isto não é negar, nem esquecer a forte conexão entre as várias ciências sociais e humanas potenciada pela Escola dos Annales, entre outros. O ritmo e a abrangência agora é que são diferentes.

Por exemplo, a Geografia é cada vez mais chamada a outras área do saber, como a História (algo que não é novo!), a Literatura (que é mais recente), a Saúde, a Política, a Sociologia, a Biologia, etc., etc.. E muito disto, não sendo novidade absoluta, tem sido potenciado pelo incremento no uso dos Sistemas de Informação Geográfica (SIG). A História dá-se muito bem com os Estudos Políticos, com a Literatura, sempre se deu bem com a Geografia, mas até com a Medicina, a Matemática ou os Estudos Ambientais têm sido construídas pontes, para as quais o Digital tem sido uma forte fundação.

No que me diz respeito, julgo que tenho feito uma parte deste caminho. Começando na História e “afunilando” para a História Económica e Social do século XIX, as ligações à Sociologia e aos seus métodos, por exemplo, estiveram sempre presentes, mas desde cedo que a importância da Geografia foi fundamental, fosse através das leituras de Orlando Ribeiro para a tese de mestrado, fosse através do recurso aos SIG, a partir desse momento. O certo é que o Digital, em vez de tornar mais evidentes as diferenças de métodos e perspectivas de análise que resultam da comparação entre o trabalho desse mestre da Geografia portuguesa e as tendências dos modernos geógrafos, tem permitido aproximações e releituras desses dois mundos, na aparência tão distantes, que aproveitam muito para a História, em particular, nas abordagens de longa duração. Mas os caminhos são vários e a ligação ao Digital permitiu sair com muito facilidade do casulo oitocentista e navegar por outros temas e épocas, desde a Idade Média, à Revolução do 25 de Abril. Ao mesmo tempo, possibilitou ligações à Biologia, ao Ambiente, à Economia, aos Estudos Religiosos e à Literatura.

O Digital até podia não ter acrescentado mais nada à História, ou no geral às Humanidades, que só esta maior flexibilidade para o cruzamento de saberes constituiria, por si, uma marca de sucesso.

O que aqui apresentei de uma forma quase idílica, sem entraves, foi sofrendo profundas resistências da/na Academia, em grande medida geradas pelo mesmo factor que travou na década de 1980 a aproximação à Estatística: um excessivo peso dado aos métodos em detrimento dos resultados e um quase monopólio das fontes de cariz quantitativo. Pois o que parece ter aproximado em definitivo esses dois mundos, o Digital e as Humanidades, foi a coincidência de dois factores nos últimos anos. Por um lado, a crescente disponibilização em formato digital de grandes volumes de textos, fonte primária para muitas das disciplinas das Humanidades e fundamental para a História ou a Literatura (de que aqui se falará mais à frente). Por outro, a crescente capacidade das ferramentas digitais tratarem de forma eficaz essa informação não estruturada ou, pelo menos, não estruturada de acordo com as regras da Matemática.

Nesta perspectiva, a ligação entre textos e mapas, feita através do Digital (via bases de dados relacionais, Linguística Computacional, ferramentas Web 2.0, SIG, etc., etc.) tem sido das que mais destaque tem tido nos últimos anos, sendo vários os projectos, nacionais, de âmbito europeu, americanos ou globais que procuram, de várias formas, com vários objectivos e dentro de áreas disciplinares diversas uma nova forma de ler essa imensa volumetria de dados.

O que aqui apresento é apenas mais um exemplo do que é possível fazer, neste caso ligando Literatura, bases de dados relacionais e SIG. No exemplo anterior, o trabalho subjacente à transposição dos textos para os mapas foi relativamente simples, pois a fonte sobre os jornais e revistas portuguesas do século XIX apresentava a informação já razoavelmente estruturada (e as máquinas adoram esse tipo de informação e lidam bem com ela). O próprio objectivo do trabalho ajudava, pois pretendia-se apenas uma análise sobre a evolução cronológica e geográfica da imprensa de oitocentos.

Contudo, noutros casos, nem a fonte apresenta uma estrutura mais “matemática”, nem os objectivos do trabalho se ficam pela simplicidade da descrição. É, por vezes, necessário analisar o conteúdo, extrair dele sentido e significado e, nestes casos, o casamento entre o Digital e as competências de investigação próprias do Humanista tem de ser mais profundo. Na gíria recente das Humanidades Digitais, aplicável quer à Literatura, quer à História ou outra qualquer disciplina que recorra, em massa, à fonte textual, estamos na presença da necessidade de compatibilizar dois métodos: a leitura atenta e a leitura de distância, ou o que os ingleses chamam de “close reading” versus “distant reading” (a tradução está muito livre, obviamente).

Optei por aquilo que me é próximo, conhecido e que facilitaria a “leitura atenta”: o romance “O crime do Padre Amaro” de Eça de Queirós. Para a “leitura de distância” optei também por aquilo que era mais fácil, que melhor dominava: as bases de dados relacionais e os SIG. Objectivo: fazer um mapa de localização e também de algum significado das geografias presentes nesta obra do século XIX. Metodologia: fazê-lo procurando conciliar rigor na análise com rapidez na execução, “close reading” com “distant reading”.

Fica aqui o resultado, partindo de uma versão em PDF do referido texto, que já li há alguns anos na versão papel do Círculo de Leitores, mas que não queria voltar a ler (pelo menos, da forma tradicional), para através dessa leitura produzir um mapa, no fundo, o objectivo deste blogue.

Crime_Padre_Amaro_1

É sabido que a acção decorre, em boa medida, em Leiria, mas são muitas outras as referências geográficas usadas por Eça no seu romance.

Crime_Padre_Amaro_2

Todas podiam ser extraídas, criando uma lista de locais mencionados que depois se poderiam comparar com os já referidos gazetteers (neste caso, com a listagem de locais da carta militar portuguesa).

Crime_Padre_Amaro_3

Para simplificar, foram usados apenas cerca de 4000 locais, correspondendo aos nomes das freguesias portuguesas (o objectivo era produzir um teste).

Era depois necessário encontrar um meio de fazer essa comparação sem ter de ler atentamente toda a obra, mas conjugando a leitura feita pela “máquina” com a leitura de proximidade feita pelo investigador. A solução chama-se VBA (Visual Basic for Applications), uma linguagem “estranha” que aprendi há já alguns anos (na altura sem saber bem para quê, a não ser que poderia ser uma porta de saída para alguma precariedade laboral) e que permite colocar a “máquina” (uma bases de dados relacional) a executar um conjunto de tarefas que se assemelham ao trabalho de leitura atenta de um texto.

Crime_Padre_Amaro_4

Daqui, após seis horas de trabalho (cinco para o código, uma para a leitura), resultou a extracção de 155 referências a locais mencionados na obra (apenas referências a nomes de freguesias e, por vezes, várias para cada freguesia).

O resto já é sabido: importação para o SIG…

Crime_Padre_Amaro_5

… e produção de mapas.

Crime_Padre_Amaro_locais

Desta feita com uma nuance, pois além da localização, procurou-se perceber, através de um mapa de densidades, que locais eram importantes ou pareciam ser relevantes no enredo do romance (os que têm uma cor mais carregada) e aqueles que eram referidos apenas de forma esporádica (os que têm a cor menos carregada). As etiquetas apresentadas referem-se aos nomes dos concelhos de onde vinham maior número de referências às freguesias respectivas.

Crime_Padre_Amaro_densidades

Por fim, perguntar-se-á: mas foram precisas seis horas para extrair essa informação, que ainda por cima não analisa todas as referências geográficas do romance, apenas uma parte? Qualquer bom leitor de Eça consegue fazer isso sem precisar recorrer ao digital! Para além de ter as minhas dúvidas sobre esse possível conhecimento geográfico do leitor “médio” de Eça, é preciso dizer que, a partir do momento em que a base de dados fica preparada para a “leitura”, todos os outros romances de Eça podem passar pelo mesmo crivo, diminuindo consideravelmente o tempo de “leitura”. E neste caso a metodologia é explícita, a margem de erro é controlada e a capacidade de recolha de informação ultrapassa em muito o que qualquer par de olhos bem treinado consegue realizar em tempo útil, ou seja, num dia de trabalho, num Dia das Humanidades Digitais.

Para a próxima, já prometi a uma amiga, falaremos de sobreiros!

Terça-feira, 4 de Junho de 2013

Workshop "Bases de Dados para as Ciências Humanas"

O workshop "Bases de Dados para as Ciências Humanas" é uma iniciativa do projecto De Todas as Partes do Mundo: O Património do 5º Duque de Bragança, D. Teodósio I, sediado no Centro de História de Além-Mar (FCSH-UNL/UAç), em colaboração com várias instituições. Esta iniciativa pretende discutir a utilização de bases de dados como ferramenta de trabalho para a investigação histórica, pelo que esperamos que seja do interesse de alunos, investigadores e colegas.

O evento terá lugar no próximo dia 18 de Junho, na Sala Multiusos 3, piso 4, do edifício ID da Faculdade de Ciências Sociais e Humanas (UNL).

A entrada é livre, mas mediante inscrição obrigatória (até 17 de Junho) para o email: teodosio.cham@gmail.com.

Programa: http://atlas.fcsh.unl.pt/docs/workshop_base_de_dados.pdf

O evento reúne vários projectos de investigação onde as bases de dados relacionais foram uma das metodologias usadas. Em alguns desses projectos dei o meu contributo, colaborando com a planificação e concepção da respectiva bases de dados, na maior parte dos casos recorrendo a software open source PostGreSQL. Foi muito curioso e proveitoso interagir com equipas de investigação com enfoques temáticos e cronológicos tão afastados do "meu" século XIX, como sejam os oficiais régios medievais, o património de uma grande casa senhorial da época moderna ou a ligação entre literatura e ambiente na contemporaneidade, entre outros.

A minha comunicação no workshop será sobre a evolução da aplicação de bases de dados à investigação em História e sobre as vantagens e desvantagens da utilização de uma linguagem estruturada para recolher, analisar e disponibilizar informação ambígua, lacunar e imprecisa, como é, na maior parte dos casos, a informação histórica. Depois vai ser muito interessante ouvir experiências dos investigadores que efectivamente trabalharam com essas ferramentas e partilhar ideias com outros projectos que recorreram, ou ainda recorrem, à mesma perspectiva digital sobre as fontes e os problemas históricos.

Quarta-feira, 29 de Maio de 2013

Não sou um Humanista Digital, mas…

Provavelmente não serei sequer um Humanista, mas apenas um historiador, esse ser que navega entre as humanidades e as ciências sociais. Para piorar o cenário, no meu caso específico, navego entre as humanidades, as ciências sociais e a informática. Mas é aqui que me sinto bem, que me sinto à vontade. É neste espaço algo indefinido que encontro o rumo do meu trabalho, as ferramentas de que preciso e as colaborações que me ajudam a compreender cada vez melhor o meu lugar no ofício de historiador.

Dizer que não sou um Humanista Digital num blogue como este é, obviamente, um excesso literário. Pretendo, contudo, reforçar a ideia que, apesar de fazer um uso recorrente e sistemático de materiais, ferramentas e metodologias digitais no meu dia-a-dia de trabalho, é sempre à História que volto no final da jornada. É dos problemas históricos que parto e é através do recurso ao digital que os procuro resolver. Contudo, essa opção é agora tão natural para mim, num momento em que o mundo digital tem cada vez mais para oferecer, como o era há quase vinte anos atrás quando, confrontado com esse ser estranho que era a “base de dados relacional”, optei por mergulhar de cabeça na lógica estruturada da informática e naquilo que ela tinha para oferecer a uma disciplina tão dada a ambiguidades e a interpretações tão pouco binárias.

Como apesar de tudo ainda me considero na transição entre dois mundos, tenho dificuldade em aceitar o rótulo de “digital”, mas também não me sinto um historiador “analógico”!

E então, onde cabem os mapas que constam do título do blogue? Bem, resultam somente de mais uma bifurcação no meu caminho em direcção à investigação histórica. O meu primeiro trabalho de licenciatura, com um saudoso professor que nos deixou precocemente, passou por mapear topónimos religiosos e perceber, através da sua distribuição espacial, a própria evolução e tipologia da presença religiosa na Idade Média e o seu contributo para a construção da identidade nacional. Foi um trabalho muito “analógico”, com muitas fotocópias, muita pintura e desenho, mas provavelmente mais aliciante do que eu pensei na altura, pois não mais deixei de juntar a Geografia à História.

Coincidência ou cabala, o certo é que o digital acabou por permitir a ponte entre as duas disciplinas e veio agora trazer-me de volta ao ponto de partida e à fonte que em 1991 o Professor Luís Krus me indicou, a carta militar de Portugal. É do uso de uma versão da mesma, agora em formato digital, que em boa medida será feito este meu primeiro exemplo de transformação de “textos em mapas”.

O que aqui apresento é apenas uma exploração, feita com uma pequena amostra de dados, de uma investigação que estou a desenvolver com um colega sobre a evolução da imprensa em Portugal durante o século XIX. Ao mesmo tempo pretende ser uma ilustração do potencial do recurso ao digital (é a veia do professor de Informática Aplicada à História a falar mais alto).

Para responder à questão formulada, sobre a evolução e distribuição espacial da imprensa portuguesa, existe já uma excelente fonte, publicada pela Biblioteca Nacional, em dois volumes, mas no velhinho papel. A mesma está parcialmente disponível no Google Books.

Jornais_1

Foi então seleccionada uma amostra para transformar as informações textuais sobre a imprensa em mapas interactivos que nos permitam saber quantos, quando e onde foram publicados os jornais.

Jornais_2

Da Net apenas se conseguem extrair as imagens digitalizadas do livro, pois o Google Books não disponibiliza esta obra em formato texto. Contudo, um qualquer editor de imagem básico e um razoável programa de reconhecimento de texto (OCR) permitem fazer maravilhas…

Jornais_3

… e passar de imagens…

Jornais_4

… para texto. Depois de algumas operações de “limpeza” feitas com o Excel (sim, o Excel não serve apenas para calcular os impostos a pagar ou para fazer uns gráficos razoavelmente interessantes, serve também para manipular texto, no bom sentido da palavra), o resultado é uma lista de jornais com mais alguma informação anexa.

Jornais_5

Mais umas fórmulas no Excel e é possível passar para uma informação mais estruturada.

Jornais_6

E é aqui que entra a carta militar, essa fonte usada por mim, pela primeira vez, no longínquo ano de 1991, pois através da sua versão digital é possível obter as coordenadas geográficas de uma parte muito significativa dos topónimos nacionais e com isso construir um gazetteer.

Jornais_7

Juntando a lista de jornais e respectivos locais com o gazetteer obtêm-se as coordenadas para os nossos bocados de texto.

Jornais_8

Os mapas ficam então a uma distância de poucos cliques.

Jornais_9

E o resultado final de duas horas de trabalho sobre cerca de 30 páginas de texto (entre as letras J e M) é o que aqui se apresenta!

Jornais

Ainda não é um dia de trabalho, mas é já uma parte do meu Dia das Humanidades Digitais, 2013!

O meu "Dia das Humanidades Digitais"

Quem estiver interessado nestas coisas de juntar o digital à investigação em História pode acompanhar o meu contributo através do blogue criado no evento Dia HD 2013: "Um dia, um historiador, vários mapas digitais". É grátis! E pode ser que seja útil! Eu quero pensar que sim...

Quarta-feira, 15 de Maio de 2013

Dia das Humanidades Digitais 2013 (versão espanhol/português)

Convite à participação

A todos os "humanistas digitais" ou a todos aqueles que dirigem e/ou colaboram em projectos de humanidades com uma componente digital.
Juntem-se a nós para o primeiro Dia das Humanidades Digitais (versão ES / PT) que terá lugar no dia 10 de Junho de 2013.
Um Dia na Vida das Humanidades Digitais (Dia HD) é um projecto que pretende documentar um dia de trabalho de pessoas que estejam envolvidas em projectos que ligam as humanidades e a computação. Pretende-se reunir pessoas de todo o mundo que falem ou trabalhem primordialmente nos idiomas espanhol e português, para através de texto e imagem registar os eventos e actividades de um dia de trabalho. O objectivo do projecto é cruzar num único local os labores de todos os participantes, deste modo elaborando um recurso digital com o qual se possa responder à questão “O que é que os humanistas digitais efectivamente fazem?”

Para aceder à página do evento e registar-se: http://dhd2013.filos.unam.mx/pt-br/

O projecto realiza-se desde 2009 na sua versão inglesa e este ano acontece pela primeira vez em versão espanhola e portuguesa, sendo organizado pelas seguintes entidades:

Segunda-feira, 10 de Dezembro de 2012

Zotero compatível com site da BN

Depois de tanto tempo ausente do blog, aparentemente, só o Zotero me faria regressar e logo para dar boas notícias. Este programa, de que não me canso de gabar as qualidades, tinha um "defeito" central para os utilizadores portugueses: não era compatível com o catálogo da BN. A questão até não passava propriamente por um erro do Zotero, mas sim pela forma como a linguagem MARC (de forma simplificada, a linguagem que serve para estruturar a informação nos catálogos de pesquisa bibliográfica) foi implementada em Portugal e pela forma como o layout da Porbase foi construído. Diferindo da forma como os mesmos foram aplicados noutros países, quem fez o Zotero inicialmente olhou apenas para os casos que lhe estavam mais próximos e daí a incompatibilidade.
Depois de ter andado a batalhar com o código do programa, com resultados funcionais mas muito duvidosos, decidi recorrer à ajuda do grupo de informáticos responsáveis pelo desenvolvimento do Zotero. A resposta foi impecável e no espaço de uma semana, após algumas trocas de mails e alguns testes, o Zotero ficou compatível não só com a BN, mas também, em princípio, com todos os sites portugueses que usam o mesmo tipo de catálogo na net. Digo em princípio porque não tive tempo de testar em todos, mas na BN, na Biblioteca Municipal de Lisboa, na Biblioteca Municipal do Porto e na Biblioteca da Gulbenkian o Zotero é agora compatível, tanto no modo de resultados de pesquisa (permitindo importar vários registos bibliográficos em simultâneo), como no modo de registos individuais.
É mais uma ajuda para quem faz da pesquisa de informação na Internet um meio fundamental de auxílio na investigação.

Sábado, 22 de Outubro de 2011

Digital Methods and Tools for Historical Research

"Digital Methods and Tools for Historical Research" is the title of an international workshop to be held at Faculdade de Ciências Sociais e Humanas, Universidade Nova de Lisboa, on 18 and 19 November, 2011.

Organization: Luís Espinha da Silveira and Daniel Alves

Presentation: With this initiative we intend to discuss the implications of using digital technologies in the production and dissemination of knowledge in History. We seek to understand how a set of digital methodologies has influenced historical research, to discuss its advantages and disadvantages, as well as to identify innovative ways of linking the future of the digital world to the study of the past. On the first day, the meeting goes around four thematic sessions dedicated to the presentation and discussion of different methodologies (relational databases; geographic information systems; text encoding; digitization and preservation of digital memory). The program of that day closes with a conference on the significance of historical research in a digital environment. The second day will be filled with three workshops devoted to relevant digital tools for historical research, including GIS, text encoding, and reference management software. We expect this conference stimulates discussion about the interaction between History and Information Technology, and encourages its use by the academic community, especially young researchers.

Dates: 2011, November, 18th-19th (free attendance)

Location: I&D building, 4th floor, room 2 (FCSH, Av. de Berna, 26-C, 1069-061 Lisbon, Portugal)

Program:
Friday (18th) (Room 2, 4th floor, I&D building, FCSH)
9:00 – Opening
9:30 – 1st session: Primary sources and relational databases
John Bradley (King's College London), Silk purses and sow's ears: in what ways can structured data deal with historical sources?

Joaquim de Carvalho (Universidade de Coimbra), Combining source oriented and person oriented data models in prosopographical database design

moderator: Daniel Alves (IHC, FCSH-Universidade Nova de Lisboa)

11:00 – coffee break

11:15 – 2nd session: Interaction of space and time: GIS and History
Paul Ell (Queen's University Belfast), Humanities Geographical Information Systems: texts, images, maps

Luís Espinha da Silveira (IHC, FCSH-Universidade Nova de Lisboa), GIS and historical research: promises, achievements and pitfalls

moderator: Marco Painho (ISEGI - Universidade Nova de Lisboa)

12:45 – Lunch

14:30 – 3rd session: Decoding historical sources: Text Encoding
Malte Rehbein (Universität Würzburg), Text Encoding: a historian's perspective

Rita Marquilhas (Centro de Linguística - Universidade de Lisboa), The automatic research of digital editions

moderator: Andreia Martins (FCSH-Universidade Nova de Lisboa and King’s College London)

16:00 – coffee break

16:15 – 4th session: Internet, digitization and digital preservation
Melissa Terras (University College London), Exploring the potential of Digital Humanities with the Transcribe Bentham project

Daniel Gomes (Portuguese Web Archive – Fundação para a Computação Científica Nacional), Web archiving

moderator: José Borbinha (Instituto Superior Técnico)

17:45 – coffee break

18:00 – Closing conference
Peter Doorn (Data Archiving and Networked Services, Nederland), Computational history among e-science, digital humanities and research infrastructures: accomplishments and challenges

Saturday (19th) (Room T8, Tower B, FCSH)
Workshops (11:00 - 13:00):
A – Historical GIS (Luís Silveira and Ana Alcântara, FCSH-UNL)
B – Zotero (Daniel Alves, FCSH-UNL)
Workshops (14:30 - 17:30):
C – Text Encoding (Julianne Nyhan, University College London)
D – Atlas.ti (Pedro Sousa, FCSH-UNL)

Terça-feira, 29 de Março de 2011

Bibliografias e investigação simplificadas com o Zotero

Ainda se lembram daquele trabalho de licenciatura no qual ficaram a faltar algumas notas de rodapé fundamentais? Ou da dissertação de mestrado para a qual a escolha da bibliografia foi uma das várias angústias? Ou do doutoramento, onde a quantidade de livros e artigos a consultar parecia um poço sem fim? Ou daquele artigo em que foi difícil acertar com a forma de citação bibliográfica exigida pela revista? Gostavam de, finalmente, colocar alguma ordem na sempre crescente biblioteca caseira ou nas fichas de leitura? Se a resposta a todas, ou a algumas, destas questões for “sim”, então, o Zotero é a ferramenta digital ideal. No mês de Julho (entre os dias 11 e 15) vou dar novo curso sobre esta ferramenta que facilita a recolha, gestão e utilização de referências bibliográficas e não só!

Quinta-feira, 24 de Março de 2011

História 2.0: oportunidades e desafios de um olhar digital sobre o passado

[Texto da comunicação feita no dia 24 de Março de 2011 no VI Encontro Nacional de Estudantes de História, Faculdade de Letras da Universidade de Lisboa]

As tecnologias digitais e a sua mais recente evolução em particular, a chamada Web 2.0, podem ser consideradas como potenciadoras de uma verdadeira revolução, mais do que da mera comunicação, do próprio conhecimento e da cultura em geral. Contudo, tal como os outros tipos de revolução, existem determinadas vertentes desse conhecimento que estão a ser profundamente alteradas e outras que, pelo que nos é possível observar no presente, permanecem imutáveis, persistem, se quisermos utilizar uma expressão do célebre título de Arno Mayer, A persistência do Antigo Regime(Mayer 1981). No que ao conhecimento histórico diz respeito, cabe perguntar que parte está já a ser afectada pelo movimento digital e que parte permanece imóvel? E em que medida as mutações estão a contribuir para novas formas de produção científica e de acesso ao conhecimento histórico? Será que as “promessas” da revolução digital vão cumprir-se no que diz respeito à História e à transformação do trabalho do historiador, ou vão sobrepor-se os supostos “perigos”(“Promises and Perils of Digital History”, introdução do livro de Cohen e Rosenzweig 2006) inerentes ao recurso às novas tecnologias, condicionando a utilização das mesmas pelo mundo académico?
Mais do que encontrar respostas definitivas, pretendo aqui apresentar e discutir algumas oportunidades e desafios, mais estes que as primeiras, que a utilização do digital pode trazer para a História, enquanto disciplina, e para o historiador, nomeadamente, ao nível da escrita e da divulgação do conhecimento historiográfico.

No início da década de 1990, quando os browsers da Internet começavam a dar os primeiros passos, a comunidade académica dividiu-se na interpretação dos sinais que apontavam para as consequências do futuro do novo mundo digital. Se uns tinham uma perspectiva positiva e consideravam estar na presença de uma verdadeira revolução do conhecimento, que levaria a profundas mudanças nas próprias salas de aula e na forma como se passaria a ter acesso à informação; outros viam precisamente nesses factores um caminhar para o abismo daquilo que era um sistema milenar de produção e validação do conhecimento científico. Se uns anteviam o paraíso através da disponibilização em formato digital e em velocidades estonteantes de todo um conjunto de informação até aí pouco acessível; outros adoptavam uma perspectiva muito próxima dos Luddistas do século XIX, profetizando uma destruição das diferenças “entre o verdadeiro e o falso”, da credibilidade académica ou mesmo de todo o “sistema de educação superior”(Cohen e Rosenzweig 2006).

Actualmente estaremos mais próximos do paraíso ou da destruição? Para responder a esta questão será útil continuar a viagem no tempo. Apesar dos debates iniciais, em 1999, continuava-se a afirmar que a comunidade dos historiadores permanecia dividida entre os que resistiam à ideia de fazer uso de tecnologias em ascensão, como os “catálogos electrónicos das bibliotecas ou o email”, e aqueles que abraçavam de forma entusiasta o que o mundo digital tinha para oferecer(Ayers 1999).
Permanecia a ideia de que pouco ou nada tinha mudado na forma tradicional de escrita da História. Não se vislumbrava ainda qualquer efeito ou sequer uma discussão alargada sobre os possíveis efeitos que o digital poderia introduzir na produção de conhecimento historiográfico e na sua divulgação, nomeadamente, ao nível da narrativa histórica ou no que dizia respeito às forma de acesso a uma audiência desejavelmente mais ampla para os trabalhos historiográficos(Ayers 1999).
Havia, porém, quem sondasse o futuro e antevisse um quase perfeito casamento entre a História e as tecnologias digitais. Estas tinham o condão de potenciar uma democratização do público-alvo da História, de estimular a diversidade temática ou de desenvolver o interesse por novas técnicas narrativas. Essas, eram, em 1999, as promessas expectáveis do digital, mas falava-se já de algumas conquistas, como o desenvolvimento da comunicação e partilha de ideias entre os historiadores, algo conseguido através do recurso à Internet(Ayers 1999).
Ao nível da publicação e da disseminação de resultados havia também algumas ideias sobre o que o futuro poderia trazer, face ao que acontecia já com a disponibilização de algumas, poucas, revistas online. Nesta altura, a tecnologia de ponta era o Cd-Rom e previa-se um aumento na disponibilização de fontes através da Internet, fruto de grandes projectos de digitalização de documentos(Ayers 1999).
Apesar de algumas conquistas da primeira década da expansão das tecnologias digitais ao mundo da produção historiográfica, aparentemente, pouco se tinha conseguido alterar em relação à narrativa histórica, à forma de construção do discurso historiográfico, que não recorria aos artifícios da interactividade, características intrínsecas do digital e que, no caso de um certo tipo de Literatura, estava a proporcionar ao leitor a sensação de estar a participar na construção do enredo(Ayers 1999).
Em 1999 acreditava-se que a “História digital poderia ser um catalisador e uma ferramenta na criação de um tipo de História mais literário”, mantendo, contudo, “uma rigorosa fidelidade à referenciação das fontes”. Continuava-se a privilegiar o livro, o texto impresso, é certo, mas pensava-se já numa narrativa histórica que pudesse fazer uso de todas as capacidades do HTML e do então nascente XML, uma narrativa que fosse construída a pensar na teia de links e nós que constituem a World Wide Web(Ayers 1999).
O hipertexto, com a sua multiplicidade de ligações e narrativas possíveis, iria levar a uma História mais complexa, multifacetada, talvez mais exigente na preparação do discurso, na construção e sustentação dos argumentos, uma vez que teria de lidar com múltiplas possibilidades de leitura. No fundo, previa-se que o aprofundamento da ligação entre a História e a Internet acabaria por fazer com que a primeira perdesse o seu tradicional discurso linear.
Uma das evoluções previstas para a História era o retorno à ligação privilegiada que já tinha tido com as outras ciências sociais, na medida em que só a colaboração interdisciplinar tornaria possível uma História “mais dinâmica, interactiva e reflexiva” que elaborasse uma descrição do passado mais complexa. Nesta visão, as tecnologias digitais, por facilitarem ou mesmo incentivarem essa multiplicidade de pontos de observação, eram consideradas como uma natural evolução para a História enquanto disciplina. O futuro iria trazer a História Digital, uma História que se tornaria, “simultaneamente, sofisticada e acessível”(Ayers 1999).
Porém, apesar de todo este entusiasmo, o aspecto a que se dava ainda maior relevância na ligação entre a História e o Digital era o da capacidade de armazenamento de informação e da velocidade do processamento da mesma. Ao mesmo tempo chamava-se a atenção para um dos riscos da, sempre crescente, aceleração tecnológica, o da dispersão e vulgarização do conhecimento, entendido como uma desvantagem, na medida em que para além de democratizar, os media digitais poderiam contribuir para um empobrecimento geral da qualidade desse mesmo conhecimento. A História dificilmente conseguiria fugir a esse destino e caberia aos historiadores saberem aproveitar a onda tecnológica para procurarem contrariar a tendência(Ayers 1999).

Meia dúzia de anos mais tarde, um novo diagnóstico à interacção entre História e Digital parecia apontar para as mesmas conclusões. Embora não se negasse que as tecnologias digitais tinham trazido mudanças em termos sociais, nos comportamentos quotidianos, na pesquisa de informação, na forma de comunicação ou até mesmo alterações no modo como se “investiga, escreve, publica e ensina” História afirmava-se estar ainda muito longe do Éden digital e isto no “longínquo” ano de 2005(Introdução em Cohen e Rosenzweig 2006).
Reforço a perspectiva de distância temporal porque, efectivamente, se olharmos para a velocidade das mutações tecnológicas, 6 anos é um gigantesco salto no tempo e são outros 6 que nos separam da análise feita em 2005. Nova meia dúzia de anos que viram nascer a chamada Web 2.0, a Web social e colaborativa. Só para dar alguns exemplos dessa velocidade repare-se que, em 2005, o Facebook estava na infância e passava praticamente despercebido fora do meio académico (estudantil!) das universidades norte-americanas. O YouTube nasceu nesse mesmo ano; o MySpace só em 2004 tinha adquirido características de rede social. Comparada com todos estes, a Wikipédia, lançada em 2001, era já uma velhinha da Internet. Um último exemplo para referir que, em 2005, ainda não tinha nascido o Twitter, que nos dias de hoje é usado, tanto para a realização de conferências científicas (ThatCamp: The Humanities And Technology Camp), como para divulgar os mais recentes desenvolvimentos das Revoluções no Mundo Árabe.
Uma vez mais, mostrando o pouco que se tinha avançado, o que era destacado em 2005, como uma das principais vantagens do uso das tecnologias digitais para os historiadores, era a capacidade de armazenamento e processamento de informação que elas disponibilizavam(Cohen e Rosenzweig 2006). A chamada de atenção, novamente, para esta capacidade do digital de colocar em pequenos espaços uma enorme quantidade de informação, pode parecer redundante, mas o certo é que essa característica traz já algumas consequências ou desafios para o trabalho dos actuais historiadores e que irão ser determinantes na moldagem da forma de abordar o passado dos futuros historiadores.
Talvez o desafio mais significativo seja o da superabundância de dados, que levará necessariamente a alterações na forma como o historiador constrói a sua visão do passado. Habituado à escassez de informação, obrigado, na maior parte dos casos, a lidar com dados lacunares e dispersos, tendo elaborado toda uma metodologia de construção do saber histórico assente no permanente confronto e comparação de fontes complementares, o problema que agora se coloca e que se vai avolumar daqui para a frente é o da selecção e avaliação da pertinência de um grande volume de dados.
Poder-se-á dizer que isto já era feito antes da era digital. Num passado, apesar de tudo, não muito longínquo, o historiador recorria, como sempre o fez, à selecção e avaliação de fontes para conseguir levar por diante a sua análise. Contudo, existe uma diferença assinalável, pois enquanto antes recorria a esta metodologia, essencialmente, para conseguir ultrapassar as lacunas do passado, agora ele tem de pensar seriamente na forma e nas ferramentas de selecção de informação para poder conseguir lidar com um volume de dados que tende a ser avassalador.
Esse volume de informação e as formas digitais, interactivas, de aceder à mesma vão começar ou estão já a começar a colocar outros desafios, nomeadamente, à própria narrativa histórica. Num artigo publicado em Dezembro último na revista History and Teory, é afirmado que o conceito actual de narrativa histórica tem de ser encarado de forma diferente, não porque os historiadores estejam a fazer um uso distinto da mesma, mas porque a narrativa, em termos gerais, está a mudar, em grande medida, fruto de pressões externas, sendo a mais significativa a que é exercida pelos meios de comunicação digitais(Rigney 2010, 100-104).
Ao procurar teorizar sobre este impacto, a autora do artigo, Ann Rigney, socorre-se do trabalho de Marshal McLuhan, A galáxia de Gutenberg(McLuhan 1977), e da sua ideia sobre a cultura do livro impresso como algo que veio impor uma definitiva separação entre o autor e o público, na medida em que fixando o seu discurso, o livro dificultaria a interactividade e a espontaneidade que, na sua visão, eram características da cultura oral. Nesse sentido, sendo o discurso historiográfico, ainda hoje, maioritariamente fixado nesse meio de comunicação, também o podemos classificar como um produto, uma narrativa, que restringe ou limita a interactividade e a espontaneidade. Algo que, como se percebe, vai claramente em sentido oposto ao que é a tendência do momento cultural actual, influenciado por aquela Web 2.0 de que dei alguns exemplos atrás.
Apesar disso, os historiadores sempre recorreram a outras formas de mediação, eminentemente orais e em certa medida participativas, como o são as conferências, congressos e eventos afins. Contudo, essas características de interactividade e espontaneidade, presentes na cultura de tradição oral e, em grande medida, ausentes na sua forma impressa, é preciso afirmá-lo que durante muitos anos e fruto de uma cultura de “persistência do Antigo Regime” fizeram parte de um jogo, consciente ou inconsciente, que definia e delimitava o poder, o prestígio e até a aura de respeitabilidade que a profissão académica tem gozado. O que não é de molde a facilitar as mudanças, como se compreende.
Ora, são as características de fixidez, pouca interactividade e rara espontaneidade da cultura impressa que estão a mudar nos últimos 20 anos e com espantosa velocidade nos últimos 5 a 6 anos. E ao mudarem, vão certamente colocar desafios, se não estão já a fazê-lo, ao historiador. Não porque a profissão de historiador ou o seu modo de escrever História tenham mudado intrinsecamente, internamente, nestes últimos anos, mas porque estão a ser cada vez mais pressionados a isso pelas mudanças de paradigma em termos de publicação e divulgação culturais impostas pelos media digitais. Neste caso, as mudanças não são apenas relativas ao meio de publicação, à passagem do impresso para o digital, mas têm implicações em termos culturais e sociais, na medida em que os novos meios “aceleram o fluxo da informação, geram redes e mudam atitudes”(Rigney 2010, 105) em relação a aspectos desde sempre acarinhados ou até ferozmente defendidos pela academia, como são os direitos de autor, a autoridade científica e a fiabilidade da informação.
Não pretendo aqui discutir se as tecnologias digitais estão a colocar esses aspectos em causa no bom ou no mau sentido, mas é inegável que estão a ter esse impacto e ele é tão mais importante para a História quanto mais importante for o impacto das tecnologias digitais no quotidiano dos indivíduos e na moldagem do seu modo de aceder e participar na cultura e na circulação da informação em geral. Isto quer dizer que as mudanças serão mais evidentes para uma geração de futuros historiadores que já nasceram na era do digital e da Internet, do que para aquela geração que cresceu profissionalmente à sombra dos velhos paradigmas. Mas mesmo para estes historiadores, as tecnologias digitais representam desafios, pois para poderem continuar a cultivar uma audiência para o seu trabalho (é impensável supor que se possa produzir História apenas para uma pequena clique académica ou apenas para gozo e realização pessoal) também eles terão de adaptar a narrativa histórica para uma forma que vá de encontro à hipertextualidade dos dias que correm.
Para além disso, a massiva disponibilização e facilitada acessibilidade da informação, na forma de grandes projectos de digitalização, tenderá, muito provavelmente, a forçar os historiadores a serem ainda mais exigentes com a abordagem do seu objecto de estudo, evitando generalizações escassamente fundamentadas, por exemplo, uma vez que uma parte significativa dessas fontes tende também a ficar disponível para escrutínio público(Cohen 2010). É claro que existe um reverso da moeda, que é a cada vez maior dificuldade, num mundo onde a informação é mais democrática e aberta, em conseguir ser original e inovador ou em manter o foco de atenção em problemas historiográficos realmente pertinentes, procurando não cair na tentação do episódico ou na armadilha da dispersão.

Contudo, estes desafios podem trazer também, já estão a trazer, efectivamente outras tantas oportunidades ou vantagens para os historiadores. As ferramentas da Web 2.0 podem ajudar a transformar a nossa disciplina, onde a facilidade em criar redes, em partilhar resultados, em encetar trabalhos colaborativos e interdisciplinares pode e deve ser uma perspectiva a valorizar. Apesar de tudo, parece ser seguro dizer que a História e os historiadores não ficaram imunes às mudanças das últimas décadas. É hoje evidente que a Internet e o mundo digital em geral, com os seus conceitos, linguagens e ferramentas, são uma componente essencial do trabalho de uma parte significativa de historiadores e podem representar uma mais-valia em termos da quantidade, acessibilidade, flexibilidade e diversidade da informação disponível, seja ela de âmbito geral ou específica da área de conhecimento histórico. Contudo, todas estas características e, em certo sentido, inovações introduzidas pela era da informação digital, não nos devem fazer esquecer uma componente essencial do trabalho do historiador, que deve estar sempre presente, esteja ele a lidar com a informação em formato analógico ou digital.
Essa componente é o espírito crítico, a análise criteriosa das fontes, o permanente colocar em questão se e de que forma as tecnologias digitais podem ajudar o seu trabalho e a fazerem dele um trabalho melhor e/ou diferente. Este sentido crítico deve fazer o historiador olhar para as vantagens e desvantagens de fazer ou recorrer à chamada “História Digital” e, a cada momento, ser capaz de “maximizar as primeiras e diminuir os efeitos das segundas”(Cohen e Rosenzweig 2006). Se o conseguir, através do recurso às tecnologias digitais, então é provável que ele possa levar a cabo uma história mais complexa, mais problematizante, mais global. Uma História que possa evitar os riscos da banalização, da simplificação ou até da adulteração a que o conhecimento histórico está sujeito em resultado do exponencial crescimento da Web colaborativa e social. No fundo, uma História, também ela, 2.0!

Bibliografia:
Ayers, Edward L. 1999. The Pasts and Futures of Digital History. http://www.vcdh.virginia.edu/PastsFutures.html.
Cohen, Dan. 2010. Is Google Good for History? Dan Cohen’s Digital Humanities Blog. http://www.dancohen.org/2010/01/07/is-google-good-for-history/.
Cohen, Dan, e Roy Rosenzweig. 2006. Digital history: a guide to gathering, preserving, and presenting the past on the Web. Philadelphia: University of Pennsylvania Press.
Mayer, Arno J. 1981. The Persistence of the Old Regime: Europe to the Great War. Taylor & Francis.
McLuhan, Marshall. 1977. A galáxia de Gutenberg: a formação do homem tipográfico. Säo Paulo: Editora Nacional.
Rigney, Ann. 2010. “When the monograph is no longer the medium: historical narrative in the online age”. History and Theory 49 (4): 100-117. doi:10.1111/j.1468-2303.2010.00562.x.