Des de fa anys, els projectes de digitalització de patrimoni documental estan en auge. És una manera d’adaptar-se als nous temps, en permetre difondre el seu llegat a través de la xarxa, i conrear així una comunitat interessada a conèixer el treball de fons dels arxius.

En l’àmbit europeu, existeix un projecte centrat en la digitalització que destaca per sobre dels altres, tant per ambició com per recursos invertits. T’agradaria conèixer-ho? Llavors viatjarem a Venècia.

Què és el Venice Time Machine?

La màquina del temps de Venècia és un projecte col·laboratiu fundat entre la Universitat Federal de Laussane de Suïssa i la Universitat Ca’Foscari que busca crear un model multidimensional de Venècia gràcies al seu llegat documental de més d’un mil·lenni d’antiguitat. Per tant, un projecte d’aquesta magnitud involucra a professionals de molts àmbits, ja que requereix tècniques com a digitalització per índexs o segmentació genèrica de documents.

Venècia i la seva història

Fins i tot comptant amb un territori reduït, Venècia va ser un dels protagonistes de la història moderna d’Europa. Gràcies a la seva gran flota, es va convertir en un centre de redistribució de mercaderies, establint colònies a les illes de Creta i Xipre i competint contra potències com l’Imperi Otomà. No obstant això, el descobriment de rutes oceàniques per part dels imperis espanyols i portuguesos van provocar el seu inevitable declivi.

Finalment, en 1797 va passar a les mans de Napoleó, per a posteriorment estar sota l’Imperi Austríac i més tard, el Regne d’Itàlia.

Tècniques del Venice Time Machine

Algunes de les tècniques emprades en aquest projecte són diverses:

Digitalització basada en índexs
Secundant-se en eines d’indexació històrica, permet disposar d’un sistema d’informació basat en el contingut dels arxius històrics digitalitzats.

Computació Cadastral
Consisteix a aplicar tècniques computacionals en els cadastres napoleònics per a convertir-los en una font d’informació.

Descobriment de Patrons Visuals
Es busca implementar motors de cerca capaços de cercar més enllà de les metadades textuals, si no també a través de consultes visuals.

Segmentació genèrica de documents
Aquesta tècnica pretén abordar diversos procediments de manera simultània, com l’extracció de pàgines, anàlisis de disseny o l’extracció d’il·lustracions o fotografies.

Extracció automàtica i anàlisi sintàctica de referències
Permet extreure un corpus de monografies de referència, i a més proposa un sistema per a aconseguir la xarxa de publicacions a les quals fa referència.

Progrès de la màquina del temps de Venècia

Un projecte d’aquesta magnitud requereix un pla meticulós. Per això, el Venice Time Machine es divideix en dues grans etapes, d’uns vuit anys de durada cadascuna.

La primera fase del projecte va començar en 2012 i va finalitzar en 2019. Es va posar en marxa el projecte amb la signatura d’un acord entre les dues institucions fundadores, la Universitat Federal de Laussane de Suïssa i la Universitat Ca’Foscari de Venècia. Durant aquests anys, es van assentar les bases d’aquest pla: es van contractar la maquinària i els especialistes necessaris, per a més tard en 2015 establir-se el protocol per a la digitalització i anotació, que va ser aprovat pels professionals dels arxius d’estat de Venècia.

A més, es van desenvolupar tecnologies destacades, com el Time Machine Box, un servidor allotjat en els arxius on s’escaneja i que permet emmagatzemar tots els fitxers i les seves metadades seguint el protocol IIIF. Gràcies a això, permet analitzar imatges utilitzant tècniques com a algorismes de segmentació de documents o reconeixement de caràcters, sempre que siguin compatibles amb els estàndards de IIIF.

Més tard, en 2017 es va desenvolupar el cercador, i en 2018 un sistema de reconeixement automàtic de l’escriptura. No obstant això, en 2019 el projecte va tenir una aturada, en sorgir desacords entre arxivistes i científics de dades respecte a llicències i metadades, perquè no seguir els estàndards de InterPARES, posant en perill els 8 terabytes d’informació generats en el projecte.

Tanmateix, el projecte va haver de suspendre’s, perquè no aconseguir resoldre les seves diferències. Amb tot, l’octubre de 2020 van arribar a publicar un article en la revista Nature sobre la pesta negra que va assotar la ciutat entre 1630 i 1631. Per desgràcia, sembla que mai veurem el producte final d’aquest projecte. Les dades generades durant aquests anys poden ser utilitzats per enginyers i arquitectes (els artífexs del projecte), però no tenen cap valor per a arxivers o historiadors que hagin participat en ell.

Lliçons sobre el Venice Time Machine

La veritat és que aquest tipus de projectes tan ambiciosos sedueixen a qualsevol; la màquina del temps de Venècia no és una excepció, i més si tenim en consideració l’enorme quantitat de finançament que ha rebut. De fet, a Catalunya existeix el projecte XARXES, liderat pel Centre de Visió per Computador (CVC) de la Universitat Autònoma de Barcelona. El projecte, presentat en 2017, pretén crear programes que aconsegueixin reconèixer massivament la lletra manuscrita i mecanoscrita. Amb tota aquesta informació, es construeixen cercadors onomàstics electrònics per a ser aplicats a registres històrics com els censos de població.

Malgrat això, com a defensors de les humanitats hem de ser cauts sobre el nostre ús de la tecnologia. Una correcta gestió del nostre consum d’aquesta ens permetrà mantenir una posició d’independència, sense renunciar als innombrables beneficis que ens aporta. De fet, no és possible substituir tot el coneixement que aporta un paleògraf per un algorisme, ni tractar les dades del passat de la mateixa manera que els actuals. Així mateix, la màquina del temps de Venècia ha fracassat perquè les humanitats van adoptar una posició secundària per sota de la tecnologia, quan mai hauria d’haver succeït. Un exemple beneficiós per a tots dos és el cercador d’imatges de Google, una eina molt cèlebre, que va saber combinar el criteri humà amb un ús adequat de la tecnologia.

Per tant, la col·laboració d’enginyers amb arxivers, lingüistes o historiadors sempre haurà de ser de tu a tu: el coneixement aportat per un ha d’estar complementat per les aportacions tècniques o crítiques de l’altre. Tan sols d’aquesta manera aconseguiríem convertir el llegat documental de Venècia en una realitat multidimensional, transportant-nos a la seva època més gloriosa.

Ilustración de Venecia