Entradas

POSTDATA participa del Congreso de Humanidades Digitales 2018 en Mexico

El congreso DH2018 (Humanidades Digitales 2018) tuvo lugar en la Ciudad de México entre el 26 y 29 de junio, organizado por The Association of Digital Humanities Organizations (ADHO),  El Colegio de México y la Universidad Nacional Autónoma de México (UNAM), en colaboración con la Red de Humanidades Digitales (RedHD). POSTDATA participó en el congreso con una presentación breve y un póster.

Presentamos la nueva versión de nuestro corpus DISCO, que consta de 4.000 sonetos en español de más de 1.000 autores, tanto canónicos como no, de Europa y América, que abarcan desde el siglo XV hasta el siglo XIX. El corpus se proporciona en TEI y texto simple, con diversos metadatos para describir a los autores, en TEI y a través de atributos RDFa (un formato de datos enlazados). El corpus tiene anotaciones literarias obtenidas a través del Procesamiento del Lenguaje Natural, concretamente escansión y encabalgamiento, y puede descargarse libremente aquí. El trabajo presentado se encuentra aquí.

 

También presentamos la interfaz web a ANJA, nuestra herramienta de detección de encabalgamiento en español, accesible aquí. Permite cargar poemas y obtener anotaciones de encabalgamiento según una tipología especializada. El trabajo se describe aquí.

 

¡El congreso fue un gran evento por el que debemos agradecer a la organización!

Presentación en jornada sobre estilometría y Siglo de Oro en Paris IV Sorbonne

El viernes 6 de abril, POSTADATA participó en el seminario “Estilometría y Siglo de Oro: El giro computacional en el estudio de textos áureos”. El evento fue organizado por Marie-Églantine Lescasse y la Profesora Mercedes Blanco del grupo LEMH-CLEA en la Universidad Paris IV Sorbonne. Los temas del seminario fueron la estilometría y la estilística computacional.

Pablo Ruiz presentó trabajo que hemos realizado en el equipo de POSTDATA sobre el análisis automático de patrones métricos y la detección automática del encabalgamiento, aplicados a corpus amplios de sonetos del Siglo de Oro y períodos posteriores, cubriendo unos 10.000 sonetos. La presentación está disponible en zenodo.

También fue la ocasión de escuchar las presentaciones de Laura Hernández Lorenzo, de la Universidad de Sevilla y José Calvo Tello de la Universidad de Würzburg, y participar en un interesante debate.

¡Gracias CLEA-LEMH por esta jornada!

El programa fue el siguiente:

 

 

POSTDATA presenta el corpus DISCO en Colonia (DHd 2018)

La semana pasada el proyecto POSTDATA estuvo en Colonia en DHd 2018, el congreso anual de Digital Humanities im deutschprachigen Raum (la asociación alemana de DH). El congreso fue organizado por el Cologne Center for eHumanities y Universität zu Köln.

Presentamos nuestro corpus DISCO (Diachronic Spanish Sonnet Corpus). El corpus contiene más de 4,000 sonetos de más de 1,000 authors, tanto europeos como americanos, incluyendo autores canónicos y no canónicos, de entre los siglos XV y XIX. El corpus se presenta en formato TEI con anotaciones en RDFa. Los autores están anotados con su identificador de VIAF. También se ofrecen anotaciones literarias (métrica y encabalgamiento). El corpus es una colaboración con José Calvo (del grupo CLiGs de Universität Würzburg), y está disponible en GitHub: https://github.com/postdataproject/disco

El poster puede verse en zenodo.

¡Gracias DHd!

POSTDATA en la Jornada de la Biblioteca Nacional de España: “La edición digital de textos: estado actual y perspectivas”

El 11 de diciembre de 2017 la Biblioteca Nacional de España, BNE, organizó una Jornada para analizar proyectos recientes sobre edición digital. La digitalización de colecciones y el desarrollo de herramientas de edición digital han llevado a la aparición de muchas formas diferentes de tratar con textos digitales. Este taller tuvo como objetivo debatir y reflexionar sobre cómo se desarrollan los proyectos actuales, qué significa la edición digital y la publicación en la actualidad y qué papel pueden desempeñar las instituciones culturales, especialmente la BNE, en este nuevo contexto. Aquí tienes más información sobre la Jornada y su programa.

 

Clara Martínez Cantón y Pablo Ruiz Fabo, miembros del equipo POSTDATA, pronunciaron dos charlas:

 

  • Clara Martínez Cantón: “Poesía medieval en un entorno digital. Edición e interoperabilidad en el siglo XXI”. En su charla presentó diferentes proyectos de Humanidades Digitales llevados a cabo en el grupo LINHD y que comparten el mismo objeto de investigación: la poesía medieval castellana y sus métricas: Remetca, Diálogo Medieval, Poetriae y, finalmente, POSTDATA. Se puede consultar en: https://zenodo.org/record/1101120#.Wi7U1EriY2w

 

  • Pablo Ruiz Fabo: “Contribuciones del Procesamiento del Lenguaje Natural a la navegación de corpus digitales”. La charla discutió cómo las tecnologías del lenguaje natural pueden ayudar a proporcionar experiencias de exploración de corpus más ricas para los usuarios. Se presentaron tres estudios de caso: Primero, navegación por actores (agentes) y sus declaraciones en un corpus de negociación climática llamado Boletín de Negociaciones de la Tierra. Segundo, navegación de conceptos en los manuscritos de Jeremy Bentham. Finalmente, se mostró cómo se aplicaron las mismas tecnologías NLP para anotar automáticamente un corpus de poesía para las ocurrencias del llamado encabalgamiento, un recurso estilístico. Los problemas de evaluación también fueron abordados. Las diapositivas están disponibles en http://bit.ly/2kmrH6v

 

El vídeo completo de la Jornada está disponible aquí debajo, con nuestras charlas empezando en 2:22:55 (Clara) y 55:08 (Pablo).

[embeber vídeo]