POSTDATA presenta el corpus DISCO en Colonia (DHd 2018)

La semana pasada el proyecto POSTDATA estuvo en Colonia en DHd 2018, el congreso anual de Digital Humanities im deutschprachigen Raum (la asociación alemana de DH). El congreso fue organizado por el Cologne Center for eHumanities y Universität zu Köln.

Presentamos nuestro corpus DISCO (Diachronic Spanish Sonnet Corpus). El corpus contiene más de 4,000 sonetos de más de 1,000 authors, tanto europeos como americanos, incluyendo autores canónicos y no canónicos, de entre los siglos XV y XIX. El corpus se presenta en formato TEI con anotaciones en RDFa. Los autores están anotados con su identificador de VIAF. También se ofrecen anotaciones literarias (métrica y encabalgamiento). El corpus es una colaboración con José Calvo (del grupo CLiGs de Universität Würzburg), y está disponible en GitHub: https://github.com/postdataproject/disco

El poster puede verse en zenodo.

¡Gracias DHd!

Charla de José Manuel Fradejas Rueda: Estilometría, o lo que los números pueden contarnos de los textos

 

El martes 12 de diciembre, José Manuel Fradejas Rueda(Universidad de Valladolid) dará una charla titulada

“Estilometría, o lo que los números pueden contarnos de los textos”

El evento tendrá lugar el 12 de diciembre a las 10:15 en la Sala de juntas de la Facultad de Psicología de la UNED (Juan del Rosal, 10, Madrid).

José Manuel Fradejas es catedrático de Filología Románica en la Universidad de Valladolid. Sus líneas de investigación actuales comprenden la crítica textual, la lingüística histórica, la bibliografía, la Edición crítica de las Siete Partidas, la estilometría y el procesamiento de lenguaje natural. Ha editado textos castellanos, catalanes y portugueses de la Edad Media.

[Mapa] para el lugar del evento.


Resumen de la charla

La estilometría es el análisis estadístico del estilo literario. Lo que hacemos es reducir los textos a números y ver qué nos pueden contar que no nos cuentan tan solo las palabras. Es algo que los “científicos” han estado haciendo desde finales del siglo XIX. Desde entonces hasta ahora una sido un territorio explorado únicamente por los expertos en estadística. En esta comunicación mostraré que uno “de letras” puede hacerlo gracias a un lenguaje de programación llamado R y un montoncito de librerías que otros han programado y no solo puede hacerlo con textos del siglo XX y XXI, sino que puede utilizar los números para averiguar cosas sobre textos tan antiguos como las obras de Alfonso X, Ayala o la Celestina.

Picasso frontispiece Apollinaire Alcools

Charla de Anne-Sophie Bories: Sex, Wine and Statelessness. Apollinaire’s verse without borders in “Vendémiaire”

 

El viernes 24, Anne-Sophie Bories (Universidad de Basel) dará una charla titulada

Sex, Wine and Statelessness. Apollinaire’s verse without borders in “Vendémiaire”

El evento tendrá lugar el 24 de noviembre a las 10:00 en el Salón de Grados de la Facultad de Educación de la UNED (Juan del Rosal, 14, Madrid) y ha sido organizado por el proyecto POSTDATA.

Anne-Sophie Bories es investigadora en la Universidad de Basel. Recientemente ha organizado el congreso internacional Plotting Poetry / Machiner la poésie. Este congreso busca discutir enfoques computacionales al análisis de poesía, así como una evaluación crítica de la contribución de las herramientas informáticas al estudio de la poesía. Se trata de intereses cercanos a los objetivos de nuestro proyecto, POSTDATA, y de hecho pudimos asistir a Plotting Poetry este año.

Un resumen de la charla y más información sobre el trabajo de Anne-Sophie Bories se encuentran a continuación.

[Mapa] para el lugar del evento.


RESUMEN

Apollinaire gladly disrupts borders or many kinds. He disregards the boundaries of morality and good taste with his playful pornography and outrageous wit. He oversteps the limits of verse with his Calligrammes. He suppresses the nicely delineating punctuation from his poems. He bridges the prose-poetry gap by cutting up his own prose to create Retour de la maison des morts. He brings together free and strict verse in the same space, circulating between the two with no formal break.

“Vendémiaire” (Alcools, 1913), titled after the French Revolutionary Calendar’s windy month of grape-harvest, is an exemplary specimen of this liberty. It glorifies France and Paris, goes on to call for internationalism, wine and sex, all the way to a “universelle ivrognerie”. The versification follows a similar pattern, intially slipping from strict alexandrines to free verse, then back and forth until the two become closely blended. “Vendémiaire” offer a typical illustration of how Apollinaire rejects geographic limitations, with a somewhat naïve fantasy seeing all rivers of the world collide into one welcoming Paris.

“j’ai soif villes de France et d’Europe et du monde
venez toutes couler dans ma gorge profonde”

These two lines are soon followed by the notion of “vin pur”, making drunkenness a sacred state, and thirst a form of chastity. The sexual undertone of this “chanson de Paris” adds further texture to the mix, conjuring overlapping images of the city as a large-chested, enticing working-girl eager for oral sex and reckless partying. Such an overpowering, cosmopolitan, hypersexualized feminine figure is an undeniable allusion to his mother, the aristocratic, Polish-Russian, Vatican demimondaine dragging her stateless children across Europe and to Paris.

I shall combine close and distant readings, focussing my analyses on Apollinaire’s versification choices and their importance in the construction of meaning. The skilful oscillation of “Vendémiaire”’s versification, between the very strict and the very lax, just as the tone and contents of the poem blend piety and outrageousness, draws, in fine, an intimate image of the poet in his rootlessness, in his ambivalence towards any culturally or geographically fixed ethos, convention or limitation; for Apollinaire hovers, inevitably, on the border.


PONENTE

Anne-Sophie Bories es doctora por la Universidad Paris 3, y ha realizado estancias de investigación en UC Berkeley y la Universidad de Leeds. Para su tesis doctoral elaboró una amplia base de datos sobre la versificación de Raymond Queneau, aplicándola para procesos hermenéuticos. Su primer libro, Des Chiffres et de mètres [Cifras y metros] está en proceso de publicación, y se trata de un estudio de la versificación de Queneau. También ha publicado artículos de investigación sobre este tema. Anne-Sophie Bories se interesa sobre todo por aspectos formales de la poesía y ha recibido una subvención de la Swiss National Science Foundation para un proyecto sobre el verso libre, que está desarrollando en el Departamento de francés de la Universidad de Basel. A través de la combinación de minería de textos (text-mining) y lecturas tradicionales, su investigación busca patrones en un amplio corpus de verso libre, en colaboración con los laboratorios ATILF (Nancy), CRISCO (Caen) y DHLab (Basel).

Crónica del curso de verano DH@Madrid Summer School 2017

Bajo el título Tecnologías semánticas y herramientas lingüísticas para humanidades digitales/Semantic web technologies and language resoruces for digital humanities, por tercer año consecutivo la DH@Madrid Summer School 2017 de la UNED ha sido un hervidero de ideas y conocimientos sobre distintos métodos digitales de investigación aplicados a las Humanidades. Investigadores en Filología y Humanidades Digitales han podido aprender una gran variedad de herramientas tecnológicas con las que poder posicionar sus proyectos de investigación en el centro del actual contexto académico digital.

Los contenidos de este curso que, de nuevo, han podido seguirse de forma presencial y online, y a los que se podrá acceder en diferido, se han centrado en las tecnologías del lenguaje y, fundamentalmente, en las tecnologías semánticas. El curso de verano de Humanidades Digitales 2017 que está avalado por la infraestructura europea de investigación CLARIN, ha sido cofinanciado por uno de los proyectos que desarrolla el LINHD: POSDATA, que precisamente está basado en la aplicación de procedimientos semánticos para crear un modelo único que haga interoperables los datos pertenecientes a las distintas tradiciones poéticas.

Durante los tres días que ha durado el curso, eminentemente práctico, se ha demostrado la aplicación a proyectos de Humanidades de tecnologías como el lenguaje de programación R, especialmente para estudios de estilometría o métodos como las expresiones regulares.

La tarde del lunes se cerró trabajando sobre metadatos y testando el entorno virtual de investigación EVILINHD para la inclusión de esquemas de metadatos y vocabularios controlados. Aparte de las sesiones prácticas, también ha habido espacio para repasar los fundamentos de las Humanidades Digitales y seguir la trayectoria personal de mano de Susan Schreibman en la conferencia plenaria que abrió la mañana del miércoles.

Para todos aquellos que no conocían, o sabían poco acerca de la infraestructura CLARIN, se pudo visualizar su trabajo en la presentación de los proyectos de los centros Clarin-K españoles.

Los métodos y conceptos asociados a Linked Open Data estuvieron presentes a lo largo de todo el curso de verano, pero fue el último día cuando las sesiones se centraron en casos concretos de utilización los datos abiertos y enlazados en las Humanidades.

 

 

Participamos en el datathon SD-LLOD de Cercedilla

La semana pasada se celebró la segunda edición del Datathon en Linguistic Linked Open Data (SD-LLOD) en Cercedilla organizado por el Ontology Engineering Group de la Universidad Politécnica de Madrid y en el que ha participado un grupo de investigadores de POSTDATA, proyecto patrocinador del evento, junto a la red de excelencia ReTeLe y el proyecto LioDi

El datathon ha consistido en una semana de seminarios y sesiones prácticas sobre los recursos y metodologías de la web semántica aplicados a los datos de naturaleza lingüística, como la generación y publicación de datos lingüísticos en RDF, el uso del modelo Lemon-Ontolex para representar información léxica o la aplicación del formato NIF.

 

Una de las partes más interesantes y activas del datathon ha sido el desarrollo por grupos de una serie de proyectos relacionados con el tratamiento de textos y datos lingüísticos con el objetivo de generar perfiles de aplicación y ontologías para la publicación de datos abiertos y enlazados referentes a la  lingüística (Linguistic Linked Open Data, LLOD). Los proyectos presentaban distintos retos en torno al modelado de datos lingüísticos, retos que abarcaban desde la desambiguación semántica al tratamiento de formas etimológicas o el enlazado de corpus en XML con diccionarios. Dos de las investigadoras participantes de nuestro laboratorio, Mariana Curando Malta y Helena Bermúdez Sabel formaron parte del equipo que ganó “Best miniproject award at  “

 

Como parte de una de las conferencias plenarias, Elena González Blanco García la Directora de LINHD e IP del proyecto ERC Starting Grant 2015 – POSTDATA (Poetry Standardization and Linked Open Data) ha presentado el proyecto como un caso práctico de modelado de información lingüística a través de datos abiertos y enlazados en la sesión inaugural del datathon.

Toda una maravillosa experiencia que se repite bianualmente en forma de taller en un idílico lugar de la sierra madrileña, Cercedilla. ¡Gracias OEG!

El proyecto POSTDATA se presenta en el workshop Crossing borders: Three talks on Text Analysis and Digital Humanities, 23 de Junio Paris

El Laboratorio de lingüística LaTTiCE de Paris, organizó el viernes 23 de junio un seminario titulado “Crossing borders : Three talks on Text Analysis and Digital Humanities”.

La conferencia ha tenido como invitados especiales a Melissa Terras, UCL (University College London), Caroline Sporleder, (University of Göttingen) y a Elena González-Blanco, UNED (Madrid) con la presentación: “From counting syllables to linked data. Interoperability and digital standardization as a new model to analyze European poetry : POSTDATA”.

El programa completo y la información sobre las charlas y los participantes se pude encontrar aquí.

El evento ha tenido lugar con ocasión de la defensa de la Tesis Doctoral de Pablo Ruiz Fabo, especialista en tecnologías del lenguaje y procesamiento del lenguaje natural que acaba de incorporarse al equipo de LINHD en el marco del proyecto de investigación europeo ERC POSTDATA.

 

 

 

Viajamos a Galway para participar en el LDK 2017

Del 19 al 20 de junio tuvo lugar en Galway, Irlanda, la primera edición del congreso Language, Data and Knowledge (LDK 2017). Este encuentro multidisciplinario que reunió investigadores e investigadoras que trabajan en la adquisición, tratamiento y aplicación de datos lingüísticos en el contexto de la ciencia de datos y de bases de conocimiento.

El congreso LDK ha sido concebido por un consorcio de investigadores del Insight Centre for Data Analytics, InfAI (University Leipzig) y Wolfgang Goethe University junto con un Comité Científico liderado por expertos en Procesamiento del Lenguaje Natural, Datos Enlazados y Web Semántica y Humanidades Digitales. Además, LDK cuenta con el apoyo de diferentes organizaciones internacionales entre las que destacan DBpedia, ACL SIGANN, Global Wordnet Association, CLARIN y Big Data Value Association (BDVA).

En el siguiente enlace están disponibles todos los artículos que fueron presentados durante el congreso.

Entre ellos se encuentra el artículo correspondiente a la participación de POSTDATA, Towards Interoperability in the European Poetry Community: The Standardization of Philological Concepts el cual ha sido premiado con el reconocimiento de “Best Student Paper”, gracias al excelente trabajo y puesta en escena de nuestra investigadora Helena Bermúdez Sabel y de todo el equipo de LINHD.

El artículo presenta la metodología seguida en el proceso de definición de los conceptos del modelo de datos que estamos desarrollando en POSTDATA, centrándose en los problemas que surgen al utilizar ciertos términos filológicos.

POSTDATA es un proyecto financiado por el Consej o Europeo de Investigacion ERC Starting Grant de  en humanidades digitales que busca comparar las distintas tradiciones poéticas utilizando la tecnología de la web semántica, que tiene como IP a Elena González Blanco García.

 

La próxima edición tendrá lugar en 2019 en Leipzig (Alemania).

El twitter del evento @LDK2017galway  y unas fotos

 

Asistimos a la Jornada en Madrid “10 años de ERC” organizada por la Fundación para el Conocimiento madri+d

Hoy, 12 de junio Madrid celebra los 10 años del ERC Research con una jornada que pretende contribuir a la difusión de las actividades del ERC y poner en valor la Comunidad de Madrid como una región atractiva para el desarrollo de los proyectos financiados por las convocatorias del ERC.

Este año se cumplen 10 años de la puesta en marcha del Consejo Europeo de Investigación (ERC), que significó un cambio profundo en la manera de abordar la financiación de la investigación europea favoreciendo proyectos en las fronteras del conocimiento y muy centrados en la figura del investigador como elemento clave y sustantivo del proceso de investigación científica.

Con este motivo, el ERC ha promovido la celebración de diferentes actos por toda Europa que ponga en valor este instrumento y sus resultados.

 

El evento ha sido organizado en el Real Jardín Botánico en Madrid y ha tenido invitados de lujo, entre los que destacan investigadores que han ganado ERC Grants en esta comunidad, además de personalidades relevantes en el ámbito de la política científica como Rafael van Grieken, Consejero de Educación, Juventud y Deporte de la Comunidad de Madrid, o Fernando Morán Director de la Fundación para el Conocimiento madri+d.

La jornada ha resultado altamente fructífera en términos de lo que el ERC supone tanto para investigadores como para instituciones y se han puesto sobre la mesa cuestiones tan importantes como la excelencia de este tipo de becas para la investigación de alto nivel en Europa, pero también se han comentado con profundidad los problemas que en España y en la Comunidad de Madrid se plantean, como las dificultades para atraer y mantener el talento, las dificultades de promoción y estabilización de los investigadores excelentes, la excesiva burocracia generada en nuestras instituciones, la escasez de políticas de reinversión de los overheads y la frustración que en muchos casos supone el luchar contra todos estos obstáculos.

Las instituciones ofrecen, por su parte, innovadoras políticas de estabilización, como la Universidad Complutense en su plan de promoción de ERC, o de reinversión de overheads, como en la Universidad Autónoma, abriendo vías e iniciativas que resultan prometedoras, pero requieren de mayor concienciación y estrategias políticas a nivel general para que el programa se convierta de verdad en el éxito que debería ser en España.

 

Puedes seguir detalladamente las intervenciones del evento en twitter en #ERC10yrs y #europamadrimasd

Empieza el POSTDATA Workshop: “Building a common model for semantic interoperability in the digital poetry ecosystems”

Nos complace anunciarles que mañana día 15 de marzo empieza el Workshop: “Building a common model for semantic interoperability in the digital poetry ecosystems”, organizado por LINHD en el ámbito del proyecto ERC POSTDATA: Poetry Standardization and Linked Open Data en la Facultad de Humanidades de la UNED.

El taller está organizado dentro de los eventos de la celebración de los 10 años de aniversario del European Research Council: ERC week and Beyond.

El taller está diseñado a lo largo de tres días con ponencias abiertas al público por las mañana y sesiones privadas de trabajo para el equipo y los socios del proyecto por la tarde.

 

El evento se retransmite en directo a través de este enlace:

Jornada sobre Humanidades Digitales organizada por la Biblioteca Nacional de España

Mañana, 14 de marzo tiene lugar el evento Proyectos de humanidades digitales en la BNE organizado por Biblioteca Nacional de España.

La Jornada es el primer encuentro que se organiza en la BNE sobre el tema de las humanidades digitales y el evento reúne a numerosos investigadores y proyectos para presentar sus trabajos de investigación y hablar sobre el marco digital que ofrecen las instituciones.

El evento se retransmite en directo a través de este enlace:

Este encuentro quiere reflexionar acerca de cómo la tecnología digital y el mundo de hoy está cambiando la forma de desarrollar trabajos de investigación y cuál es la situación actual de las humanidades digitales.

Nuestra directora Elena González Blanco García y también Presidenta de la Asociación de Humanidades digitales participará junto con Ramón Valdés, Universidad Autónoma de Barcelona, Sagrario López Poza, Universidad de A Coruña y José Manuel Lucía, Universidad Complutense de Madrid, como ponente en la mesa redonda:  “El impacto de la tecnología digital en las humanidades”.

Para más información, pueden consultar la agenda del evento aquí: