Presentación de trabajos de Helena Bermúdez Sabel y Sulema Rodríguez Roche

La investigadora e integrante de POSTDATA, Helena Bermúdez Sabel, junto a la profesora de la Universidad de la Habana, Sulema Rodríguez Roche, presentarán el próximo miércoles 11 de abril, sus trabajos de tesis doctoral en la Facultad de Ciencias Económicas y Empresariales de la UNED.

Moderado por la Profesora Clara Martínez Cantón, Helena Bermúdez presentarán su tesis sobre lingüística histórica y acdótica: edición digital del corpus trovadoresco gallego- portugués y, por su parte, Sulema Rodríguez, expondrá su trabajo sobre patrimonio digital cubano: propuesta de catálogo de datos enlazados para la Revista Infantil Pulgarcito, que ha realizado junto a Luis Miguel Rondón.

 

El evento tendrá lugar el 11 de abril en el salón ECO2 de la Facultad de Ciencias Económicas y Empresariales de 11 a 12hs.

 

 

 

Charla de José Manuel Fradejas Rueda: Estilometría, o lo que los números pueden contarnos de los textos

 

El martes 12 de diciembre, José Manuel Fradejas Rueda(Universidad de Valladolid) dará una charla titulada

“Estilometría, o lo que los números pueden contarnos de los textos”

El evento tendrá lugar el 12 de diciembre a las 10:15 en la Sala de juntas de la Facultad de Psicología de la UNED (Juan del Rosal, 10, Madrid).

José Manuel Fradejas es catedrático de Filología Románica en la Universidad de Valladolid. Sus líneas de investigación actuales comprenden la crítica textual, la lingüística histórica, la bibliografía, la Edición crítica de las Siete Partidas, la estilometría y el procesamiento de lenguaje natural. Ha editado textos castellanos, catalanes y portugueses de la Edad Media.

[Mapa] para el lugar del evento.


Resumen de la charla

La estilometría es el análisis estadístico del estilo literario. Lo que hacemos es reducir los textos a números y ver qué nos pueden contar que no nos cuentan tan solo las palabras. Es algo que los “científicos” han estado haciendo desde finales del siglo XIX. Desde entonces hasta ahora una sido un territorio explorado únicamente por los expertos en estadística. En esta comunicación mostraré que uno “de letras” puede hacerlo gracias a un lenguaje de programación llamado R y un montoncito de librerías que otros han programado y no solo puede hacerlo con textos del siglo XX y XXI, sino que puede utilizar los números para averiguar cosas sobre textos tan antiguos como las obras de Alfonso X, Ayala o la Celestina.

Picasso frontispiece Apollinaire Alcools

Charla de Anne-Sophie Bories: Sex, Wine and Statelessness. Apollinaire’s verse without borders in “Vendémiaire”

 

El viernes 24, Anne-Sophie Bories (Universidad de Basel) dará una charla titulada

Sex, Wine and Statelessness. Apollinaire’s verse without borders in “Vendémiaire”

El evento tendrá lugar el 24 de noviembre a las 10:00 en el Salón de Grados de la Facultad de Educación de la UNED (Juan del Rosal, 14, Madrid) y ha sido organizado por el proyecto POSTDATA.

Anne-Sophie Bories es investigadora en la Universidad de Basel. Recientemente ha organizado el congreso internacional Plotting Poetry / Machiner la poésie. Este congreso busca discutir enfoques computacionales al análisis de poesía, así como una evaluación crítica de la contribución de las herramientas informáticas al estudio de la poesía. Se trata de intereses cercanos a los objetivos de nuestro proyecto, POSTDATA, y de hecho pudimos asistir a Plotting Poetry este año.

Un resumen de la charla y más información sobre el trabajo de Anne-Sophie Bories se encuentran a continuación.

[Mapa] para el lugar del evento.


RESUMEN

Apollinaire gladly disrupts borders or many kinds. He disregards the boundaries of morality and good taste with his playful pornography and outrageous wit. He oversteps the limits of verse with his Calligrammes. He suppresses the nicely delineating punctuation from his poems. He bridges the prose-poetry gap by cutting up his own prose to create Retour de la maison des morts. He brings together free and strict verse in the same space, circulating between the two with no formal break.

“Vendémiaire” (Alcools, 1913), titled after the French Revolutionary Calendar’s windy month of grape-harvest, is an exemplary specimen of this liberty. It glorifies France and Paris, goes on to call for internationalism, wine and sex, all the way to a “universelle ivrognerie”. The versification follows a similar pattern, intially slipping from strict alexandrines to free verse, then back and forth until the two become closely blended. “Vendémiaire” offer a typical illustration of how Apollinaire rejects geographic limitations, with a somewhat naïve fantasy seeing all rivers of the world collide into one welcoming Paris.

“j’ai soif villes de France et d’Europe et du monde
venez toutes couler dans ma gorge profonde”

These two lines are soon followed by the notion of “vin pur”, making drunkenness a sacred state, and thirst a form of chastity. The sexual undertone of this “chanson de Paris” adds further texture to the mix, conjuring overlapping images of the city as a large-chested, enticing working-girl eager for oral sex and reckless partying. Such an overpowering, cosmopolitan, hypersexualized feminine figure is an undeniable allusion to his mother, the aristocratic, Polish-Russian, Vatican demimondaine dragging her stateless children across Europe and to Paris.

I shall combine close and distant readings, focussing my analyses on Apollinaire’s versification choices and their importance in the construction of meaning. The skilful oscillation of “Vendémiaire”’s versification, between the very strict and the very lax, just as the tone and contents of the poem blend piety and outrageousness, draws, in fine, an intimate image of the poet in his rootlessness, in his ambivalence towards any culturally or geographically fixed ethos, convention or limitation; for Apollinaire hovers, inevitably, on the border.


PONENTE

Anne-Sophie Bories es doctora por la Universidad Paris 3, y ha realizado estancias de investigación en UC Berkeley y la Universidad de Leeds. Para su tesis doctoral elaboró una amplia base de datos sobre la versificación de Raymond Queneau, aplicándola para procesos hermenéuticos. Su primer libro, Des Chiffres et de mètres [Cifras y metros] está en proceso de publicación, y se trata de un estudio de la versificación de Queneau. También ha publicado artículos de investigación sobre este tema. Anne-Sophie Bories se interesa sobre todo por aspectos formales de la poesía y ha recibido una subvención de la Swiss National Science Foundation para un proyecto sobre el verso libre, que está desarrollando en el Departamento de francés de la Universidad de Basel. A través de la combinación de minería de textos (text-mining) y lecturas tradicionales, su investigación busca patrones en un amplio corpus de verso libre, en colaboración con los laboratorios ATILF (Nancy), CRISCO (Caen) y DHLab (Basel).

Crónica del curso de verano DH@Madrid Summer School 2017

Bajo el título Tecnologías semánticas y herramientas lingüísticas para humanidades digitales/Semantic web technologies and language resoruces for digital humanities, por tercer año consecutivo la DH@Madrid Summer School 2017 de la UNED ha sido un hervidero de ideas y conocimientos sobre distintos métodos digitales de investigación aplicados a las Humanidades. Investigadores en Filología y Humanidades Digitales han podido aprender una gran variedad de herramientas tecnológicas con las que poder posicionar sus proyectos de investigación en el centro del actual contexto académico digital.

Los contenidos de este curso que, de nuevo, han podido seguirse de forma presencial y online, y a los que se podrá acceder en diferido, se han centrado en las tecnologías del lenguaje y, fundamentalmente, en las tecnologías semánticas. El curso de verano de Humanidades Digitales 2017 que está avalado por la infraestructura europea de investigación CLARIN, ha sido cofinanciado por uno de los proyectos que desarrolla el LINHD: POSDATA, que precisamente está basado en la aplicación de procedimientos semánticos para crear un modelo único que haga interoperables los datos pertenecientes a las distintas tradiciones poéticas.

Durante los tres días que ha durado el curso, eminentemente práctico, se ha demostrado la aplicación a proyectos de Humanidades de tecnologías como el lenguaje de programación R, especialmente para estudios de estilometría o métodos como las expresiones regulares.

La tarde del lunes se cerró trabajando sobre metadatos y testando el entorno virtual de investigación EVILINHD para la inclusión de esquemas de metadatos y vocabularios controlados. Aparte de las sesiones prácticas, también ha habido espacio para repasar los fundamentos de las Humanidades Digitales y seguir la trayectoria personal de mano de Susan Schreibman en la conferencia plenaria que abrió la mañana del miércoles.

Para todos aquellos que no conocían, o sabían poco acerca de la infraestructura CLARIN, se pudo visualizar su trabajo en la presentación de los proyectos de los centros Clarin-K españoles.

Los métodos y conceptos asociados a Linked Open Data estuvieron presentes a lo largo de todo el curso de verano, pero fue el último día cuando las sesiones se centraron en casos concretos de utilización los datos abiertos y enlazados en las Humanidades.

 

 

Participamos en el datathon SD-LLOD de Cercedilla

La semana pasada se celebró la segunda edición del Datathon en Linguistic Linked Open Data (SD-LLOD) en Cercedilla organizado por el Ontology Engineering Group de la Universidad Politécnica de Madrid y en el que ha participado un grupo de investigadores de POSTDATA, proyecto patrocinador del evento, junto a la red de excelencia ReTeLe y el proyecto LioDi

El datathon ha consistido en una semana de seminarios y sesiones prácticas sobre los recursos y metodologías de la web semántica aplicados a los datos de naturaleza lingüística, como la generación y publicación de datos lingüísticos en RDF, el uso del modelo Lemon-Ontolex para representar información léxica o la aplicación del formato NIF.

 

Una de las partes más interesantes y activas del datathon ha sido el desarrollo por grupos de una serie de proyectos relacionados con el tratamiento de textos y datos lingüísticos con el objetivo de generar perfiles de aplicación y ontologías para la publicación de datos abiertos y enlazados referentes a la  lingüística (Linguistic Linked Open Data, LLOD). Los proyectos presentaban distintos retos en torno al modelado de datos lingüísticos, retos que abarcaban desde la desambiguación semántica al tratamiento de formas etimológicas o el enlazado de corpus en XML con diccionarios. Dos de las investigadoras participantes de nuestro laboratorio, Mariana Curando Malta y Helena Bermúdez Sabel formaron parte del equipo que ganó “Best miniproject award at  “

 

Como parte de una de las conferencias plenarias, Elena González Blanco García la Directora de LINHD e IP del proyecto ERC Starting Grant 2015 – POSTDATA (Poetry Standardization and Linked Open Data) ha presentado el proyecto como un caso práctico de modelado de información lingüística a través de datos abiertos y enlazados en la sesión inaugural del datathon.

Toda una maravillosa experiencia que se repite bianualmente en forma de taller en un idílico lugar de la sierra madrileña, Cercedilla. ¡Gracias OEG!

El proyecto POSTDATA se presenta en el workshop Crossing borders: Three talks on Text Analysis and Digital Humanities, 23 de Junio Paris

El Laboratorio de lingüística LaTTiCE de Paris, organizó el viernes 23 de junio un seminario titulado “Crossing borders : Three talks on Text Analysis and Digital Humanities”.

La conferencia ha tenido como invitados especiales a Melissa Terras, UCL (University College London), Caroline Sporleder, (University of Göttingen) y a Elena González-Blanco, UNED (Madrid) con la presentación: “From counting syllables to linked data. Interoperability and digital standardization as a new model to analyze European poetry : POSTDATA”.

El programa completo y la información sobre las charlas y los participantes se pude encontrar aquí.

El evento ha tenido lugar con ocasión de la defensa de la Tesis Doctoral de Pablo Ruiz Fabo, especialista en tecnologías del lenguaje y procesamiento del lenguaje natural que acaba de incorporarse al equipo de LINHD en el marco del proyecto de investigación europeo ERC POSTDATA.

 

 

 

Viajamos a Galway para participar en el LDK 2017

Del 19 al 20 de junio tuvo lugar en Galway, Irlanda, la primera edición del congreso Language, Data and Knowledge (LDK 2017). Este encuentro multidisciplinario que reunió investigadores e investigadoras que trabajan en la adquisición, tratamiento y aplicación de datos lingüísticos en el contexto de la ciencia de datos y de bases de conocimiento.

El congreso LDK ha sido concebido por un consorcio de investigadores del Insight Centre for Data Analytics, InfAI (University Leipzig) y Wolfgang Goethe University junto con un Comité Científico liderado por expertos en Procesamiento del Lenguaje Natural, Datos Enlazados y Web Semántica y Humanidades Digitales. Además, LDK cuenta con el apoyo de diferentes organizaciones internacionales entre las que destacan DBpedia, ACL SIGANN, Global Wordnet Association, CLARIN y Big Data Value Association (BDVA).

En el siguiente enlace están disponibles todos los artículos que fueron presentados durante el congreso.

Entre ellos se encuentra el artículo correspondiente a la participación de POSTDATA, Towards Interoperability in the European Poetry Community: The Standardization of Philological Concepts el cual ha sido premiado con el reconocimiento de “Best Student Paper”, gracias al excelente trabajo y puesta en escena de nuestra investigadora Helena Bermúdez Sabel y de todo el equipo de LINHD.

El artículo presenta la metodología seguida en el proceso de definición de los conceptos del modelo de datos que estamos desarrollando en POSTDATA, centrándose en los problemas que surgen al utilizar ciertos términos filológicos.

POSTDATA es un proyecto financiado por el Consej o Europeo de Investigacion ERC Starting Grant de  en humanidades digitales que busca comparar las distintas tradiciones poéticas utilizando la tecnología de la web semántica, que tiene como IP a Elena González Blanco García.

 

La próxima edición tendrá lugar en 2019 en Leipzig (Alemania).

El twitter del evento @LDK2017galway  y unas fotos

 

Asistimos a la Jornada en Madrid “10 años de ERC” organizada por la Fundación para el Conocimiento madri+d

Hoy, 12 de junio Madrid celebra los 10 años del ERC Research con una jornada que pretende contribuir a la difusión de las actividades del ERC y poner en valor la Comunidad de Madrid como una región atractiva para el desarrollo de los proyectos financiados por las convocatorias del ERC.

Este año se cumplen 10 años de la puesta en marcha del Consejo Europeo de Investigación (ERC), que significó un cambio profundo en la manera de abordar la financiación de la investigación europea favoreciendo proyectos en las fronteras del conocimiento y muy centrados en la figura del investigador como elemento clave y sustantivo del proceso de investigación científica.

Con este motivo, el ERC ha promovido la celebración de diferentes actos por toda Europa que ponga en valor este instrumento y sus resultados.

 

El evento ha sido organizado en el Real Jardín Botánico en Madrid y ha tenido invitados de lujo, entre los que destacan investigadores que han ganado ERC Grants en esta comunidad, además de personalidades relevantes en el ámbito de la política científica como Rafael van Grieken, Consejero de Educación, Juventud y Deporte de la Comunidad de Madrid, o Fernando Morán Director de la Fundación para el Conocimiento madri+d.

La jornada ha resultado altamente fructífera en términos de lo que el ERC supone tanto para investigadores como para instituciones y se han puesto sobre la mesa cuestiones tan importantes como la excelencia de este tipo de becas para la investigación de alto nivel en Europa, pero también se han comentado con profundidad los problemas que en España y en la Comunidad de Madrid se plantean, como las dificultades para atraer y mantener el talento, las dificultades de promoción y estabilización de los investigadores excelentes, la excesiva burocracia generada en nuestras instituciones, la escasez de políticas de reinversión de los overheads y la frustración que en muchos casos supone el luchar contra todos estos obstáculos.

Las instituciones ofrecen, por su parte, innovadoras políticas de estabilización, como la Universidad Complutense en su plan de promoción de ERC, o de reinversión de overheads, como en la Universidad Autónoma, abriendo vías e iniciativas que resultan prometedoras, pero requieren de mayor concienciación y estrategias políticas a nivel general para que el programa se convierta de verdad en el éxito que debería ser en España.

 

Puedes seguir detalladamente las intervenciones del evento en twitter en #ERC10yrs y #europamadrimasd

La Biblioteca Nacional de España apuesta por las Humanidades Digitales: lanzamiento de BNElab y curso de TEI a cargo de LINHD

 

Esta semana, la Biblioteca Nacional de España ha lanzado una nueva iniciativa, el BNElab. Se trata de un proyecto, en colaboración con www.red.es en el que la institución centenaria se lanza hacia la innovación con desarrollos tecnológicos que, aplicados a sus tesoros culturales, prometen marcar antes y un después en las Humanidades Digitales en España: desde un generador automático de piezas musicales a un laboratorio de cocina, pasando por un generador de ePubs hasta un juego de rol que intriga hasta los usuarios más avezados. Más información sobre el evento de lanzamiento aquí.

Además, coincidiendo en fechas, esta semana hemos impartido desde LINHD un curso de Introducción a la Edición Digital Académica y Marcado de textos en TEI-XML al personal de la BNE, que desde su conocimiento de la documentación en áreas como incunables, revistas  y repositorios digitales, ha visto el potencial de la aplicación de estas tecnologías a sus ya existentes recursos previendo posibles desarrollos futuros de sus plataformas e infraestructuras hacia las Humanidades Digitales. Todo un reto muy actual en el que la Biblioteca está jugando un papel esencial en el impulso de la tecnologización de las humanidades y de la cultura. Habrá más que contar pronto, estamos seguros!…

Presentación del Catálogo Internacional de Textos Escolares de Centro de Investigación MANES en la UNED

El próximo miércoles 17 de mayo, el Centro de Investigación MANES de la UNED presentará el Catálogo Internacional de Textos Escolares, que ha sido elaborado en colaboración con el Georg Eckert Institute for International Textbook Research (Alemania) y la Universidad de Turín, con el apoyo técnico del Laboratorio de Humanidades Digitales de la UNED. La presentación tendrá lugar en el Salón de Actos de la Facultad de Educación de la UNED, a las 12:00 horas.

Este proyecto, que ha sido financiado por el Niedersaechsisches Ministerium für Wissenschaft und Kultur (Alemania), ha hecho posible la actualización de la Base de Datos MANES, un catálogo colectivo elaborado por el Centro de Investigación MANES de la UNED, que cuenta hasta la fecha con aproximadamente 35.000 registros de textos escolares de los siglos XIX al XXI de España, Portugal, Bélgica y América Latina. Es una base de datos colaborativa en la cual se han catalogado fondos de bibliotecas públicas, instituciones de enseñanza y colecciones particulares.

El Catálogo Internacional de Textos Escolares (International TextbookCat) es un instrumento de investigación y una herramienta de búsqueda que optimiza la recuperación de información dentro de una amplia colección internacional de libros de texto. Un sistema de clasificación interna, adoptado por los distintos catálogos nacionales, categoriza los textos por países en los que han sido usados, por nivel educativo y por materia, facilitando así la investigación y el acceso especializado a la información.

Se trata de un proyecto piloto que incluye en esta primera fase la biblioteca del Instituto Georg Eckert, la Base de Datos EDISCO de textos escolares italianos, la Base de Datos MANES y en un futuro próximo el catálogo del Fondo MANES de la Biblioteca de la UNED.  El Laboratorio de Innovación en Humanidades Digitales de la UNED ha llevado a cabo la conversión de las bases de datos MANES y EDISCO al sistema de gestión bibliotecaria KOHA, compatible con el catálogo del Georg Eckert Institut.

Los planes de futuro, que se discutirán en Madrid por parte de los expertos alemanes, italianos y españoles que participarán en la presentación del  International TextbookCat, consisten en  una ampliación a América Latina del proyecto piloto, creando una herramienta de investigación integrada en la que la base de datos MANES tendrá un protagonismo especial por ofrecer una infraestructura ya elaborada y depurada para la catalogación de textos escolares en lengua española.