Crónica del curso de verano DH@Madrid Summer School 2017

Bajo el título Tecnologías semánticas y herramientas lingüísticas para humanidades digitales/Semantic web technologies and language resoruces for digital humanities, por tercer año consecutivo la DH@Madrid Summer School 2017 de la UNED ha sido un hervidero de ideas y conocimientos sobre distintos métodos digitales de investigación aplicados a las Humanidades. Investigadores en Filología y Humanidades Digitales han podido aprender una gran variedad de herramientas tecnológicas con las que poder posicionar sus proyectos de investigación en el centro del actual contexto académico digital.

Los contenidos de este curso que, de nuevo, han podido seguirse de forma presencial y online, y a los que se podrá acceder en diferido, se han centrado en las tecnologías del lenguaje y, fundamentalmente, en las tecnologías semánticas. El curso de verano de Humanidades Digitales 2017 que está avalado por la infraestructura europea de investigación CLARIN, ha sido cofinanciado por uno de los proyectos que desarrolla el LINHD: POSDATA, que precisamente está basado en la aplicación de procedimientos semánticos para crear un modelo único que haga interoperables los datos pertenecientes a las distintas tradiciones poéticas.

Durante los tres días que ha durado el curso, eminentemente práctico, se ha demostrado la aplicación a proyectos de Humanidades de tecnologías como el lenguaje de programación R, especialmente para estudios de estilometría o métodos como las expresiones regulares.

La tarde del lunes se cerró trabajando sobre metadatos y testando el entorno virtual de investigación EVILINHD para la inclusión de esquemas de metadatos y vocabularios controlados. Aparte de las sesiones prácticas, también ha habido espacio para repasar los fundamentos de las Humanidades Digitales y seguir la trayectoria personal de mano de Susan Schreibman en la conferencia plenaria que abrió la mañana del miércoles.

Para todos aquellos que no conocían, o sabían poco acerca de la infraestructura CLARIN, se pudo visualizar su trabajo en la presentación de los proyectos de los centros Clarin-K españoles.

Los métodos y conceptos asociados a Linked Open Data estuvieron presentes a lo largo de todo el curso de verano, pero fue el último día cuando las sesiones se centraron en casos concretos de utilización los datos abiertos y enlazados en las Humanidades.

 

 

Participamos en el datathon SD-LLOD de Cercedilla

La semana pasada se celebró la segunda edición del Datathon en Linguistic Linked Open Data (SD-LLOD) en Cercedilla organizado por el Ontology Engineering Group de la Universidad Politécnica de Madrid y en el que ha participado un grupo de investigadores de POSTDATA, proyecto patrocinador del evento, junto a la red de excelencia ReTeLe y el proyecto LioDi

El datathon ha consistido en una semana de seminarios y sesiones prácticas sobre los recursos y metodologías de la web semántica aplicados a los datos de naturaleza lingüística, como la generación y publicación de datos lingüísticos en RDF, el uso del modelo Lemon-Ontolex para representar información léxica o la aplicación del formato NIF.

 

Una de las partes más interesantes y activas del datathon ha sido el desarrollo por grupos de una serie de proyectos relacionados con el tratamiento de textos y datos lingüísticos con el objetivo de generar perfiles de aplicación y ontologías para la publicación de datos abiertos y enlazados referentes a la  lingüística (Linguistic Linked Open Data, LLOD). Los proyectos presentaban distintos retos en torno al modelado de datos lingüísticos, retos que abarcaban desde la desambiguación semántica al tratamiento de formas etimológicas o el enlazado de corpus en XML con diccionarios. Dos de las investigadoras participantes de nuestro laboratorio, Mariana Curando Malta y Helena Bermúdez Sabel formaron parte del equipo que ganó “Best miniproject award at  “

 

Como parte de una de las conferencias plenarias, Elena González Blanco García la Directora de LINHD e IP del proyecto ERC Starting Grant 2015 – POSTDATA (Poetry Standardization and Linked Open Data) ha presentado el proyecto como un caso práctico de modelado de información lingüística a través de datos abiertos y enlazados en la sesión inaugural del datathon.

Toda una maravillosa experiencia que se repite bianualmente en forma de taller en un idílico lugar de la sierra madrileña, Cercedilla. ¡Gracias OEG!

El proyecto POSTDATA se presenta en el workshop Crossing borders: Three talks on Text Analysis and Digital Humanities, 23 de Junio Paris

El Laboratorio de lingüística LaTTiCE de Paris, organizó el viernes 23 de junio un seminario titulado “Crossing borders : Three talks on Text Analysis and Digital Humanities”.

La conferencia ha tenido como invitados especiales a Melissa Terras, UCL (University College London), Caroline Sporleder, (University of Göttingen) y a Elena González-Blanco, UNED (Madrid) con la presentación: “From counting syllables to linked data. Interoperability and digital standardization as a new model to analyze European poetry : POSTDATA”.

El programa completo y la información sobre las charlas y los participantes se pude encontrar aquí.

El evento ha tenido lugar con ocasión de la defensa de la Tesis Doctoral de Pablo Ruiz Fabo, especialista en tecnologías del lenguaje y procesamiento del lenguaje natural que acaba de incorporarse al equipo de LINHD en el marco del proyecto de investigación europeo ERC POSTDATA.

 

 

 

Viajamos a Galway para participar en el LDK 2017

Del 19 al 20 de junio tuvo lugar en Galway, Irlanda, la primera edición del congreso Language, Data and Knowledge (LDK 2017). Este encuentro multidisciplinario que reunió investigadores e investigadoras que trabajan en la adquisición, tratamiento y aplicación de datos lingüísticos en el contexto de la ciencia de datos y de bases de conocimiento.

El congreso LDK ha sido concebido por un consorcio de investigadores del Insight Centre for Data Analytics, InfAI (University Leipzig) y Wolfgang Goethe University junto con un Comité Científico liderado por expertos en Procesamiento del Lenguaje Natural, Datos Enlazados y Web Semántica y Humanidades Digitales. Además, LDK cuenta con el apoyo de diferentes organizaciones internacionales entre las que destacan DBpedia, ACL SIGANN, Global Wordnet Association, CLARIN y Big Data Value Association (BDVA).

En el siguiente enlace están disponibles todos los artículos que fueron presentados durante el congreso.

Entre ellos se encuentra el artículo correspondiente a la participación de POSTDATA, Towards Interoperability in the European Poetry Community: The Standardization of Philological Concepts el cual ha sido premiado con el reconocimiento de “Best Student Paper”, gracias al excelente trabajo y puesta en escena de nuestra investigadora Helena Bermúdez Sabel y de todo el equipo de LINHD.

El artículo presenta la metodología seguida en el proceso de definición de los conceptos del modelo de datos que estamos desarrollando en POSTDATA, centrándose en los problemas que surgen al utilizar ciertos términos filológicos.

POSTDATA es un proyecto financiado por el Consej o Europeo de Investigacion ERC Starting Grant de  en humanidades digitales que busca comparar las distintas tradiciones poéticas utilizando la tecnología de la web semántica, que tiene como IP a Elena González Blanco García.

 

La próxima edición tendrá lugar en 2019 en Leipzig (Alemania).

El twitter del evento @LDK2017galway  y unas fotos

 

Asistimos a la Jornada en Madrid “10 años de ERC” organizada por la Fundación para el Conocimiento madri+d

Hoy, 12 de junio Madrid celebra los 10 años del ERC Research con una jornada que pretende contribuir a la difusión de las actividades del ERC y poner en valor la Comunidad de Madrid como una región atractiva para el desarrollo de los proyectos financiados por las convocatorias del ERC.

Este año se cumplen 10 años de la puesta en marcha del Consejo Europeo de Investigación (ERC), que significó un cambio profundo en la manera de abordar la financiación de la investigación europea favoreciendo proyectos en las fronteras del conocimiento y muy centrados en la figura del investigador como elemento clave y sustantivo del proceso de investigación científica.

Con este motivo, el ERC ha promovido la celebración de diferentes actos por toda Europa que ponga en valor este instrumento y sus resultados.

 

El evento ha sido organizado en el Real Jardín Botánico en Madrid y ha tenido invitados de lujo, entre los que destacan investigadores que han ganado ERC Grants en esta comunidad, además de personalidades relevantes en el ámbito de la política científica como Rafael van Grieken, Consejero de Educación, Juventud y Deporte de la Comunidad de Madrid, o Fernando Morán Director de la Fundación para el Conocimiento madri+d.

La jornada ha resultado altamente fructífera en términos de lo que el ERC supone tanto para investigadores como para instituciones y se han puesto sobre la mesa cuestiones tan importantes como la excelencia de este tipo de becas para la investigación de alto nivel en Europa, pero también se han comentado con profundidad los problemas que en España y en la Comunidad de Madrid se plantean, como las dificultades para atraer y mantener el talento, las dificultades de promoción y estabilización de los investigadores excelentes, la excesiva burocracia generada en nuestras instituciones, la escasez de políticas de reinversión de los overheads y la frustración que en muchos casos supone el luchar contra todos estos obstáculos.

Las instituciones ofrecen, por su parte, innovadoras políticas de estabilización, como la Universidad Complutense en su plan de promoción de ERC, o de reinversión de overheads, como en la Universidad Autónoma, abriendo vías e iniciativas que resultan prometedoras, pero requieren de mayor concienciación y estrategias políticas a nivel general para que el programa se convierta de verdad en el éxito que debería ser en España.

 

Puedes seguir detalladamente las intervenciones del evento en twitter en #ERC10yrs y #europamadrimasd

Empieza el POSTDATA Workshop: “Building a common model for semantic interoperability in the digital poetry ecosystems”

Nos complace anunciarles que mañana día 15 de marzo empieza el Workshop: “Building a common model for semantic interoperability in the digital poetry ecosystems”, organizado por LINHD en el ámbito del proyecto ERC POSTDATA: Poetry Standardization and Linked Open Data en la Facultad de Humanidades de la UNED.

El taller está organizado dentro de los eventos de la celebración de los 10 años de aniversario del European Research Council: ERC week and Beyond.

El taller está diseñado a lo largo de tres días con ponencias abiertas al público por las mañana y sesiones privadas de trabajo para el equipo y los socios del proyecto por la tarde.

 

El evento se retransmite en directo a través de este enlace:

Jornada sobre Humanidades Digitales organizada por la Biblioteca Nacional de España

Mañana, 14 de marzo tiene lugar el evento Proyectos de humanidades digitales en la BNE organizado por Biblioteca Nacional de España.

La Jornada es el primer encuentro que se organiza en la BNE sobre el tema de las humanidades digitales y el evento reúne a numerosos investigadores y proyectos para presentar sus trabajos de investigación y hablar sobre el marco digital que ofrecen las instituciones.

El evento se retransmite en directo a través de este enlace:

Este encuentro quiere reflexionar acerca de cómo la tecnología digital y el mundo de hoy está cambiando la forma de desarrollar trabajos de investigación y cuál es la situación actual de las humanidades digitales.

Nuestra directora Elena González Blanco García y también Presidenta de la Asociación de Humanidades digitales participará junto con Ramón Valdés, Universidad Autónoma de Barcelona, Sagrario López Poza, Universidad de A Coruña y José Manuel Lucía, Universidad Complutense de Madrid, como ponente en la mesa redonda:  “El impacto de la tecnología digital en las humanidades”.

Para más información, pueden consultar la agenda del evento aquí:

8 de Marzo – Día de la mujer: una nota sobre mujeres y Humanidades Digitales

Hoy celebramos el día de la mujer trabajadora en el mundo y no hay que olvidar de las mujeres que trabajan o han trabajado en ciencia y en humanidades digitales. Hoy se están leyendo muchos mensajes en las redes sobre mujeres y tecnología, mujeres y universidad, mujeres y trabajo, pero … ¿mujeres y humanidades digitales?

En LINHD nos hemos dado cuenta de que, contrariamente a las estadísticas, nuestro equipo está formado por una mayoría femenina, que sirve para dar la vuelta a las estadísticas. ¡Estupendo!

y enhorabuena especialmente a Elena González Blanco, Clara Martínez Cantón, Susanna Allés, Helena Bermúdez Sabel, Mariana Curado Malta, María Luisa Díez Platas, Patricia Garrido Teixeira, Mara Manailescu, Gimena del Río y Llanos Tobarra

Queremos retomar y citar aquí el estupendo artículo de una de nuestras principales colaboradoras, la Doctora Gimena del Rio Riande investigadora en CAICYT-CONICET, Argentina y Vicepresidenta de la Asociación Argentina de Humanidades Digitales (AAHD) que habla sobre la importancia de las mujeres en el mundo digital y de la investigación: #8M Mujeres y Humanidades Digitales.

 

 

WORKSHOP del proyecto POSTDATA: hacia la interoperabilidad en poesía, web semántica y vocabularios controlados

Desde LINHD estamos orgullosos de anunciar el primer Workshop del proyecto ERC POSTDATA: Poetry Standardization and Linked Open Data: “Building a common model for semantic interoperability in the digital poetry ecosystems”.

El Workshop tendrá lugar entre los días 15 y 17 de marzo de 2017 en la Facultad de Humanidades de la UNED,  y será organizado por el LINHD dentro de los eventos de la celebración de los 10 años de European Research Council: ERC week and Beyond.

Los invitados al taller son los representantes de 10 bases de datos, de los 25 con los que el equipo de POSTDATA colabora, relación que viene ya desde proyectos anteriores como DIREPO. Se trata de proyectos poéticos de larga andadura y tradición que llevan trabajando en el ámbito en diferentes lenguas y con distintas aproximaciones para recopilar información que permita crear un modelo conceptual Común. El taller está diseñado a lo largo de tres días con ponencias abiertas al público por las mañana y sesiones privadas de trabajo para el equipo y los socios del proyecto por la tarde.

 

La apertura del evento la llevará a cabo el Decano de la Facultad de Filología, sede organizadora del evento, D. Julio Francisco Neira, y seguirá con la presentación de POSTDATA por la IP del proyecto Elena González Blanco García.

La primera parte del taller marca como objetivo  probar el modelo conceptual común para poesía en un ecosistema digital. El desarrollo de este modelo conceptual común forma parte de un proyecto más grande que definirá un perfil de aplicación de metadatos (PAM): un modelo semántico para ser utilizado  en el ecosistema de los datos abiertos enlazados (DAE). Este PAM abrirá las puertas hacia la interoperabilidad entre objetos digitales de poesía. Esta parte será presentada por las investigadoras Mariana Curado Malta y Helena Bermúdez Sabel.

La segunda parte del workshop estará dedicada a “El papel de los vocabularios controlados en entornos digitales”, y será impartida por Gimena del Río Riande y Diego Ferreyra (CONICET, Argentina), investigadores también en le equipo del proyecto que colaboran desde Argentina y estarán a cargo de esta sección. Los vocabularios controlados (VC) constituyen en la actualidad estructuras socio-cognitivas que permiten el establecimiento de representaciones lingüísticas formales del conocimiento y la formalización de dominios conceptuales y su utilización, generación y clasificación se encuentra cada vez más extendida en el ámbito de las humanidades digitales y ciencias sociales.

El taller finalizará con una evaluación de los resultados de las pruebas y conclusiones que retroalimentarán el proceso de desarrollo del modelo conceptual y los vocabularios controlados de POSTDATA.

Más información sobre el evento e inscripciones se pueden encontrar en la página de POSTDATA WORKSHOP.

Patrocinadores del evento:

 

Proyectos financiadores del evento: ERC Starting Grant Poetry Standardization and Linked Open Data: POSTDATA (ERC-2015-STG-679528); Repertorio Digital de Poesía Europea: DIREPO (Acción Europa Investiga EUIN2013-50630) ; Laboratorio de Innovación en Humanidades Digitales: Edición Digital, Datos Enlazados y Entorno Virtual de Investigación para el trabajo en humanidades (FFI2014-57961-R).

 

POSTDATA se presenta en el workshop “Digital Humanities and Digital Curation” en el seno del congreso internacional “Metadata & Semantics Research”

El congreso anual “Metadata & Semantics Research” (MTSR) se ha celebrado entre los días 22 y 25 de noviembre de 2016 en la UniversitätsBibliothek de Göttingen, reuniendo a académicos y profesionales con interés común en los campos interdisciplinares de metadatos, datos y semántica. Se trata de un congreso internacional anual que ofrece una oportunidad para que los participantes compartan conocimientos y nuevos enfoques en la implementación de tecnologías semánticas a través de diversos tipos de entornos y aplicaciones de información.

Este año la MTSR organizó por la primera vez un taller de humanidades digitales y curación digital (DHC). Este taller contó con la participación de tres “full papers” en el campo de las humanidades digitales y otros tres en el campo de la curación digital en un proceso de blind-peer-review. El proyecto POSTDATA de LINHD fue uno de los tres papers de humanidades digitales escogido: “Digital repertoires of poetry metrics: towards a Linked Open Data ecosystem”. El programa completo del taller se puede consultar aquí.

La investigadora de LINHD Maria Curado Malta, miembro del equipo investigador del proyecto presentó el paper durante 15 minutos, seguidos de 5 minutos de preguntas, en las que se planteó una discusión sobre la cuestión de cómo implementar tecnológicamente la transformación de los datos de las base de datos relacionales y de XML de los stakeholders del proyecto para LOD con el modelo semántico que se está desarrollando en POSTDATA.

En el final del taller hubo una discusión dinamizada por el moderador con los autores de los papers como participantes, sobre el sentido de continuar ofreciendo un taller de DHC en el congreso MTSR. ¿Las humanidades necesitan lo digital? No es el término “humanidades” demasiado general, ¿por qué no “arqueología digital”, “poesía digital”, etc. – qué ganamos por juntar todo y trabajar de forma colaborativa e interdisciplinar? Estas y otras fueran algunas de las interesantes preguntas que se plantearon a lo largo del debate.