Entradas

El proyecto Postdata en la Conferencia Anual de CLARIN

La Conferencia Anual de CLARIN fue organizada CLARIN ERIC, en colaboración con el Instituto de Lingüística Computacional (ILC) que forma parte del Departamento de Ciencias Sociales y Humanidades, Patrimonio Cultural (DSU) del Consejo Nacional de Investigación de Italia (CNR)

CLARIN2018 tuvo como objetivo intercambiar ideas y experiencias acerca del funcionamiento y servicios de CLARIN, así como su utilidad por parte de la comunidad de investigadores y su relación con otras infraestructuras y proyectos.

Del encuentro han participado Elena González-Blanco, directora general de CoverWallet en Europa e Investigadora principal de POSTDATA y Salvador Ros, Coordinador del proyecto DESIR y coordinador técnico de POSTADATA. Los principales resultados y herramientas del proyecto se han presentado durante el evento https://zenodo.org/record/1465501#.W8m8a0szbIU .

Las herramientas de poesía están destinadas a ser un mercado de código abierto donde se encuentran diferentes herramientas para procesar poesía desde la detección del modelo de poesía hasta procesos semánticos más complejos. Pero no solo está dedicado a los procesos de poesía, sino a cualquier proceso que mejore y permita una comprensión más profunda de la misma.

Las herramientas de POSTDATA que fueron presentadas son ANJA y HISMETAG. Una está relacionada con el concepto de enjambment y la segunda está relacionada con el reconocimiento de las entidades nombradas en los textos medievales.

Para más información del proyecto POSTDATA podéis visitar:

http://postdata.linhd.es

 

 

¿Cómo desarrollar una aplicación iOS en Suecia? (Parte 1)

Como es trabajar en Suecia como Senior iOS Engineer para programar apps en lenguaje Swift. ¿Por qué es importante Suecia para el desarrollo de aplicaciones?

A continuación, os presentamos una serie de nueve posts, que nos permitirán obtener una visión clara de como es trabajar en Suecia, para un Senior iOS Engineer, para programar apps con el lenguaje Swift. Lo que coloquialmente denominamos desarrollo de aplicaciones en iOS para iPhone e iPad. Toda una experiencia que nos cuenta Ginés Sánchez Meroño. Os dejamos el primer post.

Todos tenemos objetivos que conseguir en la vida. Unas veces están cerca de nosotros y en otras hay que salir de la zona de confort para conseguirlos. Suecia es un país con una gran cultura tecnológica. Siempre ha habido una afinidad cultural entre los suecos y las suecas por la cultura española, la fiesta, la creatividad y el sol. De igual forma, en España ha existido atracción hacia los suecos y las suecas, su naturaleza y su cultura vanguardista.

Te quiero presentar a Ginés, un hombre valiente, decidido y un gran ingeniero que trabaja en Suecia desde hace unos años. Además, descubrirás cómo es la vida y trabajar allí: calidad de vida y calidad en el empleo.

La entrevista la tienes en formato vídeo o escrito. Seguro que te sorprenderán muchas cosas 😉 ¡Empecemos!

¿Por qué es importante Suecia para el desarrollo de aplicaciones?

Suecia, principalmente en Estocolmo, se ha convertido en un centro muy importante en desarrollo de aplicaciones móviles.  A principios del año 2000, hace cerca de 20 años, el Estado les daba a todos los alumnos de Bachillerato un ordenador portátil.  Y aunque no toda la gente lo utilizaba para eso, hubo mucha gente que empezó desarrollar aplicaciones y sus ideas en sus sótanos, tipo Silicon Valley . De ahí han salido empresas tan importantes como Spotify, Skype… aunque creo que Skype también había gente de Eslovenia. Pero digamos que de ahí surgieron un montón de empresas importantes. A eso, hay que añadir que, como ha pasado en San Francisco, en Estados Unidos, el dinero que ganan lo han invertido en startups. Entonces se ha creado ahí un círculo que se autoalimenta y que ha conseguido hace que haya un montón de empresas. Hay empresas muy muy grandes ahora está EPIC desarrollando, creo, un motor para móviles. Google también está ahí y, como he dicho antes, también Spotify. Luego también hay startups muy pequeñas como la que yo trabajo, Kaching. O como Klarna Bank un banco muy pequeño, pero ahora también muy potente.

 

 

En la segunda parte profundiza en la parte humana de cómo es el día a día, vivir y trabajar en Suecia para un Senior iOS Engineer.

 

Autor: Pedro Hernández

 

¿Quieres aprender más?

TITULO DE EXPERTO UNIVERSITARIO. Innovación usando la tecnología iOS con programación Swift: Proyectos Europeos.

 

TITULO DE EXPERTO PROFESIONAL. Desarrollo Profesional de Aplicaciones iOS con Swift para Dispositivos Móviles.

 

PROGRAMACIÓN SWIFT Y SUS NUEVOS PARADIGMAS. Certificado de Enseñanza Abierta.

 

DESARROLLADOR DE ELEMENTOS iOS. Certificado de Enseñanza Abierta.

 

CREACIÓN PROFESIONAL DE APLICACIONES DESDE LA IDEA HASTA EL APP STORE. Certificado de Enseñanza Abierta.

Thyssen

LINHD imparte en el Museo Thyssen el curso: “Introducción a la Web semántica, datos abiertos enlazados”

 

LINHD imparte un curso al personal del Museo Thyssen, esta acción formativa se desarrollará en seis sesiones durante el mes de octubre. Hoy se ha realizado la apertura del curso a la que han asistido Elena González-Blanco, directora general de CoverWallet en Europa y Salvador Ros, IP del Proyecto DESIR.

El curso estará dirigido por las profesoras:
Dra. Mª Luisa Díez Platas
LINHD-UNED
Helena Bermúdez Sabel
LINHD-UNED

El objetivo del curso es ofrecer una visión general de conceptos y recursos necesarios para la comprensión de modelos de datos, que permiten estructurar y manejar la información en proyectos de humanidades digitales, hacerla accesible para que pueda ser compartida y enlazada.
Con este objeto, es necesario hacer una revisión de conceptos básicos sobre los datos y los metadatos, sus formas de almacenamiento y mantenimiento mediante el uso de bases de datos relacionales tradicionales, y otros tipos de bases de datos orientadas a documentos y datos abiertos enlazados. Esta revisión implica un acercamiento al diseño e interpretación de los modelos conceptuales de datos y a las formas de almacenamiento, estructuración, la extracción y manipulación, orientadas al trabajo y visualización.
Por otro lado, y dado el impacto de la web semántica y los datos abiertos enlazados, se hace necesario acometer el estudio del estado de la web de los datos, conocer los conceptos y aplicaciones de la web semántica, orientado al almacenamiento, manipulación, compartición, visualización de los datos y conocer los estándares de datos que se usan en la actualidad para facilitar la interoperabilidad de los datos.
Con esto se pretende dotar a los asistentes al curso de la capacidad de diseñar un modelo de conocimiento asociado al campo de interés con el objeto de construir un modelo propio, a partir de los conceptos necesarios para representar los datos y publicarlos de forma que puedan ser enlazados y consultados.

 

Thyssen

 

Metodogía
• El curso se imparte de forma presencial con apoyo de plataforma educativa
• Se aportará la documentación teórica necesaria para la asimilación de conceptos.
• Se realizarán ejemplos prácticos sencillos que permitan probar los conceptos asimilados y acometer el diseño del modelo de datos para el campo de conocimiento concreto, museos y obras de arte, dotándolos de las características necesarias para que pueden ser manipulados como datos abiertos enlazados.

Temario

Tema 1. Datos y metadatos

1. De la información a los datos estructurados
2. Modelos de datos
3. Bases de datos para humanidades.
a. Bases de datos relacionales. Conceptos básicos
b. Bases de datos documentales. Modelos de agregación
4. Los metadatos.
Tema 2. Web de los datos y web semántica
1. Estado actual
2. Los datos abiertos enlazados. Puntos de debate
3. Reutilización e interoperabilidad
Tema 3. Modelo semántico y ontologías. RDFS
1. Definición y conceptos
2. Ventajas e inconvenientes del uso de ontologías
3. Clasificación de ontologías
4. Introducción al modelado de ontologías
5. Lenguajes de modelado de ontologías : OWL
Tema 4. RDF como marco de descripción de recursos

1. El modelo de datos RDF. Estructuración de los datos
2. Identificadores únicos (URIs)
3. Estructura de un documento RDF
4. Bases de datos para RDF. Consultas
Tema 5. Vocabularios y estándares de metadatos
1. Características y reutilización
2. Taxonomías, tesauros y vocabularios controlados
3. Vocabularios y esquemas para modelar la información de proyectos de patrimonio cultural
a. Modelo de referencia conceptual CIDOC .
b. Vocabularios y ontologías de Getty. Tesauro de arte y arquitectura.

c. El sistema de clasificación para arte e iconografía Iconclass.
d. Modelo de datos de Europeana
e. Revisión de vocabularios para museos registrados en BARTOC .
1. Modelo de datos del Museo del Prado y del British Museum

Tema 6. Publicación de datos

1. Reglas para la publicación y registro
2. Conjuntos de datos (datasets) y enlazado

 

METODOLOGÍA
El curso se impartirá de forma presencial los martes y jue ves de 10-13 horas.
Cada una de las clases constará de una parte teórica mediante una presentación sobre los conceptos del tema correspondiente y una práctica en la que se propondrá la realización de ejercicios haciendo uso de las herramientas oportunas, con el objeto de probar los conceptos asimilados y acometer el diseño del modelo de datos para el campo de conocimiento concreto, museos y obras de arte, dotándolos de las características necesarias para que pueden ser manipulados como datos abiertos enlazados.

Seguimos con nuestra apuesta por las Humanidades Digitales, a través de la formación y la puesta en práctica, con proyectos reales y consolidados. Si quieres formarte en Humanidades Digitales y, en Diseño y desarrollo de aplicaciones y entornos Web. No dudes en visitar nuestras páginas de formación.

¿Metadatos? Una explicación muy breve

Comenzaremos por el principio, es decir por el prefijo “meta”. La Wikipedia lo define así:

Meta (proveniente de la preposición griega y el prefijo meta- (μετά-) significa “después” o “más allá”) es un prefijo usado en Español para indicar una idea de una abstracción detrás de otro concepto, usando para completar o agregar algo en el final.(«Meta (prefijo)», 2018)

 

Así, los metadatos serían los datos más allá de los datos, o, lo que es más acertado, los datos sobre los datos.

 

Los metadatos es un nombre nuevo para un concepto que no lo es en absoluto,  la catalogación con datos sobre recursos en las bibliotecas, para poder con ello gestionar sus archivos. Sin embargo,  con el nacimiento de la informática Jack Myers acuña a finales de la década de los 60 el término de metadatos para describir conjuntos de datos (Senso & de la Rosa Piñero, 2003). Así, se daba el nombre de metadatos a  toda aquella información que se incluía para identificar un recurso. Los metadatos podían también añadir información descriptiva sobre el contexto, calidad y condición o características del dato o recurso.

El término metadato surge, entonces, ya ligado a los objetos digitales. Hemos de pensar que cualquier recurso digital presenta dos tipos de datos:

  • Datos que conforman el contenido de ese recurso. Esto es, lo que se quiere comunicar, por ejemplo, el código del texto, si se trata de un documento textual, pero también el mapa de bits que representa una imagen digital, o los datos del sonido codificado digitalmente de un documento sonoro.
  • Datos que aportan diversas informaciones de gran utilidad para procesar correctamente, entender y gestionar esos contenidos: son los metadatos. Son, como ya decíamos “datos después de los datos” o “datos que describen a otros datos”.

iOS 12 nueva actualización: instalación y dispositivos compatibles

¿Cuándo está disponible iOS 12?

¡Ya está aquí la primera versión de iOS 12! El pasado miércoles 12, entre otras presentaciones, se enseñó a todos los públicos el mejor sistema operativo para iPhone, iPad y iPod Touch, jamás creado por Apple. Desde luego, que no dirás que no han sabido escoger bien el día del mes, jaja.

En este acto se anunció que la fecha de lanzamiento es el lunes 17 de septiembre de 2018. Aquí todos tendremos disponible la nueva actualización de iOS. ¡Por fin se acabaron las versiones beta!

 

Hacer una copia de seguridad para más tranquilidad

Para evitar un mal rato o disgustos siempre haz una copia de seguridad de tu iPhone o iPad antes de la instalación.

Tienes dos opciones. Una usando iTunes conectando tu dispositivo a tu Mac u otra directamente desde el dispositivo para hacerla en iCloud.

En este vídeo puedes ver cómo se puede hacer la copia usando iTunes. En tu Mac puedes elegir entre guardarlo en iCloud o en el disco duro.

La mejor Copia de Seguridad en iTunes con Mac

 

O aquí tienes la segunda forma de hacerlo, por ejemplo, en un iPhone utilizando iCloud y habilitando esta opción:

La mejor Copia de Seguridad en iCloud para iPhone iPad

 

¿Cómo instalar iOS 12?

El proceso es sencillo. Ve a Ajustes, luego a General, a continuación, pulsa en Actualización de software y finalmente te aparecerá para instalarlo. En el siguiente vídeo puedes ver el proceso súper rápido.

Tutorial completo para instalar iOS 12 paso a paso desde cero

 

¡Cuidado! Cuando vayas a actualizarlo, recuerda estas dos cosas muy importantes:

◎ Ten a mano el cargador por si te dice que no tienes suficiente nivel de batería.
◎ Si esperas una llamada o mensaje urgente, puedes descargar la actualización, pero no la instales, ya que durante unos minutos estará apagado el dispositivo. Serán pocos o muchos minutos, según el modelo.

¿Merece la pena invertir tiempo en instalarlo?

Un ¡Sí! rotundo. Sobre todo, vas a tener una mejor usabilidad, y una mayor seguridad en tu dispositivo y aplicaciones. Por ejemplo, entre otras novedades, cuando tu app favorita accede a un servidor que está en internet ahora con iOS 12, gracias a un nuevo framework para networking, la capa de seguridad se ha incrementado de forma significativa en comparación con iOS 11. Por esa razón, te animo a que actualices ahora, y sino en cuanto llegues a casa.

iPhone, iPad y iPod touch compatibles

Este es el listado de dispositivos que soportan la nueva versión de iOS 12:

iPhone
• iPhone X
• iPhone 8
• iPhone 8 Plus
• iPhone 7
• iPhone 7 Plus
• iPhone 6s
• iPhone 6s Plus
• iPhone 6
• iPhone 6 Plus
• iPhone SE
• iPhone 5s

iPad
• iPad Pro de 12,9 pulgadas (2.ª generación)
• iPad Pro de 12,9 pulgadas (1.ª generación)
• iPad Pro (10,5 pulgadas)
• iPad Pro (9,7 pulgadas)
• iPad Air 2
• iPad Air
• iPad (6.ª generación)
• iPad (5.ª generación)
• iPad mini 4
• iPad mini 3
• iPad mini 2

iPod Touch
• iPod touch (6.ª generación)

¿Cuáles son los porcentajes de actualización?

Las estadísticas nos muestran que el año pasado el 85% actualizó sus móviles y tabletas a iOS 11. Además, cada año son más las personas que disfrutan de las increíbles mejoras en el uso de sus dispositivos actualizados. Como resultado, a fecha 3 de septiembre de 2018 mira las cifras: 85% con iOS 11, 10% con iOS 10 y el 5% restante con versiones anteriores.

 

¿Te gustaría ser un desarrollador o desarrolladora de iOS 12?

¿Quieres aprender más?

 

TITULO DE EXPERTO UNIVERSITARIO. Innovación usando la tecnología iOS con programación Swift: Proyectos Europeos.

 

TITULO DE EXPERTO PROFESIONAL. Desarrollo Profesional de Aplicaciones iOS con Swift para Dispositivos Móviles.

 

PROGRAMACIÓN SWIFT Y SUS NUEVOS PARADIGMAS. Certificado de Enseñanza Abierta.

 

DESARROLLADOR DE ELEMENTOS iOS. Certificado de Enseñanza Abierta.

 

CREACIÓN PROFESIONAL DE APLICACIONES DESDE LA IDEA HASTA EL APP STORE. Certificado de Enseñanza Abierta.

Autor: Pedro Hernández

Bibliografía:
◦ Soporte Apple: iOS 12 es compatible con estos dispositivos
◦ Support Apple Developer: Devices are using iOS 11. As measured by the App Store.
◦ Soporte Apple: Cómo hacer una copia de seguridad del iPhone, iPad y iPod touch

Los Gestos iOS en iPhone e iPad (Parte 2)

En Los Gestos iOS en iPhone e iPad (Parte 1) se profundizó en los gestos disponibles en iOS, desde un punto de vista como usuario y se creó el contexto para programar estos gestos. Así que, una vez escrita la base para un developer, o como en castellano nos gusta llamar un programador o programadora, aquí empieza la segunda parte que se centrará en el código a escribir. Comprenderás qué código Swift necesitas para habilitar en una bola naranja los gestos de tocar y arrastrar. Para ello, se utilizará Xcode 10 con Swift 4.2 en un Playground, que es la forma más eficaz para aprender el lenguaje de programación Swift.

 

El objetivo por alcanzar es crear una Live View con una bola, como lo que puedes ver en este vídeo:

 

Como has visto, si solo pulsas la bola naranja se vuelve de color verde y aumenta de tamaño, mientras que si la arrastras, aumenta el diámetro de la bola y al soltarla vuelve a tu tamaño original.

 

Paso a paso

 

En este artículo te explicaré línea a línea el código que necesitarás escribir en el Playground.

 

Antes de empezar a escribir, siempre debes tener claro que es lo que vas a hacer y con qué objetivo. En el vídeo anterior has visto la finalidad, y con el siguiente vídeo deseo que visualices la estructura que tendrá el Playground para que así sepas qué clases necesitarás para conseguirlo. Dentro del Playground Gestos habrá dos clases en la carpeta Sources: FondoView y BolaGestosView. Estas dos clases serán utilizadas por el Playground. FondoView es una clase auxiliar que he creado para la visualización de la Live View.

 

En el siguiente enlace puedes descargarte de GitHub el Playground para poder iniciar el ejemplo: gestos-playground-blog-inicio

¡Empieza la acción!

En primer lugar, crea el playground Gestos en Xcode 10, importando los frameworks UIKit y PlaygroundSupport. A continuación, escribe el código para crear un rectángulo blanco para mostrarlo en la Live View del playground, como si fuese el fondo de una pantalla del iPhone.

 

En la carpeta Sources crea el archivo Swift llamado BolaGestosView. Importa el framework UIKit y escribe la clase BolaGestosView que heredará de la clase UIView. Tendrá un nivel de acceso open para que el Playground pueda usarla.

 

En esta clase escribe el código para crear las funciones para escalar y mover. La función escalar se activará cuando pulses sobre la bola o inicies el arrastre. La función mover se iniciará al arrastrar la bola.

 

Escalar recibirá un número para saber el factor de escala. Recuerda que 1.0 deja a la bola en su mismo tamaño, mientras que un número mayor a 1 aumentará el tamaño de la bola. La animación tiene una duración de 0.1 segundos, con un movimiento en la animación de inicio lento y finalización lenta, tal y como especifica curveEaseInOut. En la animación se le asignará a la bola una transformación de escala.

 

Mover recibe el punto de translación en el que se está arrastrando la bola. Ese punto se lo asigna al centro de la bola. De esta forma, hace que se mueva la bola acorde al movimiento de arrastre. Una vez terminado dicho movimiento se reinicia a cero la translación. Esto evitará un valor incremental en los movimientos de arrastre.

 

Ahora llega el momento de crear las funciones que se activarán cuando se inicien los gestos de pulsar y el de arrastrar.

 

Lo primero es añadirle la palabra clave @objc, debido a que será llamada desde una variable que utiliza un selector, que internamente todavía utiliza elementos creados con el lenguaje de programación Objective-C.

 

La función manejarPulsar recibirá el gesto de pulsar para que así se pueda imprimir el punto exacto que se ha pulsado. Como puedes observar, están comentadas las dos primeras líneas para que decidas si quieres que se imprima por consola el punto pulsado. Entonces, las puedes descomentar eliminando las dos barras. Dentro de esta función hay otra animación con una duración de 0.1 segundos y dicha animación será más lenta al terminar. Esta animación cambiará el color de la bola a verde y aumentará su escala al doble de su tamaño. Una vez terminada esta primera acción, empezará la segunda. Le he añadido un pequeño retraso de otro 0.1 para que permanezca el color verde un poco más, y luego volverá la bola a su color naranja y a su tamaño original mediante la escala con valor 1.

 

La función manejarArrastrar recibe el gesto de arrastrar. De esta forma se puede obtener los diferentes estados del gesto mediante los casos del switch. El primero se produce cuando se inicia el arrastre, aumentando un poco la bola. A continuación, cuando el estado cambia, inicia el movimiento de la bola. Finalmente, cuando termina, se le asigna la escala a 1 para que vuelva la bola a su tamaño inicial.

 

En la parte superior de esta clase se crearán las propiedades que le asignan la función a ejecutar cuando se activa el gesto de pulsar o Tap Gesture, así como el gesto de arrastrar o Pan Gesture. Puedes observar como cada variable, usando los selectores, llama a las funciones que has escrito anteriormente. Estas variables vienen precedidas por lazy, debido a que no se inicializarán hasta que no sean llamadas por el código en tiempo de ejecución.

 

El siguiente diagrama muestra la estructura de estas variables:

 

La variable gesto pulsar mediante el selector activará las acciones que se producirán en la función manejarPulsar(sender:), que a su vez iniciará la función de escalar la bola.

 

Por otra parte, la variable gesto arrastrar iniciará la acción del selector llamando la función manejarArrastrar(sender:). Y como recordarás, los casos del switch llamarán las funciones escalar o mover, según corresponda.

 

Ha llegado la hora de escribir los inicializadores de la clase.

 

El primer init será público para poder usarlo en el Playground. Dentro de él se creará un array constante con las variables de los gestos que creaste antes. A continuación, se realizarán iteraciones sobre el array gestos para añadirlos a la vista, o sea, a la bola.

 

Luego viene un init de conveniencia para poder crear la bola con las dimensiones de un rectángulo. La primera línea establecerá el tamaño recibido para asignárselo a la vista de la bola. En la segunda línea crea un radio del rectángulo, o en este playground un cuadrado. El radio será la mitad del ancho del cuadrado, de esta forma se convertirá en un círculo. La tercera línea activa el radio en la vista.

 

Finalmente se declarará el init requerido para que así se cumpla con los requisitos de los inicializadores de esta clase.

 

A continuación, escribe el código en el Playground para crear la instancia de la bola. Crearás una constante conforme a la clase BolaGestosView.

 

Al ir entre llaves, la inicialización de la bola puede personalizar la creación de la vista. En la primera línea estableces que será un cuadrado de 100 puntos, en la segunda línea defines que el punto sobre el que se aplicarán las transformaciones está en el centro geométrico de la bola. Luego le asignas el color naranja. Finalmente, mediante el return asignas la vista creada a la bola.

 

Seguidamente en la inicialización de la bola, para simplificar, se mostrará el centro de la bola en el centro de la vista blanca del fondo. Por esa razón, la última línea añade la bola al fondo para que sea visible en la Live View.

 

En el siguiente enlace puedes descargarte el Playground terminado desde GitHub, por si deseas compararlo con el tuyo: gestos-playground-blog-terminado

Tutorial completo en: https://theemotionapps.com/tutorial-gesture-recognizer-en-ios-swift-4-2/

 

¿Quieres aprender más?

 

TITULO DE EXPERTO UNIVERSITARIO. Innovación usando la tecnología iOS con programación Swift: Proyectos Europeos.

 

TITULO DE EXPERTO PROFESIONAL. Desarrollo Profesional de Aplicaciones iOS con Swift para Dispositivos Móviles.

 

PROGRAMACIÓN SWIFT Y SUS NUEVOS PARADIGMAS. Certificado de Enseñanza Abierta.

 

DESARROLLADOR DE ELEMENTOS iOS. Certificado de Enseñanza Abierta.

 

CREACIÓN PROFESIONAL DE APLICACIONES DESDE LA IDEA HASTA EL APP STORE. Certificado de Enseñanza Abierta.

¿DESDE CUÁNDO HAY METADATOS?

El término metadato nace con el advenimiento de la tecnología informática. Algunos atribuyen el primer uso de este término a Jack Myers (finales de los 60) para describir conjuntos de datos (Senso & de la Rosa Piñero, 2003: 97). Sin embargo, otros autores atribuyen este primer uso a Stuart McIntosh y David Griffel en 1967 (Steiner, 2017: 52), y otros (Solntseff & Yezerski, 1974) defienden que el término fue acuñado por Bagley en 1968 su libro Extension of Programming Language Concepts (Bagley et al., 1968). Como vemos, diferentes autores, pero fechas muy similares. En cualquier caso, lo que queda claro es que el término surge ligado a los sistemas informáticos y a los nuevos retos en la identificación de la información.

escriba-medieval

Sin embargo, lo que hoy consideramos metadatos es extensible a cualquier catálogo bibliotecario, por lo que podríamos remontarnos a varios siglos antes de Cristo. La mayoría de textos señalan el catálogo de la Gran Biblioteca de Alejandría llamado Pinakes, del siglo III a.C., como el primer ejemplo de uso de metadatos. El sistema de la biblioteca consistía, principalmente, en una etiqueta colgando al final de cada rollo. Esta etiqueta contenía información sobre el autor, título y tema de cada obra, para que los materiales puedan devolverse fácilmente a la zona de la cual habían sido sacados, pero también para que los usuarios no tuvieran que desenrollar cada rollo para ver qué contenía. El nombre original del catálogo era Tablas de personas eminentes en cada una de las ramas del aprendizaje, junto con una lista de sus escritos. El catálogo era un conjunto de índices utilizados en la Biblioteca de Alejandría en Egipto, de la que parece que no sobrevivió ninguna parte del catálogo, pero podemos saber de él gracias a citas que nos dan una aproximación a la organización del conjunto de las tablas (Casson, 2002). Por su parte Voutssás Márquez (2006:154) señala que en 1975 se descubrieron cerca de Aleppo, en Siria, los restos de la biblioteca de Ebla, dentro del palacio del rey Aghrish, y dice:

Transmissions-bandeau

Ebla, la Ciudad de las Piedras Blancas, llegó a tener 260,000 habitantes, floreció en la Edad de Bronce temprana y fue destruida alrededor del año 2,300 a.C. Su biblioteca contenía más de 17,000 documentos sobre tabletas de arcilla que fueron datados a la mitad del tercer milenio a.C., por lo que muchos la consideran la biblioteca más antigua del mundo.64 Algunas de las tablillas contenían un “listado” de las obras que se encontraban en la colección y por tanto se consideran, hasta ahora, como el metadato más antiguo que haya sido descubierto y datado; las tabletas habían sido originalmente ordenadas en sus anaqueles por temas; todo ello veinte siglos antes de la Biblioteca de Alejandría. (Voutssás Márquez, 2006: 154-155).

Durante la Edad Media (catálogos medievales de autores cristianos) y, sobre todo en el Renacimiento, podemos encontrar muchos ejemplos de metadatos, como la Bibliotheca Universalis de Konrad de 1545, que se considera la primera lista universal y verdaderamente exhaustiva de todos los libros del primer siglo de la imprenta. Era una bibliografía alfabética que enumeraba todos los libros conocidos impresos en latín, griego o hebreo (Eisenstein, 1980: 97).

REFERENCIAS BIBLIOGRÁFICAS

Bagley, P. R., United States, Air Force, Office of Scientific Research, United States, Air Force, & Office of Aerospace Research. (1968). Extension of programming language concepts. Philadelphia: University City Science Center.

Casson, L. (2002). Libraries in the Ancient World. Yale University Press.

Eisenstein, E. L. (1980). The Printing Press as an Agent of Change. Cambridge University Press.

Senso, J. A., & de la Rosa Piñero, A. (2003). El concepto de metadato. Algo más que descripción de recursos electrónicos. Ciência da Informação32(2), 95-106.

Solntseff, N., & Yezerski, A. (1974). A survey of extensible programming languages. Annual Review in Automatic Programming7, 267-307. https://doi.org/10.1016/0066-4138(74)90001-9

Steiner, T. (2017). Metadaten und OER: Geschichte einer Beziehung. Synergie. Fachmagazin für Digitalisierung in der Lehre4, 51–55.

Voutssás Márquez, J. (2006). Bibliotecas y publicaciones digitales. México: UNAM.

Autor:

Clara I. Martínez Cantón

El proyecto POSTDATA ha nacido para crear un puente digital

POSTDATA es un proyecto financiado de ERC Starting Grants de investigación en humanidades digitales que busca comparar las distintas tradiciones poéticas utilizando la tecnología de la web semántica.

El proyecto POSTDATA “Poetry Standardization and Linked Open Data”, dirigido por Elena González-Blanco García y Salvador Ros Muñoz, es un proyecto del Consejo Europeo de Investigación (European Research Council) de más de un millón de euros con una duración de cinco años (inicio mayo 2016) en los ámbitos de la Ciencia y las Humanidades digitales.

El proyecto se ha convertido en líder de un programa pionero que suma a la Filología investigadores del ámbito de la documentación, la informática, la lingüística computacional y la tecnología de la web semántica y  los datos. El proyecto está integrado en el Laboratorio de Innovación en Humanidades Digitales de la UNED (LINHD), centro pionero en España y en español en este campo.

EL proyecto:

La necesidad de estandarización viene de la mano de la importancia de intercambiar conocimiento y fomentar el entendimiento entre los diferentes campos. Las disciplinas científicas establecieron de una forma temprana protocolos y lenguas para realizar ese trasvase de información, creando unos estándares que fueron rápidamente adquiridos y adaptados para resolver sus problemáticas específicas. Las áreas de humanidades y la cultura han seguido, sin embargo, un camino independiente en el que la creatividad y la tradición juegan un papel esencial. La literatura, y especialmente la poesía, constituyen un claro reflejo de esta idiosincrasia. Desde el punto de vista filológico, no hay un sistema uniforme de analizar, clasificar o estudiar las diferentes manifestaciones poéticas, y la divergencia de teorías es aún mayor cuando se comparan diferentes escuelas poéticas correspondientes a distintas lenguas y períodos. El proyecto POSTDATA ha nacido para crear ese puente digital entre los acervos culturales tradicionales y el mundo creciente de los datos. El proyecto se centra en el análisis, clasificación y publicación de la poesía aplicando metodologías de análisis propias de las Humanidades Digitales, como la codificación en XML-TEI, para buscar la estandarización. Los problemas de interoperabilidad entre las diferentes colecciones poéticas se resuelven utilizando tecnologías de la web semántica para enlazar y publicar conjuntos de datos literarios de forma estructurada en la nube de datos enlazados.

La ventaja de convertir la poesía en datos disponibles en línea legibles para máquina es triple: en primer lugar, la comunidad académica tendrá una plataforma digital accesible para trabajar con corpora poéticos, contribuyendo al enriquecimiento de los propios textos; segundo, esta forma de codificar y estandarizar la información poética, será una garantía de preservación para poemas conservados solamente en libros impresos, o incluso transmitidos oralmente; y tercero, los conjuntos de datos y los corpora estarán disponibles en acceso abierto para su uso con otras finalidades, como la educación, la difusión cultural o el entretenimiento.

Para lograr este fin, se ha creado un laboratorio de poesía dentro de la plataforma que permite a los usuarios aplicar las últimas tecnologías del lenguaje y de la lingüística computacional para analizar los datos poéticos. Algunas de estas herramientas incluyen un analizador métrico que detecta la estructura silábica de las estrofas y los patrones acentuales, el reconocimiento de entidades nombradas para extraer lugares, fechas y personas mencionadas, la combinación de lematizadores y parsers para identificar las estructuras sintácticas con propósitos poéticos y el análisis de sentimiento para descubrir emociones y sentimientos en los poemas. La combinación de todos estos procesos en el mismo entorno mejorará y facilitará el análisis a los investigadores, generando nuevas aplicaciones, como la detección automática del género poético o el análisis de figuras retóricas y estilísticas. .

Uno de los objetivos del proyecto es proporcionar a la comunidad científica de poesía los medios para que puedan publicar los resultados de su investigación como datos abiertos enlazados (LOD) y de esta manera, poder explotar las ventajas que ofrece este tipo de recursos, propios de la web semántica (la publicación de datos que puedan ser procesados por maquinas inteligentes).   

Siguiendo este objetivo, el proyecto ha diseñado un modelo de datos que contiene los conceptos necesarios para poder desarrollar investigación en poesía europea. Al ser esta una tarea muy ambiciosa (abarcar todas las lenguas, periodos, etc de la poesía europea), es necesaria la colaboración de investigadores de todas las tradiciones poéticas de Europa para que validen nuestro trabajo.

Con este fin el proyecto ha desarrollado un formulario que, a través de la inserción de datos resultantes del análisis de los expertos, comprueba que el modelo de postdata no tenga ninguna laguna conceptual.

Enlace al formulario http://postdata-model-validation.linhd.es/

Gracias a este proceso de validación de nuestro trabajo, podremos poner a disposición de la comunidad investigadora en poesía, un modelo ontológico para datos abiertos enlazados.

Crónica del curso de verano DH@Madrid Summer School 2018

Bajo el título Aplicaciones y posibilidades del procesamiento del Lenguaje Natural para la Investigación en Humanidades por quinto año consecutivo, DH@Madrid Summer School 2018 ha tenido lugar en la UNED en su emblemático salón de actos Andrés Bello.

Durante los tres días de curso, se ha propuesta una introducción al Procesamiento del Lenguaje Natural centrado en su aplicación a los problemas propios de la investigación en Humanidades Digitales. De esta manera, el curso se ha dirigido a todos aquellos interesados en métodos digitales de investigación aplicados a las humanidades.

Nuevamente en esta oportunidad, los contenidos del curso, han podido seguirse de forma presencial y online, y ya se puede acceder en diferido.

Esta nueva edición del curso de verano ha contado entre otras, con la colaboración de las infraestructuras europeas de investigación CLARIN y DARIAH, así como de distintas redes de humanidades digitales, y ha sido organizado por el LINHD en el marco del proyecto POSTDATA.

DH@Madrid 2018

El lunes comenzó con la bienvenida y la presentación del curso por parte de los directores, Clara I. Martinéz Cantón y Salvador Ros Muñoz.

A continuación, Elena Álvarez Mellado, nos deleitó con su ponencia de “La lengua al microscopio: introducción básica al NLP desde Humanidades”, explicando las posibilidades que permiten las herramientas de la Lingüística computacional, mediante el análisis informático de grandes cantidades de textos. Su ponencia ha comenzado con una comparación entre el tabú que existía en época medieval en relación a la disección de cuerpos humanos para comprender su funcionamiento, y el peso de la tradición médica de Galeno, cuyas teorías estaban basadas principalmente en la observación, pero no se contrastaban. Explicó, además, las tareas básicas de un ordenador a la hora de procesar un texto.

 

La tarde del lunes se cerró con la presentación de Jennifer Edmond, Directora de proyectos estratégicos del Trinity Long Room Hub Arts & Humanities Research Institute, contándonos sobre la infraestructura DARIAH y de las ventajas de crear y compartir una infraestructura común que nos facilite el acceso a redes de trabajo y al conocimiento compartido entre diversos actores. De esta manera, tener una estructura también permite acercarse y ajustarse mejor a estándares como Open Science, incrementa las posibilidades de obtener financiación y promueve la sostenibilidad a lo largo del tiempo de los resultados. Permite además, estar al día de qué se está haciendo en el entorno de tu investigación.

El día martes, comenzó con la charla de Pablo Ruiz Fabo que ha introducido la noción expresión regular (regular expression- regex) y ha mostrado con diversos ejemplos y ejercicios cómo explorar un corpus de textos mediante el uso de regex, aprendiendo a modificar cadenas de texto eficazmente. La exposición teórica estuvo acompañada de ejercicios en donde se aprendieron, entre otras, las diferencias entre los elementos literales y los especiales. Durante su ponencia Pablo ha proporcionado una serie de enlaces donde poder usar las
expresiones regulares en Internet y también unos editores para poder descargarse en los ordenadores.

Mikel Iruskieta, investigador del Grupo IXA de la Universidad el País Vasco, exponía la potencialidad de Python y el lenguaje de programación para extraer o generar corpora textuales y explotarlos, guardando los resultados obtenidos. También, explicaba las tareas de PLN que pueden realizarse con Python, como la extracción de información de textos de distinto tipo, buscar términos en la web y comparar frecuencias, el desarrollo de programas basados en análisis lingüísticos y búsquedas basadas en diccionarios, guardando toda la información obtenida en XML. Asimismo, explicaba para qué podían ser útiles las infraestructuras del procesamiento del lenguaje, como CLARIN-K.

Por su parte, Mª Luisa Díez Platas, Investigadora del proyecto POSTDATA, se centró en la presentación de una herramienta que ha sido desarrollada en el Proyecto POSTDATA para el reconocimiento de entidades nombradas: Hispanic Medieval Tagger (HisMeTag). Constituye una de las tareas más importantes en la extracción de información y consiste en el reconocimiento y la clasificación de nombres de personas, lugares, organizaciones, expresiones numéricas, expresiones temporales, etc.  Su principal novedad es el reconocimiento de entidades nombradas en textos medievales. Pero, además, gracias a HisMeTag ha sido posible la creación de una taxonomía de entidades que puede servir de gran utilidad para los humanistas en su tarea de análisis de los textos.

La tarde del martes finalizó con la ponencia de Elena González-Blanco, investigadora principal del Proyecto POSTDATA y General Manager of Europe en CoverWallet. Elena comenzó con un repaso de lo que son las Humanidades Digitales y la situación actual, con el machine learning y la inteligencia artificial. Comentó que la inteligencia artificial es una etiqueta que engloba muchas cosas: reconocimiento facial o de escritura; máquinas que pueden llevar a cabo razonamientos complejos, como jugar al ajedrez; algoritmos complejos que se resuelven solos; los chatbots y los asistentes virtuales o los medios de transporte que se conducen solos. Son tecnologías diversas que se aplican a diferentes ámbitos, pero que todas tienen un punto en común: la transformación digital. No es la disciplina la que marca la diferencia, sino la tecnología y el tipo de materia sobre la que se aplica.

El último día de curso, comenzó con la charla de Antonio Robles de la UNED y José Manuel Fradejas de la Universidad de Valladolid. Se puso de manifiesto la necesidad de la interdisciplinariedad, uniendo el aspecto informático con el humanístico. En este sentido, el lenguaje R no solo sirve para el análisis de textos sino también para realizar análisis estadísticos y visualizaciones avanzadas. El profesor Fradejas explicó qué es la estilometría y señaló cuales son los libros reveladores en el campo de la estilometría para él. La charla de José Manuel también tuvo una gran parte de práctica para demostrar otras potencialidades del PLN.

A continuación, Gimena del Río, investigadora de CONICET- Argentina, explicó en qué consistía el proyecto Pelagios, y lo que es un gazetteer (una base de datos histórico-geográfica que permite trabajar en sistemas de información geográfica con coordenadas geotópicas). La estructura Pelagios está centrada en datos geográficos como entidades nombradas y trabaja distintas tecnologías: Linked Open Data, Geographical Information Systems, Natural Language Processing, GeoJson, XML-TEI, etc. Además su uso es muy intuitivo, como se pudo comprobar
durante la práctica.

La intervención de Helena Bermúdez Sabel, investigadora del Proyecto POSTDATA, fue de carácter eminentemente práctico. Comenzó, sin embargo, con una breve introducción sobre en qué consiste XML y sus ventajas respecto a otros formatos, al unir un lenguaje humano y uno informático. Así, la finalidad principal del lenguaje XML es la de modelar la estructura inherente y las propiedades semánticas de diversos documentos culturales por medio de hierarquías y estructuras ordenadas. Entre las aplicaciones prácticas de XML para las Humanidades Digitales cabe destacar la identificación de estrofas y versos y una serie de recursos estilísticos.

Para finalizar y a modo de colofón del curso, Enrique Vidal, catedrático de la Universidad Politécnica de Valencia, explica cómo llevar a la práctica en un proyecto de investigación, el Procesamiento del Lenguaje Natural. Hace algunas décadas numerosos investigadores vaticinaron el fin del papel como modelo de transmisión del texto escrito. Sin embargo, este vaticinio no se cumplió y hoy en día existe una buena cantidad de textos escritos a mano que no han sido procesados aún mediante herramienta informática alguna. Las tecnologías que se están desarrollando actualmente para procesar textos manuscritos son cada día más numerosas. Explicó que se han desarrollado tecnologías de interacción persona-máquina que permiten conseguir transcripciones perfectas con un esfuerzo mucho menor del que supondría una transcripción manual por parte de un ser humano. Estos son los llamados métodos interactivo-predictivos de transcripción asistida. Además, se han desarrollado tecnologías de predicción probabilística de texto en imágenes, que se pueden aplicar directamente a las imágenes sin tenerlas explícitamente transcritas.

¡¡¡Muchas gracias a todos por la participación…los esperamos el año que viene!!

 

DH@Madrid Summer School 2018- ¡Matrícula abierta!

La escuela de verano DH@Madrid Summer School 2018 es un evento anual que se organiza cada año desde 2014. En esta oportunidad, presentaremos el curso “Aplicaciones y posibilidades del procesamiento del lenguaje natural para la investigación en humanidades” que se  llevará a cabo entre los días 9 y 11 de julio de 2018 en la UNED. 

Este año, el curso DH@Madrid Summer School se propone ser una introducción al Procesamiento del Lenguaje Natural centrado en su aplicación a los problemas propios de la investigación en Humanidades Digitales. Su meta es introducir a los estudiantes con una formación en humanidades o ciencias sociales el contenido técnico buscando un enfoque claro y diverso, haciéndoles ver las distintas posibilidades a la hora de encarar su trabajo o investigación.

 

 

Contará ademas, con la colaboración de importantes expertos internacionales en Humanidades Digitales, tecnología semántica y procesamiento del lenguaje y estará dirigido a especialistas en Humanidades Digitales, lingüistas, investigadores, profesores, académicos, y estudiantes tanto de máster como de doctorado, preferentemente en disciplinas humanísticas, pero también en disciplinas como informática o ciencias de la información.

 

La escuela está cofinanciada por el proyecto ERC POSTDATA y la Fundación UNED.

                  ¡Entra en la página del curso: http://linhd.es/p/dh-verano-2018/ y no dudes en preguntarnos!

Items de portfolio