DePrensa, software libre y cubano

Vista de la aplicación Web para el Vocabulario Controlado de la Prensa Cubana, DePrensa.

Lenay Barceló, licenciada en Bibliotecología y
Ciencias de la Información, y Sandra Vigo, técnico en
Informática, asumieron el reto de optimizar la indización
(clasificación por contenido y otros datos) de lo publicado en
la prensa escrita nacional, utilizando para ello un software libre que permitiera el trabajo en un ambiente colaborativo.

Decididas a lograrlo, las jóvenes recién graduadas
desarrollaron una aplicación Web para el Vocabulario Controlado
de la Prensa Cubana, DePrensa.

Tarea difícil, pues, debido a su misión de informar
sobre sucesos muy diversos, la prensa destaca por la gran variedad
temática y de sentido de sus contenidos, cuya
organización y gestión requiere —además del
uso de herramientas básicas de indización como los
tesauros, las taxonomías corporativas, ontologías y
vocabularios controlados— tener en cuenta discursos
lingüísticos, fuentes de información,
ideologías, esquemas mentales y cognitivos, entre otros aspectos
particulares.

¿Cómo indizar o clasificar los materiales
periodísticos de forma dinámica, acorde con la
vertiginosidad de la profesión periodística, sin perder
la objetividad?, fue pregunta clave a la que tuvieron que responder con
su trabajo las dos jóvenes.

Los periodistas y demás trabajadores de la prensa cubana —explicaron a Cubahora
precisan del servicio de información documental y los
especialistas que procesan los documentos, a su vez, necesitan
herramientas con términos claramente definidos para su tarea de
procesamiento y representación de los contenidos.

«La Base de Datos de la Prensa Cubana —explica Sandra—
recoge todos los materiales periodísticos publicados en medios
de prensa escrita nacionales y provinciales, desde 1995 hasta hoy.
Entre los metadatos que se incluyen para su gestión se
encuentran los descriptores, pero no todos los gestores de
información tenían el dominio para establecerlos
correctamente, pues no estaban formalizados, y la recuperación
se dificultaba.»

A partir de la necesidad de formalizar esos términos, surgió la idea de crear DePrensa,
aplicación Web construida en dos meses y que comprende
más de dos mil términos, debidamente avalados y en su
mayoría genéricos y propios el discurso
periodístico de nuestros medios de prensa en forma particular.

«DePrensa —explica Lenay— comprende una caja de
búsqueda para localizar aquellos términos que van a ser
usados para la indización de los materiales procesados en la
Base de Datos de la Prensa. En cuanto a beneficios, como la herramienta
está on line, el mayor es que resulta accesible a
distancia y posibilita la colaboración; todos los usuarios del
sistema pueden contribuir a su enriquecimiento, sugerir y favorecer a
normalizar términos que se emplearán en el posterior
proceso de indización.

«No existe ningún sistema similar a este en Cuba,
desde el punto de vista de la ciencia de la información. Su
actualización es diaria; incluye la definición de los
términos y de las relaciones entre estos, desde el punto de
vista asociativo y jerárquico, todo ello sustentado por fuentes
de referencia validadas, como tesauros, listas de encabezamiento y
otros vocabularios, de manera que en un futuro no muy lejano,
podrá escalar en una ontología* sobre el dominio
del conocimiento recogidos en los materiales de prensa cubana, tanto en
su forma impresa como en los entornos digitales».

Las creadoras estudian ahora su impacto como aplicación Web,
en la fase de prueba, y luego de conocidas las inconformidades
hará las correcciones pertinentes para ofrecerlo on line a todos los medios de prensa.

Como medios pilotos, para esta etapa de prueba, se escogieron: el diario Juventud Rebelde, la revista Bohemia, el Centro de Información para la Prensa, y los semanarios Escambray, de Sancti Spíritus, y Vanguardia, de Villa Clara.

A propósito de INFO 2010 en la III Mesa Redonda Internacional de Proyecto Web Por un Diseño Sostenible, será presentado internacionalmente el Vocabulario Controlado de la Prensa Cubana.

*Representación conceptual de términos
interrelacionados y sus definiciones de dominio para dicha
representación.

Tomado de Cubahora

¿Te resultó interesante? Compártelo ...



GUTL

Publicado por GUTL

Forma parte de GUTL desde el 6 diciembre, 2011.