Un equipo de investigadores del CiTIUS, formado por expertos en las áreas de Computación de Altas Prestaciones (HPC) y Procesamiento de Lenguaje Natural (PLN) ha conseguido desarrollar una herramienta que permite adaptar automáticamente aplicaciones utilizadas en el ámbito del procesamiento de textos y documentos a modelos de computación paralela compatibles con clústeres multi-core, lo que reducirá notablemente los tiempos de ejecución y permitirá trabajar con volúmenes de datos muy superiores a los que se manejan en la actualidad.
El gran desafío de los datos online
La ingente cantidad de información que se incorpora diariamente a Internet no para de aumentar. Se estima que en sólo 24 horas generamos cerca de 2,5 trillones de bytes (2,5 Exabytes), o lo que es lo mismo: cerca de 27 GB por segundo, el equivalente a una temporada completa de Juego de Tronos en Alta Definición (HD). Para comprender la magnitud de la cifra, basta con señalar que el 90% de los datos disponibles actualmente en todo el mundo han sido creados apenas a lo largo de los dos últimos años.
De esta enorme cantidad de datos (agrupados bajo el anglicismo Big Data), sólo el 5% se puede considerar información estructurada; el 95% restante (que está compuesto por textos, principalmente) no cuenta con ningún tipo de organización ni estructura, lo que representa un serio problema a la hora de acceder y gestionar toda la información disponible.
El trabajo realizado por los investigadores del CiTIUS facilitará esta labor, ya que los resultados obtenidos harán posible el análisis de los datos de una forma más sencilla y eficiente. Su propuesta se ha basado en el diseño de un nuevo sistema que permite transformar el software usado para el Procesamiento del Lenguaje Natural (habitualmente programado en el lenguaje informático Perl, y ejecutado de manera secuencial) en una solución compatible con las tecnologías Big Data.
Con sólo introducir unas etiquetas en la aplicación original, esta herramienta de traducción permite al programador convertir automáticamente todo su código Perl en código Java adaptado al paradigma MapReduce, habilitándolo así para su ejecución en un clúster (es decir, permitiendo su ejecución simultánea en múltiples cores o nodos de computación). De esta forma, se logra multiplicar la velocidad de cómputo por un factor proporcional al número de procesadores disponibles (por ejemplo: si se dispone de 1000 procesadores, el código resultante será, en el caso ideal, aproximadamente 1000 veces más eficiente que la solución secuencial).
‘Perldoop’, la herramienta de código abierto
Otra característica reseñable de esta investigación, que ha dado lugar a la herramienta de traducción Perldoop, es que los resultados se han hecho públicos bajo una licencia de software libre, con el objetivo de que esté a disposición del mayor número posible de usuarios y profesionales. Como explica el profesor Juan Carlos Pichel, investigador principal y responsable del proyecto, la decisión se tomó porque «el desarrollo de soluciones Big Data para el Procesamiento de Lenguaje Natural» (PLN) «sólo está, en este momento, al alcance de las compañías más potentes». Con la solución propuesta, y unos conocimientos mínimos de programación, será posible convertir cualquier código programado en lenguaje Perl a una solución capaz de funcionar en un clúster de computación.
Entre las principales ventajas de esta nueva solución destaca especialmente su versatilidad, ya que se trata de una herramienta de propósito general; gracias a ello, podrán beneficiarse aplicaciones de ámbitos tan diversos como la traducción automática, el análisis de información en blogs, o incluso el procesado de datos genéticos.
El 63 Congreso de Ingeniería Naval e Industria Marítima que se ha inaugurado hoy, reúne hasta el viernes en Madrid a más de 350 profesionales y expertos de un sector que, como han coincidido todos los miembros de la Sesión inaugural, presenta “una destacada posición de liderazgo a nivel mundial y europeo y extraordinarias ...
La Fundación Caja Ingenieros abre el plazo de inscripción para una nueva convocatoria del ‘Premio Ideas Innovadoras Isabel P. Trabal'. El concurso, que este año alcanza su 7ª edición, impulsa el desarrollo de proyectos emprendedores en fase inicial y cuenta en esta ocasión con una dotación económica de 10.000€ para la idea ganadora y 5.000€ más ...
La llegada de la cuarta revolución industrial y la introducción de los robots en los procesos de fabricación han puesto de relieve la importancia de una interacción eficaz entre robots y humanos. Dado que las tecnologías de realidad extendida (RX) son fundamentales para que los robots industriales trabajen bien con los humanos en proximidad, la enseñanza ...
Hoy, 9 de abril de 2024 se cumplen 75 años desde que el Ministerio de Industria y Comercio autorizó la constitución de los Colegios de Ingenieros Industriales y su coordinación a través del, llamado hoy, Consejo General de Colegios Oficiales de Ingenieros Industriales.
Dentro de los actos de este aniversario, el Consejo ha ...
El grupo de ingeniería global SEGULA Technologies acaba de anunciar sus previsiones de contratación en Iberia en 2024: concretamente 850 nuevos empleados, que se unirán a los más de 1.300 que el grupo tiene en la Península Ibérica.
SEGULA Technologies es un grupo de ingeniería global que contribuye a aumentar la competitividad ...
En cumplimiento de la Ley de Servicios de la Sociedad de la Información y de Comercio Electrónico (LSSI) y en adecuación con la Directiva Europea 2009/136/CE, le informamos de la utilización de cookies en la presente web con el fin de facilitar y mejorar la navegación a los usuarios.
Una cookie es un fichero que se descarga en su ordenador al acceder a determinadas páginas web. Las cookies permiten a una página web, entre otras cosas, almacenar y recuperar información sobre los hábitos de navegación de un usuario o de su equipo y, dependiendo de la información que contengan y de la forma en que utilice su equipo, pueden utilizarse para reconocer al usuario.
Puede usted permitir, bloquear o eliminar las cookies instaladas en su equipo mediante la configuración de las opciones del navegador instalado en su ordenador.
Usted, una vez informado sobre la Política de Cookies, puede aceptar la utilización de las mismas por parte de esta web. Sin embargo, puede cambiar la configuración de cookies en cualquier momento, configurando su navegador para aceptar, o no, las cookies que recibe o para que el navegador le avise cuando un servidor quiera guardar una cookie.
Le informamos que en el caso de bloquear o no aceptar la instalación de cookies, es posible que ciertos servicios no estén disponibles sin la utilización de éstas o que no pueda acceder a determinados servicios ni tampoco aprovechar por completo todo lo que nuestras web le ofrece. Además del uso de cookies propias, permitimos a terceros establecer cookies y acceder a ellas en su ordenador.
Le agradecemos que consienta la aceptación de cookies, esto nos ayuda a obtener datos más precisos que nos permiten mejorar el contenido, así como mejorar la usabilidad de la web.
En caso de que este sitio web prestara algún tipo de servicio especial en el que determine unas previsiones específicas diferentes a éstas en lo relativo a la protección de datos personales y la utilización de cookies, prevalecerán las normas particulares indicadas para ese servicio en particular sobre las presentes.
Al acceder a este sitio web por primera vez verá una ventana donde se le informa de la utilización de las cookies, y donde puede consultar la presente "Política de cookies". Si usted acepta expresamente la utilización de cookies, continúa navegando o hace clic en algún link se entenderá que usted ha consentido nuestra política de cookies y por tanto la instalación de las mismas en su equipo o dispositivo.
Es posible que actualicemos la Política de Cookies de este sitio web, por ello le recomendamos revisar esta política cada vez que acceda al mismo con el objetivo de estar adecuadamente informado sobre cómo y para qué usamos las cookies. La Política de Cookies se actualizó por última vez el 02 de Septiembre de 2013.