El pasado mes de abril, la RAE y la fundación Endesa convocaron un hackathon muy interesante para detectar neologismos y tecnicismos en el ámbito de la energía y el medioambiente utilizando tecnologías del lenguaje.
A nuestro grupo de investigación SINAI le gustan mucho estos retos e intentamos participar siempre que podemos, así es que en cuanto tuvimos conocimiento del hackathon nos apuntamos sin pensarlo. Sin embargo, esta vez el reto era algo diferente puesto que no se describía absolutamente nada de lo que se pretendía conseguir, simplemente se nos decía que el hackathon se celebraría entre las 14:00 h del viernes 7 de mayo y las 14:00 h del sábado 8 de mayo de 2021 y que durante 24 horas y todo vía internet, los inscritos podrían trabajar en sus propuestas pero que el objetivo y las cuestiones concretas a resolver se darían a conocer el mismo día de su celebración a las 14.00. Así pues, además de que tendríamos que estar todo el viernes por la tarde y el sábado por la mañana trabajando, encima no sabíamos nada de nada, ni nos daban datos que pudiéramos ir preparando, ni colecciones previas a analizar, ni fuentes de datos ni, como digo, nada de nada. No teníamos claro que fuéramos a participar en esta ocasión por lo que nos reunimos Pilar y yo para decidir si seguíamos adelante y, de ser así, con quién contaríamos. Tras hablar con ella y analizar todos los pros y los contras, decidimos que lo máximo que podíamos perder era nuestro tiempo del fin de semana, así es que seguimos adelante esperando ver qué se desvelaba el día 7 y acordando que todos los que íbamos a participar decidiríamos in situ y sobre la marcha el mismo viernes si finalmente continuábamos. Así que por el momento no quedaba otra que esperar.
Llegó el día 7 y las instrucciones del reto se publicaron. Tampoco se dieron datos ni colecciones de documentos, la idea consistía en desarrollar un proyecto que mediante tecnologías facilitara la extracción, clasificación y tratamiento de neologismos, tecnicismos y extranjerismos presentes en los textos del mundo de la energía y el medioambiente. Las propuestas deberían responder de la manera más precisa y exhaustiva a cuestiones como las siguientes:
- ¿Cuáles son las palabras de uso más reciente que se emplean en este sector?
- ¿Qué tecnicismos se utilizan? ¿Cuáles han pasado ya al uso general?
- ¿Qué extranjerismos son los más frecuentes? ¿Existen alternativas en español para esos extranjerismos?
- ¿Qué tipo de palabras son las más frecuentes? ¿Derivados? ¿Compuestos? ¿Extranjerismos?
- ¿Cómo se pueden identificar todos estos términos dentro de los textos?
- ¿Es posible obtener la definición de estas voces a partir de los textos? ¿De qué manera?
Nos reunimos a las 14h y durante una hora estuvimos decidiendo si participábamos o no puesto que no se pedían sistemas computacionales concretos, que de hecho tampoco podríamos desarrollar en tan poco tiempo. Además, durante la presentación del hackathon se mencionó que se habían inscrito más de 400 participantes, lo que aún nos lo ponía más difícil. Decidimos darnos de tiempo hasta las 17 para pensarlo y ver si se nos ocurría alguna cosa coherente. Cuando nos vimos a las 17, ya entre Pilar y Flor habían montado un esquema con lo que habíamos comentado a las 14 para ir introduciendo información de manera compartida así es que no nos quedó más remedio que remangarnos y ponernos a trabajar lo más rápidamente posible a pesar de no tener muchas esperanzas, por no decir ninguna, de que fuéramos a ganar.
La verdad es que nos organizamos estupendamente, primero hicimos una tormenta de ideas pero sabíamos que no teníamos mucho tiempo por lo que rápidamente decidimos una estructura general y fuimos definiendo una arquitectura que iríamos desarrollando a continuación. Estuvimos un par de horas hasta que definimos y nos repartimos lo mejor posible el trabajo. Quedamos a las 9 el sábado para que nos diera tiempo a cada uno a realizar el trabajo asignado y poder darle el toque final al proyecto. Nos pusimos a trabajar hasta bien entrada la noche y nos levantamos muy temprano porque ya a las 7 estábamos algunos conectados. El proyecto tenía una pinta muy buena y a las 9 le dimos las últimas vueltas, cada uno aportando todo lo que podía y más. Y cuando a las 12 presentamos el proyecto, todos estábamos muy orgullosos del trabajo realizado y aunque veíamos casi imposible que nos seleccionaran nos quedamos muy satisfechos simplemente por lo bien que habíamos trabajado y lo chulo que se había quedado el proyecto. Nos despedimos hasta el lunes y disfrutamos de lo que restaba de fin de semana.
Volvimos a nuestro trabajo diario y no nos acordamos más del hackathon, hasta que el pasado viernes 21 de mayo tuvimos la magnífica noticia de que habíamos ganado el primer premio. La verdad es que aunque no hubiéramos ganado, habría merecido la pena. Pero la alegría ha sido mayúscula porque cuando el trabajo se reconoce la satisfacción, ya no solo por ti sino por todo el equipo, es mucho mayor. Después de una semana dura en cuanto a trabajo y diferentes imprevistos administrativos que te hacen cuestionarte para qué estás dedicando tantísimas horas diarias de tu vida a la universidad cuando hay muchas situaciones que no puedes contralar y ni siquiera gestionar, la noticia del premio ha sido un revulsivo para levantarte otra vez, quitarte el polvo y volver a caminar. Y aunque el premio son 3.500€, la parte económica no es para nada importante puesto que lo realmente relevante es que esto supone un reconocimiento a la labor realizada que me hace sentir muy orgullosa del equipo que tenemos y por el que merece la pena echar todas las horas necesarias. Enhorabuena a todo el grupo SINAI y sobre todo a los que nos implicamos en el reto directamente 🙂