Conferencia de YiLing Chung

noviembre 9th, 2023

El pasado miércoles, 8 de noviembre, tuvimos el placer de asistir a la charla “NLP for Online Harm Mitigation” con la investigadora Yi-Ling Chung que actualmente trabaja con el equipo de seguridad en línea del programa de políticas públicas del Instituto Alan Turing de Londres. Su investigación se centra principalmente en la aplicación del procesamiento del lenguaje natural y el análisis de redes sociales para abordar los daños en línea a través de la detección de abusos y la generación de contra-discursos y es coorganizadora del Workshop on Online Abuse and Harms (WOAH 7, WOAH 8) y del First Workshop on Counterspeech for Online Abuse (CS4OA).

La charla era abierta para toda la comunidad universitaria pero estaba principalmente orientada a los estudiantes de doctorado en TIC. Por ello, la Dra Chung realizó un buen resumen del tema con una visión general sobre los delitos de odio. Además, se profundizó en la aplicación del Procesamiento del Lenguaje Natural (PLN) para mitigar los daños en línea y cómo la lucha contra la incitación al odio en Internet se ha convertido en un reto social acuciante. En concreto, se comentaron proyectos que cubren varios aspectos de las aplicaciones contra el discurso de odio, incluyendo la creación de conjuntos de datos, técnicas de clasificación y generación, y evaluación. Además, también se presentaron algunos trabajos sobre métodos eficientes para la detección de abusos en línea comentando los retos abiertos en los que pueden progresar los investigadores y otros interesados.

Ha sido una charla muy inspiradora y productiva sobre todo para la nueva línea que hemos abierto en el grupo sobre generación de contranarrativas para luchar contra el discurso de odio en red. Hemos cogido muchas ideas y nuevos retos  se nos abren para continuar trabajando en este tema tan apasionante.

SEPLN 2023

octubre 5th, 2023

Este inicio de curso está siendo más acelerado y estresante que nunca, y uno de los motivos es que este año 2023, nuestro grupo de investigación SINAI se ha encargado de la organización del XXXIX Congreso Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural SEPLN2023.

El congreso se celebró del 27 al 29 de septiembre de 2023 en el Museo íbero de Jaén e incluyó una jornada previa el día 26 desarrollada en la Antigua Escuela de Magisterio y dedicada a los talleres y seminarios satélites que se celebran junto al congreso principal.

Aunque todo el grupo ha estado implicado en la organización, la gran parte del trabajo, sobre todo en los meses previos, ha sido realizada principalmente por mis compañeros Eugenio, Alfonso y por mí misma que nos hemos encargado de la gestión y contacto con patrocinadores y colaboradores, de la gestión de espacios, programa científico y social…

Una vez que ha finalizado el congreso puedo decir que, personalmente, creo que ha sido un éxito total, ya no solo porque hemos batido todos los récords de asistencia al congreso teniendo incluso que cerrar las inscripciones una semana antes del inicio del congreso por motivos de aforo (solo para hacerse una idea, el año pasado el número de asistentes superó ligeramente el centenar mientras que este año hemos llegado casi a 250 inscritos) sino porque todo ha salido a la perfección y el feedback que hemos tenido de los asistentes ha sido más que positivo. 

Como viene siendo habitual, el congreso en realidad se distribuye en 4 días ya que la jornada del martes 26 de septiembre se dedicó a los eventos satélites de la SEPLN, que en esta ocasión han contado con los 14 talleres dentro del marco de evaluación de sistemas computacionales en las lenguas habladas en la península ibérica dentro del foro ya más que consolidado IberLEF, además del taller NLP-MisInfo sobre desinformación y fake news. 

Por otra parte, el día de la inauguración oficial, el 27 de septiembre, además de contar con las sesiones propias del congreso, se celebró la muestra tecnológica Tecnoling, que cuenta ya con su quinta edición, y en la que también se han cubierto el cupo de inscripciones con un total de 18 empresas y startups que presentaron sus productos y servicios, habiendo sido esta muestra tecnológica auspiciada por el PERTE de la Nueva Economía de la Lengua.

El jueves 28 de septiembre acogió también el simposio doctoral que cumple su sexta edición y que constituye una oportunidad para que los jóvenes investigadores de nuestra comunidad puedan compartir experiencias con mentores expertos de la SEPLN.

Por último, este año hemos tenido el placer de contar con dos ponentes de altísimo nivel como son Valerio Basile de la Universidad de Turín y Elena Cabrio de la Universidad Coté d’azur en Niza, que nos ilustraron con dos interesantísimas charlas sobre temas de actualidad.

 

Pero además de este apretadísimo programa científico, también hemos tenido la oportunidad de mostrar las maravillas de nuestra querida ciudad de Jaén y disfrutar de un estupendo programa social que creo que ha sido del agrado de los asistentes, o al menos, así nos lo han manifestado. Este programa social ha incluido una visita guiada a nuestra Catedral de Jaén,  un paseo por el casco antiguo de la ciudad, un cóctel de bienvenida en los espléndidos jardines de los baños árabes con una actuación de un quinteto de jazz y una cena de gala en el impresionante parador del castillo de Santa Catalina de Jaén, considerado uno de los mejores castillos hoteles del mundo, y desde donde pudimos disfrutar de unas vistas maravillosas de nuestra ciudad, también con una música de fondo interpretada por Charito y acompañada por un guitarrista acústico que junto con el entorno del castillo y la luna casi llena que lucía esa noche fue la guinda final para que todos se fuera con un muy buen sabor de boca y recordando el XXXIX congreso de la SEPLN como una de las mejores ediciones de la historia de la sociedad.

Workshop on Counter Speech for Online Abusive

septiembre 16th, 2023

El pasado 11 de septiembre se celebró en Praga el primer Workshop on Counter Speech for Online Abusive en el marco del congreso internacional Sigdial-INLG 2023 en el que participé como ponente y como invitada en el panel final de discusión.

Se trata de un workshop pequeño pero en el que se han dado cita los investigadores más importantes que están trabajando en el tema de la contranarrativa a nivel mundial. Realmente ha resultado muy productivo, por los contactos realizados y porque hacía tiempo que ya no hacía personalmente la exposición de trabajos.

En un mundo cada vez más interconectado a través de las redes sociales y la comunicación en línea, el discurso de odio se ha convertido en un problema preocupante. Nosotros llevamos ya muchos años trabajando en la detección de este comportamiento inapropiado en redes sociales a través de PLN. Varios artículos, recursos y herramientas que hemos desarrollado lo demuestra, poniendo la guinda con la tesis que defendió mi doctoranda Flor Miriam Plaza del Arco.

Hace algo más de un año, contactaron conmigo desde la Oficina Nacional de Delitos de ODio (ONDOD) porque habían seguido nuestros trabajos de discurso de odio y estaban interesados en avanzar no solo en la detección sino también en la mitigación a través de la generación de contranarrativas. Esta es una estrategia que implica la creación y promoción de mensajes y contenidos que desafían y contrarrestan el discurso de odio, promoviendo valores de inclusión, diversidad y respeto.

Aunque nunca había trabajado en generación del lenguaje me pareció un reto interesantes y empecé a investigar un poco lo que se había hecho hasta el momento descubriendo que prácticamente no había casi nada desde el punto de vista computacional y por supuesto nada de nada en español. Así pues, empezamos a trabajar replicando algunos de los experimentos que había en inglés, y aplicando también GPT3 y GPT4 obteniendo unos resultados impresionantes que son los que hemos presentado en el workshop.

Como comentaba al inicio, la experiencia ha sido muy positiva y el feedback muy productivo. Ahora toca seguir trabajando e intentar avanzar poco a poco en esta tarea tan interesante.

 

 

Estancia en la Universidad Nacional de Córdoba (Argentina)

abril 2nd, 2023

El mes pasado estuve realizando una estancia en Argentina gracias a una beca de la AUIP (Asociación Universitaria Iberoamericana de Postgrado). Elegí la Universidad Nacional de Córdoba (UNC) porque son los únicos que a día de hoy habían realizado un trabajo sobre argumentación contra el discurso de odio en español y yo estoy empezando una investigación relacionada con este tema. En realidad, mi interés está más centrado en la contra narrativa que en la contra argumentación pero creí que podría aprender e iniciarme en el tema de la mano de grandes investigadores. Y así ha sido. Y no solo he aprovechado para enfocarme en la contra narrativa sino que además  tuve la oportunidad de contar los proyectos en los que estamos trabajando actualmente en el grupo para estrechar lazos de colaboración con la UNC. Además también hemos iniciado los trámites para firmar un convenio de colaboración en el que nuestros estudiantes de la UJA y los de la UNC puedan hacer intercambios de movilidad. Creo que será muy provechoso para ambas instituciones.

En el tema personal debo decir que la experiencia ha superado todas mis expectativas, tanto profesionales como personales ya que tuve la oportunidad de disfrutar de algunos viajes relámpago durante un par de fines de semana y puede visitar las cataratas de Iguazú y el perito moreno. Ambos lugar son indescriptibles y ni por asomo las fotos y vídeos que hice reflejan la espectacularidad de la naturaleza. Solo puedo dar un consejo y es que si alguien tiene la mínima oportunidad de visitarlos, que no lo dude y aproveche la ocasión.

Nueva Doctora Plaza del Arco

febrero 2nd, 2023

El pasado día 30 de enero, mi doctoranda y amiga Flor Miriam Plaza del Arco defendió su tesis doctoral “Detecting Offensive Language by Integrating Multiple Linguistic Phenomena”. Fue un día muy bonito y emotivo que pone el broche de oro a una magnífica trayectoria de inicio a la investigación que no es ni más ni menos que el fruto de todo el trabajo, dedicación, esfuerzo y constancia que ha empleado para desarrollar su tesis durante todos estos años. Es verdad que algunas tesis se hacen con menos esfuerzo y mucho más rápidamente, en algunas ocasiones sin apenas obstáculos. Sin embargo, como siempre digo a todos mis doctorandos, lo realmente importante en una tesis es disfrutar del camino, tanto de los buenos momentos como de los malos (estos probablemente son los que más enseñan y fortalecen), y sobretodo sentirse orgulloso con el resultado final, ser consciente de que lo has dado todo y no se ha quedado nada en el tintero. Yo creo que Flor está más que orgullosa con su trabajo. Esa satisfacción no tiene precio y es lo que da sentido a todos los años de trabajo y esfuerzo.

Aún recuerdo el año en el que conocí a Flor cuando era su profesora de Fundamentos de Bases de Datos en 2º del Grado de Ingeniería Informática. Desde entonces, siempre tuvimos relación y cuando, dos años después, en 4º de carrera le dirigí su TFG sobre minería de emociones, ya empecé a intuir que si se decidía por la carrera investigadora, tendría éxito asegurado. Y no porque tuviera buenas calificaciones o porque fuera muy perfeccionista y entusiasta en las tareas que se le encargaban. La característica que la hacía perfecta para afrontar una tesis era la perseverancia  en todos los trabajos que realizaba. Creo que esta actitud junto con la pasión por lo que se hace día a día son la clave del éxito de cualquier tesis (en realidad de cualquier meta que nos planteemos en la vida), y Flor lo ha demostrado con creces.

Desde que conocí a Flor, la he visto crecer primero como estudiante, después como investigadora y durante todos estos años, también y lo más importante, como persona. Realmente estoy muy orgullosa de ver en lo que se ha convertido y estoy segura de que no va a tener ningún problema en la nueva etapa que comienza en Milán. Solo queda desearle toda la suerte del mundo y esperar que en algunos años pueda regresar a nuestro grupo SINAI con alguna oportunidad que le permita vivir con un sueldo decente. En cualquier caso, no me cabe duda de que haga lo que haga, siempre irá alcanzando sus metas de manera muy satisfactoria. Querida Flor “Well done and Good luck!!!!”

Nueva etapa

noviembre 1st, 2022

Ayer terminé mi etapa como Vicerrectora de Universidad Digital de la Universidad de Jaén para comenzar a trabajar como Gestora de Proyectos de Investigación en el panel TIC-INF de la Agencia Estatal de Investigación.

Han sido unos años complicados en un vicerrectorado que a priori parecía cómodo pero que se complicó bastante con la gestión de una pandemia que ha estresado sobremanera los servicios de informática, ya de por sí saturados. Sin embargo, cuando echo la vista atrás veo que se han conseguido grandes avances a pesar de las dificultades, empezando por el diseño y despliegue del Plan Director de Transformación Digital y terminando por el último proyecto puesto en marcha que integra las tecnologías de RPA y que creo sinceramente  que supondrá un hito importante en nuestra universidad. Todo esto ha sido posible gracias al trabajo y colaboración de muchos compañeros de los distintos servicios de la UJA y especialmente del Servicio de Informática. Y por supuesto, al apoyo del equipo de gobierno y de toda la comunidad universitaria, que en esos momentos duros ha estado a la altura y ha demostrado su profesionalidad y compromiso con la institución. No me queda más que dar las gracias por hacerme el trabajo más fácil y por la comprensión en la época que nos ha tocado vivir. Personalmente, he aprendido un montón, he compartido el trabajo con compañeros increíbles desde el punto de vista personal y profesional, y he conocido cómo funciona una universidad desde dentro. Poco más se puede pedir para cumplir las expectativas marcadas al inicio de mi camino en gestión.

Ahora empiezo mi nueva etapa en la Agencia con gran ilusión y algo de vértigo inicial pero con la seguridad de que aprenderé muchísimo y encontraré nuevos compañeros de viaje que harán que valga la pena asumir nuevos retos.

 

PERTE de la nueva economía de la lengua

junio 11th, 2022

La semana pasada asistí como invitada en una de las mesas redondas a las Jornadas sobre Tecnologías del Lenguaje que se celebraron en San Sebastián. Estas jornadas se organizan, entre otras muchas razones, para fomentar el nuevo PERTE de la lengua y poner en valor las Tecnologías Lingüísticas como área fundamental de la Inteligencia Artificial. Este PERTE tiene asignados 1.100 millones de millones de euros de inversión pública y pretende además movilizar otros 1.000 millones de inversión privada. Es una gran iniciativa que demuestra que el Procesamiento del Lenguaje Natural no es una moda sino que estas tecnologías son ya una realidad por la que los gobiernos y el sector privado están apostando seriamente. Sin embargo, veo un gran riesgo y es que todo este dinero no se pueda llegar a ejecutar por falta de gestión y de estructuras organizativas que permitan el flujo efectivo y adecuado de estas inversiones. Esperemos que el gobierno y la nueva comisionada elegida para acometer este proyecto estratégico sean capaces de llevar a buen puerto esta apuesta para aprovechar el potencial del español y de las lenguas cooficiales como factor de crecimiento económico y competitividad internacional.

En cualquier caso, la impresión personal que me llevé de las jornadas es que se está trabajando bien y con ahínco para que así sea, se están involucrando a todos los sectores y actores que pueden desempeñar algún rol relevante en este ámbito. En el caso concreto de las jornadas que se han organizado en el País Vasco (hay que aclarar que ya se organizaron unas jornadas similares en Galicia y que se tienen previstas otras en distintas regiones del país), además de los apoyos institucionales a todos los niveles, se organizaron mesas redondas sobre empresas, investigación y formación en tecnologías del lenguaje para debatir los distintos puntos de vista, fortalezas y debilidades que nos encontramos, oportunidades y retos que necesitamos abordar.Como digo, por el bien de todos, esperemos que seamos capaces de ejecutar estos fondos de la mejor manera posible y que consigamos situar al español y las lenguas cooficiales como un activo importante para la economía de nuestro país.

Inteligencia Artificial y Ética

marzo 16th, 2022

Coincidiendo con el Día de la Mujer, 8 de marzo de 2022, invité a Emilia Gómez, investigadora del Joint Research Centre de la Comisión Europea en Sevilla, para que nos diese una charla relacionada con el trabajo que realiza dentro de la comisión y fundamentalmente centrada en aspectos sobre ética en el desarrollo de sistemas de inteligencia artificial. Emilia coordina el equipo de investigación HUMAINT (Human behaviour and machine intelligence) que estudia el impacto social, ético y económico de la inteligencia artificial en las personas y tiene una larga experiencia en investigación habiendo coordinado varios proyectos de calado internacional. Además, ha sido galardonada con un gran número de premios y reconocimientos que realzan la figura de esta mujer implicada  en promover el papel y las oportunidades de la mujer en el área de la ingeniería y la inteligencia artificial.

Durante la charla, que podéis ver aquí, Emilia nos habló sobre diferentes casos de uso en los que se aplican masivamente tecnologías de inteligencia artificial y en los que hay que plantearse algunos dilemas éticos que se deben estudiar con cuidado para que realmente estos sistemas sean una ayuda para la sociedad y no se conviertan en una amenaza. Merece la pena escuchar a Emilia y aprender muchos de los detalles que a veces se nos escapan cuando ponemos el foco en resolver problemas. Realmente ha sido una muy buena forma de celebrar el año de vida de la comunidad DiverTLes.

 

Agencia Digital de Andalucía

febrero 5th, 2022

El pasado miércoles 19 de enero asistí a la constitución del consejo asesor de la nueva Agencia Digital de Andalucía (ADA). He sido nombrada representante en este consejo de las universidades andaluzas.

Aunque en un principio no sabía muy bien a lo que asistía, la verdad es que me sorprendió bastante el trabajo que se está haciendo. En primer lugar, se ve que un objetivo que han perseguido es la gestión del gasto y al menos algo han conseguido, ya que todas las consejerías y agencias han aunado los gastos para que estén centralizados. Pero quizás lo que más me ha gustado es que han basado gran parte del trabajo en la estrategia y han definido un plan con 5 ejes sobre los que actualmente se está trabajando. De hecho, el primero de ellos es el de ciberseguridad y ya parece que el plan estratégico está diseñado y será presentado en breve. Los otros ejes son el de Capacitación Digital, Inteligencia Artificial, Servicios digitales para la ciudadanía y Cloud. Ahora se están creando los grupos de trabajo para cada uno de estos ejes, y yo por mi parte me apuntaré al de Inteligencia Artificial que creo que es en el que más puedo aportar. Sin embargo, en la medida de mis posibilidades intentaré también ver cómo la ADA puede ayudar a las universidades, por ejemplo, mediante una racionalización del gasto o mediante la compra compartida de infraestructura tecnológica crítica.

Esperemos que esta nueva agencia sea capaz de gestionar adecuadamente los servicios TI y que realmente sea capaz de acometer la transformación digital que Andalucía necesita.

 

Charla coloquio Tecnologías del Lenguaje en la Empresa

diciembre 4th, 2021

El pasado día 30 de noviembre celebramos un nuevo evento organizado por DiverTLes: Diversidad en Tecnologías del Lenguaje en España. En esta ocasión pasamos a un formato más informal en el que no se realizaron exposiciones de trabajos sino que simplemente se presentaron a tres ponentes que forman parte de la comunidad DiverTLes. En esta ocasión se trataba de mujeres que trabajan en la empresa privada aportando su conocimiento en Procesamiento del Lenguaje Natural. Se fueron realizando preguntas y las ponentes contestaban según su perfil y formación. Las 3 ponentes en de la charla coloquio “Tecnologías del Lenguaje en la Empresa” fueron:

  • María Aurora Grandury González: Graduada en Matemáticas y Física que actualmente trabaja como ingeniera e investigadora de Machine Learning enfocada en las áreas PLN y IA explicable en la startup alemana neurocat. Es la fundadora de “NLP en ES”, una comunidad de hispanohablantes que, con el apoyo de Hugging Face, tiene por objetivo crear y compartir recursos que aceleren el avance del PLN en español. Recientemente se ha unido al proyecto internacional BigScience sobre modelos y bases de datos multilingües. La misión de neurocat es hacer que la IA sea segura tanto para la industria como para la sociedad. Su producto central es aidkit.ai, una herramienta para la evaluación de la fiabilidad de cualquier modelo de ML. En lo referente al PLN, aidkit ofrece algoritmos capaces de explicar las predicciones de modelos tan complejos como los basados en Transformers y ataques adversarios capaces de generar perturbaciones que hacen variar las predicciones de los mismos. El principal caso de uso se centra en chatbots y asistentes virtuales.
  • Muntsa Padró: Licenciada en Física en la Universidad de Barcelona (2002) y doctorada por la Universidad Politécnica de Cataluña (2008). Ha trabajado como postdoc en la Universidad Pompeu Fabra y en la Universidade Federal do Rio Grande do Sul (Brasil). Posteriormente trabajó como ingeniera de investigación en Natural Language Understanding en Nuance en Canadá y en Holmes Semantic Solutions, en Francia. En 2017, toma la dirección del grupo de análisis semántico en Eloquant (originalmente Holmes Semantic Solutions), y en 2018 la dirección de todo el departamento de Investigación y Desarrollo.  Eloquant es especialista en soluciones SAAS para la gestión de la relación cliente. Estas soluciones incluyen principalmente software para la gestión de call centers y encuestas en línea. Para enriquecer los datos generados por esos productos, Eloquant desarrolla módulos de extracción de información (clasificación, análisis de opinión, etc.) tanto para texto escrito (comentarios, mails, chat) como audios (conversaciones telefónicas).
  • Melania Sánchez Masià: Licenciada en Filología Hispánica por la Universidad de Valencia (2010) y doctora en Ciencia Cognitiva y Lenguaje por la Universidad Autónoma de Barcelona (2017). Desde 2016 contribuye a la mejora de sistemas de PLN en Google a través de Adecco Outsourcing donde ocupa el puesto de Analytical Linguistic Project Manager. Además, es profesora asociada en el departamento de Teoría de los Lenguajes y Ciencias de la Comunicación de la Universidad de Valencia. Adecco Outsourcing es una empresa que gestiona la externalización de procesos y servicios para otras empresas. Entre sus actividades está la subcontratación de personal para trabajar en otras empresas como, por ejemplo, las grandes tecnológicas. En concreto, Melania da servicio a Google desarrollando diferentes procesos relacionados con el PLN principalmente para el asistente de Google, pero también para muchos otros de sus productos en los que se usa de forma masiva las tecnologías del lenguaje humano como su buscador de información, Google Maps, Google Home, Google Translate, YouTube, GMail, etc.

La charla coloquio se centró fundamentalmente en la percepción que tienen las ponentes sobre el uso del PLN en la empresa, de la proyección de las tecnologías del lenguaje y de cómo se aplican en el mundo empresarial, de por qué su elección laboral se encaminó hacia la empresa en lugar de a la academia, entre otras cuestiones. Fue una nueva actividad que resultó muy reveladora e interesante en la que también participaron algunos asistentes haciendo preguntas en directo.

El evento está disponible a través de YouTube y también en la web de DiverTLes.