IA detecta miles de científicos notables ignorados en la enciclopedia Wikipedia

En Wikipedia no están todos los que son. Faltan muchas biografías, sobre todo referidas a mujeres, pues estas sólo protagonizan el 18% de las entradas que existen en la enciclopedia. Recordar o identificar a todas las personas susceptibles de figurar en ella no es tarea fácil para los editores de Wikipedia. Pero los recientes avances en tecnologías de procesamiento de lenguaje natural pueden ayudarles a solventar el problema.

A Quicksilver –una herramienta de inteligencia artificial creada por la start-up Primer– le bastó una mañana para detectar 40.000 científicos ignorados por la versión inglesa de la enciclopedia de internet y que sin embargo disponen de una cobertura informativay de una relevancia investigadora similar a la de aquellos que sí figuran en ella. Y al llegar la noche, la cifra de científicos potencialmente elegibles para un artículo de Wikipedia ya se había doblado.

Evelyn Wang, la directora del prestigioso departamento MechE del MIT –cuyos logros incluyen un dispositivo que genera agua potable a partir de la luz solar y del aire del desierto–, o Miriam Adelson, médica e investigadora que ha publicado alrededor de un centenar de artículos sobre la fisiología y el tratamiento de adicciones, editora del periódico más grande de Israel y multimillonaria por matrimonio, son dos ejemplos de las ausencias que reveló Quicksilver.

John Bohannon, biólogo y periodista científico, explica en el blog del equipo de ingeniería de Primer que entrenaron los algoritmos de aprendizaje automático de Quicksilver con treinta mil artículos sobre científicos de la Wikipedia en inglés, las entradas en Wikidata y más de tres millones de párrafos de noticias que los describen a ellos y su trabajo. Después le proporcionaron los nombres y las filiaciones de dosciento mil autores de artículos científicos extraídos de un motor de búsqueda académico.

Y con todo ese bagaje, el sistema de inteligencia artificial no sólo encontró a decenas de miles de cien¬tíficos “desaparecidos” de la Wikipedia, sino que además identificó información relevante o más actualizada de la mayoría de los 30.000 que sí se mencionaban en la enciclopedia. Por ejemplo, encontró que el artículo sobre el psicólogo Aleksandr Kogan, que desarrolló la aplicación que sirvió a Cambridge Analytica para hacerse con los datos de millones de usuarios de Facebook, se creó en marzo del 2018, al explotar el escándalo, y dejó de actualizarse el 26 de abril, de modo que no menciona que también manejó datos de usuarios de Twitter porque esa información se reveló días después.

Pero además de identificar quién falta o qué información han olvidado actualizar los editores de Wikipedia, Quicksilver aprovecha las noticias que lee y la información que recaba para escribir breves resúmenes biográficos de esos científicos, para generar de forma automática artículos similares a los de Wikipedia. Pero esos artículos no se publican directamente en la enciclopedia abierta, sino que se proponen como un borrador, como un punto de partida para que los editores de esta puedan revisar y corregir errores y verificar las fuentes utilizadas por el sistema algorítmico.

Bohannon, responsable del proyecto Quicksilver, asegura que esta herramienta de inteligencia artificial pretende ser una ayuda para los editores humanos, acelerar su producción y contribuir a llenar las lagunas que hay en el proyecto. “La autoría humana de Wikipedia es su fortaleza; el proceso deliberativo de los editores asegura que Wikipedia sigue siendo sólida y tiende a un consenso (…); pero las máquinas, que ya se usan para detectar vandalismo e identificar artículos poco respaldados, pueden rastrear y resumir la información que falta en los artículos e incluso identificar artículos que faltan por completo y generar el primer borrador”, justifica.

A modo de experimento, y desde el pasado día 2, el equipo de Primer está publicando en Quicksilver.primer.ai los breves resúmenes que su sistema de inteligencia artificial ha elaborado de un centenar de científicos que no figuraban en Wikipedia para ver cuánto tiempo transcurre antes de que se creen artículos sobre ellos en la enciclopedia.

Por otra parte, el equipo técnico trabaja para convertir Quicksilver en una herramienta multilingüe –la prioridad más inmediata es expandirla al ruso y al chino– y ampliar su conocimiento a personas relevantes de otros ámbitos, como por ejemplo los políticos.

Fuente: lavanguardia.com