De la hoja de cálculo a la línea de código… con la IA en el horizonte. Así exprimen la tecnología los periodistas de datos en España
Lejos del debate sobre si todos los periodistas deben saber programar, los especializados en datos lo tienen bastante claro. Lenguajes como R o Python son recursos habituales entre estos profesionales para automatizar tareas, limpiar y analizar datos, y crear visualizaciones personalizadas. En 2021, los periodistas recurrían a la programación cuando tenían delante de ellos una gran cantidad de datos y los programas como Excel no permitían manejarlos. Sin embargo, en la actualidad, la mayoría de los profesionales utilizan lenguajes de programación para todo tipo de piezas, siendo la creación de visualizaciones especiales y la identificación de tendencias las motivaciones clave para ponerlos en práctica.
Ésta es una de las principales conclusiones a las que se llega en el artículo “Evolución del uso de lenguajes de programación y herramientas digitales en el periodismo de datos español”, que acabamos de publicar Enrique Ribera y Félix Arias en la revista Estudios sobre el Mensaje Periodístico. Hablamos con 18 periodistas de datos de los principales medios de comunicación generalistas que cuentan con una sección dedicada a esta especialidad en España (RVE, El País, elDiario.es y El Confidencial), de medios digitales que apuestan por las nuevas narrativas innovadoras como Civio, Datadista, El Orden Mundial, StoryData o Relevo o los principales verificadores de noticias, Newtral y Maldita. Lo hicimos en dos etapas (2021 y 2024) para medir también la evolución de esta tendencia.
En el artículo, se describen las herramientas y habilidades que los periodistas están adoptando para navegar en este nuevo entorno y se analiza el papel de la programación y de la inteligencia artificial (IA) en la producción de periodismo de calidad y se abordan los desafíos y oportunidades que plantea esta transformación.
Pese a ser una tecnología que ha aterrizado hace relativamente poco en los medios de comunicación, las preferencias de los profesionales están evolucionando. El lenguaje de programación R cada vez es más utilizado en las redacciones españolas en lugar de Python. ¿El motivo? Posiblemente debido a su amplia comunidad y su interfaz más amigable para aquellos familiarizados con hojas de cálculo. Aun así, la elección del lenguaje sigue dependiendo de las necesidades y preferencias de cada periodista. Mientras tanto, JavaScript continúa siendo la opción estrella cuando se trata de visualización de datos.
Por otro lado, la automatización de procesos y la extracción de información, que antes eran una prioridad, han pasado a un segundo plano. Esto indica que la programación ya no es solo una herramienta puntual, sino una parte más integrada del trabajo diario en los medios. Eso sí, factores como el tiempo disponible y la cantidad de datos siguen influyendo en qué tecnología utilizar.
Herramientas para analizar y visualizar datos
Los periodistas de datos también recurren a una variedad de herramientas y técnicas, desde software especializado en visualización hasta la Inteligencia Artificial. La selección de herramientas adecuadas es crucial para cada etapa del proceso.
Aunque hoy en día muchos datos pueden obtenerse con un simple “botón de descarga”, la fase de obtención de datos sigue siendo la que más recursos requiere. Herramientas como Tabula, Import.io y WebScraper se han convertido en aliados indispensables para la extracción de información de diversas fuentes.
La limpieza de datos encuentra en Excel y Google Spreadsheets sus aliados favoritos, desplazando a OpenRefine. Excel se consolida para tareas específicas, mientras que Google Spreadsheets facilita la colaboración en equipo. Power BI, una herramienta de Microsoft como Excel, emerge como una opción avanzada para aquellos que requieren funcionalidades más avanzadas.
El análisis de datos continúa confiando en Excel y Google Spreadsheets como herramientas de referencia. Curiosamente, plataformas pensadas para la visualización, como Datawrapper y Flourish, también se emplean para detectar tendencias y realizar verificaciones rápidas. Sin embargo, Tableau ha perdido popularidad en este ámbito..
A la hora de visualizar la información, Datawrapper se ha consolidado como la opción más rápida y clara, mientras que Flourish se usa para gráficos más elaborados.. Herramientas complementarias como Illustrator, software de gráficos vectoriales de Adobe, y el Sistema de Información Geográfica de código abierto y gratuito QGIS amplían el abanico de posibilidades.
Tres años después, se observa una consolidación de las herramientas más eficientes y una reducción en la diversidad de opciones utilizadas. Esto refleja una mayor especialización y una búsqueda de herramientas que se adapten a las necesidades específicas del periodismo de datos.
La IA se hace hueco
La inteligencia artificial también está empezando a hacerse un hueco en el periodismo de datos. Aunque su uso aún es limitado, su potencial es enorme: desde identificar patrones en grandes volúmenes de información hasta generar resúmenes de texto de manera automática. Eso sí, los periodistas insisten en que su aplicación debe ser responsable, garantizando siempre la precisión y el uso ético de los datos..
La integración de la IA en las redacciones españolas está en una fase de exploración, con los periodistas de datos viendo en ella una aliada perfecta para mejorar la programación. La capacidad de la IA para pulir y generar código es vista como una herramienta valiosa, aunque no exenta de riesgos. Además, se reconocen otras aplicaciones potenciales, como la asistencia virtual en la búsqueda de información.
A pesar del entusiasmo por las posibilidades de la IA, existe un consenso generalizado sobre la necesidad de cautela. Los periodistas son conscientes de las limitaciones de la IA, especialmente en lo que respecta a la precisión y la fiabilidad. La mayoría coincide en que la IA no debe utilizarse de forma autónoma en tareas críticas como el trabajo editorial y el fact checking, donde el juicio humano y la verificación son indispensables.
El uso de la inteligencia artificial en el periodismo de datos sigue generando debate, principalmente por su tendencia a generar información errónea y la falta de transparencia en su funcionamiento. Además, los periodistas destacan la necesidad de mejorar la programación desde cero, hacer las herramientas más accesibles e integrarlas mejor con plataformas como RStudio.
Entre las herramientas de IA más utilizadas, ChatGPT destaca como la opción favorita por los periodistas de datos españoles. Otras herramientas como Midjourney se utilizan para tareas específicas, como la obtención de datos de PDF borrosos o la generación de imágenes. Sin embargo, a pesar de la popularidad de ChatGPT, muchos periodistas aún no utilizan herramientas de IA en su trabajo diario debido a las preocupaciones sobre su fiabilidad. Aquellos que sí las utilizan, la aplican principalmente para la visualización de datos, la obtención y limpieza de datos, y el análisis avanzado. Herramientas como Julius y Aino.word complementan a ChatGPT en estas tareas.
A pesar del potencial que ofrece el periodismo de datos, también existen desafíos que superar. La falta de formación y habilidades técnicas sigue siendo una barrera importante. Por ello, es necesario que tanto las universidades como los medios apuesten por la formación de periodistas en estas áreas. Otro desafío es la calidad de los datos: los periodistas deben ser capaces de detectar datos poco fiables. Para ello, los periodistas necesitan realizar las preguntas adecuadas a las bases de datos y tener conocimiento sobre estadística.
El periodismo de datos ha transformado la forma en que se investiga y se cuenta la información. Con nuevas herramientas y habilidades, los periodistas pueden ofrecer historias más profundas, precisas e interactivas. A medida que la tecnología avanza, es esencial que el sector se adapte y aproveche todas las posibilidades. El futuro del periodismo depende de la capacidad de los profesionales para abrazar la innovación y utilizarla para producir un periodismo de calidad, riguroso y relevante para la sociedad.