Periodistas de datos, una lista para registrarlos a todos
Todo comenzó con una pregunta mental: ¿cómo puedo localizar a los periodistas de datos en España? Un primer rastreo me proporcionó alguna lista de Twitter, un grupo de trabajo en Meetup y algún artículo científico exploratorio. Las incógnitas se multiplicaron: ¿faltan nombres? ¿Están actualizados? ¿Hay forma de ponerse en contacto con ellos?
La respuesta parecía obvia: había que crear un proyecto de periodismo de datos sobre periodistas de datos (entiéndase la redundancia). El proceso tenía que seguir las fases habituales: búsqueda, extracción, limpieza, análisis, visualización… Y había que testar cuanto antes el proyecto. Así se lanzó periodistasdedatos.com, un listado para visibilizar, estudiar y fomentar la colaboración entre los profesionales de esta especialidad que ya cuenta con 334 miembros.
Dos meses, tres listas y nueve categorías
Pero me he saltado unos cuantos pasos intermedios. A principios de mayo le formulé la pregunta inicial a Miguel Carvajal y la cogió al vuelo sin dudar. Ya tenía desarrollador y compañero de fatigas. Sin pensarlo mucho más, tiré del hilo en Twitter a partir listas, búsquedas, etiquetas (#periodismodatos, #periodismodedatos, #ddj…) y proyectos formativos y periodísticos centrados en datos. El primer resultado fue una lista de 219 miembros:
Queremos reunir a todos los que hacen periodismo de datos en español. Y empezamos con una lista de Twitter con 219 miembros 👇https://t.co/zzLDIPdQXw
— Félix Arias Robles (@flxarias) 10 de mayo de 2018
Cualquier sugerencia será bienvenida 🧐
Llegaron las primeras sugerencias, pero el grueso de los nuevos registros se alcanzó gracias a un scrapping con webscraper de diversos grupos de Meetup de Hacks/Hackers principalmente).
El dataset sobrepasó las 5.000 filas. Había llegado la hora de cribar. Y mucho. Fue un proceso algo artesanal basado en dos criterios:
-
Que tuviera una cuenta en Twitter (la red más común en esta ámbito y una forma de verificar la información y mantenerla actualizada).
-
Que se acercara lo máximo posible a alguno de los ejes del periodismo de datos (vinculados a sus fases): investigación, transparencia (búsqueda), desarrollo (extracción), análisis y visualización
Al mismo tiempo, se añadieron profesionales de las secciones de investigación, visualización y datos de medios y proyectos periodísticos innovadores, incluidos los del ranking de innovación periodística.
Era el momento de volver a scrapear, esta vez con los perfiles de Twitter, campos como el nombre, el perfil o la ubicación. Y, por último, de añadir algunos campos adicionales como el sexo o las categorías (que son la parte más interpretativa y, por tanto, más subjetiva y polémica del proyecto). Estos los criterios empleados para etiquetar a los profesionales:
-
#redacción: experiencia y habilidad para contar historias a partir de datos.
-
#academia: estudio científico y formación en periodismo de datos.
-
#proyectos: desarrollo de algún producto basado en la investigación periodística y los datos.
-
#desarrollo: programación o escritura de código para facilitar las diferentes fases del trabajo periodístico.
-
#visualización: diseño y confección de representaciones gráficas estáticas o interactivas.
-
#verificación: enfoque en certificar la autenticidad de información.
-
#transparencia: especialización en legislación o procesos de solicitud de información de interés público para su posterior publicación.
-
#investigación: periodismo más allá de declaraciones, de filtraciones y de unos pocos documentos.
-
#análisis: conocimientos sobre estadística, minería de datos y todo ese universo.
Mientras tanto, la web había empezado a germinar. Poco a poco, la librería de Bootstrap iba cobrando vida en Github hasta dar forma a categorías, formularios y popups para los primeros 303 miembros de la lista.
Hoy estrenamos ⏩ https://t.co/GbhxYUtMIi, una lista que reúne a profesionales "que ven en los datos la verdadera materia prima del #periodismo", como dice @flxarias, impulsor del proyecto. Aporto mi granito de arena con el diseño y desarrollo web: #periodistasdedatos pic.twitter.com/L5epYfJiAW
— Miguel Carvajal (@mcarvajal_) 19 de julio de 2018
Primeros resultados
Dos días después de presentar la primera versión de la web, habíamos recibido más de veinte peticiones. Ahora, cuando el proyecto apenas ha cumplido una semana, tenemos otras tantas en lista de espera.
Tras la primera actualización se extrajeron los primeros resultados demográficos. De los 334 miembros, un 51,05% son hombres y un 48,95%, mujeres. El 58,41% reside en España, el 11%, en Argentina y el 5,5%, en Estados Unidos.
Listado actualizado en ⏩ https://t.co/R6AmieeLHY
— Félix Arias Robles (@flxarias) 23 de julio de 2018
Primer avance de datos demográficos:
170 hombres
163 mujeres
97 de Madrid
54 de Barcelona
37 de Argentina
¡Y muchos aún por registrar! ▶️ https://t.co/VDvLc8aOAS#periodistasdedatos 🔁 pic.twitter.com/LrpRqlnlLr
Y esto es todo por ahora. Pero lo cierto es que el proyecto no ha hecho más que empezar. #Periodistasdedatos nace para ser una red especializada, actualizada y, sobre todo, abierta. Por eso animamos a que cualquiera aporte sus datos o los de cualquiera que conozca. Y si se le ocurre otra forma de colaborar, estaremos encantados de escucharle.
En los próximos meses, añadiremos mejoras como la posibilidad de registrarse y editar perfiles propios y ajenos, listados paralelos de proyectos y herramientas o un sistema de votaciones y otro de generación de colaboraciones. Porque nos proponemos visibilizar, estudiar y fomentar la colaboración entre periodistas de datos. Por eso lanzamos una lista para registrarlos a todos.