Periodismo de Datos en 2015: análisis de El Mundo y The Guardian

June 24, 2017 | Autor: Eva Tuñas López | Categoría: Big Data, Data Journalism, Data-Driven Journalism
Share Embed


Descripción

Facultad de Ciencias de la Comunicación

TRABAJO DE FIN DE GRADO El periodismo de datos en 2015: análisis de El Mundo y The Guardian

Autora: Eva Tuñas López Tutores: Xosé López García y Carlos Toural Bran Grado en Periodismo Santiago de Compostela, junio de 2015

Dedicatoria

A mis padres, por su ilusión y apoyo en todas las decisiones que he tomado y por ayudarme a convertirme en lo que siempre quise ser.

Agradecimientos Gracias a Xosé López, por su atención y ayuda prestada para sacar este trabajo adelante siempre que así lo necesité; y a Arturo, por sus consejos y ánimos constantes.

1

Resumen

El trabajo y los procesos de producción de la información dentro de la profesión periodística han cambiado en gran medida a lo largo de los últimos años debido, entre otras cosas, al rápido avance de las nuevas tecnologías, lo que ha provocado como consecuencia, que se almacenen enormes cantidades de datos en la red. Por este motivo, han sido varias las empresas informativas que han visto en el tratamiento y uso de los datos una buena oportunidad para salir de la crisis que sufre el periodismo en la actualidad. En este sentido, este trabajo se centra en el estudio del conocido como Periodismo de Datos desde los diferentes ámbitos de desarrollo del mismo, con la pretensión de describir un perfil completo de esta nueva disciplina. Además, se presenta un análisis de las características propias de este tipo de proyectos en dos cibermedios, uno nacional, El Mundo, y otro extranjero, The Guardian.

Abstract Work and production processes of information inside the journalistic profession have changed greatly over the years due to the fast development of new technologies, which has provoke, as a result, huge amounts of stored data on the web. Accordingly, there have been several media companies that have seen a good opportunity to try to get out of the crisis that journalism is facing nowadays. This project focuses on the study known as Data Journalism from the different phases of development which this area has, with the aim of describing a complete profile of this new discipline. In this regard, it is presented an analysis of the characteristics of this type of projects in two online media features, one from Spain, El Mundo, and other from the United Kingdom,

The

Guardian.

2

Índice de contenidos 1.

Introducción .......................................................................................................................................... 5 1.1 Justificación ........................................................................................................................................ 5 1.2 Objetivos del estudio........................................................................................................................... 9 1.3 Hipótesis ........................................................................................................................................... 14

2. Periodismo de datos ................................................................................................................................ 14 2.1 Definición y características ............................................................................................................... 14 2.2 Evolución histórica y antecedentes teóricos ..................................................................................... 22 2.3 El fenómeno del Big Data y su influencia en el periodismo de datos ............................................... 29 2.4 Ejemplos de trabajos realizados a partir del periodismo de datos.................................................... 32 2.5 Importancia del Periodismo de Datos en la corriente periodística actual ........................................ 40 2.5.1 Ley de Transparencia, Acceso a la Información Pública y Buen Gobierno en España ............. 42 3. Características profesionales, etapas de trabajo y herramientas en el periodismo de datos .................... 47 3.1 Perfil profesional del periodista de datos .......................................................................................... 51 3.2 Fases de trabajo en periodismo de datos ........................................................................................... 56 3.3 Herramientas y aplicaciones ............................................................................................................. 67 3.4. Tipos de datos .................................................................................................................................. 68 3.5 Extracción y colección de los datos .................................................................................................. 70 3.6 Comprobación o “factchecking” ....................................................................................................... 76 3.7 Limpieza y preparación de los datos ................................................................................................ 79 3.8 Visualización.................................................................................................................................... 81 4. Análisis y comparación del Periodismo de Datos elaborado por El Mundo y The Guardian ................. 88 4.1 Metodología ...................................................................................................................................... 89 4.2 Análisis de los proyectos seleccionados ........................................................................................... 95 4.2.1 El Mundo ................................................................................................................................... 99 4.2.2 The Guardian ........................................................................................................................... 111 4.2.3 Conclusiones de la comparación de los dos medios de comunicación .................................... 122 4.2.4 Grado de seguimiento de los pasos de la Pirámide de Paul Bradshaw en los trabajos de los dos medios ............................................................................................................................................... 125 5. Conclusiones finales ............................................................................................................................. 127 Bibliografía ............................................................................................................................................... 132

6.Anexos ................................................................................................................................................... 137 Apéndice hemerográfico ....................................................................................................................... 137 Herramientas imprescindibles en el periodismo de datos ..................................................................... 145 Cuestionario realizado al equipo de datos del diario El Mundo ........................................................... 147

4

1. Introducción 1.1 Justificación

A lo largo de la historia del periodismo y la comunicación hemos asistido a multitud de cambios en el ámbito de la tecnología que han provocado considerables avances. La creación de la linotipia y el desarrollo de los sistemas de impresión con la rotativa en el siglo XIX provocaron la generalización en el acceso a la información a través del periódico, el inicio de las emisiones de radio y televisión supuso un cambio radical en la manera de consumir información y entretenimiento y en las últimas décadas la aparición de Internet causó - y continúa haciéndolo-, una crisis en el modelo de negocio del periodismo y un gran desafío para el mismo, al verse involucrado en un cambio de gran calibre que afecta a la búsqueda de información, la elaboración, la gestión y la difusión de las piezas informativas, lo que implica, según muchos autores, una auténtica reinvención. Entre ellos Gómez Mompart, catedrático en la Universidad de Valencia, o João Canavilhas, profesor en la Universidad de Beira Interior, son dos de los investigadores que han elaborado extensos proyectos y estudios sobre los cambios producidos en los últimos años dentro de la profesión. Es indudable que la tecnología ejerce un peso muy importante en la comunicación, pues su forma de difusión depende casi de manera completa de la misma, por ello es indispensable que el periodismo y la tecnología caminen de la mano y se tengan en cuenta mutuamente. Por este motivo hoy en día uno de los principales desafíos está en encontrar el punto en el que la información que se crea pueda ser accesible para todos los dispositivos electrónicos existentes en el mercado, ya sean pantallas de ordenador, tablets, smartphones o el último grito en tecnología: 5

wearables. Pero este no es el único reto en el horizonte. Como indican Flores y Salinas (2012) la situación es de expectación e incertidumbre, pues la gran mayoría de los medios se encuentran en un agujero sin salida del que no saben -o no se atreven- a crear nuevas formas de negocio.

La tecnología no sólo afecta al soporte comunicativo, sino que también tiene incidencia en la información con la que se trabaja cada día. El auge y la democratización de Internet han supuesto una ampliación de las fronteras del periodismo en todas sus vertientes, y una de las últimas y más influyentes del momento es el periodismo de datos, que tiene su fuente principal en el gran volumen de información disponible en la red o Big Data, así como también en el conocido como Código Abierto u Open Data, a través de los que tanto gobiernos como instituciones promueven la transparencia y el flujo de datos abiertos de manera gratuita y accesible para todos. Vivimos en un mundo plagado de datos por todas partes, hoy en día cualquier hecho, independientemente de su magnitud, es descrito con números: cambios sociales, políticos, económicos, demográficos, geográficos, sin descontar el hambre, la pobreza, la riqueza, la tasa de paro, el precio de un café en según qué parte del mundo, los pasos recorridos por una persona diariamente, etcétera. Todo absolutamente todo se mide y se estudia, por ello es pertinente afirmar que los datos han llegado para quedarse y ante esta situación el periodismo tiene la obligación de estar presente para tratar de estudiarlos y analizarlos, desenmascararlos y presentarlos a la sociedad de manera comprensible para poder entender nuestro entorno y actuar conforme a ello.

6

Con todo, es necesario señalar que el periodismo de datos no es una variante, corriente o especialización surgida en los últimos tiempos con el avance tecnológico sino que éste ha ido evolucionando con el paso del tiempo, principalmente a partir del llamado Periodismo de Precisión, concepto desarrollado por el profesor de la Universidad de Carolina del Norte, Philip Meyer1, durante los primeros años de la década de los 90 y, en nuestro entorno, posteriormente tratado en España por José Luis Dader 2 , quien previamente había realizado una estancia en Estados Unidos y conocido los trabajos del profesor Meyer. Cabe destacar que el modo primordial de actuación de esta modalidad se basa en la aplicación de técnicas de investigación social, búsqueda y tratamiento de datos, todo ello llevado a cabo con la máxima competencia profesional en el área de especialización periodística correspondiente (Galindo, 2003). Tanto el periodismo de precisión como el actual periodismo de datos, necesitan de una figura profesional altamente especializada y profesionalizada que sepa responder a todas las necesidades técnicas para poder elaborar este tipo de información. A lo largo del desarrollo de las distintas etapas por las que ha ido pasando el periodismo, nuevas figuras y perfiles profesionales se han ido intercalando entre ellas. Ejemplo de ello es el caso del nuevo periodista todoterreno, heredero del viejo “periodista para todo” o multitarea y periodista multimedia, con diferentes especializaciones, los cuales se han encontrado infinidad de defensores y detractores durante la expansión del uso de la tecnología en el proceso comunicativo.

1

Principal investigador del periodismo de precisión y uno de los referentes a nivel mundial en esta disciplina. Columnista en el diario Usa Today y profesor en la Universidad de Carolina del Norte. 2

Catedrático del Área de Periodismo, especializado en Comunicación Política, Profesionalismo Periodístico y Periodismo de Precisión y de Datos. Es uno de los investigadores más reconocidos a nivel español en este ámbito.

7

En la actualidad existen cada vez más apoyos a la tendencia especializada, con la configuración de perfiles muy definidos por el nuevo entorno comunicativo y los renovados sistemas de producción, necesaria para elaborar información de calidad en las diferentes áreas, cada vez más específicas y de mayor dificultad, que forman los medios de comunicación (Fernández del Moral, 2004).

Después de la crisis que internet trajo al periodismo, se ha podido comprobar como el papel de sus profesionales continúa en vigencia y es altamente necesario. El periodismo de hoy requiere de personal cualificado y preparado ante la ingente cantidad de información existente, no solo en la red, sino en infinidad de documentos en formato físico. Por tanto, la figura del periodista de datos se está erigiendo como un punto importante dentro de las especializaciones del ámbito comunicativo a pesar de que todavía queda mucho camino por recorrer, puesto que en las universidades3 apenas se han implantado estudios sobre comunicación a través del análisis de datos y en nuestro país las publicaciones de este tipo son muy escasas, todo indica a que esta disciplina supondrá una oportunidad de oro para sus profesionales y un importante nicho de mercado dentro de la actual crisis de la profesión. Con todo, siempre hay quien a pesar de no haberse formado durante sus estudios periodísticos en esta especialidad, encuentra la forma de dedicarse a esta rama profesional. Un ejemplo es uno de los antiguos alumnos de la facultad de Santiago de Compostela, Duarte Romero Varela4, estudiante de la facultad en la que se presenta

3

Actualmente se están comenzando a implantar esta especialización en varias universidades del país, entre ellas, la Universidad de Santiago incorpora contenidos de periodismo de datos a asignaturas como Periodismo Especializado y Movimientos Periodísticos y Comunicación Ciudadana. Además, la Universidad Complutense de Madrid ofrece cursos intensivos de verano en esta materia. 4

https://www.linkedin.com/in/duarteromerovarela

8

este proyecto y ahora periodista de datos en Reino Unido, uno de los países con mayor proyección en esta especialidad, y que ha trabajado entre otros, para medios como el Daily Telegraph. Por las razones expuestas en estas líneas, desde mi punto de vista personal, considero que el periodismo de datos es una disciplina que merece ser estudiada y considerada como una gran oportunidad para la profesión, motivo principal por el que he decidido elaborar mi trabajo de fin de grado sobre este tema. En un futuro me gustaría poder encaminar mi carrera profesional en torno a esta modalidad, y por ello he visto en este proyecto un comienzo positivo para ello. Además de la bibliografía utilizada para la elaboración del estudio, en el mes de junio seré partícipe del curso de verano impartido por la Universidad Complutense de Madrid “Big Data, Transparencia y Periodismo de Datos”, impartido, entre otros, por Jesús Flores Vivar, un estudioso e investigador a cuya bibliografía se recurrirá en reiteradas ocasiones a lo largo de esta investigación.

1.2 Objetivos del estudio

El carácter reciente y actual de esta rama del periodismo supone un desafío para todas las investigaciones y estudios que se desarrollan sobre ella y al mismo tiempo las motiva, debido a la escasa documentación disponible sobre el tema, y la leve o casi inexistente aplicación del periodismo de datos en algunos países como España. Los estudios son escasos, aunque ya hay trabajos defendidos en esta misma facultad y, sobre los antecedentes, tesis de Periodismo

9

Asistido por Ordenador5, entre otras. Además, hay varias líneas de investigación en marcha y proyectos muy diversos sobre el tema, tanto en el ámbito nacional como en el extranjero. Por ello este Trabajo de Fin de Grado tiene como pretensión inicial identificar y analizar aquellos aspectos propios y característicos del periodismo de datos en los diferentes ámbitos convergentes del periodismo: el empresarial, el profesional, el de contenido y el tecnológico. De este modo, se buscará examinar de qué manera las nuevas tecnologías han provocado cambios en los medios de comunicación dando lugar a nuevas formas de trabajo, nuevos perfiles profesionales y nuevas formas de contar historias a la sociedad. En especial, este trabajo se centrará en cómo se está introduciendo en los medios la práctica del periodismo de datos y los resultados de dos casos concretos que se analizarán de forma empírica. Así, partiendo de esta base teórica, se profundizará en los antecedentes que han dado paso a lo que hoy se conoce como periodismo de datos y que años atrás fue denominado periodismo de precisión o de bases de datos, además de hacer referencias al estado de la cuestión en el momento actual. Del mismo modo, se analizarán los nuevos perfiles profesionales surgidos a raíz de esta modalidad, sus características y formación necesaria para poder dedicarse a esta nueva forma de comunicación, además de su papel y futuro dentro de la profesión. Con la evolución de los equipos humanos de los medios, aparecen los cambios en el proceso de trabajo, por lo que otro de los ejes centrales de este estudio será indagar en aquellas herramientas y aplicaciones aprovechadas para construir la información - bases de datos, “scraping”, hojas de

5

Un ejemplo de ello es la elaborada por Francisco M. Casal Cortizas, titulada “El periodismo de investigación asistido por ordenador y de precisión aplicado a la prensa local y regional: el contraste entre Estados Unidos y un modelo futuro para Galicia”, desarrollada en la UCM.

10

cálculo, técnicas de visualización, etcétera- , así como su proceso de producción, forma de trabajo y tratamiento. Además, con la intención de poder ejemplificar en mayor medida todo el campo teórico expuesto, e intentando mostrar de una manera más práctica la realidad del periodismo de datos, se llevará a cabo un estudio de uno de los diarios de referencia actuales dentro de este campo, The Guardian 6 , pionero en periodismo de datos y visualización de la información a nivel europeo. La elección de este medio se debe principalmente a su carácter precursor 7 y a su estrategia actual en relación con el periodismo de datos. Con esto, se pretende mostrar la realidad de esta nueva manera de informar y su viabilidad en las formas de negocio actuales a partir de esta experiencia. Por otro lado, y queriendo explicar la situación de esta vertiente en España, se llevará a cabo la exploración de un medio español, El Mundo8, uno de los escasos periódicos que están comenzando a incorporar el tratamiento y la visualización de los datos entre sus piezas diarias y uno de los periódicos de mayor tirada, audiencia y tráfico en la red de todo el territorio español. Una vez realizado el análisis de estos dos diarios, se procederá a su comparación para poder constatar de forma más clara, las diferencias entre la calidad y cantidad de información entre un país como Reino Unido, en donde existen leyes y portales de transparencia promovidos por el Gobierno, y España, en donde todavía, y a pesar de la reciente implantación de la Ley de

6

http://www.comscore.com/esl/Insights/Presentations-and-Whitepapers/2015/UK-Digital-Market-OverviewFebruary-2015 7

Datablog, el espacio dedicado al periodismo de datos del diario anglosajón The Guardian comenzó su andadura en 2009. Se puede visitar en el siguiente enlace: http://www.theguardian.com/data 8

http://www.comscore.com/esl/Panorama-Digital/Datos-actuales/El-Mercado-Online-Espanol-Agosto-2014

11

Transparencia9, todavía no gozamos de un nivel cuantitativo alto, así como 100% fiable de dichos datos públicos. No obstante, aunque los límites que impone dicha ley son perjudiciales para su óptimo desarrollo, este nuevo marco normativo podría favorecer la práctica del periodismo de datos en España. La elección de un determinado medio para el análisis, como en este caso corresponde a El Mundo, no implica que sea el único diario que utiliza los datos para construir sus piezas. Otros periódicos como El País han elaborado informaciones de gran importancia basadas en datos, entre ellos el proyecto llamado “Todos los papeles de Bárcenas” 10 , donde se explica pormenorizadamente el contenido de los papeles que albergan la contabilidad “B” del Partido Popular y su ex tesorero. Además, otros medios nativos digitales del ámbito español como El Español11 - diario creado por Pedro J. Ramírez, ex director de El Mundo- todavía en desarrollo pero ya con varios proyectos publicados en esta modalidad, como el denominado “España en cifras”12, sin descontar el caso de otro diario también concebido hace escaso tiempo y de carácter digital, eldiario.es, donde además de referenciar trabajos de otros autores u organizaciones sobre periodismo de datos, también crean sus propios proyectos, uno de los más recientes se corresponde con varios gráficos y datos sobre las elecciones autonómicas y municipales del mes de mayo de 201513. También existen casos televisivos como “El Objetivo” programa conducido por Ana Pastor o

9

La Ley de Transparencia en España se aprobó en noviembre de 2013 y en diciembre de ese mismo año se publicó en el BOE, pero no fue hasta un año más tarde cuando se produjo su entrada en vigor.https://www.boe.es/boe/dias/2013/12/10/pdfs/BOE-A-2013-12887.pdf 10

http://elpais.com/especiales/2013/caso_barcenas/todos_los_papeles.html

11

Diario creado recientemente por el exdirector de El Mundo, Pedro J. Ramírez. http://espanaencifras.elespanol.com/ 13 http://www.eldiario.es/politica/MAPA-resultados-elecciones-autonomicas-municipales_0_391611869.html 12

12

“La Sexta Noche”, ambos pertenecientes a la misma cadena -La Sexta- en donde se utilizan gráficos y datos para elaborar y esquematizar dichos programas, aunque la incursión de los datos en el periodismo español es muy tímida en la actualidad y es posible que tengamos que esperar años para ver su evolución hacia un nivel de producción alto, similar al de nuestros vecinos europeos. Es en este ámbito europeo donde precisamente se puede comprobar como existe una mayor cultura y actividad en la creación de proyectos periodísticos basados en datos. Además del ya citado The Guardian, en países como Holanda se está extendiendo esta nueva disciplina en medios como De Correspondent14, diario nativo digital con un diseño muy distinto y moderno, con un carácter mucho más visual y avanzado. Además, en Francia, también existen este tipo de medios, como es el caso de Owni15, medio vanguardista dentro del panorama mediático del país galo y cuyo exitoso modelo de negocio está alejado de suscripciones y publicidad, sino que se basa en vender y prestar servicios o herramientas que permiten rastrear millones de datos en la web, aplicaciones, formación o consulting sobre estrategias online. En definitiva, la intención de este trabajo es dar a conocer de manera amplia y clara la historia, antecedentes, características, aplicaciones y herramientas de esta disciplina en proceso de crecimiento y formación y que tiene consigo todas las particularidades para augurar un futuro prometedor al periodismo y a todos los que se dedican a él.

14 15

https://decorrespondent.nl/nieuw http://owni.fr/#aujourd-hui

13

1.3 Hipótesis Como ya se ha indicado el amplio caudal de información que se ha desarrollado en los últimos años ha provocado la aparición de nuevas formas de producir y crear información dentro de los medios de comunicación, pero con todo algunos países tienen índices de productividad en esta materia muy superiores a los de otros a pesar de tener niveles socioeconómicos y culturales muy similares. Por tanto, la hipótesis de este trabajo se basa principalmente en tres puntos : 1. El periodismo de datos tiene un peso mucho menor en España en comparación con otros países europeos, como puede ser el caso de Reino Unido. 2. Los medios de comunicación españoles se están adaptando a esta nueva disciplina de forma tímida pero progresiva. 3. Cada vez existe un mayor interés por parte de los medios y de los lectores en este tipo de información.

2. Periodismo de datos 2.1 Definición y características

Encontrar una definición adecuada y exacta de lo que es el periodismo datos supone un reto importante, motivado principalmente por el hecho de que se trata de una modalidad reciente, apenas conocida entre la sociedad y que todavía está en sus primeras fases de desarrollo. Además la documentación y bibliografía existentes sobre el tema no es muy amplia, pero hay base para

14

una aproximación conceptual a partir de las estudios de los expertos en este campo y de reflexiones de los propios profesionales que lo ejercen. Las investigaciones y hallazgos de Philip Meyer y sus coetáneos, entre ellos Dader, dentro del campo del periodismo de precisión suponen -como se explicará en posteriores epígrafes- una antesala muy importante para lo que hoy en día se entiende por periodismo de datos, el cual ha visto su momento de expansión con la aparición y el desarrollo de la red y las aplicaciones de carácter informativo que se derivan de la misma. Debido a la carencia de unanimidad en torno a este concepto por sus principales estudiosos, la mejor forma de esclarecer las características de este tipo de periodismo es haciendo alusión a aquellas referencias que más se asemejan al uso y aplicaciones actuales de las grandes cantidades de datos disponibles dentro del entorno de la información, también conocidas como “Big Data”, concepto que hace referencia a la acumulación masiva de datos en formato digital y desarrollado y estudiado por, entre otros, por Viktor Mayer-Schönberger 16 , autor del libro “Big Data. A revolution that will transform how we live, work and think” o “Delete: The Virtue of Forgetting in the Digital Age”. Actualmente este fenómeno digital se está convirtiendo en uno de los procesos más importantes en investigación contemporánea en cualquier campo del conocimiento y la producción empresarial (Del Campo, 2014). Esta corriente debe ser entendida en clave de procesamiento de información, pues los datos que lo componen se utilizan principalmente para investigar tendencias, patrones y correlaciones a partir de los que se abre la puerta a un nuevo mercado profesional y laboral, así como una nueva

16

Viktor Mayer-Schönberger es profesor de regulación y gestión de internet en el Internet Institut de la Universidad de Oxford, y uno de los expertos más reconocidos internacionalmente en el mundo de los datos masivos.

15

vía para lograr información privilegiada tanto para empresas privadas como para la sociedad en su conjunto. Mar Cabra17, periodista de investigación y una de las mayores especialistas de este ámbito del periodismo de datos tanto a nivel español como europeo, define este concepto de forma muy clara y concisa, indicando que se trata de una modalidad que “recaba y analiza grandes cantidades de información y datos muy detallados para después hacerlos comprensibles a la audiencia a través de artículos, gráficos, visualizaciones o aplicaciones” (2012). Por su parte, Simon Rogers18, jefe de la sección de datos y visualización del diario anglosajón The Guardian, y de cuyos proyectos se hablará en las siguientes páginas, afirma que el periodismo de datos es un campo que “combina hojas de cálculo, datos extraídos de análisis y las historias más grandes que puedan ser contadas en un medio de comunicación” (2011).

La explicación del periodismo de datos como un proceso o flujo de trabajo (“workflow”) es, bajo mi punto de vista, una de las más acertadas ya que debido a sus características técnicas y a sus pasos de creación de las piezas informativas - los cuales se erigen como obligatorios para cualquier medio de comunicación y soporte - conforman una sucesión de actividades propias y características de esta modalidad, difíciles de encontrar en otros campos del periodismo.

17

Impulsora del periodismo de datos en España, durante el año 2012 dirigió la Fundación Ciudadana Civio y en diciembre de ese mismo año fue nombrada vicepresidenta de la Open Knowledge Foundation 18

Creador de uno de los blogs más importantes que existen sobre periodismo de datos, Datablog, publicado en la web de The Guardian, es considerado uno de los pioneros en este campo. En 2011 publicó el libro “Facts are sacred”, una compilación de trabajos y su visión sobre esta nueva especialidad.

16

Con todo, no se debe olvidar el carácter predominantemente investigativo en el que se engloba esta clase de periodismo. Estudiosos como Jesús Flores19 y la doctora Cecilia Salinas20 (2012) insisten en que dicha modalidad es una nueva veta del periodismo de investigación que se vale de las nuevas herramientas tecnológicas para contar historias y descubrir otras nuevas que narrar. Aquello que le otorga un carácter diferente al periodismo de datos es, según expresa Paul Bradshaw 21 en “Data Journalism Handbook” (2012), “las nuevas posibilidades que se abren cuando se combina el olfato periodístico tradicional y la capacidad de contar una historia convincente con la magnitud y el alcance que conceden las herramientas digitales disponibles en la actualidad”. Las distintas descripciones que pueden ser halladas sobre este campo comunicativo tienen como eje común el ámbito tecnológico, pues el proceso de producción de la información es la base de su definición y lo que más peso acarrea en este ámbito. En este contexto, hablar de periodismo de datos supone pues referirse a nuevas técnicas de obtención y creación de información que requieren a su vez de destrezas y aptitudes en el uso de bases de datos, estadística, rastreo de información y demás. A lo largo de todo el proceso de creación de estas piezas, la visualización es el último escalón y a su vez uno de los más importantes, pues es la presentación del producto final, la manera de 19

Doctor en Ciencias de la Información por la Universidad Complutense de Madrid, es profesor Titular de la misma. Imparte Multimedia, Ciberperiodismo y Tecnologías y Modelos de negocio. Investigador Principal de diferentes proyectos relacionados con el Ciberperiodismo y Cibermedios. 20

Profesora colaboradora honorífica en la UCM. Sus líneas de investigación se centran en la divulgación científica, la ética e historia del periodismo y participa en proyectos de innovación docente e investigación competitiva relacionadas con las temáticas mencionadas en los nuevos soportes digitales. 21

Periodista digital, blogger, profesor en la Universidad de Birmingham. Es cofundador de la web “Help Me Investigate”: http://helpmeinvestigate.com/

17

mostrar todo lo que se ha averiguado sobre un tema. Es en este momento cuando la imagen actúa como mediadora entre números, abundantes cantidades de información y el público, pero todo ello debe hacerse sin caer en la espectacularización de la imagen y el impacto como premisa principal, lo que puede llegar a provocar desinformación (Del Campo, 2014).

La visualización de la información es importante también debido a sus posibilidades de interacción, algo cada vez más demandado por las generaciones más jóvenes, acostumbradas a tratar con imágenes diariamente, lo que se deriva en mayor interés por la información que se presenta y que en ocasiones puede llegar a dotar de una vida más larga para esas noticias, pudiendo ser recordadas y compartidas durante más tiempo que si se tratase de un simple texto escrito.

El periodismo de datos es, en resumen, la conjugación del acceso y manejo óptimo de unas herramientas digitales de calidad que influyen en todo el proceso informativo junto con el objetivo periodístico por excelencia de honrar a la verdad y objetividad. Con este juego de aptitudes se podrá crear una información visual de calidad y comprensible para una audiencia que, de otra manera, no podría entender el mundo que lo rodea del mismo modo y donde el periodista puede ver también una solución a ciertos temas complejos de narrar. Así mismo, resulta interesante dar voz a aquellos investigadores y estudiosos importantes del periodismo de datos ante la cuestión de la importancia y utilidad de esta modalidad

18

comunicativa. En Data Journalism Handbook (2012), Philip Meyer, afirma que una de las cosas más importantes que permite el periodismo de datos es filtrar el flujo de datos. Esto es: “Cuando la información era escasa, la mayor parte de nuestros esfuerzos se dedicaban a la caza y la recolección. Ahora que la información es abundante, el procesamiento es más importante. Procesamos a dos niveles: el análisis para dotar de sentido a la información y la estructura del flujo interminable de datos. En segundo lugar la presentación, para conseguir aquello que es importante y relevante en la cabeza del consumidor. Al igual que la ciencia, el periodismo de datos revela sus métodos y presenta sus resultados de una manera que puede ser verificada por la réplica”.

En la misma línea, Tom Fries22, antiguo miembro de la Bertelsmann Foundation, en Alemania, indica que el periodismo de datos “ayuda a combatir la asimetría de la información”, refiriéndose a la incapacidad de captar y procesar los datos a los que tenemos acceso en nuestra vida diaria. Según Fries, “la información tomada de medios de comunicación escritos, visuales o de audio influyen en nuestra toma de decisiones y el buen periodismo de datos ayuda a combatir este hecho, clarificando las noticias”.

Además, otros profesionales como Isao Matsunami 23 del

Tokyo Shimbun lo consideran una forma de crear opiniones propias e independientes a partir de

22

Profesional del mundo de la comunicación, trabaja actualmente en el Artic Council en Noruega.

23

Periodista de datos y visualización del citado periódico japonés

19

informaciones oficiales, o de ser capaces de ver cosas que de otra manera no podríamos visualizar, según Cheryl Phillips24, de Seattle Times.

Además de realizar una exposición de lo que es hoy en día el periodismo de datos, es necesario situarlo en un contexto dentro del panorama de la comunicación. A lo largo de estas líneas se ha mencionado en varias ocasiones que el periodismo de datos es una modalidad de dicha ciencia, pero se torna necesario indicar dentro de qué corriente tradicional se engloba para poder comprender el término en mayor medida. Según Sandra Crucianelli25, periodista argentina especializada en este campo, muchas personas y profesionales de la rama no encuentran sentido a esta especialidad debido a su denominación, ya que desde siempre los periodistas han utilizado los datos para realizar su trabajo y el término no parece aludir a algo novedoso. Para esta investigadora, “el periodismo de datos no es algo nuevo, sino que es el periodismo de siempre al que ahora se le pueden añadir componentes totalmente nuevos”. A su vez afirma que esta modalidad se engloba dentro de las que se enumeran a continuación: -

Periodismo de investigación (PI), ya que se usan técnicas propias de esta especialidad.

-

Periodismo en profundidad (PP), en mayor o menor medida presente dependiendo del tema que se analice.

24

Profesora en la Universidad de Stanford. Anteriormente fue editora de la sección de Innovación de Datos del diario Seattle Times. En 2011 colaboró en el proyecto Methadone and the Politics of Pain,trabajo merecedor de un premio Pulitzer. 25

Es una de las pioneras en la enseñanza y el ejercicio del Periodismo de Datos en español. Líder de Proyectos Periodísticos Digitales y autora del libro “Herramientas digitales para periodistas”.

20

-

Periodismo de Precisión (PPr), a través del que se recurre a los métodos de investigación social definidos en la década de los años 60 por Philip Meyer.

-

Periodismo Asistido por Computadora (PAC), pues se analizan datos a través de hojas de cálculo, bases de datos, y otras aplicaciones tecnológicas propias de esta disciplina.

-

Periodismo Analítico (PA), debido al uso de métodos analíticos para llevar los datos a sistemas de información geográfica que permitan visualizar el comportamiento de las variables a estudiar.

A mayores, Crucianelli apunta que a la anterior explicación habría que añadir lo siguiente para completar de manera definitiva lo que es y comporta el periodismo de datos: -

Grandes volúmenes de datos

-

Visualización interactiva

-

Incorporación del programador al equipo periodístico para desarrollar tareas que van desde la extracción de datos hasta el diseño de aplicaciones de noticias.

Si se pudiera expresar a modo de fórmula toda la información anteriormente recabada sería la siguiente:

Ilustración 1. Elaboración propia. Fuente: Sandra Crucianelli.

21

Por último, Simon Rogers en su libro “Facts are sacred” (2013), apunta que en su momento ocurrieron una serie de hechos, o más bien coincidieron en un mismo momento, que propiciaron el nacimiento del periodismo de datos. Estos son, según Rogers, los siguientes: -

La viabilidad del uso de los datos a través de internet

-

El uso y manejo sencillo de hojas de cálculo en cada ordenador personal

-

El creciente interés en la visualización de datos, para hacer más fácil la comprensión de la información

-

La aparición de grandes historias que no hubieran sido posibles, o que su comunicación sería muy difícil sin la existencia de las estadísticas detrás de ellas.

2.2 Evolución histórica y antecedentes teóricos

Liliana Bounegru26, miembro del European Journalism Centre, afirma en la publicación “Data Journalism Handbook” (2012) que la primera expresión de la definición del periodismo de datos actual, esto es, tal y como hoy en día lo conocemos, vino de la mano de Adrian Holovaty27, fundador de la web Every Block, un portal informativo que permite a los usuarios saber qué sucesos han tenido lugar en el área que habitan o en la zona por la que suelen estar influenciados.

26

Investigadora de medios en la Universidad de Amsterdam, centrada en el periodismo de datos y métodos digitales. Miembro del grupo de investigación Digital Methods Initiative. 27

Desarrollador web, periodista y emprendedor. Es co-creador de Django framework web y un defensor del periodismo a través de la programación de ordenadores. Además, es una figura muy importante en cuanto al diseño y visualización de datos.

22

Holovaty publicó en el año 2006 una entrada en su blog que lleva por nombre “A fundamental way newspaper sites need to change” 28 en el que daba su opinión sobre la situación del periodismo en aquel momento y sugería lo siguiente: “Digamos que un periódico ha escrito una historia acerca de un incendio[...] Lo que realmente quiero ser capaz de hacer es explorar los hechos crudos de la historia, uno por uno, con capas de atribución y una infraestructura para la comparación de los detalles del incendio - fecha, hora, lugar, victimas, número de estación de bomberos , distancia del cuerpo de bomberos, los nombres y años de experiencia de los bomberos en la escena, el tiempo que le tomó a los bomberos en llegar - con los detalles de los incendios anteriores”.

Por extraño que pueda parecer, Holovaty provocó una revolución con esta entrada, abriendo los ojos a los profesionales del sector de todo lo que se podía y se puede crear con la información, sus utilidades y el interés público que tiene aquello que a veces puede llegar a considerar como absurdo o de banal importancia. A partir del año 2006, cuando tuvo lugar el nacimiento de Wikileaks, y un par de años más tarde, cuando esta organización revolucionó el panorama informativo mundial, se creó el impulso definitivo para el periodismo de datos a nivel global. Desde el momento en el que la página web inicialmente ideada por Julian Assange comenzó a filtrar datos de forma masiva, fueron muchos los medios de comunicación que abrieron los ojos ante el hecho de que algo tenía

28

http://www.holovaty.com/writing/fundamental-change/

23

cambiar en su forma de comunicar lo que pasaba en el mundo, así como las características de su contenido. Años más tarde, en 2010, esta organización comenzó a establecer redes de colaboración con importantes medios como The New York Times, Le Monde, The Guardian o El País, de manera que estas cabeceras tenían un acceso directo a los cables de las filtraciones, teniendo así la oportunidad de poder investigar y profundizar en la información recabada sobre cada uno de los casos. Con el tratamiento de estos datos, se llegó a la conclusión de que de esta forma, se podría demostrar las grandes capacidades y potencialidades de las redacciones de hoy en día, así como provocar un giro radical en la información que se estaba haciendo hasta el momento, demostrando que todavía se puede llevar a cabo la verdadera función social para la que nacieron los medios en su día y que en los últimos años ha estado en decadencia.

Se puede decir pues, que Wikileaks supuso un punto de inflexión para la profesión periodística en la última década, abriendo los ojos a una buena parte de los profesionales de este mundo, siendo conscientes de que para poder continuar en el camino de la calidad es necesario reinventarse, adquirir nuevas capacidades y ser conscientes de los cambios que cada día se producen en el ecosistema informativo, algo que requiere colaboración con otras entidades no específicas del periodismo, pues Wikileaks planteó la cooperación entre empresas mediáticas que en su día fueron rivales, una novedad sin precedentes para un panorama marcado por la competición en la exclusividad e inmediatez. Un año antes del estallido total de Wikileaks en la sociedad, Barack Obama tomó la decisión de abrir un portal dependiente del gobierno, en el que regularmente se publicarían documentos y datos referentes al estado y sus ciudadanos, esto es 24

una web de Open Data. Dicho portal29, en que se aportan datos tan extremos como las crecidas de ríos o el número de crímenes cometidos, provocó una oleada de creaciones y copias de este tipo de webs en muchos otros países como Australia, Nueva Zelanda o Reino Unido, cuya web de datos abiertos fue construido por el creador de la world wide web, Tim Berners- Lee.

Como ya se ha dicho en anteriores apartados, a pesar de que lo que hoy se conoce como periodismo de datos es un campo relativamente nuevo, desarrollado en los últimos años y apoyado por las nuevas tecnologías, sus orígenes se remontan a unas cuantas décadas atrás, con la llegada del Periodismo Asistido por Computadora (CAR en sus siglas en inglés) y el Periodismo de Precisión. Durante las primeras décadas del siglo XX, los sondeos en materia política realizados por varios periódicos en Estados Unidos dieron muestra del creciente interés por todo lo relacionado con este tipo de estudios que trataban de buscar una vía alternativa a la información, pero su uso e inclusión dentro de las publicaciones no se generalizó hasta la llegada de los ordenadores a las salas de redacción. Con el comienzo del uso de este aparato aparece el denominado Periodismo Asistido por Computadora, término utilizado por primera vez en el año 1952 por la cadena CBS durante las elecciones a la presidencia de los Estados Unidos, pero no es hasta los años 70 cuando su uso se instaura de manera habitual en América y Europa, etapa en la que las encuestas comienzan a inundar los periódicos con debates y todo tipo de temas de opinión.

29

http://www.data.gov/

25

Durante estos años, se trataba de utilizar la tecnología para controlar el poder de manera independiente a través del análisis de bases de datos y mostrar así evidencias a las que de otra forma hubiera resultado mucho más difícil darles credibilidad. Este hecho supuso un antecedente muy importante que marcaría el inicio de lo que en el año 1973 Philip Meyer definió como “Periodismo de Precisión”.

Este movimiento nace contra un periodismo convencional y la tendencia imperante de aquellos años conocida como “Nuevo Periodismo”, que proponía un reporterismo de raíces literarias y una fuerte marca personal de autor en cada una de las publicaciones. Puede entenderse que la aparición del periodismo de precisión surge como respuesta a las deficiencias existentes en el periodismo declarativo y testifical de aquel momento, tales como la dependencia de la asistencia a ruedas de prensa, la necesidad de alcanzar exclusivas sensacionalistas o la consideración de que lo único necesario para elaborar un buen trabajo es estar en el lugar de los hechos sin tener en consideración la búsqueda hacia formas más objetivas y veraces de contar lo que sucede. En este sentido, otro de los estudiosos de mayor prestigio en este campo después de Meyer, el español José Luis Dader (1997), expone una hipótesis en su libro sobre periodismo de precisión que refleja a la perfección la esencia de esta especialidad: “La noticia bomba duerme a menudo en los archivos, en los silenciosos listados de una base de datos o en las frías y cabalísticas anotaciones estadísticas de una investigación sociológica, sólo que hacen falta unos conocimientos técnicos y metodológicos para aprender a ver -u observar de otra manera- lo que se oculta delante mismo de nuestras narices”.

26

Así pues, y tratando de huir de la consideración que hasta el momento se había tenido de la definición y aplicación de la práctica periodística, el periodismo de precisión surge como una nueva alternativa basada en la capacidad indagatoria y creativa del periodista, que tal y como sucede en el método científico, parte de una capacidad de observación generadora de problemas y que, como en el conocimiento científico, surge cuando el acervo del conocimiento disponible es insuficiente para manejar determinados problemas o comprender determinadas cuestiones (Galindo, 2003). Para poder entender mejor la anterior definición de Galindo30, es necesario recurrir al primer esbozo del periodismo de precisión realizado por Meyer (1989), descrito como la aplicación de métodos de investigación social y comportamental a la práctica del periodismo tales como la encuesta, el sondeo, los experimentos psicosociales o los análisis de contenido. Por otro lado, Meyer apuntaba también que el periodista tenía que ser un administrador de los datos acumulados, un procesador de datos y un analista de los mismos. Así pues, el periodismo de precisión surge para abrir un nuevo camino hacia nuevos métodos de investigación e innovación, lo que supondrá una revolución en la manera de producir noticias. Por otro lado, tal y como exponen Manuel Gértrudix31 y Sergio Álvarez32 (2010), el periodismo de precisión tiene como objetivos:

30

Profesor Titular de Periodismo en el Departamento de Ciencias de Comunicación de la Universidad de Santiago de Compostela, que cuenta con trabajos de investigación en ámbitos muy diversos como las figuras Julio Camba o Manu Leguineche, el periodismo de precisión o géneros periodísticos entre otros. 31

Doctor en Ciencias de la Información. Experto universitario en Internet y sus aplicaciones Profesionalmente, ha participado en numerosas ediciones en los campos audiovisual y multimedia como autor, técnico, editor y director de proyectos. 32

Docente e investigador en Comunicación Digital en la Universidad Rey Juan Carlos de Madrid.

27

-

Localizar nuevos métodos de identificación y relación de hechos sociales noticiables que permitan sacar a la luz conocimientos o facetas de gran relevancia que hasta el momento habían pasado desapercibidos.

-

Hacer uso de métodos desarrollados por otras disciplinas, tales como la sociología o la estadística y las matemáticas entre otras.

-

Aplicar una perspectiva científica a los hechos y fenómenos noticiosos.

-

Localizar nuevos métodos identificadores de noticias.

-

Construir modelos de investigación derivados de los ya existentes.

En la actualidad existe un debate abierto y en continuo cambio, basado en las diferencias y exactitudes que el periodismo de datos actual y el periodismo asistido por computadora tienen entre sí. Para algunos las diferencias son grandes, puesto que consideran al primero de ellos como una forma de hacer información, teniendo en cuenta tan sólo los datos de los que se dispone, y siendo la más antigua de las modalidades, una manera de mejorar la información que ya estaba previamente elaborada con nuevos datos. Quizá la opinión más favorable para las dos partes sea la de considerar cada una de ellas como una unidad pero con cambios y evoluciones sufridas a lo largo de la tradición periodística. En esta actual fase de reflexión serán las práctica profesionales y las investigaciones e indagaciones académicas las que conducirán esta fase de transición y por lo tanto, su destino inmediato. Sea como sea, el caso es que comparten infinidad de similitudes, lo que demuestra que son dos caras de la misma moneda o dos etapas del mismo proceso periodístico y su uso tiene el mismo objetivo principal: la verdad y la exactitud.

28

2.3 El fenómeno del Big Data y su influencia en el periodismo de datos

Tal y como se ha comentado en otros apartados anteriores de este trabajo, el fenómeno del Big Data hace referencia a la acumulación de grandes volúmenes de datos. La cantidad de documentos e información existentes en la actualidad acarrea muchas ventajas, pero también se generan grandes inconvenientes, sobre todo en aquellas actividades que tienen que ver con su gestión, almacenamiento, visualización y comprensión. Según el estudio desarrollado en el año 2014 por EMC en colaboración con IDC sobre el universo digital33, se estima que para el año 2020 la cantidad de información digital crecerá en 44 millones de gigabytes, cuando en la actualidad existen 4.4 millones. Para hacerse una idea más real de la inmensa cantidad de datos es necesario indicar que un zetabyte se corresponde con 1.000.000.000 de bytes. Todos estos millones de datos se almacenan en nubes en la red, servidores de ordenadores pertenecientes a grandes empresas como Google, Microsoft, IBM, Amazon etcétera. Además, existe una tendencia en alza a crear espacios de almacenamiento propios por parte de empresas y universidades para obtener mayores aprovechamientos de la información. Por tanto se puede afirmar que en este sentido el “Big Data” no es algo estático, sino que es una actividad en constante cambio, movimiento y evolución, a raíz de lo que se elaboran grandes proyectos e investigaciones.

33

http://spain.emc.com/leadership/digital-universe/index.htm

29

En la actualidad los datos están en todas partes, en los códigos de barras, en las tarjetas de crédito, antenas de telefonía, sensores de humedad y un largo etcétera. Además, los datos ya no se encuentran en manos de empresas e instituciones de forma exclusiva, sino que estos pueden llegar a estar en manos de un ciudadano de a pie. Debido a sus características los expertos hablan de las “tres v” del Big Data: -

Volumen: grandes volúmenes de datos, a partir de terabytes o petabytes.

-

Variedad: diversas fuentes de tipos de datos, ya sean estructuradas o no

-

Velocidad: frecuencia de las actualizaciones de las bases de datos.

Además de grandes desafíos en el panorama empresarial y gubernamental, el Big Data ha supuesto un reto para la profesión del periodismo y la comunicación en la forma de contar las historias. Tal y como se ha podido comprobar, este nuevo fenómeno exige a los periodistas nuevas habilidades técnicas para dar sentido y forma a grandes conjuntos de datos, tomar mayor conciencia del valor que tiene este tipo de información en la sociedad actual y saber trabajar acorde a este hecho, por lo que este fenómeno ha supuesto también grandes cambios para las rutinas de esta profesión. Otro de los puntos a tener en cuenta es la necesidad, no dejar a un lado la organización, ya que su inexistencia puede provocar grandes fallos, y sobre todo la comprobación de los datos, en todos y cada uno de los campos en los que se trabaje o aplique el Big Data, pero con mucha más razón en el periodismo. En este sentido, y ante un panorama en el que apenas se ha investigado sobre las dificultades y adversidades que acarrea el uso del Big Data en la comunicación, sino que más bien todos los estudios se han enfocado a sus positividades y aprovechamientos, es necesario 30

tener en cuenta ambas partes. Tal y como apuntan Plantin, Lagoze, Edwards y Sanvig en el artículo “Big Data is not about size” (2013), hay un hecho muy importante que muchas empresas y organismos no han tenido en cuenta al trabajar con grandes cantidades de datos, y son las fuentes y la procedencia de esos datos, ya que en muchas ocasiones el gran número de datos con los que se trabaja, y en los que no se ha comprobado su calidad, puede desestabilizar y descontrolar en gran medida investigaciones, resultados, o publicaciones. En un estudio publicado por Seth C. Lewis34 en el año 2014, “Journalism in an era of Big Data”, se examinan algunos de los puntos negativos que tiene la inclusión y el uso de

grandes

cantidades de datos en la producción de noticias. Una de las que más destaca este autor es el conocido como “autonomus decision- making” o “toma de decisiones automática”, acción a través de la cual se automatizan publicaciones y temas en la publicación en cibermedios de ciertos temas, lo que provoca grandes dudas sobre las normas y procesos rutinarios que se deberían de seguir a la hora de sacar a la luz algunas publicaciones. En sentido se comparan los algoritmos matemáticos con el trabajo racional de un periodista, surgiendo así la pregunta de cuáles son los patrones de publicación, normas éticas y deontológicas y razonamientos lógicos que se utilizan para aprobar un tema, hecho que puede, sin duda, provocar una disminución del juicio humano y profesional. Por tanto, es necesario tener presente que la adaptación del periodismo al trabajo con Big Data debe ser consistente, pero no completo, en el sentido de dejar al juicio tecnológico todo tipo de decisiones, además, el periodismo debe ser entendido como una práctica socio-discursiva, esto es, no se debe reparar solo en la creación de herramientas para tratar y conseguir los datos, sino que se deben hacer grandes esfuerzos en el sentido de dar forma 34

Investigador y profesor en la Escuela de Periodismo y Comunicación de la Universidad de Minnesota-Twin Cities, Estados Unidos.

31

a la noción del periodismo de datos en su sentido más humano, teniendo en cuenta a todos los actores que están involucrados en este proceso.

2.4 Ejemplos de trabajos realizados a partir del periodismo de datos

No se podría tratar de explicar qué es el periodismo de datos sin aportar ningún ejemplo que demuestre su capacidad de comunicación y las grandes aportaciones que puede hacer a la profesión y al contexto que la rodea. En su escasa vida o tiempo de aplicación, hemos podido ser testigos de grandes trabajos en este campo elaborados para todo tipo de publicaciones, desde las más generales hasta las de temáticas más concretas que se puedan imaginar. Una de las web que más ha revolucionado en los últimos años el periodismo de datos es FiveThirtyEight 35 , un espacio web creado por Nate Silver, que comenzó siendo un blog dependiente de The New York Times hasta que en marzo de 2014 inició su andadura en solitario, y hoy en día acumula más de veinte trabajadores en plantilla. La historia de su creador es curiosa y guarda una gran relación con el escepticismo y el miedo que muchos medios de comunicación tienen hacia el uso de los datos en sus piezas informativas. Durante las elecciones presidenciales de los Estados Unidos en el año 2008, Silver dedicó gran parte de su tiempo a pronosticar los resultados de las votaciones36 en los diferentes estados. En un principio fue tomado por loco, al considerar que no sería capaz de averiguar con la exactitud

35

http://fivethirtyeight.com/

36

http://www.nytimes.com/2008/11/10/business/media/10silver.html?pagewanted=all

32

que proclamaba dichos resultados. En noviembre de ese mismo año, acertó los nombres de los ganadores de 49 de los 50 estados que conforman el país, siendo así el centro de grandes elogios y admiración. En su momento, y al ser preguntado por tal hazaña, alegó que su única suerte había estado en realizar un estudio exhaustivo de los datos. En la actualidad, su página web realiza infografías y visualizaciones de datos interactivas prácticamente a diario. Una de las últimas publicada el día 12 de marzo de 2015 lleva por título “ Which Flight Will Get You There Fastest?”37, un análisis interactivo en el que se analizan todos los vuelos y rutas de las compañías de vuelos comerciales que operan en Estados Unidos para poder así obtener información de cuáles son las más rápidas según qué destino y origen.

37

http://fivethirtyeight.com/interactives/flights/

33

Ilustración 2: Captura de pantalla del proyecto "Which flight will get you there fastest?". Fuente: Fivethirtyeight.com

En el ámbito español, a pesar de que los casos de uso del periodismo de datos son escasos, se comienza a ver un atisbo de esperanza para esta modalidad promovido por algunos medios de comunicación. En el caso del ya citado eldiario.es -cuyo director y fundador es Ignacio Escolares frecuente ver algunas publicaciones de este tipo. Con todo es necesario destacar que a pesar de

34

que este medio tiene infografistas en su plantilla, recurre a los servicios de una pequeña empresa llamada “Data‘n‘Press”38, formada por tres especialistas en este campo. Uno de los proyectos más sonados de las últimas semanas realizado a partir de la colaboración del diario.es con esta empresa es “¿De qué habla el Gobierno?”39, donde a partir del análisis de los temas y discursos que se producen en el Parlamento español se crearon gráficos que muestran cuáles son los temas más recurrentes y las palabras más utilizadas. De esta forma se le da al lector la oportunidad de conocer qué importancia tiene cada tema en la legislatura y cómo es abordado por el Gobierno.

Ilustración 3: "¿De qué habla el Gobierno?". Fuente: eldiario.es

38

http://datanpress.com/es

39

http://www.eldiario.es/politica/palabras-gobierno_0_243576536.html

35

A partir de estos gráficos se puede observar pues qué términos se utilizan y en qué medida. Así, de las dos infografías presentadas, la segunda tiene un detalle curioso, pues es elaborado a partir de una rueda de prensa ofrecida por la vicepresidenta del Gobierno, Soraya Sáenz de Santamaría en la que los periodistas allí presentes preguntaron por Bárcenas hasta en 83 ocasiones y los datos demuestran los equilibrismos que ha tenido que hacer Sáenz para no pronunciar el nombre del extesorero de su partido, recientemente imputado y encarcelado.

Otro ejemplo interesante que guarda amplia relación con el anterior es una página web, www.quehacenlosdiputados.net , una aplicación con información y datos creada en 2011 que permite a la ciudadanía seguir la trayectoria y labores de los 350 diputados del Congreso, además de un listado de sus propiedades y pertenencias extraídos de documentos públicos.

36

El gráfico que se muestra a continuación es uno de los ejemplos elaborados por esta iniciativa. En él, una mujer miembro del grupo parlamentario del PSOE, Ángeles Álvarez, aparece en la web como la diputada que más iniciativas ha presentado en el Congreso. En su ficha se pueden ver todo tipo de datos sobre ella: los proyectos que ha presentado, cuántos de ellos han sido debatidos y tramitados, sus votaciones en los Plenos del Congreso, etcétera.

Ilustración 4: extracto de "¿Qué hacen los diputados?". Fuente: quehacenlosdiputados.net

Una vez mostrado esto, se puede observar cómo, además de medios de comunicación que realizan sus propias informaciones a partir de datos, se están comenzando a desarrollar multitud de iniciativas de carácter privado y sin ánimo de lucro para promover el periodismo de datos y contribuir así a la transparencia, algo que debería ser aprovechado por los medios de 37

comunicación, que deberían de seguir el ejemplo de estas plataformas y comenzar colaboraciones con ellas para poder así avanzar poco a poco dentro de este campo del periodismo. A través de la repercusión e importancia de proyectos como estos se puede observar como claramente existe un amplio interés y aceptación en la sociedad por consumir este tipo de información.

Dos de las instituciones que dentro de nuestras fronteras más esfuerzos han invertido en promover el periodismo de datos son Medialab-Prado 40, un “espacio cultural concebido como un laboratorio ciudadano de producción, investigación y difusión de proyectos culturales que explora las formas de experimentación y aprendizaje colaborativo que han surgido de las redes digitales” y Fundación Ciudadana Civio 41, una organización sin ánimo de lucro que trabaja para alcanzar una mayor transparencia y libre acceso a los datos públicos alcanzables para cualquier ciudadano u organización. Civio genera e investiga herramientas y formas de llegar a los datos y mostrarlos al público de diversas formas. Es posible afirmar que existe una amplia relación entre esta fundación española y la web norteamericana ProPublica 42 , una agencia de noticias, también sin ánimo de lucro, y cuya financiación se consigue a través del apoyo de varias asociaciones. Su objetivo es producir periodismo de investigación y datos de temas sobre todo de carácter político y económico.

40

http://medialab-prado.es/

41

http://www.civio.es/

42

http://www.propublica.org/

38

Algunos de los proyectos más importantes de Civio se corresponden con el espacio denominado “Quién manda” 43, una web con mapas y noticias sobre el poder en España con el propósito de convertirse en un repositorio fiable y documentado de los vínculos, sobre todo profesionales entre las cargos más importantes del país. En esta plataforma se especifica la formación de estas personas, sus puestos en instituciones públicas y demás, con el objetivo de esclarecer esta situación así como reclamar más transparencia y ayudar a que la ciudadanía tome sus propias decisiones. En la siguiente imagen se muestra uno de los trabajos publicados en dicha página web que trata de esclarecer los altos cargos que forman o han formado parte de la Compañía de Radio Televisión Española (RTVE) y que anteriormente habían ocupado algún escaño en el parlamento español o mantenido vínculos con el gobierno, actividad que en términos coloquiales se denomina como “puerta giratoria”. La metodología empleada para elaborar estos gráficos interactivos se basa en datos extraídos a través de la web de la CNMV o el BOE entre otros, y en ocasiones se recurre a la investigación periodística para poder conseguir información y posteriormente ser reportada.

43

http://quienmanda.es/

39

Ilustración 5. "La televisión pública". Fuente: quienmanda.es

2.5 Importancia del Periodismo de Datos en la corriente periodística actual

Muchos años atrás, con el desarrollo del periodismo y de las herramientas de las que se valían sus profesionales, se gozaba de la oportunidad de poder ser los únicos en la creación y adaptación de una tecnología para poder difundir lo que estaba pasando a nuestro alrededor, como fue el caso de la imprenta, la única vía disponible en el momento para distribuir información de forma masiva y más rápida para todo aquel que desease informarse. Hoy en día eso ha desaparecido. Se continúan imprimiendo y vendiendo diarios en formato papel, y se espera que por mucho más tiempo, pero esto ya no basta para que un medio de 40

comunicación pueda sobrevivir ante las exigencias que hay en la sociedad actual. Con la aparición de las redes sociales, los blogs, los diarios en versión digital - y gratuitos- la información se conoce a medida que ocurre, esperar a la mañana siguiente es algo que a una buena parte de los lectores les resulta tedioso y, ¿para qué comprar un periódico en papel que te va a contar lo que has leído la noche anterior en varios blogs o tweets y que ya está desfasado? Para que el periodismo pueda sobrevivir a esta gran revolución tecnológica y de comunicación es necesario ser necesarios. Los medios tienen que ofrecer algo que a simple vista el lector no pueda deducir o descubrir por sí mismo en poco tiempo y al mismo tiempo crear en ellos la necesidad de una información que no puedan lograr por sí solos. Por este motivo es importante el periodismo de datos. Recopilar, filtrar, estudiar, presentar y saber explicar la repercusión de cualquier asunto que a un primer vistazo se torna como imposible. La base de todo esto son pequeños datos, insignificantes si están aislados, pero muy importantes para el conjunto de la sociedad una vez han sido contextualizados, pues con ellos se transforma algo abstracto en aquello que todos pueden entender y relacionar.

La gama de temas y datos a tratar es cada vez más grande, y seguirá creciendo a medida que instituciones públicas y privadas, así como los gobiernos de cada país se conciencien de la necesidad de publicar información en defensa de la transparencia. Por este motivo es necesario que también los periodistas abran los ojos ante la inmensa oportunidad que se les presenta por y para ellos. El periodismo de datos ofrece una perspectiva de futuro, tanto a la profesión en sí como a la situación laboral de sus trabajadores, puesto que no solo son buscados por las

41

redacciones, sino por otro tipo de empresas que buscan los denominados como “sensemakers”, sujetos que saben tratar con datos y transformarlos en algo tangible.

2.5.1 Ley de Transparencia, Acceso a la Información Pública y Buen Gobierno en España

El desempeño del trabajo de cualquier periodista hoy en día está ampliamente relacionado con el Open Data y el Open Government, en donde se asume la tradicional función conocida como “Watchdog Journalism” basada en actuar como perro guardián ante las prácticas ilegales de los órganos de poder elegidos por los ciudadanos, a lo que habría que añadir la oportunidad de informar de manera eficaz a la sociedad para que pueda tomar decisiones en base a su conocimiento (Del Campo, 2014). Antes de hablar del estado de la cuestión en España, conviene explicar pormenorizadamente lo que es el Open Data y lo que su uso supone. Como indica Alicia Tapia44, los datos abiertos son un filosofía que se basa en proporcionar datos de forma libre a todo el mundo, independientemente de su lugar de procedencia, religión, sexo, profesión u ordenador o dispositivo que utilice, esto es, sin restricciones de copyright, patentes u otro tipo de mecanismos de control, con la finalidad de que sean reproducidos y utilizados por todo aquel que así lo desee. Dentro de este ámbito lo más habitual es que los datos se presenten sin procesar, pero bien estructurados y en formatos que permitan su extracción y manejo con distintas herramientas. Este hecho contribuye a que cualquiera pueda acceder a estos datos públicos y construir nuevas ideas

44

Profesora de la asignatura “Documentación y gestión de fuentes” en la Universidad Internacional de La Rioja.

42

y conclusiones sobre ellos y darles valor añadido. Esta reutilización automática y fácilmente accesible distingue al Open Data de los datos incluidos dentro de las páginas web convencionales.

Sin embargo, la oportunidad de ejercer el periodismo de datos en España es un hecho complicado sin la presencia de una Ley de Transparencia de calidad, la cual se erige como uno de los requisitos indispensables en una sociedad democrática y justa. Como ya se ha tratado en otros puntos de este trabajo, la regulación sobre datos de carácter público en nuestro país se aprobó a finales del año 2013, y un año después, hace escasos meses, entró en vigencia. Pero esta novedad dentro del panorama legal español no ha sido como se esperaba debido principalmente a los vacíos y ausencias en su redacción y las negaciones o “no obligaciones” existentes ante la petición de compartir todos los datos que la sociedad reclama. Esta regulación se planteó con la idea de cambiar la forma de acceso a la información de administraciones, partidos políticos, empresas y fundaciones y otro tipo de entidades a través de registros, portales de transparencia, formación de los servidores públicos y la proclamación y difusión del derecho a estos datos, pero desafortunadamente no se ha producido así. Si se compara con otras legislaciones europeas como la de algunos países escandinavos, las dudas sobre la efectividad de esta ley en nuestro país se vuelven cada vez mayores dado que esta regulación no recoge garantías de protección para aquellos trabajadores del Estado que quieran denunciar casos de corrupción dentro de los puestos públicos, por lo que los funcionarios seguirán sin disfrutar de autonomía y libertad para denunciar lo que consideren necesario.

43

Por otro lado, existen muchas más restricciones que hacen de esta ley un instrumento prácticamente inservible para su uso social y más aún en el ámbito periodístico, pues no se harán públicos datos de, por ejemplo, gastos de la Casa Real, información de relevancia jurídica del citado organismo o del Banco de España -los cuáles sólo están obligados a mostrar información administrativa-, las agendas de los altos cargos de Estado, o información sobre empresas privadas que gestionen, entre otros, hospitales públicos o centros educativos. Así mismo, también será decisión última del Gobierno decidir si responder a peticiones de datos por parte de la ciudadanía a través de la web de propiedad gubernamental que gestiona estas demandas: Portal de la Transparencia45.

A pesar de haber abandonado el puesto del único país con más de un millón habitantes sin regulación sobre transparencia, esta medida ha supuesto una decepción tanto para los ciudadanos españoles, como para instituciones internacionales, ya que muchas consideran que el hecho de no incluir el reconocimiento al derecho a la información en el tratado como algo fundamental deja la puerta abierta a que cualquier proceso de petición sea denegado sin mayor miramiento. En definitiva, los mayores errores o ausencias que presenta la Ley de Transparencia en España son las siguientes:

45

-

No afecta a todos los poderes del Estado

-

Excluye muchos tipos de información pública

http://transparencia.gob.es/

44

-

Establece el silencio negativo, algo excepcional en el derecho administrativo español, lo que fomenta la inactividad administrativa ante las solicitudes de información

-

No reconoce el derecho a de acceso a la información como un derecho básico y fundamental, como sí ocurre en otros países desarrollados

-

Crea un organismo de revisión dependiente del Gobierno y sin poder vinculante

-

No establece sanciones relevantes por la ocultación de información

Ante esta mala y tardía gestión por parte del gobierno central, han sido muchas las comunidades autónomas y sus instituciones, tanto privadas como de carácter público y de gobierno, que han decidido sumarse a la tendencia del Open Government y crear sus propias webs donde poder publicar información relativa a su actividad. El primer atisbo de Open Data que se experimentó en España fue en el año 2010, a raíz de un acuerdo del Consejo de Gobierno Vasco, motivado a desarrollar este proyecto tras la aprobación de la Ley 11/2007, que regula el acceso electrónico de los ciudadanos a los datos públicos. Este hecho condujo, de manera prácticamente obligatoria, a la digitalización de las herramientas de gestión de los datos de todas las administraciones públicas y fue a partir de este momento cuando varias comunidades que decidieron sumarse a este movimiento y publicar sus datos de manera pública e independientemente del Gobierno central. A continuación se pueden ver señalados en un mapa del territorio español aquellos lugares en los que se han creado portales de datos abiertos.

45

Ilustración 6. Mapa de los portales de Open Data en España. Fuente: Fundación Tic

Dichos portales de información pública accesible repartidos por todo el territorio español se corresponden con las siguientes comunidades, provincias y municipios: Islas Canarias, Galicia, Asturias, Gijón, Santander, Bilbao, Pamplona, Navarra Euskadi, Aragón, Zaragoza, Lleida, Diputación de Barcelona, Manresa, Rubí, Sant Feliu de Llobregat, Sant Boi de Llobregat Sabadell, Gavà, Tarragona, Islas Baleares, Valencia, Diputación de Alicante, Lorca, Diputación de Málaga, Málaga ciudad, El Puerto de Santa María, Sevilla, Andalucía, Extremadura, Cáceres, Madrid, Alcobendas, Líneas de bus de Madrid y Castilla y León.

46

3. Características profesionales, etapas de trabajo y herramientas en el periodismo de datos

Tal y como ocurre en cualquier disciplina social o científica que se precie, los cambios generados con el paso del tiempo y la evolución de dichas especialidades, acarrean nuevas rutinas, formas de trabajo distintas y la aplicación y uso de herramientas diferentes. El periodismo de datos no se queda atrás en este hecho y lo que en su momento surgió como periodismo de precisión ha evolucionado hasta nuestros días dejando a su paso hábitos y tecnologías creados y derivados de las necesidades específicas que han ido surgiendo. Algo similar ocurre con las personas encargadas de llevar a cabo estos proyectos y sus características profesionales, las que también se van transformando poco a poco y añadiendo nuevas habilidades a su definición. Esta nueva rama del ámbito periodístico supone un reto para sus profesionales en lo referente a sus conocimientos y formación, así como para los encargados de desarrollar y manejar las tecnologías empleadas para poder elaborar periodismo de datos con plenitud y calidad. En los siguientes puntos se tratará pues de elaborar una descripción detallada de la situación que están viviendo o tendrán que experimentar aquellas redacciones que ya incluyan o quieran comenzar a trabajar en periodismo de datos, así como una explicación detallada de las cualidades básicas que debe tener un profesional de esta rama, las diferentes fases o etapas de trabajo que se llevan a cabo en el uso de los datos para la elaboración de información y por último las herramientas más novedosas que se utilizan hoy en día para la extracción, recopilación, manejo y visualización de los datos.

47

Ante la actual situación de crisis, tanto económica como profesional, implantar el periodismo de datos en una redacción supone un gran desafío en todos los sentidos. La escasez de presupuesto y los recortes en empresas informativas tanto del ámbito público como en el privado, han provocado el despido de muchos trabajadores, hecho que acarrea que los que se quedan en plantilla se conviertan en periodistas multitarea, por lo que plantear el hecho de instaurar la especialización entre los empleados se torna como algo altamente improbable y complicado en la gran mayoría de los medios de comunicación, sobre todo en España, donde la crisis es más que notable.

El principal problema del periodismo y de la industria que lo rodea se resume, como apunta Juan Luis Sánchez 46 en uno de los cuadernos de comunicación de Evoca titulado “El futuro del periodismo” (2012), en que “la finalidad para la que fue creada esta disciplina ya no existe, por lo que la esencia de lo que se hace en la actualidad tiene que cambiar y adaptarse al momento y sobre todo, a las necesidades de la audiencia”. Esta idea introduce un elemento de reflexión a tener en cuenta, el de los cambios y mudanzas en la profesión, porque a pesar de que han evolucionado muchas cosas, en especial para la industria tradicional que ahora compite con nuevos actores en un escenario en red, la esencia y fin último de la profesión sigue siendo la fidelidad a la verdad y a contribuir positivamente a una sociedad bien informada, canalizar ideas, vigilar a los estatutos de poder y demás.

46

Subdirector de eldiario.es y colaborador de La Sexta, es especialista en contenidos digitales y nuevos medios.

48

Si hablamos de cambios y desafíos, el periodismo tiene decenas ante sí a los que tiene que hacer frente, algunos de los más importantes en términos generales son, como señala Picard 47 (2012), los siguientes: -

Transformaciones en la sociedad y en las formas de consumo, visibles en el cambio de audiencia y en el tiempo de uso de los medios de comunicación

-

Aumento de la integración de la audiencia en Internet, servicios móviles y redes sociales

-

Desplazamiento de los gastos publicitarios, y de la utilización de los medios clásicos en lugar de los nuevos medios

-

Disminución de los ingresos de la publicidad debido a la crisis económica con impactos en el modelo de negocio y en la procura de la sustentabilidad del periodismo.

Algunas de las propuestas para frenar esta caída en picado de la profesión pasan por procurar nuevos productos y formas de negocio que devuelvan la viabilidad a los medios, y entre estas proposiciones está el periodismo de datos, a través del que se ofrece al público una nueva forma de información y de uso, adaptado a las características de la audiencia actual, que exige rapidez y contenidos visuales y amenos, así como fiables en la mayoría de los casos debido a sus cualidades inherentes. Lo que puede parecer una pérdida en términos monetarios y temporales, puede ser una gran oportunidad para la profesión si hablamos de renovación y adaptación. Con la gran cantidad de información disponible y las miles de fuentes a las que se tiene acceso, el público se encuentra 47

Robert G. Picard es uno de los mayores especialistas en economía de los medios y desafíos comerciales que desafían las empresas informativas con la aparición de las nuevas tecnologías. Es miembro del Reuters Institute y de Information Society Project de Yale Law School.

49

con un grave problema en sus capacidades de información, hecho también conocido como infoxicación o sobrecarga informativa. Por este motivo, aquello que para el usuario supone un problema, para el periodismo puede llegar a ser una gran oportunidad.

Filtrar, evaluar la calidad de la información, ofrecer un producto atractivo para el lector así como la localización, selección y valoración de aquella información de interés entre la gran oleada de datos que nos llegan cada día puede llegar a ser una ocasión de oro para el periodismo pero para poder llevar estas tareas a cabo, debe de apoyarse en el periodismo de datos dadas las características de las que se compone y que han sido mencionadas en anteriores apartados de este trabajo. Ante esta situación como modelo imperante se puede afirmar que la figura del periodista de datos toma fuerza dentro de la profesión.

A lo largo de la historia del periodismo de investigación hemos podido ser testigos de cómo se han descubierto grandes casos de corrupción de gobiernos y empresas alrededor de todo el mundo, y eso es ahora más necesario que nunca y además, los periodistas actuales cuentan con la posibilidad de aprovechar las herramientas necesarias para poder realizar estos trabajos de la mejor manera posible, a través de datos públicos, narrativas transmedia, aplicaciones online, y demás, que conducen a la necesidad de reflexionar sobre el contexto de los medios, el futuro del papel y las novedades que aporta la web (Flores y Salinas, 2012). Con todo, el de periodista de datos no es el único perfil profesional nacido del intento de adaptación al nuevo entorno cambiante marcado por la digitalización y la aparición de los nuevos

50

medios en el que se han modificado la gran mayoría de las fases de trabajo. Así, algunas de las nuevas profesiones que se pueden encontrar son el conocido como “Mobile Journalist” 48 , especialistas en SEO49 o Responsables de redes sociales entre otros.

3.1 Perfil profesional del periodista de datos

Las redacciones de los medios de comunicación tienen un reto muy importante ante sí: acomodarse totalmente a la era digital. Para ello, deben de contar con profesionales que dominen el mundo multimedia y entiendan las reglas del juego de la comunicación digital. Además de los nuevos perfiles mencionados en las líneas anteriores, Gumersindo Lafuente50 (2013) afirma que “tenemos que dejar a un lado el periodismo de filtración y reivindicar el periodismo de investigación con datos. Solo así podremos recuperar la credibilidad del oficio y encontrar vías alternativas para mejorar su calidad”. Ante la importancia que muchos profesionales coinciden en otorgarle al manejo y profesionalización de los datos dentro del mundo de la información, se plantea la cuestión de cuáles deben ser las características de un profesional para que se pueda adaptar de forma óptima

48

Perfil derivado de la aparición del Mobile Journalism o periodismo móvil, en el que las noticias se elaboran y difunden a través de teléfonos inteligentes o tablets. Este trabajo corresponde normalmente a trabajadores autónomos o freelance. 49

Search Engine Optimization, o posicionamiento en buscadore, es el proceso de mejorar la visibilidad de las páginas web en los buscadores. 50

Periodista español, precursor del periodismo digital en habla hispana y líder de varios proyectos de comunicación online en nuestro país.

51

al nuevo entorno digital. Para ello, Lafuente destaca cuatro puntos básicos que van más allá de los tecnicismos: -

Talento

-

Perseverancia

-

Obsesión por el rigor

-

Mente abierta

Además se hace necesaria la mezcla de habilidades y la combinación de profesionales en un marco donde es necesario el entendimiento y la convivencia entre los que dominan la tecnología y los que dominan la profesión. Sin embargo, las dificultades y la gran cantidad de características que debe reunir un periodista de datos hacen necesario hacer un repaso de las necesidades o habilidades básicas que confluyen en estos profesionales. El eje principal de este perfil se basa en las características técnicas debido al empleo de nuevas tecnologías y por lo tanto también se vuelve imprescindible el desarrollo de múltiples destrezas y conocimiento en varias áreas a las que un periodista de otro campo o modalidad no tendría por qué recurrir. Después de haber definido qué es el periodismo de datos, se puede afirmar que las principales herramientas de las que se vale esta disciplina y de las que los periodistas necesitan tener control son las bases de datos y los mecanismos para la visualización. La democratización del uso de internet, así como todos los puntos intermedios entre ellas, y el aprovechamiento por parte de empresas de desarrollo tecnológico en la creación de nuevas plataformas de trabajo, han creado un amplio catálogo de oportunidades a la hora de trabajar, lo que hace del periodismo de datos un campo con infinidad de posibilidades de creación y una modalidad muy versátil y que a su 52

vez, obliga a sus profesionales a estar al día en las últimas novedades y en el manejo de todo tipo de programas. Por ello, como apuntan Flores y Cebrián (2012), para poder llevar a cabo este trabajo, los principales campos teóricos en los que se debe poseer una mínima formación son entre otros, Estadística, Programación, Sociología, Psicología y Diseño Gráfico. Además, estos dos autores, apuntan que además de conocimientos en las citadas ramas científicas, los periodistas de datos tienen que poseer un alto conocimiento sobre gestión de datos y clasificación de la información, capacidad para la búsqueda, interpretación y creación de una narración fácilmente comprensible, desprendida de todo tipo de tecnicismos innecesarios para el lector. Quizá este sea uno de los puntos más importantes dentro de la finalidad del periodismo de datos, el hecho de filtrar información y convertirla en algo noticiable e interesante, por lo que el olfato periodístico se vuelve algo fundamental en esta disciplina, pero mucho más complicado de ejecutar debido a la poca información que aportan los datos en bruto a primera vista. Flores también recaba en denominar a este profesional como “Data Delibery Editor” y también como “creador de mashups51”, esto es, un periodista que realiza su trabajo en base a elementos que aparecen en la red, incluyendo aplicaciones tecnológicas en forma de contenidos informativos.

51

La palabra “mashup” proviene del mundo de la música, a raíz de mezclar diferentes canciones para crear una nueva. El denominado como “Periodismo mashup” es por tanto la creación de información como consecuencia de mezclar diferentes tipos de informaciones y aplicaciones para su elaboración.

53

Sandra Crucianelli, en Data Journalism Handbook (2012), apunta que el periodismo de datos es un entrenamiento y aprendizaje constante en materias que se alejan de las que suele manejar un periodista convencional. Destaca que este profesional debe reunir los siguientes conocimientos: -

Dominio alto del inglés

-

Habilidades en búsquedas avanzadas en la web

-

Conocimiento de los principios básicos de programas de análisis de datos

-

Conocimientos en matemática básica y estadística

-

Capacidad analítica

-

Conocimiento del funcionamiento de la administración pública del país o países sobre los que se realizan trabajos

Por las necesidades anteriormente mencionadas, encontrar periodistas con esta formación, de un rango tan amplio y variado, supone todo un reto para aquellos medios de comunicación que quieran adaptarse a esta nueva modalidad, por lo que lo habitual en diarios que ya se han amoldado al periodismo de datos, es integrar a varios perfiles profesionales en la sala de redacción, desde programadores, informáticos, matemáticos o economistas. En el trabajo realizado por la autora antes citada -Crucianelli- junto con la colaboración de Michael Zanchelli

52

y el Knight International Journalism Fellowships (ICFJ), titulado

“Integrando el Periodismo de Datos en las salas de redacción”, se realizó un estudio a siete de los principales diarios de Gran Bretaña, Estados Unidos y Latinoamérica que utilizan el periodismo

52

Programador web, antiguo miembro del International Center for Journalists y actual miembro de la organización estadounidense United States Institute of Peace.

54

de datos como una vía para elaborar información y tratar de identificar así los puntos comunes que hacen que el periodismo de datos se pueda utilizar con eficacia dentro de una redacción. Estos factores clave que hacen viable esta nueva rama de la comunicación en una redacción, y que por lo tanto, tienen incidencia en las cualidades profesionales y técnicas de los trabajadores de un medio son los siguientes: -

Ubicar la sección de periodismo de datos dentro o cerca de la propia sala de redacción y no en un entorno aparte, pues esto ayuda a mejorar el contacto y las relaciones entre redactores y editores y el equipo de datos, así como estar al día del trabajo de cada grupo.

-

Fomentar el trabajo conjunto entre periodistas y desarrolladores informáticos para generar ideas para reportajes o piezas basados en datos. El hecho de cada uno aporte sus conocimientos especializados en cada uno de los campos, beneficia las conclusiones y críticas sobre el trabajo y por lo tanto su óptimo desarrollo.

-

Reclutar a periodistas y desarrolladores que cierren la brecha de habilidades. Aquellos miembros con experiencia en minería de datos, desarrollo y codificación son altamente valorados en una redacción que incluya un grupo de periodismo de datos.

-

Producir reportajes que transmitan la importancia de los datos y por qué el público debería interesarse por ellos.

55

Una vez visto esto, se observa como no basta con tener en plantilla a los profesionales adecuados para hacer un buen proyecto a partir de los datos, sino que además de eso, es necesario que este grupo esté bien organizado dentro de la redacción y sobre todo que sea uno de los ejes centrales, con contacto permanente con el resto de la redacción, que estén al día de lo que hacen el resto de compañeros y sobre todo que intercambien ideas para poder aprovechar al máximo cada información o pieza informativa sobre la que se trabaja y las posibilidades que de ellas se derivan.

3.2 Fases de trabajo en periodismo de datos

Los distintos investigadores que han estudiado el periodismo de datos, así como sus antecedentes a lo largo de los últimos años, coinciden en considerar esta modalidad como una rama investigativa del periodismo en el que se utilizan las nuevas tecnologías para buscar, contrastar, visualizar, combinar datos, proporcionar información de diferentes fuentes, etcétera. Por ello, para que esta actividad se pueda realizar es necesario cumplir una serie de pasos o etapas con la finalidad de elaborar contenido de calidad, todo ello utilizando todo tipo de herramientas y aplicaciones especializadas y creadas específicamente para cada una de las diferentes fases. Estas nuevas herramientas disponibles con el desarrollo de las tecnologías de la información conforman los ejes fundamentales de la creación de piezas informativas: el acceso a los datos, el tratamiento y la publicación.

56

Antes de entrar de lleno en las citadas fases que conforman la producción del periodismo de datos es necesario señalar la importancia que tiene en este campo el concepto denominado “Infomorfosis”, por Flores (2009), y definido como “el proceso de cambio que están viviendo los mensajes u otro tipo de información, independientemente del soporte de su difusión”. Esta idea cobra sentido si se tiene en consideración el hecho de que la mayoría de las nuevas formas de periodismo tienen una base primordialmente visual, esto es, cada vez más la imagen y el sonido ganan más importancia dentro del relato periodístico- devaluando el texto aislado-, y en el caso del periodismo de datos se puede afirmar que la base de su esencia es la visualización de los datos y una de las etapas más importantes de su producción hecho en el que se profundizará en posteriores líneas. Este concepto de Informorfosis guarda una amplia relación con la teoría de la Pirámide Invertida del periodismo de datos propuesta por Paul Bradshaw y con lo que ya en 1993 Philip Meyer señalaba como fases de trabajo del periodismo de precisión: recopilarlos, almacenarlos, recuperarlos, analizarlos, resumirlos y comunicarlos. Dos décadas después, el estudio de Bradshaw se ha convertido en uno de los más referenciados en el ámbito académico. Esta investigación relata el proceso de producción de manera gradual, desde la recopilación de una enorme cantidad de datos, hasta el resultado final donde se le presenta a la audiencia la información de la manera más sencilla posible.

57

Ilustración 7. Pirámide invertida del periodismo de datos de Paul Bradshaw. Fuente: Online Journalism Blog

Una vez observada la pirámide de Bradshaw se puede comprobar pues como las cinco fases que confluyen en la producción de información en periodismo de datos son: compilar, limpiar, contextualizar, combinar y comunicar. A continuación se analizarán las diferentes características que incluyen cada una de las etapas. 1. Compilar: Según Bradshaw, el periodismo de datos comienza de una de las dos siguientes formas: “o tienes una pregunta que necesita datos, o tienes unos datos que necesitan preguntas”. Así, las diferentes fuentes a través de las que se pueden extraer o alcanzar los datos incluyen las siguientes posibilidades:

58

-

Provistos directamente por una organización de carácter público o privado

-

Datos encontrados utilizando técnicas de búsqueda avanzada en diferentes webs

-

Al utilizar la técnica del scraping en bases de datos en línea

-

Realizando conversiones en las extensiones de distintos documentos para convertir los datos en accesibles y manejables

-

Tomando información de API’s

-

Recolectando los datos por el propio periodista a través de la observación, encuestas, formularios online, crowdsourcing, etcétera.

2. Limpiar: el hecho de poseer los datos es sólo el comienzo de todo el proceso. Para confiar en lo que posteriormente contarán los datos es necesario limpiarlos, y esto se puede elaborar a través de dos vías: remover o borrar los errores humanos cometidos en los datos, o convertir los datos en formatos al formato que se precise o con el que se esté trabajando en todo el proceso (xml, html, etc).

3. Contextualizar: como en cualquier otra fuente documental o personal, la información que estas proporcionan no es siempre fiable, pues contiene perjuicios, subjetividades, y demás elementos, por lo que como a cualquier otra fuente, es necesario cuestionarla con preguntas como quién se encargó de recolectar los datos, cuándo y por qué motivo, la metodología empleada. Además, se vuelve una necesidad entender el lenguaje o la jerga del campo temático al que se refiere o con el que están relacionados los datos, así como códigos que representen categorías, clasificaciones,

59

ubicaciones. Por tanto, el alfabetismo y conocimiento en ciencias como la Estadística se vuelve esencial para poder contextualizar bien los datos.

4. Combinación. Con normalidad es necesario, o al menos más fructífero y exitoso, combinar datos procedentes de diferentes lugares para hacer de este trabajo un proyecto más enriquecedor. La combinación clásica en el periodismo de datos suele ser frecuentemente de un tipo: combinar datos y mapas para brindar así una visualización instantánea de lo que esa información quiere transmitir.

5. Comunicar. Dentro de esta disciplina visualizar los datos es algo prácticamente necesario, pues sin esto la comprensión se vuelve mucho más dificultosa para el público. Esta visualización se puede hacer a partir de mapas, infografías, cuadros o animaciones interactivas, pero siempre hay que tener presente que lo que se está elaborando es un producto informativo y por lo tanto no se pueden dejar a un lado asuntos como la narración entre muchas otras cosas.

Debido a la gran importancia que acarrea la fase de visualización dentro de todo el proceso de construcción de la información elaborada a partir de los datos, Paul Bradshaw continuó su investigación hasta elaborar una nueva pirámide dentro de la etapa comunicativa en la que se engloba lo siguiente:

60

Ilustración 8. Fases dentro del proceso de comunicación del periodismo de datos. Fuente: Online Journalism Blog

El periodismo de datos tal y como lo conocemos hoy en día, ha ido evolucionando de la mano de la visualización, que ha experimentado un gran “boom” en los últimos años dentro de los medios de comunicación. Este hecho provoca que así como existe un gran catálogo de oportunidad de construir la información, las demás opciones se olviden, por esto, como las posibilidades de contar historias desde diferentes puntos de vista aumentan cada vez más, deben ser tenidas en cuenta. Los siguientes apartados se presentan como una guía de las diferentes posibilidades de narración y presentación existentes.

1. Visualización. Es la forma más rápida de comunicar los resultados extraídos de las investigaciones en periodismo de datos. Las distintas herramientas disponibles en la red

61

permiten crear grandes gráficos con apenas unos clicks. Con todo, la visualización no significa siempre efectividad, puesto que los gráficos o infografías no están exentos de manipulaciones o inexactitudes. La visualización tiene una gran ventaja que hace que el esfuerzo de estudiar los datos tenga recompensa, ya que hace de la comunicación una herramienta muy eficaz y persuasiva, pero esta es al mismo tiempo su debilidad, ya que el hecho de ser visual y no textual provoca que una buena parte de la audiencia no gaste tiempo estudiando estos gráficos.

2. Narración. Es un modo accesible para el público de entender la historia, pero es mucho más complicado proporcionar una visión comprensible de los datos. Un punto a favor de la narración con respecto a la visualización es que el primero aporta más significado a lo que se está contando y de manera más explícita.

3. Socializar. La comunicación es un acto social y éxito de la infografía a través de medios sociales es testimonio de ello. Además, las iniciativas de crowdsourcing proporcionan una dimensión social a los datos, ya que la conectividad casi total que existe hoy en día permite que se puedan aprovechar todas las oportunidades de socializar con el entorno a para conseguir mayor calidad en los datos y presentar el periodismo de datos como una rama en la que la sociedad puede tomar parte.

62

4. Humanizar. El hecho de hacer comprensibles los datos está enlazando en gran medida con el hecho de humanizarlos, de hacer a las personas parte de ellos, dando a entender que detrás de cada número, hay alguien.

5. Personalizar. Uno de los puntos más importantes dentro del periodismo digital y del periodismo de datos, es el hecho de que la información que se presenta tiene la oportunidad de ser interactiva y por lo tanto, de que la audiencia la pueda personalizar en base a sus intereses o preferencias a través de la posición geográfica, el perfil social, la edad, el sexo, la profesión, estudios, etcétera. Las historias personalizadas pueden ser utilizadas como una expresión de identidad: qué es lo que me gusta, que es lo que pasa en el lugar en el que vivo, así me siento afectado/a por tal hecho etcétera.

6. Utilidad. La mayor dificultad que contiene un producto realizado a partir del periodismo de datos es conseguir convertirlo en una herramienta útil para la sociedad. Probablemente sea en este punto donde resida el mayor de los retos de la comunicación de datos. La idea se basa pues en que cuanto más afectado se sienta el usuario por la información, más interés y utilidad encontrará en ella.

Todos los puntos anteriores demuestran lo mucho que todavía queda por descubrir en el periodismo de datos y en el periodismo digital en su conjunto, y sobre todo que lo que ahora sabemos y con lo que se trabaja es tan solo una pequeña parte de todo lo mucho que queda por evolucionar en este ámbito.

63

Así, a raíz de las investigaciones de Paul Bradshaw, Flores y Salinas (2013) han elaborado su propio esquema de las fases de producción en periodismo de datos, el cual guarda gran relación con respecto a las anteriores fases ya citadas, lo que deja en evidencia que el periodismo de datos se construye a través de una serie de pasos fijos e inquebrantables -similares en todos los estudios de la gran parte de los investigadores- que inevitablemente hay que seguir para elaborar la información.

Ilustración 9. Mapa contextual para el desarrollo del periodismo de datos. Fuente: Flores y Salinas (2013)

64

Por su parte, el diario pionero en el uso del periodismo de datos, a través de su blog en la versión digital, Datablog 53 , de The Guardian, del que se llevará a cabo un estudio en los próximos puntos, publicó en su sitio web las fases de trabajo que conforman su proceso productivo. En la siguiente imagen se puede comprobar cómo dichas etapas están más desglosadas que en los anteriores casos expuestos, motivado principalmente por ser un esquema o estudio basado en un trabajo real y diario, que se lleva a cabo en una redacción día tras día.

53

http://www.theguardian.com/data

65

Ilustración 10. Proceso de creación de un proyecto de periodismo de datos en The Guardian. Fuente: The Guardian

66

A raíz de estas fases de trabajo se puede afirmar que el periodismo de datos es posible hoy en día gracias al uso y evolución de las nuevas tecnologías, que ayudan a la digitalización de los hechos y al uso de herramientas de intercambio de conocimientos, así como a la colaboración ciudadana y a la creación de portales de Open Data. Además, cabe destacar que por su infinidad de aplicaciones y formas de construcción, el periodismo de datos supone un punto importante para cualquiera de las áreas de un medio de comunicación: Política, Deportes, Cultura, Economía, Sociedad, etcétera. Esta modalidad del periodismo de datos tiene cabida y en todas se sigue la misma estructura, por lo que se vuelve a encontrar un motivo más para su incursión en las redacciones de las empresas informativas. La transformación del entorno comunicativo ha afectado a todos los ámbitos de aplicación del mismo, dejando en evidencia “una nueva esfera informativa que trasciende al periodista como técnico especializado, afecta al ADN informativo de las sociedades contemporáneas y alcanza a la investigación, producción y difusión informativas” García Chico y Rodríguez Brito (2013).

3.3 Herramientas y aplicaciones

El proceso de realizar una pieza informativa a partir del periodismo de datos es, en términos metafóricos, similar al de elaborar un plato de cocina, esto es los pasos a seguir en cualquiera de las dos disciplinas comparten mucho en común: se idea el plato a cocinar, se elabora una lista de los ingredientes necesarios, se reúnen, se preparan para su elaboración y finalmente se cocinan y

67

se presenta el plato a los comensales. Por su parte, tal y como hemos visto en el apartado anterior, con los datos ocurre algo muy parecido: se decide el tema sobre el que se quiere informar, se recolectan los datos, se limpian y se ponen a punto para su tratamiento, y por último se elaboran gráficos, infografías u otro tipo de visualizaciones.

Para poder elaborar un producto de calidad, es necesario conocer las características de la materia prima con la que se está trabajando, por lo que antes de comenzar a explicar las herramientas de uso en el periodismo de datos, es preciso analizar con qué tipo de datos se trabaja cada día y cuáles son sus principales cualidades y características.

3.4. Tipos de datos

Existen diferentes variedades dentro de la gran cantidad de datos que se pueden encontrar hoy en la red, en archivos de documentación físicos, en publicaciones institucionales, en portales web y demás, y todos ellos requieren una forma de trabajo y tratamiento distintos para poder aprovecharlos al máximo y extraer de ellos la mayor cantidad de información posible. Las tipologías principales que se explicarán a continuación son: nominal, ordinal, de intervalo y de razón. -

Nominal

Los datos nominales pueden ser contados y se utilizan principalmente para elaborar porcentajes. Se basan en el etiquetado de información por categorías. Por ejemplo, son útiles para saber qué 68

porcentaje de los productos que se venden en un supermercado son frescos, congelados, importados, de producción nacional, etcétera. -

Ordinal

Este tipo de datos se encuentran o extraen principalmente de encuestas en las que el tipo de respuestas para la pregunta formulada suele ser “muy de acuerdo”, “de acuerdo”, “en total desacuerdo” y demás, es decir, se trata de una tipología que se suele utilizar para opiniones y actitudes. Además, los datos ordinales se pueden emplear también para contar datos y calcular porcentajes, aunque existen problemas a la hora de interpretar categorías como las anteriormente señaladas de forma matemática, pues hacer promedios de categorías nombradas con “de acuerdo” puede dar lugar a conclusiones erróneas en un estudio al considerar las opiniones como números y calcularlas como tal. -

Intervalo

Son variables que determinan magnitudes y distancias entre dos números. Con ellos se pueden realizar comparaciones de igualdad/desigualdad, establecer un orden dentro de los valores de una escala y medir la distancia entre cada valor de la escala. Los datos de intervalo son numéricos, y permiten operaciones matemáticas, pero no existe un “punto cero”, es decir, el valor del cero no indica la ausencia de lo que se está midiendo. Por ejemplo, el hecho de que se registren cero grados centígrados no implica que no exista un índice de temperatura. -

Razón

Son numéricos y guardan una gran relación con la categoría anterior, excepto que no tienen un punto cero significativo, sino que cuentan con un cero absoluto, esto es, el valor 0 representa la 69

ausencia total de medida, por lo que se puede realizar cualquier operación aritmética y lógica. Estos datos permiten el valor más alto de medición y se suelen calcular variables de salario, altura, peso y demás. Dentro de esta categoría existen dos subtipos: discretos, donde solo se puede trabajar con cantidades específicas de lo que se está midiendo, es decir, no se puede emplear cuartos o mitades si los datos se refieren a personas; y datos continuos, donde se puede trabajar con cualquier valor de la escala.

Además de estos términos, al trabajar con datos es muy común encontrar otros términos que pueden dar lugar a confusión y que deben ser tenidos en cuenta como datos categóricos, datos cuantitativos y cualitativos. En cada fuente, o en cada documento del que sea posible extraer datos, estos estarán organizados de diferente manera y antes de comenzar a utilizarlos, es necesario estudiar detenidamente qué información representan y si la forma en la que están expresados es la correcta.

3.5 Extracción y colección de los datos

Si se retorna a la metáfora de la cocina antes mencionada, escoger los datos para un trabajo es similar a escoger los ingredientes adecuados para una receta, lo que significa, en ambos casos, tomar decisiones antes de comenzar con la parte principal del trabajo. Esto es, saber de dónde queremos extraer los datos, qué características tienen que tener, en qué formato los necesitamos

70

y demás necesidades básicas. No basta con ver los datos a través de la pantalla o en el papel, hay que saber cómo capturarlos, lo cual es un elemento clave a lo largo de todo el proceso. Las diferentes formas de llegar a la información son cada vez más variadas. Se pueden utilizar encuestas de todo tipo, observaciones, estudios de caso, pero son los menos ya que su ejecución requiere de tiempo y en ocasiones no se dispone de él, por lo que la búsqueda en la web es la manera más empleada para llegar a los datos en una redacción. En contraposición con las páginas webs a las que estamos acostumbrados a visitar, denominada como “Web Superficial”, donde se incluyen perfiles de sitios comerciales con gran cantidad de tráfico, está lo que se conoce como “Web Profunda” o “Internet Oscuro”, difíciles de acceder y cuyo contenido está aislado para el usuario común. En este tipo de webs se pueden encontrar documentos que no han sido almacenados bajo la estructura de HTML y que se encuentran en formatos diferentes como PDF, Excel, Flash, u otro tipo de extensiones. Estudios académicos, de investigación, tesis doctorales, resultados de encuestas, libros electrónicos, gráficos, infografías, y todo tipo de documentos no indexados por los motores de búsqueda pueden ser recuperados a través del uso de varias herramientas para poder así acceder a ellos y utilizarlos en los trabajos periodísticos. Para poder realizar una correcta extracción de los datos, el principal elemento que debe ser dominado son las búsquedas avanzadas de buscadores como Google 54 o Bing. Si lo que se necesita es extraer datos de tablas incluidas dentro de documentos PDF, una de las herramientas

54

www.google.com/advanced_search

71

más usadas por los periodistas de datos es Zamzar55, que convierte archivos de un formato a otro de forma sencilla - tan sólo hay que indicar la dirección del correo electrónico y se enviarán los datos en el formato requerido-. En el caso de querer obtener tablas o gráficos, hay que tener en cuenta la posibilidad de que se encuentren subidos a la red en formato imagen, por lo que no se debe olvidar su búsqueda en este formato. Para esto conviene buscar en plataformas como Flickr o Google Imágenes y se utilizan herramientas de reconocimiento óptico como Free OCR 56, a través de las que se extraen los datos de dichas imágenes sin necesidad de descargar la fotografía.

Con todo, la técnica por excelencia para la extracción de datos de páginas web es el “Scraping”, en español literalmente se traduce como “rascar” y es una técnica muy empleada para desprender la información que se necesita de grandes cantidades de datos. Algunos navegadores como Google Chrome incorporan esta técnica entre sus aplicaciones, aunque la forma más habitual de llevar a cabo esta tarea es a través de la aplicación ScraperWiki57 o OutWitHub58. Otras de las webs que se deben tener en cuenta a la hora de buscar datos son Infomine 59 , proyecto en el que participan varias bibliotecas de Estados Unidos y que recopila información de

55

http://www.zamzar.com/

56

http://www.free-ocr.com/

57

https://scraperwiki.com/

58

http://www.outwit.com/products/hub/

59

https://infomine.ucr.edu/

72

bases de datos, tablas, revistas, catálogos en línea y demás o Complete Planet60, que se define como una de las puertas de entrada a las miles de bases de datos que aloja la Web Profunda, y a través de la cual se pueden encontrar resultados que no son accesibles a partir de los motores de búsqueda convencionales. La existencia y uso de la Web Semántica61 supone un punto muy favorable para el periodismo de datos y la búsqueda de información, pues al reorganizar la información para que esta sea más comprensible se ejerce un profundo efecto en la manera en la que la gente consume la información. La gran cantidad de información disponible hoy en día en la red provoca que en ocasiones el proceso de buscar información se vuelva difícil y engorroso, por lo que es necesario un sistema superior y precisamente la web semántica viene a solucionar ese caos. Para conseguir esto, se tienen que estandarizar ciertas partes de la web como el alfabeto, las referencias, el lenguaje, el formato, significados, conceptos, reglas y sistemas de deducción. Algunos de los buscadores semánticos más utilizados son Wolfram Alpha 62, uno de los más conocidos, su versión Premium permite descargar datos y exportarlos directamente a hojas de cálculo; Swoogle 63, una base de datos que almacena metadatos sobre documentos en la web semántica; Cluuz64 presenta resultados en líneas de texto, en nube de etiquetas y en listas de

60

https://www.completeplanet.com/

61

Desarrollo Web que tiene que como objetivo proveer de contenido semántico o sentido inteligible a la información, permitiendo a los sistemas que intervienen en su gestión comprender y responder satisfactoriamente al contenido que solicita el usuario. 62

https://www.wolframalpha.com/

63

https://swoogle.umbc.edu/

64

https://www.cluuz.com/

73

imágenes, pero su punto fuerte son los mapas semánticos que devuelve enlaces seleccionados según las preferencias de búsqueda. Por último, es necesario apuntar que Google ha revolucionado el mundo de la Web Semántica desde que en 2012 lanzó su proyecto Knowledge Graph65, el cual ya no es que haya dado un gran paso en avances semánticos, sino que ha supuesto una transición entre la búsqueda de información a la búsqueda de conocimiento, y con la capacidad de conectarlo con otros temas debido a la recopilación de más de 500 millones de datos y 3.500 millones de vínculos con esos datos. Más allá del compendio a través de procedimientos propios como los que se han citado anteriormente (encuestas, observaciones, etcétera), el uso de los datos externos supone una gran ventaja para los periodistas de datos por tres motivos principales: -

El tiempo y el coste al reducirse el tiempo de investigación para recoger los datos

-

La accesibilidad, que permite el uso de datos a los que trabajando sobre los estudios e investigaciones personales no se tendría acceso.

-

Comunidad, pues se promueven nuevas ideas e intereses colaborativos al conectar a gente que está interesada en el mismo tópico.

En este sentido, el Open Data o los datos promovidos por instituciones públicas son de gran provecho e incorporan una gran cantidad de temas importantes para la sociedad, a los que de otro

65

https://www.google.com/insidesearch/features/search/knowledge.html

74

modo sería casi imposible su acceso. Algunos de los portales más visitados a nivel mundial son los siguientes: - World Bank (http://data.worldbank.org/) -United Nations (http://data.un.org/) -Open Data Index (https://index.okfn.org/) -Open Data Barometer (http://www.opendataresearch.org/project/2013/odb), -U.S. Government Data (https://www.data.gov) - Kenya’s Open Data Initiative (https://opendata.go.ke)

Por su parte, los portales de repositorios de datos más importantes y utilizados son: -DataBib (http://databib.org/ ) -DataCite (http://www.datacite.org/) -Dryad (http://datadryad.org/) -DataCatalogs.org (http://datacatalogs.org/) -Open Access Directory (http://oad.simmons.edu/oadwiki/Data_repositories) -Gapminder (http://www.gapminder.org/data) -Google Public Data Explorer (https://www.google.com/publicdata/directory)

75

-Knoema (http://knoema.com/atlas//)

3.6 Comprobación o “factchecking”

La comprobación o verificación de los datos con los que se trabaja ha sido siempre una parte ineludible dentro del proceso de producción de la información periodística. Sin embargo, con el desarrollo de las nuevas tecnologías y la introducción del periodismo de datos en los medios de comunicación, la situación del chequeo o comprobación ha dado un giro y se ha llegado a convertir en el punto central de la noticia, esto es, en el atractivo principal. Este sistema, inicialmente popularizado en Estados Unidos y sobre todo en el ámbito político, tuvo su punto de máxima expectación a partir del año 2009, cuando el diario Tampa Bay Times, de Florida, y su periodista, Bill Adair, crearon el portal Politifact66, especializado en analizar declaraciones y afirmaciones de personajes políticos, proyecto ganador de un Premio Pulitzer en ese mismo año. Un ejemplo de alguno de los trabajos realizados por este diario estadounidense, y de referencia para muchos otros es el conocido como “The Obameter”, que analiza los discursos y apariciones públicas del presidente de Estados Unidos y analiza el grado de cumplimiento de las promesas, la veracidad de sus afirmaciones y demás.

66

http://www.politifact.com/

76

Ilustración 11. Medidor de promesas del presidente de EE.UU, Barack Obama. Fuente: Politifact.com

A raíz de este trabajo, comenzaron a emerger nuevos proyectos y plataformas que analizan las palabras de los personajes o cargos públicos. Algunos de ellos son Factcheck.org, o la sección del Washington Post llamada The Fact Checker67, conocida por los famosos “Pinocchio Tests” en donde se otorga a los políticos con un rango de “pinochos” de 1 a 4 según la cantidad de mentiras que cometan en sus declaraciones. Por otro lado, en Argentina también se ha

67

http://www.washingtonpost.com/blogs/fact-checker/

77

comenzado a utilizar este método, a través del portal Chequeado.com, y el último de ellos, uno de los más populares en los últimos meses ha sido el proyecto lanzado por la web mexicana Animal Político 68 denominado “El Sabueso” en el que se siguen siete pasos básicos para comprobar la veracidad de las afirmaciones: 1. Seleccionar una frase del ámbito público y ponderar su relevancia 2. Solicitar al autor de la frase la fuente de su afirmación 3. Dirigirse a la fuente para verificar que los datos de la frase se corresponden realmente con los datos proporcionados por el autor de la misma 4. Se contrastan los datos con otras cifras o investigaciones sobre el tema 5. La frase se pone en un contexto social, temporal y/o económico 6. La frase se afirma, se contrapesa o se refuta 7. La afirmación se califica con una de las seis categorías y se publica el resultado Dichas categorías serían: verdadero, casi verdadero, no se puede probar, engañoso, falso o ridículo. En el ámbito español todavía no se ha instaurado la tendencia de la comprobación de los datos en los medios de comunicación excepto en casos aislados como en el programa de La Sexta, “El Objetivo” conducido por la periodista Ana Pastor. En dicho espacio televisivo, basado en entrevistas a personajes del ámbito público y debates sobre la actualidad con expertos en diferentes ámbitos, se trata de dar respuesta a las distintas preguntas que se plantean en cada uno

68

http://www.animalpolitico.com/

78

de los programas a través de la llamada “Prueba de verificación”69, en la que se analizan los datos disponibles para poder responder a la cuestión.

3.7 Limpieza y preparación de los datos

Unos de los aspectos más difíciles a la hora de trabajar con los datos es alcanzar la manera en la que deben ser tratados para su mayor utilidad. La preparación de los datos no es una tarea sencilla, requiere de tiempo y paciencia, y tampoco existe una única forma de hacerlo, cada conjunto de datos es único y por ello hay técnicas que solo se utilizan una vez. La primera parte del proceso de limpieza de datos, pasa por decidir cuáles son útiles y cuáles no para aquello que se quiere comunicar. Es muy común, no sólo en esta parte de la profesión, sino en muchas de las situaciones a las que nos tenemos que enfrentar a diario, que los datos en bruto disponibles tengan mucha información que no interesa, que está mal planteada, codificada irregularmente, etc. Para ello, las estrategias que más se suelen utilizar por los profesionales del periodismo de datos son Google Refine, una poderosa herramienta diseñada para ayudar a entender la estructura y calidad de los datos y permitir corregir errores comunes en ellos. Excel es otra buena herramienta para esta actividad, a pesar de no estar diseñada específicamente para esto, tiene la ventaja de ser manejado por una buena parte de la sociedad, por lo que para muchos será una buena opción para la optimización de la información.

69

http://www.lasexta.com/videos-online/programas/el-objetivo/prueba-verificacion/

79

Algunos de los pasos que se deben tener en cuenta a la hora de limpiar los datos para su preparación son los siguientes: -

Controles de rango. Ayudan a ver si los valores numéricos con los que se están trabajando están por encima o por debajo de las variables que deben ser aceptadas.

-

Corrector ortográfico. Una herramienta de comprobación básica que se utiliza para encontrar problemas en los datos como palabras mal escritas, abreviaturas que el sistema no pueda reconocer o relacionar etc.

-

Coincidencia de patrones. Un poco más avanzado que el paso anterior, esta acción trata de asegurar que todos los campos están rellenados con el mismo formato. Por ejemplo, si existe un apartado dentro de una base de datos que tenga que englobar direcciones de email, se asegura que todo lo que esté englobado en ese campo sean direcciones escritas correctamente.

-

Combinaciones de campos. Esta estrategia se lleva a cabo normalmente para poder determinar que el contenido de los campos es correcto, pues en ocasiones estos pueden funcionar sólo si están colocados en sentido predeterminado.

Estas son algunas de las acciones que se pueden seguir, pero como ya se ha mencionado, cada conjunto de datos tiene unas características que lo diferencian del resto, y por lo tanto, en cada caso es necesaria una toma de decisiones acordes a dichas características. Con todo, hay que aceptar el hecho de que los datos externos, es decir, los que no han sido creados por el profesional que los tiene que tratar, no siempre serán como se esperan y será muy difícil poder limpiarlos y prepararlos al completo. Además, se tendrá que ser consciente de que la limpieza de los datos no siempre será fiable y con ella no siempre se conseguirá obtener información 80

verdadera y contrastada al 100%. En el caso de grandes cantidades de datos, el hecho de aplicar un mismo formato, que las variables sean las correctas y demás, no garantiza que los datos en sílas diferencias que, por ejemplo, puede acarrear el introducir el número 54 o el 45- sean los que deseados y los que se pretenden conseguir.

3.8 Visualización

Una vez que se han recopilado los datos, seleccionado y optimizado, el siguiente paso dentro de la producción de periodismo de datos es hacerlos comprensibles y atractivos, y esta es quizás una de las partes más complicadas y a la vez más interesantes de todo el proceso productivo. La cultura del consumo en la que estamos inmersos, está provocando un ascenso del diseño centrado en áreas que se extienden más allá de los gráficos o los aparatos electrónicos como dispositivos móviles u ordenadores. Empresas de productos para el hogar como IKEA centran todos sus esfuerzos en el diseño, o la gran marca británica Virgin, que ha llevado la sensualidad a la industria aérea, creando aviones que asemejan más a un salón de una elegante mansión que a un medio de transporte. Es prácticamente obvio que los consumidores guían sus decisiones por el diseño, y otro buen ejemplo de ello es Apple. Por ello, y ante esta situación, si se pone la vista sobre el panorama actual de los medios de comunicación, -con grandes índices de competencia y nuevos medios digitales cada día-, se vuelve necesario poner el foco sobre el diseño para diferenciar la marca -y la información- de la multitud. En otras palabras, la gente precisa de un incentivo adicional para consumir información, y es por medio de atractivos visuales como se les ayuda a profundizar en el contenido. 81

En el artículo “Sobre el papel del diseño en la visualización de la información”, Andrew Vande Moore70 y Helen Purchase71, afirman que los estándares que deben ir adheridos a cualquier pieza visual que quiera transmitir información tiene que tener solidez, utilidad y belleza. Esto es, debe ser adecuada al tipo de información que representa, permitir al espectador deducir el significado de la misma, entenderla y retenerla y debe además, poseer un atractivo estético que llame la atención del espectador y proporcione una experiencia visual agradable. La comprensión es también un punto muy importante a la hora de plantear el diseño del gráfico. A lo largo de las últimas décadas, se han elaborado multitud de estudios sobre el aprendizaje. Uno de los más conocidos sugiere que cuando se trata de comprender información, las personas aprenden mejor con uno de estos tres tipos de estímulos: -

Visual

-

Auditivo

-

Cenestético o táctil

Según Lankow, Ritchie y Crooks (2013), aquellos que aprenden de manera visual comprenden mejor la información que se presenta en imágenes, diagramas, tablas y similares; los que lo hace de manera auditiva lo llevan mejor cuando escuchan información hablada; y los que aprenden de manera táctil necesitan tocar y aprender haciéndolo. A pesar de que esta teoría se da por

70

Profesor asociado en el Departamento de Arquitectura de K.U. Leuven en Bélgica. El principal tema de su investigación académica trata el potencial de la tecnología de sensores y actuadores en nuestro entorno construido y en el contexto de la visualización de datos, la computación ubicua y la arquitectura de los medios. 71

Profesora de Ciencias de la Computación en la Universidad de Glasgow

82

aceptada, no existe ninguna evidencia clara de que exista un método mejor que los demás para retener y comprender la información. De manera independiente a este debate, lo importante tener a tener en cuenta es la estructura de los medios de comunicación y los canales a través de los cuáles la gente obtiene información. Es menos importante identificar cómo prefieren aprender las personas que descubrir cómo están aprendiendo en realidad, y en la actualidad estas experiencias se están produciendo cada vez más en un entorno online, un canal basado principalmente en la visualización. Hasta que la red sea capaz de proporcionar experiencias táctiles, la mayoría de la información se comunicará visualmente y dado que las personas tienden a consumir información de manera visual, el valor de utilizar elementos visuales en la información es realmente significativo para el periodismo. La retención es el tercer punto más importante de la comunicación visual, pues ayuda a las personas a conservar información, ya que los gráficos son capaces de ampliar el alcance de nuestros sistemas de memoria. Esto nos dice que los gráficos que contienen un embellecimiento visual más allá de la información que se muestra pueden ser superiores no sólo en términos de atracción, sino también en su capacidad de garantizar que los espectadores entiendan y retengan su mensaje, que probablemente se basa en valores. Atraer a alguien no sólo de forma estética sino también de forma emocional da lugar a una conexión más profunda con la información, lo que hace que crezcan sus posibilidades de ser recordado. Como apunta Sara Cohen, de Duke University, en Data Journalism Handbook (2012), la visualización de datos merece ser tenida en cuenta, aparte de por su carga visual, por su capacidad de precisión y atención sobre el tema principal sobre el que se quiere informar, y su elaboración a partir de datos medibles y cuantificables, lo que eleva su veracidad. Además, 83

Cohen apunta a que la visualización de información tiene un carácter versátil, pues es apropiada tanto para noticias de última hora como la señalización geográfica de sucesos, así como para profundizar en temas complejos. La visualización de datos es útil en muchos aspectos, pero sobre todo, tiene gran incidencia en la representación de las siguientes situaciones: ver temas que nos son familiares desde otro punto de vista, mostrar el paso del tiempo, comparar valores, mostrar conexiones entre dos temas, sujetos u objetos y para trazar flujos. Algunos ejemplos de esto se muestran a continuación. En el primer caso, el número de muertes según las diferentes guerras que se han ido sucediendo a lo largo de la historia, se puede comprobar a través de la visualización donde se realiza una comparación de los valores entre cada una de ellas para que el lector pueda hacerse una idea más visual de lo que implicó cada una.

84

Ilustración 12. Coste humano de diferentes guerras. Fuente: BBC

Ilustración 13. Datos de desempleo según perfil socioeconómico. Fuente: The New York Times

85

En el segundo de los casos, se observa como en ocasiones se utiliza la visualización de los datos para poner a prueba la concienciación general sobre un tema. El gráfico interactivo que se presenta, muestra la tasa de desempleo en Estados Unidos según el nivel de estudios, la raza, el sexo y la edad y fue elaborado por The New York Times en el año 2009, en plena efervescencia de la crisis económica, y por lo tanto en un momento en el que la gente estaba familiarizada con la información sobre tasas de desempleo, pero probablemente no lo estaba tanto con la cifra exacta correspondiente a sus características sociales y económicas.

Como en todos los campos del periodismo, en los procesos de producción de la información no se deben olvidar la ética y la fidelidad a la verdad, el rigor y la exactitud. En un gráfico, o en cualquier representación de datos, es relativamente fácil que los medios que los elaboran tiendan a espectacularizar la información a través del diseño. En vista de que eran muchos los medios que no estaban cumpliendo estos principios es sus trabajos, Alberto Cairo72 (2011), propone seis puntos que toda representación visual debe cumplir: 1. No puede realizarse en ausencia de información fiable 2. No debe incluir elementos que no estén basados en hechos conocidos y evidencias disponibles

72

Profesor de infografía y multimedia en la escuela de periodismo de la Universidad de Carolina del Norte en Chapel Hill (EEUU). También trabaja como consultor, asesor y freelance para medios de comunicación en todo el mundo (The New York Times, National Geographic, The Roanoke Times, El Universal, La Tercera, etc)

86

3. No debe presentarse como verdad un gráfico basado en ficción o en suposiciones no verificadas 4. No debe ser publicado sin acreditar las fuentes de la información 5. Los profesionales de la visualización de datos deben rechazar producir cualquier representación visual que incluya componentes ficticios diseñados para hacerla más “atractiva” o “espectacular” y los editores deben abstenerse de pedir gráficos que no se ajusten a las pruebas disponibles 6. Las visualizaciones no son ilustraciones ni arte. Son periodismo visual y deben regirse por los mismos estándares éticos que se aplican al resto de la profesión

Para elaborar trabajos de visualización de la información existen multitud de herramientas, programas y aplicaciones, cada día más numerosas y de manejo más fácil, aunque también hay que apuntar que el hecho de construir una buena visualización requiere capacidades profesionales que la mayoría de las veces no dependen de las facilidades técnicas disponibles sino de conocimientos profesionales sobre el tema que se quiere expresar y sobre la mejor forma de plantear el proyecto. Con todo, algunas de las herramientas utilizadas en la elaboración de representación visual de la información son: Tableau 73 , una de las más empleadas por su facilidad de uso y funcionalidades; Weave 74 , herramienta muy potente, permite graficar casi cualquier dato de cualquier manera; Gephi75 es una de las mejores plataformas de visualización

73

https://public.tableau.com/s/

74

https://public.tableau.com/s/

75

https://gephi.github.io/

87

de nodos, que permite hacer gráficos dinámicos y jerárquicos de forma sencilla; Many Eyes 76, herramienta para crear infografías de IBM, tiene muchas opciones de personalización y se pueden compartir las creaciones; NodeXL77, plataforma que trabaja simultáneamente con Excel; Data Driven Documents 78 , es una librería de Java- Script que permite manipular elementos basados en datos y es muy sencilla, flexible y eficiente; Axiis 79 , uno de los programas más antiguos y populares que existen; y por último Google Fusion Tables 80 , el desarrollador de visualizaciones de Google que permite compartir datos de forma abierta y construir gráficos personalizados.

4. Análisis y comparación del Periodismo de Datos elaborado por El Mundo y The Guardian

Una vez que se han sido presentadas y analizadas las características del periodismo de datos, es conveniente observar de manera más práctica y analítica como se realiza y se trabaja sobre esta modalidad y los resultados que se obtienen de ella. Para esto, han sido escogidos dos medios de comunicación europeos, uno español, El Mundo, uno de los pocos diarios que realiza trabajos de periodismo de datos en nuestro país, y otro anglosajón, pionero y ejemplo a seguir por muchos otros en este campo, The Guardian. La elección de estos dos diarios viene marcada por su 76

http://www-01.ibm.com/software/analytics/many-eyes/

77

http://nodexl.codeplex.com/

78

http://d3js.org/

79

http://www.axiis.org/index.html

80

https://support.google.com/fusiontables/answer/2571232

88

influencia en cada uno de sus respectivos países, siendo los diarios de mayor tirada en sendas naciones y cuyas informaciones alcanzan cada día a un gran número de lectores, como se ha apuntado anteriormente. Uno de los principales objetivos que contiene este análisis es comparar las características de uno y otro en todos los campos posibles: número de publicaciones, características de cada una, herramientas utilizadas, tipos de datos, temáticas y demás, que puedan arrojar un poco de luz y poner en situación sobre el estado del periodismo de datos en España, especialidad que todavía está comenzando a crecer, e Inglaterra, donde es una proceso más habitual en los medios de comunicación. En este sentido se tratará de predecir de qué manera se debería de desarrollar esta especialidad en nuestro país, y qué caminos está tomando con respecto a uno de los medios más ejemplares y seguidos en este ámbito.

4.1 Metodología

El proceso metodológico que se llevará a cabo está marcado por la elección de varias piezas de cada uno de los diarios, concretamente 5 trabajos de cada publicación, en el caso de El Mundo, extraídos de su apartado conocido como El Mundo Datos81, y en el caso de The Guardian, de su Datablog82. El proceso de selección que ha seguido para escoger los trabajos ha sido aleatorio excepto en un caso, en el que los autores de El Mundo apuntaron en el inicio de su trabajo que se

81

http://www.elmundo.es/periodismo-de-datos.html

82

http://www.theguardian.com/data

89

habían basado en un proyecto de The Guardian para elaborar dicho trabajo. Por este motivo, se ha optado por escoger esas dos noticias de forma premeditada con la finalidad de vislumbrar en mayor medida cuáles son los puntos o partes que se toman como ejemplo del medio británico. Estas piezas son, en el caso español la titulada como “Elecciones: los de 18 a 25 años, ¿estáis ahí?”83 y en el ejemplo británico “UK Election 2015. Can young voters make a difference?”84. A continuación se muestra un listado de los proyectos escogidos de forma aleatoria en cada uno de los dos medios de comunicación:

El Mundo

Fecha

Título

En constante actualización

Mapa de la corrupción en España

29/09/2014

Opacidad y recortes en el gasto contra los incendios forestales

07/09/2014

Turismo de borrachera, un arma de doble filo

09/12/2014

¿Cuánto le cuesta el consejo consultivo de su CCAA?

Ilustración 14. Proyectos de El Mundo escogidos para el análisis. Fuente: elaboración propia

83

http://www.elmundo.es/blogs/elmundo/mas-datos/2015/03/05/elecciones-los-de-18-a-25-anos-estais.html

84

http://www.theguardian.com/politics/datablog/2015/feb/24/uk-election-2015-can-young-voters-make-a-difference

90

The Guardian

Fecha

Título

30/10/2014

London’s second languages mapped by tube stop

17/12/2014

More than 200 journalists in prison worldwide for third consecutive year

09/03/2015

Inmigration and health what UK voters are talking about, data shows

23/02/2015

This is where Australia’s imported food comes from

Ilustración 15. Proyectos escogidos para el análisis de The Guardian. Fuente: elaboración propia

Para poder realizar un buen análisis tanto cualitativo como cuantitativo de los trabajos de estos dos periódicos señalados es necesario elaborar unas pautas básicas que serán utilizadas a lo largo del estudio. Estas directrices generales tienen como finalidad establecer un esquema de las partes en las que más se debe incidir para posteriormente poder comparar el trabajo de cada uno de los cibermedios. Las bases escogidas son las siguientes:

91

Universo

Número total de proyectos de cada medio durante los seis meses escogidos para la muestra

Temas

Análisis de la temática de cada uno divididos en: política, economía, sociedad y cultura

Titulación

Características de los titulares de las piezas: informativos e indicativos (expresivos y apelativos)

Presentación

Características de la forma en la que se muestran los datos: tipos de gráficos

Tipología de los datos

Fuentes de extracción, características formales.

Tratamiento

Características de la contextualización del tema

Ilustración 16. Puntos principales del análisis de los medios. Fuente: elaboración propia.

El universo escogido para elaborar el análisis de los dos medios de comunicación es de seis meses, comprendido entre octubre de 2014 y abril de 2015. Dicha elección está motivada por el hecho de que en el caso de El Mundo las piezas informativas elaboradas a partir del periodismo de datos son menos frecuentes que en el diario británico The Guardian y por ello se ha decidido ampliar el período de elección de tres meses -tal y como había sido planteado en un principio- a seis para poder disponer de un rango mayor de piezas, con más variedad de temas y tipos de trabajos en los dos casos. 92

Una vez que las piezas a analizar han sido escogidas, lo primero en elaborarse será una clasificación o distribución de las áreas temáticas en las que recaen las noticias para poder especificar así cuáles son los temas más trabajados en periodismo de datos por cada uno de los dos periódicos. En segundo lugar, la forma de titulación y sus características también ocupan un lugar destacado dentro del análisis. Para estudiar los tipos de titulares que caracterizan las piezas escogidas para esta investigación se tomará como punto de partida la clasificación de los tipos de titulares asentados por Lavedèze (1995), organizados en titulares informativos, y dentro de ellos los de tipo estático y dinámico y en segundo lugar los indicativos, dentro de los que puede haber dos subtipos: expresivos y apelativos. Los titulares informativos son aquellos que permiten identificar la unidad de cambio de una acción de manera singulizadora aunque gramaticalmente no construyan oraciones de sujeto y predicado expreso. Es decir, explican el sujeto de la acción, la acción misma y las circunstancias. Dentro de los informativos, existen dos subtipos: los estáticos y los dinámicos. Los estáticos describen efectos o resultados de las acciones o se centran en la situación originada por la acción de la que se informa y generalmente son pasivos (Mar de Fontcuberta, 1993). Por su parte, los dinámicos se refieren principalmente a la acción y la mayor parte de las veces se construyen con un verbo en presente y futuro. Por otro lado, los titulares indicativos suelen acarrear opiniones o juicios. Dentro de ellos se pueden encontrar los categorizados como expresivos, aquellos que no aportan información sobre hechos, no se orientan a informar sobre sucesos y/o circunstancias, sino a evocar, en mayor o menor medida, un hecho que se presume conocido. El segundo subtipo se corresponde con los 93

titulares apelativos, aquellos que utilizan el lenguaje para llamar la atención sobre un hecho cuyo conocimiento no se presume pero del que tampoco se informa o se hace de una forma un tanto vaga. La tipografía y elementos ortográficos que dan relieve al título funcionan como reglas de información sobre cuya particularidad no se ofrecen datos suficientes que permitan singularizarlo como un hecho en circunstancias específicas. Estos títulos apelativos suelen ser meramente temáticos, esto es, mencionan un tema pero no dan información que permita identificar el asunto.

Otro de los aspectos más importantes que se analizarán de los trabajos escogidos serán los tipos de gráficos que se utilizan para presentar la información. Algunas de las posibilidades de visualización son mapas, tablas con información desglosada por características, gráficos de barras, de líneas, circulares, diagramas de dispersión, nubes de palabras, diagramas de vínculos de puntos nodales, gráficos de burbujas, treemap, o gráficos sociales entre otros. Además de explicar la forma en la que se presenta la información, se tratará de analizar dónde se han conseguido los datos con los que se elaboró esa información, si son de carácter público y accesibles para toda la sociedad en su conjunto y cuáles han sido elaborados a partir de otras fuentes. Por último, se tratará de detallar la forma en que ha sido tratado el tema, si está contextualizado, es decir, si la visualización o presentación de los datos se acompaña junto con un texto explicativo que indica las características del tema, si se explican los datos o se dejan al juicio e interpretación del lector, y el nivel cualitativo de esa información, esto es, si se profundiza en la cuestión o no y en qué medida son tratados los temas según su tipología y contenido.

94

4.2 Análisis de los proyectos seleccionados

El primero de los pasos, que tal y como se ha indicado en las líneas anteriores, se llevará a cabo en este análisis, será estudiar el universo escogido para la investigación. A través de un recuento de los proyectos del citado período de seis meses, que engloba las publicaciones desde octubre de 2014 a abril de 2015, se tratará de profundizar en la importancia que se le da en cada medio al periodismo de datos. Así pues, en El Mundo existen 25 trabajos elaborados principalmente a partir de datos extraídos de fuentes públicas y privadas, encuestas u otros tipos de investigación. Además, de manera “extraoficial”, los alumnos del Master en Periodismo de Datos e Investigación promovido por este diario en colaboración con la Universidad Rey Juan Carlos de Madrid, tienen su espacio en este punto del cibermedio para publicar sus trabajos, aunque estos no han sido tenidos en cuenta en este proyecto al tratarse de prácticas universitarias y publicadas en este espacio por ser la cabecera quien promueve y gestiona estos estudios y no porque los que han elaborado formen parte de la plantilla del diario español. De este modo, a través del recuento se ha podido determinar que de los 25 proyectos que se han elaborado en la sección “Periodismo de Datos”, nueve de ellos corresponden a la sección de Economía, siete a la de Política, seis a la de Sociedad, ninguno a la de Cultura, dos a Deportes, y uno a Internacional. Para poder observar el resultado de manera más gráfica y visual, a continuación se puede ver un gráfico con la repartición de los temas en los proyectos.

95

En dicho gráfico se puede observar como las áreas en las que se reparten los temas no son proporcionales sino que unas tienen mucho más peso que las demás, en este caso, Economía y Política engloban más de la mitad de los trabajos totales.

Ilustración 17. Reparto por áreas temáticas de los proyectos realizados en El Mundo a partir del periodismo de datos. Fuente: elaboración propia

En el caso de The Guardian el número total de proyectos realizados a partir de esta especialidad periodística es de 219 piezas. De ellas, la mayoría se encuentran en la sección Política, con 54 trabajos, la de Sociedad con 48, la de Internacional con 38, Cultura con 37, Economía con 27, y Deportes con 15. Al igual que en el caso anterior, se muestra un gráfico con la repartición de las áreas por número de trabajos realizados en cada una. En este caso, y al contrario de lo que 96

ocurría con el diario español, se puede observar cómo las áreas en las que se reparten las obras son mucho más equivalentes entre sí, teniendo una presencia importante en el medio todas y cada una de ellas y no dando predominancia a dos áreas concretas. Con todo, también se debe tener en cuenta que el hecho de elaborar proyectos casi a diario brinda la oportunidad de tener un abanico de temas más amplio e igualado.

Ilustración 18. Reparto de las áreas temáticas de los trabajos realizados por The Guardian a partir del periodismo de datos. Fuente: elaboración propia

Además de las áreas, es necesario visualizar las diferencias en el número de obras publicadas a través del Periodismo de Datos. Así pues, se puede comprobar cómo el diario anglosajón es mucho más activo en cuanto a la realización de trabajos a partir de datos en todas las áreas

97

temáticas estudiadas, multiplicando casi en ocho ocasiones el número de trabajos en la cabecera española.

Ilustración 19. Comparación del número de proyectos realizados en esta modalidad por los dos medios. Fuente: elaboración propia

Tanto a partir de las cifras como de los gráficos se llega a la conclusión de cuáles son las áreas que tienen mayor importancia en los diarios. En el caso de El Mundo la sección de Economía, y en The Guardian la sección de Política, son los dos apartados más numerosos dentro del medio. Del mismo modo, se puede comprobar cómo cada uno de ellos aporta un peso más importante a un tema distinto, esto es, en el caso del diario español, no existe un tema predominante, se elaboran piezas a medida que surge la actualidad, en cambio durante el recuento de las piezas en The Guardian se ha visto la numerosa cantidad de trabajos que han sido creados con motivo de

98

las elecciones presidenciales en Gran Bretaña celebradas en el año 2015 y por lo tanto, esto aporta una mayor importancia a la sección política, tal y como se ha visto.

4.2.1 El Mundo

A continuación se realiza el análisis de los trabajos que han sido identificados en el cuadro expuesto con anterioridad y extraídos de la versión web del periódico español El Mundo. El primer trabajo seleccionado es “El mapa de la corrupción en España”, una de las últimas piezas elaboradas por el equipo de datos de este diario y que está en constante actualización a la espera de la resolución de los casos abiertos en los juzgados repartidos por toda la geografía española. Tal y como apuntan sus creadores, el objetivo de este trabajo es construir una base de datos que recopile los principales casos de corrupción destapados desde el año 2000 en España, con el foco de atención sobre personajes políticos y agrupados a nivel autonómico, hecho por el que se puede afirmar que su contenido es exclusivamente político. En cuanto a la titulación de esta pieza, se observa como su titular “El mapa de la corrupción en España” es totalmente informativo pues define y explica el gráfico y su contenido sin tener en cuenta ningún tipo de juicio u opinión por parte de los profesionales que la han elaborado. En lo que se refiere a su presentación, el gráfico se corresponde con un mapa de España interactivo, provisto con unas pestañas en la parte posterior del mismo a través de las que se puede acotar la búsqueda y filtrar a los sujetos por partido político, caso de corrupción o por tipo de imputación, además de una búsqueda general.

99

Ilustración 20. Mapa de la corrupción en España. Fuente: El Mundo.

Así, se comprueba como el mapa refleja una auténtica base de datos, a través de la que se pueden acotar los resultados y observarlos de una forma más visual y comprensiva para entender mejor el tema presentado y poder contextualizarlo en mayor medida ya que las elecciones hechas por el lector muestran los resultados de forma automática. Los datos con los que han sido elaborados tanto el gráfico interactivo como la base de la información se obtuvieron a través de la recopilación de las publicaciones en prensa de los diferentes periódicos españoles e internacionales, además de con la ayuda de varios redactores tanto del propio medio, como de periodistas de diferentes periódicos ante la existencia de un listado oficial y público de dichos casos de corrupción. En este gráfico cabe destacar que se 100

utilizan valores absolutos y no porcentajes, estadísticas o comparaciones de niveles de corrupción entre comunidades autónomas. Según apuntan sus autores, la herramienta principal para la elaboración del gráfico es D3, Excel y Google Spreadsheets para la recopilación, ordenación y análisis de los datos. En cuanto a su tratamiento o contextualización, el proyecto no dispone de nada más que el propio gráfico y la información que proporciona, así como las conclusiones que se pueden derivar del mismo, pues se puede afirmar que dicho trabajo supone un complemento adicional a todas las noticias que se han ido publicando en la prensa a lo largo de los últimos años, con el fin de aclarar y simplificar al lector la situación de la corrupción en España y el avance de los juicios y condenas de los mismos, al contrario de lo que ocurre con otros proyectos, creados para informar sobre temas antes desconocidos, este supone pues una vía de mayor entendimiento y aclaración sobre la corrupción en nuestro país. En este sentido, en la pestaña llamada “Casos” se incluyen algunas de las tramas que en realidad forman parte de otras al mismo tiempo, pero son analizados y presentados por separado debido a la dificultad que supone entender todo el entramado en su conjunto. Ejemplo de ello es la separación del Caso Nóos, englobado dentro del caso Palma Arena, pero que por sus características y su tratamiento separado en la prensa, merece una explicación aparte. El segundo de los trabajos a analizar de este medio se corresponde con “Opacidad y recortes en el gasto contra los incendios forestales” de temática principalmente económica, ya que trata la falta de fondos públicos destinados para prevenir los incendios, aunque también se puede considerar que tiene un trasfondo social muy latente por la influencia en la sociedad, tanto por los recortes como a causa de los incendios y los daños derivados de los mismos. 101

El titular, del mismo modo que ocurría en el caso anterior, es informativo, pues pone al lector en situación sobre lo que va a experimentar o aprender en este proyecto, esto es, un desglose de los recortes llevados a cabo en dicha materia así como su influencia en la sociedad. En este caso, la información elaborada a partir de los datos se encuentra en varios gráficos interactivos y no sólo en uno, como pasaba en el caso anterior, pues cada tipo de datos tiene unas cualidades intrínsecas que deben ser tratadas de manera separada. A continuación se pueden ver algunas de las piezas del proyecto relativas al gasto por hectárea forestal y el gasto en la lucha contra incendios por comunidad autónoma.

Ilustración 21. Relación del dinero gastado en prevención de incendios por comunidades autónomas. Fuente: El Mundo

102

Ilustración 22. Gasto público en la prevención de la lucha contra incendios. Fuente: El Mundo

Como ya se ha apuntado, en este trabajo no existe sólo un gráfico, sino que a lo largo de la noticia confluyen varias formas de representación visual, con diferentes tipos de información y presentación. Así, en el primero de ellos se observa un mapa interactivo (correspondiente al primer mapa señalado) que representa el territorio español y en él muestra la evolución del gasto público destinado a prevención e investigación de incendios en cada una de las autonomías del país y en la segunda muestra, el gasto en la lucha contra esta situación en un gráfico de líneas también interactivo. En cualquiera de las dos visualizaciones presentadas el público puede filtrar la información que recibe a través de las casillas provistas para escoger la información que se prefiere de forma desglosada.

103

En cuanto a los datos utilizados en este proyecto, se señala en la propia noticia que una gran parte de las administraciones públicas competentes no han querido proporcionar información sobre los fondos destinados a la prevención de incendios. Además se apunta que la obtención de los datos presentados han sido recuperados gracias a la colaboración de Andalucía, Asturias, Extremadura, Murcia y los ministerios de Presidencia y el MAGRAMA, mientras que algunas comunidades han aportado datos parciales. En el caso de regiones como Galicia, Castilla-La Mancha, Comunidad Valenciana, Islas Baleares o Madrid han decidido ejercer el silencio administrativo. Además, es necesario indicar que este proyecto es también publicado simultáneamente bajo el título de “España en Llamas” cedido por la Fundación Civio, cuyos trabajos ha sido comentados en epígrafes anteriores.

En comparación con el anterior trabajo analizado, la contextualización es en este caso mucho más extensa pues aparte de los gráficos, el trabajo está acompañado de fotografías y varios sub apartados. En el texto se tratan temas básicos como el número de incendios registrados en 2014, además de declaraciones sobre el asunto de personajes políticos relevantes y de organizaciones a favor del cuidado del medio ambiente como Greenpeace. Además de esta contextualización previa, a lo largo de la pieza se van intercalando explicaciones de los datos mostrados en los gráficos, a la vez que se señalan también varios ejemplos derivados de los recortes y falta de fondos especificados.

La tercera de las noticias estudiadas tiene relación con los nuevos tipos de turismo desarrollados en España durante los últimos años. La obra tiene por nombre “Turismo de borrachera, un arma 104

de doble filo”, y presenta un tratamiento predominantemente de carácter social debido a que está centrado en el turismo y su influencia en la comunidad. La primera de las características de la pieza es su titular apelativo, ya que utiliza el lenguaje para llamar la atención, y a pesar de que introduce el tópico sobre el que se construye la información, no aporta grandes rasgos de lo que se va a tratar dentro del trabajo, por lo que no trata de informar o poner al lector en antecedentes sobre los cambios en la forma de turismo en España. Al contrario de lo que ocurría con los dos casos anteriormente analizados, esta titulación se caracteriza por utilizar metáforas, como “arma de doble filo” o también “turismo de borrachera”, un término creado recientemente por los medios de comunicación para definir a los grupos de jóvenes, principalmente británicos que acuden a lugares emblemáticos del turismo en España como Andalucía o las Islas Baleares, con la única motivación de beber alcohol a bajos precios, acudir a discotecas hasta altas horas de la madrugada sin reparar en el bienestar de los ciudadanos de esas zonas.

En cuanto a la presentación de los datos, se recurre a gráficos lineales interactivos en los que el valor señalado cambia a medida que se pulsa con el cursor en un punto u otro de las líneas, así como un mapa de la península, también interactivo, en el que se desglosa la información por municipios. A lo largo del proyecto existen tres grandes grupos de gráficos: el primero representa la evolución del turismo según el tipo de alojamiento, el segundo la evolución en el número de plazas en apartamentos turísticos, y el tercero la evolución del turismo en el sector hotelero entre el 2008 y el 2013.

105

Para la elaboración de estos gráficos se ha recurrido a la herramienta Tableau, una de las más utilizadas en este ámbito del periodismo, y Datawrapper. Las fuentes de los datos son principalmente estamentos públicos como el Instituto Nacional de Estadística, la Encuesta de Ocupación Hotelera, y TourSpain, organismo dependiente del Ministerio de Industria, Energía y Turismo responsable del Marketing del país en el resto del mundo.

Ilustración 23. Evolución del turismo según tipo de alojamiento. Fuente: El Mundo

106

Ilustración 24. Evolución del turismo en el sector hotelero. Fuente: El Mundo

Con la finalidad de presentar el tema en mayor profundidad la forma escogida para el tratamiento de los datos es una evolución en el tiempo. Al tratarse de cambios en un hábito social, la manera más óptima para poder comprobar los cambios de la cuestión es ver cómo han evolucionado las costumbres de los turistas para posteriormente explicar la situación actual con los datos acompañados por un texto complementario.

En este caso, la contextualización del tema vuelve a ser bastante extensa. Primero se define y explica el término “turismo de borrachera” y después se enuncian los problemas que acarrean para la sociedad en general como el comportamiento incívico o destrozos en las calles y demás 107

fechorías. El texto continúa con declaraciones de expertos en turismo y cargos importantes dentro de asociaciones del sector como Fevitur antes de presentar la visualización de datos creada. En esta pieza se utilizan las preguntas para introducir los datos, dando a entender que la mejor forma de contestar a una cuestión es mostrarlo con datos reales. Así, cuestiones como “¿Dónde veranean los extranjeros?” o “¿Un cambio de modelo?” son la antesala a la introducción de los gráficos. Por otro lado, como sucedía con las noticias anteriores, cada gráfico está acompañado de una explicación más profunda de lo que muestran los datos, ayudando así al lector a comprender mejor la información que se le está proporcionando.

La cuarta pieza seleccionada para su estudio se corresponde con un proyecto de tema principalmente político pues analizan las legislaciones y normas de los consejos consultivos de cada comunidad autónoma de España. En este caso, el titular de la pieza “¿Cuánto le cuesta el consejo consultivo de su CCAA? se corresponde de nuevo con un titular informativo a pesar de ser una pregunta enunciada de manera directa al lector, pues apunta a que la cuestión que será tratada en las sucesivas líneas intentará desenmascarar qué cantidad de los impuestos se destinan a estos fines políticos. Una vez más nos encontramos ante una pieza extensa y con una amplia contextualización del tema. En este caso, los datos han sido extraídos a través de los presupuestos de las Comunidades Autónomas para los consejos consultivos y Memorias de los Consejos Consultivos, de carácter público disponibles en las webs de los diferentes organismos dependientes del Gobierno central.

108

Ilustración 25. Evolución de los presupuestos de las CCAA. Fuente: El Mundo

Cabe destacar que además de presentar los datos ya filtrados y tratados para su comprensión, El Mundo ofrece la disponibilidad de descargar un archivo de Excel con los datos en bruto con los que el equipo de Periodismo de Datos de este medio ha trabajado. En esta ocasión se recurre de nuevo a los gráficos lineales interactivos elaborados con Tableau, aunque también se ha optado por la elaboración de un gráfico de barras y otro circular para cada una de las comunidades.

109

Ilustración 26. Actividades desarrolladas por los consejeros de las comunidades autónomas. Fuente: El Mundo

En el campo correspondiente a la contextualización, se puede observar cómo de nuevo se recurre a amplias explicaciones que ponen al lector en situación. Para ello se utilizan declaraciones de expertos y cargos importantes dentro de las comunidades autónomas. Ejemplo de ello es el extracto de un vídeo de una entrevista a Joaquín Leguina, expresidente de la comunidad de Madrid o declaraciones de Miriam Gracia, vicepresidenta del Consejo Consultivo de Aragón entre otros, de los que se va apuntando su opinión sobre la cuestión a medida que los cifras van ocupando su lugar dentro del conjunto de la noticia. Por tanto, la estructura para contextualizar las piezas es la misma que en anteriores piezas, esto es: 1. Introducción del tema y antecedentes de la cuestión 2. Presentación de los datos 110

3. Explicación y declaraciones referentes a los resultados obtenidos con el estudio de los datos 4. Conclusión

4.2.2 The Guardian

En las siguientes líneas se analizará, siguiendo el mismo esquema que para el diario español El Mundo, algunas de los trabajos elaborados a partir de la disciplina del Periodismo de Datos por uno de los medios pioneros a nivel mundial en comenzar a utilizarlo como es el caso de The Guardian. La primera pieza estudiada dentro de este medio lleva por título “London’s second languages mapped by tube stop” en la que se investigaron las lenguas más habladas -después del inglés- en cada una de las paradas de las que dispone el metro público de la capital británica, Londres. En este trabajo se intenta exponer pues cuál es la parada, y por lo tanto la zona, con mayor diversidad lingüística y cultural de la ciudad. Por este motivo, estamos ante una noticia de carácter cultural y social, pues el fin principal es tratar de extraer conclusiones a través de un estudio que determine las características sociales de una comunidad. Su titular es puramente informativo y se ajusta totalmente a las características de la información que contiene la pieza y que han sido comentadas en estas líneas. Cabe destacar que a pesar de haber sido un trabajo publicado en The Guardian, su autor no pertenece a la plantilla del periódico, sino que se corresponde con el proyecto de un investigador en geovisualización y arquitectura web de la College London University. Por otro lado, se 111

apunta que los datos con los que se ha elaborado esta pieza han sido extraídos del Censo de la ciudad del año 201185 además de los realizados a partir de las investigaciones del propio creador, Oliver O’Brien, sobre los viajes con más tráfico hechos por los usuarios y las estaciones más congestionadas de la ciudad. Por su parte, los mapas han sido construidos con OpenStreetMap, herramienta también utilizada por El Mundo en varias ocasiones.

Ilustración 27. Lenguas habladas en las diferentes estaciones de metro de Londres. Fuente: The Guardian

El tratamiento del tema es poco extenso, ya que a pesar de ser información difícil de obtener, los mapas representados hablan por sí solos, por lo que el escaso texto que existe en la pieza se 85

http://www.ons.gov.uk/ons/guide-method/census/2011/index.html?utm_source=twitterfeed&utm_medium=twitter

112

limita a hacer una pequeña explicación de los detalles del autor, la forma en la que se han obtenido los datos y pequeñas introducciones a los diferentes mapas existentes. Así, se puede concluir que a pesar de la originalidad del tema, los editores de la edición han preferido dejar espacio para las conclusiones de la audiencia y no interferir en las opiniones o visiones personales, ciñéndose a presentar los resultados. Por otro lado, en la última de las representaciones señaladas, se observa cómo además de las lenguas habladas, el autor de este estudio añadió una nueva variante a su trabajo, analizando cuáles eran las ocupaciones predominantes según qué área de la ciudad, soluciones a las que llegó llevando a cabo las mismas rutinas que para el estudio anterior.

Ilustración 28. Ocupaciones mayoritarias por zonas de metro. Fuente: The Guardian

113

Otro de los trabajos publicados en el diario anglosajón durante los últimos seis meses es “More than 200 journalists in prison worldwide for third consecutive year”. De nuevo, el titular es de carácter meramente informativo, ya que se limita a dar una cifra real de los periodistas encarcelados alrededor del mundo, eje principal de la noticia y punto de inicio para una pieza que posteriormente analizará por países el número de profesionales de la comunicación arrestados y los motivos, dando así por tanto visión y difusión a un tema de carácter principalmente social pero con trazas políticas. En este proyecto confluyen dos gráficos principales, uno que marca el número de periodistas en prisión y su posición geográfica, mostrado a través de un mapa, y en segundo lugar un gráfico de barras, en el que se enumera una lista de causas para el encarcelamiento.

Ilustración 29. Periodistas en prisión repartidos por países. Fuente: The Guardian.

114

Ilustración 30. Delitos por los que los periodistas presos han sido condenados. Fuente: The Guardian

La consecución de los datos mostrados en este trabajo ha sido posible gracias a un estudio elaborado por el llamado Comitte to Protect Journalists (CPJ) a partir del cual el equipo de datos de The Guardian construido esta información. La contextualización del tema es, de nuevo, poco extensa ya que tan solo se apunta la fuente de los datos y se explica de manera sencilla los resultados más destacables de los dos gráficos, así como alguna que otra comparación de las cifras con el año anterior. Por lo tanto se vuelve a dar de nuevo toda la importancia a los gráficos y la información que por sí solos transmiten.

115

El tercer trabajo se corresponde con una visualización que muestra la procedencia de los alimentos llegados a Australia procedentes de otros países alrededor del mundo. Su titular “This is where Australia’s imported food comes from” es de carácter informativo, pues de nuevo vuelve a describir el contenido del proyecto sin metáforas ni opiniones en el mismo, tan solo se limita a introducir el tema principal.

Ilustración 31. Productos de alimentación importados desde Australia en 2012 y 2013. Fuente: The Guardian

Los datos para la creación de este mapa de flujos han sido extraídos de la página web del Ministerio de Agricultura de Australia, disponibles para todo aquel que lo solicite en varios tipos de formatos para su uso y consulta. En este estudio tan sólo han sido incluidos aquellos datos que

116

superan las exportaciones por valor de más de 500.000 dólares, según apunta su creador, Nick Evershed. De nuevo, se puede ver de qué manera el gráfico de flujos interactivo vuelve a ser el protagonista, ya que tan sólo se hace una pequeña explicación sobre la fuente principal de los datos y un pequeño apunte metodológico en el inicio del estudio.

La tercera noticia englobada dentro del Datablog de The Guardian se encuentra dentro de una de las áreas con más repercusión dentro de la especialidad del periodismo de datos en este medio, la política. La pieza “Inmigration and health what UK voters are talking about, data shows” se caracteriza otra vez por disponer de un titular informativo, al igual que el resto de noticias analizadas anteriormente. En este proyecto se analiza cuáles son los temas que más preocupan a la sociedad ante la llegada de las elecciones presidenciales en el país en el año actual, 2015. Es necesario destacar que dentro del Datablog existe un apartado especial dedicado a temas relacionados con las elecciones, donde casi a diario se añaden nuevas investigaciones y curiosidades sobre el tema. En este caso, la información se presenta a través de diagramas de barras, donde se representan los temas más recurridos por los votantes y los partidos políticos sobre los que más se debate. Los datos han sido elaborados por una empresa privada especializada en este tipo de investigaciones sociales.

117

Ilustración 32. Porcentaje de temas discutidos sobre el asunto. Fuente: The Guardian.

Los gráficos están acompañados en este caso de una explicación metodológica que anuncia la manera en la que esta empresa privada ha obtenido los resultados mostrados. En esta ocasión, el texto que acompaña a los datos es un poco más extenso que en el resto de casos. Esta contextualización se basa principalmente en explicar los resultados obtenidos y destacar los más relevantes. Por último, con el objetivo de comparar en mayor medida los trabajos realizados por estos dos medios, se ha optado por escoger dos noticias sobre intención de voto juvenil en las próximas elecciones en el año 2015, tanto las que tendrán lugar en España como en Reino Unido y que han sido citadas en epígrafes anteriores. Para ello, las piezas escogidas se corresponden, en el caso 118

del diario español, con la titulada y basada en el homónimo trabajo de The Guardian “ Los de 18 a 25 años, ¿estáis ahí?” y en el caso británico y pionero en la elaboración de este tema “ Can young voters make a difference?”. En el Reino Unido, se realizó un análisis de la influencia que tiene el voto de los menores de 25 años y su factor decisivo en la elección de ciertos candidatos para el Parlamento inglés. Los datos utilizados por el periódico británico se encuentran en un gráfico animado que muestra la evolución por grupos de edad en las últimas dos décadas y los cambios en su elección de voto con el paso del tiempo. Con estos resultados, obtenidos gracias a estudios de la ONS, British Election Study e Ipsos Mori, compañía privada sobre investigación de mercados, se ha llegado a la conclusión de que en el caso de este país, a pesar de que los votos de los jóvenes no serán tan determinantes como en un principio se pudiera considerar, sí son importantes para decidir ciertas “plazas”, esto es 35 asientos o butacas en el parlamento se corresponden con el 20 % de los votos de personas con edades Ilustración 33. Intención de voto y evolución de la población. Fuente: The Guardian

comprendidas entre los 18 y los 24 años.

En cuanto a la contextualización esta es, quizá, una de las más extensas en cuanto a texto de todas las piezas que se han investigado, debido principalmente a que los gráficos provistos son 119

difíciles de comprender a primera vista y con menor carga visual que otros casos anteriores. Además este es un tema que requiere de conclusiones y ejemplos que demuestren lo que se está contando.

En el caso del medio de comunicación español El Mundo, el planteamiento de la noticia es diferente, comenzando por el titular. A pesar de que los dos titulan con una pregunta, en el caso anglosajón continúa siendo un titular informativo, puesto que plantea la cuestión inicial que abordará la noticia y centra la atención en los jóvenes votantes, pero en caso español, estamos ante un titular de tipo apelativo que trata de llamar la atención del lector y no provoca que se pueda prever el tema que va a ser abordado en las sucesivas líneas. En en caso de El Mundo, en vez de elaborar un gráfico de barras con la evolución del porcentaje de edad a lo largo de los años, han utilizado OpenStreetMap y CartoDB para elaborar un mapa de España dividido por municipios y el porcentaje correspondiente a la población de entre 18 y 25 años, tal y como se muestra a continuación.

120

Ilustración 34. Población entre 18 y 25 años. Fuente: El Mundo

Un punto en común entre los dos trabajos es el gráfico de barras en el que se detalla el partido político con mayor simpatía según qué rango de edad, aunque hay que apuntar que en El Mundo está un poco más detallado que en The Guardian, así como también es necesario indicar que la procedencia de los datos españoles está marcada por el INE86 y el CIS87.

86

http://www.ine.es/

87

http://www.cis.es/cis/opencms/ES/index.html

121

Una vez señalado esto, se puede afirmar que para El Mundo, el diario The Guardian supone un gran ejemplo dentro del campo del Periodismo de Datos y en este caso en concreto, teniendo en cuenta la similitud de resultados de los dos conjuntos de datos, el Ilustración 35. Intención de voto por grupos de edad. Fuente: El Mundo

medio

español

ha

sabido

aprovechar la idea, desarrollándola de manera un poco más gráfica que en el caso británico y con elementos visuales más cercanos a la audiencia, así como más comprensibles.

4.2.3 Conclusiones de la comparación de los dos medios de comunicación

Uno de los puntos más importantes extraídos del análisis de estos dos medios es, sobre todo, el amplio número de proyectos que realiza The Guardian en comparación con El Mundo. Este hecho está principalmente provocado por el hecho de que en el caso del diario español, la implantación de esta disciplina es prácticamente nueva, creada durante los últimos meses. Según Marta Ley, una de las profesionales que forman el equipo de datos del diario español, esta sección “nace como tal entre marzo y abril de 2015”, a pesar de que se hubieran publicado trabajos con estas características en meses anteriores, esta es la fecha de constitución oficial. Su reciente creación deja entrever el empeño y dedicación que se está realizando por parte del 122

medio nacional por elaborar buenos productos en este campo, inspirándose en el periódico inglés, que como ya se ha puntuado en más ocasiones a lo largo de este trabajo, ha sido y continúa siendo uno de los pioneros en esta disciplina. En relación a este diario, cabe destacar que en cuanto a los proyectos que se han estudiado, se percibe cómo la imagen y las visualizaciones tienen un peso mucho más importante que el texto, algo que no ocurre en El Mundo, en donde se ha visto en repetidas ocasiones que el texto y las contextualizaciones o explicaciones extensas de los temas ocupan una posición importante, quedando así los gráficos o representaciones de los datos relegados a un segundo plano, o como un mero apoyo a la parte textual y no como una pieza informativa con relevancia y peso por sí misma, como sí ocurre en The Guardian. Con todo, es necesario apuntar que en cualquier caso, el hecho de elaborar una representación con líneas o barras siempre dependerá de una explicación o anotación que ayude a contextualizar el tema, sea en un medio nacional o internacional. En relación con este hecho, hay que destacar que, en términos generales, el rango o variedad de tipos de gráficos en El Mundo es mucho más escasa que en el segundo periódico investigado, pues la gran mayoría de visualizaciones se representan a través de mapas de la península o gráficos de barras o líneas, como se ha comprobado. Otro punto importante y que guarda amplia relación con la corta vida de esta disciplina en el caso español, es el ámbito sobre el que se construyen los trabajos, esto es, de momento no se ha podido disfrutar de ningún proyecto de carácter internacional o con interés únicamente cultural, como sí pasa en medios que están mucho más avanzados en este ámbito, sino que se limitan a ocuparse de temas básicos, de importancia para la audiencia como puede ser la corrupción o los 123

incendios, pero sin arriesgarse a indagar y crear proyectos que puedan llegar a tener menos repercusión en la audiencia principal del medio, esto es, un lector español, de edad media y con interés por temas principalmente sociales, económicos y políticos.

Los dos casos analizados comparten puntos en común que deben de tenerse en cuenta a la hora de ver el Periodismo de Datos en la práctica actual. Uno de los recursos que se pueden encontrar en los dos medios de comunicación, y que refleja la característica social de esta disciplina, es la opción de poder descargar los brutos de los datos con los que se ha trabajado o los enlaces a los sitios web. En The Guardian a través de las indicaciones existentes en prácticamente todas las piezas con el hiperenlace resaltado con el título “Get the data embed” y en el caso español también disponibles en el mismo sentido con los enlaces indicados en los que se dice “Descargue aquí los datos”. En cualquiera de las dos versiones se observa cómo además de informar y mostrar los resultados obtenidos se ofrece al lector el bruto de la información para que pueda ser él mismo quien verifique los datos o quien elabore sus propias conclusiones a través de la misma fuente de la que lo hacen los propios periodistas, algo muy poco común hasta el momento. El segundo punto en común de estos dos medios es, además del uso generalizado de los titulares informativos tal y como se ha percibido en el análisis, es la confluencia dentro del texto de sub apartados titulados con cuestiones que más tarde los datos presentados tratarán de responder, por lo que se le da al trabajo realizado un carácter resolutivo.

124

4.2.4 Grado de seguimiento de los pasos de la Pirámide de Paul Bradshaw en los trabajos de los dos medios

Afirmar que dentro de un proceso de producción de la información se realizan siempre las mismas fases de trabajo es ciertamente complicado, primero por el hecho de que cada pieza tiene unas características intrínsecas que la hacen diferentes de las demás y segundo porque además del tipo de información y sus necesidades, las formas de trabajo de los distintos profesionales que engloban un equipo periodístico no siempre tienen por qué ser similares. A pesar de esto, es necesario tratar de descubrir si las fases de trabajo elaboradas por Paul Bradshaw para el periodismo de datos -referenciadas en anteriores puntos de este trabajo- se han cumplido en los dos medios de comunicación analizados o no. Dichas fases de trabajo, como son compilar, limpiar, contextualizar, combinar y comunicar, se pueden considerar como básicas y necesarias para elaborar los proyectos que se han presentado aquí. Esto es, en todas las informaciones analizadas, elaboradas de una forma u otra y con diferentes estilos estéticos, han tenido que pasar por un proceso de recopilación de datos, necesario para poder elaborar la pieza independientemente de su temática o fuente principal. La limpieza también se puede suponer como algo que se ha hecho también en los dos cibermedios, pues se ha comprobado como la mayoría de las piezas han extraído la información de bases de datos, muchas veces referenciadas en la propia noticia, lo que implica un proceso de limpieza y puesta a punto de esos datos para poder continuar con el proceso y elaborar una óptima información, como hemos visto que ha ocurrido. En este sentido, y teniendo en cuenta las declaraciones de Marta Ley, miembro del equipo de datos de El Mundo, confirma que la fase de limpieza se realiza siempre, ya que como apunta el período de tiempo que se tarda en elaborar un

125

tema “depende de muchos factores. No sólo del tema, sino de cómo se encuentren los datos disponibles, en qué formato y si están “limpios” o no lo están”. En cuanto a la tercera fase propuesta por Bradshaw, este paso se trata de algo más personalizable u optativo, es decir, se ha observado como en The Guardian la contextualización de los gráficos era mucho más escasa en el ejemplo español si nos referimos al texto que acompaña a la representación de los datos, pero por otro lado, el medio anglosajón suele elaborar un tipo de gráficos o infografías mucho más trabajadas que en El Mundo, lo que provoca que no sea estrictamente necesario acompañar a la pieza de un largo texto o explicación, pues son comprensibles por sí mismos. Así, puede decirse que, dentro de las diferentes posibilidades estilísticas que aporta la contextualización, los dos medios realizan esta fase en todos sus trabajos. En el proceso de combinación, el siguiente en las fases propuestas por Bradshaw, se ha apuntado en las líneas anteriores que se trata de mezclar los datos con los mapas, esto es, no mostrar una simple tabla con la información, sino hacerlos visualmente más atractivos, cercanos y comprensibles al lector. Si se toma como referencia el análisis elaborado en este proyecto, se puede observar como en todos los casos los datos aparecen combinados con mapas, tablas interactivas, gráficos de flujos y demás, por lo que afirmar que la el proceso de combinar los datos se cumple de nuevo también es posible. Por último, la fase de comunicación, en la que se engloba la visualización, narración o humanización entre otros guarda amplia relación con todos los procesos anteriores, es decir, la combinación de los datos se realiza para llegar a crear visualizaciones de calidad y cercanas que permitan una mayor comprensión de lo que se quiere contar. En todos los casos analizados se ha 126

visto como los trabajos no tenían un nivel de interpretación complicado, sino que más bien eran sencillos y elaborados de forma que el público no tenga prácticamente ni que leer los textos que acompañan a las piezas para discernir la información que se les presenta. Este proceso y su calidad dependerán siempre de las características del tema y del tipo de datos que se manejen, pero se puede corroborar de nuevo, como la fase de comunicación es algo que los dos medios tienen muy presente en sus proyectos, puesto que es lo que más influye en esta especialidad y lo que diferencia al periodismo de datos de otras disciplinas, su carácter distinto en la forma de comunicar la información que se podido ver como existe en las piezas seleccionadas.

5. Conclusiones finales

Existen ciertos puntos destacables que se han podido extraer de todo lo explicado a lo largo de estas líneas. Además de aquellas ideas a las que se podemos llegar después de esta lectura, hay además detalles que necesitan ser tenidos en consideración para poder tener una visión más global y completa de lo que supone el periodismo de datos para la profesión. La primera idea a la que es necesario hacer mención es el hecho de que una de las razones por las que se comienza a crear información a partir de los datos surge con la aparición o nacimiento del Big Data y el Open Data. Esta nueva especialidad del periodismo se puede decir que surge, o más bien, que evoluciona desde el periodismo de precisión, como una respuesta o solución a la gran cantidad de datos disponibles en la red y ante la necesidad de ser comunicados a la sociedad de una forma comprensible y fácil de asimilar. Se puede afirmar por lo tanto que el periodismo 127

de datos es una especie de “instrumento” o arma de comunicación ante un difícil panorama repleto de datos y sobreinformación que los periodistas han comenzado a utilizar en sus publicaciones y proyectos con el fin de poner un poco de orden en esta situación, muchas veces caótica e incomprensible. Este hecho ha provocado que se produzcan cambios importantes, aunque no todos los necesarios, dentro de la profesión periodística en áreas como la construcción de la información, la formación, perfil y manejo técnico de los profesionales de esta rama, la forma en que se informa a los lectores, y las rutinas de trabajo entre muchas otras alteraciones. En relación con este punto cabe destacar que con los nuevos hábitos que se han creado con esta modalidad es necesaria la implementación y concienciación sobre varios puntos dentro de esta actividad:

-

Crear más y mejores planes de estudio por parte de las universidades españolas basados en el periodismo de datos, con el fin de colaborar al desarrollo y cualificación de profesionales preparados para realizar este tipo de trabajos. A mayores, también es necesaria la colaboración entre centros educativos y medios de comunicación, para poder saber de las necesidades y requerimientos que acarrea el panorama laboral del momento. Aunque están surgiendo talleres y estudios de posgrado sobre esta materia, es una disciplina con un gran componente autodidacta, lo que dificulta su expansión.

-

Concienciación y adaptación por parte de las empresas informativas españolas en la idea de que el periodismo de datos puede ser una salida viable y óptima en la mejora de los modelos de negocio existentes en la actualidad, además de tomar parte del hecho de que 128

los trabajadores de las redacciones no sólo deben ser periodistas, sino que en ellas deben de confluir perfiles variados para poder aprovechar mejor todos los recursos. Hay que tener presente que los perfiles profesionales están destinados a cambiar y evolucionar, también en el periodismo, por lo que estas empresas deben abrir la mente hacia nuevas fronteras y posibilidades, en lo que se refiere a la parte de negocios como a la profesional.

-

La audiencia también debe ser consciente de los cambios que se producen en este campo y entender que las formas de comunicación se renuevan y lo que antes se podía contar con palabras, ahora se puede hacer con imágenes o gráficos. Por ello, también hay que tener muy presente que los plazos de producción y trabajo con datos son más lentos comparados con la redacción de un texto, pero su satisfacción y nivel cualitativa son mejores, por lo que la información que queremos tardará más en llegarnos pero es probable que sea mejor.

-

En cuanto a la disponibilidad de los datos, los gobiernos deben dar su brazo a torcer y proporcionar aquellos datos que los medios de comunicación y la sociedad en su conjunto reclaman y necesitan y además hacerlo de forma transparente y verdadera. En este sentido, tanto los medios como la clase política y sobre todo la sociedad, se verán beneficiados, los medios por tener información sobre la trabajar, los segundos por mejorar su reputación y colaborar con otros estamentos sociales, y los últimos porque ven sus necesidades informativas cubiertas en mayor medida, lo que generará mayor confianza en la política y los medios. Con todo, la democratización del poder es distinta a la democratización de la información. Saber que algo está mal o que hay una manera 129

mejor de hacerlo no es lo mismo que estar en posición de hacer las cosas o afectar a su cambio. Información abierta no es sinónimo de un gobierno abierto, participativo y de calidad.

Por otra parte, y considerando que la parte más importante o con más peso dentro de esta nueva especialidad periodística son los datos, es preciso tener en mente una serie de consideraciones sobre los ellos, que pueden ser útiles tanto al trabajar con ellos, como al leer o ver información elaborada mediante este procedimiento. En primer lugar, los datos no son una fuerza, no crean valor por sí mismos, lo que aporta interés y utilidad se encuentra en la explotación de sus potenciales y el uso que hagan los periodistas. El valor de estas cosas es resultado de la inteligencia, competición y el esfuerzo, no algo que aparezca de forma automática por el mero hecho de la existencia de los datos en la web en un formato que permita su reutilización. En segundo lugar, los datos no son el mejor reflejo del mundo. Las bases de datos públicas no nos dan las la información perfecta sino que son representaciones generadas, seleccionadas, arregladas, filtradas, coladas, analizadas y corregidas para casos concretos y tan diversos como sectores públicos existen. Los datos son a menudo incompletos, imperfectos, inapropiados o inexactos, y fuera de fecha o desactualizados. A pesar de estas parcialidades generadas por los cuerpos públicos, estos datos pueden ser la mejor fuente de información que se pueda tener sobre un tópico y que puede ser aumentada con datos de otras fuentes, documentos y conocimiento externo. Estas bases pueden suponer un punto de partida para una investigación. En ocasiones,

130

los datos públicos son como los textos oficiales, se necesita aprender cómo leerlos para comprender algo, interpretarlos críticamente, leer entre líneas, para notar que se ha omitido.

En este sentido no hay nada más fácil para ser un buen periodista de datos que ser un buen periodista, un buen analista, y un buen intérprete. Crear una pieza de calidad a través del periodismo de datos o una buena aplicación de datos es a veces como un arte más que como una ciencia. Al igual que la fotografía, incluye procesos de selección, filtros, enmarcado, composición y por supuesto, énfasis. El periodismo tiene por tanto ante sí un gran reto a la par que una gran oportunidad en todos los sentidos de la palabra. Como se ha podido comprobar su intrusión en el panorama español es muy tímida y apenas notable en comparación con otros países europeos, pero todo apunta a que con el paso del tiempo se acabará por instaurar de manera total, esto es, en la gran mayoría de medios de comunicación con versión digital y de forma similar al modelo de otros países europeos, augurando así, un futuro prometedor y afianzado dentro de la profesión.

131

Bibliografía Meyer, P. (1993) Periodismo de precisión: nuevas fronteras para la investigación periodística. Barcelona. Editorial Bosch. Dader, J.L. (1997). Periodismo de precisión: la vía socioinformática de descubrir noticias. Madrid. Editorial Síntesis. Galindo Arranz, F. (2004). Ámbitos del periodismo de precisión. Santiago de Compostela. Tórculo, D.L. Fernández del Moral, J. (2004). Periodismo especializado. Editorial Ariel. Madrid Rogers, S. (2013). Facts are Sacred: The power of data. Londres. Editorial Faber & Faber. Picard, R.G (2012). La creación de valor y el futuro de las empresas informativas. Por qué el periodismo debe cambiar para seguir siendo relevante en el siglo XXI. Editorial Media XXI. Oporto, Portugal. European Journalism Center y Open Knowledge Foundation. (Ed.) (2012). Data Journalism Handbook. O’Reilly Media. Londres, Reino Unido. Gértrudix,M. y Álvarez, S. (2010). Diálogos y desafíos euro-latinoamericanos: ensayos sobre cooperación derecho, educación y comunicación. Ediciones Uninorte. Plantin JC., Lagoze C., Edwards P., Sandvig C. (2013). Big Data is not About Size: When Data Tranform Scholarship. Collection PraTICs, Éditions de la Maison des Sciences de l’Homme. Paris, Francia. Cruccianelli.S. (2013). Periodismo de Base de Datos. Buenos Aires. International Center of Journalism. Crucianelli, S. (2010). Herramientas digitales para periodistas. Knight Center for Journalism in the Americas. Crucianelli, S. (2013). ¿Qué es el periodismo de datos? Asociación de la Prensa de Madrid. Cuadernos de Periodistas nº26. Disponible en: http://www.apmadrid.es/images/stories/106124%281%29.pdf [Recuperado el 10 de abril de 2015] Zanchelli, M. y Crucianelli,S (2012). Integrando el Periodismo de Datos en las salas de redacción. Knight International Journalism Fellowships.

132

Cuadernos de Comunicación Evoca. (2012). El futuro del periodismo. Evoca, Comunicación e Imagen nº7. Disponible en: http://neolabs.es/evoca/down/cuadernos7.pdf [Recuperado el 27 de marzo de 2015] Lewis, S. (2014) Journalism in an Era of Big Data: Cases, Concepts, and Critiques. Digital Journalism, Volume 3, Issue 3. Disponible en: http://www.tandfonline.com/doi/pdf/10.1080/21670811.2014.976399 [Recuperado el 6 de mayo de 2015] Chaparro, M.A. (2013). La evolución del periodismo de precisión: el blog de The Guardian sobre periodismo de datos. Universidad Internacional de La Rioja (Ed.). Actas del I Congreso de Comunicación y Sociedad, La Rioja, España. Disponible en: http://reunir.unir.net/handle/123456789/1736 [Recuperado el 13 de marzo de 2015] Flores Vivar, J. M. (2009). Nuevos modelos de comunicación, perfiles y tendencias en las redes sociales. Revista Comunicar (33). Disponible en: http://www.revistacomunicar.com/index.php?contenido=detalles&numero=33&articulo=332009-09&mostrar=comocitar#comocitar [Recuperado el 2 de abril de 2015] Flores Vivar, J. y Salinas Aguilar, C. (2012). Sinergias en la construcción del Nuevo Periodismo derivadas del Data Journalism y el Transmedia Journalism. Actas del III Congreso Internacional Comunicación 3.0. Salamanca. Disponible en: http://www.2ip.es/wpcontent/uploads/2013/01/sinergias_construccion_nuevoperiodismo.pdf [Recuperado el 4 de abril de 2015] Flores Vivar, J. y Salinas Aguilar, C (2013). El periodismo de datos como especialización de las organizaciones de noticias en Internet. Revista Correspondencias y Análisis, (3). Disponible en: http://dialnet.unirioja.es/servlet/articulo?codigo=4739290 [Recuperado el 14 de marzo de 2015] Flores Vivar, J. (2012). Ecosistema del Periodismo de datos. Revista Comunicação e

Sociedade, 34 (1), 7-35. Flores Vivar, J Cebrián Herreros (2012). El data journalism en la construcción de mashups para

medios digitales. En El periodismo digital analizado desde la investigación procedente del ámbito académico. Asociación de la Prensa de Aragón. Disponible en: http://dialnet.unirioja.es/servlet/articulo?codigo=3903640 [Recuperado el 28 de abril de 2015] España. Gobierno de España. (2013). Ley 19/2013, de 9 de diciembre, Ley de Transparencia, Acceso a la Información Pública y Buen Gobierno. Madrid. BOE Nuñez Ladevéze, L. (1995): Introducción al periodismo escrito. Ariel, Barcelona. Lankow, J.; Ritchie, J.;Crooks, R. (2013) Infografías. El poder del storytelling visual. Editorial Planeta, Madrid. 133

Armentia, J.I.; Elexgaray, J.; Pérez, J.C. (2000) Diseño y periodismo electrónico. Servicio editorial de la Universidad del País Vasco. Bilbao. Moere, A. V., y Purchase, H. (2011). On the role of design in information visualization. Information Visualization, 10 (4). Disponible en: http://infoscape.org/publications/ivs12.pdf [Recuperado el 16 de marzo de 2015] Mariño, Á. (2012) La relación del Periodismo de Datos con Big Data y Open Data, Trabajo de Fin de Master en Investigación y Documentación, Facultad de Humanidades, Comunicación y Documentación, Universidad Carlos III. Disponible en: http://es.scribd.com/doc/111830154/Larelacion-del-Periodismo-de-Datos-con-Big-Data-y-Open-Data [Recuperado el 10 de marzo de 2015] Bueno Plaza, A. (2014). Periodismo de datos. Antecedentes, ámbitos de desarrollo y aplicación en medios generalistas: el caso de El Confidencial y El Periódico. Trabajo de fin de Grado en Periodismo, Facultad de Filosofía y Letras, Universidad de Valladolid. Disponible en: https://uvadoc.uva.es/bitstream/10324/5752/1/TFG_F_2014_8.pdf [Recuperado el 25 de febrero de 2015] Ferreras Rodríguez, E.M. (2013): Aproximación teórica al perfil profesional del ‘Periodista de datos. Revista Icono 14 de Comunicación y Tecnologías Emergentes, volumen 11. Disponible en: http://www.icono14.net/ojs/index.php/icono14/article/view/573 [Recuperado el 2 de marzo de 2015] Ferreras Rodríguez, E.M (2012). Nuevos perfiles profesionales: el periodista de datos. Actas del IV Congreso Internacional Latina de Comunicación Social. Universidad de la Laguna. Disponible en: http://www.revistalatinacs.org/12SLCS/2012_actas/062_Ferreras.pdf [Recuperado el 12 de marzo de 2015] Casal Cortizas, F.M (2010). El Periodismo de Investigación Asistido por Ordenador y de Precisión aplicado a la prensa local y regional: el contraste entre Estados Unidos y un modelo de futuro para Galicia. Tesis doctoral. Universidad Complutense de Madrid. Disponible en: http://eprints.ucm.es/10792/1/T28305.pdf [Recuperado el 21 de marzo de 2015]

Rodriguez Brito, A; Chico, L. G. (2013). Cartografiando el periodismo de datos. Big Data y periodismo en el continente americano. Cinco casos de estudio. Revista Telos (Fundación Telefónica): Cuadernos de comunicación e innovación, (95). Disponible en: http://telos.fundaciontelefonica.com/url-direct/pdfgenerator?tipoContenido=articuloTelos&idContenido=2013062110110002&idioma=es [Recuperado el 4 de abril de 2015]

134

Del Campo, E. (2014). Visualización e interactividad en el periodismo de datos y el empoderamiento de la audiencia. Ubierna, F., Sierra J. (coords): Miscelánea sobre el entorno audiovisual en 2014. Editorial Fragua. Madrid Domínguez, M. Á. (2014). Nuevas formas informativas: el periodismo de datos y su enseñanza en el contexto universitario. Historia y Comunicación Social, 19, 43-54. Tapia, A. (2013). Big Data y Periodismo de Datos. Revista Unir Universidad Internacional de la Rioja. Disponible en: http://revista.unir.net/especiales/periodismo-datos-big-data/ [Recuperado el 23 de abril de 2015] Cairo, A. (2011). El arte funcional. Infografía y visualización de la información. Editorial Alamut. España Holovaty, A. (2006) A fundamental way newspaper sites need to change. Disponible en: http://www.holovaty.com/writing/fundamental-change/ [Recuperado el 3 de marzo de 2015] Salaverría, R. (2013). ¿Quién dijo que la información con números no interesa? Disponible en: http://www.salaverria.es/blog/2013/12/23/quien-dijo-que-la-informacion-con-numeros-nointeresa/ [Recuperado el 3 de marzo de 2015] Peiró, K. (2013). Cuando los datos explican historias. Disponible en: http://blogs.cccb.org/lab/es/article_quan-les-dades-expliquen-histories/ [Recuperado el 5 de marzo de 2015] Rexach, E. (2013). El futuro son los datos. Disponible en: http://blogs.cccb.org/lab/es/article_elfutur-son-les-dades/ [Recuperado el 5 de marzo de 2015] Knight Journalism Fellowships (2009-2010). Journalism in the age of data [video].Disponible en: http://datajournalism.stanford.edu/ Fernández, M. (2012). Tres herramientas para incursionar en el periodismo de datos. Disponible en: https://ijnet.org/es/blog/tres-herramientas-para-incursionar-en-el-periodismo-dedatos [Recuperado el 7 de marzo de 2015] Fundación Ciudadana Civio (2014). España en Llamas. Disponible en: http://www.espanaenllamas.es/ [Recuperado el 23 de marzo de 2015] NiemanLab (2014). Predictions for Journalism 2015: A NiemanLab series. Disponible en: http://www.niemanlab.org/collection/predictions-2015/ [Recuperado el 4 de abril de 2015] Centre de Cultura Contemporánea de Barcelona (2013). Entrevista a Mar Cabra [vídeo] Disponible en: http://www.cccb.org/es/video-entrevista_mar_cabra_vo_es-44005 [Recuperado el 10 de abril de 2015] 135

Valdés,S. (2013). La Aventura del Saber. Entrevista a Mar Cabra [vídeo]. Disponible en: http://www.rtve.es/alacarta/videos/la-aventura-del-saber/aventura-del-saber-entrevista-marcabra/2019928.shtml [Recuperado el 17 de abril de 2015] Crucianelli, S. (2012). Periodimo de datos: lo bueno, lo malo y lo feo. Disponible en: https://ijnet.org/es/stories/periodismo-de-datos-lo-bueno-lo-malo-y-lo-feo [Recuperado el 17 de abril de 2015] Fole, X. (2012). Los hechos son sagrados. El factchecker y la importancia del periodismo. Disponible en: http://www.fronterad.com/?q=hechos-son-sagrados-fact-checker-y-importanciaperiodismo [Recuperado el 3 de mayo de 2015] EMC y IDC (2014). The Digital Universe of oportunities. Disponible en: http://spain.emc.com/collateral/analyst-reports/idc-digital-universe-2014.pdf [Recuperado el 10 de mayo de 2015]

136

6.Anexos Apéndice hemerográfico

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº 2 Which flight will get you there fastest?

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL

Ilustración nº3 ¿De qué habla el gobierno?

Autor/autores Idioma principal Medio

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

En constante actualización. http://fivethirtyeight.com/interactives/flights/ Nate Silver y Ritchie King Inglés Fivethirtyeight.com

03/04/2014 http://www.eldiario.es/politica/palabrasgobierno_0_243576536.html Data n’ Press (empresa) Español Eldiario.es

Ilustración nº4 ¿Qué hacen los diputados?

En constante actualización http://quehacenlosdiputados.net/diputado/angeles-alvarez-alvarez No se especifica Español Quehacenlosdiputados.net

137

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº5 Quién manda en la televisión pública

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº6 Public Dataset Catalog Faceted Browser

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL

Ilustración nº7 Pirámide invertida del periodismo de datos elaborada por Paul Bradshaw

Autor/autores Idioma principal Medio Trabajo Nombre del proyecto/ Título original Fecha Dirección URL

Autor/autores Idioma principal Medio

No se especifica http://quienmanda.es/topics/tv No se especifica Español Quienmanda.es

En constante actualización http://datos.fundacionctic.org/sandbox/catalog/faceted/ No se especifica Inglés Fundación Tic

No se especifica http://onlinejournalismblog.com/2011/07/08/the-inverted-pyramidof-data-journalism-in-spanish/ Paul Bradshaw Español Onlinejournalismblog.com Ilustración nº8 6 ways of communicating data journalism

No se especifica http://onlinejournalismblog.com/2011/07/13/the-inverted-pyramidof-data-journalism-part-2-6-ways-of-communicating-datajournalism/ Paul Bradshaw Inglés Onlinejournalismblog.com 138

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº9 Mapa conceptual para el desarrollo del periodismo de datos

Noviembre de 2013 http://www.correspondenciasyanalisis.com/es/pdf/cnt/1_periodismo _datos.pdf Jesús Flores Vivar y Cecilia Salinas Español Revista de comunicación Correspondencias y análisis

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº10 Behind the scenes at Guardian Datablog

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº 11 The Obameter: Tracking Obamas’s campaign promises

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº12 Counting the human cost of war

2012 http://datajournalismhandbook.org/1.0/en/in_the_newsroom_3.html Simon Rogers Inglés The Guardian

En constante actualización http://www.politifact.com/truth-o-meter/promises/obameter/ No especificado Inglés Tampa Bay Times

2012 http://datajournalismhandbook.org/1.0/en/delivering_data_4.html No especificado Inglés BBC 139

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº13 The jobless rate for people like you

6 de noviembre de 2009 http://www.nytimes.com/interactive/2009/11/06/business/economy/ unemployment-lines.html Shan Carter, Amanda Cox, Kevin Quealy Inglés The New York Times Ilustración nº 20 Mapa de la corrupción en España

En constante actualización http://www.elmundo.es/grafico/espana/2014/11/03/5453d2e6268e3 e8d7f8b456c.html Olalla Novoa, Verónica Ramírez, Marta Ley, Luis Sevillano, y Manuel González Español El Mundo Ilustracíón nº21 Opacidad y recortes en el gasto contra incendios forestales: Relación entre euro gastado por hectárea forestal 29 de septiembre de 2014 http://www.elmundo.es/grafico/espana/2014/09/29/54243170ca474 1ea278b457c.html Marcos García Rey, Verónica Ramírez y Daniel Jarreta Español El Mundo

140

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº22 Opacidad y recortes en el gasto contra incendios forestales: Gasto público en la lucha contra incendios forestales (2001-2014) 29 de septiembre de 2014 http://www.elmundo.es/grafico/espana/2014/09/29/54243170ca474 1ea278b457c.html Marcos García Rey, Verónica Ramírez y Daniel Jarreta Español El Mundo

Ilustración nº23 Turismo de borrachera, una arma de doble filo: evolución del turismo según tipo de alojamiento 7 de septiembre de 2009 http://www.elmundo.es/grafico/economia/2014/09/07/5409dadc226 01d191a8b458e.html Verónica Ramírez y Marta Ley Español El Mundo

Ilustración nº24 Turismo de borrachera, un arma de doble filo: evolución del turismo en el sector hotelero 7 de septiembre de 2009 http://www.elmundo.es/grafico/economia/2014/09/07/5409dadc226 01d191a8b458e.htm Verónica Ramírez y Marta Ley Español El Mundo

141

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº 25 ¿Cuánto le cuesta el consejo consultivo de su Comunidad Autónoma?: Evolución de los presupuestos 9 de diciembre de 2014 http://www.elmundo.es/grafico/espana/2014/12/09/54774cf1268e3e 7b2f8b456d.html Verónica Ramírez y Marta Ley Español El Mundo

Ilustración nº26 ¿Cuánto le cuesta el consejo consultivo de su Comunidad Autónoma?: actividades desarrolladas por los consejeros 9 de diciembre de 2014 http://www.elmundo.es/grafico/espana/2014/12/09/54774cf1268e3e 7b2f8b456d.html Verónica Ramírez y Marta Ley Español El Mundo Ilustración nº 27 London second languages mapped by tube stop

30 de octubre del 2014 http://www.theguardian.com/news/datablog/2014/oct/30/-splondons-tube-languages-visualised Oliver O’ Brien Inglés The Guardian

142

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº28 London second languages mapped by tube stop

30 de octubre del 2014 http://www.theguardian.com/news/datablog/2014/oct/30/-splondons-tube-languages-visualised Oliver O’ Brien Inglés The Guardian

Ilustración nº29 More than 200 journalists in prison worldwide for third consecutive year 17 de diciembre de 2014 http://www.theguardian.com/news/datablog/2014/dec/17/over-200journalists-in-prison-worldwide-for-third-consecutive-year George Arnett Inglés The Guardian Ilustración nº30 More than 200 journalists in prison worldwide for third consecutive year

17 de diciembre de 2014 http://www.theguardian.com/news/datablog/2014/dec/17/over-200journalists-in-prison-worldwide-for-third-consecutive-year George Arnett Inglés The Guardian

143

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL

Autor/autores Idioma principal Medio

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº31 This is where Australia imported food comes from

23 de febrero de 2015 http://www.theguardian.com/global/datablog/nginteractive/2015/feb/23/this-is-where-australias-imported-food-comesfrom Nick Evershed Inglés The Guardian

Ilustración nº32 Inmigration and health, what UK voters are talking about, data shows

9 de marzo de 2015 http://www.theguardian.com/news/datablog/2015/mar/09/immigrationhealth-uk-voters-talking-about-data-shows George Arnett Inglés The Guardian

Ilustración nº33 UK election 2015: Can young voters make a difference?

24 de febrero de 2015 http://www.theguardian.com/politics/datablog/2015/feb/24/uk-election2015-can-young-voters-make-a-difference George Arnett y Pablo Gutierrez Inglés The Guardian

Ilustración nº34 Elecciones: Los de 18 a 25 años, ¿estáis ahí?: población de 18 a 25 años por municipios 5 de marzo de 2015 http://www.elmundo.es/blogs/elmundo/masdatos/2015/03/05/elecciones-los-de-18-a-25-anos-estais.html Marta Ley Español El Mundo 144

Trabajo Nombre del proyecto/ Título original Fecha Dirección URL Autor/autores Idioma principal Medio

Ilustración nº 35 Elecciones: Los de 18 a 25 años, ¿estáis ahí?: intención de voto por grupos de edad 5 de marzo de 2015 http://www.elmundo.es/blogs/elmundo/mas-datos/2015/03/05/eleccioneslos-de-18-a-25-anos-estais.html Marta Ley Español El Mundo

Herramientas imprescindibles en el periodismo de datos Para extracción y recolección de los datos o repositorios de datos Free OCR (http://www.free-ocr.com/) OutWitHub (https://www.outwit.com/products/hub/) Complete Planet (http://aip.completeplanet.com/) Swoogle (http://swoogle.umbc.edu/) Logikcull (http://logikcull.com/) Citizen Desk (https://www.sourcefabric.org/en/citizendesk/) LocalData (http://localdata.com/) Kimono (https://www.kimonolabs.com/) Tabula (http://tabula.technology/)

ScraperWiki (https://scraperwiki.com/) Infomine (http://library.ucr.edu/view/infomine) Wolfram Alpha (https://www.wolframalpha.com/) Cluuz (http://www.cluuz.com/) Storify (https://storify.com/) Twitter Counter (http://twittercounter.com/) Google Public Data (http://www.google.com/publicdata/directory) Import.io (https://import.io/) Phyton (https://www.python.org/)

Limpieza y análisis de datos

Data Wrangler Google Refine Statwing

http://vis.stanford.edu/wrangler/ http://openrefine.org/ https://www.statwing.com/ 145

Visualización

Tableau Public (https://public.tableau.com/s/) CartoDB (https://cartodb.com/) Vizzuality (http://www.vizzuality.com/) Picktochart (http://piktochart.com/)

Visualize.me (http://vizualize.me/) Infomine (http://www.infomine.com/) Gephi (http://gephi.github.io/) Many Eyes (http://www01.ibm.com/software/analytics/many-eyes/) Google Fusion Tables Node XL (http://nodexl.codeplex.com/) (https://sites.google.com/site/fusiontablestalks/st ories) Datawrapper (https://datawrapper.de/) Data- driven documents (http://d3js.org/) QGis (http://www.qgis.org/es/site/) Axiis (http://www.axiis.org/) ArcView TimelineJS (http://timeline.knightlab.com/) (http://www.esri.com/software/arcgis/arcgis-for desktop) StoryMapJS (http://storymap.knightlab.com/) DevInfo (http://www.devinfo.org/libraries/aspx/Home. aspx) Highcharts (http://www.highcharts.com/) Verificación Checkdesk Emergent Info Four and Six Churnalism Full Fact Finder Lazy Truth Very.ly

http://meedan.com/checkdesk/ http://www.emergent.info/ http://www.fourandsix.com/fourmatch/ http://churnalism.com/ http://fullfact.org/ http://www.lazytruth.com/ https://veri.ly/

146

Cuestionario realizado al equipo de datos del diario El Mundo Esta entrevista se realizó mediante correo electrónico el día 20 de mayo de 2015 después de haber contactado con una de las integrantes del equipo de periodismo de datos de este medio de comunicación, Marta Ley, quién respondió a dicho cuestionario y se encargó de difundirlo entre el resto de los profesionales que forman este equipo con vistas a que pudieran añadir o aportar nueva información.

¿Cómo y cuándo nace o se toma la decisión de incluir el Periodismo de Datos en el diario El Mundo?

Desconozco cuáles han sido exactamente los motivos que han llevado a tomar la decisión de crear la unidad de datos, pero puedo contarte cómo se fue sembrando la semilla.Ha sido un proceso lento. Como sabrás, desde el curso 2012/2013 existe un Máster de Periodismo de Investigación, Datos y Visualización de El Mundo y Unidad Editorial. En la segunda edición dos de las alumnas, Verónica Ramírez y yo, Marta Ley somos incorporadas a la redacción como becarias para centrarnos exclusivamente en temas de datos. Sin embargo seguía sin existir una sección como tal. Al llegar el 31 de diciembre y terminado el periodo de prácticas no tuvo lugar una contratación, aunque sí quedó una puerta abierta a una futura sección de datos.Finalmente se crea la sección entre marzo y abril de 2015.

¿Cuántos/as profesionales forman el equipo que desarrolla estos proyectos? ¿Pensáis que este grupo puede aumentar en los próximos años?

147

En este aspecto no podemos concretar mucho ahora mismo, ya que la sección prácticamente acaba de nacer. Actualmente somos tres redactores y un redactor jefe. Sí pensamos, no obstante, que el equipo puede aumentar. Cuándo, todavía no lo sabemos.

¿Cuál es vuestra formación? ¿Qué creéis que se necesita para poder formar parte de un grupo que se encargue de esta disciplina?

Somos un grupo con formación variada, aunque la mayoría estamos formados en comunicación o periodismo. El grupo está formado por los siguientes:

-

Paula Guisado: licenciada en periodismo, comunicación audiovisual y publicidad y relaciones públicas, Máster en periodismo de investigación, datos y visualización (primera promoción)

-

Marta Ley: graduada en periodismo y comunicación audiovisual, Máster en periodismo de investigación, datos y visualización (segunda promoción)

-

Hugo Garrido: Ingeniero Técnico en Informática de Sistemas y cursando último curso de grado en periodismo.

-

Guillermo Sánchez-Herrero Clemente: Redactor jefe

Creemos que lo ideal es que el grupo esté formado por distintos perfiles, entre los que haya periodistas especializados en datos, diseñadores/programadores e informáticos para dar mayor dinamismo y mejores aportaciones a la sección.

148

El Periodismo de Datos es una disciplina muy reciente pero aun así con una repercusión muy baja en España en comparación con otros países como Reino Unido o Estados Unidos, ¿cuál creéis que puede ser la causa de esto? ¿En general las empresas informativas tienen interés en invertir en esta modalidad?

Cada vez más medios están apostando por esta disciplina. Recientemente se han visto buenos ejemplos de periodismo de datos en El Mundo (Casi 1500 municipios gobernados desde 1987 por un mismo partido) o en El Español, cuyo proyecto España en Cifras promete albergar multitud de historias. También El Confidencial lleva apostando dos años por esta disciplina, con Daniele Grasso y Jesús Escudero, ambos alumnos del Máster de Investigación, Datos y Visualización, a la cabeza de la unidad de datos. También en La Sexta se ha creado recientemente una unidad de periodismo de datos formada asimismo por dos alumnos del repetido Máster: Verónica Ramirez e Ignacio Calle. En la Fundación Ciudadana Civio también se hace periodismo de datos.

El día 21 de mayo tuvo lugar la primera ocasión en España en la que un medio generalista tenía en portada un tema de periodismo de datos: ‘Cuando ganar no es gobernar’, que en la edición de papel tenía por título ‘Las listas más votadas no han gobernado en 458 municipios’. Creo que existe cierta retroalimentación. Cuantos más medios se sumen, más se moverá el ‘mercado’, mejores temas se harán. La mayor competencia está trayendo asimismo cada vez más calidad. No sé si puede decirse que en general las empresas informativas tienen interés en invertir, pero sí puede afirmarse que cada vez se está invirtiendo más.

149

¿Qué pensáis que puede aportar el Periodismo de Datos a la situación actual de la profesión en España? ¿Consideráis que el lector tiene interés en este tipo de piezas?

El Periodismo de Datos puede favorecer que se abra la puerta para muchos periodistas preparados para trabajar con datos. No sólo periodistas, sino también programadores, diseñadores, informáticos o estadísticos, por ejemplo, que trabajen en equipo para dar otra dimensión a las historias. Puede aportar un valor añadido, dar lugar a nuevos enfoques y conclusiones a las que no sería viable llegar sin herramientas de análisis de datos.

¿Cuál es el período mínimo que tardáis en desarrollar un proyecto?

Esto depende de muchos factores. No sólo del tema, sino de cómo se encuentren los datos disponibles, en qué formato y si están “limpios” o no lo están. Una pieza sencilla creada a partir de una base de datos puede elaborarse incluso en un día, como es el caso de este ejemplo. En esa ocasión, los datos se encontraban en formato reutilizable y con la consistencia suficiente para poder elaborar la pieza.

No obstante, esto no suele ser así. Lo normal es no tardar menos de una semana en hacer un tema. Y esto si es un tema relativamente sencillo. Pero también, una vez que se ha trabajado una base de datos, lo cual puede llevar varias semanas, pueden salir diferentes temas a partir de la misma. Si el proyecto requiere además investigación, entonces hablaríamos de un mes como mínimo. Pero como te decía, es demasiado relativo.

150

En cuanto a vuestro espacio de trabajo, ¿está incluido dentro de la redacción, es decir, trabajáis conjuntamente con el resto de periodistas del medio o por separado?

Sí. Trabajamos dentro de la redacción. No olvidamos que, aunque tengamos una formación especializada en datos, somos periodistas. Además de tener agenda propia trabajamos en todo momento con el resto de las secciones, lo cual favorece no dejar nunca de lado el periodismo, las historias, las personas.

¿Qué medios tomáis como referencia en vuestro trabajo y por qué?

Estamos siempre atentos a lo que se hace en medios, tanto nacionales como internacionales, en materia de periodismo de datos. Tanto buenos como malos ejemplos. Seguimos de cerca al Data Blog del Guardian, La Nación de Argentina, La Nación de Costa Rica, New York Times, Civio, Pro Publica, El Confidencial…

¿Cuáles son las herramientas que más utilizáis?

La herramienta estrella es Excel. En cuanto a otras herramientas, estamos también pendientes de nuevos avances que faciliten y mejoren el periodismo y la visualización de datos, pero las que más utilizamos son según las fases de trabajo las siguientes:

-

Extracción, tratamiento y limpieza de datos: Excel, Google Refine, SQL, Tabula, Python, Kimono

151

-

Visualización de datos: Ilustrator, Photoshop, CartoDB yTableau. En algunas ocasiones hemos empleado también: DataWrapper, Google Fusion Tables, Google Charts, TimelineJS, StoryMapJS, Highcharts, Raw, DevInfo

152

153

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.