Big Data: la información del otro lado del espejo

Share Embed


Descripción

Teoría de la Información - Maestría en Información y Comunicación 2ª Cohorte - Universidad de la República - 2014

BIG DATA: Del otro lado del espejo En aquel Imperio, el Arte de la Cartografía logró tal Perfección que el Mapa de una sola Provincia ocupaba toda una Ciudad, y el Mapa del Imperio, toda una Provincia. Con el tiempo, estos Mapas Desmesurados no satisficieron y los Colegios de Cartógrafos levantaron un Mapa del Imperio, que tenía el Tamaño del Imperio y coincidía puntualmente con él. Menos Adictas al Estudio de la Cartografía, las Generaciones Siguientes entendieron que ese dilatado Mapa era Inútil y no sin Impiedad lo entregaron a las Inclemencias del Sol y los Inviernos. En los Desiertos del Oeste perduran despedazadas Ruinas del Mapa, habitadas por Animales y por Mendigos; en todo el País no hay otra reliquia de las Disciplinas Geográficas. Suárez Miranda: Viajes de varones prudentes, libro cuarto, cap. xlv, Lérida, 1658.

Jorge Luis Borges,Del rigor en la ciencia, Historia universal de la infamia

Juan S. Platero CI 4102091-8

Introducción: La sociedad actual ha visto visto crecer exponencialmente la importancia de la información en un conjunto cada vez más amplio de actividades y un gran número de teóricos sociales no han dudado en colocarla como la piedra angular de una nueva fase del sistema capitalista, llegando a sustituir el concepto de capital por el de información, como clave de análisis para entender los fenómenos o procesos incontestables de globalización y digitalización de las sociedades y sus economías. Si bien la explosión de la burbuja de la “nueva economía” asociada a los nuevos negocios de internet en el 2001 puso en duda algunos aspectos de este proceso, el posterior crack del sistema financiero en el 2008 reveló hasta que punto la digitalización e inmaterialización de los procesos financieros se basaban ya en información pura, sin sustento material. Paralelamente a estos dos acontecimientos que revelan los límites éticos y prácticos de estos fenómenos, el crecimiento imparable de la movilidad y los nuevos mecanismos de transacciones digitales para el público masivo, no sólo se convertían empíricamente en los nichos de mercado con mayores crecimientos a nivel mundial, sino que comenzaban a generar una cantidad de información de proporciones gigantescas sobre los hábitos y patrones de consumo pero también dentro de las propias corporaciones que buscaban capitalizar sus bases de datos cada vez más “completas”. A su vez la investigación científica, con el proyecto Genoma Humano a la cabeza (o la observación astronómica por citar algunos ejemplos), generaba ingentes cantidades de información de la cual solo un pequeño porcentaje es procesable. Los avances en materia de micro-informática han permitido y son también el límite para la captura y almacenamiento de toda esta información. En los últimos años las empresas como IBM, Oracle, Microsoft y SAP se han lanzado de lleno al mercado, comprando distintos softwares y desarrollándolos para poder analizar y visualizar significativamente toda esta información. A esta disciplina de reciente desarrollo se la conoce como Big Data, o datos a gran escala. Hoy día esta disciplina es ya un negocio estimado en 100.000 millones de dólares y crece a una tasa de 10% anual, más del doble que la industria del software en su conjunto. Las aplicaciones beneficiosas de esta ingeniería en el campo de la salud, los negocios, el gobierno y la ciencia son indudables, sin embargo también acarrean el peligro de la seguridad de los datos y la privacidad de la información personal. El presente trabajo sigue la hipótesis de que el Big Data muestra a las claras por primera vez que debemos entender por información en las sociedades contemporáneas

digitalizadas, llevando al mundo de los hechos sociales el paradigma matemático de la información. No se trata ya del comunicar algo, de ofrecer sentido a sino de dar forma -algorítmica- a la masa de datos comunicados por infinidad de usuarios, sensores, máquinas, empresas y gobiernos. No es un mapa borgiano que coincide con la geografía, son algoritmos que seleccionan datos y permiten ver lo que estratégicamente interesa dar a luz como información. Es el proyecto político de la Sociedad de la Información -globalmostrando por primera vez su verdadera piel. Estamos ya del otro del otro lado del espejo. ¿Qué es la información? La primera necesidad para este análisis es entender el concepto-palabra mismo de información y sus derivas históricas, rastreando sus usos y orígenes. Siguiendo a Capurro (2008: 5) en clave hermenéutica, es necesario ver estos cambios semánticos y las fuerzas discursivas que explican este devenir, para poder entender (nos) incorporando una perspectiva histórica del uso presente del término y abrirnos a su -nuestro- futuro. De esta manera podemos entender como llegamos a las conceptualizaciones de macrodatos o big data, y que relación guarda esta noción con la de información de uso corriente en nuestros dias. Las raíces etimológicas del concepto de información pueden situarse en el eidos platónico-socrático y el morphé aristotélico, que combinaban (en una simplificación muy esquemática) el carácter subjetivo de la idea con la dimensión objetiva de dar forma, o la forma en que se nos presentan las cosas. Pero también guarda probable relación con otros conceptos como el de logos, prólepsis o typos. Conviene recordar en este punto el análisis de Foucalt (1970: 19) sobre las implicaciones de esta mirada fundante sobre el órden y relación entre discurso, ideas y conocimiento que denomina “voluntad de saber”. Hasta el SVI A.C. los poetas griegos atribuían al discurso verdadero poderes concretos sobre el mundo, infundiendo temor y respeto incidiendo en lo considerado justo para cada quién, profetizando el futuro e interviniendo en el mismo a través de su influjo en los hombres. Este discurso debía ser pronunciado “por quién tenía el derecho y según el ritual requerido”1. Era el lugar del oráculo y el poeta. Un siglo después “la verdad superior no residía ya más en lo que era el discurso o en lo que hacía, sino que residía en lo que decía”2. Platón expulsaba a los sofistas de la República, el discurso verdadero deja de ser 1 Foucault, Michel, “El orden del discurso”, Tusquets Editores, Barcelona, 1999 2 Idem

lo deseable, bello, justo o eficaz; separando la enunciación de lo enunciado. Pasarían 2000 años antes de que esta postura fuera revisada o al menos contextualizada. Más segura es la raíz latina y su uso en la tradición clásica y medieval en en el concepto informatio que mantiene y explicita los significados de dar forma a algo y comunicar conocimiento a alguien -sentido ontológico y epistemológico- (Capurro 2008: 6 ,Weizsacker). Los usos reales en los escritos de Virgilio lo acercan a la idea de modelación “informatum manibus” y en Cicerón nos muestran la compleja y estrecha relación entre ambos sentidos del término y lo asimila a conceptos como el de educación (moral)“quibus aetas puerilis ad humanitatem informari solet” o al deber ser de un buen orador o “informabo” observando en su alma las ideas (platónicas). Estos significados combinados se mantienen en los usos con sus variantes creacionistas más ligadas a las ideas teológicas de Agustín (que agrega a la idea moral su sentido social “informatio civitatis sanctae”) y Tomás de Aquino. Estos usos platónico-aristotélicos del término se verán cuestionados severamente por la filosofía cartesiana en el continente europeo y los empiristas en Inglaterra y más tarde el racionalismo. “Descartes separa radicalmente, en oposición a la filosofía aristotélico- escolástica, el proceso informativo (objetivo) sensible del cerebro, del conocimiento inmediato consciente de las ideas.” (Capurro 1998: 7). Es decir que estos pensadores sitúan exclusivamente la información en el terreno de la subjetividad humana y aún confundiendo a veces -o sustituyendo usos- con el de impresión se abandonan los usos éticos, morales o teológicos. La información es una actividad exclusiva del hombre en su actividad de percepción y conocimiento de su entorno físico y definitivamente alejada del uso sustancial-universal. En el siglo XX sin embargo esta noción dominante de información será puesta en tela de juicio desde los modelos matemáticos de la comunicación y los comienzos de la cibernética. Suele citarse el clásico artículo de Shannon “A Mathematical Theory of Communication”, publicado en 1948, como el hito teórico que da comienzo a la llamada Ciencia de la información y a su vez revoluciona los estudios de comunicación de la época. Por primera vez se pone en duda la univocidad del significado de los mensajes que la información transmitiría. También recorta de manera abrupta una enorme cantidad de sobre-interpretaciones que ha tenido este modelo. Se trata de una mirada al problema de como comunicar mensajes (¿datos?) -y no información- en la forma más eficiente en un sistema de codificación y transmisión controlable -computable-. ¿A qué llama Shannon información? Al resultado de calcular el coeficiente entre las posibles selecciones dentro del código de signos utilizado para crear un mensaje y la improbabilidad de que este efectivamente ocurra. Hablamos de informática no de comunicación humana. Tanto el

sentido semántico como el pragmático han sido explícitamente dejados de lado en aras de un positivismo lógico, de la utopía de un lenguaje matemático universal. En palabras del autor: “Frequently the messages have meaning; that is they refer to or are correlated according to some system with certain physical or conceptual entities. These semantic aspects of communication are irrelevant to the engineering problem.”. Para Warren Weaver este concepto de información que plantea Shannon (con quién trabajaron juntos largos años) es “bizarro y desilusionante”, siendo que solo responde a una de las tres niveles básicas que debería contener un modelo matemático y el uso del término en al menos cinco siglos en el inglés corriente: el problema técnico. El autor amplía el horizonte con los niveles semántico (How precisely do the transmitted symbols convey the desired meaning?) y pragmático (How effectively does the received meaning affect conduct at the desired way?). Sin dudas esta concepción de la información como algo que existe más allá de las conciencias o subjetividades abrió las puertas para sus aplicaciones científicas (código genético por ejemplo) y computacionales. Y con Norbert Wiener (Wiener: 19481950) da un paso más allá ubicando a la información como algo diferente a la materia y la energía y presente junto a estas en todos los entes del universo y que define como se estructura la materia y la energía y que podemos visualizar por ejemplo en la información genética. Estas investigaciones retomaban de algún modo el uso y significado antiguo y medieval del término, su valor universal. El debate posterior entre las miradas objetivas y subjetivas (información humana y nohumana) ha sido tema para innumerables estudios, disputas y escuelas, y siendo que se usa el término en disciplinas tan diversas como “quantum information, bioinformatics and information in systems biology, biosemiotics, cognitive sciences, consciousness studies, communication, media studies, information and communication technologies, technologies for cooperation” (Wolfgang Hofkirchner); una teoría unificada de la información parece una quimera expresada claramente en el “Trilema de Capurro” según las perspectivas adoptadas sobre el sentido del término información: unívoco, es decir que el significado es el mismo en todos los ámbitos con el peligro del reduccionismo; análogo que es la postura que defiende que hay un sentido originario del concepto humana y se traslada metafóricamente a otras disciplinas; o equívoco, que plantea que tiene significados distintos en las disciplinas o discursos, con el riesgo de la “intraducibilidad” entre sí. Lo que es, se da como forma en el caso de procesos naturales o, como “oferta de sentido” en el caso de sistemas psíquicos y sociales. Información es, en ambos casos, un ”resorte” de selección. (Capurro: 19)

Los orígenes de la Sociedad de la Información: Luego de la Segunda Guerra mundial, acelerado a partir de 1970, comienzan un proceso de re-estructuración post-industrial del sistema capitalista, dónde la información -y lo que los distintos teóricos entienden por ella- vuelve a ser colocada en el centro de los debates de las ciencias sociales, abandona la esfera de la Ciencia de la Información -aunque abreva en ella- y en algunos casos sustituye al capital como la clave conceptual o se confunde con el mismo (capital cognitivo). Sin duda es Manuel Castells quién más profundamente a sintetizado estas visiones en su trilogía la Era de la Información. Antes de entrar en su caracterización de la Sociedad Red, haremos un repaso de los antecedentes de sus conceptualizaciones, siguiendo el análisis histórico de Nicholas Garnham.3 En primer lugar ubica a Daniel Bell (1973) y el post-industrialismo, para quién el capital humano en forma de conocimiento científico ha ocupado el lugar de motor del desarrollo capitalista. Las ideas sustituyen al uso de la energía para manipular la materia como fuente del valor añadido, y estas están en manos de los científicos que no pueden ser sustituidos por maquinaria. Como segundo antecedente, aunque históricamente muy anterior, ubica la teoría económica de ciclos largos e innovación de Schumpeter (193439). Este economista se opuso a la teoría neoclásica hegemónica en su época, que entendía el equilibrio como el resultado de la competencia de precios entre capitales que buscaban una eficiencia óptima a través del continuo abaratamiento de los costes de producción. Para Schumpeter la tendencia a largo plazo de crecimiento capitalista se da en ciclos y no en progresiva, ciclos que se explican a través de la competencia en la innovación y no en precios. Los emprendedores crean nuevos productos y mercados para ellos, que pueden explotar en forma monopólica durante un tiempo de manera de apaliar los riesgos inherentes de una demanda incierta de un producto nuevo. El foco de la teoría es la innovación tecnológica en manos de emprendedores y tecnólogos, ya no de científicos específicamente. La tercer vertiente sería la llamada “economía de la información” basada en las teorías desarrolladas por Arrow y Machlup, quienes critican severamente la idea neoclásica de una distribución de la información equilibrada y racional de los participantes del mercado, que aseguraba el aumento del bienestar mediante el equilibrio entre oferta y demanda y el sistema de precios. Para estos autores los mercados, por el contrario, se caracterizan por una distribución desigual de la 3 Garnham, Nicholas “De las industrias culturales a las creativas. Análisis de las implicaciones en el Reino Unido”, en “Industrias creativas. Amenazas sobre la cultura digital”, Gedisa Ediciones, Barcelona, 2011.

información, que es tan central como escasa y explica en gran parte el comportamiento de los mismos y sus actores. Una nueva concepción de la empresa y el surgimiento del management, dónde la información -y su flujo- es el concepto clave a la hora de pensar y diseñar las relaciones internas a las empresas, pero también a la hora de analizar los mercados y los posibles nuevos productos; a través de los servicios de información empresarial y las nuevas tecnologías de información y comunicación. Separándose un poco del análisis de Granham, conviene en este punto profundizar en la semántica económica de Machlup, quien discrepa abiertamente con el uso del concepto objetivo de información Shannon y Weaver, para el autor el sentido del concepto información siempre refiere "to telling something or to the something that is being told. Information is addressed to human minds and is received by human minds." lo entiende como un flujo de mensajes y significados que pueden añadir, re-estructurar o modificar el conocimiento. Y según sus investigaciones es el uso primordial que se le da a esta noción en los campos de las ciencias humanas como la economía, la psicología o la lingüística. 4 La Sociedad Red -y su concepto de información- de Manuel Castells Intentaremos ahora sintetizar los planteos de este autor en torno a lo que él llama la Revolución de la tecnología de la información y que sería para él una tercera revolución industrial. Un verdadero cambio de paradigma tecnológico dónde las tecnologías de la información convergentes: microelectrónica, la informática (hardware y software), las telecomunicaciones y medios, la optoelectrónica y la ingeniería genética y sus aplicaciones en desarrollo, donde podemos incluir a la nanotecnología, biotecnología (la llamada NBIC o gran convergencia tecnológica si le agregamos la cognotecnología) son capaces de cambiar radicalmente las relaciones entre economía, la sociedad y la cultura. No es que la información y el conocimiento no hayan sido fundamentales en las anteriores revoluciones sino que es en esta etapa (la del final del siglo XX) que por la digitalización y la convergencia dinámica entre estas industrias innovadoras en productos y mercados, pero también por los usos que retroalimentan incesantemente el proceso. En palabras de Castells “los contextos culturales/institucionales y la acción social intencionada interactúan decisivamente con el nuevo sistema tecnológico, pero este sistema lleva incorporada su propia lógica, caracterizada por la capacidad de traducir todos los aportes a un sistema de información común y procesar esa información a una velocidad creciente (en nuestros días muchas veces en tiempo real), con una potencia en aumento, a un 4 Machlup and Mansfield, “The Study of Information: Interdisciplinary Messages”, 1983

coste decreciente, en una red de recuperación y distribución potencialmente ubicua.” (Castells 1999: 59). 15 años después de estos análisis, la historia parece haberle dado la razón al menos en estas intuiciones, y de algún modo profetiza el nacimiento del Big Data como disciplina y la ubicuidad de la internet inalámbrica y los dispositivos móviles. Pero que es el Big Data? Me animaría a decir que el Big Data es el conjunto de herramientas informáticas que permiten transformar datos sin procesar en información. Si pensamos que alrededor del 95% de los datos generados y digitalizados son rawdata, o sea datos no estructurados, podemos ver el inmenso campo que representa esta disciplina. Pero ¿de dónde provienen esos datos masivos? Las fuentes las podemos encontrar en lugares muy clásicos como son diversas industrias y compañías que almacenan enormes cantidades de datos transaccionales, reuniendo información acerca de sus clientes, proveedores y operaciones. También los campos científicos como la astronomía, meteorología, la genética crean ingentes cantidades de datos. Por otro lado el sector público administra enormes bases de datos cada vez más digitalizadas: censos de población, registros médicos, impuestos, sistema de transporte, etc. Pero la mayor explicación de esta infoexplosión proviene de internet y los dispositivos móviles con su multiplicidad de sensores , análisis de redes sociales, ubicación geográfica mediante coordenadas GPS, etc. Para tener una idea del ritmo de producción de datos en internet citemos algunas cifras recogidas por Intel en 2013 5 : cada minuto se compartieron durante el año pasado: 4.1 millones de búsquedas en Google, 138.889 horas de video vistos y 100 horas subidas en Youtube, 23.148 horas de video visto en Netflix (Youtube + Netflix significan más de la mitad del tráfico total), 3.3 millones de contenidos compartidos en Facebook y 6.9 millones de mensajes enviados, 347.222 tweets publicados en Twiteer, 38.194 fotos subidas a Instagram, 194.064 aplicaciones bajadas, 438.801 paginas wikis visitadas, 10 millones de ads se mostraron, Amazon vendió 133.436 dólares y el gigante chino Alibaba llegó a vender 400 millones de dolares en los dias pico.Según esta misma fuente se calcula que el tráfico móvil se multiplicará por 13 en los próximos 5 años y habrán 3 veces más dispositivos conectados que habitantes del planeta. Por último la cifra estimada de data creada durante el 2013 es de 4 zettabytes. Pero no solamente somos los seres humanos explican este crecimiento enorme de información, existe también la comunicación denominada máquina a máquina. Sensores 5 http://www.intel.es/content/www/es/es/communications/internet-minute-infographic.html

digitales instalados en contenedores para seguir en tiempo real la ruta y el estado del envío, sensores en medidores eléctricos para determinar el consumo de energía, etc. Si seguimos la clasificación según el origen de los datos propuestas por IBM 6 podemos dividir en 5 fuentes: web y social media, originada en los contenidos de la web, los rastreos de click, los posteos de Facebook o los twitts de Twitter; máquina a máquina (M2M) a través de sensores conectados comunican valores como posición, velocidad, valores químicos o meteorológicos; Big transaction data, registros de facturación, registros detallados de llamadas en telecomunicaciones, demandas médicas, etc; Biometrics, que incluye el escaneo de huellas digitales, reconocimiento facial, escaneo de la retina y los datos genéticos; Human generated, como ser llamadas grabadas por call center (o servicios de inteligencia), mensajes de voz, documentos y correos electrónicos, historiales médicos entre otros. La pregunta que se han hecho numerosos investigadores en los últimos 25 años es si estos datos pueden convertirse en información dadas las dificultades vinculadas a la gestión, la captura, el almacenamiento, búsqueda, y análisis de los mismos. Y hasta no hace mucho tiempo la respuesta parecía ser negativa. Solo los servicios de información especializada con técnicas tradicionales de análisis de base datos permitían a costos muy altos utilizar el 10% de los datos estructurados de manera significativa (léase comercial). Sin embargo podemos decir que al día de hoy a través del uso de algoritmos complejos (como el de Google) y el incesable crecimiento de la capacidad de cálculo computacional, es posible convertir estos datos “salvajes” en información, en algunos casos, en tiempo real. Los intereses económicos en juego, las empresas de punta y los estados más poderosos se han lanzado ya de lleno a la investigación y utilización de estas herramientas cuya aplicación en el campo de la mercadotecnia, los servicios financieros y el espionaje son evidentes. Más adelante abordaremos las implicaciones ético y sociales que apareja esta revolución que parece dar por ciertas las intuiciones de Castells. Nuestras acciones, mensajes, consumos, traslados, se han convertido ya en commoditys. Los macrodatos o Big Data suponen grandes volúmenes de información que se mueven y analizan a gran velocidad y una gran variabilidad en la estructura compleja de su composición, lo que se a llamado las 3V (Volumen, Velocidad, Variabilidad). Algunos autores proponen agregar una variable más como ser la Visualización 7 o el tiempo real8, 6 https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/ (2012) 7 Tascón, Mario, “Big Data Pasado, presente y futuro” en Revista Telos 95 8 Cabo, David, y Magallón, Raúl “Nuevos retos para las Administraciones Públicas. Datos, cultura cuantitativa y calidad democrática”, en Revista Telos 95

diferenciando así esta disciplina de sus posibles antecesores, la Business Intelligence (BI) y su campo más específico, la minería de datos. La BI tiene al menos 20 años de desarrollo y refiere al conjunto de estrategias y herramientas utilizadas por las empresas para realizar análisis y previsiones basados en los datos de su organización. La minería de datos es un sector de las ciencias computacionales dentro de la BI que busca en forma automática o semi-automática encontrar patrones en grandes volúmenes de datos utilizando la inteligencia artificial, el aprendizaje automatizado, las herramientas estadísticas y los sistemas de bases de datos. Sin duda es el núcleo duro de lo que evolucionó al día de hoy como Big Data, aunque deja de lado las tareas de recolección, preparación, interpretación de los resultados, tareas que pertenecen a la llamada “Knowledge Discovery in databases” (KDD). La evolución de esta estas técnicas apunta a saltearse la etapa de preparación de los datos que insume enormes cantidades de tiempo, y busca basarse en un modelo predictivo que no busca causalidades, sino predecir comportamientos, midiendo la cantidad de información diponible en la base de datos.9 Para ello se valen del modelo matemático de Shannon, tratando a la base de datos como un sistema de comunicación, entendiendo que la mayor entropía significa mayor información, y buscando establecer relaciones entre variables más importantes, reducir el ruido y ver de qué manera estas afectan al sistema. Pero entonces ¿qué diferencia tiene el Big Data con el KDD?. El cambio fundamental es el crecimiento exponencial que tienen las 3V. Las herramientas tradicionales servían para análisis intraempresa y las bases de datos eran manejables en los servidores de las mismas. Hoy día el desarrollo del Big Data también está asociado al Cloud Computing, es decir granjas enteras de computadoras ubicuas procesando estos datos dentro de la propia red, tanto el volumen, la variabilidad y velocidad del proceso han dado un salto cualitativo. Gracias a la velocidad del análisis, es posible que el analista de datos pueda cambiar sus ideas basándose en el resultado obtenido y re trabajar el procedimiento una y otra vez hasta encontrar el verdadero valor al que se está tratando de llegar. Fuera del ámbito económico y empresarial podemos destacar las investigaciones que incluyen herramientas de Big Data en áreas de estudios cognitivos, estudios del genoma del cáncer, secuencias proteínicas, sistemas de inteligencia territorial, lingüística computacional, bioinformática, monitoreo de pacientes en CTI, entre otras. También el campo de la administración pública es susceptible de utilizar con provecho el Big Data de la mano del llamado gobierno electrónico u open data, a través de una mejora 9 Pyle, Dorian, Data Preparation for Data Mining, Morgan Kaufmann, 1999

en la eficiencia de los servicios, la mejor utilización de los recursos y un mayor acceso a la información debidamente procesada de los ciudadanos. El Open Data puede ser entendido como la contracara social del Big Data, si los estados y las grandes corporaciones pueden acceder a nuestros datos privados -y no hay vuelta atrás posible en este tema- deberíamos tener el acceso abierto a las bases de datos que generamos como sociedad. Sin dudas aquí además de la necesidad de incorporar especialistas en análisis de datos, de ‘responsables de la información’ (Chief Information Officers, CIO) como en las empresas privadas, de manera que no solo se asegure la transparencia y accesibilidad sino que deben ser accesibles a través de infografías y/o visualizaciones diversas. De esta manera el ciudadano es pasible de participar más activamente y evaluar los objetivos perseguidos cuando se apuesta por una política pública determinada. Sin dudas las experiencias británicas en este campo son una referencia ineludible. Mysociety10 reúne una serie de herramientas y aplicaciones que utilizan los datos públicos para intentar aumentar el bienestar de la comunidad y la trasparencia de las administraciones, a través de lo que se ha llamado la tecnología cívica. Otro campo con escaso desarrollo a nivel local pero de considerable impacto en los medios internacionales es el llamado “periodismo de datos”, ejemplos como The Guardian11 o La Nación en Argentina12, dónde los datos públicos y su monitoreo permiten sumar una herramienta muy poderosa a la hora de investigar un tema y encontrar constantes impensadas, así como acercarlo a la ciudadanía en forma inteligible.

Los peligros del Big Data

En primer lugar deberíamos anotar que estamos frente a un abandono de la constituitiva relación en el pensamiento occidental entre las relaciones causales entre variables y su posible explicación como forma de entender el mundo en el que vivimos. La disciplina de los macro datos por el contrario supone un análisis correlacional que no busca explicar el pasado, sino por el contrario predecir el futuro, dejando de lado muchas veces el juicio humano. Sin dudas parte de la explicación de la crisis bursátil de 2008 se le puede atribuir al Big Data, de alguna manera las propias herramientas financieras predictivas fueron construyendo un bien intangible ligado a las hipotecas, de óptimas características de acuerdo a sus parámetros pero sin ningún sustento en el mundo real. Esta crisis ha 10 https://www.mysociety.org/ 11 http://www.theguardian.com/data 12 http://www.lanacion.com.ar/data

dejado en evidencia los límites éticos y prácticos pero sin duda no exime de culpa a los individuos detrás de estos usos de las tecnologías y las corporaciones que ampararon el secreto hasta que ya fue demasiado tarde. La transparencia es un camino insoslayable y el control de los gobiernos en esta área indispensable. Otro riesgo evidente es la privacidad de los datos, hoy nula para los ciudadanos digitales. Pero a través de los mecanismos de Open Data, iniciativas de tecnologías cívicas, y la educación digital es posible re-encausar estos procesos de manera que no sólo los grandes capitales obtengan beneficios cuantiosos de estas herramientas, sino que puedan ser el motor para una administración pública mas eficiente, una evasión fiscal más controlada y una ciudadanía más informada y participativa. El proyecto económico de la Sociedad de la Información debe conciliarse con el proyecto político de la Sociedad del Conocimiento y el bienestar, sin intervención estatal y participación ciudadana simplemente estaremos encaminándonos a lo que Piketty (utilizando herramientas de base de datos) llama el capitalismo patrimonial, es decir un aumento exponencial de la desigualdad en la distribución de las riquezas a nivel mundial y a la interna de las distintas sociedades. Desigualdad que puede encontrar en el Big Data un potente motor de crecimiento.

Bibliografía consultada: Capurro, Rafael, “Pasado, presente y futuro de la noción de información”, 2008, consultado en línea en noviembre 2014, http://www.capurro.de/leon.pdf Capurro, Rafael, Fleissner, Peter, Hofkirchner, Wolfgang “Is a Unified Theory of Information feasible?”, consultado en línea en diciembre de 2014, http://www.capurro.de/trialog.htm Capurro, Rafael, “Información y acción moral en el contexto de las nuevas tecnologías”, consultado en línea en diciembre de 2014, http://www.capurro.de/marilia.html Capurro, Rafael, ”La hermenéutica y el fenómeno de la información”, consultado en línea en diciembre de 2014, http://www.capurro.de/herminf.html Capurro, Rafael, Hjørland Birger “The Concept of Information”, consultado en línea en diciembre de 2014, http://www.capurro.de/infoconcept.html Castells, Manuel “La era de la información: la sociedad red”, Alianza editorial, 1999 Ferreira, Marcelo, “Data Mining basado en la Teoría de la Información”, consultado en línea en enero de 2015, http://web.austral.edu.ar/images/contenido/facultad-ingenieria/2Data_Mining_basado_Teoria_Informacion_Marcelo_Ferreyra.pdf Foucault, Michel, “El orden del discurso”, Tusquets Editores, Barcelona, 1999 Garnham, Nicholas “De las industrias culturales a las creativas. Análisis de las implicaciones en el Reino Unido”, en “Industrias creativas. Amenazas sobre la cultura digital”, Gedisa Ediciones, Barcelona, 2011. Revista Telos 95, Dossier Big Data, consultado en línea en noviembre de 2014, disponible http://telos.fundaciontelefonica.com/DYC/TELOS/NMEROSANTERIORES/Nmeros8097/DYC/TELOSonline/ SOBRETELOS/Nmerosanteriores/Nmero95/seccion=1286&idioma=es_ES.do

Artículos consultados en línea: http://es.wikipedia.org/wiki/Big_data, consultado en diciembre 2014 http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos, consultado en enero 2015 http://es.wikipedia.org/wiki/Norbert_Wiener, consultado en enero 2015 https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/, consultado en diciembre 2014 http://www.economist.com/node/15557443, consultado en diciembre 2014 http://librosensayo.com/big-data-la-revolucion-de-los-datos-masivos-de-viktor-mayer-

schonberger-y-kenneth-cukier/, consultado en diciembre 2014 http://www.elboomeran.com/obra/1760/big-data-la-revolucion-de-los-datos-masivos/, consultado en diciembre 2014

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.