Auditoría Pública nº 75. Revista de los órganos autonómicos de control externo

INTRODUCCIÓN. ( TIEMPOS MODERNOS) El Big data promete ser un cambio equivalente al des- cubrimiento de la rueda o de la imprenta. Es un cambio que, nos guste o no, ya está en nuestras vidas, en nues- tros teléfonos, en nuestras ciudades, en nuestras casas. A efectos del Big data las personas somos entes produc- tores de datos. En la actualidad ya no hablamos de bites ni Megabyte (10 6 bites) sino de Quintillón de bytes (QB= 10 30 bytes) cifras que la mente humana apenas puede concebir. No sólo se trata de la cantidad de datos sino el soporte para contenerlos. Al respecto, Antonio Monleón-Getino 1 asegura que toda la música del mundo se puede intro- ducir en un disco duro que cuesta unos 500 euros y que el 90 por ciento de los datos del mundo han sido creados en los últimos dos años. A pesar de que se abren muchas puertas por la gran cantidad de datos que se generan y que se recopilan, és- tos, por sí solos, no sirven de casi nada. Para que los da- tos se conviertan en información o conocimiento éstos se tienen que procesar para poder resolver respuestas a preguntas derivadas de éstos: es decir se tienen que convertir en útiles. Por otra parte, el tener muchos datos supone adquirir mayor carga de trabajo ya que, si bien algunos proble- mas se eliminan mediante el Big data , otros no, y por tanto se pueden heredar los defectos de la Estadística a una escala mayor. “Hay muchos problemas asociados a la Estadística tradicional que también se dan con gran- des cantidades de datos. No desaparecen porque estés analizando gran cantidad de información, se vuelven peores” 2 . El problema será cómo inferir lo que está ocu- rriendo y determinar las medidas para cambiarlo. Pero ¿qué es el Big data ?. Pocos tienen una idea clara de lo que significa, más allá de que se refiere a una gran cantidad de datos. El Big data es un concepto mucho más complejo que esa simple idea de volumen. Para una aproximación al concepto, el analista Douglas Laney’s en su definición ya clásica del Big data lo relaciona con las tres uves (actualmente se agregan más “uves” a la de- finición, como veracidad, valor, etc.): Volumen de datos que necesitan ser procesados y analizados a fin conseguir conocimiento útil y valioso Velocidad en el procesamiento para conseguir unos tiempos de respuesta adecuados. Variedad de estos datos. 10 Junio nº 75 - 2020 AUDITORÍA Y GESTIÓN DE LOS FONDOS PÚBLICOS 1 El impacto del Big data en la Sociedad de la Información. Significado y utilidad. Antonio Monleón-Getino. Universidad de Barcelona. Noviembre de 2015. 2 Big Data: are we making a big mistake . Hartford, Tim: Financial Times 28/3/2014. 3 Ronny Kohavi y Foster Provost. Applications of Data Mining to Electronic Commerce. Kluwer Academic Publischers. 2001. 4 Antonio Monleón-Getino Universidad de Barcelona. El impacto del Big data en la Sociedad de la información. Significado y utilidad. 2010. Ilustración 1. Las uves del big data , según Douglas Laney’s BIG DATA VELOCIDAD VARIEDAD VOLUMEN Por su parte, la Wikipedia establece que los macroda- tos ( Big data ) “es un término que hace referencia a con- juntos de datos tan grandes y complejos como para que hagan falta aplicaciones informáticas no tradicionales de procesamiento de datos para tratarlos adecuadamen- te. El concepto de Big data tiende a referirse al análisis del comportamiento del usuario, extrayendo valor de los datos almacenados, y formulando predicciones a través de los patrones observados”. EL BIG DATA NO TRATA SÓLO SOBRE EL VOLUMEN DE DATOS SINO SOBRE LA INFORMACIÓN QUE DE ELLOS PUEDE DESPRENDERSE E INTERPRETARSE Hemos de tener en cuenta que para que los datos se conviertan en conocimiento útil y valioso cobra impor- tancia el concepto de Machine-Learning (ML). El ML lo definieron Kovahi y Provost 3 como “una dis- ciplina proveniente de la ciencia y la ingeniería que se ocu- pa de la construcción y el estudio de algoritmos capaces de aprender apartir dedatos. Es decir, se intenta realizar predic- ciones o toma de decisiones a partir demodelos construidos por los propios algoritmos en lugar de seguir instrucciones de manera explícita para lo que han sido programados 4 ”.

RkJQdWJsaXNoZXIy MTEw