Auditoría Pública nº 76. Revista de los órganos autonómicos de control externo
La transformación digital no será televisada: el Big Data en la Auditoría Pública 59 Auditoría Pública nº 76 (2020), pp. 51 - 64 En un gran porcentaje de los casos se desconocen las leyes que relacionan las inputs y las outputs, pero el objetivo de la minería de datos no es tratar de explicar- lo todo, sino buscar cómo explicar los datos y concluir un MODELO que funcione, es decir, extraer patrones y relaciones no apreciables inicialmente para predecir comportamientos y en la toma de decisiones. El desarrollo tecnológico ha permitido que los mode- los sean replicables, automatizados, comparables y co- nectables entre sí y, que incluso, se perfeccionen de ma- nera no supervisada. Vale la pena emplear recursos, pero hay que estar preparados para que una modelización no arroje resultados concluyentes. El desarrollo más cono- cido de la minería de datos es el Machine Learning cuyos algoritmos se configuran para dos objetivos: • DESCRIPCIÓN: Técnicas que nos ayudan a entender la información masiva para su clasifi- cación (clustering y segmentación), establecer reglas de asociación y dependencia, sistemas de recomendación, etc... • PREDICCIÓN: combinando algoritmos con el uso de los modelos tradicionales de regre- sión y series temporales, análisis discriminante, métodos bayesianos, árbol de decisión y otros más avanzados como son las redes neuronales se pueden obtener patrones de comportamien- to empleados en detección del fraude y crédito y caución. Los modelos pueden ser entrenados para el mantenimiento predictivo de los activos o la detección de cuellos de botella, pero tam- bién pueden pronosticar cuál es la siguiente ta- rea, cómo finalizan los procesos o qué recursos se van a necesitar. Una vez seleccionados los datos tras un proceso ETL y tras seleccionar la variable objetivo, el conjunto de da- tos se divide en un grupo de entrenamiento y otro grupo de test, en general 70-80% de los datos para el primer grupo y el resto para el grupo de comprobación. Con el primer grupo se construye el modelo elegido y con el segundo grupo de datos se evalúan los errores y acier- Las herramientas de analítica van a poder tanto agre- gar y procesar el universo completo de registros granu- lando y segmentando con un alto grado de precisión poniendo el foco en la actuación, no tanto en el con- tenido de esa actuación sino en el cómo se ha hecho. Siempre tenemos la posibilidad de añadir otras fuentes de datos por lo que se abre un mundo de pruebas de cumplimiento para las auditorías de sistemas y proce- dimientos. Una analítica de procesos avanzada permite, en tiem- po real, mejorar los procesos, la trazabilidad de las acti- vidades, compliance y detectar el riesgo de fraude. Para el auditor externo, le ayuda a obtener el conocimiento necesario de los procesos de negocio y del organigrama real de la organización 12 . 2.3 MINERÍA DE DATOS: Data mining La analítica de Big Data ha impulsado la interrelación entre las técnicas que utiliza la minería de datos, muchas de ellas no son novedad puesto que provienen del análi- sis multivariante de la estadística descriptiva clásica. Con la capacidad y la relativa sencillez del procesado de las máquinas se pueden desarrollar métodos sencillos para abordar un tratamiento complejo de datos. El desarrollo de interfaces integradores de todas estas técnicas ha faci- litado su combinación y presentarlas como un menú que facilita el descubrimiento automático de conocimiento. Gran parte de esta tecnología está basada en el software libre que incluyen comunidades abiertas de colaboración, por lo que es muy sencillo encontrar capacitación, ejem- plos completos ( end-to-end ) y ayuda especializada. 12 Véase recientes trabajos de Tribunal Europeo de Cuentas: https://medium.com/ecajournal/connecting-data-and-processes-in-audit-some-considerations-about- the-use-of-process-mining-231fe76f3f21
RkJQdWJsaXNoZXIy MTEw