Page 55 - Auditoría Pública Nº 85
P. 55
¿Sueñan los auditores con ovejas eléctricas? (Los auditores frente a la inteligencia artificial)
Cuando no se dispone de grandes cantidades de datos o más alta y, por su parte, la red discriminadora in-
cuando está limitado de alguna manera su uso, la nueva crementa su capacidad para detectar datos no
IA utiliza una herramienta innovadora que esta cambiado reales.
la forma en que se manejan los datos. Esta herramienta
se denomina de “datos sintéticos” y se basa en la gene- ¡ Autoencoders. En este modelo hay una red co-
ración de datos, de forma algorítmica, que conservan las dificadora y otra decodificadora. Con la retroali-
propiedades de distribución, estadísticas y de estructura mentación de la decodificación la red “aprende”
de datos reales. Esto abre un nuevo campo en la IA al las características de los datos reales y puede
no necesitar gran cantidad de datos o el combinar datos crear datos sintéticos. Los codificadores, por su
reales con datos generados. Esta herramienta ya tiene parte, al reducir las características de los datos
salidas en el campo de la medicina, pruebas pentest sin manteniendo la información relevante, en lo que
paralizar producción, ciberseguridad, etc. se denomina espacio latente, permiten una opti-
6
mización de su tratamiento.
Hay varias formas de creación de datos sintéticos, pero
en general se trata de poner a competir a dos redes de Todo lo anterior nos lleva a hacer una diferenciación
forma reiterada para que al final produzcan un resultado esencial respecto a la IA en dos tipos: la discriminati-
lo más óptimo posible. Entre las redes que utilizan dos va y la generativa. La diferencia fundamental entre las
redes para crear datos destacan las siguientes: dos es simplemente que la IA generativa crea de forma
coherente (¡?). La inteligencia generativa, gracias a los
¡ Redes generativas adversarias. Una red coge Transformers y a los LLM, pueden “comprender”, gene-
el rol de generar datos (generadora) los más rea- rar y manipular lenguaje natural a un nivel muy avanzado
les posible y la otra (discriminadora) ha de distin- capaz de superar sobradamente la prueba de Turing.
guir entre los creados de los reales. La iteración
consigue hacer una sinergia y permite que los Las principales características diferenciadoras de la IA dis-
datos conseguidos sean cada vez de una calidad criminativa y la IA generativa se presentan en la tabla 1.
Tabla 1.
Características de la IA discriminativa y la IA generativa.
Característica IA Discriminativa IA Generativa
Puede trabajar con datos no estructurados ni eti-
Necesita de datos estructurados y etique- quetados y puede crear datos sintéticos equivalen-
Fase de entrenamiento tados. tes a los reales.
Simple y eficiente.
Complejo e intensivo.
Modela la distribución condicionada
P(X/Y): es decir la probabilidad de que la Modela la distribución conjunta P(X,Y); es decir la
Distribución base probabilidad de que ocurran simultáneamente
etiqueta Y tome ciertos valores para un ciertos valores de la característica X y la etiqueta Y.
valor determinado de la característica X.
Herramientas utilizadas Árboles de decisión, Redes neuronales, Redes Neuronales avanzadas (Transformers), mo-
modelos estadísticos de regresión. delos LLM (DeepSeek, GPT).
Datos existentes clasificados. Modo texto. Creación compleja de datos en formato texto, imá-
Salida El nivel de creación es mínimo. genes, sonido, etc. Multimodal.
Reconocimiento de imágenes, clasifica-
Usos ción de textos, Detección spams, diagnós- Generación de texto, imágenes digitales, composi-
ción musical, modelado, arte digital.
ticos médicos, modelado de datos.
6 Generación de datos sintéticos: técnicas y consideraciones. Cristina Ortega QuestionPRO https://www.questionpro.com/blog/es/datos-sinteticos
55