Page 55 - Auditoría Pública Nº 85
P. 55

¿Sueñan los auditores con ovejas eléctricas?  (Los auditores frente a la inteligencia artificial)






            Cuando no se dispone de grandes cantidades de datos o      más alta y, por su parte, la red discriminadora in-
            cuando está limitado de alguna manera su uso, la nueva     crementa su capacidad para detectar datos no
            IA utiliza una herramienta innovadora que esta cambiado    reales.
            la forma en que se manejan los datos. Esta herramienta
            se denomina de “datos sintéticos” y se basa en la gene-  ¡  Autoencoders. En este modelo hay una red co-
            ración de datos, de forma algorítmica, que conservan las   dificadora y otra decodificadora. Con la retroali-
            propiedades de distribución, estadísticas y de estructura   mentación de la decodificación la red “aprende”
            de datos reales. Esto abre un nuevo campo en la IA al      las características de los datos  reales y puede
            no necesitar gran cantidad de datos o el combinar datos    crear datos sintéticos. Los codificadores, por su
            reales con datos generados. Esta herramienta ya tiene      parte, al reducir las características de los datos
            salidas en el campo de la medicina, pruebas pentest sin    manteniendo la información relevante, en lo que
            paralizar producción, ciberseguridad, etc.                 se denomina espacio latente, permiten una opti-
                                               6
                                                                       mización de su tratamiento.
            Hay varias formas de creación de datos sintéticos, pero
            en general se trata de poner a competir a dos redes de   Todo  lo  anterior  nos  lleva  a  hacer  una  diferenciación
            forma reiterada para que al final produzcan un resultado   esencial respecto a la IA en dos tipos: la discriminati-
            lo más óptimo posible. Entre las redes que utilizan dos   va y la generativa. La diferencia fundamental entre las
            redes para crear datos destacan las siguientes:     dos es simplemente que la IA generativa crea de forma
                                                                coherente (¡?). La inteligencia generativa, gracias a los
               ¡  Redes generativas adversarias. Una red coge   Transformers y a los LLM, pueden “comprender”, gene-
                   el rol de generar datos (generadora) los más rea-  rar y manipular lenguaje natural a un nivel muy avanzado
                   les posible y la otra (discriminadora) ha de distin-  capaz de superar sobradamente la prueba de Turing.
                   guir entre los creados de los reales. La iteración
                   consigue hacer una sinergia y permite que los   Las principales características diferenciadoras de la IA dis-
                   datos conseguidos sean cada vez de una calidad   criminativa y la IA generativa se presentan en la tabla 1.




            Tabla 1.
            Características de la IA discriminativa y la IA generativa.


                 Característica             IA Discriminativa                        IA Generativa
                                                                      Puede trabajar con datos no estructurados ni eti-
                                  Necesita de datos estructurados y etique-  quetados y puede crear datos sintéticos equivalen-
             Fase de entrenamiento  tados.                            tes a los reales.
                                  Simple y eficiente.
                                                                      Complejo e intensivo.

                                  Modela la distribución  condicionada
                                  P(X/Y): es decir la probabilidad de que la   Modela la distribución conjunta P(X,Y); es decir la
             Distribución base                                        probabilidad  de  que  ocurran  simultáneamente
                                  etiqueta Y tome ciertos valores para un   ciertos valores de la característica X y la etiqueta Y.
                                  valor determinado de la característica X.


             Herramientas utilizadas  Árboles de decisión, Redes neuronales,  Redes Neuronales avanzadas (Transformers), mo-
                                  modelos estadísticos de regresión.  delos LLM (DeepSeek, GPT).

                                  Datos existentes clasificados. Modo texto. Creación compleja de datos en formato texto, imá-
             Salida               El nivel de creación es mínimo.     genes, sonido, etc. Multimodal.


                                  Reconocimiento de imágenes, clasifica-
             Usos                 ción de textos, Detección spams, diagnós-  Generación de texto, imágenes digitales, composi-
                                                                      ción musical, modelado, arte digital.
                                  ticos médicos, modelado de datos.




            6     Generación de datos sintéticos: técnicas y consideraciones. Cristina Ortega QuestionPRO https://www.questionpro.com/blog/es/datos-sinteticos


                                                                                                              55
   50   51   52   53   54   55   56   57   58   59   60