El valor de los datos sintéticos: MIT Sloan

El objetivo de los datos sintéticos es reproducir las propiedades estadísticas y los patrones de un conjunto de datos existentes

Cada vez más empresas recurren a la ciencia de datos para transformar sus negocios y hacerlos más competitivos. El análisis, la estadística, los métodos científicos y la inteligencia artificial (IA), se han convertido en herramientas fundamentales para extraer valor de los datos almacenados en diversas fuentes de información.

En este contexto, en el artículo “El verdadero negocio de los Datos Sintéticos”, publicado por el MIT Sloan Management Review México, Fernando Lucini destaca que los datos  son el principal combustible que impulsa las iniciativas de aprendizaje automático y el análisis avanzado de las organizaciones, sin embargo, entre las preocupaciones por mantener la privacidad y los problemas de proceso, no es fácil para los investigadores obtener lo que necesitan.

Nueva alternativa para explorar

De este modo, el especialista refiere que los datos sintéticos que se generan artificialmente por medio de un algoritmo de IA que ha sido entrenado en un conjunto de datos reales; se han convertido en una nueva alternativa para explorar, ya que se pueden utilizar y compartir de distintas formas, algo que no ocurre con los datos reales.

“Tiene el mismo poder predictivo que los datos originales, pero los reemplaza en lugar de disfrazarlos o modificarlos”.

De igual forma, indica que el objetivo de los datos sintéticos es reproducir las propiedades estadísticas y los patrones de un conjunto de datos existentes, modelando su distribución de probabilidad y muestreo; es decir que el algoritmo crea nuevos datos que tienen todas las características de los datos originales, lo que conduce a las mismas respuestas.

Finalmente, el artículo menciona que el principal beneficio de los datos sintéticos es que elimina el riesgo de exponer datos críticos y comprometer la privacidad y seguridad tanto de los clientes como de las empresas, mediante técnicas de cifrado, anonimato y la preservación de la privacidad que se centran en proteger los datos originales y la información que contienen para poder rastrearse hasta un individuo.

Visit Us On FacebookVisit Us On TwitterVisit Us On InstagramVisit Us On LinkedinVisit Us On Youtube