El aumento de la adopción de Internet y los rápidos avances tecnológicos en la conectividad de los dispositivos están impulsando el flujo de datos a un ritmo exponencial, lo que lleva a las organizaciones a encontrar diferentes formas de transformar la afluencia de datos en conocimientos empresariales que faciliten la toma de decisiones más informadas e inteligentes. En algún minuto del año 2008, la ciencia de datos empezó a promoverse y dio un salto a la fama. Desde entonces, se ha convertido en tendencia en el campo TI.
La ciencia de datos es un campo interdisciplinario relacionado con el Big Data y Machine Learning que gestiona y maneja procesos, los diferentes métodos y algoritmos científicos para sustraer información e inteligencia empresarial de diversos datos estructurados y no estructurados. Independientemente de la clasificación de éstos, los científicos de datos deben asegurarse de que los computadores entiendan los datos que se están utilizando para X acción.
El flujo de trabajo de la ciencia de datos implica una serie de procesos complejos que incluyen la obtención, almacenamiento, limpieza, procesamiento, puesta en escena, agrupación y modelado de datos, como también, el resumen de conocimientos.
Los científicos de datos realizan trabajos de exploración, regresión, minería de textos, análisis predictivo y cualitativo y finalmente, los conocimientos se comunican a través de la visualización de datos, lo que ayuda a los ejecutivos a tomar decisiones empresariales inteligentes.