Imagen de portada tomada de: https://towardsdatascience.com/what-is-data-science-and-how-it-helps-companies-to-reinvent-their-business-15bcc33e9349

Post basado en: https://aukera.es/blog/data-science-que-es-y-que-no-es/

He escuchado a muchas personas hablando de Big Data, Machine Learning, Data Science, Open Data, entre otros términos, y he notado que existe una gran confusión alrededor de tantas definiciones.

Es muy fácil confundirse entre los nombres y aplicaciones que se le dan a estas disciplinas.

El objetivo de este post es acabar (en la medida de lo posible) con la ignorancia que hay sobre estos conceptos.

Data Science, si lo traducimos literalmente, es ciencia de los datos, naturalmente ciencia de los datos representa o puede representar muchas cosas, y realmente es así. Pensemos por ejemplo en ciencias naturales, incluye biología, ecología…



Vamos a explicar algunos de los conceptos mas importantes de Data Science.

Data Mining

Imagen tomada de: http://www.copyrightuser.org/understand/exceptions/text-data-mining/

El Data Mining es normalmente lo que se estudia para comenzar el camino del estudio de los datos. Por lo general el objetivo es encontrar información útil de los datos que en principio no se podía visualizar. Por lo general se toman datos poco estructurados y se ofrecen conclusiones o información de valor.

Las fases de Data Mining son las siguientes:

  • Recoger información (datos): ser refiere al proceso de obtener los datos que se usarán para los análisis.
  • Preprocesado: consiste en ordenar los datos anteriores de manera que se puedan manipular de forma fácil. Esta parte incluye la limpieza de los datos (quitar datos con errores, verificar datos incompletos, etc).
  • Entrenamiento del modelo: también se le llama machine learning.
  • Testeo: permite validar los resultados de los algoritmos de machine learning
  • Visualización e interpretación: esta etapa se hace en cada momento del proceso. El objetivo es graficar los datos de manera que exista claridad sobre las ideas que los datos exponen para la toma de decisiones.



Inteligencia Artificial

Imagen tomada de: https://marketing4ecommerce.mx/inteligencia-artificial-incrementara-empleos-e-ingresos-encuesta/

En términos generales, Data Mining puede usar Inteligencia Artificial para algunos algoritmos de entrenamiento en Machine Learning, aunque realmente es mucho mas que eso.

La inteligencia artificial tiene como objetivo poder simular un comportamiento con razonamiento lógico así como lo hacemos los seres humanos. La inteligencia artificial podría permitir que un bot genere títulos atractivos para posts en un blog, y adicionalmente pueda escribir el contenido de forma coherente basándose en algún libro u otro documento de entrada.



¿Y que es Big Data?

Imagen tomada de: https://www.kdnuggets.com/2018/03/5-things-big-data.html

La ciencia de datos puede aplicarse sobre diversos conjuntos de datos. Dependiendo del tamaño de esos conjuntos cambian los recursos que se necesitan para procesarlos. A los conjuntos de datos muy grandes se les llama Big Data.

Cuando se pueden procesar los datos en una computadora doméstica estamos hablando de Small Data, cuando un documento de excel no es suficiente para almacenarlos se llama Medium Data.

Otras formas de abordar Data Science

Imagen tomada de: http://sudeep.co/data-science/Understanding-the-Data-Science-Lifecycle/
Imagen tomada de: http://blablanegocios.com/data-science-que-es/



Print Friendly, PDF & Email

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *