Cuando no se tiene un proceso automático para el registro de los valores en las bases de datos, muy frecuentemente estas vienen con valores faltantes en sus variables o bien con valores duplicados, es decir que, por alguna razón, la información de un individuo se encuentra registrada dos o mas veces, lo que podría alterar los resultados obtenidos al momento de analizarlas.

En esta ocasión te hablaré acerca de la detección de valores perdidos y de valores duplicados.

Los archivos que voy utilizando los puedes encontrar en:

https://github.com/rociochavezmx/Roci…

Algunos archivos no los encontrarás en el link, ya que se van creando al correr los códigos que vienen en los videos y estos se grabarán en tu computadora.

Si quieres aprender más acerca de este tipo de técnicas, suscríbete a mi canal, en donde estaré subiendo videos de Machine Learning, Estadística y de Matemáticas en general aplicadas a los negocios.

Si conoces a alguna persona a la que le pudiera ser de utilidad esta información, por favor ayúdame a compartirla. Te lo agradeceré muchísimo 😉

Si quieres ver el video en mi canal de youtube, da clic aquí