Como te comentaba en el video “Pre-Procesamiento de Datos en R: Variables Dummy”, existen muchos métodos de machine learning para los cuales es necesario convertir las variables categóricas en 1’s y 0’s. La manera más sencilla de hacerlo es crear variables dummy (también llamadas ficticias), mediante un proceso conocido como one-hot encoding, el cual crea […]
Estás navegando por los archivos de
Autor: Rocío Chávez
Variables Dummy (One Hot Encoding) en R
Existen muchos métodos de machine learning que no tienen la capacidad de manejar variables categóricas, como son, el sexo o la profesion de una persona, por lo que es necesario transformarlas a numéricas. La manera más sencilla de hacerlo es crear variables dummy (también llamadas ficticias), mediante un proceso conocido como one-hot encoding, el cual […]
Detección de Outliers en Python
Después de haber trabajado con los valores perdidos, vamos a hacer ahora la detección de outliers. Un outlier es un valor que numéricamente es muy diferente al resto de los datos, lo que puede afectar al momento su análisis, por lo que es aconsejable retirarlos antes de seguir adelante con el mismo. Si deseas saber […]
Reemplazando los Valores Perdidos en Pyt...
En el video Valores Perdidos y Filas Duplicadas en Python te mostré la manera de detectar los valores perdidos dentro de un archivo y cómo podías borrar las filas o las columnas en las que éstos se encontraban. En este video te platicaré acerca de algunas técnicas que se pueden aplicar para calcular los valores […]




