Aquí se muestran los tipos de las columnas del conjunto de datos con tres metodologías diferentes. La columna 'Tipo general' muestra si las variables son numéricas, de texto, booleanas; la columna 'Tipo general (Python)' muestra el tipo de la variable según la función "dtypes" de Python; las columnas 'Tipo especifico' muestran los tipos de las observaciones de cada columna, incluidos datos faltantes ("nan"), como porcentaje del total.
Seleccionar todos
{% for item in variables_list_2 %}{{ loop.index }} - {{ item }}
{% endfor %}Variable | {% for item in header_list_2 %}{{ item }} | {% endfor %}
---|---|
{{ column }} | {% else %}{{ column }} | {% endif %} {% endfor %}
Contiene las 10 categorías más frecuentes de las columnas tipo texto y presenta el porcentaje dentro del total de observaciones. Incluye valores faltantes.
Seleccionar todos
{% for item in variables_list_3 %}{{ loop.index }} - {{ item }}
{% endfor %}{{ item }} | {% endfor %}|
---|---|
{{ column }} | {% else %}{{ column }} | {% endif %} {% endfor %}
Cada columna muestra los nombres de las filas y columnas que están duplicadas en el conjunto de datos.{{ mensaje_duplicados }}
Contiene información para cada columna de tipo numérico, incluye media, mediana, percentiles, desviación estándar, valores extremos y porcentaje de valores faltantes.
{% if variables_list != None %}Seleccionar todos
{% for item in variables_list %}{{ loop.index }} - {{ item }}
{% endfor %}Variable | {% for item in header_list %}{{ item }} | {% endfor %}
---|---|
{{ column }} | {% else %}{{ column }} | {% endif %} {% endfor %}
La correlación de Pearson es una medida de correlación lineal entre dos variables. Varía entre -1 y 1, donde -1 significa que la correlación entre las variables es negativa y total, 0 que no existe la correlación y 1 que hay correlación positiva total. Se calcula como la división de la covarianza de las dos variables con el producto de las desviaciones estándar de cada variable.
{% if corre_pearson_headers|length > 1 %}* En caso de ver mal los labels del eje x, ajustar el zoom del navegador.
* El conjunto de datos no tiene columnas numéricas para el cálculo de correlaciones
{% endif %}La correlación de Kendall mide la relación entre dos variables ordinales. Varía entre -1 y 1, donde -1 significa que la correlación entre las variables es negativa total, 0 que no existe la correlación y 1 que hay correlación positiva total. Se calcula como la división de los números concordantes menos los discordantes de pares entre las variables con el número total de pares.
{% if corre_kendall_headers|length > 1 %}* En caso de ver mal los labels del eje x, ajustar el zoom del navegador.
* El conjunto de datos no tiene columnas numéricas para el cálculo de correlaciones
{% endif %}La correlación de Spearman es una medida de correlación monotónica que se usa principalmente para medir la relación entre dos variables ordinales. Varía entre -1 y 1, donde -1 significa una correlación monotónica negativa total, 0 que no hay correlación monotónica y 1 que hay una correlación monotónica positiva total. Se calcula como la división de la covarianza de los rangos de cada variable con el producto de las desviaciones estándar de cada variable.
{% if corre_spearman_headers|length > 1 %}* En caso de ver mal los labels del eje x, ajustar el zoom del navegador.
* El conjunto de datos no tiene columnas numéricas para el cálculo de correlaciones
{% endif %}La correlación Cramer V se usas para medir la relación entre dos variables nominales. Varía entre 0 y 1, donde 0 significa que no hay correlación y 1 que la correlación es positiva y total. Se calcula como la raíz cuadrada de la división de estadístico Chi Cuadrado con el mínimo entre el número de filas o columnas y el número total de observaciones.
{% if corre_cramer_headers|length > 1 %}* En caso de ver mal los labels del eje x, ajustar el zoom del navegador.
* El conjunto de datos no tiene columnas categóricas para el cálculo de correlaciones
{% endif %}Esta correlación se calcula con el módulo Phik de Python. ver más detalles
{% if corre_phik_headers|length > 1 %}* En caso de ver mal los labels del eje x, ajustar el zoom del navegador.
* El conjunto de datos no tiene columnas categóricas para el cálculo de correlaciones
{% endif %}