Introducción al análisis de datos con Python
Nombre: ___________________________
Fecha: ____________________________
Puntaje: __________________________
1.
¿Qué devuelve el método .head() de un DataFrame de pandas?
Las primeras 5 filas del DataFrame
Las últimas 5 filas del DataFrame
Una muestra aleatoria de filas
Los nombres de las columnas
2.
El método utilizado para eliminar filas con valores faltantes en un DataFrame de pandas es:
Respuesta: ____________________________________________
3.
¿Cuál es la forma correcta de seleccionar una columna llamada 'edad' de un DataFrame df?
df['edad']
df[edad]
df[['edad']]
df.get('edad')
4.
Para seleccionar filas donde la columna 'puntaje' sea mayor a 50, se utiliza:
df[df['puntaje'] > 50]
df.loc[:, df['puntaje'] > 50]
df.loc('puntaje > 50')
df.filter('puntaje > 50')
5.
El atributo que devuelve el número de filas y columnas de un DataFrame es:
Respuesta: ____________________________________________
6.
¿Qué información proporciona el método .describe() aplicado a un DataFrame?
Estadísticas descriptivas de las columnas numéricas
Los tipos de datos de cada columna
El número de valores faltantes por columna
Los valores únicos de cada columna
7.
¿Cuál función de matplotlib crea una nueva figura?
plt.plot()
plt.figure()
plt.subplot()
plt.show()
8.
Para importar pandas con el alias común se escribe: import pandas as ___
Respuesta: ____________________________________________
9.
¿Cuál de las siguientes NO es una forma válida de crear un DataFrame en pandas?
A partir de un diccionario de listas
A partir de una lista de diccionarios
A partir de un archivo CSV
A partir de una cadena de texto usando pd.StringData()
10.
Después de aplicar .groupby() a un DataFrame, ¿qué método devuelve directamente la media de cada grupo?
.mean()
.apply(np.mean)
.agg('count')
.transform('mean')
11.
La función de matplotlib que muestra el gráfico en pantalla es:
Respuesta: ____________________________________________
12.
Para crear un gráfico de líneas con datos x e y, se utiliza:
plt.scatter(x, y)
plt.plot(x, y)
plt.bar(x, y)
plt.hist(x)
13.
En matplotlib, el parámetro 'alpha' controla:
El ancho de la línea
El color de relleno
La transparencia
El tamaño del marcador
14.
El método de pandas para renombrar columnas de un DataFrame es:
Respuesta: ____________________________________________
15.
¿Cuál de los siguientes comandos fusiona correctamente dos DataFrames df1 y df2 por la columna 'id'?
pd.merge(df1, df2, on='id')
df1.merge(df2, on='id', how='cross')
df1.join(df2, on='id')
pd.concat([df1, df2], axis=1)
16.
Para añadir un título a un gráfico de matplotlib, se usa:
plt.xlabel('Título')
plt.ylabel('Título')
plt.title('Título')
plt.legend('Título')
17.
La función de pandas para leer un archivo CSV se escribe:
Respuesta: ____________________________________________
18.
¿Qué devuelve el método .value_counts() aplicado a una Serie de pandas?
La frecuencia de cada valor único
La suma de todos los valores
La suma acumulativa de los valores
El promedio de los valores
19.
¿Cuál función de matplotlib se usa para crear una figura y un conjunto de subgráficos?
plt.subplots()
plt.subplot()
plt.figure()
plt.axes()
20.
En el método .plot() de pandas, el parámetro 'kind' controla:
El color del gráfico
El tipo de gráfico (línea, barra, etc.)
El tamaño de la figura
La leyenda del gráfico