Introducción al análisis de datos con Python
Nombre: ___________________________
Fecha: ____________________________
Puntaje: __________________________
1.
¿Qué devuelve el método .head() de un DataFrame de pandas?
Las primeras 5 filas del DataFrame
Las últimas 5 filas del DataFrame
Una muestra aleatoria de filas
Los nombres de las columnas
Las primeras 5 filas del DataFrame
2.
El método utilizado para eliminar filas con valores faltantes en un DataFrame de pandas es:
Respuesta: ____________________________________________
dropna
3.
¿Cuál es la forma correcta de seleccionar una columna llamada 'edad' de un DataFrame df?
df['edad']
df[edad]
df[['edad']]
df.get('edad')
df['edad']
4.
Para seleccionar filas donde la columna 'puntaje' sea mayor a 50, se utiliza:
df[df['puntaje'] > 50]
df.loc[:, df['puntaje'] > 50]
df.loc('puntaje > 50')
df.filter('puntaje > 50')
df[df['puntaje'] > 50]
5.
El atributo que devuelve el número de filas y columnas de un DataFrame es:
Respuesta: ____________________________________________
shape
6.
¿Qué información proporciona el método .describe() aplicado a un DataFrame?
Estadísticas descriptivas de las columnas numéricas
Los tipos de datos de cada columna
El número de valores faltantes por columna
Los valores únicos de cada columna
Estadísticas descriptivas de las columnas numéricas
7.
¿Cuál función de matplotlib crea una nueva figura?
plt.plot()
plt.figure()
plt.subplot()
plt.show()
plt.figure()
8.
Para importar pandas con el alias común se escribe: import pandas as ___
Respuesta: ____________________________________________
pd
9.
¿Cuál de las siguientes NO es una forma válida de crear un DataFrame en pandas?
A partir de un diccionario de listas
A partir de una lista de diccionarios
A partir de un archivo CSV
A partir de una cadena de texto usando pd.StringData()
A partir de una cadena de texto usando pd.StringData()
10.
Después de aplicar .groupby() a un DataFrame, ¿qué método devuelve directamente la media de cada grupo?
.mean()
.apply(np.mean)
.agg('count')
.transform('mean')
.mean()
11.
La función de matplotlib que muestra el gráfico en pantalla es:
Respuesta: ____________________________________________
plt.show()
12.
Para crear un gráfico de líneas con datos x e y, se utiliza:
plt.scatter(x, y)
plt.plot(x, y)
plt.bar(x, y)
plt.hist(x)
plt.plot(x, y)
13.
En matplotlib, el parámetro 'alpha' controla:
El ancho de la línea
El color de relleno
La transparencia
El tamaño del marcador
La transparencia
14.
El método de pandas para renombrar columnas de un DataFrame es:
Respuesta: ____________________________________________
rename
15.
¿Cuál de los siguientes comandos fusiona correctamente dos DataFrames df1 y df2 por la columna 'id'?
pd.merge(df1, df2, on='id')
df1.merge(df2, on='id', how='cross')
df1.join(df2, on='id')
pd.concat([df1, df2], axis=1)
pd.merge(df1, df2, on='id')
16.
Para añadir un título a un gráfico de matplotlib, se usa:
plt.xlabel('Título')
plt.ylabel('Título')
plt.title('Título')
plt.legend('Título')
plt.title('Título')
17.
La función de pandas para leer un archivo CSV se escribe:
Respuesta: ____________________________________________
pd.read_csv()
18.
¿Qué devuelve el método .value_counts() aplicado a una Serie de pandas?
La frecuencia de cada valor único
La suma de todos los valores
La suma acumulativa de los valores
El promedio de los valores
La frecuencia de cada valor único
19.
¿Cuál función de matplotlib se usa para crear una figura y un conjunto de subgráficos?
plt.subplots()
plt.subplot()
plt.figure()
plt.axes()
plt.subplots()
20.
En el método .plot() de pandas, el parámetro 'kind' controla:
El color del gráfico
El tipo de gráfico (línea, barra, etc.)
El tamaño de la figura
La leyenda del gráfico
El tipo de gráfico (línea, barra, etc.)
Respuestas
-
A.
Las primeras 5 filas del DataFrame
-
dropna
-
A.
df['edad']
-
A.
df[df['puntaje'] > 50]
-
shape
-
A.
Estadísticas descriptivas de las columnas numéricas
-
B.
plt.figure()
-
pd
-
D.
A partir de una cadena de texto usando pd.StringData()
-
A.
.mean()
-
plt.show()
-
B.
plt.plot(x, y)
-
C.
La transparencia
-
rename
-
A.
pd.merge(df1, df2, on='id')
-
C.
plt.title('Título')
-
pd.read_csv()
-
A.
La frecuencia de cada valor único
-
A.
plt.subplots()
-
B.
El tipo de gráfico (línea, barra, etc.)