Introducción al análisis de datos con Python

Nombre: ___________________________

Fecha: ____________________________

Puntaje: __________________________

1.

¿Qué devuelve el método .head() de un DataFrame de pandas?

Las primeras 5 filas del DataFrame
Las últimas 5 filas del DataFrame
Una muestra aleatoria de filas
Los nombres de las columnas

Respuesta correcta:

Las primeras 5 filas del DataFrame

2.

El método utilizado para eliminar filas con valores faltantes en un DataFrame de pandas es:

Respuesta: ____________________________________________

Respuesta correcta:

dropna

3.

¿Cuál es la forma correcta de seleccionar una columna llamada 'edad' de un DataFrame df?

df['edad']
df[edad]
df[['edad']]
df.get('edad')

Respuesta correcta:

df['edad']

4.

Para seleccionar filas donde la columna 'puntaje' sea mayor a 50, se utiliza:

df[df['puntaje'] > 50]
df.loc[:, df['puntaje'] > 50]
df.loc('puntaje > 50')
df.filter('puntaje > 50')

Respuesta correcta:

df[df['puntaje'] > 50]

5.

El atributo que devuelve el número de filas y columnas de un DataFrame es:

Respuesta: ____________________________________________

Respuesta correcta:

shape

6.

¿Qué información proporciona el método .describe() aplicado a un DataFrame?

Estadísticas descriptivas de las columnas numéricas
Los tipos de datos de cada columna
El número de valores faltantes por columna
Los valores únicos de cada columna

Respuesta correcta:

Estadísticas descriptivas de las columnas numéricas

7.

¿Cuál función de matplotlib crea una nueva figura?

plt.plot()
plt.figure()
plt.subplot()
plt.show()

Respuesta correcta:

plt.figure()

8.

Para importar pandas con el alias común se escribe: import pandas as ___

Respuesta: ____________________________________________

Respuesta correcta:

9.

¿Cuál de las siguientes NO es una forma válida de crear un DataFrame en pandas?

A partir de un diccionario de listas
A partir de una lista de diccionarios
A partir de un archivo CSV
A partir de una cadena de texto usando pd.StringData()

Respuesta correcta:

A partir de una cadena de texto usando pd.StringData()

10.

Después de aplicar .groupby() a un DataFrame, ¿qué método devuelve directamente la media de cada grupo?

.mean()
.apply(np.mean)
.agg('count')
.transform('mean')

Respuesta correcta:

.mean()

11.

La función de matplotlib que muestra el gráfico en pantalla es:

Respuesta: ____________________________________________

Respuesta correcta:

plt.show()

12.

Para crear un gráfico de líneas con datos x e y, se utiliza:

plt.scatter(x, y)
plt.plot(x, y)
plt.bar(x, y)
plt.hist(x)

Respuesta correcta:

plt.plot(x, y)

13.

En matplotlib, el parámetro 'alpha' controla:

El ancho de la línea
El color de relleno
La transparencia
El tamaño del marcador

Respuesta correcta:

La transparencia

14.

El método de pandas para renombrar columnas de un DataFrame es:

Respuesta: ____________________________________________

Respuesta correcta:

rename

15.

¿Cuál de los siguientes comandos fusiona correctamente dos DataFrames df1 y df2 por la columna 'id'?

pd.merge(df1, df2, on='id')
df1.merge(df2, on='id', how='cross')
df1.join(df2, on='id')
pd.concat([df1, df2], axis=1)

Respuesta correcta:

pd.merge(df1, df2, on='id')

16.

Para añadir un título a un gráfico de matplotlib, se usa:

plt.xlabel('Título')
plt.ylabel('Título')
plt.title('Título')
plt.legend('Título')

Respuesta correcta:

plt.title('Título')

17.

La función de pandas para leer un archivo CSV se escribe:

Respuesta: ____________________________________________

Respuesta correcta:

pd.read_csv()

18.

¿Qué devuelve el método .value_counts() aplicado a una Serie de pandas?

La frecuencia de cada valor único
La suma de todos los valores
La suma acumulativa de los valores
El promedio de los valores

Respuesta correcta:

La frecuencia de cada valor único

19.

¿Cuál función de matplotlib se usa para crear una figura y un conjunto de subgráficos?

plt.subplots()
plt.subplot()
plt.figure()
plt.axes()

Respuesta correcta:

plt.subplots()

20.

En el método .plot() de pandas, el parámetro 'kind' controla:

El color del gráfico
El tipo de gráfico (línea, barra, etc.)
El tamaño de la figura
La leyenda del gráfico

Respuesta correcta:

El tipo de gráfico (línea, barra, etc.)

Respuestas

A.
Las primeras 5 filas del DataFrame
dropna
A.
df['edad']
A.
df[df['puntaje'] > 50]
shape
A.
Estadísticas descriptivas de las columnas numéricas
B.
plt.figure()
pd
D.
A partir de una cadena de texto usando pd.StringData()
A.
.mean()
plt.show()
B.
plt.plot(x, y)
C.
La transparencia
rename
A.
pd.merge(df1, df2, on='id')
C.
plt.title('Título')
pd.read_csv()
A.
La frecuencia de cada valor único
A.
plt.subplots()
B.
El tipo de gráfico (línea, barra, etc.)