\n"
+ ],
+ "application/vnd.google.colaboratory.intrinsic+json": {
+ "type": "dataframe",
+ "variable_name": "pacientes",
+ "summary": "{\n \"name\": \"pacientes\",\n \"rows\": 21,\n \"fields\": [\n {\n \"column\": \"Ident\",\n \"properties\": {\n \"dtype\": \"number\",\n \"std\": 6,\n \"min\": 1,\n \"max\": 21,\n \"num_unique_values\": 21,\n \"samples\": [\n 1,\n 18,\n 16\n ],\n \"semantic_type\": \"\",\n \"description\": \"\"\n }\n },\n {\n \"column\": \"Idade\",\n \"properties\": {\n \"dtype\": \"number\",\n \"std\": 16,\n \"min\": 17,\n \"max\": 73,\n \"num_unique_values\": 15,\n \"samples\": [\n 54,\n 73,\n 58\n ],\n \"semantic_type\": \"\",\n \"description\": \"\"\n }\n },\n {\n \"column\": \"Altura\",\n \"properties\": {\n \"dtype\": \"number\",\n \"std\": 0.08453514343863432,\n \"min\": 1.56,\n \"max\": 1.94,\n \"num_unique_values\": 16,\n \"samples\": [\n 1.8,\n 1.68,\n 1.76\n ],\n \"semantic_type\": \"\",\n \"description\": \"\"\n }\n },\n {\n \"column\": \"Peso\",\n \"properties\": {\n \"dtype\": \"number\",\n \"std\": 12.375115199079005,\n \"min\": 60.8,\n \"max\": 106.7,\n \"num_unique_values\": 21,\n \"samples\": [\n 76.1,\n 99.3,\n 106.7\n ],\n \"semantic_type\": \"\",\n \"description\": \"\"\n }\n },\n {\n \"column\": \"Pulsacao\",\n \"properties\": {\n \"dtype\": \"number\",\n \"std\": 11,\n \"min\": 56,\n \"max\": 96,\n \"num_unique_values\": 9,\n \"samples\": [\n 56,\n 64,\n 76\n ],\n \"semantic_type\": \"\",\n \"description\": \"\"\n }\n },\n {\n \"column\": \"Sistolica\",\n \"properties\": {\n \"dtype\": \"number\",\n \"std\": 11,\n \"min\": 107,\n \"max\": 153,\n \"num_unique_values\": 13,\n \"samples\": [\n 121,\n 119,\n 125\n ],\n \"semantic_type\": \"\",\n \"description\": \"\"\n }\n },\n {\n \"column\": \"Diastolica\",\n \"properties\": {\n \"dtype\": \"number\",\n \"std\": 10,\n \"min\": 44,\n \"max\": 87,\n \"num_unique_values\": 17,\n \"samples\": [\n 78,\n 54,\n 83\n ],\n \"semantic_type\": \"\",\n \"description\": \"\"\n }\n },\n {\n \"column\": \"Colesterol\",\n \"properties\": {\n \"dtype\": \"number\",\n \"std\": 250,\n \"min\": 49,\n \"max\": 972,\n \"num_unique_values\": 20,\n \"samples\": [\n 522,\n 138,\n 972\n ],\n \"semantic_type\": \"\",\n \"description\": \"\"\n }\n },\n {\n \"column\": \"IMC\",\n \"properties\": {\n \"dtype\": \"number\",\n \"std\": 3.6657747833036276,\n \"min\": 19.7,\n \"max\": 32.8,\n \"num_unique_values\": 19,\n \"samples\": [\n 23.5,\n 21.3,\n 24.9\n ],\n \"semantic_type\": \"\",\n \"description\": \"\"\n }\n }\n ]\n}"
+ }
+ },
+ "metadata": {},
+ "execution_count": 1
+ }
+ ]
+ },
+ {
+ "cell_type": "code",
+ "metadata": {
+ "id": "WLnGnhW2G55q",
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "outputId": "be80df5f-6d74-48ef-e56b-cb45dbee5242"
+ },
+ "source": [
+ "# Note a coluna Dtype que mostra os tipos de dados (int64 - inteiro; float64 - real)\n",
+ "pacientes.info()"
+ ],
+ "execution_count": null,
+ "outputs": [
+ {
+ "output_type": "stream",
+ "name": "stdout",
+ "text": [
+ "\n",
+ "RangeIndex: 21 entries, 0 to 20\n",
+ "Data columns (total 9 columns):\n",
+ " # Column Non-Null Count Dtype \n",
+ "--- ------ -------------- ----- \n",
+ " 0 Ident 21 non-null int64 \n",
+ " 1 Idade 21 non-null int64 \n",
+ " 2 Altura 21 non-null float64\n",
+ " 3 Peso 21 non-null float64\n",
+ " 4 Pulsacao 21 non-null int64 \n",
+ " 5 Sistolica 21 non-null int64 \n",
+ " 6 Diastolica 21 non-null int64 \n",
+ " 7 Colesterol 21 non-null int64 \n",
+ " 8 IMC 21 non-null float64\n",
+ "dtypes: float64(3), int64(6)\n",
+ "memory usage: 1.6 KB\n"
+ ]
+ }
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "qrQ5YhV8gOmX"
+ },
+ "source": [
+ "## Medidas de Tendência Central\n",
+ "A partir dos dados dos pacientes podemos querer saber como vai a saúde deste grupo. Se a lista for muito grande, torna-se complicado analisar um a um. Um primeiro passo é analisar informações que sumarizam (resumem) os dados e então verificar se é possível tirar conclusões. Em geral, podemos ter uma boa ideia disso analisando a tendência central.\n",
+ "\n",
+ "Uma **tendência central** (ou, normalmente, uma medida de tendência central) é um valor central ou valor típico para um certo atributo. As medidas de tendência central mais comuns são:\n",
+ "\n",
+ "- **Média aritmética** (ou simplesmente, média) - obtida pela soma de todas as medições divididas pelo número de observações no conjunto de dados.\n",
+ "- **Mediana** - obtida a partir dos dados ordenados, encontrando-se o valor (pertencente ou não à amostra) que a divide ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana.\n",
+ "- **Moda** - valor que aparece com maior frequência no conjunto de dados.\n",
+ "\n",
+ "O Pandas tem funções pré-definidas que calculam essas medidas de tendência central:"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "ZlMdvKC-k5cR"
+ },
+ "source": [
+ "### Média\n",
+ "\n",
+ "Por exemplo, para calcular a média das avaliações, podemos usar a função `mean`, que calcula a média de cada coluna da base de dados."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "metadata": {
+ "id": "jNoSbTpReeib",
+ "colab": {
+ "base_uri": "https://localhost:8080/",
+ "height": 366
+ },
+ "outputId": "d0667e99-1b88-4d15-d9d9-0a1f56c317ff"
+ },
+ "source": [
+ "## média aritimética\n",
+ "pacientes.mean()"
+ ],
+ "execution_count": null,
+ "outputs": [
+ {
+ "output_type": "execute_result",
+ "data": {
+ "text/plain": [
+ "Ident 11.000000\n",
+ "Idade 36.476190\n",
+ "Altura 1.731905\n",
+ "Peso 77.904762\n",
+ "Pulsacao 72.761905\n",
+ "Sistolica 119.952381\n",
+ "Diastolica 73.428571\n",
+ "Colesterol 338.285714\n",
+ "IMC 25.976190\n",
+ "dtype: float64"
+ ],
+ "text/html": [
+ "
\n",
+ "\n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
\n",
+ "
0
\n",
+ "
\n",
+ " \n",
+ " \n",
+ "
\n",
+ "
Ident
\n",
+ "
11.000000
\n",
+ "
\n",
+ "
\n",
+ "
Idade
\n",
+ "
36.476190
\n",
+ "
\n",
+ "
\n",
+ "
Altura
\n",
+ "
1.731905
\n",
+ "
\n",
+ "
\n",
+ "
Peso
\n",
+ "
77.904762
\n",
+ "
\n",
+ "
\n",
+ "
Pulsacao
\n",
+ "
72.761905
\n",
+ "
\n",
+ "
\n",
+ "
Sistolica
\n",
+ "
119.952381
\n",
+ "
\n",
+ "
\n",
+ "
Diastolica
\n",
+ "
73.428571
\n",
+ "
\n",
+ "
\n",
+ "
Colesterol
\n",
+ "
338.285714
\n",
+ "
\n",
+ "
\n",
+ "
IMC
\n",
+ "
25.976190
\n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
"
+ ]
+ },
+ "metadata": {},
+ "execution_count": 2
+ }
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "Gx0QuEN6lFaF"
+ },
+ "source": [
+ "A instrução acima, aplicada ao `dataframe` mostra a média de todos os atributos. Mas por exemplo, não faz sentido calcular a média do atributo \"Ident\" (código do paciente).\n",
+ "\n",
+ "Além disso, normalmente queremos analisar a média de um determinado atributo que queremos investigar.\n",
+ "\n"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "tnWUGJd5b5NB"
+ },
+ "source": [
+ "#### Média especificando o atributo\n",
+ "\n",
+ "Para calcular a média de um atributo específico, como a pressão sistólica, devemos especificar o nome do atributo.\n",
+ "\n",
+ "Pode-se usar essa notação a seguir, com o atributo entre colchetes: **`[Sistolica]`**"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "metadata": {
+ "id": "nSBXLZRNb-9l",
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "outputId": "a19b677c-8f2c-47b8-ecee-361598f32360"
+ },
+ "source": [
+ "#média da pressão sistólica\n",
+ "pacientes[\"Sistolica\"].mean()\n"
+ ],
+ "execution_count": null,
+ "outputs": [
+ {
+ "output_type": "execute_result",
+ "data": {
+ "text/plain": [
+ "np.float64(119.95238095238095)"
+ ]
+ },
+ "metadata": {},
+ "execution_count": 3
+ }
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "aq2mJxvRBcwp"
+ },
+ "source": [
+ "Outra notação, um pouco mais simples é usar o nome do atributo direto (sem os colchetes, mas com um ponto extra): **`.Sistolica`**"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "metadata": {
+ "id": "Geq-izIoTj2Y",
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "outputId": "b0c783aa-c406-495e-9242-bf3fd05dbf37"
+ },
+ "source": [
+ "# Outra possibilidade de obtenção da média de um determinado atributo\n",
+ "pacientes.Sistolica.mean()"
+ ],
+ "execution_count": null,
+ "outputs": [
+ {
+ "output_type": "execute_result",
+ "data": {
+ "text/plain": [
+ "np.float64(119.95238095238095)"
+ ]
+ },
+ "metadata": {},
+ "execution_count": 4
+ }
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "Hyq03z6TuVrO"
+ },
+ "source": [
+ "O Python permite-nos restringir o número de casas decimais, usando o print com formatação. Veja o exemplo a seguir:\n",
+ "* \"%.2f\" (entre aspas) indica que são 2 casas decimais\n",
+ "* Note que há % entre o formato (\"%.2f\") e o que será exibido (pacientes.Sistolica.mean()) no respectivo formato."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "metadata": {
+ "id": "jG4s2dTruHdz",
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "outputId": "9c270c43-2ded-44f1-d2b3-870191d12f4a"
+ },
+ "source": [
+ "# imprimindo com 2 casas decimais: .2\n",
+ "print(\"%.2f\" % pacientes.Sistolica.mean())"
+ ],
+ "execution_count": null,
+ "outputs": [
+ {
+ "output_type": "stream",
+ "name": "stdout",
+ "text": [
+ "119.95\n"
+ ]
+ }
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "F6HyGJoFv1NY"
+ },
+ "source": [
+ "Outra possibilidade é atribuir o resultado para uma variável (por exemplo, media) antes de mostrar na tela (com o `print`)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "metadata": {
+ "id": "lZ6SoV6lwCzD",
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "outputId": "9ef98768-d759-426e-be99-5c640bde8418"
+ },
+ "source": [
+ "# atribuindo a média para uma variável\n",
+ "media = pacientes.Sistolica.mean()\n",
+ "# imprimindo com 2 casas decimais: .2\n",
+ "print(\"%.2f\" % media)"
+ ],
+ "execution_count": null,
+ "outputs": [
+ {
+ "output_type": "stream",
+ "name": "stdout",
+ "text": [
+ "119.95\n"
+ ]
+ }
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "QZ0fcVkqYiyS"
+ },
+ "source": [
+ "Para tentar analisar o significado dessa média, podemos verificar os valores extremos de `Sistolica `(maior e menor)."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "metadata": {
+ "id": "B0wLr6AZYNuI",
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "outputId": "8e1cdba1-d199-4a4b-9740-1fb0e080f95c"
+ },
+ "source": [
+ "# Maior Valor de Pressão Sistólica\n",
+ "pacientes.Sistolica.max()"
+ ],
+ "execution_count": null,
+ "outputs": [
+ {
+ "output_type": "execute_result",
+ "data": {
+ "text/plain": [
+ "153"
+ ]
+ },
+ "metadata": {},
+ "execution_count": 7
+ }
+ ]
+ },
+ {
+ "cell_type": "code",
+ "metadata": {
+ "id": "XUADVExgYvvL",
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "outputId": "9a12d43b-eef8-455c-ef8c-8ee9f45b32de"
+ },
+ "source": [
+ "# Menor Valor de Pressão Sistólica\n",
+ "pacientes.Sistolica.min()"
+ ],
+ "execution_count": null,
+ "outputs": [
+ {
+ "output_type": "execute_result",
+ "data": {
+ "text/plain": [
+ "107"
+ ]
+ },
+ "metadata": {},
+ "execution_count": 8
+ }
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "pYbYdl3qY1P7"
+ },
+ "source": [
+ "Nota-se uma variação razoável entre a média `mean()` (119.95) , a maior `max()`pressão sistólica (153) e a menor `min()` pressão sistólica (107). Poderemos entender melhor esta variação, mais adiante, com as medidas de dispersão. Mas antes disso, vamos ver as outras medidas de tendência central."
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "ouEm0eQ5cCQ-"
+ },
+ "source": [
+ "### Mediana\n",
+ "\n",
+ "A mediana pode ser calculada usando a função `median`:"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "metadata": {
+ "id": "_3AW3ND2fnQZ",
+ "colab": {
+ "base_uri": "https://localhost:8080/",
+ "height": 366
+ },
+ "outputId": "612c5085-2cb4-44ff-878a-e28493ed4b59"
+ },
+ "source": [
+ "# mediana\n",
+ "pacientes.median()"
+ ],
+ "execution_count": null,
+ "outputs": [
+ {
+ "output_type": "execute_result",
+ "data": {
+ "text/plain": [
+ "Ident 11.00\n",
+ "Idade 32.00\n",
+ "Altura 1.73\n",
+ "Peso 76.10\n",
+ "Pulsacao 72.00\n",
+ "Sistolica 119.00\n",
+ "Diastolica 76.00\n",
+ "Colesterol 265.00\n",
+ "IMC 26.00\n",
+ "dtype: float64"
+ ],
+ "text/html": [
+ "
\n",
+ "\n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
\n",
+ "
0
\n",
+ "
\n",
+ " \n",
+ " \n",
+ "
\n",
+ "
Ident
\n",
+ "
11.00
\n",
+ "
\n",
+ "
\n",
+ "
Idade
\n",
+ "
32.00
\n",
+ "
\n",
+ "
\n",
+ "
Altura
\n",
+ "
1.73
\n",
+ "
\n",
+ "
\n",
+ "
Peso
\n",
+ "
76.10
\n",
+ "
\n",
+ "
\n",
+ "
Pulsacao
\n",
+ "
72.00
\n",
+ "
\n",
+ "
\n",
+ "
Sistolica
\n",
+ "
119.00
\n",
+ "
\n",
+ "
\n",
+ "
Diastolica
\n",
+ "
76.00
\n",
+ "
\n",
+ "
\n",
+ "
Colesterol
\n",
+ "
265.00
\n",
+ "
\n",
+ "
\n",
+ "
IMC
\n",
+ "
26.00
\n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
"
+ ]
+ },
+ "metadata": {},
+ "execution_count": 9
+ }
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "Hzdo1N7MXzgs"
+ },
+ "source": [
+ "#### Mediana especificando o atributo\n",
+ "Calculando a mediana somente do atributo `Idade`"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "metadata": {
+ "id": "7FaXpfkfX5y8",
+ "colab": {
+ "base_uri": "https://localhost:8080/"
+ },
+ "outputId": "24a71938-187a-4143-c9b1-364741bd3750"
+ },
+ "source": [
+ "pacientes.Sistolica.median()"
+ ],
+ "execution_count": null,
+ "outputs": [
+ {
+ "output_type": "execute_result",
+ "data": {
+ "text/plain": [
+ "119.0"
+ ]
+ },
+ "metadata": {},
+ "execution_count": 10
+ }
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "UOd2sDYVowjn"
+ },
+ "source": [
+ "Nesse caso, os valores da média e da mediana não diferem muito (respectivamente 119.95 e 119), e ambos poderiam ser usados como um representante da tendência central do atributo `Sistólica`. Vale lembrar, que mesmo havendo valores extremos de `Sistolica` (mínimo = 107 e máximo = 153) razoavelmente distantes da Média (119.95), ainda assim a Média e Mediana são valores próximos.\n",
+ "\n",
+ "Na presença de valores extremos, a mediana pode ser uma medida **menos sensível** a presença desses valores.\n",
+ "\n"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "HLS4F9mGcHZ1"
+ },
+ "source": [
+ "### Moda\n",
+ "\n",
+ "A moda representa o valor que mais ocorre na base de dados. A moda pode **não** existir ou pode não ser única."
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "DV6ITz4FELAY"
+ },
+ "source": [
+ "Uma maneira de obter esse valor seria calcular a frequência de cada valor, agrupando os dados.\n",
+ "\n",
+ "Por exemplo, para contar a frequência de cada valor de **pressão Sistólica** poderíamos usar a seguinte instrução:"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "metadata": {
+ "id": "tDKHaozCE4qq",
+ "colab": {
+ "base_uri": "https://localhost:8080/",
+ "height": 523
+ },
+ "outputId": "4338b28c-f204-43e5-9f2c-0cc2023811ca"
+ },
+ "source": [
+ "# Agrupando por Sistolica e contando pelo atributo Sistolica\n",
+ "pacientes.groupby(\"Sistolica\")[\"Sistolica\"].count()"
+ ],
+ "execution_count": null,
+ "outputs": [
+ {
+ "output_type": "execute_result",
+ "data": {
+ "text/plain": [
+ "Sistolica\n",
+ "107 2\n",
+ "109 1\n",
+ "110 3\n",
+ "112 2\n",
+ "113 2\n",
+ "119 1\n",
+ "121 2\n",
+ "125 2\n",
+ "126 2\n",
+ "131 1\n",
+ "132 1\n",
+ "137 1\n",
+ "153 1\n",
+ "Name: Sistolica, dtype: int64"
+ ],
+ "text/html": [
+ "
\n",
+ "\n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
\n",
+ "
Sistolica
\n",
+ "
\n",
+ "
\n",
+ "
Sistolica
\n",
+ "
\n",
+ "
\n",
+ " \n",
+ " \n",
+ "
\n",
+ "
107
\n",
+ "
2
\n",
+ "
\n",
+ "
\n",
+ "
109
\n",
+ "
1
\n",
+ "
\n",
+ "
\n",
+ "
110
\n",
+ "
3
\n",
+ "
\n",
+ "
\n",
+ "
112
\n",
+ "
2
\n",
+ "
\n",
+ "
\n",
+ "
113
\n",
+ "
2
\n",
+ "
\n",
+ "
\n",
+ "
119
\n",
+ "
1
\n",
+ "
\n",
+ "
\n",
+ "
121
\n",
+ "
2
\n",
+ "
\n",
+ "
\n",
+ "
125
\n",
+ "
2
\n",
+ "
\n",
+ "
\n",
+ "
126
\n",
+ "
2
\n",
+ "
\n",
+ "
\n",
+ "
131
\n",
+ "
1
\n",
+ "
\n",
+ "
\n",
+ "
132
\n",
+ "
1
\n",
+ "
\n",
+ "
\n",
+ "
137
\n",
+ "
1
\n",
+ "
\n",
+ "
\n",
+ "
153
\n",
+ "
1
\n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
"
+ ]
+ },
+ "metadata": {},
+ "execution_count": 11
+ }
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "oLffXN58FFST"
+ },
+ "source": [
+ "Note acima que, **Sistolica = 110** é o valor que ocorre mais vezes (3 vezes). Então, neste caso a moda é 110."
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {
+ "id": "xhQPa3zcFeqD"
+ },
+ "source": [
+ "Mas o Pandas, possui a função `mode` para calcular a moda:"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "metadata": {
+ "id": "NfJBPAVojpoB",
+ "colab": {
+ "base_uri": "https://localhost:8080/",
+ "height": 708
+ },
+ "outputId": "e068f71c-078c-4feb-ed68-557bc45ccb2f"
+ },
+ "source": [
+ "# moda\n",
+ "pacientes.mode()"
+ ],
+ "execution_count": null,
+ "outputs": [
+ {
+ "output_type": "execute_result",
+ "data": {
+ "text/plain": [
+ " Ident Idade Altura Peso Pulsacao Sistolica Diastolica Colesterol \\\n",
+ "0 1 20.0 1.73 60.8 64.0 110.0 81.0 265.0 \n",
+ "1 2 NaN NaN 61.8 72.0 NaN NaN NaN \n",
+ "2 3 NaN NaN 62.6 NaN NaN NaN NaN \n",
+ "3 4 NaN NaN 64.9 NaN NaN NaN NaN \n",
+ "4 5 NaN NaN 68.1 NaN NaN NaN NaN \n",
+ "5 6 NaN NaN 68.7 NaN NaN NaN NaN \n",
+ "6 7 NaN NaN 70.3 NaN NaN NaN NaN \n",
+ "7 8 NaN NaN 73.9 NaN NaN NaN NaN \n",
+ "8 9 NaN NaN 74.7 NaN NaN NaN NaN \n",
+ "9 10 NaN NaN 75.1 NaN NaN NaN NaN \n",
+ "10 11 NaN NaN 76.1 NaN NaN NaN NaN \n",
+ "11 12 NaN NaN 78.8 NaN NaN NaN NaN \n",
+ "12 13 NaN NaN 79.1 NaN NaN NaN NaN \n",
+ "13 14 NaN NaN 79.5 NaN NaN NaN NaN \n",
+ "14 15 NaN NaN 80.7 NaN NaN NaN NaN \n",
+ "15 16 NaN NaN 84.0 NaN NaN NaN NaN \n",
+ "16 17 NaN NaN 86.0 NaN NaN NaN NaN \n",
+ "17 18 NaN NaN 90.7 NaN NaN NaN NaN \n",
+ "18 19 NaN NaN 94.2 NaN NaN NaN NaN \n",
+ "19 20 NaN NaN 99.3 NaN NaN NaN NaN \n",
+ "20 21 NaN NaN 106.7 NaN NaN NaN NaN \n",
+ "\n",
+ " IMC \n",
+ "0 24.3 \n",
+ "1 32.8 \n",
+ "2 NaN \n",
+ "3 NaN \n",
+ "4 NaN \n",
+ "5 NaN \n",
+ "6 NaN \n",
+ "7 NaN \n",
+ "8 NaN \n",
+ "9 NaN \n",
+ "10 NaN \n",
+ "11 NaN \n",
+ "12 NaN \n",
+ "13 NaN \n",
+ "14 NaN \n",
+ "15 NaN \n",
+ "16 NaN \n",
+ "17 NaN \n",
+ "18 NaN \n",
+ "19 NaN \n",
+ "20 NaN "
+ ],
+ "text/html": [
+ "\n",
+ "