{ "cells": [ { "cell_type": "code", "execution_count": 1, "id": "1fc0602c", "metadata": {}, "outputs": [ { "data": { "text/html": [ "\n", "\n", "\n", "\t\n", "\t\n", "\n", "\n", "\t\n", "\t\n", "\t\n", "\n", "
A data.frame: 3 × 5
Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies
<dbl><dbl><dbl><dbl><fct>
15.13.51.40.2setosa
24.93.01.40.2setosa
34.73.21.30.2setosa
\n" ], "text/latex": [ "A data.frame: 3 × 5\n", "\\begin{tabular}{r|lllll}\n", " & Sepal.Length & Sepal.Width & Petal.Length & Petal.Width & Species\\\\\n", " & & & & & \\\\\n", "\\hline\n", "\t1 & 5.1 & 3.5 & 1.4 & 0.2 & setosa\\\\\n", "\t2 & 4.9 & 3.0 & 1.4 & 0.2 & setosa\\\\\n", "\t3 & 4.7 & 3.2 & 1.3 & 0.2 & setosa\\\\\n", "\\end{tabular}\n" ], "text/markdown": [ "\n", "A data.frame: 3 × 5\n", "\n", "| | Sepal.Length <dbl> | Sepal.Width <dbl> | Petal.Length <dbl> | Petal.Width <dbl> | Species <fct> |\n", "|---|---|---|---|---|---|\n", "| 1 | 5.1 | 3.5 | 1.4 | 0.2 | setosa |\n", "| 2 | 4.9 | 3.0 | 1.4 | 0.2 | setosa |\n", "| 3 | 4.7 | 3.2 | 1.3 | 0.2 | setosa |\n", "\n" ], "text/plain": [ " Sepal.Length Sepal.Width Petal.Length Petal.Width Species\n", "1 5.1 3.5 1.4 0.2 setosa \n", "2 4.9 3.0 1.4 0.2 setosa \n", "3 4.7 3.2 1.3 0.2 setosa " ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "head( iris,3)" ] }, { "cell_type": "code", "execution_count": 3, "id": "174b6a7a", "metadata": {}, "outputs": [ { "data": { "text/plain": [ " Sepal.Length Sepal.Width Petal.Length Petal.Width \n", " Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 \n", " 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 \n", " Median :5.800 Median :3.000 Median :4.350 Median :1.300 \n", " Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199 \n", " 3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800 \n", " Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500 \n", " Species \n", " setosa :50 \n", " versicolor:50 \n", " virginica :50 \n", " \n", " \n", " " ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "summary(iris)" ] }, { "cell_type": "code", "execution_count": 4, "id": "7a9f6ba9", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "'data.frame':\t150 obs. of 5 variables:\n", " $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...\n", " $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...\n", " $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...\n", " $ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...\n", " $ Species : Factor w/ 3 levels \"setosa\",\"versicolor\",..: 1 1 1 1 1 1 1 1 1 1 ...\n" ] } ], "source": [ "str(iris)" ] }, { "cell_type": "code", "execution_count": 2, "id": "180100d0", "metadata": {}, "outputs": [], "source": [ "copy_iris <- iris" ] }, { "cell_type": "code", "execution_count": 6, "id": "f1d5e444", "metadata": { "collapsed": true }, "outputs": [ { "data": { "text/html": [ "\n", "\n", "\n", "\t\n", "\t\n", "\n", "\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\n", "
A data.frame: 150 × 5
Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies
<dbl><dbl><dbl><dbl><fct>
5.13.51.40.2setosa
4.93.01.40.2setosa
4.73.21.30.2setosa
4.63.11.50.2setosa
5.03.61.40.2setosa
5.43.91.70.4setosa
4.63.41.40.3setosa
5.03.41.50.2setosa
4.42.91.40.2setosa
4.93.11.50.1setosa
5.43.71.50.2setosa
4.83.41.60.2setosa
4.83.01.40.1setosa
4.33.01.10.1setosa
5.84.01.20.2setosa
5.74.41.50.4setosa
5.43.91.30.4setosa
5.13.51.40.3setosa
5.73.81.70.3setosa
5.13.81.50.3setosa
5.43.41.70.2setosa
5.13.71.50.4setosa
4.63.61.00.2setosa
5.13.31.70.5setosa
4.83.41.90.2setosa
5.03.01.60.2setosa
5.03.41.60.4setosa
5.23.51.50.2setosa
5.23.41.40.2setosa
4.73.21.60.2setosa
6.93.25.72.3virginica
5.62.84.92.0virginica
7.72.86.72.0virginica
6.32.74.91.8virginica
6.73.35.72.1virginica
7.23.26.01.8virginica
6.22.84.81.8virginica
6.13.04.91.8virginica
6.42.85.62.1virginica
7.23.05.81.6virginica
7.42.86.11.9virginica
7.93.86.42.0virginica
6.42.85.62.2virginica
6.32.85.11.5virginica
6.12.65.61.4virginica
7.73.06.12.3virginica
6.33.45.62.4virginica
6.43.15.51.8virginica
6.03.04.81.8virginica
6.93.15.42.1virginica
6.73.15.62.4virginica
6.93.15.12.3virginica
5.82.75.11.9virginica
6.83.25.92.3virginica
6.73.35.72.5virginica
6.73.05.22.3virginica
6.32.55.01.9virginica
6.53.05.22.0virginica
6.23.45.42.3virginica
5.93.05.11.8virginica
\n" ], "text/latex": [ "A data.frame: 150 × 5\n", "\\begin{tabular}{lllll}\n", " Sepal.Length & Sepal.Width & Petal.Length & Petal.Width & Species\\\\\n", " & & & & \\\\\n", "\\hline\n", "\t 5.1 & 3.5 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.9 & 3.0 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.7 & 3.2 & 1.3 & 0.2 & setosa\\\\\n", "\t 4.6 & 3.1 & 1.5 & 0.2 & setosa\\\\\n", "\t 5.0 & 3.6 & 1.4 & 0.2 & setosa\\\\\n", "\t 5.4 & 3.9 & 1.7 & 0.4 & setosa\\\\\n", "\t 4.6 & 3.4 & 1.4 & 0.3 & setosa\\\\\n", "\t 5.0 & 3.4 & 1.5 & 0.2 & setosa\\\\\n", "\t 4.4 & 2.9 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.9 & 3.1 & 1.5 & 0.1 & setosa\\\\\n", "\t 5.4 & 3.7 & 1.5 & 0.2 & setosa\\\\\n", "\t 4.8 & 3.4 & 1.6 & 0.2 & setosa\\\\\n", "\t 4.8 & 3.0 & 1.4 & 0.1 & setosa\\\\\n", "\t 4.3 & 3.0 & 1.1 & 0.1 & setosa\\\\\n", "\t 5.8 & 4.0 & 1.2 & 0.2 & setosa\\\\\n", "\t 5.7 & 4.4 & 1.5 & 0.4 & setosa\\\\\n", "\t 5.4 & 3.9 & 1.3 & 0.4 & setosa\\\\\n", "\t 5.1 & 3.5 & 1.4 & 0.3 & setosa\\\\\n", "\t 5.7 & 3.8 & 1.7 & 0.3 & setosa\\\\\n", "\t 5.1 & 3.8 & 1.5 & 0.3 & setosa\\\\\n", "\t 5.4 & 3.4 & 1.7 & 0.2 & setosa\\\\\n", "\t 5.1 & 3.7 & 1.5 & 0.4 & setosa\\\\\n", "\t 4.6 & 3.6 & 1.0 & 0.2 & setosa\\\\\n", "\t 5.1 & 3.3 & 1.7 & 0.5 & setosa\\\\\n", "\t 4.8 & 3.4 & 1.9 & 0.2 & setosa\\\\\n", "\t 5.0 & 3.0 & 1.6 & 0.2 & setosa\\\\\n", "\t 5.0 & 3.4 & 1.6 & 0.4 & setosa\\\\\n", "\t 5.2 & 3.5 & 1.5 & 0.2 & setosa\\\\\n", "\t 5.2 & 3.4 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.7 & 3.2 & 1.6 & 0.2 & setosa\\\\\n", "\t ⋮ & ⋮ & ⋮ & ⋮ & ⋮\\\\\n", "\t 6.9 & 3.2 & 5.7 & 2.3 & virginica\\\\\n", "\t 5.6 & 2.8 & 4.9 & 2.0 & virginica\\\\\n", "\t 7.7 & 2.8 & 6.7 & 2.0 & virginica\\\\\n", "\t 6.3 & 2.7 & 4.9 & 1.8 & virginica\\\\\n", "\t 6.7 & 3.3 & 5.7 & 2.1 & virginica\\\\\n", "\t 7.2 & 3.2 & 6.0 & 1.8 & virginica\\\\\n", "\t 6.2 & 2.8 & 4.8 & 1.8 & virginica\\\\\n", "\t 6.1 & 3.0 & 4.9 & 1.8 & virginica\\\\\n", "\t 6.4 & 2.8 & 5.6 & 2.1 & virginica\\\\\n", "\t 7.2 & 3.0 & 5.8 & 1.6 & virginica\\\\\n", "\t 7.4 & 2.8 & 6.1 & 1.9 & virginica\\\\\n", "\t 7.9 & 3.8 & 6.4 & 2.0 & virginica\\\\\n", "\t 6.4 & 2.8 & 5.6 & 2.2 & virginica\\\\\n", "\t 6.3 & 2.8 & 5.1 & 1.5 & virginica\\\\\n", "\t 6.1 & 2.6 & 5.6 & 1.4 & virginica\\\\\n", "\t 7.7 & 3.0 & 6.1 & 2.3 & virginica\\\\\n", "\t 6.3 & 3.4 & 5.6 & 2.4 & virginica\\\\\n", "\t 6.4 & 3.1 & 5.5 & 1.8 & virginica\\\\\n", "\t 6.0 & 3.0 & 4.8 & 1.8 & virginica\\\\\n", "\t 6.9 & 3.1 & 5.4 & 2.1 & virginica\\\\\n", "\t 6.7 & 3.1 & 5.6 & 2.4 & virginica\\\\\n", "\t 6.9 & 3.1 & 5.1 & 2.3 & virginica\\\\\n", "\t 5.8 & 2.7 & 5.1 & 1.9 & virginica\\\\\n", "\t 6.8 & 3.2 & 5.9 & 2.3 & virginica\\\\\n", "\t 6.7 & 3.3 & 5.7 & 2.5 & virginica\\\\\n", "\t 6.7 & 3.0 & 5.2 & 2.3 & virginica\\\\\n", "\t 6.3 & 2.5 & 5.0 & 1.9 & virginica\\\\\n", "\t 6.5 & 3.0 & 5.2 & 2.0 & virginica\\\\\n", "\t 6.2 & 3.4 & 5.4 & 2.3 & virginica\\\\\n", "\t 5.9 & 3.0 & 5.1 & 1.8 & virginica\\\\\n", "\\end{tabular}\n" ], "text/markdown": [ "\n", "A data.frame: 150 × 5\n", "\n", "| Sepal.Length <dbl> | Sepal.Width <dbl> | Petal.Length <dbl> | Petal.Width <dbl> | Species <fct> |\n", "|---|---|---|---|---|\n", "| 5.1 | 3.5 | 1.4 | 0.2 | setosa |\n", "| 4.9 | 3.0 | 1.4 | 0.2 | setosa |\n", "| 4.7 | 3.2 | 1.3 | 0.2 | setosa |\n", "| 4.6 | 3.1 | 1.5 | 0.2 | setosa |\n", "| 5.0 | 3.6 | 1.4 | 0.2 | setosa |\n", "| 5.4 | 3.9 | 1.7 | 0.4 | setosa |\n", "| 4.6 | 3.4 | 1.4 | 0.3 | setosa |\n", "| 5.0 | 3.4 | 1.5 | 0.2 | setosa |\n", "| 4.4 | 2.9 | 1.4 | 0.2 | setosa |\n", "| 4.9 | 3.1 | 1.5 | 0.1 | setosa |\n", "| 5.4 | 3.7 | 1.5 | 0.2 | setosa |\n", "| 4.8 | 3.4 | 1.6 | 0.2 | setosa |\n", "| 4.8 | 3.0 | 1.4 | 0.1 | setosa |\n", "| 4.3 | 3.0 | 1.1 | 0.1 | setosa |\n", "| 5.8 | 4.0 | 1.2 | 0.2 | setosa |\n", "| 5.7 | 4.4 | 1.5 | 0.4 | setosa |\n", "| 5.4 | 3.9 | 1.3 | 0.4 | setosa |\n", "| 5.1 | 3.5 | 1.4 | 0.3 | setosa |\n", "| 5.7 | 3.8 | 1.7 | 0.3 | setosa |\n", "| 5.1 | 3.8 | 1.5 | 0.3 | setosa |\n", "| 5.4 | 3.4 | 1.7 | 0.2 | setosa |\n", "| 5.1 | 3.7 | 1.5 | 0.4 | setosa |\n", "| 4.6 | 3.6 | 1.0 | 0.2 | setosa |\n", "| 5.1 | 3.3 | 1.7 | 0.5 | setosa |\n", "| 4.8 | 3.4 | 1.9 | 0.2 | setosa |\n", "| 5.0 | 3.0 | 1.6 | 0.2 | setosa |\n", "| 5.0 | 3.4 | 1.6 | 0.4 | setosa |\n", "| 5.2 | 3.5 | 1.5 | 0.2 | setosa |\n", "| 5.2 | 3.4 | 1.4 | 0.2 | setosa |\n", "| 4.7 | 3.2 | 1.6 | 0.2 | setosa |\n", "| ⋮ | ⋮ | ⋮ | ⋮ | ⋮ |\n", "| 6.9 | 3.2 | 5.7 | 2.3 | virginica |\n", "| 5.6 | 2.8 | 4.9 | 2.0 | virginica |\n", "| 7.7 | 2.8 | 6.7 | 2.0 | virginica |\n", "| 6.3 | 2.7 | 4.9 | 1.8 | virginica |\n", "| 6.7 | 3.3 | 5.7 | 2.1 | virginica |\n", "| 7.2 | 3.2 | 6.0 | 1.8 | virginica |\n", "| 6.2 | 2.8 | 4.8 | 1.8 | virginica |\n", "| 6.1 | 3.0 | 4.9 | 1.8 | virginica |\n", "| 6.4 | 2.8 | 5.6 | 2.1 | virginica |\n", "| 7.2 | 3.0 | 5.8 | 1.6 | virginica |\n", "| 7.4 | 2.8 | 6.1 | 1.9 | virginica |\n", "| 7.9 | 3.8 | 6.4 | 2.0 | virginica |\n", "| 6.4 | 2.8 | 5.6 | 2.2 | virginica |\n", "| 6.3 | 2.8 | 5.1 | 1.5 | virginica |\n", "| 6.1 | 2.6 | 5.6 | 1.4 | virginica |\n", "| 7.7 | 3.0 | 6.1 | 2.3 | virginica |\n", "| 6.3 | 3.4 | 5.6 | 2.4 | virginica |\n", "| 6.4 | 3.1 | 5.5 | 1.8 | virginica |\n", "| 6.0 | 3.0 | 4.8 | 1.8 | virginica |\n", "| 6.9 | 3.1 | 5.4 | 2.1 | virginica |\n", "| 6.7 | 3.1 | 5.6 | 2.4 | virginica |\n", "| 6.9 | 3.1 | 5.1 | 2.3 | virginica |\n", "| 5.8 | 2.7 | 5.1 | 1.9 | virginica |\n", "| 6.8 | 3.2 | 5.9 | 2.3 | virginica |\n", "| 6.7 | 3.3 | 5.7 | 2.5 | virginica |\n", "| 6.7 | 3.0 | 5.2 | 2.3 | virginica |\n", "| 6.3 | 2.5 | 5.0 | 1.9 | virginica |\n", "| 6.5 | 3.0 | 5.2 | 2.0 | virginica |\n", "| 6.2 | 3.4 | 5.4 | 2.3 | virginica |\n", "| 5.9 | 3.0 | 5.1 | 1.8 | virginica |\n", "\n" ], "text/plain": [ " Sepal.Length Sepal.Width Petal.Length Petal.Width Species \n", "1 5.1 3.5 1.4 0.2 setosa \n", "2 4.9 3.0 1.4 0.2 setosa \n", "3 4.7 3.2 1.3 0.2 setosa \n", "4 4.6 3.1 1.5 0.2 setosa \n", "5 5.0 3.6 1.4 0.2 setosa \n", "6 5.4 3.9 1.7 0.4 setosa \n", "7 4.6 3.4 1.4 0.3 setosa \n", "8 5.0 3.4 1.5 0.2 setosa \n", "9 4.4 2.9 1.4 0.2 setosa \n", "10 4.9 3.1 1.5 0.1 setosa \n", "11 5.4 3.7 1.5 0.2 setosa \n", "12 4.8 3.4 1.6 0.2 setosa \n", "13 4.8 3.0 1.4 0.1 setosa \n", "14 4.3 3.0 1.1 0.1 setosa \n", "15 5.8 4.0 1.2 0.2 setosa \n", "16 5.7 4.4 1.5 0.4 setosa \n", "17 5.4 3.9 1.3 0.4 setosa \n", "18 5.1 3.5 1.4 0.3 setosa \n", "19 5.7 3.8 1.7 0.3 setosa \n", "20 5.1 3.8 1.5 0.3 setosa \n", "21 5.4 3.4 1.7 0.2 setosa \n", "22 5.1 3.7 1.5 0.4 setosa \n", "23 4.6 3.6 1.0 0.2 setosa \n", "24 5.1 3.3 1.7 0.5 setosa \n", "25 4.8 3.4 1.9 0.2 setosa \n", "26 5.0 3.0 1.6 0.2 setosa \n", "27 5.0 3.4 1.6 0.4 setosa \n", "28 5.2 3.5 1.5 0.2 setosa \n", "29 5.2 3.4 1.4 0.2 setosa \n", "30 4.7 3.2 1.6 0.2 setosa \n", "⋮ ⋮ ⋮ ⋮ ⋮ ⋮ \n", "121 6.9 3.2 5.7 2.3 virginica\n", "122 5.6 2.8 4.9 2.0 virginica\n", "123 7.7 2.8 6.7 2.0 virginica\n", "124 6.3 2.7 4.9 1.8 virginica\n", "125 6.7 3.3 5.7 2.1 virginica\n", "126 7.2 3.2 6.0 1.8 virginica\n", "127 6.2 2.8 4.8 1.8 virginica\n", "128 6.1 3.0 4.9 1.8 virginica\n", "129 6.4 2.8 5.6 2.1 virginica\n", "130 7.2 3.0 5.8 1.6 virginica\n", "131 7.4 2.8 6.1 1.9 virginica\n", "132 7.9 3.8 6.4 2.0 virginica\n", "133 6.4 2.8 5.6 2.2 virginica\n", "134 6.3 2.8 5.1 1.5 virginica\n", "135 6.1 2.6 5.6 1.4 virginica\n", "136 7.7 3.0 6.1 2.3 virginica\n", "137 6.3 3.4 5.6 2.4 virginica\n", "138 6.4 3.1 5.5 1.8 virginica\n", "139 6.0 3.0 4.8 1.8 virginica\n", "140 6.9 3.1 5.4 2.1 virginica\n", "141 6.7 3.1 5.6 2.4 virginica\n", "142 6.9 3.1 5.1 2.3 virginica\n", "143 5.8 2.7 5.1 1.9 virginica\n", "144 6.8 3.2 5.9 2.3 virginica\n", "145 6.7 3.3 5.7 2.5 virginica\n", "146 6.7 3.0 5.2 2.3 virginica\n", "147 6.3 2.5 5.0 1.9 virginica\n", "148 6.5 3.0 5.2 2.0 virginica\n", "149 6.2 3.4 5.4 2.3 virginica\n", "150 5.9 3.0 5.1 1.8 virginica" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "copy_iris" ] }, { "cell_type": "code", "execution_count": 12, "id": "04796792", "metadata": {}, "outputs": [ { "data": { "text/html": [ "\n", "
  1. 150
  2. 5
\n" ], "text/latex": [ "\\begin{enumerate*}\n", "\\item 150\n", "\\item 5\n", "\\end{enumerate*}\n" ], "text/markdown": [ "1. 150\n", "2. 5\n", "\n", "\n" ], "text/plain": [ "[1] 150 5" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "dim( copy_iris)" ] }, { "cell_type": "code", "execution_count": 17, "id": "8310582d", "metadata": {}, "outputs": [ { "data": { "text/html": [ "\n", "
  1. 92
  2. 12
  3. 129
  4. 85
  5. 101
  6. 131
  7. 125
  8. 70
  9. 7
  10. 18
  11. 146
  12. 27
  13. 29
  14. 143
  15. 22
  16. 139
  17. 115
  18. 82
  19. 36
  20. 30
  21. 120
  22. 135
  23. 3
  24. 40
  25. 127
  26. 51
  27. 10
  28. 121
  29. 50
  30. 47
\n" ], "text/latex": [ "\\begin{enumerate*}\n", "\\item 92\n", "\\item 12\n", "\\item 129\n", "\\item 85\n", "\\item 101\n", "\\item 131\n", "\\item 125\n", "\\item 70\n", "\\item 7\n", "\\item 18\n", "\\item 146\n", "\\item 27\n", "\\item 29\n", "\\item 143\n", "\\item 22\n", "\\item 139\n", "\\item 115\n", "\\item 82\n", "\\item 36\n", "\\item 30\n", "\\item 120\n", "\\item 135\n", "\\item 3\n", "\\item 40\n", "\\item 127\n", "\\item 51\n", "\\item 10\n", "\\item 121\n", "\\item 50\n", "\\item 47\n", "\\end{enumerate*}\n" ], "text/markdown": [ "1. 92\n", "2. 12\n", "3. 129\n", "4. 85\n", "5. 101\n", "6. 131\n", "7. 125\n", "8. 70\n", "9. 7\n", "10. 18\n", "11. 146\n", "12. 27\n", "13. 29\n", "14. 143\n", "15. 22\n", "16. 139\n", "17. 115\n", "18. 82\n", "19. 36\n", "20. 30\n", "21. 120\n", "22. 135\n", "23. 3\n", "24. 40\n", "25. 127\n", "26. 51\n", "27. 10\n", "28. 121\n", "29. 50\n", "30. 47\n", "\n", "\n" ], "text/plain": [ " [1] 92 12 129 85 101 131 125 70 7 18 146 27 29 143 22 139 115 82 36\n", "[20] 30 120 135 3 40 127 51 10 121 50 47" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "sample( 1:150,30) #1~150 숫자중 임의 30개 리턴" ] }, { "cell_type": "code", "execution_count": 21, "id": "1d8436e2", "metadata": {}, "outputs": [], "source": [ "copy_iris[ sample( 1:150,30) , 1 ] = NA # sepal.length 30 개 결측값" ] }, { "cell_type": "code", "execution_count": 25, "id": "bee50f3b", "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "Loading required package: Rcpp\n", "\n", "## \n", "## Amelia II: Multiple Imputation\n", "## (Version 1.8.2, built: 2024-04-10)\n", "## Copyright (C) 2005-2024 James Honaker, Gary King and Matthew Blackwell\n", "## Refer to http://gking.harvard.edu/amelia/ for more information\n", "## \n", "\n" ] } ], "source": [ "# install.packages('Amelia')\n", "library(Amelia)" ] }, { "cell_type": "code", "execution_count": 26, "id": "c1d94882", "metadata": {}, "outputs": [ { "data": { "image/png": "iVBORw0KGgoAAAANSUhEUgAAA0gAAANICAMAAADKOT/pAAAAOVBMVEUAAAAhcbVNTU1oaGh8\nfHyMjIyampqnp6eysrK9vb2+vr7Hx8fQ0NDZ2dnh4eHp6env8//w8PD////KfU0HAAAACXBI\nWXMAABJ0AAASdAHeZh94AAAgAElEQVR4nO3diVrqWgKE0X0YHNqBC+//sE0mSAARNVVFwr++\nvscgdgKbKjMQYtkB+LOSfgDAHFAkYAQUCRgBRQJGQJGAEVAkYAQUCRgBRQJGQJGAEVAkYAQU\nCRgBRQJGQJGAEVAkYAQUCRgBRQJGQJGAEVCkc6WyqSc39XT7zW//X4nHhfvAi3GuDulbPfl2\nd0U6fVy4D7wY5+qQrurJ1d0V6fRx4T7wYpwrx5SWewrsvT4u7CjSJfuIrkt530+911P9NdL2\npVoZrJsNrMGN3s+977/99NnMbPO0X4u8fnXv9nlRFs+b87kNblx7XLu3amrZzKP63utyP/uN\nZGDwNYp0bh/H130Y91NP9VSvSJtFsy6ot7AGN3pVeW6+W3flo/2Jy/d2c/i4Putrj2vV/mA9\nj6ZqewuaZEaRzlWBXZfFfmpR1sMiPdV7+9t9el9PbvSK1KoSv1scb1+5d3F91lce1/7Larvb\n7du5Hsx+aRst1CjSuWp98Vr9it+vTl4/B0UqzfHnbZ3UwY1ekRbvdROqm2/NrbfFxXubFmyb\n1lyZ9ZXHtWwPiB8e3mK/ZnpfNFuA8KFI56rAbkp52b3sUzosUlWIpy6jgxu9IlXf2jY3232a\n+nD1xXu3zXfXV2d97XENll7aw+Pv7RoPNhTpXL0Hs9ivC5b77ahhkV7a7bI644Mbu8HP9Yq3\n+/re45bY4uqsrz2u/f7U2/OqHGbY/Sjbdl4U6Vwd2P32Vv17fVik3XOX/M3pja+qsuvd/LJI\n5eqsrz2ut2VvFqeLgw3jfa4O7H5jbFltKJ0Uabd9a46TrU5v/GKNtBjG/ctZX3lc1Tbj8qnb\nYyrttiJFsmO8z9WBbc5m25wVqfL+1LvV3bhYlQv7SBfu7bk46yuPa9nO4vAY6qN8781BPPhQ\npHN1UKuIVjsam0EFlofDA4uTG5eL1B21K1/e+1F/WV2d9ZXH1c7wuEaqjjZUR+16h81hQJHO\nHXdZnncnBdn/ql9t6mMBzyc3LhfpwvtIF+/9uDrrK49r1fz44nSnq9c/OFCkc4fO1FtNwwp0\nBwFWZzcuV+W9/Ymr9zZt+XrWVx7XR1ecuoylO3GCMxvcKNK5JqLVez3b3VlB6v2WVbvh1L9x\nuSq7z+pcu/ev7t0+77fU1u/ncxveuPK4qvkvnqr3l9bN996WZfG8HXdE8C2KZLH1bGx1/YQd\nAy/V7PzvPleew2gUKYaBlzqcm+05+Y0ixTDwUoePQ/SPvulQpBgGXmv7Un1AaHF2AqoGRYph\n4IERUCRgBBQJGAFFAkZAkYARUCRgBBQJGAFFAkYgLtLhXOeTs5+BedHmuvvQQH9pNAkzJI11\n2Q2LNLz1D49JGbkYZZFKO/vBCokiPTxh5HIc+0jHPaTBItOvJ0K0kQuxFKn7hyLhH0X64+wL\nRUJNG7kQigQ3beRCKBLctJELse0jUSS0tJEL8ZzZsDs74rCjSA9LG7kQz6bd4cyg/ilC6dcT\nIdrIhQRP2Em/ngjJRU6IIsEtFzkhigS3XOSEKBLccpETokhwy0VOiCLBLRc5IYoEt1zkhCgS\n3HKRE6JIcMtFTogiwS0XOSGKBLdc5IQoEtxykROiSHDLRU6IIsEtFzkhigS3XOSEKBLccpET\nokhwy0VOiCLBLRc5IYoEt1zkhCgS3HKRE6JIcMtFTogiwS0XOSGKBLdc5IQoEtxykROiSHDL\nRU6IIsEtFzkhigS3XOSEKBLccpETokhwy0VOiCLBLRc5oWCR/nNIhwbncpETokhwy0VOiCLB\nLRc5IYoEt1zkhDjYALdc5IQoEtxykROiSHDLRU6IIsEtFzkhigS3XOSEKBLccpETokhwy0VO\niCLBLRc5IYoEt1zkhCgS3HKRE6JIcMtFTogiwS0XOSGKBLdc5IQoEtxykRPiYxRwy0VOiCLB\nLRc5IYoEt1zkhCgS3HKRE+JgA9xykROiSHDLRU5IXKR29qWU7ms3SZEeljZyIdoidf3pFjRY\nWvr1RIg0cinSIpVefSgSWsrIxSiLVPqzP6yVDtKvJ0KEkcvx7CO1G3n9PSSK9LC0kQuxHmwY\nbt6lX0+EaCMX4lojXZhKv54I0UYuxFak3lZe+zX9eiJEG7kQigQ3beRCHEU6vJl0fFepkn49\nEaKNXIilSIM3ZDnY8Oi0kQvxniK04/A3KNLI0q8nQnKRE6JIcMtFTogiwS0XOSGKBLdc5IT4\nqDnccpETokhwy0VOiCLBLRc5IYoEt1zkhCgS3HKRE6JIcMtFTogiwS0XOSGKBLdc5IQoEtxy\nkRPizAa45SInRJHgloucEEWCWy5yQhQJbrnICXGwAW65yAlRJLjlIidEkeCWi5wQRYJbLnJC\nFAluucgJcdQObrnICVEkuOUiJ0SR4JaLnBBFglsuckIcbIBbLnJCFAluucgJUSS45SInRJHg\nloucEEWCWy5yQhQJbrnICVEkuOUiJ0SR4JaLnBBFglsuckKc2QC3XOSEKBLccpETokhwy0VO\niCLBLRc5IYoEt1zkhCgS3HKRE6JIcMtFTogiwS0XOSGKBLdc5IQoEtxykROiSHDLRU6IIsEt\nFzkhigS3XOSEKBLccpETokhwy0VOiCLBLRc5IYoEt1zkhCgS3HKRE6JIcMtFTogiwS0XOSFx\nkdrZl71u4nBf+vVEiDZyIdoidfXpFnSYqKRfT4RII5ciLVI51qf+91irSvr1RIgycjHKIpXB\n7CkSGsLI5Xj2kdpJioR/FOlvsz/uHlGkB6eNXAhFgps2ciGuIg2POtTSrydCtJELMRWpnP1L\nkR6WNnIhpjdk+18o0oPTRi7EUqTBBh5vyD46beRCHEUqjXbycB9/H+lBaSMXwh8ag1suckIU\nCW65yAlRJLjlIidEkeCWi5wQH+yDWy5yQhQJbrnICVEkuOUiJ0SR4JaLnBBFglsuckIUCW65\nyAlRJLjlIidEkeCWi5wQRYJbLnJCFAluucgJUSS45SInRJHgloucEEWCWy5yQpz9Dbdc5IQo\nEtxykROiSHDLRU6IIsEtFzkhDjbALRc5IYoEt1zkhCgS3HKRE6JIcMtFTogiwS0XOSGKBLdc\n5IQoEtxykROiSHDLRU6IIsEtFzkhigS3XOSEKBLccpETokhwy0VOiCLBLRc5IYoEt1zkhCgS\n3HKRE6JIcMtFTogiwS0XOSGKBLdc5IQoEtxykROiSHDLRU6IIsEtFzkhigS3XOSEKBLccpET\nokhwy0VOiCLBLRc5IYoEt1zkhCgS3HKRE+La33DLRU6IIsEtFzkhigS3XOSEKBLccpETokhw\ny0VOiKN2cMtFTogiwS0XOSFxkdrZl1K6r90kRXpY2siFaIvU9adb0GBp6dcTIdLIpUiLVPr1\nObSpk349EaKMXIyySGV3UqThwtKvJ0KEkctx7CMdi9TbQ6JID0sbuRBvkQZLTL+eCNFGLsRa\npOEi068nQrSRC6FIcNNGLoQiwU0buRD/PhJFenTayIVYzmwYvCHLwYZHp41ciPcUoR2Hv0GR\nRpZ+PRGSi5wQRYJbLnJCFAluucgJ8QlZuOUiJ0SR4JaLnBBFglsuckIUCW65yAlRJLjlIifE\nUTu45SInRJHgloucEEWCWy5yQhQJbrnICVEkuOUiJ0SR4JaLnBBFglsuckIUCW65yAlRJLjl\nIidEkeCWi5wQRYJbLnJCFAluucgJUSS45SInRJHgloucEEWCWy5yQhQJbrnICVEkuOUiJ0SR\n4JaLnBBFglsuckIUCW65yAlRJLjlIidEkeCWi5wQRYJbLnJCFAluucgJUSS45SInRJHglouc\nEEWCWy5yQhQJbrnICVEkuOUiJ0SR4JaLnBBFglsuckIUCW65yAlRJLjlIidEkeCWi5wQRYJb\nLnJCFAluucgJUSS45SInRJHgloucEEWCWy5yQhQJbrnICVEkuOUiJ0SR4JaLnBBFglsuckIU\nCW65yAlRJLjlIidEkeCWi5wQRYJbLnJCniKVUk4mdhTpYVki52YpUukWdJiopF9PhDgiZ+co\nUun+Lb2bFOlhGSLnR5HgZoicH0WCmyFyfhQJbobI+fkONlAkNByRs/Md/qZIaFgi5+Z7Q5Yi\noWGLnBP7SHAzRM6PN2Th5oicHacIwc0SOTdOWoVbLnJCFAluucgJUSS45SInFCzSfw7p0OBc\nLnJCFAluucgJUSS45SInRJHgloucEEWCWy5yQhy1g1suckIUCW65yAlRJLjlIidEkeCWi5wQ\nRYJbLnJCFAluucgJUSS45SInRJHgloucEEWCWy5yQhQJbrnICVEkuOUiJ0SR4JaLnBBFglsu\nckKc/Q23XOSEKBLccpETokhwy0VOiCLBLRc5IQ42wC0XOSGKBLdc5IQoEtxykROiSHDLRU6I\nIsEtFzkhjtrBLRc5IYoEt1zkhCgS3HKRE6JIcMtFToiDDXDLRU6IIsEtFzkhigS3XOSEKBLc\ncpETokhwy0VOiCLBLRc5IYoEt1zkhCgS3HKRE6JIcMtFTogzG+CWi5wQRYJbLnJCFAluucgJ\nUSS45SInRJHgloucEEft4JaLnBBFglsuckIUCW65yAlRJLjlIidEkeCWi5wQRYJbLnJCjiKV\nxmGq/Xb69USIIXJ+tjVSOVta+vVEiCtyVhQJbq7IWbmKdN4jivSoTJHz8hapt4dEkR6WKXJe\npiKV47+HJaZfT4R4ImdmLdJwOv16IsQTObNgkTj7+0F5ImdGkeDmiZyZp0il/4UiPThL5Nys\nRaq/HpZIkR6UJXJu3iLtOPwNijSy9OuJkFzkhCgS3HKRE6JIcMtFTogiwS0XOSEuxwW3XOSE\nKBLccpETokhwy0VOiCLBLRc5IQ42wO1iGv536tIPLdavm3pi87pe7Kr39y9H66vvH72v24mP\n5kfflmX5UU1sy7L+xvr9u1mcLPJnPz6m9OuJkItp+N/JpsTFIpVSnuqJp+5iOpej9W2RNmXb\nTGwX9Y9+lOfdc6ma9FyaBm3L5pt5nCzyRz89qvTriZCLabixSMtFPbFYfr/SuWb13E6sm/ms\n9sXaltVxhbRv1OpHc6RIcLuYhhuL9Fw+918/91//kty3boX01p78eVi/dSukqlJvP5klRYLb\nxTTcWKT38rr/+lrejpt276tSVnX8D1PV90vZrMvipf7/PS/2m2696i3btc2mrIZFOq6Q9mup\n4+QNKBLcLqbhxiJtS3WUYF02hyK9Nlcdfe1PNUVaVLeqJq2qiadjkT7qNtZ3bIabdscVUjW7\njx+kmSLB7WIabizSblkXaHHcGFtUG3tv1ZrkONUUabXdl2F/670sPnefi2ORmu3D3e5lv/VW\n+gcbNr0VUrX9+IM0UyS4XUzDrUWqjq19lKdjkcphJdKfqv77aKfW9fffj0VaNbtIn9Xarf3u\ne334e/+Th+PgzcGHm1EkuF1Mw61FettvrB3WJM3hgbL+rNcwx6mmSMOp3j5SO7VcbIdHyj/3\nHTocB7/l3aj+Q/vBz44s/Xoi5GIabi3SZr+e2O/aHIu0e6n2hRab/tRNRXoq77thW/YrpMNx\n8B1Fwp27mIZbi7TfE9rud5F6Rdpvlz0v252bduqmIpWD9tvVpl5/thQJd+1iGm4u0lN5rk5v\nODmzYTg1LNIX+0hnRVqXz/5s2UfCfbuYhpvOtasSXr2H+tYr0rK6VR+rO04Ni3ThqN3HYJaN\n+thDb9Pug6N2uGu/j0yV+s2+SJtekd6atcpHf2pYpOZ9pN4FrD7Ky2CWjWqF1DvpbvfC+0i4\na7+PTJ36RTmc+H08s6HO/GHqpEjVmQ2rjwtnNux6RapXSN1x8ApnNuC+hfLW2+V5v+HU7k35\n0QcpKBLc3EGr96m26/4uz+r73R/O/sadcwftpdlDWvS+dfg80pf4PBLunT1pr/t9p+VwHfT+\n9M3/54lPyOLO5SInRJHgloucEEWCWy5yQhQJbrnICVEkuOUiJ0SR4JaLnBBFgtvFNNx00upu\nt31eVoeym3eB/nZJrrM5NBeNrE4nag99fz6V8lS/nfT99SMpEtwupuF/Jz90uUhv3Scf6hyP\nW6TmTdrmBNf6pNb35n3c7U3Xj6RIcLuYhpuKtI/28z7Am+dy9unW3+nPoT5t6LW6ZMr2qb46\nymLx2Z5ZdMP1IykS3C6m4ZYibQ+XN3kvp9db+J3eHN7aFVK13tlU7XmrT84bfhz36+tHUiS4\nXUzDLUV6OZ53+txevu65LJrvHS8TuXtdlkV94bpStsuyblciy6ooh7u+umhk9ynzVfVR3M/u\nvhuuH0mR4HYxDbcUaX2M9kdzKa11tRdTNeB4cchd/b36m/X9z6t6d6a6aErvrmZfaH120cje\n5RqWpbqaylOznvr2+pEUCW4X03BLkfqbcu3FVOvPkL/1Lw75Xu/lrKrI19eIrC/gVa3N3vt3\nvX1x0chl3bqPZu7r7qTxG64fSZHgdjENvytSc1WTdf/ikOt6X2fbfLNeadTxX5bBXev6rvOL\nRr6U9Xb3uTrUdPtU1/D760dSJLhdTMPvinSY7F8c8nCFhvb+p/1apj58cH7X+WWIFodNvlKv\no3proavXj6RIcLuYhluKtDruI/UvNzy8TOR5W6prnTw310T5vkj7VdDi5fLl8K5eP5Iiwe1i\nGn581O7lNOq9i0O2DmuZZfW/S3ddujDerl73VL0Z3nH9+pEUCW4X0/C795GaHZ3u78H2Lgd5\nuFl5Lq/1nk7vrmayd2Whdh9pUX95rWb5Uv/I5rArdP36kRQJbhfTcNO5dr0zG6q3Q7ujdu/9\ni0PWx+OaKnQ1qS6FV/Wjd9dXF42sr+L6Uc9tv3dUn+TQvvH6zfUjKRLc/pCZ924vp053/dfD\nSr1COl4csj1brruWfm3Zrj2OdzVvKQ3++Fh9ft22PtjQrONeju867b69fiRFgttfQrN9qc7+\nfjmc/f3c/XXL42Uiq9MXmpO2DzV567bpDnfVRycu/TnMzb5c3and+3kuutXOd9ePpEhwy0Xu\nmlsuGtlzev1IigS3XOSuuuGikT2c/Y20XOSu+v6ikT18Hglxuchd9+1FI3vOrh9JkeCWi5xQ\nsEj/OaRDg3O5yAlRJLjlIifkKdLhr6X1/mwaRXpUlsi5WYpUugUdJioU6UE5ImfnKFLp/i29\nmxxseFiGyPn5irSjSKgZIufnKVK7a0SR8I8i/X4Z3a4RRcI/ivTHZbCPhIYhcn4UCW6GyPlR\nJLgZIudHkeBmiJxf8A3Z9OuJEEfk7DhFCG6WyLlx0irccpETokhwy0VOiCLBLRc5IYoEt1zk\nhPioOdxykROiSHDLRU6IIsEtFzkhigS3XOSEKBLccpETokhwy0VOiCLBLRc5IYoEt1zkhCgS\n3HKRE6JIcMtFTogiwS0XOSGKBLdc5IQoEtxykROiSHDLRU6IIsEtFzkhigS3XOSEKBLccpET\n4hOycMtFTogiwS0XOSGKBLdc5IQoEtxykROiSHDLRU6Io3Zwy0VOiCLBLRc5IYoEt1zkhCgS\n3HKRE6JIcMtFTogiwS0XOSGKBLdc5IQoEtxykROiSHDLRU6IMxvgloucEEWCWy5yQhQJbrnI\nCVEkuOUiJ8TBBrjlIidEkeCWi5wQRYJbLnJCFAluucgJUSS45SInxFE7uOUiJ0SR4JaLnBBF\nglsuckIUCW65yAlxsAFuucgJUSS45SInRJHgloucEEWCWy5yQhQJbrnICVEkuOUiJ0SR4JaL\nnJCtSPWCSq39Tvr1RIgrclauIjX1GSwt/XoixBQ5L1ORyo4ioeWJnJmnSKVZ0HBh6dcTIZbI\nuXmL1NtDokgPyxI5N0uRSu+/4xLTrydCHJGzcxTpZPeIo3YPzhA5P0ORysmCKNKD00cuwFGk\nMnj7iCI9On3kAqxvyA7XTenXEyGuyFmZz2zYcbABrshZeYu04/A3KNLI0q8nQnKRE6JIcMtF\nTogiwS0XOSGKBLdc5IQoEtxykROiSHDLRU6IIsEtFzkhigS3XOSEKBLccpETokhwy0VOiCLB\nLRc5IYoEt1zkhCgS3HKRE6JIcMtFTogiwS0XOSGKBLdc5IQoEtxykROiSHDLRU6IIsEtFzkh\nigS3XOSEKBLccpETokhwy0VOiCLBLRc5IYoEt1zkhCgS3HKRE6JIcMtFTogiwS0XOSGKBLdc\n5IQoEtxykROiSHDLRU4oWKT/HNKhwblc5IQoEtxykROiSHDLRU6IIsEtFzkhigS3XOSEKBLc\ncpETokhwy0VOiCLBLRc5IYoEt1zkhCgS3HKRE6JIcMtFTogiwS0XOSGKBLdc5IQ4+xtuucgJ\nUSS45SInRJHgloucEEWCWy5yQhQJbrnICXHUDm65yAlRJLjlIidEkeCWi5wQRYJbLnJCHGyA\nWy5yQhQJbrnICXmKVEo5mdhRpIdliZybpUilW9BhopJ+PRHiiJydo0gnHeoWmX49EWKInJ9t\nH4kioeWKnJWrSIUioWWKnJf1YANFwj+K9PcFUST8o0h/XxJFwj+K9PclUST8o0h/XAZFQsMQ\nOT9LkXhDFj2GyPlxihDcLJFz46RVuOUiJ0SR4JaLnBBFglsuckIUCW65yAlRJLjlIidEkeCW\ni5wQRYJbLnJCFAluucgJUSS45SInRJHgloucEEWCWy5yQhQJbrnICVEkuOUiJ0SR4JaLnBBF\nglsuckIUCW65yAlRJLjlIidEkeCWi5wQRYJbLnJCFAluucgJUSS45SInRJHgloucEEWCWy5y\nQhQJbrnICVEkuOUiJ0SR4JaLnFCwSP85pEODc7nICVEkuOUiJ0SR4JaLnBBFglsuckIUCW65\nyAlx1A5uucgJUSS45SInRJHgloucEEWCWy5yQhQJbrnICVEkuOUiJ0SR4JaLnBBFglsuckIU\nCW65yAlRJLjlIidEkeCWi5wQRYJbLnJCFAluucgJUSS45SInRJHgloucEEWCWy5yQhQJbrnI\nCVEkuOUiJ0SR4JaLnBBFglsuckIUCW65yAlRJLjlIidEkeCWi5wQRYJbLnJCriI1yym19lvp\n1xMhpsh5mYrUtmewtPTriRBP5Mw8RSo7ioSOJXJuliKVdjnDhaVfT4Q4Imdn3Ufq7yFRpIdl\nipyXt0iDJaZfT4SYIuflPWo3mEy/nggxRc4rWCT+PtKDMkXOiyLBzRQ5L/8+EkV6dKbIeZnP\nbOgvkSI9KFPkvMybdhz+BkUaWfr1REguckIUCW65yAlRJLjlIidEkeCWi5wQRYJbLnJCFAlu\nucgJUSS45SInRJHgloucEEWCWy5yQhQJbrnICVEkuOUiJ0SR4JaLnBBFglsuckIUCW65yAlR\nJLjlIidEkeCWi5wQRYJbLnJCFAluucgJUSS45SInRJHgloucEEWCWy5yQhQJbrnICQWLxHXt\nHlQuckIUCW65yAlRJLjlIidEkeCWi5wQBxvgloucEEWCWy5yQhQJbrnICVEkuOUiJ0SR4JaL\nnBBFglsuckIUCW65yAlRJLjlIidEkeCWi5wQRYJbLnJCFAluucgJUSS45SInRJHgloucEEWC\nWy5yQhQJbrnICVEkuOUiJ0SR4JaLnBBFglsuckJ81BxuucgJUSS45SInRJHgloucEEWCWy5y\nQhxsgFsuckIUCW65yAlRJLjlIidEkeCWi5wQRYJbLnJCFAluucgJUSS45SInRJHgloucEEWC\nWy5yQsEiAfNBkYARUCRgBBQJGAFFAkZAkYARUCRgBBTpVDUipTAu+JFJBaa0pMvo/SdciuGZ\nzGghEzClAbA8VkuRbM9kHguZgikNBEV60IVMwZQGgiI96EKmYFID4YlG0e8izSjkkwqQ0GTG\nofSkH8vfWJ7JfBYyEQ8/AMAYplSkcvJVtZj9r1fTlp1lR2z6C5mCKQ2A50Ur3f+0yxh8ZSGT\nN50BMG2PG47aWZ7JfBYyDVMaAA5/P+hCpoCBOOE5RQhzM6W82LbttPtIroPG+qVw+PtoUgNQ\nun/1AVQuYNd7JpaFKJdjeSYTMKUR6B0hmtLDvsB9QE34nuzJ14c1pQGgSL9dCEWSm9IAUKTf\nLoQiyU1qAI7b46KHXXo70JolHBe0kw++fLiGC3ls0xqBLuHTetSXWI50WYaLY3Y1hgAYAUU6\nxbYKfoHAnGDvGb8xqby4Tlrtf5UswXREQ/7BPtczmYApDYD1LMwpDcxl038GUzKl0fY8Vvk+\nkuu3t34xrIeOpjQUrgBatrmkC2iWol+E6ZlMwaSGYVIP9hu2M2PlKFNlSkMwux1b08colAs5\nLMuwkLv28ANwrugvftItZh7m80z+gCE4Jf9gX72Q2WRvPs/kb6Y1CoaVRen9p1qE7biderho\n0cGkBsKxstAXyTbk8uGaVHjEpjQWhpXFnNZI83kmUzClgbAUaT77SKbhoku1KY2CJxmuD9jI\nF2IaLrpUm9QQWFYWRvqP4bqGiypNawBm9Has8xOy+qXIF3L3GIIzcznXzmE+z+SvGIZTszn7\nW28+z+TvpjgUE/9gn9t8nsk9m+Ioz6dILGQ2pjgA8ymSxXyeyT2b4ijrzxGa1eb/fJ7JPZvi\nKHs+xTOb41EzeRp3boqjPMXHHMRwOUxmlOezprA8k/ksZCIefgBO1ONBLvBTJGagdP8wLviR\nKQZG/Zm7cpyULci4QTSfZ3LPHn4ABlxFKrNZ7c3nmfwRI9DXq5CjSDMY/fk8kz96+AEYMBZp\nJr/I5/NM/ujhB2CAIv3UfJ7JH01mADzvWRRLjwy7Fra3eNhJajz8AJwolh41+ZvHoa75PJM/\nYQSAEUyqSLN5z8LzWY3ZDNcUTGmU57M5bimSabjoam1KQzCX9yxMxwE8w2Xap7x7UxqB+Rxq\ntZ0aJB+u+X2g+JemNADzKZIFRXKa1ADMZyfJ8tfMHMNFkVrTGoDZvGdReu/9apfiuML4bk6X\nuPilhx+AiPlspPIh2dZjP/sUdl9mZ1qjPJdffBRpdiY1yvN5z0K/j2Tb5HIcNpmAKQ3BnH7F\nOhKunf1xKXX529IAAAFvSURBVIbDJvdvSiMwpyLNxXwOm/zRlAaAIv2QYauLIrUmNQBzec/C\nd/kg+VYXRWpNaQDm8p6FKXiejLOP1GAE7FzHHk0ri8n/XhsHQ2A3syKhNq1RnsV7FrZ3w9jq\nMprUMM8jGb63lS3XEJrLecR/NKUhmMm2ynzOz2h7tJvJs/mTKY0ARbozvWcyh6fzJ1MagLkU\nyXMU37DBRZGOJjUA89hH8nD8xulV6OFflGkNAO9Z3MoSb4p09PADMFMUyezhB2CmPPEu9Kgz\noRHgPYsfMOXb9TcH7t90hoD3LH6CgJtNZqg51PojFMlsMkNNkX5kLh85mYzJjDJHiHDPJhNK\nioR7NplQUiTcs+mEkvcscMcmlEres8D9IpbACCgSMAKKBIyAIgEjoEjACCgSMAKKBIyAIgEj\noEjACCgSMAKKBIyAIgEjoEjACCgSMAKKBIyAIgEjoEjACCgSMAKKBIyAIgEjoEjACCgSMAKK\nBIzg/0DpORtmcWTBAAAAAElFTkSuQmCC", "text/plain": [ "Plot with title \"Missingness Map\"" ] }, "metadata": { "image/png": { "height": 420, "width": 420 } }, "output_type": "display_data" } ], "source": [ "missmap( copy_iris )" ] }, { "cell_type": "markdown", "id": "3e58917a", "metadata": {}, "source": [ "## 1. 단순대치법" ] }, { "cell_type": "code", "execution_count": 32, "id": "f3cc0074", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
Sepal.Length
30
Sepal.Width
0
Petal.Length
0
Petal.Width
0
Species
0
\n" ], "text/latex": [ "\\begin{description*}\n", "\\item[Sepal.Length] 30\n", "\\item[Sepal.Width] 0\n", "\\item[Petal.Length] 0\n", "\\item[Petal.Width] 0\n", "\\item[Species] 0\n", "\\end{description*}\n" ], "text/markdown": [ "Sepal.Length\n", ": 30Sepal.Width\n", ": 0Petal.Length\n", ": 0Petal.Width\n", ": 0Species\n", ": 0\n", "\n" ], "text/plain": [ "Sepal.Length Sepal.Width Petal.Length Petal.Width Species \n", " 30 0 0 0 0 " ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "## 컬럼별 na 갯수\n", "colSums( is.na( copy_iris) )" ] }, { "cell_type": "code", "execution_count": 35, "id": "02c7f047", "metadata": { "collapsed": true }, "outputs": [ { "data": { "text/html": [ "\n", "
  1. TRUE
  2. TRUE
  3. TRUE
  4. TRUE
  5. TRUE
  6. TRUE
  7. TRUE
  8. TRUE
  9. TRUE
  10. FALSE
  11. TRUE
  12. TRUE
  13. TRUE
  14. FALSE
  15. TRUE
  16. TRUE
  17. TRUE
  18. TRUE
  19. FALSE
  20. FALSE
  21. TRUE
  22. FALSE
  23. TRUE
  24. FALSE
  25. FALSE
  26. TRUE
  27. TRUE
  28. TRUE
  29. TRUE
  30. TRUE
  31. TRUE
  32. TRUE
  33. FALSE
  34. TRUE
  35. TRUE
  36. TRUE
  37. FALSE
  38. TRUE
  39. TRUE
  40. TRUE
  41. TRUE
  42. TRUE
  43. TRUE
  44. FALSE
  45. TRUE
  46. TRUE
  47. TRUE
  48. TRUE
  49. FALSE
  50. TRUE
  51. TRUE
  52. TRUE
  53. TRUE
  54. TRUE
  55. TRUE
  56. TRUE
  57. TRUE
  58. TRUE
  59. TRUE
  60. TRUE
  61. TRUE
  62. TRUE
  63. TRUE
  64. FALSE
  65. TRUE
  66. TRUE
  67. TRUE
  68. FALSE
  69. TRUE
  70. FALSE
  71. TRUE
  72. TRUE
  73. FALSE
  74. TRUE
  75. TRUE
  76. TRUE
  77. FALSE
  78. TRUE
  79. FALSE
  80. TRUE
  81. TRUE
  82. TRUE
  83. TRUE
  84. TRUE
  85. TRUE
  86. TRUE
  87. TRUE
  88. TRUE
  89. TRUE
  90. FALSE
  91. TRUE
  92. TRUE
  93. FALSE
  94. TRUE
  95. TRUE
  96. TRUE
  97. TRUE
  98. FALSE
  99. TRUE
  100. TRUE
  101. FALSE
  102. TRUE
  103. FALSE
  104. TRUE
  105. TRUE
  106. TRUE
  107. TRUE
  108. TRUE
  109. TRUE
  110. TRUE
  111. TRUE
  112. TRUE
  113. TRUE
  114. TRUE
  115. FALSE
  116. FALSE
  117. FALSE
  118. TRUE
  119. FALSE
  120. TRUE
  121. TRUE
  122. TRUE
  123. TRUE
  124. TRUE
  125. TRUE
  126. TRUE
  127. TRUE
  128. TRUE
  129. FALSE
  130. TRUE
  131. TRUE
  132. TRUE
  133. TRUE
  134. TRUE
  135. TRUE
  136. TRUE
  137. FALSE
  138. TRUE
  139. TRUE
  140. TRUE
  141. TRUE
  142. TRUE
  143. FALSE
  144. TRUE
  145. TRUE
  146. TRUE
  147. TRUE
  148. FALSE
  149. TRUE
  150. TRUE
\n" ], "text/latex": [ "\\begin{enumerate*}\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\end{enumerate*}\n" ], "text/markdown": [ "1. TRUE\n", "2. TRUE\n", "3. TRUE\n", "4. TRUE\n", "5. TRUE\n", "6. TRUE\n", "7. TRUE\n", "8. TRUE\n", "9. TRUE\n", "10. FALSE\n", "11. TRUE\n", "12. TRUE\n", "13. TRUE\n", "14. FALSE\n", "15. TRUE\n", "16. TRUE\n", "17. TRUE\n", "18. TRUE\n", "19. FALSE\n", "20. FALSE\n", "21. TRUE\n", "22. FALSE\n", "23. TRUE\n", "24. FALSE\n", "25. FALSE\n", "26. TRUE\n", "27. TRUE\n", "28. TRUE\n", "29. TRUE\n", "30. TRUE\n", "31. TRUE\n", "32. TRUE\n", "33. FALSE\n", "34. TRUE\n", "35. TRUE\n", "36. TRUE\n", "37. FALSE\n", "38. TRUE\n", "39. TRUE\n", "40. TRUE\n", "41. TRUE\n", "42. TRUE\n", "43. TRUE\n", "44. FALSE\n", "45. TRUE\n", "46. TRUE\n", "47. TRUE\n", "48. TRUE\n", "49. FALSE\n", "50. TRUE\n", "51. TRUE\n", "52. TRUE\n", "53. TRUE\n", "54. TRUE\n", "55. TRUE\n", "56. TRUE\n", "57. TRUE\n", "58. TRUE\n", "59. TRUE\n", "60. TRUE\n", "61. TRUE\n", "62. TRUE\n", "63. TRUE\n", "64. FALSE\n", "65. TRUE\n", "66. TRUE\n", "67. TRUE\n", "68. FALSE\n", "69. TRUE\n", "70. FALSE\n", "71. TRUE\n", "72. TRUE\n", "73. FALSE\n", "74. TRUE\n", "75. TRUE\n", "76. TRUE\n", "77. FALSE\n", "78. TRUE\n", "79. FALSE\n", "80. TRUE\n", "81. TRUE\n", "82. TRUE\n", "83. TRUE\n", "84. TRUE\n", "85. TRUE\n", "86. TRUE\n", "87. TRUE\n", "88. TRUE\n", "89. TRUE\n", "90. FALSE\n", "91. TRUE\n", "92. TRUE\n", "93. FALSE\n", "94. TRUE\n", "95. TRUE\n", "96. TRUE\n", "97. TRUE\n", "98. FALSE\n", "99. TRUE\n", "100. TRUE\n", "101. FALSE\n", "102. TRUE\n", "103. FALSE\n", "104. TRUE\n", "105. TRUE\n", "106. TRUE\n", "107. TRUE\n", "108. TRUE\n", "109. TRUE\n", "110. TRUE\n", "111. TRUE\n", "112. TRUE\n", "113. TRUE\n", "114. TRUE\n", "115. FALSE\n", "116. FALSE\n", "117. FALSE\n", "118. TRUE\n", "119. FALSE\n", "120. TRUE\n", "121. TRUE\n", "122. TRUE\n", "123. TRUE\n", "124. TRUE\n", "125. TRUE\n", "126. TRUE\n", "127. TRUE\n", "128. TRUE\n", "129. FALSE\n", "130. TRUE\n", "131. TRUE\n", "132. TRUE\n", "133. TRUE\n", "134. TRUE\n", "135. TRUE\n", "136. TRUE\n", "137. FALSE\n", "138. TRUE\n", "139. TRUE\n", "140. TRUE\n", "141. TRUE\n", "142. TRUE\n", "143. FALSE\n", "144. TRUE\n", "145. TRUE\n", "146. TRUE\n", "147. TRUE\n", "148. FALSE\n", "149. TRUE\n", "150. TRUE\n", "\n", "\n" ], "text/plain": [ " [1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE\n", " [13] TRUE FALSE TRUE TRUE TRUE TRUE FALSE FALSE TRUE FALSE TRUE FALSE\n", " [25] FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE\n", " [37] FALSE TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE\n", " [49] FALSE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE\n", " [61] TRUE TRUE TRUE FALSE TRUE TRUE TRUE FALSE TRUE FALSE TRUE TRUE\n", " [73] FALSE TRUE TRUE TRUE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE\n", " [85] TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE FALSE TRUE TRUE TRUE\n", " [97] TRUE FALSE TRUE TRUE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE\n", "[109] TRUE TRUE TRUE TRUE TRUE TRUE FALSE FALSE FALSE TRUE FALSE TRUE\n", "[121] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE\n", "[133] TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE FALSE TRUE\n", "[145] TRUE TRUE TRUE FALSE TRUE TRUE" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "#complete.cases() 함수는 R에서 데이터프레임이나 벡터에 포함된 결측값(NA)을 확인하고,\n", "# 결측값이 없는 행을 논리값으로 반환하는 함수.\n", "#TRUE는 결측값이 없는 행, FALSE는 결측값이 있는 행을 나타냅\n", "complete.cases( copy_iris)" ] }, { "cell_type": "markdown", "id": "9735ee91", "metadata": {}, "source": [ "### NA 행 제거" ] }, { "cell_type": "code", "execution_count": 36, "id": "f032c714", "metadata": {}, "outputs": [], "source": [ "copy_iris1 = copy_iris[ complete.cases( copy_iris), ]" ] }, { "cell_type": "code", "execution_count": 37, "id": "5f59fe37", "metadata": {}, "outputs": [ { "data": { "text/html": [ "\n", "
  1. 120
  2. 5
\n" ], "text/latex": [ "\\begin{enumerate*}\n", "\\item 120\n", "\\item 5\n", "\\end{enumerate*}\n" ], "text/markdown": [ "1. 120\n", "2. 5\n", "\n", "\n" ], "text/plain": [ "[1] 120 5" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "dim( copy_iris1)" ] }, { "cell_type": "markdown", "id": "5a528b5a", "metadata": {}, "source": [ "### 평균값 대치" ] }, { "cell_type": "code", "execution_count": 41, "id": "838e4f4e", "metadata": {}, "outputs": [ { "data": { "text/html": [ "\n", "
  1. 'Sepal.Length'
  2. 'Sepal.Width'
  3. 'Petal.Length'
  4. 'Petal.Width'
  5. 'Species'
\n" ], "text/latex": [ "\\begin{enumerate*}\n", "\\item 'Sepal.Length'\n", "\\item 'Sepal.Width'\n", "\\item 'Petal.Length'\n", "\\item 'Petal.Width'\n", "\\item 'Species'\n", "\\end{enumerate*}\n" ], "text/markdown": [ "1. 'Sepal.Length'\n", "2. 'Sepal.Width'\n", "3. 'Petal.Length'\n", "4. 'Petal.Width'\n", "5. 'Species'\n", "\n", "\n" ], "text/plain": [ "[1] \"Sepal.Length\" \"Sepal.Width\" \"Petal.Length\" \"Petal.Width\" \"Species\" " ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "colnames( copy_iris)" ] }, { "cell_type": "code", "execution_count": 42, "id": "d5d840f9", "metadata": {}, "outputs": [ { "data": { "text/html": [ "5.84666666666667" ], "text/latex": [ "5.84666666666667" ], "text/markdown": [ "5.84666666666667" ], "text/plain": [ "[1] 5.846667" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "mean( copy_iris$Sepal.Length , na.rm = T)" ] }, { "cell_type": "code", "execution_count": 44, "id": "1cafbc02", "metadata": { "collapsed": true }, "outputs": [ { "data": { "text/html": [ "\n", "
  1. FALSE
  2. FALSE
  3. FALSE
  4. FALSE
  5. FALSE
  6. FALSE
  7. FALSE
  8. FALSE
  9. FALSE
  10. TRUE
  11. FALSE
  12. FALSE
  13. FALSE
  14. TRUE
  15. FALSE
  16. FALSE
  17. FALSE
  18. FALSE
  19. TRUE
  20. TRUE
  21. FALSE
  22. TRUE
  23. FALSE
  24. TRUE
  25. TRUE
  26. FALSE
  27. FALSE
  28. FALSE
  29. FALSE
  30. FALSE
  31. FALSE
  32. FALSE
  33. TRUE
  34. FALSE
  35. FALSE
  36. FALSE
  37. TRUE
  38. FALSE
  39. FALSE
  40. FALSE
  41. FALSE
  42. FALSE
  43. FALSE
  44. TRUE
  45. FALSE
  46. FALSE
  47. FALSE
  48. FALSE
  49. TRUE
  50. FALSE
  51. FALSE
  52. FALSE
  53. FALSE
  54. FALSE
  55. FALSE
  56. FALSE
  57. FALSE
  58. FALSE
  59. FALSE
  60. FALSE
  61. FALSE
  62. FALSE
  63. FALSE
  64. TRUE
  65. FALSE
  66. FALSE
  67. FALSE
  68. TRUE
  69. FALSE
  70. TRUE
  71. FALSE
  72. FALSE
  73. TRUE
  74. FALSE
  75. FALSE
  76. FALSE
  77. TRUE
  78. FALSE
  79. TRUE
  80. FALSE
  81. FALSE
  82. FALSE
  83. FALSE
  84. FALSE
  85. FALSE
  86. FALSE
  87. FALSE
  88. FALSE
  89. FALSE
  90. TRUE
  91. FALSE
  92. FALSE
  93. TRUE
  94. FALSE
  95. FALSE
  96. FALSE
  97. FALSE
  98. TRUE
  99. FALSE
  100. FALSE
  101. TRUE
  102. FALSE
  103. TRUE
  104. FALSE
  105. FALSE
  106. FALSE
  107. FALSE
  108. FALSE
  109. FALSE
  110. FALSE
  111. FALSE
  112. FALSE
  113. FALSE
  114. FALSE
  115. TRUE
  116. TRUE
  117. TRUE
  118. FALSE
  119. TRUE
  120. FALSE
  121. FALSE
  122. FALSE
  123. FALSE
  124. FALSE
  125. FALSE
  126. FALSE
  127. FALSE
  128. FALSE
  129. TRUE
  130. FALSE
  131. FALSE
  132. FALSE
  133. FALSE
  134. FALSE
  135. FALSE
  136. FALSE
  137. TRUE
  138. FALSE
  139. FALSE
  140. FALSE
  141. FALSE
  142. FALSE
  143. TRUE
  144. FALSE
  145. FALSE
  146. FALSE
  147. FALSE
  148. TRUE
  149. FALSE
  150. FALSE
\n" ], "text/latex": [ "\\begin{enumerate*}\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item FALSE\n", "\\item TRUE\n", "\\item FALSE\n", "\\item FALSE\n", "\\end{enumerate*}\n" ], "text/markdown": [ "1. FALSE\n", "2. FALSE\n", "3. FALSE\n", "4. FALSE\n", "5. FALSE\n", "6. FALSE\n", "7. FALSE\n", "8. FALSE\n", "9. FALSE\n", "10. TRUE\n", "11. FALSE\n", "12. FALSE\n", "13. FALSE\n", "14. TRUE\n", "15. FALSE\n", "16. FALSE\n", "17. FALSE\n", "18. FALSE\n", "19. TRUE\n", "20. TRUE\n", "21. FALSE\n", "22. TRUE\n", "23. FALSE\n", "24. TRUE\n", "25. TRUE\n", "26. FALSE\n", "27. FALSE\n", "28. FALSE\n", "29. FALSE\n", "30. FALSE\n", "31. FALSE\n", "32. FALSE\n", "33. TRUE\n", "34. FALSE\n", "35. FALSE\n", "36. FALSE\n", "37. TRUE\n", "38. FALSE\n", "39. FALSE\n", "40. FALSE\n", "41. FALSE\n", "42. FALSE\n", "43. FALSE\n", "44. TRUE\n", "45. FALSE\n", "46. FALSE\n", "47. FALSE\n", "48. FALSE\n", "49. TRUE\n", "50. FALSE\n", "51. FALSE\n", "52. FALSE\n", "53. FALSE\n", "54. FALSE\n", "55. FALSE\n", "56. FALSE\n", "57. FALSE\n", "58. FALSE\n", "59. FALSE\n", "60. FALSE\n", "61. FALSE\n", "62. FALSE\n", "63. FALSE\n", "64. TRUE\n", "65. FALSE\n", "66. FALSE\n", "67. FALSE\n", "68. TRUE\n", "69. FALSE\n", "70. TRUE\n", "71. FALSE\n", "72. FALSE\n", "73. TRUE\n", "74. FALSE\n", "75. FALSE\n", "76. FALSE\n", "77. TRUE\n", "78. FALSE\n", "79. TRUE\n", "80. FALSE\n", "81. FALSE\n", "82. FALSE\n", "83. FALSE\n", "84. FALSE\n", "85. FALSE\n", "86. FALSE\n", "87. FALSE\n", "88. FALSE\n", "89. FALSE\n", "90. TRUE\n", "91. FALSE\n", "92. FALSE\n", "93. TRUE\n", "94. FALSE\n", "95. FALSE\n", "96. FALSE\n", "97. FALSE\n", "98. TRUE\n", "99. FALSE\n", "100. FALSE\n", "101. TRUE\n", "102. FALSE\n", "103. TRUE\n", "104. FALSE\n", "105. FALSE\n", "106. FALSE\n", "107. FALSE\n", "108. FALSE\n", "109. FALSE\n", "110. FALSE\n", "111. FALSE\n", "112. FALSE\n", "113. FALSE\n", "114. FALSE\n", "115. TRUE\n", "116. TRUE\n", "117. TRUE\n", "118. FALSE\n", "119. TRUE\n", "120. FALSE\n", "121. FALSE\n", "122. FALSE\n", "123. FALSE\n", "124. FALSE\n", "125. FALSE\n", "126. FALSE\n", "127. FALSE\n", "128. FALSE\n", "129. TRUE\n", "130. FALSE\n", "131. FALSE\n", "132. FALSE\n", "133. FALSE\n", "134. FALSE\n", "135. FALSE\n", "136. FALSE\n", "137. TRUE\n", "138. FALSE\n", "139. FALSE\n", "140. FALSE\n", "141. FALSE\n", "142. FALSE\n", "143. TRUE\n", "144. FALSE\n", "145. FALSE\n", "146. FALSE\n", "147. FALSE\n", "148. TRUE\n", "149. FALSE\n", "150. FALSE\n", "\n", "\n" ], "text/plain": [ " [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE\n", " [13] FALSE TRUE FALSE FALSE FALSE FALSE TRUE TRUE FALSE TRUE FALSE TRUE\n", " [25] TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE\n", " [37] TRUE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE\n", " [49] TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE\n", " [61] FALSE FALSE FALSE TRUE FALSE FALSE FALSE TRUE FALSE TRUE FALSE FALSE\n", " [73] TRUE FALSE FALSE FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE\n", " [85] FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE TRUE FALSE FALSE FALSE\n", " [97] FALSE TRUE FALSE FALSE TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE\n", "[109] FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE FALSE TRUE FALSE\n", "[121] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE\n", "[133] FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE\n", "[145] FALSE FALSE FALSE TRUE FALSE FALSE" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "is.na(copy_iris$Sepal.Length )" ] }, { "cell_type": "code", "execution_count": 46, "id": "61c71e80", "metadata": {}, "outputs": [], "source": [ "copy_iris$Sepal.Length[ is.na(copy_iris$Sepal.Length )] = mean( copy_iris$Sepal.Length , na.rm = T)" ] }, { "cell_type": "code", "execution_count": 47, "id": "086d66eb", "metadata": { "collapsed": true }, "outputs": [ { "data": { "text/html": [ "\n", "\n", "\n", "\t\n", "\t\n", "\n", "\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\n", "
A data.frame: 150 × 5
Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies
<dbl><dbl><dbl><dbl><fct>
5.1000003.51.40.2setosa
4.9000003.01.40.2setosa
4.7000003.21.30.2setosa
4.6000003.11.50.2setosa
5.0000003.61.40.2setosa
5.4000003.91.70.4setosa
4.6000003.41.40.3setosa
5.0000003.41.50.2setosa
4.4000002.91.40.2setosa
5.8466673.11.50.1setosa
5.4000003.71.50.2setosa
4.8000003.41.60.2setosa
4.8000003.01.40.1setosa
5.8466673.01.10.1setosa
5.8000004.01.20.2setosa
5.7000004.41.50.4setosa
5.4000003.91.30.4setosa
5.1000003.51.40.3setosa
5.8466673.81.70.3setosa
5.8466673.81.50.3setosa
5.4000003.41.70.2setosa
5.8466673.71.50.4setosa
4.6000003.61.00.2setosa
5.8466673.31.70.5setosa
5.8466673.41.90.2setosa
5.0000003.01.60.2setosa
5.0000003.41.60.4setosa
5.2000003.51.50.2setosa
5.2000003.41.40.2setosa
4.7000003.21.60.2setosa
6.9000003.25.72.3virginica
5.6000002.84.92.0virginica
7.7000002.86.72.0virginica
6.3000002.74.91.8virginica
6.7000003.35.72.1virginica
7.2000003.26.01.8virginica
6.2000002.84.81.8virginica
6.1000003.04.91.8virginica
5.8466672.85.62.1virginica
7.2000003.05.81.6virginica
7.4000002.86.11.9virginica
7.9000003.86.42.0virginica
6.4000002.85.62.2virginica
6.3000002.85.11.5virginica
6.1000002.65.61.4virginica
7.7000003.06.12.3virginica
5.8466673.45.62.4virginica
6.4000003.15.51.8virginica
6.0000003.04.81.8virginica
6.9000003.15.42.1virginica
6.7000003.15.62.4virginica
6.9000003.15.12.3virginica
5.8466672.75.11.9virginica
6.8000003.25.92.3virginica
6.7000003.35.72.5virginica
6.7000003.05.22.3virginica
6.3000002.55.01.9virginica
5.8466673.05.22.0virginica
6.2000003.45.42.3virginica
5.9000003.05.11.8virginica
\n" ], "text/latex": [ "A data.frame: 150 × 5\n", "\\begin{tabular}{lllll}\n", " Sepal.Length & Sepal.Width & Petal.Length & Petal.Width & Species\\\\\n", " & & & & \\\\\n", "\\hline\n", "\t 5.100000 & 3.5 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.900000 & 3.0 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.700000 & 3.2 & 1.3 & 0.2 & setosa\\\\\n", "\t 4.600000 & 3.1 & 1.5 & 0.2 & setosa\\\\\n", "\t 5.000000 & 3.6 & 1.4 & 0.2 & setosa\\\\\n", "\t 5.400000 & 3.9 & 1.7 & 0.4 & setosa\\\\\n", "\t 4.600000 & 3.4 & 1.4 & 0.3 & setosa\\\\\n", "\t 5.000000 & 3.4 & 1.5 & 0.2 & setosa\\\\\n", "\t 4.400000 & 2.9 & 1.4 & 0.2 & setosa\\\\\n", "\t 5.846667 & 3.1 & 1.5 & 0.1 & setosa\\\\\n", "\t 5.400000 & 3.7 & 1.5 & 0.2 & setosa\\\\\n", "\t 4.800000 & 3.4 & 1.6 & 0.2 & setosa\\\\\n", "\t 4.800000 & 3.0 & 1.4 & 0.1 & setosa\\\\\n", "\t 5.846667 & 3.0 & 1.1 & 0.1 & setosa\\\\\n", "\t 5.800000 & 4.0 & 1.2 & 0.2 & setosa\\\\\n", "\t 5.700000 & 4.4 & 1.5 & 0.4 & setosa\\\\\n", "\t 5.400000 & 3.9 & 1.3 & 0.4 & setosa\\\\\n", "\t 5.100000 & 3.5 & 1.4 & 0.3 & setosa\\\\\n", "\t 5.846667 & 3.8 & 1.7 & 0.3 & setosa\\\\\n", "\t 5.846667 & 3.8 & 1.5 & 0.3 & setosa\\\\\n", "\t 5.400000 & 3.4 & 1.7 & 0.2 & setosa\\\\\n", "\t 5.846667 & 3.7 & 1.5 & 0.4 & setosa\\\\\n", "\t 4.600000 & 3.6 & 1.0 & 0.2 & setosa\\\\\n", "\t 5.846667 & 3.3 & 1.7 & 0.5 & setosa\\\\\n", "\t 5.846667 & 3.4 & 1.9 & 0.2 & setosa\\\\\n", "\t 5.000000 & 3.0 & 1.6 & 0.2 & setosa\\\\\n", "\t 5.000000 & 3.4 & 1.6 & 0.4 & setosa\\\\\n", "\t 5.200000 & 3.5 & 1.5 & 0.2 & setosa\\\\\n", "\t 5.200000 & 3.4 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.700000 & 3.2 & 1.6 & 0.2 & setosa\\\\\n", "\t ⋮ & ⋮ & ⋮ & ⋮ & ⋮\\\\\n", "\t 6.900000 & 3.2 & 5.7 & 2.3 & virginica\\\\\n", "\t 5.600000 & 2.8 & 4.9 & 2.0 & virginica\\\\\n", "\t 7.700000 & 2.8 & 6.7 & 2.0 & virginica\\\\\n", "\t 6.300000 & 2.7 & 4.9 & 1.8 & virginica\\\\\n", "\t 6.700000 & 3.3 & 5.7 & 2.1 & virginica\\\\\n", "\t 7.200000 & 3.2 & 6.0 & 1.8 & virginica\\\\\n", "\t 6.200000 & 2.8 & 4.8 & 1.8 & virginica\\\\\n", "\t 6.100000 & 3.0 & 4.9 & 1.8 & virginica\\\\\n", "\t 5.846667 & 2.8 & 5.6 & 2.1 & virginica\\\\\n", "\t 7.200000 & 3.0 & 5.8 & 1.6 & virginica\\\\\n", "\t 7.400000 & 2.8 & 6.1 & 1.9 & virginica\\\\\n", "\t 7.900000 & 3.8 & 6.4 & 2.0 & virginica\\\\\n", "\t 6.400000 & 2.8 & 5.6 & 2.2 & virginica\\\\\n", "\t 6.300000 & 2.8 & 5.1 & 1.5 & virginica\\\\\n", "\t 6.100000 & 2.6 & 5.6 & 1.4 & virginica\\\\\n", "\t 7.700000 & 3.0 & 6.1 & 2.3 & virginica\\\\\n", "\t 5.846667 & 3.4 & 5.6 & 2.4 & virginica\\\\\n", "\t 6.400000 & 3.1 & 5.5 & 1.8 & virginica\\\\\n", "\t 6.000000 & 3.0 & 4.8 & 1.8 & virginica\\\\\n", "\t 6.900000 & 3.1 & 5.4 & 2.1 & virginica\\\\\n", "\t 6.700000 & 3.1 & 5.6 & 2.4 & virginica\\\\\n", "\t 6.900000 & 3.1 & 5.1 & 2.3 & virginica\\\\\n", "\t 5.846667 & 2.7 & 5.1 & 1.9 & virginica\\\\\n", "\t 6.800000 & 3.2 & 5.9 & 2.3 & virginica\\\\\n", "\t 6.700000 & 3.3 & 5.7 & 2.5 & virginica\\\\\n", "\t 6.700000 & 3.0 & 5.2 & 2.3 & virginica\\\\\n", "\t 6.300000 & 2.5 & 5.0 & 1.9 & virginica\\\\\n", "\t 5.846667 & 3.0 & 5.2 & 2.0 & virginica\\\\\n", "\t 6.200000 & 3.4 & 5.4 & 2.3 & virginica\\\\\n", "\t 5.900000 & 3.0 & 5.1 & 1.8 & virginica\\\\\n", "\\end{tabular}\n" ], "text/markdown": [ "\n", "A data.frame: 150 × 5\n", "\n", "| Sepal.Length <dbl> | Sepal.Width <dbl> | Petal.Length <dbl> | Petal.Width <dbl> | Species <fct> |\n", "|---|---|---|---|---|\n", "| 5.100000 | 3.5 | 1.4 | 0.2 | setosa |\n", "| 4.900000 | 3.0 | 1.4 | 0.2 | setosa |\n", "| 4.700000 | 3.2 | 1.3 | 0.2 | setosa |\n", "| 4.600000 | 3.1 | 1.5 | 0.2 | setosa |\n", "| 5.000000 | 3.6 | 1.4 | 0.2 | setosa |\n", "| 5.400000 | 3.9 | 1.7 | 0.4 | setosa |\n", "| 4.600000 | 3.4 | 1.4 | 0.3 | setosa |\n", "| 5.000000 | 3.4 | 1.5 | 0.2 | setosa |\n", "| 4.400000 | 2.9 | 1.4 | 0.2 | setosa |\n", "| 5.846667 | 3.1 | 1.5 | 0.1 | setosa |\n", "| 5.400000 | 3.7 | 1.5 | 0.2 | setosa |\n", "| 4.800000 | 3.4 | 1.6 | 0.2 | setosa |\n", "| 4.800000 | 3.0 | 1.4 | 0.1 | setosa |\n", "| 5.846667 | 3.0 | 1.1 | 0.1 | setosa |\n", "| 5.800000 | 4.0 | 1.2 | 0.2 | setosa |\n", "| 5.700000 | 4.4 | 1.5 | 0.4 | setosa |\n", "| 5.400000 | 3.9 | 1.3 | 0.4 | setosa |\n", "| 5.100000 | 3.5 | 1.4 | 0.3 | setosa |\n", "| 5.846667 | 3.8 | 1.7 | 0.3 | setosa |\n", "| 5.846667 | 3.8 | 1.5 | 0.3 | setosa |\n", "| 5.400000 | 3.4 | 1.7 | 0.2 | setosa |\n", "| 5.846667 | 3.7 | 1.5 | 0.4 | setosa |\n", "| 4.600000 | 3.6 | 1.0 | 0.2 | setosa |\n", "| 5.846667 | 3.3 | 1.7 | 0.5 | setosa |\n", "| 5.846667 | 3.4 | 1.9 | 0.2 | setosa |\n", "| 5.000000 | 3.0 | 1.6 | 0.2 | setosa |\n", "| 5.000000 | 3.4 | 1.6 | 0.4 | setosa |\n", "| 5.200000 | 3.5 | 1.5 | 0.2 | setosa |\n", "| 5.200000 | 3.4 | 1.4 | 0.2 | setosa |\n", "| 4.700000 | 3.2 | 1.6 | 0.2 | setosa |\n", "| ⋮ | ⋮ | ⋮ | ⋮ | ⋮ |\n", "| 6.900000 | 3.2 | 5.7 | 2.3 | virginica |\n", "| 5.600000 | 2.8 | 4.9 | 2.0 | virginica |\n", "| 7.700000 | 2.8 | 6.7 | 2.0 | virginica |\n", "| 6.300000 | 2.7 | 4.9 | 1.8 | virginica |\n", "| 6.700000 | 3.3 | 5.7 | 2.1 | virginica |\n", "| 7.200000 | 3.2 | 6.0 | 1.8 | virginica |\n", "| 6.200000 | 2.8 | 4.8 | 1.8 | virginica |\n", "| 6.100000 | 3.0 | 4.9 | 1.8 | virginica |\n", "| 5.846667 | 2.8 | 5.6 | 2.1 | virginica |\n", "| 7.200000 | 3.0 | 5.8 | 1.6 | virginica |\n", "| 7.400000 | 2.8 | 6.1 | 1.9 | virginica |\n", "| 7.900000 | 3.8 | 6.4 | 2.0 | virginica |\n", "| 6.400000 | 2.8 | 5.6 | 2.2 | virginica |\n", "| 6.300000 | 2.8 | 5.1 | 1.5 | virginica |\n", "| 6.100000 | 2.6 | 5.6 | 1.4 | virginica |\n", "| 7.700000 | 3.0 | 6.1 | 2.3 | virginica |\n", "| 5.846667 | 3.4 | 5.6 | 2.4 | virginica |\n", "| 6.400000 | 3.1 | 5.5 | 1.8 | virginica |\n", "| 6.000000 | 3.0 | 4.8 | 1.8 | virginica |\n", "| 6.900000 | 3.1 | 5.4 | 2.1 | virginica |\n", "| 6.700000 | 3.1 | 5.6 | 2.4 | virginica |\n", "| 6.900000 | 3.1 | 5.1 | 2.3 | virginica |\n", "| 5.846667 | 2.7 | 5.1 | 1.9 | virginica |\n", "| 6.800000 | 3.2 | 5.9 | 2.3 | virginica |\n", "| 6.700000 | 3.3 | 5.7 | 2.5 | virginica |\n", "| 6.700000 | 3.0 | 5.2 | 2.3 | virginica |\n", "| 6.300000 | 2.5 | 5.0 | 1.9 | virginica |\n", "| 5.846667 | 3.0 | 5.2 | 2.0 | virginica |\n", "| 6.200000 | 3.4 | 5.4 | 2.3 | virginica |\n", "| 5.900000 | 3.0 | 5.1 | 1.8 | virginica |\n", "\n" ], "text/plain": [ " Sepal.Length Sepal.Width Petal.Length Petal.Width Species \n", "1 5.100000 3.5 1.4 0.2 setosa \n", "2 4.900000 3.0 1.4 0.2 setosa \n", "3 4.700000 3.2 1.3 0.2 setosa \n", "4 4.600000 3.1 1.5 0.2 setosa \n", "5 5.000000 3.6 1.4 0.2 setosa \n", "6 5.400000 3.9 1.7 0.4 setosa \n", "7 4.600000 3.4 1.4 0.3 setosa \n", "8 5.000000 3.4 1.5 0.2 setosa \n", "9 4.400000 2.9 1.4 0.2 setosa \n", "10 5.846667 3.1 1.5 0.1 setosa \n", "11 5.400000 3.7 1.5 0.2 setosa \n", "12 4.800000 3.4 1.6 0.2 setosa \n", "13 4.800000 3.0 1.4 0.1 setosa \n", "14 5.846667 3.0 1.1 0.1 setosa \n", "15 5.800000 4.0 1.2 0.2 setosa \n", "16 5.700000 4.4 1.5 0.4 setosa \n", "17 5.400000 3.9 1.3 0.4 setosa \n", "18 5.100000 3.5 1.4 0.3 setosa \n", "19 5.846667 3.8 1.7 0.3 setosa \n", "20 5.846667 3.8 1.5 0.3 setosa \n", "21 5.400000 3.4 1.7 0.2 setosa \n", "22 5.846667 3.7 1.5 0.4 setosa \n", "23 4.600000 3.6 1.0 0.2 setosa \n", "24 5.846667 3.3 1.7 0.5 setosa \n", "25 5.846667 3.4 1.9 0.2 setosa \n", "26 5.000000 3.0 1.6 0.2 setosa \n", "27 5.000000 3.4 1.6 0.4 setosa \n", "28 5.200000 3.5 1.5 0.2 setosa \n", "29 5.200000 3.4 1.4 0.2 setosa \n", "30 4.700000 3.2 1.6 0.2 setosa \n", "⋮ ⋮ ⋮ ⋮ ⋮ ⋮ \n", "121 6.900000 3.2 5.7 2.3 virginica\n", "122 5.600000 2.8 4.9 2.0 virginica\n", "123 7.700000 2.8 6.7 2.0 virginica\n", "124 6.300000 2.7 4.9 1.8 virginica\n", "125 6.700000 3.3 5.7 2.1 virginica\n", "126 7.200000 3.2 6.0 1.8 virginica\n", "127 6.200000 2.8 4.8 1.8 virginica\n", "128 6.100000 3.0 4.9 1.8 virginica\n", "129 5.846667 2.8 5.6 2.1 virginica\n", "130 7.200000 3.0 5.8 1.6 virginica\n", "131 7.400000 2.8 6.1 1.9 virginica\n", "132 7.900000 3.8 6.4 2.0 virginica\n", "133 6.400000 2.8 5.6 2.2 virginica\n", "134 6.300000 2.8 5.1 1.5 virginica\n", "135 6.100000 2.6 5.6 1.4 virginica\n", "136 7.700000 3.0 6.1 2.3 virginica\n", "137 5.846667 3.4 5.6 2.4 virginica\n", "138 6.400000 3.1 5.5 1.8 virginica\n", "139 6.000000 3.0 4.8 1.8 virginica\n", "140 6.900000 3.1 5.4 2.1 virginica\n", "141 6.700000 3.1 5.6 2.4 virginica\n", "142 6.900000 3.1 5.1 2.3 virginica\n", "143 5.846667 2.7 5.1 1.9 virginica\n", "144 6.800000 3.2 5.9 2.3 virginica\n", "145 6.700000 3.3 5.7 2.5 virginica\n", "146 6.700000 3.0 5.2 2.3 virginica\n", "147 6.300000 2.5 5.0 1.9 virginica\n", "148 5.846667 3.0 5.2 2.0 virginica\n", "149 6.200000 3.4 5.4 2.3 virginica\n", "150 5.900000 3.0 5.1 1.8 virginica" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "copy_iris" ] }, { "cell_type": "markdown", "id": "7d55859c", "metadata": {}, "source": [ "### 중앙값 대치" ] }, { "cell_type": "code", "execution_count": 3, "id": "311a2da4", "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "Registered S3 method overwritten by 'quantmod':\n", " method from\n", " as.zoo.data.frame zoo \n", "\n" ] } ], "source": [ "# install.packages('DMwR2')\n", "library( DMwR2 )" ] }, { "cell_type": "code", "execution_count": 4, "id": "ea857a40", "metadata": {}, "outputs": [], "source": [ "copy_iris[ sample( 1:150,30) , 1 ] = NA # sepal.length 30 개 결측값" ] }, { "cell_type": "code", "execution_count": 6, "id": "a4a48ffc", "metadata": {}, "outputs": [], "source": [ "copy_iris = centralImputation( copy_iris) # NA 중앙값으로 대치" ] }, { "cell_type": "code", "execution_count": 7, "id": "0bba7f55", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
Sepal.Length
0
Sepal.Width
0
Petal.Length
0
Petal.Width
0
Species
0
\n" ], "text/latex": [ "\\begin{description*}\n", "\\item[Sepal.Length] 0\n", "\\item[Sepal.Width] 0\n", "\\item[Petal.Length] 0\n", "\\item[Petal.Width] 0\n", "\\item[Species] 0\n", "\\end{description*}\n" ], "text/markdown": [ "Sepal.Length\n", ": 0Sepal.Width\n", ": 0Petal.Length\n", ": 0Petal.Width\n", ": 0Species\n", ": 0\n", "\n" ], "text/plain": [ "Sepal.Length Sepal.Width Petal.Length Petal.Width Species \n", " 0 0 0 0 0 " ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "## 컬럼별 na 갯수\n", "colSums( is.na( copy_iris) )" ] }, { "cell_type": "markdown", "id": "4851e053", "metadata": {}, "source": [ "### 인접이웃값 대치" ] }, { "cell_type": "code", "execution_count": 12, "id": "1d6e0f0b", "metadata": {}, "outputs": [], "source": [ "copy_iris[ sample( 1:150,30) , 1 ] = NA # sepal.length 30 개 결측값" ] }, { "cell_type": "code", "execution_count": 13, "id": "f28afc2d", "metadata": { "collapsed": true }, "outputs": [ { "data": { "text/html": [ "\n", "\n", "\n", "\t\n", "\t\n", "\n", "\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\n", "
A data.frame: 30 × 5
Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies
<dbl><dbl><dbl><dbl><fct>
2NA3.01.40.2setosa
7NA3.41.40.3setosa
11NA3.71.50.2setosa
15NA4.01.20.2setosa
34NA4.21.40.2setosa
36NA3.21.20.2setosa
38NA3.61.40.1setosa
43NA3.21.30.2setosa
44NA3.51.60.6setosa
47NA3.81.60.2setosa
57NA3.34.71.6versicolor
69NA2.24.51.5versicolor
75NA2.94.31.3versicolor
77NA2.84.81.4versicolor
86NA3.44.51.6versicolor
87NA3.14.71.5versicolor
88NA2.34.41.3versicolor
89NA3.04.11.3versicolor
96NA3.04.21.2versicolor
97NA2.94.21.3versicolor
108NA2.96.31.8virginica
121NA3.25.72.3virginica
126NA3.26.01.8virginica
128NA3.04.91.8virginica
129NA2.85.62.1virginica
131NA2.86.11.9virginica
135NA2.65.61.4virginica
144NA3.25.92.3virginica
145NA3.35.72.5virginica
147NA2.55.01.9virginica
\n" ], "text/latex": [ "A data.frame: 30 × 5\n", "\\begin{tabular}{r|lllll}\n", " & Sepal.Length & Sepal.Width & Petal.Length & Petal.Width & Species\\\\\n", " & & & & & \\\\\n", "\\hline\n", "\t2 & NA & 3.0 & 1.4 & 0.2 & setosa \\\\\n", "\t7 & NA & 3.4 & 1.4 & 0.3 & setosa \\\\\n", "\t11 & NA & 3.7 & 1.5 & 0.2 & setosa \\\\\n", "\t15 & NA & 4.0 & 1.2 & 0.2 & setosa \\\\\n", "\t34 & NA & 4.2 & 1.4 & 0.2 & setosa \\\\\n", "\t36 & NA & 3.2 & 1.2 & 0.2 & setosa \\\\\n", "\t38 & NA & 3.6 & 1.4 & 0.1 & setosa \\\\\n", "\t43 & NA & 3.2 & 1.3 & 0.2 & setosa \\\\\n", "\t44 & NA & 3.5 & 1.6 & 0.6 & setosa \\\\\n", "\t47 & NA & 3.8 & 1.6 & 0.2 & setosa \\\\\n", "\t57 & NA & 3.3 & 4.7 & 1.6 & versicolor\\\\\n", "\t69 & NA & 2.2 & 4.5 & 1.5 & versicolor\\\\\n", "\t75 & NA & 2.9 & 4.3 & 1.3 & versicolor\\\\\n", "\t77 & NA & 2.8 & 4.8 & 1.4 & versicolor\\\\\n", "\t86 & NA & 3.4 & 4.5 & 1.6 & versicolor\\\\\n", "\t87 & NA & 3.1 & 4.7 & 1.5 & versicolor\\\\\n", "\t88 & NA & 2.3 & 4.4 & 1.3 & versicolor\\\\\n", "\t89 & NA & 3.0 & 4.1 & 1.3 & versicolor\\\\\n", "\t96 & NA & 3.0 & 4.2 & 1.2 & versicolor\\\\\n", "\t97 & NA & 2.9 & 4.2 & 1.3 & versicolor\\\\\n", "\t108 & NA & 2.9 & 6.3 & 1.8 & virginica \\\\\n", "\t121 & NA & 3.2 & 5.7 & 2.3 & virginica \\\\\n", "\t126 & NA & 3.2 & 6.0 & 1.8 & virginica \\\\\n", "\t128 & NA & 3.0 & 4.9 & 1.8 & virginica \\\\\n", "\t129 & NA & 2.8 & 5.6 & 2.1 & virginica \\\\\n", "\t131 & NA & 2.8 & 6.1 & 1.9 & virginica \\\\\n", "\t135 & NA & 2.6 & 5.6 & 1.4 & virginica \\\\\n", "\t144 & NA & 3.2 & 5.9 & 2.3 & virginica \\\\\n", "\t145 & NA & 3.3 & 5.7 & 2.5 & virginica \\\\\n", "\t147 & NA & 2.5 & 5.0 & 1.9 & virginica \\\\\n", "\\end{tabular}\n" ], "text/markdown": [ "\n", "A data.frame: 30 × 5\n", "\n", "| | Sepal.Length <dbl> | Sepal.Width <dbl> | Petal.Length <dbl> | Petal.Width <dbl> | Species <fct> |\n", "|---|---|---|---|---|---|\n", "| 2 | NA | 3.0 | 1.4 | 0.2 | setosa |\n", "| 7 | NA | 3.4 | 1.4 | 0.3 | setosa |\n", "| 11 | NA | 3.7 | 1.5 | 0.2 | setosa |\n", "| 15 | NA | 4.0 | 1.2 | 0.2 | setosa |\n", "| 34 | NA | 4.2 | 1.4 | 0.2 | setosa |\n", "| 36 | NA | 3.2 | 1.2 | 0.2 | setosa |\n", "| 38 | NA | 3.6 | 1.4 | 0.1 | setosa |\n", "| 43 | NA | 3.2 | 1.3 | 0.2 | setosa |\n", "| 44 | NA | 3.5 | 1.6 | 0.6 | setosa |\n", "| 47 | NA | 3.8 | 1.6 | 0.2 | setosa |\n", "| 57 | NA | 3.3 | 4.7 | 1.6 | versicolor |\n", "| 69 | NA | 2.2 | 4.5 | 1.5 | versicolor |\n", "| 75 | NA | 2.9 | 4.3 | 1.3 | versicolor |\n", "| 77 | NA | 2.8 | 4.8 | 1.4 | versicolor |\n", "| 86 | NA | 3.4 | 4.5 | 1.6 | versicolor |\n", "| 87 | NA | 3.1 | 4.7 | 1.5 | versicolor |\n", "| 88 | NA | 2.3 | 4.4 | 1.3 | versicolor |\n", "| 89 | NA | 3.0 | 4.1 | 1.3 | versicolor |\n", "| 96 | NA | 3.0 | 4.2 | 1.2 | versicolor |\n", "| 97 | NA | 2.9 | 4.2 | 1.3 | versicolor |\n", "| 108 | NA | 2.9 | 6.3 | 1.8 | virginica |\n", "| 121 | NA | 3.2 | 5.7 | 2.3 | virginica |\n", "| 126 | NA | 3.2 | 6.0 | 1.8 | virginica |\n", "| 128 | NA | 3.0 | 4.9 | 1.8 | virginica |\n", "| 129 | NA | 2.8 | 5.6 | 2.1 | virginica |\n", "| 131 | NA | 2.8 | 6.1 | 1.9 | virginica |\n", "| 135 | NA | 2.6 | 5.6 | 1.4 | virginica |\n", "| 144 | NA | 3.2 | 5.9 | 2.3 | virginica |\n", "| 145 | NA | 3.3 | 5.7 | 2.5 | virginica |\n", "| 147 | NA | 2.5 | 5.0 | 1.9 | virginica |\n", "\n" ], "text/plain": [ " Sepal.Length Sepal.Width Petal.Length Petal.Width Species \n", "2 NA 3.0 1.4 0.2 setosa \n", "7 NA 3.4 1.4 0.3 setosa \n", "11 NA 3.7 1.5 0.2 setosa \n", "15 NA 4.0 1.2 0.2 setosa \n", "34 NA 4.2 1.4 0.2 setosa \n", "36 NA 3.2 1.2 0.2 setosa \n", "38 NA 3.6 1.4 0.1 setosa \n", "43 NA 3.2 1.3 0.2 setosa \n", "44 NA 3.5 1.6 0.6 setosa \n", "47 NA 3.8 1.6 0.2 setosa \n", "57 NA 3.3 4.7 1.6 versicolor\n", "69 NA 2.2 4.5 1.5 versicolor\n", "75 NA 2.9 4.3 1.3 versicolor\n", "77 NA 2.8 4.8 1.4 versicolor\n", "86 NA 3.4 4.5 1.6 versicolor\n", "87 NA 3.1 4.7 1.5 versicolor\n", "88 NA 2.3 4.4 1.3 versicolor\n", "89 NA 3.0 4.1 1.3 versicolor\n", "96 NA 3.0 4.2 1.2 versicolor\n", "97 NA 2.9 4.2 1.3 versicolor\n", "108 NA 2.9 6.3 1.8 virginica \n", "121 NA 3.2 5.7 2.3 virginica \n", "126 NA 3.2 6.0 1.8 virginica \n", "128 NA 3.0 4.9 1.8 virginica \n", "129 NA 2.8 5.6 2.1 virginica \n", "131 NA 2.8 6.1 1.9 virginica \n", "135 NA 2.6 5.6 1.4 virginica \n", "144 NA 3.2 5.9 2.3 virginica \n", "145 NA 3.3 5.7 2.5 virginica \n", "147 NA 2.5 5.0 1.9 virginica " ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "copy_iris[ is.na(copy_iris$Sepal.Length),]" ] }, { "cell_type": "code", "execution_count": 14, "id": "981031d9", "metadata": {}, "outputs": [], "source": [ "copy_iris = knnImputation( copy_iris, k=10) # 인접이웃으로 대치" ] }, { "cell_type": "code", "execution_count": 17, "id": "ec704127", "metadata": { "collapsed": true }, "outputs": [ { "data": { "text/html": [ "\n", "\n", "\n", "\t\n", "\t\n", "\n", "\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\n", "
A data.frame: 5 × 5
Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies
<dbl><dbl><dbl><dbl><fct>
25.1534243.01.40.2setosa
75.1499153.41.40.3setosa
115.2632953.71.50.2setosa
155.2763094.01.20.2setosa
345.3862854.21.40.2setosa
\n" ], "text/latex": [ "A data.frame: 5 × 5\n", "\\begin{tabular}{r|lllll}\n", " & Sepal.Length & Sepal.Width & Petal.Length & Petal.Width & Species\\\\\n", " & & & & & \\\\\n", "\\hline\n", "\t2 & 5.153424 & 3.0 & 1.4 & 0.2 & setosa\\\\\n", "\t7 & 5.149915 & 3.4 & 1.4 & 0.3 & setosa\\\\\n", "\t11 & 5.263295 & 3.7 & 1.5 & 0.2 & setosa\\\\\n", "\t15 & 5.276309 & 4.0 & 1.2 & 0.2 & setosa\\\\\n", "\t34 & 5.386285 & 4.2 & 1.4 & 0.2 & setosa\\\\\n", "\\end{tabular}\n" ], "text/markdown": [ "\n", "A data.frame: 5 × 5\n", "\n", "| | Sepal.Length <dbl> | Sepal.Width <dbl> | Petal.Length <dbl> | Petal.Width <dbl> | Species <fct> |\n", "|---|---|---|---|---|---|\n", "| 2 | 5.153424 | 3.0 | 1.4 | 0.2 | setosa |\n", "| 7 | 5.149915 | 3.4 | 1.4 | 0.3 | setosa |\n", "| 11 | 5.263295 | 3.7 | 1.5 | 0.2 | setosa |\n", "| 15 | 5.276309 | 4.0 | 1.2 | 0.2 | setosa |\n", "| 34 | 5.386285 | 4.2 | 1.4 | 0.2 | setosa |\n", "\n" ], "text/plain": [ " Sepal.Length Sepal.Width Petal.Length Petal.Width Species\n", "2 5.153424 3.0 1.4 0.2 setosa \n", "7 5.149915 3.4 1.4 0.3 setosa \n", "11 5.263295 3.7 1.5 0.2 setosa \n", "15 5.276309 4.0 1.2 0.2 setosa \n", "34 5.386285 4.2 1.4 0.2 setosa " ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "copy_iris[ c(2,7,11,15,34),]" ] }, { "cell_type": "markdown", "id": "390bdfdc", "metadata": {}, "source": [ "### 다중대치법" ] }, { "cell_type": "markdown", "id": "a4cffac2", "metadata": {}, "source": [ "#### 다중 대치법(Multiple Imputation)은 결측값을 처리하는 방법으로, 대치, 분석, 결합이라는 3단계를 거칩니다. 이를 쉽게 설명해볼게요:\n", "\n", "1. 대치 (Imputation)\n", "결측값을 여러 번 대치하는 단계입니다.\n", "\n", "데이터에 결측값(NA)이 있을 때, 그 결측값을 한 번만 채우는 대신 여러 번 채워넣습니다. 예를 들어, 결측값을 하나의 값으로 고정하지 않고, 그 결측값에 대해 여러 번 다른 값으로 대치합니다.\n", "즉, 결측값이 들어간 데이터를 여러 개의 새로운 데이터셋으로 만듭니다. 이때 사용되는 방법은 통계적 모델(회귀모델, 랜덤 포레스트 등)을 이용하여 예측합니다.\n", "\n", "예시:\n", "데이터의 결측값이 NA라고 가정할 때,\n", "\n", "첫 번째 데이터셋에서는 3.1로 대치\n", "두 번째 데이터셋에서는 3.3으로 대치\n", "세 번째 데이터셋에서는 3.5로 대치\n", "\n", "2. 분석 (Analysis)\n", "각 대치된 데이터셋에서 독립적으로 분석을 수행하는 단계입니다.\n", "\n", "여러 번 대치된 각각의 데이터셋에서 동일한 분석(예: 평균 계산, 회귀 분석 등)을 진행합니다.\n", "즉, 결측값을 다르게 채운 각각의 데이터에 대해 동일한 분석을 반복하여 여러 개의 결과를 얻습니다.\n", "예시:\n", "각 대치된 데이터셋에서 평균을 구하는 경우:\n", "\n", "첫 번째 데이터셋의 분석 결과: 평균값 = 5.1\n", "두 번째 데이터셋의 분석 결과: 평균값 = 5.3\n", "세 번째 데이터셋의 분석 결과: 평균값 = 5.2\n", "\n", "\n", "3. 결합 (Combination)\n", "여러 분석 결과를 결합하여 최종 결과를 도출하는 단계입니다.\n", "\n", "각 대치된 데이터셋에서 얻은 결과를 하나로 결합하여 최종 결과를 계산합니다.\n", "이를 통해 결측값으로 인한 불확실성을 반영한 신뢰성 높은 결과를 도출할 수 있습니다.\n", "\n", "예시:\n", "세 개의 대치된 데이터셋에서 나온 평균값을 결합:\n", "\n", "결합된 평균값: 5.2\n", "결합된 평균값에 따른 표준오차나 신뢰구간도 함께 계산됩니다.\n", "\n", "#### 요약:\n", "1. 대치: 결측값을 여러 번 대체하여 다양한 데이터셋을 만듭니다.\n", "2. 분석: 각 대치된 데이터셋에서 독립적으로 분석을 진행합니다.\n", "3. 결합: 각각의 분석 결과를 결합하여 최종 추정치를 도출합니다.\n", "이 과정을 통해, 다중 대치법은 결측값으로 인해 생길 수 있는 분석의 왜곡을 줄이고, 보다 신뢰성 있는 결과를 얻을 수 있게 합니다." ] }, { "cell_type": "markdown", "id": "ed39481a", "metadata": {}, "source": [ "1) 대치" ] }, { "cell_type": "code", "execution_count": 4, "id": "01fd22d1", "metadata": { "collapsed": true }, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "Loading required package: Rcpp\n", "\n", "## \n", "## Amelia II: Multiple Imputation\n", "## (Version 1.8.2, built: 2024-04-10)\n", "## Copyright (C) 2005-2024 James Honaker, Gary King and Matthew Blackwell\n", "## Refer to http://gking.harvard.edu/amelia/ for more information\n", "## \n", "\n" ] }, { "name": "stdout", "output_type": "stream", "text": [ " x y\n", "1 1 NA\n", "2 2 3\n", "3 NA 3\n", "4 4 2\n", "5 5 5\n" ] }, { "name": "stderr", "output_type": "stream", "text": [ "Warning message in amelia_prep(x = x, m = m, idvars = idvars, empri = empri, ts = ts, :\n", "\"You have a small number of observations, relative to the number, of variables in the imputation model. Consider removing some variables, or reducing the order of time polynomials to reduce the number of parameters.\"\n" ] }, { "name": "stdout", "output_type": "stream", "text": [ "-- Imputation 1 --\n", "\n", " 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20\n", " 21 22 23\n", "\n", "-- Imputation 2 --\n", "\n", " 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20\n", " 21 22 23 24 25 26 27 28 29\n", "\n", "-- Imputation 3 --\n", "\n", " 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19\n", "\n", "-- Imputation 4 --\n", "\n", " 1 2 3 4 5 6\n", "\n", "-- Imputation 5 --\n", "\n", " 1 2 3 4 5 6 7 8 9 10 11 12 13\n", "\n" ] } ], "source": [ "library(Amelia)\n", "# 1. 결측값이 있는 데이터 생성\n", "set.seed(123)\n", "data <- data.frame(\n", " x = c(1, 2, NA, 4, 5),\n", " y = c(NA, 3, 3, 2, 5)\n", ")\n", "\n", "# 결측값 확인\n", "print(data)\n", "\n", "# 2. Amelia 패키지 설치 및 로드\n", "# install.packages(\"Amelia\")\n", "\n", "\n", "# 3. 다중 대치 수행\n", "imputed_data <- amelia(data, m = 5)" ] }, { "cell_type": "markdown", "id": "5a9c2a83", "metadata": {}, "source": [ "#### 2.분석" ] }, { "cell_type": "code", "execution_count": 5, "id": "4f59204a", "metadata": { "collapsed": true }, "outputs": [ { "data": { "text/plain": [ "$imp1\n", "\n", "Call:\n", "lm(formula = y ~ x, data = df)\n", "\n", "Residuals:\n", " 1 2 3 4 5 \n", " 0.0004521 0.2590075 0.2589246 -1.5555522 1.0371680 \n", "\n", "Coefficients:\n", " Estimate Std. Error t value Pr(>|t|)\n", "(Intercept) 1.9264 1.0584 1.820 0.166\n", "x 0.4073 0.3347 1.217 0.311\n", "\n", "Residual standard error: 1.1 on 3 degrees of freedom\n", "Multiple R-squared: 0.3305,\tAdjusted R-squared: 0.1073 \n", "F-statistic: 1.481 on 1 and 3 DF, p-value: 0.3107\n", "\n", "\n", "$imp2\n", "\n", "Call:\n", "lm(formula = y ~ x, data = df)\n", "\n", "Residuals:\n", " 1 2 3 4 5 \n", " 0.5829 -0.1293 -0.1293 -1.5556 1.2313 \n", "\n", "Coefficients:\n", " Estimate Std. Error t value Pr(>|t|)\n", "(Intercept) 2.7031 1.1532 2.344 0.101\n", "x 0.2131 0.3647 0.584 0.600\n", "\n", "Residual standard error: 1.198 on 3 degrees of freedom\n", "Multiple R-squared: 0.1022,\tAdjusted R-squared: -0.1971 \n", "F-statistic: 0.3415 on 1 and 3 DF, p-value: 0.6\n", "\n", "\n", "$imp3\n", "\n", "Call:\n", "lm(formula = y ~ x, data = df)\n", "\n", "Residuals:\n", " 1 2 3 4 5 \n", " 0.21379 -0.04459 0.21047 -1.56079 1.18112 \n", "\n", "Coefficients:\n", " Estimate Std. Error t value Pr(>|t|) \n", "(Intercept) 2.5284 0.9666 2.616 0.0793 .\n", "x 0.2581 0.3152 0.819 0.4729 \n", "---\n", "Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1\n", "\n", "Residual standard error: 1.144 on 3 degrees of freedom\n", "Multiple R-squared: 0.1827,\tAdjusted R-squared: -0.08977 \n", "F-statistic: 0.6705 on 1 and 3 DF, p-value: 0.4729\n", "\n", "\n", "$imp4\n", "\n", "Call:\n", "lm(formula = y ~ x, data = df)\n", "\n", "Residuals:\n", " 1 2 3 4 5 \n", " 0.0634 0.2817 -0.5823 -1.2488 1.4860 \n", "\n", "Coefficients:\n", " Estimate Std. Error t value Pr(>|t|)\n", "(Intercept) 2.1879 1.2088 1.810 0.168\n", "x 0.2652 0.3150 0.842 0.462\n", "\n", "Residual standard error: 1.182 on 3 degrees of freedom\n", "Multiple R-squared: 0.1912,\tAdjusted R-squared: -0.07846 \n", "F-statistic: 0.709 on 1 and 3 DF, p-value: 0.4616\n", "\n", "\n", "$imp5\n", "\n", "Call:\n", "lm(formula = y ~ x, data = df)\n", "\n", "Residuals:\n", " 1 2 3 4 5 \n", " 0.25108 -0.02012 0.16783 -1.56354 1.16475 \n", "\n", "Coefficients:\n", " Estimate Std. Error t value Pr(>|t|) \n", "(Intercept) 2.4767 1.0038 2.467 0.0903 .\n", "x 0.2717 0.3249 0.836 0.4644 \n", "---\n", "Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1\n", "\n", "Residual standard error: 1.139 on 3 degrees of freedom\n", "Multiple R-squared: 0.189,\tAdjusted R-squared: -0.08132 \n", "F-statistic: 0.6992 on 1 and 3 DF, p-value: 0.4644\n", "\n" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "# 4. 각 대치된 데이터셋에서 회귀 분석 수행\n", "models <- lapply(imputed_data$imputations, function(df) {\n", " lm(y ~ x, data = df)\n", "})\n", "\n", "# 각 대치된 데이터셋의 회귀 분석 결과 확인\n", "lapply(models, summary)\n" ] }, { "cell_type": "markdown", "id": "e821e666", "metadata": {}, "source": [ "#### 3.결합" ] }, { "cell_type": "code", "execution_count": 6, "id": "588744bf", "metadata": {}, "outputs": [ { "name": "stderr", "output_type": "stream", "text": [ "Installing package into 'C:/Users/medici/AppData/Local/R/win-library/4.4'\n", "(as 'lib' is unspecified)\n", "\n" ] }, { "name": "stdout", "output_type": "stream", "text": [ "package 'mitools' successfully unpacked and MD5 sums checked\n", "\n", "The downloaded binary packages are in\n", "\tC:\\Users\\medici\\AppData\\Local\\Temp\\Rtmp8yk92z\\downloaded_packages\n", "Multiple imputation results:\n", " MIcombine.default(models)\n", " results se (lower upper) missInfo\n", "(Intercept) 2.3644972 1.1330708 0.1384868 4.5905076 9 %\n", "x 0.2830855 0.3409588 -0.3857984 0.9519693 6 %\n" ] } ], "source": [ "# 5. mitools 패키지 설치 및 로드\n", "# install.packages(\"mitools\")\n", "library(mitools)\n", "\n", "# 6. 다중 대치된 회귀 모델의 결과를 결합\n", "combined_results <- MIcombine(models)\n", "\n", "# 7. 최종 결합된 결과 확인\n", "summary(combined_results)\n" ] }, { "cell_type": "code", "execution_count": null, "id": "0f5333d9", "metadata": {}, "outputs": [], "source": [ "결과 해석\n", "대치 (Imputation) 결과:\n", "\n", "imputed_data$imputations[[1]]에서 대치된 첫 번째 데이터셋을 확인할 수 있습니다. Amelia가 결측값을 대치하여 5개의 대치된 데이터셋을 생성했습니다.\n", "분석 (Analysis) 결과:\n", "\n", "각 대치된 데이터셋에서 lm(y ~ x) 회귀 분석을 수행합니다. 각 모델의 회귀 계수와 통계적 유의성을 확인할 수 있습니다.\n", "결합 (Combination) 결과:\n", "\n", "MIcombine() 함수로 각 분석 결과를 결합하여 최종 추정치를 얻습니다. 결합된 결과는 회귀 계수, 표준오차, 신뢰구간을 포함합니다.\n", "이 코드는 Amelia 패키지를 사용하여 다중 대치법을 쉽게 구현할 수 있는 방법을 보여줍니다." ] }, { "cell_type": "markdown", "id": "5698694c", "metadata": {}, "source": [ "## ========================" ] }, { "cell_type": "markdown", "id": "2066bbf0", "metadata": {}, "source": [ "\n", "다중 대치법(Multiple Imputation)은 결측값을 처리하는 통계적 방법 중 하나로, 결측값을 채우는 과정에서 단일 값으로 대치하는 대신 여러 번의 대치를 통해 불확실성을 반영한 데이터를 생성하는 방법입니다. 이 방법은 결측값이 있는 데이터에 대한 분석의 정확도와 신뢰도를 높이는 데 사용됩니다.\n", "\n", "### 다중 대치법의 주요 개념\n", "1. 결측값의 불확실성 반영:\n", "\n", "결측값이 있는 데이터를 다룰 때, 하나의 값으로 대치하는 경우(단순 대치법) 해당 값이 불확실성을 충분히 반영하지 못할 수 있습니다. 다중 대치법은 동일한 결측값에 대해 여러 개의 대체값을 생성하여 그 불확실성을 더 잘 반영합니다.\n", "\n", "2. 여러 번의 대치:\n", "\n", "다중 대치법에서는 결측값이 있는 데이터를 여러 번(보통 3회에서 5회) 대치합니다. 이렇게 생성된 각 대치 데이터셋은 결측값이 다른 방식으로 채워진 서로 다른 버전의 데이터입니다.\n", "\n", "3. 독립적인 분석 수행:\n", "\n", "대치된 각 데이터셋에 대해 독립적으로 분석을 수행합니다. 예를 들어, 회귀 분석이나 평균값 계산 등을 각 대치된 데이터셋에서 개별적으로 실행합니다.\n", "\n", "4. 결과 결합:\n", "\n", "각각의 대치된 데이터셋에서 나온 분석 결과를 종합하여 최종 결과를 얻습니다. 이를 통해 결측값에 대한 불확실성을 반영한 더 정확한 추정값과 신뢰구간을 계산할 수 있습니다.\n", "\n", "### 다중 대치법의 과정\n", "다중 대치법은 3단계로 나눌 수 있습니다:\n", "\n", "1. 대치(Imputation):\n", "\n", "결측값을 가진 데이터를 기반으로 여러 번의 대치값을 생성합니다. 이는 결측값을 통계적 모델(회귀모델, 랜덤 포레스트 등)을 사용해 예측하는 방식으로 이루어집니다. 이 과정에서 데이터의 패턴과 특성을 반영하여 결측값을 채웁니다.\n", "\n", "2. 독립적인 분석:\n", "\n", "대치된 각 데이터셋에 대해 분석을 독립적으로 수행합니다. 예를 들어, 평균값 계산, 회귀 분석 등을 각 대치 데이터셋에서 수행합니다.\n", "\n", "3. 결과 결합:\n", "\n", "각 대치된 데이터셋에서 나온 분석 결과를 하나의 결합된 추정값으로 통합합니다. 결합된 결과는 평균 추정치와 불확실성을 반영한 분산을 고려하여 최종 분석 결과를 제공합니다.\n", "\n", "#### 장점\n", "- 불확실성 반영: 다중 대치법은 단일 대치법보다 결측값에 대한 불확실성을 더 잘 반영합니다.\n", "- 편향 감소: 단순 대치법에서는 결측값을 고정된 하나의 값으로 채우기 때문에 편향이 발생할 수 있지만, 다중 대치법은 다양한 대치값을 사용하여 이러한 편향을 줄일 수 있습니다.\n", "- 통계적 유효성 유지: 결측값이 있는 데이터를 무시하거나 단일 값으로 대치하는 대신, 데이터를 최대한 활용하여 통계적 유효성을 유지할 수 있습니다.\n", "\n", "#### 단점\n", "- - 복잡성: 다중 대치법은 구현이 상대적으로 복잡하며, 대치 모델을 적절하게 선택해야 하는 어려움이 있습니다.\n", "계산 비용: 다중 대치법은 대치 과정을 여러 번 반복해야 하기 때문에 계산 비용이 증가할 수 있습니다.\n", "#### 다중 대치법을 사용하는 패키지\n", "- R: mice 패키지, Amelia 패키지\n", "- Python: fancyimpute, impyute" ] }, { "cell_type": "markdown", "id": "7afd54d5", "metadata": {}, "source": [ "### 각각의 추정치:\n", "- (Intercept): 절편에 대한 추정치\n", "\n", "- Estimate (results): 0.6767929\n", "- Standard Error (se): 4.523700\n", "- 95% 신뢰구간: [-10.542190, 11.895776]\n", "- 결측 정보: 88%\n", "- x: x 변수에 대한 추정치\n", "\n", "- Estimate (results): 0.6848302\n", "- Standard Error (se): 1.083126\n", "- 95% 신뢰구간: [-1.887488, 3.257148]\n", "- 결측 정보: 81%\n", "\n", "### 결론:\n", "- Estimate 값: 결측값을 대치할 때 사용할 추정치는 results 열에 있는 값.\n", "- (Intercept): 0.6767929\n", "- x: 0.6848302\n", "- 즉, x 변수의 결측값을 대치할 때 최종 추정치는 **0.6848302**" ] }, { "cell_type": "code", "execution_count": 34, "id": "2443881d", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Multiple imputation results:\n", " MIcombine.default(imputation_models)\n", " results se (lower upper) missInfo\n", "(Intercept) 0.6767929 4.523700 -10.542190 11.895776 88 %\n", "x 0.6848302 1.083126 -1.887488 3.257148 81 %\n", " results se (lower upper) missInfo\n", "(Intercept) 0.6767929 4.523700 -10.542190 11.895776 88 %\n", "x 0.6848302 1.083126 -1.887488 3.257148 81 %\n" ] } ], "source": [ "print( summary(combined_results))" ] }, { "cell_type": "code", "execution_count": 21, "id": "7693cace", "metadata": { "collapsed": true }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "-- Imputation 1 --\n", "\n", " 1 2 3\n", "\n", "-- Imputation 2 --\n", "\n", " 1 2 3\n", "\n", "-- Imputation 3 --\n", "\n", " 1 2 3\n", "\n" ] }, { "data": { "text/plain": [ "\n", "Amelia output with 3 imputed datasets.\n", "Return code: 1 \n", "Message: Normal EM convergence. \n", "\n", "Chain Lengths:\n", "--------------\n", "Imputation 1: 3\n", "Imputation 2: 3\n", "Imputation 3: 3\n" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "copy_iris = iris\n", "copy_iris[ sample( 1:150,30) , 1 ] = NA # sepal.length 30 개 결측값\n", "library( Amelia )\n", "iris_impl = amelia( copy_iris, m=3, cs='Species')\n", "iris_impl" ] }, { "cell_type": "markdown", "id": "b3333b30", "metadata": {}, "source": [ "#### iris_impl = amelia(copy_iris, m=3, cs='Species'):\n", "\n", "- amelia() 함수는 결측값을 다중 대치하는 함수입니다. 여기서 주요 인수는 다음과 같습니다:\n", "- copy_iris: 결측값을 포함한 데이터프레임.\n", "- m=3: 3개의 대치된 데이터셋을 생성합니다. 즉, 결측값에 대해 3개의 다른 대체값 세트를 생성하여 각각의 대체값으로 데이터를 보완합니다.\n", "- cs='Species': 종(Species)을 대치할 때 그룹화 기준으로 사용합니다. 즉, 각 종별로 결측값을 대치합니다.\n", "- iris_impl:\n", "iris_impl은 amelia() 함수의 결과로서, 다중 대치된 데이터를 포함한 리스트 객체입니다. 이 리스트에는 대치된 데이터가 포함되어 있으며, 3개의 서로 다른 대치된 버전이 들어 있습니다." ] }, { "cell_type": "markdown", "id": "c7ba9972", "metadata": {}, "source": [ "#### 결과 해석\n", "iris_impl 객체에는 다음과 같은 중요한 정보가 포함되어 있습니다:\n", "\n", "1) $imputations:\n", "\n", "- iris_impl\\\\$imputations는 대치된 3개의 데이터프레임을 포함하고 있습니다. 각 데이터프레임은 결측값을 다르게 처리한 데이터셋으로, 이를 통해 불확실성을 반영한 예측이나 분석을 할 수 있습니다.\n", "예를 들어, iris_impl\\\\$imputations[[1]]는 첫 번째 대치된 데이터셋을 의미합니다.\n", "\n", "2) $missmap:\n", "\n", "- iris_impl\\\\$missmap은 결측값의 위치를 시각화한 그래프입니다. 이 그래프를 통해 결측값의 패턴을 쉽게 파악할 수 있습니다.\n", "3) $iterations:\n", "\n", "- 다중 대치를 수행한 반복 횟수를 나타냅니다. 이 값은 알고리즘이 수렴할 때까지 얼마나 반복했는지를 보여줍니다.\n", "\n", "#### 대치된 데이터의 해석:\n", "\n", "amelia() 함수를 사용하여 결측값을 다중 대치하면, 결측값에 대한 불확실성을 반영한 여러 버전의 데이터를 생성합니다. 이를 통해 결측값이 전체 분석에 미치는 영향을 줄이고, 통계적 추정치를 더욱 신뢰성 있게 만들 수 있습니다. 각 대치된 데이터셋에서 얻은 결과를 결합하여 최종 분석 결과를 도출할 수 있습니다." ] }, { "cell_type": "code", "execution_count": 25, "id": "852e6e60", "metadata": { "collapsed": true }, "outputs": [ { "data": { "text/html": [ "
\n", "\t
$imp1
\n", "\t\t
\n", "\n", "\n", "\t\n", "\t\n", "\n", "\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\n", "
A data.frame: 150 × 5
Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies
<dbl><dbl><dbl><dbl><fct>
5.1000003.51.40.2setosa
4.9000003.01.40.2setosa
4.7000003.21.30.2setosa
4.7506643.11.50.2setosa
5.0000003.61.40.2setosa
5.4000003.91.70.4setosa
4.6000003.41.40.3setosa
5.0000003.41.50.2setosa
4.4000002.91.40.2setosa
4.9000003.11.50.1setosa
5.4000003.71.50.2setosa
4.8000003.41.60.2setosa
4.8000003.01.40.1setosa
4.3000003.01.10.1setosa
5.0319584.01.20.2setosa
5.7000004.41.50.4setosa
5.4000003.91.30.4setosa
5.1000003.51.40.3setosa
5.7000003.81.70.3setosa
5.2782593.81.50.3setosa
5.4000003.41.70.2setosa
5.1000003.71.50.4setosa
4.6000003.61.00.2setosa
5.3879813.31.70.5setosa
5.0085323.41.90.2setosa
5.0000003.01.60.2setosa
4.9449293.41.60.4setosa
5.2000003.51.50.2setosa
5.2000003.41.40.2setosa
4.7000003.21.60.2setosa
6.9000003.25.72.3virginica
5.6000002.84.92.0virginica
7.7000002.86.72.0virginica
6.3000002.74.91.8virginica
6.7000003.35.72.1virginica
7.2000003.26.01.8virginica
6.2000002.84.81.8virginica
6.1000003.04.91.8virginica
6.4000002.85.62.1virginica
7.2000003.05.81.6virginica
7.4000002.86.11.9virginica
7.9000003.86.42.0virginica
6.4453902.85.62.2virginica
6.3000002.85.11.5virginica
6.7852792.65.61.4virginica
7.5394363.06.12.3virginica
6.3000003.45.62.4virginica
6.7274523.15.51.8virginica
6.0000003.04.81.8virginica
6.9000003.15.42.1virginica
6.7000003.15.62.4virginica
6.9000003.15.12.3virginica
5.7101252.75.11.9virginica
6.6969503.25.92.3virginica
6.7000003.35.72.5virginica
6.7000003.05.22.3virginica
6.3000002.55.01.9virginica
5.7268693.05.22.0virginica
6.2000003.45.42.3virginica
5.9000003.05.11.8virginica
\n", "
\n", "\t
$imp2
\n", "\t\t
\n", "\n", "\n", "\t\n", "\t\n", "\n", "\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\n", "
A data.frame: 150 × 5
Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies
<dbl><dbl><dbl><dbl><fct>
5.1000003.51.40.2setosa
4.9000003.01.40.2setosa
4.7000003.21.30.2setosa
4.4858723.11.50.2setosa
5.0000003.61.40.2setosa
5.4000003.91.70.4setosa
4.6000003.41.40.3setosa
5.0000003.41.50.2setosa
4.4000002.91.40.2setosa
4.9000003.11.50.1setosa
5.4000003.71.50.2setosa
4.8000003.41.60.2setosa
4.8000003.01.40.1setosa
4.3000003.01.10.1setosa
5.6290674.01.20.2setosa
5.7000004.41.50.4setosa
5.4000003.91.30.4setosa
5.1000003.51.40.3setosa
5.7000003.81.70.3setosa
5.3249673.81.50.3setosa
5.4000003.41.70.2setosa
5.1000003.71.50.4setosa
4.6000003.61.00.2setosa
4.6959923.31.70.5setosa
5.3115053.41.90.2setosa
5.0000003.01.60.2setosa
5.1615423.41.60.4setosa
5.2000003.51.50.2setosa
5.2000003.41.40.2setosa
4.7000003.21.60.2setosa
6.9000003.25.72.3virginica
5.6000002.84.92.0virginica
7.7000002.86.72.0virginica
6.3000002.74.91.8virginica
6.7000003.35.72.1virginica
7.2000003.26.01.8virginica
6.2000002.84.81.8virginica
6.1000003.04.91.8virginica
6.4000002.85.62.1virginica
7.2000003.05.81.6virginica
7.4000002.86.11.9virginica
7.9000003.86.42.0virginica
6.3416182.85.62.2virginica
6.3000002.85.11.5virginica
7.0536592.65.61.4virginica
6.8519793.06.12.3virginica
6.3000003.45.62.4virginica
6.2510323.15.51.8virginica
6.0000003.04.81.8virginica
6.9000003.15.42.1virginica
6.7000003.15.62.4virginica
6.9000003.15.12.3virginica
6.3275002.75.11.9virginica
6.6781283.25.92.3virginica
6.7000003.35.72.5virginica
6.7000003.05.22.3virginica
6.3000002.55.01.9virginica
6.1908153.05.22.0virginica
6.2000003.45.42.3virginica
5.9000003.05.11.8virginica
\n", "
\n", "\t
$imp3
\n", "\t\t
\n", "\n", "\n", "\t\n", "\t\n", "\n", "\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\t\n", "\n", "
A data.frame: 150 × 5
Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies
<dbl><dbl><dbl><dbl><fct>
5.1000003.51.40.2setosa
4.9000003.01.40.2setosa
4.7000003.21.30.2setosa
4.3147373.11.50.2setosa
5.0000003.61.40.2setosa
5.4000003.91.70.4setosa
4.6000003.41.40.3setosa
5.0000003.41.50.2setosa
4.4000002.91.40.2setosa
4.9000003.11.50.1setosa
5.4000003.71.50.2setosa
4.8000003.41.60.2setosa
4.8000003.01.40.1setosa
4.3000003.01.10.1setosa
4.8273504.01.20.2setosa
5.7000004.41.50.4setosa
5.4000003.91.30.4setosa
5.1000003.51.40.3setosa
5.7000003.81.70.3setosa
4.9353753.81.50.3setosa
5.4000003.41.70.2setosa
5.1000003.71.50.4setosa
4.6000003.61.00.2setosa
5.3442303.31.70.5setosa
5.1338713.41.90.2setosa
5.0000003.01.60.2setosa
4.4129163.41.60.4setosa
5.2000003.51.50.2setosa
5.2000003.41.40.2setosa
4.7000003.21.60.2setosa
6.9000003.25.72.3virginica
5.6000002.84.92.0virginica
7.7000002.86.72.0virginica
6.3000002.74.91.8virginica
6.7000003.35.72.1virginica
7.2000003.26.01.8virginica
6.2000002.84.81.8virginica
6.1000003.04.91.8virginica
6.4000002.85.62.1virginica
7.2000003.05.81.6virginica
7.4000002.86.11.9virginica
7.9000003.86.42.0virginica
6.7294482.85.62.2virginica
6.3000002.85.11.5virginica
6.8492282.65.61.4virginica
6.4022393.06.12.3virginica
6.3000003.45.62.4virginica
6.9749393.15.51.8virginica
6.0000003.04.81.8virginica
6.9000003.15.42.1virginica
6.7000003.15.62.4virginica
6.9000003.15.12.3virginica
6.0895702.75.11.9virginica
6.6872453.25.92.3virginica
6.7000003.35.72.5virginica
6.7000003.05.22.3virginica
6.3000002.55.01.9virginica
6.0366333.05.22.0virginica
6.2000003.45.42.3virginica
5.9000003.05.11.8virginica
\n", "
\n", "
\n" ], "text/latex": [ "\\begin{description}\n", "\\item[\\$imp1] A data.frame: 150 × 5\n", "\\begin{tabular}{lllll}\n", " Sepal.Length & Sepal.Width & Petal.Length & Petal.Width & Species\\\\\n", " & & & & \\\\\n", "\\hline\n", "\t 5.100000 & 3.5 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.900000 & 3.0 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.700000 & 3.2 & 1.3 & 0.2 & setosa\\\\\n", "\t 4.750664 & 3.1 & 1.5 & 0.2 & setosa\\\\\n", "\t 5.000000 & 3.6 & 1.4 & 0.2 & setosa\\\\\n", "\t 5.400000 & 3.9 & 1.7 & 0.4 & setosa\\\\\n", "\t 4.600000 & 3.4 & 1.4 & 0.3 & setosa\\\\\n", "\t 5.000000 & 3.4 & 1.5 & 0.2 & setosa\\\\\n", "\t 4.400000 & 2.9 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.900000 & 3.1 & 1.5 & 0.1 & setosa\\\\\n", "\t 5.400000 & 3.7 & 1.5 & 0.2 & setosa\\\\\n", "\t 4.800000 & 3.4 & 1.6 & 0.2 & setosa\\\\\n", "\t 4.800000 & 3.0 & 1.4 & 0.1 & setosa\\\\\n", "\t 4.300000 & 3.0 & 1.1 & 0.1 & setosa\\\\\n", "\t 5.031958 & 4.0 & 1.2 & 0.2 & setosa\\\\\n", "\t 5.700000 & 4.4 & 1.5 & 0.4 & setosa\\\\\n", "\t 5.400000 & 3.9 & 1.3 & 0.4 & setosa\\\\\n", "\t 5.100000 & 3.5 & 1.4 & 0.3 & setosa\\\\\n", "\t 5.700000 & 3.8 & 1.7 & 0.3 & setosa\\\\\n", "\t 5.278259 & 3.8 & 1.5 & 0.3 & setosa\\\\\n", "\t 5.400000 & 3.4 & 1.7 & 0.2 & setosa\\\\\n", "\t 5.100000 & 3.7 & 1.5 & 0.4 & setosa\\\\\n", "\t 4.600000 & 3.6 & 1.0 & 0.2 & setosa\\\\\n", "\t 5.387981 & 3.3 & 1.7 & 0.5 & setosa\\\\\n", "\t 5.008532 & 3.4 & 1.9 & 0.2 & setosa\\\\\n", "\t 5.000000 & 3.0 & 1.6 & 0.2 & setosa\\\\\n", "\t 4.944929 & 3.4 & 1.6 & 0.4 & setosa\\\\\n", "\t 5.200000 & 3.5 & 1.5 & 0.2 & setosa\\\\\n", "\t 5.200000 & 3.4 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.700000 & 3.2 & 1.6 & 0.2 & setosa\\\\\n", "\t ⋮ & ⋮ & ⋮ & ⋮ & ⋮\\\\\n", "\t 6.900000 & 3.2 & 5.7 & 2.3 & virginica\\\\\n", "\t 5.600000 & 2.8 & 4.9 & 2.0 & virginica\\\\\n", "\t 7.700000 & 2.8 & 6.7 & 2.0 & virginica\\\\\n", "\t 6.300000 & 2.7 & 4.9 & 1.8 & virginica\\\\\n", "\t 6.700000 & 3.3 & 5.7 & 2.1 & virginica\\\\\n", "\t 7.200000 & 3.2 & 6.0 & 1.8 & virginica\\\\\n", "\t 6.200000 & 2.8 & 4.8 & 1.8 & virginica\\\\\n", "\t 6.100000 & 3.0 & 4.9 & 1.8 & virginica\\\\\n", "\t 6.400000 & 2.8 & 5.6 & 2.1 & virginica\\\\\n", "\t 7.200000 & 3.0 & 5.8 & 1.6 & virginica\\\\\n", "\t 7.400000 & 2.8 & 6.1 & 1.9 & virginica\\\\\n", "\t 7.900000 & 3.8 & 6.4 & 2.0 & virginica\\\\\n", "\t 6.445390 & 2.8 & 5.6 & 2.2 & virginica\\\\\n", "\t 6.300000 & 2.8 & 5.1 & 1.5 & virginica\\\\\n", "\t 6.785279 & 2.6 & 5.6 & 1.4 & virginica\\\\\n", "\t 7.539436 & 3.0 & 6.1 & 2.3 & virginica\\\\\n", "\t 6.300000 & 3.4 & 5.6 & 2.4 & virginica\\\\\n", "\t 6.727452 & 3.1 & 5.5 & 1.8 & virginica\\\\\n", "\t 6.000000 & 3.0 & 4.8 & 1.8 & virginica\\\\\n", "\t 6.900000 & 3.1 & 5.4 & 2.1 & virginica\\\\\n", "\t 6.700000 & 3.1 & 5.6 & 2.4 & virginica\\\\\n", "\t 6.900000 & 3.1 & 5.1 & 2.3 & virginica\\\\\n", "\t 5.710125 & 2.7 & 5.1 & 1.9 & virginica\\\\\n", "\t 6.696950 & 3.2 & 5.9 & 2.3 & virginica\\\\\n", "\t 6.700000 & 3.3 & 5.7 & 2.5 & virginica\\\\\n", "\t 6.700000 & 3.0 & 5.2 & 2.3 & virginica\\\\\n", "\t 6.300000 & 2.5 & 5.0 & 1.9 & virginica\\\\\n", "\t 5.726869 & 3.0 & 5.2 & 2.0 & virginica\\\\\n", "\t 6.200000 & 3.4 & 5.4 & 2.3 & virginica\\\\\n", "\t 5.900000 & 3.0 & 5.1 & 1.8 & virginica\\\\\n", "\\end{tabular}\n", "\n", "\\item[\\$imp2] A data.frame: 150 × 5\n", "\\begin{tabular}{lllll}\n", " Sepal.Length & Sepal.Width & Petal.Length & Petal.Width & Species\\\\\n", " & & & & \\\\\n", "\\hline\n", "\t 5.100000 & 3.5 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.900000 & 3.0 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.700000 & 3.2 & 1.3 & 0.2 & setosa\\\\\n", "\t 4.485872 & 3.1 & 1.5 & 0.2 & setosa\\\\\n", "\t 5.000000 & 3.6 & 1.4 & 0.2 & setosa\\\\\n", "\t 5.400000 & 3.9 & 1.7 & 0.4 & setosa\\\\\n", "\t 4.600000 & 3.4 & 1.4 & 0.3 & setosa\\\\\n", "\t 5.000000 & 3.4 & 1.5 & 0.2 & setosa\\\\\n", "\t 4.400000 & 2.9 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.900000 & 3.1 & 1.5 & 0.1 & setosa\\\\\n", "\t 5.400000 & 3.7 & 1.5 & 0.2 & setosa\\\\\n", "\t 4.800000 & 3.4 & 1.6 & 0.2 & setosa\\\\\n", "\t 4.800000 & 3.0 & 1.4 & 0.1 & setosa\\\\\n", "\t 4.300000 & 3.0 & 1.1 & 0.1 & setosa\\\\\n", "\t 5.629067 & 4.0 & 1.2 & 0.2 & setosa\\\\\n", "\t 5.700000 & 4.4 & 1.5 & 0.4 & setosa\\\\\n", "\t 5.400000 & 3.9 & 1.3 & 0.4 & setosa\\\\\n", "\t 5.100000 & 3.5 & 1.4 & 0.3 & setosa\\\\\n", "\t 5.700000 & 3.8 & 1.7 & 0.3 & setosa\\\\\n", "\t 5.324967 & 3.8 & 1.5 & 0.3 & setosa\\\\\n", "\t 5.400000 & 3.4 & 1.7 & 0.2 & setosa\\\\\n", "\t 5.100000 & 3.7 & 1.5 & 0.4 & setosa\\\\\n", "\t 4.600000 & 3.6 & 1.0 & 0.2 & setosa\\\\\n", "\t 4.695992 & 3.3 & 1.7 & 0.5 & setosa\\\\\n", "\t 5.311505 & 3.4 & 1.9 & 0.2 & setosa\\\\\n", "\t 5.000000 & 3.0 & 1.6 & 0.2 & setosa\\\\\n", "\t 5.161542 & 3.4 & 1.6 & 0.4 & setosa\\\\\n", "\t 5.200000 & 3.5 & 1.5 & 0.2 & setosa\\\\\n", "\t 5.200000 & 3.4 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.700000 & 3.2 & 1.6 & 0.2 & setosa\\\\\n", "\t ⋮ & ⋮ & ⋮ & ⋮ & ⋮\\\\\n", "\t 6.900000 & 3.2 & 5.7 & 2.3 & virginica\\\\\n", "\t 5.600000 & 2.8 & 4.9 & 2.0 & virginica\\\\\n", "\t 7.700000 & 2.8 & 6.7 & 2.0 & virginica\\\\\n", "\t 6.300000 & 2.7 & 4.9 & 1.8 & virginica\\\\\n", "\t 6.700000 & 3.3 & 5.7 & 2.1 & virginica\\\\\n", "\t 7.200000 & 3.2 & 6.0 & 1.8 & virginica\\\\\n", "\t 6.200000 & 2.8 & 4.8 & 1.8 & virginica\\\\\n", "\t 6.100000 & 3.0 & 4.9 & 1.8 & virginica\\\\\n", "\t 6.400000 & 2.8 & 5.6 & 2.1 & virginica\\\\\n", "\t 7.200000 & 3.0 & 5.8 & 1.6 & virginica\\\\\n", "\t 7.400000 & 2.8 & 6.1 & 1.9 & virginica\\\\\n", "\t 7.900000 & 3.8 & 6.4 & 2.0 & virginica\\\\\n", "\t 6.341618 & 2.8 & 5.6 & 2.2 & virginica\\\\\n", "\t 6.300000 & 2.8 & 5.1 & 1.5 & virginica\\\\\n", "\t 7.053659 & 2.6 & 5.6 & 1.4 & virginica\\\\\n", "\t 6.851979 & 3.0 & 6.1 & 2.3 & virginica\\\\\n", "\t 6.300000 & 3.4 & 5.6 & 2.4 & virginica\\\\\n", "\t 6.251032 & 3.1 & 5.5 & 1.8 & virginica\\\\\n", "\t 6.000000 & 3.0 & 4.8 & 1.8 & virginica\\\\\n", "\t 6.900000 & 3.1 & 5.4 & 2.1 & virginica\\\\\n", "\t 6.700000 & 3.1 & 5.6 & 2.4 & virginica\\\\\n", "\t 6.900000 & 3.1 & 5.1 & 2.3 & virginica\\\\\n", "\t 6.327500 & 2.7 & 5.1 & 1.9 & virginica\\\\\n", "\t 6.678128 & 3.2 & 5.9 & 2.3 & virginica\\\\\n", "\t 6.700000 & 3.3 & 5.7 & 2.5 & virginica\\\\\n", "\t 6.700000 & 3.0 & 5.2 & 2.3 & virginica\\\\\n", "\t 6.300000 & 2.5 & 5.0 & 1.9 & virginica\\\\\n", "\t 6.190815 & 3.0 & 5.2 & 2.0 & virginica\\\\\n", "\t 6.200000 & 3.4 & 5.4 & 2.3 & virginica\\\\\n", "\t 5.900000 & 3.0 & 5.1 & 1.8 & virginica\\\\\n", "\\end{tabular}\n", "\n", "\\item[\\$imp3] A data.frame: 150 × 5\n", "\\begin{tabular}{lllll}\n", " Sepal.Length & Sepal.Width & Petal.Length & Petal.Width & Species\\\\\n", " & & & & \\\\\n", "\\hline\n", "\t 5.100000 & 3.5 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.900000 & 3.0 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.700000 & 3.2 & 1.3 & 0.2 & setosa\\\\\n", "\t 4.314737 & 3.1 & 1.5 & 0.2 & setosa\\\\\n", "\t 5.000000 & 3.6 & 1.4 & 0.2 & setosa\\\\\n", "\t 5.400000 & 3.9 & 1.7 & 0.4 & setosa\\\\\n", "\t 4.600000 & 3.4 & 1.4 & 0.3 & setosa\\\\\n", "\t 5.000000 & 3.4 & 1.5 & 0.2 & setosa\\\\\n", "\t 4.400000 & 2.9 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.900000 & 3.1 & 1.5 & 0.1 & setosa\\\\\n", "\t 5.400000 & 3.7 & 1.5 & 0.2 & setosa\\\\\n", "\t 4.800000 & 3.4 & 1.6 & 0.2 & setosa\\\\\n", "\t 4.800000 & 3.0 & 1.4 & 0.1 & setosa\\\\\n", "\t 4.300000 & 3.0 & 1.1 & 0.1 & setosa\\\\\n", "\t 4.827350 & 4.0 & 1.2 & 0.2 & setosa\\\\\n", "\t 5.700000 & 4.4 & 1.5 & 0.4 & setosa\\\\\n", "\t 5.400000 & 3.9 & 1.3 & 0.4 & setosa\\\\\n", "\t 5.100000 & 3.5 & 1.4 & 0.3 & setosa\\\\\n", "\t 5.700000 & 3.8 & 1.7 & 0.3 & setosa\\\\\n", "\t 4.935375 & 3.8 & 1.5 & 0.3 & setosa\\\\\n", "\t 5.400000 & 3.4 & 1.7 & 0.2 & setosa\\\\\n", "\t 5.100000 & 3.7 & 1.5 & 0.4 & setosa\\\\\n", "\t 4.600000 & 3.6 & 1.0 & 0.2 & setosa\\\\\n", "\t 5.344230 & 3.3 & 1.7 & 0.5 & setosa\\\\\n", "\t 5.133871 & 3.4 & 1.9 & 0.2 & setosa\\\\\n", "\t 5.000000 & 3.0 & 1.6 & 0.2 & setosa\\\\\n", "\t 4.412916 & 3.4 & 1.6 & 0.4 & setosa\\\\\n", "\t 5.200000 & 3.5 & 1.5 & 0.2 & setosa\\\\\n", "\t 5.200000 & 3.4 & 1.4 & 0.2 & setosa\\\\\n", "\t 4.700000 & 3.2 & 1.6 & 0.2 & setosa\\\\\n", "\t ⋮ & ⋮ & ⋮ & ⋮ & ⋮\\\\\n", "\t 6.900000 & 3.2 & 5.7 & 2.3 & virginica\\\\\n", "\t 5.600000 & 2.8 & 4.9 & 2.0 & virginica\\\\\n", "\t 7.700000 & 2.8 & 6.7 & 2.0 & virginica\\\\\n", "\t 6.300000 & 2.7 & 4.9 & 1.8 & virginica\\\\\n", "\t 6.700000 & 3.3 & 5.7 & 2.1 & virginica\\\\\n", "\t 7.200000 & 3.2 & 6.0 & 1.8 & virginica\\\\\n", "\t 6.200000 & 2.8 & 4.8 & 1.8 & virginica\\\\\n", "\t 6.100000 & 3.0 & 4.9 & 1.8 & virginica\\\\\n", "\t 6.400000 & 2.8 & 5.6 & 2.1 & virginica\\\\\n", "\t 7.200000 & 3.0 & 5.8 & 1.6 & virginica\\\\\n", "\t 7.400000 & 2.8 & 6.1 & 1.9 & virginica\\\\\n", "\t 7.900000 & 3.8 & 6.4 & 2.0 & virginica\\\\\n", "\t 6.729448 & 2.8 & 5.6 & 2.2 & virginica\\\\\n", "\t 6.300000 & 2.8 & 5.1 & 1.5 & virginica\\\\\n", "\t 6.849228 & 2.6 & 5.6 & 1.4 & virginica\\\\\n", "\t 6.402239 & 3.0 & 6.1 & 2.3 & virginica\\\\\n", "\t 6.300000 & 3.4 & 5.6 & 2.4 & virginica\\\\\n", "\t 6.974939 & 3.1 & 5.5 & 1.8 & virginica\\\\\n", "\t 6.000000 & 3.0 & 4.8 & 1.8 & virginica\\\\\n", "\t 6.900000 & 3.1 & 5.4 & 2.1 & virginica\\\\\n", "\t 6.700000 & 3.1 & 5.6 & 2.4 & virginica\\\\\n", "\t 6.900000 & 3.1 & 5.1 & 2.3 & virginica\\\\\n", "\t 6.089570 & 2.7 & 5.1 & 1.9 & virginica\\\\\n", "\t 6.687245 & 3.2 & 5.9 & 2.3 & virginica\\\\\n", "\t 6.700000 & 3.3 & 5.7 & 2.5 & virginica\\\\\n", "\t 6.700000 & 3.0 & 5.2 & 2.3 & virginica\\\\\n", "\t 6.300000 & 2.5 & 5.0 & 1.9 & virginica\\\\\n", "\t 6.036633 & 3.0 & 5.2 & 2.0 & virginica\\\\\n", "\t 6.200000 & 3.4 & 5.4 & 2.3 & virginica\\\\\n", "\t 5.900000 & 3.0 & 5.1 & 1.8 & virginica\\\\\n", "\\end{tabular}\n", "\n", "\\end{description}\n" ], "text/markdown": [ "$imp1\n", ": \n", "A data.frame: 150 × 5\n", "\n", "| Sepal.Length <dbl> | Sepal.Width <dbl> | Petal.Length <dbl> | Petal.Width <dbl> | Species <fct> |\n", "|---|---|---|---|---|\n", "| 5.100000 | 3.5 | 1.4 | 0.2 | setosa |\n", "| 4.900000 | 3.0 | 1.4 | 0.2 | setosa |\n", "| 4.700000 | 3.2 | 1.3 | 0.2 | setosa |\n", "| 4.750664 | 3.1 | 1.5 | 0.2 | setosa |\n", "| 5.000000 | 3.6 | 1.4 | 0.2 | setosa |\n", "| 5.400000 | 3.9 | 1.7 | 0.4 | setosa |\n", "| 4.600000 | 3.4 | 1.4 | 0.3 | setosa |\n", "| 5.000000 | 3.4 | 1.5 | 0.2 | setosa |\n", "| 4.400000 | 2.9 | 1.4 | 0.2 | setosa |\n", "| 4.900000 | 3.1 | 1.5 | 0.1 | setosa |\n", "| 5.400000 | 3.7 | 1.5 | 0.2 | setosa |\n", "| 4.800000 | 3.4 | 1.6 | 0.2 | setosa |\n", "| 4.800000 | 3.0 | 1.4 | 0.1 | setosa |\n", "| 4.300000 | 3.0 | 1.1 | 0.1 | setosa |\n", "| 5.031958 | 4.0 | 1.2 | 0.2 | setosa |\n", "| 5.700000 | 4.4 | 1.5 | 0.4 | setosa |\n", "| 5.400000 | 3.9 | 1.3 | 0.4 | setosa |\n", "| 5.100000 | 3.5 | 1.4 | 0.3 | setosa |\n", "| 5.700000 | 3.8 | 1.7 | 0.3 | setosa |\n", "| 5.278259 | 3.8 | 1.5 | 0.3 | setosa |\n", "| 5.400000 | 3.4 | 1.7 | 0.2 | setosa |\n", "| 5.100000 | 3.7 | 1.5 | 0.4 | setosa |\n", "| 4.600000 | 3.6 | 1.0 | 0.2 | setosa |\n", "| 5.387981 | 3.3 | 1.7 | 0.5 | setosa |\n", "| 5.008532 | 3.4 | 1.9 | 0.2 | setosa |\n", "| 5.000000 | 3.0 | 1.6 | 0.2 | setosa |\n", "| 4.944929 | 3.4 | 1.6 | 0.4 | setosa |\n", "| 5.200000 | 3.5 | 1.5 | 0.2 | setosa |\n", "| 5.200000 | 3.4 | 1.4 | 0.2 | setosa |\n", "| 4.700000 | 3.2 | 1.6 | 0.2 | setosa |\n", "| ⋮ | ⋮ | ⋮ | ⋮ | ⋮ |\n", "| 6.900000 | 3.2 | 5.7 | 2.3 | virginica |\n", "| 5.600000 | 2.8 | 4.9 | 2.0 | virginica |\n", "| 7.700000 | 2.8 | 6.7 | 2.0 | virginica |\n", "| 6.300000 | 2.7 | 4.9 | 1.8 | virginica |\n", "| 6.700000 | 3.3 | 5.7 | 2.1 | virginica |\n", "| 7.200000 | 3.2 | 6.0 | 1.8 | virginica |\n", "| 6.200000 | 2.8 | 4.8 | 1.8 | virginica |\n", "| 6.100000 | 3.0 | 4.9 | 1.8 | virginica |\n", "| 6.400000 | 2.8 | 5.6 | 2.1 | virginica |\n", "| 7.200000 | 3.0 | 5.8 | 1.6 | virginica |\n", "| 7.400000 | 2.8 | 6.1 | 1.9 | virginica |\n", "| 7.900000 | 3.8 | 6.4 | 2.0 | virginica |\n", "| 6.445390 | 2.8 | 5.6 | 2.2 | virginica |\n", "| 6.300000 | 2.8 | 5.1 | 1.5 | virginica |\n", "| 6.785279 | 2.6 | 5.6 | 1.4 | virginica |\n", "| 7.539436 | 3.0 | 6.1 | 2.3 | virginica |\n", "| 6.300000 | 3.4 | 5.6 | 2.4 | virginica |\n", "| 6.727452 | 3.1 | 5.5 | 1.8 | virginica |\n", "| 6.000000 | 3.0 | 4.8 | 1.8 | virginica |\n", "| 6.900000 | 3.1 | 5.4 | 2.1 | virginica |\n", "| 6.700000 | 3.1 | 5.6 | 2.4 | virginica |\n", "| 6.900000 | 3.1 | 5.1 | 2.3 | virginica |\n", "| 5.710125 | 2.7 | 5.1 | 1.9 | virginica |\n", "| 6.696950 | 3.2 | 5.9 | 2.3 | virginica |\n", "| 6.700000 | 3.3 | 5.7 | 2.5 | virginica |\n", "| 6.700000 | 3.0 | 5.2 | 2.3 | virginica |\n", "| 6.300000 | 2.5 | 5.0 | 1.9 | virginica |\n", "| 5.726869 | 3.0 | 5.2 | 2.0 | virginica |\n", "| 6.200000 | 3.4 | 5.4 | 2.3 | virginica |\n", "| 5.900000 | 3.0 | 5.1 | 1.8 | virginica |\n", "\n", "\n", "$imp2\n", ": \n", "A data.frame: 150 × 5\n", "\n", "| Sepal.Length <dbl> | Sepal.Width <dbl> | Petal.Length <dbl> | Petal.Width <dbl> | Species <fct> |\n", "|---|---|---|---|---|\n", "| 5.100000 | 3.5 | 1.4 | 0.2 | setosa |\n", "| 4.900000 | 3.0 | 1.4 | 0.2 | setosa |\n", "| 4.700000 | 3.2 | 1.3 | 0.2 | setosa |\n", "| 4.485872 | 3.1 | 1.5 | 0.2 | setosa |\n", "| 5.000000 | 3.6 | 1.4 | 0.2 | setosa |\n", "| 5.400000 | 3.9 | 1.7 | 0.4 | setosa |\n", "| 4.600000 | 3.4 | 1.4 | 0.3 | setosa |\n", "| 5.000000 | 3.4 | 1.5 | 0.2 | setosa |\n", "| 4.400000 | 2.9 | 1.4 | 0.2 | setosa |\n", "| 4.900000 | 3.1 | 1.5 | 0.1 | setosa |\n", "| 5.400000 | 3.7 | 1.5 | 0.2 | setosa |\n", "| 4.800000 | 3.4 | 1.6 | 0.2 | setosa |\n", "| 4.800000 | 3.0 | 1.4 | 0.1 | setosa |\n", "| 4.300000 | 3.0 | 1.1 | 0.1 | setosa |\n", "| 5.629067 | 4.0 | 1.2 | 0.2 | setosa |\n", "| 5.700000 | 4.4 | 1.5 | 0.4 | setosa |\n", "| 5.400000 | 3.9 | 1.3 | 0.4 | setosa |\n", "| 5.100000 | 3.5 | 1.4 | 0.3 | setosa |\n", "| 5.700000 | 3.8 | 1.7 | 0.3 | setosa |\n", "| 5.324967 | 3.8 | 1.5 | 0.3 | setosa |\n", "| 5.400000 | 3.4 | 1.7 | 0.2 | setosa |\n", "| 5.100000 | 3.7 | 1.5 | 0.4 | setosa |\n", "| 4.600000 | 3.6 | 1.0 | 0.2 | setosa |\n", "| 4.695992 | 3.3 | 1.7 | 0.5 | setosa |\n", "| 5.311505 | 3.4 | 1.9 | 0.2 | setosa |\n", "| 5.000000 | 3.0 | 1.6 | 0.2 | setosa |\n", "| 5.161542 | 3.4 | 1.6 | 0.4 | setosa |\n", "| 5.200000 | 3.5 | 1.5 | 0.2 | setosa |\n", "| 5.200000 | 3.4 | 1.4 | 0.2 | setosa |\n", "| 4.700000 | 3.2 | 1.6 | 0.2 | setosa |\n", "| ⋮ | ⋮ | ⋮ | ⋮ | ⋮ |\n", "| 6.900000 | 3.2 | 5.7 | 2.3 | virginica |\n", "| 5.600000 | 2.8 | 4.9 | 2.0 | virginica |\n", "| 7.700000 | 2.8 | 6.7 | 2.0 | virginica |\n", "| 6.300000 | 2.7 | 4.9 | 1.8 | virginica |\n", "| 6.700000 | 3.3 | 5.7 | 2.1 | virginica |\n", "| 7.200000 | 3.2 | 6.0 | 1.8 | virginica |\n", "| 6.200000 | 2.8 | 4.8 | 1.8 | virginica |\n", "| 6.100000 | 3.0 | 4.9 | 1.8 | virginica |\n", "| 6.400000 | 2.8 | 5.6 | 2.1 | virginica |\n", "| 7.200000 | 3.0 | 5.8 | 1.6 | virginica |\n", "| 7.400000 | 2.8 | 6.1 | 1.9 | virginica |\n", "| 7.900000 | 3.8 | 6.4 | 2.0 | virginica |\n", "| 6.341618 | 2.8 | 5.6 | 2.2 | virginica |\n", "| 6.300000 | 2.8 | 5.1 | 1.5 | virginica |\n", "| 7.053659 | 2.6 | 5.6 | 1.4 | virginica |\n", "| 6.851979 | 3.0 | 6.1 | 2.3 | virginica |\n", "| 6.300000 | 3.4 | 5.6 | 2.4 | virginica |\n", "| 6.251032 | 3.1 | 5.5 | 1.8 | virginica |\n", "| 6.000000 | 3.0 | 4.8 | 1.8 | virginica |\n", "| 6.900000 | 3.1 | 5.4 | 2.1 | virginica |\n", "| 6.700000 | 3.1 | 5.6 | 2.4 | virginica |\n", "| 6.900000 | 3.1 | 5.1 | 2.3 | virginica |\n", "| 6.327500 | 2.7 | 5.1 | 1.9 | virginica |\n", "| 6.678128 | 3.2 | 5.9 | 2.3 | virginica |\n", "| 6.700000 | 3.3 | 5.7 | 2.5 | virginica |\n", "| 6.700000 | 3.0 | 5.2 | 2.3 | virginica |\n", "| 6.300000 | 2.5 | 5.0 | 1.9 | virginica |\n", "| 6.190815 | 3.0 | 5.2 | 2.0 | virginica |\n", "| 6.200000 | 3.4 | 5.4 | 2.3 | virginica |\n", "| 5.900000 | 3.0 | 5.1 | 1.8 | virginica |\n", "\n", "\n", "$imp3\n", ": \n", "A data.frame: 150 × 5\n", "\n", "| Sepal.Length <dbl> | Sepal.Width <dbl> | Petal.Length <dbl> | Petal.Width <dbl> | Species <fct> |\n", "|---|---|---|---|---|\n", "| 5.100000 | 3.5 | 1.4 | 0.2 | setosa |\n", "| 4.900000 | 3.0 | 1.4 | 0.2 | setosa |\n", "| 4.700000 | 3.2 | 1.3 | 0.2 | setosa |\n", "| 4.314737 | 3.1 | 1.5 | 0.2 | setosa |\n", "| 5.000000 | 3.6 | 1.4 | 0.2 | setosa |\n", "| 5.400000 | 3.9 | 1.7 | 0.4 | setosa |\n", "| 4.600000 | 3.4 | 1.4 | 0.3 | setosa |\n", "| 5.000000 | 3.4 | 1.5 | 0.2 | setosa |\n", "| 4.400000 | 2.9 | 1.4 | 0.2 | setosa |\n", "| 4.900000 | 3.1 | 1.5 | 0.1 | setosa |\n", "| 5.400000 | 3.7 | 1.5 | 0.2 | setosa |\n", "| 4.800000 | 3.4 | 1.6 | 0.2 | setosa |\n", "| 4.800000 | 3.0 | 1.4 | 0.1 | setosa |\n", "| 4.300000 | 3.0 | 1.1 | 0.1 | setosa |\n", "| 4.827350 | 4.0 | 1.2 | 0.2 | setosa |\n", "| 5.700000 | 4.4 | 1.5 | 0.4 | setosa |\n", "| 5.400000 | 3.9 | 1.3 | 0.4 | setosa |\n", "| 5.100000 | 3.5 | 1.4 | 0.3 | setosa |\n", "| 5.700000 | 3.8 | 1.7 | 0.3 | setosa |\n", "| 4.935375 | 3.8 | 1.5 | 0.3 | setosa |\n", "| 5.400000 | 3.4 | 1.7 | 0.2 | setosa |\n", "| 5.100000 | 3.7 | 1.5 | 0.4 | setosa |\n", "| 4.600000 | 3.6 | 1.0 | 0.2 | setosa |\n", "| 5.344230 | 3.3 | 1.7 | 0.5 | setosa |\n", "| 5.133871 | 3.4 | 1.9 | 0.2 | setosa |\n", "| 5.000000 | 3.0 | 1.6 | 0.2 | setosa |\n", "| 4.412916 | 3.4 | 1.6 | 0.4 | setosa |\n", "| 5.200000 | 3.5 | 1.5 | 0.2 | setosa |\n", "| 5.200000 | 3.4 | 1.4 | 0.2 | setosa |\n", "| 4.700000 | 3.2 | 1.6 | 0.2 | setosa |\n", "| ⋮ | ⋮ | ⋮ | ⋮ | ⋮ |\n", "| 6.900000 | 3.2 | 5.7 | 2.3 | virginica |\n", "| 5.600000 | 2.8 | 4.9 | 2.0 | virginica |\n", "| 7.700000 | 2.8 | 6.7 | 2.0 | virginica |\n", "| 6.300000 | 2.7 | 4.9 | 1.8 | virginica |\n", "| 6.700000 | 3.3 | 5.7 | 2.1 | virginica |\n", "| 7.200000 | 3.2 | 6.0 | 1.8 | virginica |\n", "| 6.200000 | 2.8 | 4.8 | 1.8 | virginica |\n", "| 6.100000 | 3.0 | 4.9 | 1.8 | virginica |\n", "| 6.400000 | 2.8 | 5.6 | 2.1 | virginica |\n", "| 7.200000 | 3.0 | 5.8 | 1.6 | virginica |\n", "| 7.400000 | 2.8 | 6.1 | 1.9 | virginica |\n", "| 7.900000 | 3.8 | 6.4 | 2.0 | virginica |\n", "| 6.729448 | 2.8 | 5.6 | 2.2 | virginica |\n", "| 6.300000 | 2.8 | 5.1 | 1.5 | virginica |\n", "| 6.849228 | 2.6 | 5.6 | 1.4 | virginica |\n", "| 6.402239 | 3.0 | 6.1 | 2.3 | virginica |\n", "| 6.300000 | 3.4 | 5.6 | 2.4 | virginica |\n", "| 6.974939 | 3.1 | 5.5 | 1.8 | virginica |\n", "| 6.000000 | 3.0 | 4.8 | 1.8 | virginica |\n", "| 6.900000 | 3.1 | 5.4 | 2.1 | virginica |\n", "| 6.700000 | 3.1 | 5.6 | 2.4 | virginica |\n", "| 6.900000 | 3.1 | 5.1 | 2.3 | virginica |\n", "| 6.089570 | 2.7 | 5.1 | 1.9 | virginica |\n", "| 6.687245 | 3.2 | 5.9 | 2.3 | virginica |\n", "| 6.700000 | 3.3 | 5.7 | 2.5 | virginica |\n", "| 6.700000 | 3.0 | 5.2 | 2.3 | virginica |\n", "| 6.300000 | 2.5 | 5.0 | 1.9 | virginica |\n", "| 6.036633 | 3.0 | 5.2 | 2.0 | virginica |\n", "| 6.200000 | 3.4 | 5.4 | 2.3 | virginica |\n", "| 5.900000 | 3.0 | 5.1 | 1.8 | virginica |\n", "\n", "\n", "\n", "\n" ], "text/plain": [ "$imp1\n", " Sepal.Length Sepal.Width Petal.Length Petal.Width Species\n", "1 5.100000 3.5 1.4 0.2 setosa\n", "2 4.900000 3.0 1.4 0.2 setosa\n", "3 4.700000 3.2 1.3 0.2 setosa\n", "4 4.750664 3.1 1.5 0.2 setosa\n", "5 5.000000 3.6 1.4 0.2 setosa\n", "6 5.400000 3.9 1.7 0.4 setosa\n", "7 4.600000 3.4 1.4 0.3 setosa\n", "8 5.000000 3.4 1.5 0.2 setosa\n", "9 4.400000 2.9 1.4 0.2 setosa\n", "10 4.900000 3.1 1.5 0.1 setosa\n", "11 5.400000 3.7 1.5 0.2 setosa\n", "12 4.800000 3.4 1.6 0.2 setosa\n", "13 4.800000 3.0 1.4 0.1 setosa\n", "14 4.300000 3.0 1.1 0.1 setosa\n", "15 5.031958 4.0 1.2 0.2 setosa\n", "16 5.700000 4.4 1.5 0.4 setosa\n", "17 5.400000 3.9 1.3 0.4 setosa\n", "18 5.100000 3.5 1.4 0.3 setosa\n", "19 5.700000 3.8 1.7 0.3 setosa\n", "20 5.278259 3.8 1.5 0.3 setosa\n", "21 5.400000 3.4 1.7 0.2 setosa\n", "22 5.100000 3.7 1.5 0.4 setosa\n", "23 4.600000 3.6 1.0 0.2 setosa\n", "24 5.387981 3.3 1.7 0.5 setosa\n", "25 5.008532 3.4 1.9 0.2 setosa\n", "26 5.000000 3.0 1.6 0.2 setosa\n", "27 4.944929 3.4 1.6 0.4 setosa\n", "28 5.200000 3.5 1.5 0.2 setosa\n", "29 5.200000 3.4 1.4 0.2 setosa\n", "30 4.700000 3.2 1.6 0.2 setosa\n", "31 4.800000 3.1 1.6 0.2 setosa\n", "32 5.400000 3.4 1.5 0.4 setosa\n", "33 5.200000 4.1 1.5 0.1 setosa\n", "34 5.500000 4.2 1.4 0.2 setosa\n", "35 4.900000 3.1 1.5 0.2 setosa\n", "36 5.000000 3.2 1.2 0.2 setosa\n", "37 5.500000 3.5 1.3 0.2 setosa\n", "38 4.900000 3.6 1.4 0.1 setosa\n", "39 4.400000 3.0 1.3 0.2 setosa\n", "40 5.100000 3.4 1.5 0.2 setosa\n", "41 5.000000 3.5 1.3 0.3 setosa\n", "42 4.500000 2.3 1.3 0.3 setosa\n", "43 4.400000 3.2 1.3 0.2 setosa\n", "44 4.383061 3.5 1.6 0.6 setosa\n", "45 5.526084 3.8 1.9 0.4 setosa\n", "46 4.800000 3.0 1.4 0.3 setosa\n", "47 5.100000 3.8 1.6 0.2 setosa\n", "48 4.600000 3.2 1.4 0.2 setosa\n", "49 4.741405 3.7 1.5 0.2 setosa\n", "50 5.000000 3.3 1.4 0.2 setosa\n", "51 7.000000 3.2 4.7 1.4 versicolor\n", "52 6.400000 3.2 4.5 1.5 versicolor\n", "53 6.900000 3.1 4.9 1.5 versicolor\n", "54 5.646550 2.3 4.0 1.3 versicolor\n", "55 6.500000 2.8 4.6 1.5 versicolor\n", "56 5.700000 2.8 4.5 1.3 versicolor\n", "57 6.441912 3.3 4.7 1.6 versicolor\n", "58 4.900000 2.4 3.3 1.0 versicolor\n", "59 6.600000 2.9 4.6 1.3 versicolor\n", "60 5.863056 2.7 3.9 1.4 versicolor\n", "61 5.041745 2.0 3.5 1.0 versicolor\n", "62 5.900000 3.0 4.2 1.5 versicolor\n", "63 6.000000 2.2 4.0 1.0 versicolor\n", "64 6.100000 2.9 4.7 1.4 versicolor\n", "65 5.600000 2.9 3.6 1.3 versicolor\n", "66 6.700000 3.1 4.4 1.4 versicolor\n", "67 5.600000 3.0 4.5 1.5 versicolor\n", "68 5.800000 2.7 4.1 1.0 versicolor\n", "69 6.200000 2.2 4.5 1.5 versicolor\n", "70 5.998981 2.5 3.9 1.1 versicolor\n", "71 5.900000 3.2 4.8 1.8 versicolor\n", "72 5.680752 2.8 4.0 1.3 versicolor\n", "73 6.300000 2.5 4.9 1.5 versicolor\n", "74 5.775478 2.8 4.7 1.2 versicolor\n", "75 6.203438 2.9 4.3 1.3 versicolor\n", "76 6.600000 3.0 4.4 1.4 versicolor\n", "77 6.800000 2.8 4.8 1.4 versicolor\n", "78 6.700000 3.0 5.0 1.7 versicolor\n", "79 6.000000 2.9 4.5 1.5 versicolor\n", "80 5.700000 2.6 3.5 1.0 versicolor\n", "81 5.457727 2.4 3.8 1.1 versicolor\n", "82 5.500000 2.4 3.7 1.0 versicolor\n", "83 5.800000 2.7 3.9 1.2 versicolor\n", "84 6.000000 2.7 5.1 1.6 versicolor\n", "85 5.400000 3.0 4.5 1.5 versicolor\n", "86 6.000000 3.4 4.5 1.6 versicolor\n", "87 6.700000 3.1 4.7 1.5 versicolor\n", "88 6.300000 2.3 4.4 1.3 versicolor\n", "89 5.600000 3.0 4.1 1.3 versicolor\n", "90 5.500000 2.5 4.0 1.3 versicolor\n", "91 5.500000 2.6 4.4 1.2 versicolor\n", "92 6.100000 3.0 4.6 1.4 versicolor\n", "93 5.800000 2.6 4.0 1.2 versicolor\n", "94 5.284482 2.3 3.3 1.0 versicolor\n", "95 5.600000 2.7 4.2 1.3 versicolor\n", "96 5.700000 3.0 4.2 1.2 versicolor\n", "97 5.700000 2.9 4.2 1.3 versicolor\n", "98 6.200000 2.9 4.3 1.3 versicolor\n", "99 5.140855 2.5 3.0 1.1 versicolor\n", "100 5.700000 2.8 4.1 1.3 versicolor\n", "101 6.300000 3.3 6.0 2.5 virginica\n", "102 5.800000 2.7 5.1 1.9 virginica\n", "103 7.100000 3.0 5.9 2.1 virginica\n", "104 6.300000 2.9 5.6 1.8 virginica\n", "105 6.500000 3.0 5.8 2.2 virginica\n", "106 7.600000 3.0 6.6 2.1 virginica\n", "107 4.900000 2.5 4.5 1.7 virginica\n", "108 7.676980 2.9 6.3 1.8 virginica\n", "109 6.700000 2.5 5.8 1.8 virginica\n", "110 6.937050 3.6 6.1 2.5 virginica\n", "111 6.500000 3.2 5.1 2.0 virginica\n", "112 6.400000 2.7 5.3 1.9 virginica\n", "113 6.800000 3.0 5.5 2.1 virginica\n", "114 5.426168 2.5 5.0 2.0 virginica\n", "115 5.800000 2.8 5.1 2.4 virginica\n", "116 6.400000 3.2 5.3 2.3 virginica\n", "117 6.500000 3.0 5.5 1.8 virginica\n", "118 7.700000 3.8 6.7 2.2 virginica\n", "119 7.700000 2.6 6.9 2.3 virginica\n", "120 6.000000 2.2 5.0 1.5 virginica\n", "121 6.900000 3.2 5.7 2.3 virginica\n", "122 5.600000 2.8 4.9 2.0 virginica\n", "123 7.700000 2.8 6.7 2.0 virginica\n", "124 6.300000 2.7 4.9 1.8 virginica\n", "125 6.700000 3.3 5.7 2.1 virginica\n", "126 7.200000 3.2 6.0 1.8 virginica\n", "127 6.200000 2.8 4.8 1.8 virginica\n", "128 6.100000 3.0 4.9 1.8 virginica\n", "129 6.400000 2.8 5.6 2.1 virginica\n", "130 7.200000 3.0 5.8 1.6 virginica\n", "131 7.400000 2.8 6.1 1.9 virginica\n", "132 7.900000 3.8 6.4 2.0 virginica\n", "133 6.445390 2.8 5.6 2.2 virginica\n", "134 6.300000 2.8 5.1 1.5 virginica\n", "135 6.785279 2.6 5.6 1.4 virginica\n", "136 7.539436 3.0 6.1 2.3 virginica\n", "137 6.300000 3.4 5.6 2.4 virginica\n", "138 6.727452 3.1 5.5 1.8 virginica\n", "139 6.000000 3.0 4.8 1.8 virginica\n", "140 6.900000 3.1 5.4 2.1 virginica\n", "141 6.700000 3.1 5.6 2.4 virginica\n", "142 6.900000 3.1 5.1 2.3 virginica\n", "143 5.710125 2.7 5.1 1.9 virginica\n", "144 6.696950 3.2 5.9 2.3 virginica\n", "145 6.700000 3.3 5.7 2.5 virginica\n", "146 6.700000 3.0 5.2 2.3 virginica\n", "147 6.300000 2.5 5.0 1.9 virginica\n", "148 5.726869 3.0 5.2 2.0 virginica\n", "149 6.200000 3.4 5.4 2.3 virginica\n", "150 5.900000 3.0 5.1 1.8 virginica\n", "\n", "$imp2\n", " Sepal.Length Sepal.Width Petal.Length Petal.Width Species\n", "1 5.100000 3.5 1.4 0.2 setosa\n", "2 4.900000 3.0 1.4 0.2 setosa\n", "3 4.700000 3.2 1.3 0.2 setosa\n", "4 4.485872 3.1 1.5 0.2 setosa\n", "5 5.000000 3.6 1.4 0.2 setosa\n", "6 5.400000 3.9 1.7 0.4 setosa\n", "7 4.600000 3.4 1.4 0.3 setosa\n", "8 5.000000 3.4 1.5 0.2 setosa\n", "9 4.400000 2.9 1.4 0.2 setosa\n", "10 4.900000 3.1 1.5 0.1 setosa\n", "11 5.400000 3.7 1.5 0.2 setosa\n", "12 4.800000 3.4 1.6 0.2 setosa\n", "13 4.800000 3.0 1.4 0.1 setosa\n", "14 4.300000 3.0 1.1 0.1 setosa\n", "15 5.629067 4.0 1.2 0.2 setosa\n", "16 5.700000 4.4 1.5 0.4 setosa\n", "17 5.400000 3.9 1.3 0.4 setosa\n", "18 5.100000 3.5 1.4 0.3 setosa\n", "19 5.700000 3.8 1.7 0.3 setosa\n", "20 5.324967 3.8 1.5 0.3 setosa\n", "21 5.400000 3.4 1.7 0.2 setosa\n", "22 5.100000 3.7 1.5 0.4 setosa\n", "23 4.600000 3.6 1.0 0.2 setosa\n", "24 4.695992 3.3 1.7 0.5 setosa\n", "25 5.311505 3.4 1.9 0.2 setosa\n", "26 5.000000 3.0 1.6 0.2 setosa\n", "27 5.161542 3.4 1.6 0.4 setosa\n", "28 5.200000 3.5 1.5 0.2 setosa\n", "29 5.200000 3.4 1.4 0.2 setosa\n", "30 4.700000 3.2 1.6 0.2 setosa\n", "31 4.800000 3.1 1.6 0.2 setosa\n", "32 5.400000 3.4 1.5 0.4 setosa\n", "33 5.200000 4.1 1.5 0.1 setosa\n", "34 5.500000 4.2 1.4 0.2 setosa\n", "35 4.900000 3.1 1.5 0.2 setosa\n", "36 5.000000 3.2 1.2 0.2 setosa\n", "37 5.500000 3.5 1.3 0.2 setosa\n", "38 4.900000 3.6 1.4 0.1 setosa\n", "39 4.400000 3.0 1.3 0.2 setosa\n", "40 5.100000 3.4 1.5 0.2 setosa\n", "41 5.000000 3.5 1.3 0.3 setosa\n", "42 4.500000 2.3 1.3 0.3 setosa\n", "43 4.400000 3.2 1.3 0.2 setosa\n", "44 5.141276 3.5 1.6 0.6 setosa\n", "45 5.294512 3.8 1.9 0.4 setosa\n", "46 4.800000 3.0 1.4 0.3 setosa\n", "47 5.100000 3.8 1.6 0.2 setosa\n", "48 4.600000 3.2 1.4 0.2 setosa\n", "49 4.682249 3.7 1.5 0.2 setosa\n", "50 5.000000 3.3 1.4 0.2 setosa\n", "51 7.000000 3.2 4.7 1.4 versicolor\n", "52 6.400000 3.2 4.5 1.5 versicolor\n", "53 6.900000 3.1 4.9 1.5 versicolor\n", "54 4.994057 2.3 4.0 1.3 versicolor\n", "55 6.500000 2.8 4.6 1.5 versicolor\n", "56 5.700000 2.8 4.5 1.3 versicolor\n", "57 6.554774 3.3 4.7 1.6 versicolor\n", "58 4.900000 2.4 3.3 1.0 versicolor\n", "59 6.600000 2.9 4.6 1.3 versicolor\n", "60 5.383949 2.7 3.9 1.4 versicolor\n", "61 4.864915 2.0 3.5 1.0 versicolor\n", "62 5.900000 3.0 4.2 1.5 versicolor\n", "63 6.000000 2.2 4.0 1.0 versicolor\n", "64 6.100000 2.9 4.7 1.4 versicolor\n", "65 5.600000 2.9 3.6 1.3 versicolor\n", "66 6.700000 3.1 4.4 1.4 versicolor\n", "67 5.600000 3.0 4.5 1.5 versicolor\n", "68 5.800000 2.7 4.1 1.0 versicolor\n", "69 6.200000 2.2 4.5 1.5 versicolor\n", "70 5.661461 2.5 3.9 1.1 versicolor\n", "71 5.900000 3.2 4.8 1.8 versicolor\n", "72 5.924074 2.8 4.0 1.3 versicolor\n", "73 6.300000 2.5 4.9 1.5 versicolor\n", "74 5.780914 2.8 4.7 1.2 versicolor\n", "75 5.958822 2.9 4.3 1.3 versicolor\n", "76 6.600000 3.0 4.4 1.4 versicolor\n", "77 6.800000 2.8 4.8 1.4 versicolor\n", "78 6.700000 3.0 5.0 1.7 versicolor\n", "79 6.000000 2.9 4.5 1.5 versicolor\n", "80 5.700000 2.6 3.5 1.0 versicolor\n", "81 5.920930 2.4 3.8 1.1 versicolor\n", "82 5.500000 2.4 3.7 1.0 versicolor\n", "83 5.800000 2.7 3.9 1.2 versicolor\n", "84 6.000000 2.7 5.1 1.6 versicolor\n", "85 5.400000 3.0 4.5 1.5 versicolor\n", "86 6.000000 3.4 4.5 1.6 versicolor\n", "87 6.700000 3.1 4.7 1.5 versicolor\n", "88 6.300000 2.3 4.4 1.3 versicolor\n", "89 5.600000 3.0 4.1 1.3 versicolor\n", "90 5.500000 2.5 4.0 1.3 versicolor\n", "91 5.500000 2.6 4.4 1.2 versicolor\n", "92 6.100000 3.0 4.6 1.4 versicolor\n", "93 5.800000 2.6 4.0 1.2 versicolor\n", "94 5.009877 2.3 3.3 1.0 versicolor\n", "95 5.600000 2.7 4.2 1.3 versicolor\n", "96 5.700000 3.0 4.2 1.2 versicolor\n", "97 5.700000 2.9 4.2 1.3 versicolor\n", "98 6.200000 2.9 4.3 1.3 versicolor\n", "99 4.803383 2.5 3.0 1.1 versicolor\n", "100 5.700000 2.8 4.1 1.3 versicolor\n", "101 6.300000 3.3 6.0 2.5 virginica\n", "102 5.800000 2.7 5.1 1.9 virginica\n", "103 7.100000 3.0 5.9 2.1 virginica\n", "104 6.300000 2.9 5.6 1.8 virginica\n", "105 6.500000 3.0 5.8 2.2 virginica\n", "106 7.600000 3.0 6.6 2.1 virginica\n", "107 4.900000 2.5 4.5 1.7 virginica\n", "108 6.614380 2.9 6.3 1.8 virginica\n", "109 6.700000 2.5 5.8 1.8 virginica\n", "110 6.786585 3.6 6.1 2.5 virginica\n", "111 6.500000 3.2 5.1 2.0 virginica\n", "112 6.400000 2.7 5.3 1.9 virginica\n", "113 6.800000 3.0 5.5 2.1 virginica\n", "114 5.969026 2.5 5.0 2.0 virginica\n", "115 5.800000 2.8 5.1 2.4 virginica\n", "116 6.400000 3.2 5.3 2.3 virginica\n", "117 6.500000 3.0 5.5 1.8 virginica\n", "118 7.700000 3.8 6.7 2.2 virginica\n", "119 7.700000 2.6 6.9 2.3 virginica\n", "120 6.000000 2.2 5.0 1.5 virginica\n", "121 6.900000 3.2 5.7 2.3 virginica\n", "122 5.600000 2.8 4.9 2.0 virginica\n", "123 7.700000 2.8 6.7 2.0 virginica\n", "124 6.300000 2.7 4.9 1.8 virginica\n", "125 6.700000 3.3 5.7 2.1 virginica\n", "126 7.200000 3.2 6.0 1.8 virginica\n", "127 6.200000 2.8 4.8 1.8 virginica\n", "128 6.100000 3.0 4.9 1.8 virginica\n", "129 6.400000 2.8 5.6 2.1 virginica\n", "130 7.200000 3.0 5.8 1.6 virginica\n", "131 7.400000 2.8 6.1 1.9 virginica\n", "132 7.900000 3.8 6.4 2.0 virginica\n", "133 6.341618 2.8 5.6 2.2 virginica\n", "134 6.300000 2.8 5.1 1.5 virginica\n", "135 7.053659 2.6 5.6 1.4 virginica\n", "136 6.851979 3.0 6.1 2.3 virginica\n", "137 6.300000 3.4 5.6 2.4 virginica\n", "138 6.251032 3.1 5.5 1.8 virginica\n", "139 6.000000 3.0 4.8 1.8 virginica\n", "140 6.900000 3.1 5.4 2.1 virginica\n", "141 6.700000 3.1 5.6 2.4 virginica\n", "142 6.900000 3.1 5.1 2.3 virginica\n", "143 6.327500 2.7 5.1 1.9 virginica\n", "144 6.678128 3.2 5.9 2.3 virginica\n", "145 6.700000 3.3 5.7 2.5 virginica\n", "146 6.700000 3.0 5.2 2.3 virginica\n", "147 6.300000 2.5 5.0 1.9 virginica\n", "148 6.190815 3.0 5.2 2.0 virginica\n", "149 6.200000 3.4 5.4 2.3 virginica\n", "150 5.900000 3.0 5.1 1.8 virginica\n", "\n", "$imp3\n", " Sepal.Length Sepal.Width Petal.Length Petal.Width Species\n", "1 5.100000 3.5 1.4 0.2 setosa\n", "2 4.900000 3.0 1.4 0.2 setosa\n", "3 4.700000 3.2 1.3 0.2 setosa\n", "4 4.314737 3.1 1.5 0.2 setosa\n", "5 5.000000 3.6 1.4 0.2 setosa\n", "6 5.400000 3.9 1.7 0.4 setosa\n", "7 4.600000 3.4 1.4 0.3 setosa\n", "8 5.000000 3.4 1.5 0.2 setosa\n", "9 4.400000 2.9 1.4 0.2 setosa\n", "10 4.900000 3.1 1.5 0.1 setosa\n", "11 5.400000 3.7 1.5 0.2 setosa\n", "12 4.800000 3.4 1.6 0.2 setosa\n", "13 4.800000 3.0 1.4 0.1 setosa\n", "14 4.300000 3.0 1.1 0.1 setosa\n", "15 4.827350 4.0 1.2 0.2 setosa\n", "16 5.700000 4.4 1.5 0.4 setosa\n", "17 5.400000 3.9 1.3 0.4 setosa\n", "18 5.100000 3.5 1.4 0.3 setosa\n", "19 5.700000 3.8 1.7 0.3 setosa\n", "20 4.935375 3.8 1.5 0.3 setosa\n", "21 5.400000 3.4 1.7 0.2 setosa\n", "22 5.100000 3.7 1.5 0.4 setosa\n", "23 4.600000 3.6 1.0 0.2 setosa\n", "24 5.344230 3.3 1.7 0.5 setosa\n", "25 5.133871 3.4 1.9 0.2 setosa\n", "26 5.000000 3.0 1.6 0.2 setosa\n", "27 4.412916 3.4 1.6 0.4 setosa\n", "28 5.200000 3.5 1.5 0.2 setosa\n", "29 5.200000 3.4 1.4 0.2 setosa\n", "30 4.700000 3.2 1.6 0.2 setosa\n", "31 4.800000 3.1 1.6 0.2 setosa\n", "32 5.400000 3.4 1.5 0.4 setosa\n", "33 5.200000 4.1 1.5 0.1 setosa\n", "34 5.500000 4.2 1.4 0.2 setosa\n", "35 4.900000 3.1 1.5 0.2 setosa\n", "36 5.000000 3.2 1.2 0.2 setosa\n", "37 5.500000 3.5 1.3 0.2 setosa\n", "38 4.900000 3.6 1.4 0.1 setosa\n", "39 4.400000 3.0 1.3 0.2 setosa\n", "40 5.100000 3.4 1.5 0.2 setosa\n", "41 5.000000 3.5 1.3 0.3 setosa\n", "42 4.500000 2.3 1.3 0.3 setosa\n", "43 4.400000 3.2 1.3 0.2 setosa\n", "44 5.412516 3.5 1.6 0.6 setosa\n", "45 5.808592 3.8 1.9 0.4 setosa\n", "46 4.800000 3.0 1.4 0.3 setosa\n", "47 5.100000 3.8 1.6 0.2 setosa\n", "48 4.600000 3.2 1.4 0.2 setosa\n", "49 5.228957 3.7 1.5 0.2 setosa\n", "50 5.000000 3.3 1.4 0.2 setosa\n", "51 7.000000 3.2 4.7 1.4 versicolor\n", "52 6.400000 3.2 4.5 1.5 versicolor\n", "53 6.900000 3.1 4.9 1.5 versicolor\n", "54 5.951996 2.3 4.0 1.3 versicolor\n", "55 6.500000 2.8 4.6 1.5 versicolor\n", "56 5.700000 2.8 4.5 1.3 versicolor\n", "57 6.518191 3.3 4.7 1.6 versicolor\n", "58 4.900000 2.4 3.3 1.0 versicolor\n", "59 6.600000 2.9 4.6 1.3 versicolor\n", "60 5.923269 2.7 3.9 1.4 versicolor\n", "61 4.997109 2.0 3.5 1.0 versicolor\n", "62 5.900000 3.0 4.2 1.5 versicolor\n", "63 6.000000 2.2 4.0 1.0 versicolor\n", "64 6.100000 2.9 4.7 1.4 versicolor\n", "65 5.600000 2.9 3.6 1.3 versicolor\n", "66 6.700000 3.1 4.4 1.4 versicolor\n", "67 5.600000 3.0 4.5 1.5 versicolor\n", "68 5.800000 2.7 4.1 1.0 versicolor\n", "69 6.200000 2.2 4.5 1.5 versicolor\n", "70 5.520899 2.5 3.9 1.1 versicolor\n", "71 5.900000 3.2 4.8 1.8 versicolor\n", "72 5.488044 2.8 4.0 1.3 versicolor\n", "73 6.300000 2.5 4.9 1.5 versicolor\n", "74 6.726687 2.8 4.7 1.2 versicolor\n", "75 5.862531 2.9 4.3 1.3 versicolor\n", "76 6.600000 3.0 4.4 1.4 versicolor\n", "77 6.800000 2.8 4.8 1.4 versicolor\n", "78 6.700000 3.0 5.0 1.7 versicolor\n", "79 6.000000 2.9 4.5 1.5 versicolor\n", "80 5.700000 2.6 3.5 1.0 versicolor\n", "81 5.123322 2.4 3.8 1.1 versicolor\n", "82 5.500000 2.4 3.7 1.0 versicolor\n", "83 5.800000 2.7 3.9 1.2 versicolor\n", "84 6.000000 2.7 5.1 1.6 versicolor\n", "85 5.400000 3.0 4.5 1.5 versicolor\n", "86 6.000000 3.4 4.5 1.6 versicolor\n", "87 6.700000 3.1 4.7 1.5 versicolor\n", "88 6.300000 2.3 4.4 1.3 versicolor\n", "89 5.600000 3.0 4.1 1.3 versicolor\n", "90 5.500000 2.5 4.0 1.3 versicolor\n", "91 5.500000 2.6 4.4 1.2 versicolor\n", "92 6.100000 3.0 4.6 1.4 versicolor\n", "93 5.800000 2.6 4.0 1.2 versicolor\n", "94 4.903144 2.3 3.3 1.0 versicolor\n", "95 5.600000 2.7 4.2 1.3 versicolor\n", "96 5.700000 3.0 4.2 1.2 versicolor\n", "97 5.700000 2.9 4.2 1.3 versicolor\n", "98 6.200000 2.9 4.3 1.3 versicolor\n", "99 4.552672 2.5 3.0 1.1 versicolor\n", "100 5.700000 2.8 4.1 1.3 versicolor\n", "101 6.300000 3.3 6.0 2.5 virginica\n", "102 5.800000 2.7 5.1 1.9 virginica\n", "103 7.100000 3.0 5.9 2.1 virginica\n", "104 6.300000 2.9 5.6 1.8 virginica\n", "105 6.500000 3.0 5.8 2.2 virginica\n", "106 7.600000 3.0 6.6 2.1 virginica\n", "107 4.900000 2.5 4.5 1.7 virginica\n", "108 7.162334 2.9 6.3 1.8 virginica\n", "109 6.700000 2.5 5.8 1.8 virginica\n", "110 7.213644 3.6 6.1 2.5 virginica\n", "111 6.500000 3.2 5.1 2.0 virginica\n", "112 6.400000 2.7 5.3 1.9 virginica\n", "113 6.800000 3.0 5.5 2.1 virginica\n", "114 5.756700 2.5 5.0 2.0 virginica\n", "115 5.800000 2.8 5.1 2.4 virginica\n", "116 6.400000 3.2 5.3 2.3 virginica\n", "117 6.500000 3.0 5.5 1.8 virginica\n", "118 7.700000 3.8 6.7 2.2 virginica\n", "119 7.700000 2.6 6.9 2.3 virginica\n", "120 6.000000 2.2 5.0 1.5 virginica\n", "121 6.900000 3.2 5.7 2.3 virginica\n", "122 5.600000 2.8 4.9 2.0 virginica\n", "123 7.700000 2.8 6.7 2.0 virginica\n", "124 6.300000 2.7 4.9 1.8 virginica\n", "125 6.700000 3.3 5.7 2.1 virginica\n", "126 7.200000 3.2 6.0 1.8 virginica\n", "127 6.200000 2.8 4.8 1.8 virginica\n", "128 6.100000 3.0 4.9 1.8 virginica\n", "129 6.400000 2.8 5.6 2.1 virginica\n", "130 7.200000 3.0 5.8 1.6 virginica\n", "131 7.400000 2.8 6.1 1.9 virginica\n", "132 7.900000 3.8 6.4 2.0 virginica\n", "133 6.729448 2.8 5.6 2.2 virginica\n", "134 6.300000 2.8 5.1 1.5 virginica\n", "135 6.849228 2.6 5.6 1.4 virginica\n", "136 6.402239 3.0 6.1 2.3 virginica\n", "137 6.300000 3.4 5.6 2.4 virginica\n", "138 6.974939 3.1 5.5 1.8 virginica\n", "139 6.000000 3.0 4.8 1.8 virginica\n", "140 6.900000 3.1 5.4 2.1 virginica\n", "141 6.700000 3.1 5.6 2.4 virginica\n", "142 6.900000 3.1 5.1 2.3 virginica\n", "143 6.089570 2.7 5.1 1.9 virginica\n", "144 6.687245 3.2 5.9 2.3 virginica\n", "145 6.700000 3.3 5.7 2.5 virginica\n", "146 6.700000 3.0 5.2 2.3 virginica\n", "147 6.300000 2.5 5.0 1.9 virginica\n", "148 6.036633 3.0 5.2 2.0 virginica\n", "149 6.200000 3.4 5.4 2.3 virginica\n", "150 5.900000 3.0 5.1 1.8 virginica\n", "\n", "attr(,\"class\")\n", "[1] \"mi\" \"list\"" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "iris_impl$imputations" ] }, { "cell_type": "code", "execution_count": 23, "id": "cf76fc85", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
imp1
5.84173033264163
imp2
5.83099240704088
imp3
5.83925592449123
\n" ], "text/latex": [ "\\begin{description*}\n", "\\item[imp1] 5.84173033264163\n", "\\item[imp2] 5.83099240704088\n", "\\item[imp3] 5.83925592449123\n", "\\end{description*}\n" ], "text/markdown": [ "imp1\n", ": 5.84173033264163imp2\n", ": 5.83099240704088imp3\n", ": 5.83925592449123\n", "\n" ], "text/plain": [ " imp1 imp2 imp3 \n", "5.841730 5.830992 5.839256 " ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "# 각 대치된 데이터셋에서 평균값을 계산한 후 결합\n", "library(Amelia)\n", "\n", "# 예시: Sepal.Length의 대치된 값들에 대해 평균값 구하기\n", "sepal_length_means <- sapply(iris_impl$imputations, function(df) mean(df$Sepal.Length, na.rm = TRUE))\n", "\n", "# 세 개의 대치된 데이터셋에서의 평균값을 확인\n", "sepal_length_means" ] }, { "cell_type": "markdown", "id": "96e1a4d0", "metadata": {}, "source": [ "## 3.이상값" ] }, { "cell_type": "markdown", "id": "6f42a2b3", "metadata": {}, "source": [ "1) ESD 검정\n", "\n", "이상치 탐지에서 ESD(Extreme Studentized Deviate) 검정은 극단적인 이상치를 탐지하는 통계적 방법입니다. ESD 검정은 정규분포를 가정하며, 한 데이터셋에서 다수의 이상치를 탐지할 수 있도록 설계된 방법입니다. 이 검정은 Grubbs' Test와 유사하지만, Grubbs' Test는 한 번에 하나의 이상치만 탐지하는 반면, ESD는 여러 개의 이상치를 한꺼번에 탐지할 수 있습니다.\n", "\n", "#### ESD 검정의 기본 개념\n", "ESD 검정은 이상치가 될 가능성이 있는 값을 하나씩 제거하면서 데이터를 반복적으로 분석하는 방식입니다. 각 단계에서 가장 극단적인 관측값에 대해 Studentized residual을 계산하고, 그 값이 미리 설정된 임계값을 초과하면 이상치로 간주합니다.\n", "\n", "ESD 검정 절차\n", "1. 가설 설정:\n", "\n", "귀무가설 (H0): 데이터에 이상치가 없다.\n", "대립가설 (H1): 데이터에 이상치가 존재한다.\n", "2. 이상치 탐지:\n", "\n", "- 반복적으로 가장 극단적인 값에 대한 Studentized residual을 계산하고, 해당 값이 임계값보다 큰지 확인합니다.\n", "- 임계값은 정해진 유의수준(보통 0.05)을 기반으로 계산됩니다.\n", "3. 검정 종료:\n", "\n", "여러 단계에서 이상치가 발견될 때까지 이 과정을 반복합니다." ] }, { "cell_type": "code", "execution_count": 6, "id": "8336a7e2", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "평균: 50.08064 \n", "표준편차: 4.958475 \n", "3표준편차 이상 벗어난 값(이상치): 66.2052 \n" ] } ], "source": [ "# 예시 데이터 생성\n", "set.seed(123)\n", "data <- rnorm(1000, mean = 50, sd = 5) # 평균 50, 표준편차 5인 정규분포 데이터\n", "\n", "# 3 표준편차 범위 계산\n", "mean_data <- mean(data)\n", "sd_data <- sd(data)\n", "lower_bound <- mean_data - 3 * sd_data\n", "upper_bound <- mean_data + 3 * sd_data\n", "\n", "# 이상치 탐지\n", "outliers <- data[data < lower_bound | data > upper_bound]\n", "\n", "# 결과 출력\n", "cat(\"평균:\", mean_data, \"\\n표준편차:\", sd_data, \"\\n\")\n", "cat(\"3표준편차 이상 벗어난 값(이상치):\", outliers, \"\\n\")\n" ] }, { "cell_type": "markdown", "id": "a747c923", "metadata": {}, "source": [ "### 예시 결과:\n", "평균이 약 50이고, 표준편차가 약 5인 데이터를 기준으로, 평균 ± 3 표준편차 범위를 벗어난 값들이 이상치로 간주됩니다.\n", "예를 들어, mean ± 3 * sd 범위는 [35, 65]가 되며, 이 범위 밖에 있는 값들이 이상치로 탐지됩니다.\n", "### 요약\n", "3 표준편차 규칙은 정규분포를 가정한 이상치 탐지 방법으로, 평균에서 3σ 이상 벗어난 값을 이상치로 간주합니다." ] }, { "cell_type": "markdown", "id": "bffa8aa6", "metadata": {}, "source": [ "## 사분위수 이용 이상탐지" ] }, { "cell_type": "markdown", "id": "9a73447f", "metadata": {}, "source": [ "사분위수를 이용한 이상치 탐지는 IQR(Interquartile Range) 방법을 사용하여 이상치를 탐지하는 매우 일반적인 방법입니다. 이는 정규분포 가정 없이 데이터의 분포를 바탕으로 이상치를 탐지하는 방법으로, 데이터가 비대칭적이거나 정규분포가 아닐 때 유용합니다.\n", "\n", "### 사분위수를 이용한 이상치 탐지 개념\n", "1. 사분위수(Quartile)\n", "사분위수는 데이터를 4등분하여 분포를 설명하는 값입니다.\n", "\n", "- Q1 (1사분위수): 하위 25%에 해당하는 값 (데이터의 25%가 이 값보다 작음).\n", "- Q2 (2사분위수, 중앙값): 하위 50%에 해당하는 값 (데이터의 중앙값).\n", "- Q3 (3사분위수): 하위 75%에 해당하는 값 (데이터의 75%가 이 값보다 작음).\n", "2. IQR (Interquartile Range, 사분범위)\n", "- IQR은 1사분위수(Q1)와 3사분위수(Q3) 간의 범위입니다.\n", "- IQR = Q3 - Q1: 이 범위는 데이터의 중간 50%를 포함합니다.\n", "3. 이상치 정의\n", "IQR 방법에서 이상치는 아래와 같이 정의됩니다:\n", "\n", "- 이상치 (Outliers): 데이터가 Q1 - 1.5 * IQR 보다 작거나, Q3 + 1.5 * IQR 보다 큰 값.\n", "이 범위 밖에 있는 값들은 데이터 분포에서 멀리 떨어져 있어 이상치로 간주됩니다.\n", "\n", "### 사분위수를 이용한 이상치 탐지 방법\n", "1. 사분위수(Q1)와 3사분위수(Q3)를 계산.\n", "2. IQR을 계산.\n", "3. Q1 - 1.5 * IQR보다 작은 값 또는 Q3 + 1.5 * IQR보다 큰 값을 이상치로 탐지.\n" ] }, { "cell_type": "markdown", "id": "04b1ad61", "metadata": {}, "source": [ "**IQR(Interquartile Range, 사분위 범위)**에서 1.5를 곱하는 이유는, 데이터를 이상치로 분류하기 위한 경계를 설정하기 위해서. 이 값은 이상치 탐지에 대한 경험적 기준으로, 데이터가 정규분포를 따르지 않더라도 적절한 범위에서 극단적인 값을 탐지할 수 있도록 도와준다" ] }, { "cell_type": "code", "execution_count": 7, "id": "1f2c2c22", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "1사분위수(Q1): 47.56764 \n", "3사분위수(Q3): 53.80156 \n", "IQR: 6.23392 \n", "이상치 탐지 범위: [ 38.21676 , 63.15244 ]\n", "이상치: 100 105 \n" ] } ], "source": [ "# 예시 데이터 생성\n", "set.seed(123)\n", "data <- c(rnorm(100, mean = 50, sd = 5), 100, 105) # 정규분포 + 이상치 포함\n", "\n", "# 사분위수 계산\n", "Q1 <- quantile(data, 0.25)\n", "Q3 <- quantile(data, 0.75)\n", "\n", "# IQR 계산\n", "IQR_value <- Q3 - Q1\n", "\n", "# 이상치 탐지 범위 계산\n", "lower_bound <- Q1 - 1.5 * IQR_value\n", "upper_bound <- Q3 + 1.5 * IQR_value\n", "\n", "# 이상치 탐지\n", "outliers <- data[data < lower_bound | data > upper_bound]\n", "\n", "# 결과 출력\n", "cat(\"1사분위수(Q1):\", Q1, \"\\n\")\n", "cat(\"3사분위수(Q3):\", Q3, \"\\n\")\n", "cat(\"IQR:\", IQR_value, \"\\n\")\n", "cat(\"이상치 탐지 범위: [\", lower_bound, \",\", upper_bound, \"]\\n\")\n", "cat(\"이상치:\", outliers, \"\\n\")\n" ] } ], "metadata": { "kernelspec": { "display_name": "R", "language": "R", "name": "ir" }, "language_info": { "codemirror_mode": "r", "file_extension": ".r", "mimetype": "text/x-r-source", "name": "R", "pygments_lexer": "r", "version": "4.4.1" } }, "nbformat": 4, "nbformat_minor": 5 }