Grafică statistică şi grafică "artistică", pentru două variabile
Generăm un anumit număr de puncte având drept coordonate expresii simple de sin() şi cos(); cu funcţia smoothScatter() obţinem o estimare de densitate a punctelor, reliefată printr-o anumită gradare a culorilor de acoperire a unor zone; apoi, plotăm segmentele corespunzătoare perechilor de puncte.
Ideea este de a corela o histogramă verticală (pentru notele de la "Română") cu una orizontală ("Matematică"). ...dedesubtul diagonalei duse prin colţul (0,0) avem mult mai multă culoare decât deasupra, însemnând că pentru majoritatea elevilor notele la "Română" sunt mai mari decât cele de la "Matematică".
Studiul datelor evaluării naţionale din 2016 (folosind R)
Studiul datelor examenului de bacalaureat din 2016 (folosind R)
unde găsim că normalitatea este o iluzie şi este chiar greu de simulat!
Distribuţia mediilor bacalaureatului
Contrar aşteptării obişnuite, densităţile estimate diferă mult de distribuţia normală; avem câte un vârf cu înălţimea ≈25%-30%, care pe măsură ce media judeţeană creşte, se mută dinspre zona mediilor 6-7 (de la "Ilfov 7.02", cu media judeţeană 7.02) spre zona mediilor 8-9 (până la "Iaşi 7.95").
sinteză: "Bacalaureat 2015 - de la forma microsoftizată, la R"
Ne-am ocupat anterior în cinci părţi (prima - în iulie) de rezultatele bacalaureatului din 2015 (prezentând diverse elemente de limbaj R, cu judecăţi statistice elementare), plecând de la setul de date (în formă "microsoftizată") preluat de la data.gov.ro. Între timp s-a insinuat cumva ideea de a reuni părţile respective într-o lucrare unică, eventual în format PDF.
vezi Cărţile mele (de programare)