Expresii aritmetice în R (partea I)
Generăm într-un limbaj implementat ca interpretor - şi am ales R - toate expresiile aritmetice pentru patru operanzi, cu trei dintre cei patru operatori binari elementari. Într-un limbaj compilat - fie C++ - aceasta ar necesita demersuri prealabile de modelare (de obicei prin arbori binari) pentru "expresie aritmetică"; în schimb, interpretoarele funcţionează după principiul "read - eval" şi prevăd câte o funcţie care analizează şi evaluează o expresie dată ca şir de caractere - şi exact faptul că putem dispune direct de funcţia respectivă îl folosim aici, pentru a genera expresiile aritmetice menţionate.
Alegând tocmai R, avem imediat şi instrumente comode pentru diverse experimentări şi grafice de natură statistică asupra expresiilor respective.
Statistici pe judeţ, mediu şi grupe de medii, folosind R (partea a III-a)
Barele verticale alăturate (având beside=TRUE în apelul barplot()) din fiecare grup - [5,6), [6,7), etc. - sunt asociate liniilor tabelului, reprezentând implicit judeţele; înălţimea barei este proporţională cu procentul mediilor de categoria respectivă, pentru judeţul corespunzător barei.
Dar transpunând în prealabil matricea respectivă şi elaborând cât se poate comanda barplot(), putem găsi o reprezentare grafică superioară (şi care înlesneşte comparaţiile).
În [2] am produs în final structura 'jud.med', conţinând denumirile judeţelor şi mediile corespunzătoare, pe linii ordonate descrescător după medie; lista începea cu Cluj 7.598, M.Bucureşti 7.592, Brăila 7.533, etc. şi se încheia cu Vaslui 6.296, Mehedinţi 6.270, ..., Giurgiu 5.945. Media judeţului rezulta ca valoarea medie a tuturor mediilor finale ale elevilor din judeţul respectiv…
Dar situaţia depinde considerabil şi de 'Mediu', cum am evidenţiat în [4]; prin urmare lista tocmai amintită este principial greşită - cel mai evident, în privinţa încadrării M.Bucureşti ("judeţ" care are numai 'URBAN', spre deosebire de judeţele propriu-zise). Pentru corectitudine era necesar să ţinem seama de proporţia celor două categorii de mediu, în fiecare judeţ; sau, cum vom proceda mai simplu aici - să tratăm separat cele două cazuri.
Statistici pe judeţ, mediu şi grupe de medii, folosind R (partea a II-a)
Sintetizăm şi restructurăm datele examenului de Evaluare Naţională 2015, în scopul evidenţierii unor aspecte şi relaţii posibil relevante, privitoare la judeţul şi mediul în care se încadrează şcolile din care provin candidaţii şi respectiv, media finală a elevilor.
Avem câte 14 valori 'freq' pentru fiecare judeţ - procentele a 6 categorii de medii finale plus procentul de elevi absenţi, pentru fiecare categorie de 'Mediu - exceptând "M.Bucureşti" la care avem numai 7. Ar fi de comparat situaţiile, după 'Mediu' şi după judeţ; dar numai în trecere vom consemna eventuale concluzii şi "semnale de alarmă", urmărind de fapt formularea câtorva grafice statistice (conturând eventual anumite caracteristici ale datelor), folosind R (pachetele de bază şi pachetul ggplot2).
Statistici pe judeţ, mediu şi grupe de medii, folosind R (partea I)
Sintetizăm şi restructurăm datele examenului de Evaluare Naţională 2015, în scopul evidenţierii unor aspecte şi relaţii posibil relevante, privitoare la judeţul şi mediul în care se încadrează şcolile din care provin candidaţii şi respectiv, media finală a elevilor.
vezi Cărţile mele (de programare)