Alocarea pe zile a lecțiilor prof | cls; ajustarea interactivă a repartiției rezultate, în scopul omogenizării tuturor distribuțiilor.
Forma normală a lecțiilor cls|prof promite repartizarea pe zile a acestora, uniformă față de un criteriu sau altul. Matricea orară a lecțiilor unei zile din orarul curent, permite socotirea vizuală a ferestrelor existente.
Ce poate fi mai plăcut decât să știi că și mâine ai ceva anume, de făcut… eventual "doar" s-o iei de la capăt !?
Recunoașterea textului și extragerea datelor unui orar școlar prezentat în format PDF (VIII)
Constituim un nou model "cop.traineddata
" — unde "cop" ar aminti "cls|obj|prof
" și de fapt… vine de la "COPy", că asta facem: „copiem” conținuturi ad-hoc din poze ale orarelor (folosind Tesseract, Bash, ImageMagick), în scopul de a le organiza (folosind R) ca set coerent de date.
Recunoașterea textului și extragerea datelor unui orar școlar prezentat în format PDF (VII)
Avem chipurile, un „tabel de date” aferente unui orar școlar — dar cu defectele rezultate în urma formatării vizuale (sub Microsoft-Word sau -Excel) și în urma scanării ulterioare a paginilor PDF respective; în plus, textul de pe imaginile respective este scris "de mână"…
În aceste condiții, rezultatele recunoașterii textului folosind Tesseract sunt nesatisfăcătoare; însă dacă separăm cumva celulele din tabelul inițial și aplicăm Tesseract pe „celulele PNG” rezultate (scurtându-le pe cât se poate — eliminând astfel, în mod implicit, diversele artefacte), atunci textul conținut va fi mult mai bine, recunoscut.
vezi Cărţile mele (de programare)