momente şi schiţe de informatică şi matematică
To attain knowledge, write. To attain wisdom, rewrite.

Recunoașterea textului și extragerea datelor unui orar școlar prezentat în format PDF (V)

Bash | ImageMagick | Tesseract
2024 sep

[1] v. partea a IV-a

Intermezzo…

În loc să continui cuminte ce începusem în [1], firește că m-am lăsat tentat să adopt imediat noua variantă, Ubuntu 24.04 LTS "Noble Numbat", oferită automat după 29 august (mă bucura instalarea normală a variantei curente, pentru Ghostscript (10), ImageMagick (7) și altele).

N-am făcut decât să confirm și… să aștept (dar întâi, ar fi trebuit să mă documentez cu atenție).
După câtva timp am fost atenționat că instalarea nu poate continua: "'postgresql-9.5' is marked for removal but it is in the removal deny list"; pe moment am reacționat mecanic (de!… e ceva timp de când n-am mai folosit direct, psql): am șters în modul obișnuit, 'postgresql-9.5' — dar (bineînțeles) atenționarea s-a repetat pentru 'postgresql-10'; așa că am tot șters ('-10', '-11', '-12') și am reluat instalarea…
Acum desigur (pățit fiind), știu despre ce este vorba: înainte de a instala noua versiune, trebuie să respecți recomandarea (care ți se și amintește totdeauna) de a salva în prealabil, datele proprii; prin autopostgresqlbackup puteam salva foarte simplu, bazele mele de date…
Dar procedând mecanic (fără să mă gândesc), mi-a luat apoi ceva timp (după terminarea "instalării") ca să „recuperez” (ajutat de journalctl) bazele de date (a trebuit și să reinstalez 'postgresql-10'); reușind până la urmă să pot folosi psql și apoi pg_upgradecluster, bazele mele de date au fost în final, integrate în versiunea nou instalată ('postgresql-16').

Pe parcursul instalării automate a versiunii "Noble Numbat" a trebuit din când în când să confirm anumite configurări; iarăși, am răspuns cam mecanic, probabil nu prea inspirat, iar în final, după cam trei ore, am avut în față un "desktop" stupid: la baza ecranului figurau 5 iconuri mari, prin care puteam lansa prin click anumite aplicații — iar icon-ul central lansa "Office"… Sus pe ecran, se oferea coșcogeamitea casetă, în care puteam tasta vreun termen, obținând într-o altă casetă frumoasă, lista aplicațiilor legate de termenul tastat; bineînțeles, click pe un item deschidea aplicația respectivă…

Dar sunt peste 20 de ani, de când eu nu mai folosesc Microsoft-Office (deși a trebuit totuși, să dresez și eu elevii, cu "-Word", "-Excel", etc. și cu "point-and-click"); mai sunt și vreo 10 ani sau mai mulți, de când am exclus de pe sistemul meu pachetele "LibreOffice", fără să întâmpin vreodată un motiv de a regreta.
În plus, nu agreez și nici nu prea folosesc "telefonul inteligent", cu care a ajuns să semene "desktop"-ul oferit acum de noua versiune de Ubuntu (dacă o instalezi automat)…

Un timp, mi-a părut rău că n-am păstrat Xubuntu-22.04 (de care am fost foarte mulțumit); dar știu că nu se cade să fiu nemulțumit (că "nemulțumitului i se ia darul") și pe de altă parte și eu observ, ca toată lumea, tendința generală denumită generic populism — dorința și calea sigură de a câștiga piața și puterea (tendință însușită iată —de înțeles—  și de Ubuntu).
Trecând peste cele, m-am apucat cu umilință să încerc modificări prin care să ajung la o interfață grafică apropiată de cea coerentă, pe care o obținusem fără efort sub Xubuntu-22.04; nu m-am grăbit, fiind captivat uneori de documentații lăturalnice dar instructive (din gama GTK și Xfce); investigând pentru aspecte legate de situația mea, cred că am căzut și în vreo capcană scăpată din vedere de recomandările de rezolvare găsite…

Abia după trei zile de asemenea investigări, documentări și orbecăieli, am rezolvat situația — dar deocamdată nu tocmai cum s-ar fi cuvenit (ceea ce totuși nu mă deranjează, iar uneori poate fi avantajos): sistemul se lansează în modul text, permițându-mi să lucrez în consola tty1 (sau în alta, deschisă prin combinația binecunoscută ctrl+alt+F3, sau "+F4", etc.); după ce mă loghez (prin User și Pasword), pot intra în modul grafic tastând comanda startx (și trebuie să intru în „modul grafic”, având nevoie de exemplu, de un editor decent de cod-sursă).

Ceea ce am dorit arată cam așa (într-o instanță de lucru obișnuită):

În partea de sus a ecranului avem o bară îngustă (un Panel xfce4) care conține: meniul "Applications" (se poate deschide prin click, pentru a vedea ce aplicații avem pe sistem și a lansa eventual una dintre acestea, în primul rând din submeniul "Settings"); avem apoi 8 icon-uri de bază, "launchers" corespunzătoare aplicațiilor sau programelor pe care le folosesc de obicei, după caz: Thunar (manager de fișiere), editorul de text Gedit, un terminal, browserul Firefox, un Player, apoi Screenshot, managerul de pachete Synaptic și Task Manager; în partea din dreapta avem 4 "Workspace", care sunt urmate de anumiți "indicatori" de stare (pentru imprimantă, rețea, notificări, etc.), care n-au mai încăput pe imaginea redată mai sus.

Imaginea de mai sus (care se poate deschide într-un nou Tab al browser-ului, pentru a o vedea la scara reală) spune că în Workspace 1 am deschis Gedit, în Workspace 2 am deschis un Terminal, iar în al treilea spațiu de lucru am deschis Firefox; în Gedit lucrez în câte un Tab, "articol.html" și programul "word_dis.R" (iar într-un alt Tab am deschis ".bash_history", pentru a urmări sau a recupera anumite comenzi tastate anterior în Terminal). Când am nevoie, trec în Workspace-ul în care am deschis Terminal și de exemplu, lansez interpretorul $\mathbf{R}$ pentru a executa programul "word_dis.R", sau după caz, mă informez adesea prin man, despre unul sau altul dintre programele utilitare, sau despre diverse comenzi Bash, etc.; când este cazul să caut ceva pe Internet, sau să văd cum arată "articol.html", etc. — intru în workspace-ul în care am deschis Firefox.

Cele descrise mai sus deservesc maniera de lucru pe care am adoptat-o de mulți ani pentru a dezvolta o aplicație proprie; avem nevoie (și tocmai de aceea le-am fixat în câte un "workspace") de un editor de text (pentru a scrie programe-sursă în diverse limbaje și deasemenea, pentru a documenta pas cu pas aplicația respectivă), de un "terminal" (pentru a lansa și verifica diversele programe și secțiuni de cod), de un browser de fișiere (Thunar) și eventual de Firefox. În rest… ne bazăm direct pe sistem: de exemplu, click-dreapta pe itemul "5A.png" aflat undeva în fereastra lui Thunar, va deschide un meniu contextual din care putem alege pentru a vizualiza fișierul PNG respectiv, fie "ImageView"-ul obișnuit, fie "ImageMagick", sau "GIMP", etc.; sau, putem folosi în Terminal comenzi Bash sau diverse programe utilitare, pentru a înființa un fișier (touch), sau un director (mkdir), sau pentru a localiza, copia/muta/arhiva/dezarhiva fișiere, sau pentru a descărca de pe Internet (wget, curl), ș.a.m.d.

Deocamdată pot să mă declar mulțumit; Ghostscript s-a instalat cu versiunea 10 (și va fi de verificat cândva, dacă vechile mele programe în PostScript mai funcționează); ImageMagick a rămas la versiunea 6; pentru Python am acum versiunea 3.12; Django are acum versiunea 4.2 (și va trebui să văd dacă am de făcut ceva modificări pe acest site, dezvoltat inițial cu Django 3.2).

Deja am reînceput în "articol.html" și "word_dis.R" (evocate mai sus), lucrul la [1]…

vezi Cărţile mele (de programare)

docerpro | Prev | Next