Pagina principala
Informatii
Internationalizarea
pROgrame KDE/Qt
Download
Documentatii
Despre LKR
Contact
Resurse
Harta site-ului

Procesoare de text


   Claudiu Costin
   18 mai 2000

Introducere

Un aspect foarte important al utilizarii calculatoarelor este crearea de documente. Exista o multitudine de editoare de text. Ceea ce se stie mult mai putin este ca exista o deosebire distincta intre textul propriu-zis si formatarea acestuia. Formatarea reprezinta atributele care sint aplicate textului sau documentului in ansamblu. In mediile integrate de editare de documente, precum MS Office sau Star Office, operatiile de formatare sint visibile in timpul creearii documentului si foarte complexe. Aceasta complexitate nu este administrata eficient prin faptul ca utilizatorul poate face absolut ce vrea, iar documentele, care ocupa o gama incepind de la simplul C.V. si terminind la carti de sute de pagini, sint de o calitate extrem de slaba. Iata de ce setul de variabile si reguli care reprezinta tehnoredactarea este o arma cu doua taisuri. Mai putin de 2% din utilizatorii de aplicatii "office" stiu sa foloseasca posibilitatile reale de tehnoredactare si sa evite folosirea irationala de fonturi.

Sub Linux, ca de obicei, lucrurile stau un pic altfel. Astfel, in foarte multe pachete de procesare de text, de aranjarea paginii sau a altor elemente se ocupa un program, raminind ca utilizatorul sa se ocupe efectiv de scrierea textului. Desi editarea nu se face vizual, iar fisierul editat arata mai mult a cod sursa de program, realitatea practica confirma inca odata ca unde este munca este si satifactie.

POD - Perl Old Documentation format

Acest format de fisier a fost inventat de programatorii de Perl pentru a insera documentatie in cadrul codului sursa al programului, fara ca in vreun fel sa fie afectata rularea programelor. El foloseste un numar mic de taguri de formatare astfel incit este usor de invatat si foarte bun la crearea de documentatii si pentru alte programe. Fisierul sursa POD se poate prelucra cu ajutorul mai multor programe de conversie astfel incit obtineti imediat formatele HTML, man, txt si LaTex (adica implicit si DVI, PostScript, PDF). Nu permite inserarea de imagini. Mai jos puteti vedea sursa unui fisier POD, cu unele din elementele de formatare uzuale.

Fisier sursa POD:

=head1 Acesta este un titlu

Un rind

=head2 Un subtitlu

Urmeaza in continuare o lista:

=over 4

=item * Primul item

=item *

Al doilea item

=back

=head2 l doilea subtitlu

Textele pot fi B<bold>, I<italic> sau C<typewriter>. Exista si un tag pentru F<fisiere>.

Formatul POD permite si referinte incrucisate. Deoarece nu este treaba utilizatorului sa faca formatarea, documentele generate din fisierele sursa vor avea un aspect unitar. In 10 minute invatati formatul POD si in alte 10 minute de scris va impresionati toti prietenii cu abilitatile dumneavoastra de a avea simultan patru formate frumos tehnoredactate dintr-un singur fisier sursa.

TeX/LaTeX

S-au scris multe carti despre TeX si in principal pachetul de macrouri care este LaTeX. Acest sistem complex de formatare a documentelor este extrem de performant. Realizeaza documente de o calitate uluitoare si este in continuare folosit in mediile academice si nu numai pentru creare de carti, documente etc. Avantajul principal pentru un utilizator incepator este ca nu ii permite sa modifice prea multe. El lucreaza implicit cu stiluri si tine cont de toate regulile tipografice. LaTeX (TeX) este de fapt tipograful dumneavoastra. Nu trebuie decit sa ii spuneti unde vine capitolul, sectiunea, figurile. El genereaza in mod automatizat cuprinsul, lista de tabele, de figuri, bibliografia, pune corect numerele de pagini acolo unde aveti referinte, se ocupa de notele de subsol si cele marginale. Astfel, si documentele cele mai simple au un aspect profesional. Cel mai puternic atu al TeX-ului este editarea de formule matematice. Ecuatii extrem de complexe din cartile de matematica sau fizica vad lumina tiparului datorita TeX-ului. Deoarece TeX este practic un limbaj de programare orientat catre text, o multime de utilizatori din intreaga lume au creat extensii si module care simplifica de exemplu creare de figuri PostScript, generatoare de algoritmi, stiluri etc. Trebuie sa retineti ca fonturile din TeX nu au corespondent direct pentru TrueType. Ele au un format special, alte codari si chiar stiluri diferite (practic mult mai multe stiluri: normal, bold, italic, slanted, noun) si acopera seturi de caractere latine, grecesti si cirilice.

Daca sinteti hotarit sa creati documente superbe si cu o multime de efecte va recomand calduros sa luati o carte in limba romana care poate se mai gaseste in librarii de stat. Daca vreti sa beneficiati de LaTeX dar nu vreti sa va spetiti prea mult lucrati cu ...

LyX

Probabil Matthias Ettrich avea o simpatie deosebita pentru LaTeX, dar era si putin comod. Astfel, prin 1995 se hotaraste sa scrie o interfata grafica care sa proceseze in fundal fisierele sursa LaTeX.

Editarea vizuala in LyX reprezinta o aproximare a ceea ce obtineti in final. El are un editor grafic de ecuatii foarte bun si permite inserarea de figuri direct in document, randindu-le pentru a putea vedea ce reprezinta. Inserarea de note de subsol, comentarii, cuprins, referinte este o joaca de copii. Schimbarea fonturilor este insa mai dificila. Permite inserare de cod LaTeX direct in document, lucreaza cu stiluri. Stie sa faca previzualizare intr-un vizualizor postcript precum gv sau kghostview (acesta din urma stie sa si actualizeze automat documentul daca a fost modificat). LyX stie sa importe LaTeX, sa exporte direct in LaTeX, text, PostScript, va permite mai mult control asupra documentului, dar nu implemeteaza toate capabilitatile TeX-ului. Acest lucru este observabil numai de experti, deci nu va ingrijorati deloc. Documentatia de ajutor este alcatuita din documente LyX, astfel incit generind fisierul PostScript sau DVI puteti vedea efectul comenzilor explicate. Pentru a obtine LyX, vizitati www.lyx.org sau daca lucrati in KDE puteti lua si un pachet RPM al KLyX de-a gata compilat de la www.kde.org (este mult mai neactualizat decit LyX).

SGML - LinuxDoc

SGML nu este un limbaj de formatare. Este o metoda de specificare a stilurilor de formatare. Unul dintre cele mai populare in mediul Linux este specificatia LinuxDoc. El seamana foarte mult cu HTML. Prima linie din fisierul precizeaza tipul documentului SGML: <!doctype linuxdoc system>. Aproape toata documentatia Linux este lucrata cu stilul article. LinuxDoc nu permite inserarea de figuri, ceea ce este un avantaj major la ora actuala. In schimb stie sa lucreze cu referinte incrucisate, sa genereze automat cuprins si suporta taguri hypertext: <htmlurl> si <url>. Cu acestea puteti introduce link-uri direct in document. Sursa SGML poate fi convertita intr-o multime de formate: HTML, text, man, info, LaTeX, LyX, PostScript, RTF. Toate acestea le obtineti dintr-un singur fisier, folosind programele: sgml2html, sgml2info, sgml2latex, sgml2lyx, sgml2rtf si sgml2txt. Cititi paginile lor de manual deoarece fiecare din ele poate mai mult decit ii sugereaza numele. Ele fac parte din pachetul sgml-tools.

DocBook

Formatul DocBook este tot o specificatie SGML. Este foarte complex si incearca sa acopere orice nevoi pentru scrierea de documentatii tehnice. Spre deosebire de HTML si LinuxDoc, tagurile trebuie riguros inchise cind sint deschise si nu sint permise anumite taguri in unele parti ale documentului. Stilul de lucru este puternic structurat si exista taguri pentru aproape orice entitate din lumea tehnica. De exemplu, daca vreau sa evidentez un nume de fisier, stunci il scriu intre <filename> si </filename>, iar pentru variabile de mediu de interpretor am <envar> si </envar>. Exista seturi complete de taguri pentru descrierea meniurilor unui program, pentru documentarea functiilor si procedurilor, a claselor, pentru mesajele afisate pe ecran. Este destul de dificil de asimilat DocBook si de aceea este bine sa invatati numai ceea ce aveti nevoie. DocBook face separarea completa intre formatarea finala si documentul propriu-zis. Astfel, pentru un anumit fisier sursa si cu un anumit stil pot genera formate de iesire pentru ecran, pentru imprimanta sau orice alt mediu de afisare inchipuit. Fiecare mediu de distributie electronic este speculat la caracteristicie pe care le are. In viitorul apropiat se urmareste integrarea XML, alaturi de alte imbunatatiri. Programele backend pentru DocBook genereaza HTML, DVI, PostScript si PDF. Trebuie sa mai stiti ca proiectele Gnome si KDE folosesc DocBook pentru generarea fisierelor HTML necesare sistemului de ajutor on-line.

Daca utilizati o distributie de Linux bazata pe RedHat trebuie sa instalati pachetele RPM necesare pentru a scrie documente DocBook. Pe site-ul Linux KDE Romania prezent si un tutorial tradus in limba romana, care ar trebui sa va familiarizeze foarte rapid cu acest nou stil de document. Iata pachetele de care aveti nevoie (in ordinea in care trebuie sa le instalati):

  • sgml-common-0.1-3.noarch.rpm
  • docbook-3.1-5.noarch.rpm
  • stylesheets-0.10-2.noarch.rpm
  • jade-1.2.1-6.i386.rpm

Optional puteti instala si jadetex-2.5-1.i386.rpm care va permite sa generati documente PostScript si PDF direct din sursa DocBook. Daca sinteti fan Emacs, atunci cu psgml-1.0.3-2.noarch.rpm puteti beneficia de un mod major SGML care stie sa automatizeze o multime de activitati in munca de editare.

Concluzii

Procesoarele de texte sint un de un real ajutor in crearea documentatiilor tehnice structurate. Exista si alte procesoare de texte alaturi de cele prezentate aici, de exemplu groff si lout. Ramine sa decideti cind este corect sa folositi un procesor de texte si cind este normal sa tehnoredactati direct intr-o aplicatie "office".

Resurse