όλα τα τεύχη


Το σημείωμα της έκδοσης

Copy Cataloguing: αξιοποιώντας έτοιμες εγγραφές

Συλλογικός Κατάλογος Δημοσίων Βιβλιοθηκώ Φάσεις υλοποίησης ( 1999 - 2004)

Το στοιχείο της δομής στις γλώσσες ευρετηρίασης

Δημόσια Κεντρική Βιβλιοθήκη Πύργου

Δημόσια Κεντρική Βιβλιοθήκη Ρόδου

Δημόσια Κεντρική Βιβλιοθήκη Σερρών

Χρήσιμες Διευθύνσεις στο Διαδίκτυο


Τεύχος 3, Μάιος 2005
(έγχρωμη έκδοση, 10,2MB)
 

"Οι Δημόσιες Βιβλιοθήκες...Κινούνται», τεύχος 3, Μάιος 2005: Τετράμηνη έκδοση του Εθνικού Κέντρου Τεκμηρίωσης/ΕΙΕ που πραγματοποιείται στο πλαίσιο του έργου «Ολοκλήρωση των Έργων των Κινητών Βιβλιοθηκών»-Επιχειρησιακό Πρόγραμμα Εκπαίδευσης και Αρχικής Επαγγελματικής Κατάρτισης (ΕΠΕΑΕΚ II ), Γ' ΚΠΣ, το οποίο συγχρηματοδοτείται κατά 75% από την Ευρωπαϊκή Ένωση-Ευρωπαϊκό Κοινοτικό Ταμείο και κατά 25% από το Ελληνικό Δημόσιο".




Το στοιχείο της δομής στις γλώσσες ευρετηρίασης

Στην πορεία της μέχρι σήμερα, η επιστήμη της πληροφόρησης χρησιμοποίησε και χρησιμοποιεί σύνολα όρων για τη θεματική περιγραφή των τεκμηρίων και την υποστήριξη της πρόσβασης σε αυτά. Πρόκειται για λεξιλόγια (γλώσσες ευρετηρίασης) που χαρακτηρίζονται από διαφορετικούς τύπους και βαθμούς οργάνωσης, ως απόρροια της ανάπτυξης και χρήσης τους σε διαφορετικά πλαίσια απαιτήσεων.

Μια πρώτη θεμελιώδης διαφοροποίηση συναρτάται με τον έλεγχο του λεξιλογίου. Χωρίς τον έλεγχο αυτό, η ευρετηρίαση γίνεται με όρους ελεύθερου κειμένου ή με λέξεις-κλειδιά που δεν ανήκουν σε τυποποιημένο λεξιλόγιο. Μπορεί μια τέτοια προσέγγιση να παρακάμπτει μια απαιτητική και επίπονη εργασία, ασφαλώς όμως δεν την υποκαθιστά, διότι δεν αποδίδει ικανοποιητικά κατά την ανάκτηση. Η μεγάλη ποικιλομορφία του ανθρώπινου λόγου δυσχεραίνει την ταύτιση του όρου αναζήτησης με τον όρο ευρετηρίασης αυτό ακριβώς το πρόβλημα έρχεται να αντιμετωπίσει σε κάποιο βαθμό ο έλεγχος του λεξιλογίου. Συχνά, μάλιστα, ως γλώσσες ευρετηρίασης νοούνται μόνο τα ελεγχόμενα λεξιλόγια, και σε αυτά θα επικεντρώσουμε την προσοχή μας.

Ένας κατάλογος καθιερωμένων όρων αποτελεί την απλούστερη μορφή ελεγχόμενου λεξιλογίου. Καθιστά υποχρεωτική τη χρήση συγκεκριμένων όρων για συγκεκριμένες έννοιες (συχνά με παραπομπές του τύπου "βλέπε", π.χ. "πουλιά, βλέπε πτηνά"), αλλά δεν προσφέρει καμία περαιτέρω δυνατότητα καθώς δεν διαθέτει δομή. Η δομή του λεξιλογίου είναι εκείνη που επηρεάζει άμεσα το ζητούμενο, την καθοδήγηση δηλαδή του χρήστη στην επιλογή του κατάλληλου όρου αναζήτησης.

Τα λεξιλόγια με την απλούστερη δομή είναι οι διαδεδομένες στο Διαδίκτυο "ταξινομίες", όρος που πολλές φορές χρησιμοποιείται με ασαφή τρόπο. Οι ταξινομίες έχουν ιεραρχική δομή: οι σχέσεις μεταξύ των εννοιών αναπτύσσονται κάθετα και χρησιμοποιούνται κυρίως για την ομαδοποίηση των όρων σε ευρείες θεματικές κατηγορίες (π.χ. ο όρος "πτηνά" έχει ως πλατύτερο τον όρο "ζώα" και ως ειδικότερο τον όρο "περιστέρια"). Παρόμοια είναι η δομή και η χρήση των "συστημάτων κατηγοριοποίησης". Και τα ταξινομικά συστήματα έχουν ανάλογη δομή, αλλά η ιστορία, η φιλοσοφία και η χρήση τους διαφέρουν αρκετά.

Το στοιχείο όμως που προσδίδει στη δομή του λεξιλογίου τη μορφή δικτύου σχέσεων και παρέχει στον χρήστη τη δυνατότητα να ξεφύγει από την ομαδοποίηση των όρων και να κινηθεί σε εναλλακτικές διαδρομές είναι η "οριζόντια" διασύνδεση των εννοιών με μη ιεραρχικές σχέσεις (π.χ. ο όρος "πτηνά" έχει ως σχετικό τον όρο "ορνιθολογία" ακολουθώντας τη διαδρομή αυτή, ο χρήστης περνά από την ομάδα ή κατηγορία των "έμβιων όντων" σε εκείνη των "επιστημών"). Τέτοια δομή διαθέτουν οι κατάλογοι θεματικών επικεφαλίδων και οι θησαυροί, δύο τύποι γλώσσας ευρετηρίασης που χρησιμοποιούνται ευρέως σε συστηματικά τεκμηριωμένες συλλογές. Η μεταξύ τους διάκριση δυσχεραίνεται από αυτήν ακριβώς την δομική συγγένειά τους, η οποία εντούτοις είναι σε μεγάλο βαθμό επιφανειακή.

Στην πραγματικότητα, μεγάλες είναι οι διαφορές τους τόσο στο θεωρητικό υπόβαθρο όσο και στην πρακτική εφαρμογή τους, και αυτό οφείλεται καταρχήν στο γεγονός ότι εκπροσωπούν δύο διαφορετικές προσεγγίσεις στο δίπτυχο ευρετηρίαση-αναζήτηση.

Πιο συγκεκριμένα, οι θεματικές επικεφαλίδες:

  • δομούνται με βάση τη θεματική περιγραφή συγκεκριμένων τεκμηρίων,
  • συχνά αποτελούνται από συνδυασμούς όρων που δηλώνουν μια ευκαιριακή, ή αλλιώς συντακτική, σχέση μεταξύ των εννοιών, η οποία δεν έχει νόημα παρά στο πλαίσιο της ευρετηρίασης του εκάστοτε τεκμηρίου,
  • χρησιμοποιούνται στην προσυνδυασμένη ευρετηρίαση.

Ο τυχαίος τρόπος με τον οποίο προστίθενται νέες επικεφαλίδες στον κατάλογο, βάσει των αναγκών της ευρετηρίασης, αφήνει μεγάλα περιθώρια για θεματικά "κενά" ή "επικαλύψεις". Στους θησαυρούς, οι όροι:

  • εκφράζουν αυτόνομες έννοιες που από κοινού καλύπτουν θεματικά συγκεκριμένο εύρος και βάθος,
  • διασυνδέονται με σταθερές σημασιολογικές σχέσεις που απορρέουν από τις ίδιες τις έννοιες και δεν εξαρτώνται από κανένα συγκεκριμένο τεκμήριο,
  • χρησιμοποιούνται στην υστεροσυνδυασμένη ευρετηρίαση, όπου σε κάθε τεκμήριο αποδίδεται ένας αριθμός ξεχωριστών θεματικών όρων, και μόνο στη φάση της αναζήτησης μπορεί να γίνει συνδυασμός των όρων αυτών.

Ο συγκροτημένος τρόπος με τον οποίο δομούνται εξαρχής οι θησαυροί διευκολύνει την πληρότητα και τη σαφήνεια εννοιών και σχέσεων στο θεματικό τους πλαίσιο.

Η φιλοσοφία των θησαυρών ενισχύει την "οικονομία" της γλώσσας ευρετηρίασης. Σχηματικά, θα λέγαμε ότι η δομική μονάδα στους θησαυρούς είναι η "λέξη", ενώ στους καταλόγους θεματικών επικεφαλίδων είναι η "φράση". Οι επικεφαλίδες αυξάνονται συνεχώς και με τυχαίο τρόπο προκειμένου να περιγραφούν νέα τεκμήρια.

Αντίθετα, αλλαγές στο περιεχόμενο θησαυρών γίνονται μόνο στον βαθμό που εμφανίζονται νέες έννοιες ή επέρχονται τροποποιήσεις στις ήδη υπάρχουσες, πάντοτε στο πλαίσιο της θεματικής τους κάλυψης.

Η φαινομενική ομοιότητα των δύο αυτών γλωσσών ευρετηρίασης ως προς τη δομή του πλέγματος των σχέσεων οφείλεται περισσότερο στο γεγονός ότι ορισμένοι κατάλογοι θεματικών επικεφαλίδων (όπως της Βιβλιοθήκης του Κογκρέσου) υιοθέτησαν τα τελευταία χρόνια τη σημειογραφία που αναπτύχθηκε για την περιγραφή της δομής των θησαυρών. Παλαιότερα χρησιμοποιούσαν (και πολλοί χρησιμοποιούν ακόμη και σήμερα) τις παραπομπές του τύπου "βλέπε επίσης" για να αποτυπώσουν αδιακρίτως τόσο τις κάθετες όσο και τις οριζόντιες σχέσεις μεταξύ των όρων.

Η αλλαγή αποφασίστηκε ακριβώς επειδή διαπιστώθηκε η αδυναμία των συγκεκριμένων παραπομπών να αποδώσουν αυτήν τη θεμελιώδη δομική διάκριση. Ωστόσο, σε μεγάλο βαθμό το εγχείρημα απέτυχε: το σύστημα παραπομπών μεταξύ των επικεφαλίδων, παρά τη χρήση της σημειογραφίας των θησαυρών ("BT-NT", "RT"), εξακολουθεί να μη διαχωρίζει σαφώς τις κατηγορίες σχέσεων και να μην ακολουθεί τις κατευθυντήριες οδηγίες για τους θησαυρούς (ISO 2788, ΕΛΟΤ 1321).

Ο λόγος της αποτυχίας είναι απλός: από τη στιγμή που κάθε επικεφαλίδα δύναται να απαρτίζεται από περισσότερες της μίας έννοιες, η εφαρμογή της δομής των θησαυρών είναι ουσιαστικά ανέφικτη. H επικεφαλίδα "Automobiles-Pollution control devices" εμφανίζεται ως ειδικότερος όρος ("NT") της επικεφαλίδας "Air-Pollution"... Είναι φανερό ότι, με τους συνδυασμούς των εννοιών, ο καθορισμός μιας ιεραρχικής σχέσης δεν μπορεί παρά να είναι αυθαίρετος.

Αλλά ακόμη και στις σχέσεις μεταξύ απλών εννοιών, επικρατεί ανάλογη σύγχυση: η επικεφαλίδα "Automobiles" εμφανίζεται ως "NT" της επικεφαλίδας "Transportation, Automotive", η οποία με τη σειρά της δεν εμφανίζεται ως "NT" της επικεφαλίδας "Transportation". Ή, πάλι, η επικεφαλίδα "Marriage" εμφανίζεται ως "NT" της επικεφαλίδας "Love"! Ο θεμελιώδης κανόνας που θέλει τις έννοιες που συνδέονται με ιεραρχική σχέση να ανήκουν στην ίδια γενική κατηγορία, στον ίδιο "βασικό τύπο εννοιών" (π.χ. "πράγματα", "ενέργειες" ή "ιδιότητες", βλ. ΕΛΟΤ 1321 § 8.3.2), αγνοείται συστηματικά. Το αποτέλεσμα είναι ότι συνολικά η δομή του καταλόγου θεματικών επικεφαλίδων χαρακτηρίζεται από έλλειψη συνοχής και τελείως υποκειμενική οργάνωση.

Κλείνοντας εδώ μια συνοπτική παρουσίαση του θέματος, θα πρέπει να πούμε ότι τα δομικά χαρακτηριστικά των λεξιλογίων και οι μεταξύ τους διαφορές έχουν συγκεκριμένες πρακτικές συνέπειες στη χρήση και απόδοση των συστημάτων πληροφόρησης. Αυτός είναι και ο λόγος για τον οποίο το ζήτημα παρουσιάζει μεγάλο ενδιαφέρον και βρίσκεται σήμερα στην αιχμή του προβληματισμού για την οργάνωση του περιεχομένου.

Διονύσης Γιαννίμπας
Συντονιστής σε θέματα ορολογίας
Εθνικό Κέντρο Τεκμηρίωσης

 

Copyright © ΕΚΤ (800x600)