Τι κάνουμε αν δεν βρούμε το έργο από τον εκδοτικό οίκο;

Τι κάνουμε αν δεν βρούμε το έργο από τον εκδοτικό οίκο;

Σάρωση!

 

Στην περίπτωση που ο εκδοτικός οίκος δεν διαθέτει το έργο σε ψηφιακή μορφή ή δεν μας παραχωρείται εντός του οριζόμενου από την Υπουργική Απόφαση διαστήματος (30 ημέρες), προχωράμε σε σάρωση του κειμένου.

Η σάρωση (scanning) είναι η διαδικασία ψηφιακής «δειγματοληψίας» ενός τυπωμένου εγγράφου. Η σάρωση γίνεται με τη χρήση σαρωτών (scanners), δηλαδή επίπεδων ηλεκτρονικών συσκευών συνδεδεμένων με ηλεκτρονικό υπολογιστή μέσω των οποίων επιτυγχάνεται ψηφιοποίηση εικόνας (φωτογραφίας ή σχεδίου) καθώς και κάθε εγγράφου με σκοπό την αποθήκευση ή την επεξεργασία ή και την ηλεκτρονική αποστολή αυτών.

Και πως ρυθμίζουμε καλύτερα τον σαρωτή;

Ανάλυση και Χρωματικό βάθος:

 

Η ανάλυση της σάρωσης συνδέεται με την πυκνότητα της πληροφορίας που θα αποτυπώσει ο σαρωτής κατά τη λήψη της φωτογραφίας (διαδικασία σάρωσης). Όσο μεγαλύτερη είναι η πυκνότητα τόσο μεγαλύτερη είναι η διακριτική ικανότητα του τελικού προϊόντος, δηλαδή ο διαχωρισμός στιγμάτων (κουκίδων) ανά επιφάνεια. Μικρή ανάλυση σάρωσης μπορεί να έχει σαν αποτέλεσμα την απώλεια σημαντικής πληροφορίας (π.χ. αν πρόκειται για φωτογραφίες ή για γραμματοσειρές μικρού μεγέθους). Από την άλλη, η υπερβολικά μεγάλη ανάλυση σάρωσης αφενός αυξάνει σημαντικά τον απαιτούμενο χώρο αποθήκευσης του τελικού προϊόντος, και αφετέρου πολλές φορές η πλεονάζουσα πληροφορία δεν προσφέρει οφέλη, αντιθέτως, δυσχεραίνει τη διαδικασία για τους σκοπούς της οποίας γίνεται η σάρωση (για παράδειγμα, η οπτική αναγνώριση χαρακτήρων σε κείμενα που έχουν σαρωθεί με πολύ υψηλή ανάλυση καθυστερεί σημαντικά, χωρίς να παράγει καλύτερα αποτελέσματα).

 

Η ανάλυση σάρωσης εκφράζεται σε «κουκίδες ανά ίντσα» (dots per inch – DPI) ή «pixels ανά ίντσα» (pixels per inch – PPI).

 

Το χρωματικό βάθος είναι το εύρος των διαφορετικών αποχρώσεων που μπορεί να λάβει μία κουκίδα κατά τη σάρωση. Ουσιαστικά, πρόκειται για μία τιμή, που ποικίλει μεταξύ:

  • 0 και 1 (1-bit, 21)
  • 0 και 256 (8-bit, 28)
  • 0 και 65.536 (16-bit, 216)
  • 0 και 16.777.216 (24-bit, 224)
  • 0 και 232 (32-bit)
  • 0 και 248 (48-bit)

 

Το χρωματικό βάθος συσχετίζεται με μία χρωματική παλέτα, δηλαδή έναν προκαθορισμένο πίνακα με τα χρώματα που αναπαριστά η κάθε πιθανή τιμή του χρώματος βάθους. Όσο μεγαλύτερο είναι το χρωματικό βάθος, τόσο πιο ρεαλιστική είναι η αναπαράσταση μίας εικόνας. Παρακάτω εμφανίζονται ενδεικτικά μερικές χρωματικές παλέτες.

 

Εικόνα 1 Χρωματική παλέτα 8-bit (αποχρώσεις γκρι)

 

Εικόνα 2 Χρωματική παλέτα 8-bit (χρώματα web)

 

Εικόνα 3 Χρωματική παλέτα 16-bit (RGB)

 

Ο παρακάτω πίνακας περιλαμβάνει τις επιθυμητές ελάχιστες απαιτήσεις σε ανάλυση και χρωματικό βάθος για το ψηφιακό υποκατάστατο (από σάρωση) σύμφωνα με τις κρατούσες συνθήκες σε Ευρώπη, Η.Π.Α. και αλλού[1].

Πίνακας 1 Ελάχιστες απαιτήσεις για σάρωση

 

Στον παραπάνω πίνακα θα πρέπει να ληφθεί υπόψη ένας επιπλέον παράγοντας, που σχετίζεται με τη διαδικασία οπτικής αναγνώρισης χαρακτήρων που ακολουθεί τη σάρωση: για κείμενα που έχουν μικρό μέγεθος χαρακτήρων η προκαθορισμένη ανάλυση των 400 dpi (ή 300 dpi) μπορεί να δημιουργήσει σφάλματα κατά την αναγνώριση. Σε αυτές τις περιπτώσεις συνίσταται ο διπλασιασμός της ανάλυσης (600 dpi).

Οδηγίες Σάρωσης σε λίγα βήματα

 

Για τις ρυθμίσεις σάρωσης συμβουλευτείτε τον Πίνακα 1

 

 

  • Η σάρωση πρέπει να γίνει από το πρωτότυπο υλικό ή από ένα οπτικά πολύ ποιοτικό αντίγραφο του.
  • Η γυάλινη επιφάνεια του σαρωτή επιβάλλεται να είναι καθαρή. Καλό είναι να γίνεται τακτικός καθαρισμός της με αντιστατικά πανάκια.
  • Αν οι διαστάσεις του εγγράφου είναι μεγαλύτερες από την επιφάνεια σάρωσης του σαρωτή, τότε η σάρωση πρέπει να γίνει τμηματικά. Συνίσταται, σε κάθε τμήμα, να περιέχονται σημεία επικάλυψης με τα γειτονικά τμήματα, ώστε να είναι ευκολότερη η μετέπειτα ανασύνθεση της κάθε σελίδας. Σε κάθε περίπτωση, συμβουλευτείτε το λογισμικό σάρωσης για τις τεχνικές λεπτομέρειες σε περιπτώσεις μεγάλων εγγράφων.
  • Αν ο σαρωτής παρέχει τροφοδότη χαρτιών, τότε μπορεί να επιταχυνθεί η διαδικασία σάρωσης, εφόσον είναι εφικτή η αποσύνθεση του πρωτότυπου εγγράφου (δηλαδή, ο διαχωρισμός των σελίδων του).
  • Κάποια έγγραφα, ιδίως μεγάλης ηλικίας, μπορεί να είναι ευαίσθητα στο έντονο φως και η διαδικασία σάρωσης να τα καταστρέψει. Σε μία τέτοια περίπτωση, συμβουλευτείτε κάποιον ειδικό.
  • Η σάρωση γίνεται ανά σελίδα.
  • Αν κατά την σάρωση των σελίδων παρατηρηθούν «μαύρες» περιοχές γύρω από τη σαρωμένη σελίδα, αν και δεν επηρεάζουν την περαιτέρω διαδικασία, συνίσταται κατά την τοποθέτηση της κάθε σελίδας προς σάρωση στον σαρωτή, να καλύπτονται τα κενά που μένουν στο γυαλί με σκληρό λευκό χαρτόνι.

Πως αποθηκεύουμε τα σαρωμένα έγγραφα;

 

Η διαδικασία της αποθήκευσης είναι σημαντική καθώς είναι το πρώτο στάδιο της οργάνωσης του αρχείου των ψηφιοποιημένων βιβλίων. Για το λόγο αυτό υπάρχει η ανάγκη να τεθούν κάποιες τεχνικές προδιαγραφές.

 

  1. Μορφότυπος Ψηφιοποιημένων Εγγράφων

      

Τα σαρωμένα έγγραφα πρέπει να αποθηκεύονται σε μορφή τύπου TIFF (Tagged Image File Format), δηλαδή αρχεία ψηφιακής εικόνας χωρίς συμπίεση (No compression). Πρέπει να αποφεύγεται η χρήση μορφοτύπων που εμπεριέχουν συμπίεση (π.χ. JPEG, PDF), καθώς η συμπίεση αλλοιώνει το περιεχόμενο της σάρωσης, χωρίς να είναι αναστρέψιμη αυτή η αλλοίωση.

Κάθε σαρωμένη σελίδα αποθηκεύεται σε ξεχωριστό αρχείο, ή, αν το υποστηρίζει το λογισμικό του σαρωτή, όλες οι σελίδες αποθηκεύονται σε μορφή TIFF, κάνοντας χρήση της δυνατότητας εμφώλευσης πολλαπλών σελίδων του μορφότυπου TIFF.

  1. Ονοματοδοσία και Φάκελοι

 

Η ονοματοδοσία των αρχείων πρέπει να είναι ενιαία.

Για την αποθήκευση των σαρωμένων σελίδων, δημιουργήστε έναν φάκελο (folder) στον τοπικό σας δίσκο με το όνομα του βιβλίου και τον αριθμό ISBN, π.χ.:

 

Η παγκοσμιοποίηση - 978-960-7510-94-5

 

Αν η κάθε σελίδα αποτελεί ξεχωριστό TIFF αρχείο, τότε αποθηκεύστε τις σαρωμένες σελίδες μέσα σε αυτόν τον φάκελο, δίνοντας τους σαν όνομα τον αριθμό της σελίδας. Για λόγους συνέπειας και ταξινόμησης, συνίσταται ο αριθμός να φέρει υποχρεωτικά 4 ψηφία: αν μία αρίθμηση σελίδας έχει λιγότερα ψηφία από 4, τότε τα πρώτα ψηφία παίρνουν την τιμή μηδέν. Π.χ.:

  • Η σελίδα 1 αποθηκεύεται σαν p0001.tif
  • Η σελίδα 23 αποθηκεύεται σαν p0023.tif
  • Η σελίδα 1021 αποθηκεύεται σαν p1021.tif

Αν έχει γίνει χρήση multi-page TIFF αρχείου, τότε το όνομα του αρχείου πρέπει να είναι all-pages.tif.

 

  1. Αρχειοθέτηση

 

Για την αρχειοθέτηση του αρχείου, δημιουργήστε ένα ZIP αντίγραφο του φακέλου: στο λειτουργικό των Microsoft Windows αυτό γίνεται κάνοντας δεξί κλικ πάνω στον φάκελο που δημιουργήσατε παραπάνω, Αποστολή Προς (Send To) à Συμπιεσμένο (zipped) φάκελο (Compressed (zipped) folder).

Το αρχείο ZIP θα πρέπει κατόπιν να αποθηκεύεται στην ΠΨΒ.

 

 

[1] «Οδηγός Καλών Πρακτικών για την Ψηφιοποίηση και τη Μακροπρόθεσμη Διατήρηση», Εργαστήριο Πληροφοριακών Συστημάτων Υψηλών Επιδόσεων Πανεπιστήμιο Πατρών, 2005