Ο ιστότοπος της Europeana παρέχει πρόσβαση σε ψηφιακές αναπαραστάσεις εκατομμυρίων αντικειμένων πολιτιστικής κληρονομιάς από όλη την Ευρώπη. Αυτές οι ψηφιακές αναπαραστάσεις είναι προσβάσιμες μέσω συνδέσμων που παρέχονται με τα μεταδεδομένα που δημοσιεύουμε στον ιστότοπο της Europeana. Ωστόσο, οι σύνδεσμοι μερικές φορές σπάνε, γεγονός που μπορεί να είναι μια απογοητευτική εμπειρία για τους επισκέπτες του ιστότοπου και τους χρήστες του API μας.
Οι σπασμένοι σύνδεσμοι έχουν μια ποικιλία προελεύσεων: από τα έργα που λήγουν και τις συλλογές εικόνων που λαμβάνονται εκτός διαδικτύου, έως τα ιδρύματα που μεταφέρουν τις συλλογές τους σε μια νέα πλατφόρμα εσωτερικά και δεν εφαρμόζουν ανακατευθύνσεις ή χρησιμοποιούν μόνιμα αναγνωριστικά. Οι σπασμένοι σύνδεσμοι διαφέρουν επίσης ως προς τη φύση τους: ορισμένα έχουν διακοπεί προσωρινά, ορισμένα μόνιμα και άλλα μπορεί απλώς να φαίνεται ότι έχουν διακοπεί για ορισμένους χρήστες, ανάλογα με τους όρους πρόσβασης που καθορίζονται από τον πάροχο δεδομένων. Αυτό καθιστά την επίλυση αυτού του ζητήματος ένα δύσκολο έργο.
Μια νέα διαδικασία για την αντιμετώπιση των σπασμένων συνδέσμων
Οι ομάδες προϊόντων του Ιδρύματος Europeana εργάζονται πάνω σε τρόπους για τον αποτελεσματικό εντοπισμό των σπασμένων δεσμών και την αντιμετώπισή τους. Την άνοιξη του 2020, αναπτύξαμε ένα εργαλείο βασισμένο στην υπηρεσία μέσων ενημέρωσης Metis, το οποίο ελέγχει συνδέσμους σε μικρό δείγμα αρχείων σε κάθε σύνολο δεδομένων που δημοσιεύεται στον ιστότοπο της Europeana μία φορά την εβδομάδα. Το εργαλείο παράγει μια αναφορά για κάθε σύνδεσμο που βρίσκει ότι έχει πρόβλημα και καθορίζει το πρόβλημα με τον σύνδεσμο - για παράδειγμα, ότι δεν είναι καθόλου προσβάσιμος (κωδικός σφάλματος 404), ότι ένα αντικείμενο πίσω από έναν σύνδεσμο είναι προσβάσιμο μόνο μετά από ανακατεύθυνση ή ότι ένας σύνδεσμος δεν φαίνεται ασφαλής για να ανοίξει ένα πρόγραμμα περιήγησης. Κάθε τρεις μήνες θα συντάσσουμε ενοποιημένη έκθεση, για να έχουμε πλήρη επισκόπηση των συνόλων δεδομένων στα οποία αναφέρονται συστηματικά προβλήματα με συνδέσμους κατά τη διάρκεια αυτής της τρίμηνης περιόδου.
Αυτή η αναφορά θα αποτελέσει τη βάση για έναν μη αυτόματο έλεγχο για να επιβεβαιωθεί ότι οι σύνδεσμοι είναι πραγματικά σπασμένοι και τα σφάλματα που αναφέρονται από το εργαλείο είναι σωστά. Σε αυτό το βήμα θα αποκλείσουμε σύνολα δεδομένων όπου οι σύνδεσμοι έχουν άλλα προβλήματα, αλλά δεν έχουν σπάσει. Τα χρονικά όρια, τα ζητήματα SSL και τα προσωρινά τεχνικά ζητήματα δεν θα υπολογίζονται ως χαλασμένοι σύνδεσμοι και θα αφαιρούνται από την αναφορά και θα αντιμετωπίζονται ξεχωριστά. Μετά από αυτό το βήμα καθαρισμού, η έκθεση θα πρέπει να περιλαμβάνει μόνο σύνολα δεδομένων όπου οι σύνδεσμοι είναι πραγματικά χαλασμένοι και η πρόσβαση σε αντικείμενα δεν είναι δυνατή για άτομα ή μηχανές.
Η πρώτη έκθεση αυτού του είδους έχει ήδη κοινοποιηθεί στους φορείς συγκέντρωσης και η δεύτερη θα παραχθεί στα τέλη Μαρτίου 2021. Όλα τα χαλασμένα σύνολα δεδομένων συνδέσμων που υπάρχουν τόσο στην παρούσα πρώτη όσο και στη δεύτερη έκθεση θα αποδημοσιευθούν από τον ιστότοπο της Europeana στις αρχές Απριλίου. Αυτό σημαίνει ότι τα σύνολα δεδομένων δεν θα είναι προσβάσιμα μέσω του δικτυακού τόπου της Europeana, αλλά θα εξακολουθούν να είναι προσβάσιμα μέσω του περιβάλλοντος προεπισκόπησης. Έτσι, εάν οι σπασμένοι σύνδεσμοι επιδιορθωθούν αργότερα, θα είναι δυνατή η επιστροφή των συνόλων δεδομένων στον ιστότοπο. Ο κύκλος αυτός θα συνεχιστεί καθ’ όλη τη διάρκεια του 2021, ώστε να διασφαλιστεί ότι οι σύνδεσμοί μας παραμένουν ενημερωμένοι.
Συνεργασία με τους συνεργάτες μας στον τομέα των δεδομένων
Ζητήσαμε από όλους τους συναθροιστές μας να αφιερώσουν χρόνο για να ελέγξουν αυτές τις αναφορές και να διορθώσουν τυχόν ζητήματα που μπορούν μέχρι το τέλος Μαρτίου. Σχεδιάζουμε επίσης να προσεγγίσουμε εταίρους δεδομένων που είναι ανενεργοί ή δεν έχουμε πλέον επαφή μαζί τους, για να τους εμπλέξουμε σε αυτό το έργο και να διασφαλίσουμε την καλύτερη εμπειρία των αντικειμένων πολιτιστικής κληρονομιάς που μπορούμε να προσφέρουμε.
Εάν είστε ίδρυμα πολιτιστικής κληρονομιάς που παρέχει δεδομένα στην Europeana και ανησυχείτε για τους χαλασμένους συνδέσμους στα δεδομένα σας, επικοινωνήστε με τον φορέα συγκέντρωσης ή με εμένα ([email protected]) για να συζητήσετε περαιτέρω!
