του Chikezie Omeje. Αυτό το άρθρο γράφτηκε από τους Chikezie Omeje, Kunle Adelowo και Vershima Tingir ως μέρος του προγράμματος υποτροφιών Open Data for Development (OD4D). Το εν λόγω πρόγραμμα που ξεκίνησε πρόσφατα, σχεδιάστηκε με στόχο να οικοδομήσει την οργανωτική ικανότητα των οργανώσεων την κοινωνίας των πολιτών να χρησιμοποιούν αποτελεσματικά τα δεδομένα:
- αυξάνοντας το επίπεδο γνώσεων του προσωπικού των οργανώσεων γύρω από τη χρήση δεδομένων
- υποστηρίζοντας τον εκάστοτε οργανισμό να παραδώσει ένα συγκεκριμένο έργο δεδομένων
- και αναπτύσσοντας μια στρατηγική δεδομένων για την μελλοντική δέσμευση του οργανισμού.
Ο Chikezie Omeje είναι δημοσιογράφος στο International Centre for Investigative Reporting (ICIR), και οι Kunle Adelowo και Vershima Tingir είναι προγραμματιστές στο Public and Private Development Centre (PPDC). Όλα τα παραπάνω εδρεύουν στην Abuja.
Το OD4D είναι ένα παγκόσμιο δίκτυο πρωτοπόρων της κοινότητας Ανοικτών Δεδομένων στο οποίο συμμετέχει το Διεθνές Ίδρυμα Ανοικτής Γνώσης και όλοι μαζί συνεργάζονται για την ανάπτυξη λύσεων μέσα από την αξιοποίηση των Ανοικτών Δεδομένων. Με αυτή την υποτροφία το Public and Private Development Centre (PPDC) θα ενισχύσει την ικανότητα του International Centre for Investigative Reporting (ICIR) να διερευνά και να φέρνει στο φώς της δημοσιότητας πληροφορίες.
Η απειλή για την Παραδοσιακή Δημοσιογραφία
Οι παλαιότεροι δημοσιογράφοι συμφωνούν ότι η δημοσιογραφία δεν είναι πια η ίδια. Αλλάζει με μεγάλη ταχύτητα. Την τελευταία δεκαετία, το επάγγελμα της δημοσιογραφίας έχει διαβρωθεί σε τέτοιο βαθμό που είναι δύσκολο να απαντηθεί πλέον το ερώτημα, ποιος είναι δημοσιογράφος. Η τεχνολογία έχει εκδημοκρατίσει την δημοσιογραφία με τέτοιο τρόπο ώστε οποιοσδήποτε ενδιαφέρεται να μπορεί να την ασκήσει. Η άνοδος των κοινωνικών μέσω δικτύωσης και των πλατφορμών ψηφιακών εκδόσεων διευκόλυνε αυτούς που κάποτε ονομάζονταν ακροατήριο, να γίνουν παραγωγοί ειδήσεων. Μέλη του ακροατηρίου που ενδιαφέρονται για τη δημοσιογραφία μπορούν πλέον εύκολα να ασκήσουν δημοσιογραφικό έργο. Η γραμμή μεταξύ δημοσιογράφων και ακροατηρίου είναι θολή. Οποιοσδήποτε διαθέτει ψηφιακά εργαλεία μπορεί να δημιουργεί και να δημοσιεύει ειδήσεις χωρίς τη βοήθεια ενός δημοσιογράφου.
Αυτή η διαταραχή στη βιομηχανία των μέσων ενημέρωσης εμφανίζεται ταυτόχρονα ως απειλή αλλά και ως ευκαιρία για τους δημοσιογράφους. Η απειλή διαφαίνεται στην πτώση των εσόδων των παραδοσιακών μέσων ενημέρωσης πράγμα που σηματοδοτεί ότι οι παραδοσιακοί δημοσιογράφοι κινδυνεύουν να χάσουν τις δουλειές τους. Το παλιό επιχειρηματικό μοντέλο δημοσιογραφίας δεν είναι πλέον βιώσιμο και οι δημοσιογράφοι αντιμετωπίζουν έντονο ανταγωνισμό από πλήθος μεμονωμένων ηλεκτρονικών εκδοτών. Συνέπεια αυτού είναι ότι το να είσαι απλώς δημοσιογράφος που καλύπτει και γράφει ειδήσεις δεν είναι πλέον αρκετό. Όποιος είναι πρόθυμος και ικανός μπορεί να το κάνει τώρα.
Για να επιβιώσουν, από την υπαρξιακή απειλή που αντιμετωπίζει η παραδοσιακή δημοσιογραφία, οι δημοσιογράφοι πρέπει να αποκτήσουν νέες δεξιότητες. Η εμφάνιση των λέξεων «tech – savvy δημοσιογράφος» και «δημοσιογράφος δεδομένων» μέσα στην αίθουσα σύνταξης αποτελεί απόδειξη αυτής της μετατόπισης. Για να ασκήσει δημοσιογραφία ένας δημοσιογράφος, θα πρέπει πλέον να έχει ψηφιακές δεξιότητες που είναι απαραίτητες για τη δημοσιογραφία του 21ου αιώνα. Καθώς οι πολίτες είναι όλο και περισσότερο ικανοί να ασκήσουν δημοσιογραφικό έργο, ο επαγγελματίας δημοσιογράφος πρέπει να κάνει περαιτέρω βήματα για να αποκτήσει δεξιότητες πέρα και έξω από την παλαιά έννοια της δημοσιογραφίας. Ως εκ τούτου ένας δημοσιογράφος πρέπει να κατέχει τόσο θεωρητικές όσο και τεχνικές δεξιότητες.
Μεταξύ των δεξιοτήτων που πρέπει να έχει ένας δημοσιογράφος είναι η ικανότητα επεξεργασίας, ανάλυσης και οπτικοποίησης δεδομένων. Παρά την πληθώρα των πληροφοριών που είναι πλέον διαθέσιμες στους πολίτες, πολλοί εξακολουθούν να μην είναι επαρκώς ενημερωμένοι γύρω από ζητήματα που αφορούν δεδομένα. Αυτός είναι ο λόγος που η δημοσιογραφία δεδομένων τραβάει τα βλέμματα όλων. Η ανάλυση και οπτικοποίηση δεδομένων αποτελούν χρήσιμες δεξιότητες για τους δημοσιογράφους σήμερα. Πολλές κρίσιμες πληροφορίες είναι θαμμένες στα δεδομένα και ένας δημοσιογράφος οφείλει να έχει τις δεξιότητες (ή έστω πρόσβαση στις δεξιότητες) ώστε να τα αξιοποιήσει.
Όταν οι δημοσιογράφοι διαθέτουν δεξιότητες επεξεργασίας δεδομένων, διευκολύνουν την έγκαιρη παραγωγή υψηλής αξίας πληροφοριών με μεγάλο αντίκτυπο. Ωστόσο πολλοί δημοσιογράφοι διαμαρτύρονται σχετικά με το γιατί πρέπει να αποκτήσουν αυτές τις τεχνικές δεξιότητες. Συχνά διαμαρτύρονται ότι οι νέες δεξιότητες που απαιτούνται να έχουν είναι πολύ τεχνικές και περίπλοκες. Για παράδειγμα ορισμένοι δημοσιογράφοι αναρωτιούνται γιατί πρέπει να μάθουν συγκεκριμένες πτυχές του προγραμματισμού υπολογιστών, υποστηρίζοντας ότι είναι πολύ δύσκολο. Η αλήθεια ωστόσο είναι ότι υπάρχει πλέον ένας αυξανόμενος αριθμός ψηφιακών εργαλείων που κάνουν εύκολη την απόκτηση τέτοιων δεξιοτήτων, πράγμα που μειώνει το εμπόδια σε τεχνικό επίπεδο για τους περισσότερους δημοσιογράφους. Πιστεύουμε ότι για να κατακτήσει κανείς την δημοσιογραφία δεδομένων πρέπει να έχει τρεις βασικές τεχνικές δεξιότητες.
Τεχνολογίες Συλλογής, μετατροπής και εξαγωγής δεδομένων
Συχνά οι δημοσιογράφοι λαμβάνουν πληροφορίες από διαφορετικές πηγές. Οι πληροφορίες αυτές μπορεί να εμφανίζονται σε διαφορετικές μορφές, μερικές από τις οποίες ενδέχεται να μην είναι άμεσα αξιοποιήσιμες μέχρι να μετατραπούν σε άλλη μορφή. Μορφές αρχείων όπως PDF, έγγραφα HTML και έντυπα έγγραφα καθιστούν δύσκολη τη συλλογή δεδομένων με δομημένο και επαναχρησιμοποιήσιμο τρόπο. Επομένως δεδομένα που εμφανίζονται σε τέτοιες μορφές αρχείων πρέπει να μετατραπούν σε πιο ευέλικτες, δομημένες και επαναχρησιμοποιήσιμες μορφές όπως Excel, Word και CSV. Υπάρχουν εργαλεία που διευκολύνουν την μετατροπή και απαιτούν ελάχιστες τεχνικές δεξιότητες για να χρησιμοποιηθούν. Μερικά από αυτά τα εργαλεία είναι το Tabula για εξαγωγή πινάκων από PDF σε CSV και η online οπτική αναγνώριση χαρακτήρων (OCR) το οποίο αποτελεί ένα εύχρηστο εργαλείο για την μετατροπή πινάκων από σαρωμένο έγγραφο σε CSV,PDF κτλ.
Εικόνα από Tabula Interface
Εικόνα από την εφαρμογή Online OCR
Εργαλεία καθαρισμού δεδομένων
Έπειτα από τις διαδικασίες της συγκέντρωσης, μετατροπής και εξαγωγής θα έχετε όλα τα δεδομένα που θέλετε και ακόμα περισσότερα στα χέρια σας. Τις περισσότερες φορές τα δεδομένα που ψάχνετε έρχονται σε μεγάλα σύνολα δεδομένων την στιγμή που σας αφορά μόνο ένα μικρό μέρος αυτών. Για να πάρετε ακριβώς αυτό που ψάχνετε χρειάζεται να αποκτήσετε δεξιότητες πάνω σε εργαλεία καθαρισμού δεδομένων. Ο καθαρισμός δεδομένων είναι η διαδικασία διόρθωσης λανθασμένων πεδίων αφαιρώντας ή προσθέτοντας και αναδιατάσσοντας ένα σύνολο δεδομένων. Για το σκοπό αυτό το κατάλληλο εργαλείο είναι το Microsoft Excel. Είναι πολύ ισχυρό και μπορεί να χρησιμοποιηθεί για απλές εργασίες όπως ταξινόμηση, φιλτράρισμα, απλά μαθηματικά και λειτουργίες κειμένου, πίνακες και επικύρωση δεδομένων.
Επιλογές ταξινόμησης και φιλτραρίσματος στο Microsoft Excel
Εργαλεία οπτικοποιήσεων
Τώρα που έχετε τα δεδομένα σας και έχετε καταφέρει να τα κάνετε να βγάζουν νόημα, η δουλειά σας ως δημοσιογράφος είναι συλλέξετε αυτές τις πληροφορίες και να τις παρουσιάσετε στο ακροατήριό σας. Σε ένα μέρος του ακροατηρίου σας αρέσουν οι αριθμοί: τους αρέσει να βλέπουν τα ψηφία στην πιο ακατέργαστη μορφή τους ενώ σε κάποιοι άλλοι θέλουν να εμφανίζονται πιο καλαίσθητα. Θέλουν να βλέπουν χρώματα και κινούμενα σχέδια που λένε ιστορίες. Σε αυτό βοηθούν οι οπτικοποιήσεις. Οπτικοποίηση δεδομένων είναι η διαδικασία του μετασχηματισμού και παρουσίασης συνόλων δεδομένων με την μορφή γραφικής παράστασης. Χαρακτηριστικό παράδειγμα αποτελεί η δημιουργία ενός γραφήματος με τον ετήσιο μισθό που λαμβάνει κάθε εργαζόμενος ενός οργανισμού. Μερικά από τα πιο απλά εργαλεία που μπορούν να χρησιμοποιηθούν για την δημιουργία οπτικοποιήσεων είναι το Excel και τα Google charts.