DATA ANALYST
Η επιστήμη των δεδομένων (Data Science) πρόκειται για ένα αναπτυσσόμενο πεδίο με ιδιαίτερη ζήτηση διεθνώς.
Ένας Data Analyst καλείται να χειρίζεται μεγάλες ποσότητες δεδομένων που εισέρχονται ή εξέρχονται από τα συστήματα επιχειρηματικών πληροφοριών της κάθε εταιρείας.
Οι θέσεις των αναλυτών δεδομένων (Data Analysts) απαιτούν οι υποψήφιοι να διαθέτουν ικανότητες στα μαθηματικά, στο την επιστήμη των υπολογιστών και την ανάλυση.
Τι χρειάζεται όμως πραγματικά ένας
Data Analyst για να μπεί με αξιώσεις στο χώρο ;

Programming
Οι ικανότητες προγραμματισμού είναι πολύ σημαντικές για έναν Data Analyst.
Γι’ αυτόν τον σκοπό οι πιο συχνές γλώσσες προγραμματισμού είναι οι: Python και R.
- Python: Χρησιμοποιείται για την ικανότητα της για στατιστική ανάλυση και για την εύκολη αναγνωσιμότητά της.
- R: Σχετικά πιο γνωστή, καθώς είχε δημιουργηθεί συγκεκριμένα για την στατιστική ανάλυση.
Python vs R (ΔΕΙΤΕ ΕΔΩ)
Data Analytical Skills
Ένας Data Analyst θα πρέπει να έχει δεξιότητες ανάλυσης δεδομένων.
Αυτή είναι η ικανότητα ανάλυσης και ερμηνείας μεγάλων ποσοτήτων δεδομένων και δημιουργίας ενεργών πληροφοριών για την επιχείρηση.
Ένας Data Analyst θα πρέπει να είναι γνώριμος με τα βασικά στοιχεία της Στατιστικής Ανάλυσης και τη γνώση του ‘πότε’ θα χρησιμοποιηθούν ποιές στατιστικές τεχνικές για ένα δεδομένο πρόβλημα δεδομένων.
Δύο γνωστά εργαλεία που χρησιμοποιούνται:
Α) Tableau
Β) Spark
SQL
Όπως είναι γνωστό, τα δεδομένα παίζουν καθοριστικό ρόλο στις εργασίες ενός Data Analyst, γι’ αυτό και είναι απαραίτητη η γνώση της SQL.
Είναι ένα από τα κύρια εργαλεία για τη Διαχείριση δεδομένων που περιλαμβάνει την Εξόρυξη , τον Μετασχηματισμό και την Φόρτωση Δεδομένων (Data Extraction, Data Transformation, and Data Loading).
Αυτό σημαίνει ότι πρέπει να γίνεται εξαγωγή δεδομένων από διάφορες πηγές, στη συνέχεια να πραγματοποιηθεί μετατροπή στην απαιτούμενη μορφή για ανάλυση και τελικά η μεταφόρτωση σε αποθήκη δεδομένων (data warehouse).
Τέλος, ένας Data Analyst, χρειάζεται την SQL για να τρέξει ερωτήματα για την εύρεση σχετικών τάσεων στα τρέχοντα δεδομένα και για την επεξεργασία δεδομένων που μπορεί να είναι χρήσιμα για έναν Data Scientist.