📋 Σκοπός του Εγγράφου

Το παρόν έγγραφο τεκμηριώνει τους γνωστούς κινδύνους που σχετίζονται με τη λειτουργία του AI συστήματος Evaluator.gr, τις στρατηγικές μετριασμού που έχουν υλοποιηθεί, καθώς και τα πρωτόκολλα παρακολούθησης και αντιμετώπισης περιστατικών. Εκπονείται βάσει των αρχών του Article 9 του EU AI Act ως εκούσια βέλτιστη πρακτική, δεδομένου ότι το Evaluator.gr κατατάσσεται ως σύστημα Limited Risk (Article 52).

Υπόμνημα Αξιολόγησης

Πιθανότητα Υψηλή Μέτρια Χαμηλή
Σοβαρότητα Υψηλή Μέτρια Χαμηλή
Κατάσταση Υλοποιημένο Μερικό Προγραμματισμένο

📊 Μητρώο Κινδύνων

R01

Μεροληψία Θέσης (Position Bias)

Το μοντέλο αποδίδει διαφορετική βαρύτητα σε κριτήρια ανάλογα με τη σειρά εμφάνισής τους στο prompt.

ΠιθανότηταΜέτρια
ΣοβαρότηταΜέτρια
ΚατάστασηΥλοποιημένο

Επίπτωση

Ανακριβής βαθμολόγηση κριτηρίων που εμφανίζονται αργότερα στο prompt, οδηγώντας σε μη αντιπροσωπευτική αξιολόγηση.

Μετριασμός

Σταθερή και αμετάβλητη σειρά κριτηρίων σε κάθε αξιολόγηση. Τριπλό σύστημα αξιολογητών για τα Pitch Decks (ακαδημαϊκός, επενδυτής, επικοινωνίας) για ισορρόπηση οπτικών γωνιών.

R02

Ψευδαισθήσεις AI (Hallucination)

Το μοντέλο παράγει πληροφορίες που δεν βασίζονται στο υποβληθέν έγγραφο.

ΠιθανότηταΜέτρια
ΣοβαρότηταΥψηλή
ΚατάστασηΥλοποιημένο

Επίπτωση

Χρήστης λαμβάνει ανακριβή feedback βασισμένο σε επινοημένα δεδομένα, πιθανώς οδηγώντας σε λανθασμένες επιχειρηματικές αποφάσεις.

Μετριασμός

Ρητές οδηγίες σε κάθε prompt που απαγορεύουν την επινόηση δεδομένων. Απαίτηση για τεκμηρίωση κάθε αξιολόγησης με αναφορά σε συγκεκριμένα σημεία του εγγράφου. Σε περίπτωση που κάτι δεν αναφέρεται, το σύστημα οδηγείται να το δηλώνει ρητά.

R03

Υπερβολική Εξάρτηση (Over-reliance)

Χρήστες υιοθετούν συστάσεις χωρίς κριτική αξιολόγηση, αντιμετωπίζοντας το σύστημα ως αυθεντία.

ΠιθανότηταΥψηλή
ΣοβαρότηταΥψηλή
ΚατάστασηΜερικό

Επίπτωση

Εφαρμογή ακατάλληλων συστάσεων χωρίς επαλήθευση, πιθανή βλάβη στην επιχειρηματική πορεία του χρήστη.

Μετριασμός

Σαφείς επισημάνσεις συμβουλευτικού χαρακτήρα σε κάθε εκροή. Σελίδες διαφάνειας (transparency.php, system-card.php). Προγραμματισμένο: checklist επαλήθευσης στα αποτελέσματα υψηλής σημασίας.

R04

Ανομοιογένεια Αποτελεσμάτων (Heterogeneous Outcomes)

Η ποιότητα της ανατροφοδότησης ποικίλλει ανάλογα με την πληρότητα του υποβληθέντος εγγράφου.

ΠιθανότηταΥψηλή
ΣοβαρότηταΜέτρια
ΚατάστασηΜερικό

Επίπτωση

Χρήστες με ελλιπή έγγραφα λαμβάνουν λιγότερο χρήσιμη ανατροφοδότηση, δημιουργώντας ανισότητα στην αξία της υπηρεσίας.

Μετριασμός

Οδηγίες υποβολής εγγράφων. Προγραμματισμένο: ένδειξη ποιότητας εισόδου πριν την αξιολόγηση, με προτάσεις συμπλήρωσης ελλιπών στοιχείων.

R05

Γλωσσική Μεροληψία (Language Bias)

Μειωμένη ποιότητα αποτελεσμάτων για έγγραφα σε γλώσσες πέραν της ελληνικής.

ΠιθανότηταΧαμηλή
ΣοβαρότηταΧαμηλή
ΚατάστασηΥλοποιημένο

Επίπτωση

Χαμηλότερη ποιότητα αξιολόγησης για μη ελληνόφωνους χρήστες ή αγγλόφωνα έγγραφα.

Μετριασμός

Το σύστημα έχει βελτιστοποιηθεί για ελληνική γλώσσα με ειδικό glossary επιχειρηματικής ορολογίας. Σαφής ενημέρωση χρηστών για την ελληνόγλωσση βελτιστοποίηση.

R06

Ασυνέπεια Αποτελεσμάτων (Output Inconsistency)

Το ίδιο έγγραφο μπορεί να λαμβάνει ελαφρώς διαφορετικές βαθμολογίες σε διαφορετικές εκτελέσεις.

ΠιθανότηταΜέτρια
ΣοβαρότηταΜέτρια
ΚατάστασηΥλοποιημένο

Επίπτωση

Χρήστες που επαναλαμβάνουν αξιολόγηση λαμβάνουν διαφορετικά αποτελέσματα, μειώνοντας την αξιοπιστία του συστήματος.

Μετριασμός

Temperature ορισμένο στο 0.3 (χαμηλό) για μέγιστη συνέπεια εξόδου. Δομημένα prompts με αυστηρά καθορισμένη μορφή αποτελεσμάτων.

R07

Αλλαγή Μοντέλου AI (Model Version Change)

Αλλαγή στο υποκείμενο μοντέλο Claude μπορεί να επηρεάσει την ποιότητα και συνέπεια των αποτελεσμάτων.

ΠιθανότηταΧαμηλή
ΣοβαρότηταΜέτρια
ΚατάστασηΥλοποιημένο

Επίπτωση

Μη συγκρίσιμα αποτελέσματα μεταξύ διαφορετικών χρονικών περιόδων, δυσκολεύοντας την ακαδημαϊκή αναπαραγωγιμότητα.

Μετριασμός

Καταγραφή έκδοσης μοντέλου σε κάθε αξιολόγηση (audit trail). Σύστημα versioning που τεκμηριώνει κάθε αλλαγή μοντέλου με ημερομηνία και αιτιολόγηση.

R08

Κλαδική Μεροληψία (Industry Bias)

Το σύστημα ενδέχεται να αξιολογεί καλύτερα tech startups έναντι παραδοσιακών κλάδων.

ΠιθανότηταΜέτρια
ΣοβαρότηταΜέτρια
ΚατάστασηΠρογραμματισμένο

Επίπτωση

Μη αντιπροσωπευτικές αξιολογήσεις για επιχειρήσεις εκτός τεχνολογικού κλάδου, πιθανή αποθάρρυνση μη-tech επιχειρηματιών.

Μετριασμός

Stage-adaptive evaluation που προσαρμόζεται ανά κλάδο. Προγραμματισμένο: συστηματικό bias testing ανά κλάδο και τεκμηρίωση ευρημάτων.

R09

Διαρροή Δεδομένων (Data Privacy Risk)

Ευαίσθητα επιχειρηματικά δεδομένα που υποβάλλουν οι χρήστες μπορεί να εκτεθούν.

ΠιθανότηταΧαμηλή
ΣοβαρότηταΥψηλή
ΚατάστασηΥλοποιημένο

Επίπτωση

Έκθεση εμπιστευτικών επιχειρηματικών πληροφοριών, παραβίαση ΓΚΠΔ, νομικές συνέπειες.

Μετριασμός

Κρυπτογραφημένες συνδέσεις MySQL. Ασφαλείς κλήσεις API. Δεδομένα μη προσβάσιμα από τρίτους χωρίς συγκατάθεση. Κοινοποίηση σε επενδυτές μόνο με ρητή συγκατάθεση χρήστη.

R10

Αδυναμία Διαθεσιμότητας API (API Downtime)

Διακοπή λειτουργίας του Anthropic API επηρεάζει τη διαθεσιμότητα της υπηρεσίας.

ΠιθανότηταΧαμηλή
ΣοβαρότηταΜέτρια
ΚατάστασηΥλοποιημένο

Επίπτωση

Αδυναμία χρήσης της πλατφόρμας, απώλεια δεδομένων σε εξέλιξη.

Μετριασμός

Graceful error handling με φιλικά μηνύματα σφάλματος. Αποθήκευση προόδου χρήστη. Ενημέρωση χρηστών για προσωρινή αδυναμία.

R11

Ανακριβής Web Search (Search Result Quality)

Τα real-time αποτελέσματα web search που χρησιμοποιούν τα 8 evaluation modules μπορεί να είναι ανακριβή ή παρωχημένα.

ΠιθανότηταΜέτρια
ΣοβαρότηταΜέτρια
ΚατάστασηΜερικό

Επίπτωση

Αξιολόγηση βασισμένη σε λανθασμένα δεδομένα αγοράς, πιθανώς παραπλανητική για τον χρήστη.

Μετριασμός

Σαφής ένδειξη στα αποτελέσματα ότι τα δεδομένα αγοράς προέρχονται από web search. Προγραμματισμένο: ένδειξη ημερομηνίας/πηγής αποτελεσμάτων αναζήτησης.

👁️ Πρωτόκολλα Παρακολούθησης

📊

Συνεχής Παρακολούθηση

  • Καταγραφή σφαλμάτων API σε πραγματικό χρόνο
  • Παρακολούθηση completion rates ανά module
  • Καταγραφή χρόνων απόκρισης
📅

Περιοδική Αξιολόγηση

  • Μηνιαία ανασκόπηση error logs
  • Τριμηνιαία αξιολόγηση ποιότητας αποτελεσμάτων
  • Εξαμηνιαία αναθεώρηση του παρόντος εγγράφου
🔔

Αναφορά Περιστατικών

  • Χρήστες μπορούν να αναφέρουν ανακριβείς αξιολογήσεις
  • Συλλογή feedback για βελτίωση prompts
  • Τεκμηρίωση σημαντικών αποκλίσεων

🚨 Πρωτόκολλο Αντιμετώπισης Περιστατικών

1

Αναγνώριση

Εντοπισμός περιστατικού μέσω error logs, αναφορών χρηστών ή περιοδικής ανασκόπησης.

2

Αξιολόγηση

Κατηγοριοποίηση σοβαρότητας (χαμηλή/μέτρια/υψηλή) και εκτίμηση αριθμού επηρεαζόμενων χρηστών.

3

Αντιμετώπιση

Άμεσα μέτρα ανάλογα με τη σοβαρότητα: απενεργοποίηση module, ενημέρωση χρηστών, προσωρινή αναστολή.

4

Διόρθωση

Εφαρμογή μόνιμης λύσης: τροποποίηση prompts, ενημέρωση μεθοδολογίας, βελτίωση κώδικα.

5

Τεκμηρίωση

Καταγραφή περιστατικού, ενέργειες που ελήφθησαν και ενημέρωση του παρόντος εγγράφου.