Το Common Voice έχει συγκεντρώσει περίπου 400.000 εγγραφές από 20.000 διαφορετικούς ανθρώπου - Μελλοντικά μάλιστα σκοπεύει να υποστηρίξει και άλλες γλώσσες εκτός από την αγγλική
Ο καθένας μπορεί εδώ και λίγες μέρες να «κατεβάσει» στον υπολογιστή του εκατοντάδες χιλιάδες δείγματα φωνής που έχει ήδη συλλέξει το Ίδρυμα Mozilla στο πλαίσιο του νέου έργου του Common Voice.
Πρόκειται για ένα σύστημα αναγνώρισης ομιλίας ανοιχτού κώδικα, το οποίο βασίζεται σε εθελοντές που υποβάλλουν δείγματα της ομιλίας τους. Στόχος του Mozilla είναι, μέσα από τη συλλογή των δειγμάτων αυτών, να εκπαιδεύσει μια νέα εφαρμογή ανοιχτού κώδικα για την αναγνώριση της ομιλίας.
Έως πρόσφατα, οι προγραμματιστές, επιχειρήσεις και ερευνητές που ήθελαν να πειραματιστούν και να αναπτύξουν νέες τεχνολογίες φωνής, είχαν πρόσβαση σε μια περιορισμένη συλλογή δεδομένων φωνής. Η συλλογή Common Voice είναι ήδη το δεύτερο μεγαλύτερο γνωστό δημόσιο φωνητικό σύνολο δεδομένων, καθώς άνθρωποι σε όλο τον κόσμο προσθέτουν σταδιακά και τη δική τους φωνή (σε πρώτη φάση μόνο στα αγγλικά).
Με τη δημιουργία του νέου δημόσιου συνόλου δεδομένων, το Mozilla Foundation συμβάλλει να ξεπερασθούν τα εμπόδια και να διευκολυνθεί η ανάπτυξη καλύτερων συστημάτων αναγνώρισης ομιλίας. Μελλοντικά μάλιστα σκοπεύει να υποστηρίξει και άλλες γλώσσες εκτός από την αγγλική.
Μπορεί κανείς να «κατεβάσει» με ελεύθερη άδεια «κοινού κτήματος» την πρώτη έκδοση της φωνητικής συλλογής Common Voice στη διεύθυνση: https://voice.mozilla.org/data.