Η δημοτικότητα των audio book έχει εκτοξευθεί τα τελευταία χρόνια. Είναι ενδεικτικό ότι οι πωλήσεις πέρυσι αυξήθηκαν κατά 25%, αποφέροντας περισσότερα από 1,5 δισ. δολάρια. Ως εκ τούτου, οι εταιρίες τεχνολογίας προσπαθούν να εδραιωθούν και στην αγορά αυτή.
Σύμφωνα με τον Leyland Cecco συντάκτη του σχετικού άρθρου στον Guardian, η Apple εγκαινίασε, κρατώντας χαμηλούς τόνους, έναν κατάλογο audio book στα οποία η αφήγηση είναι προϊόν τεχνητής νοημοσύνης. Η κίνηση αυτή, η οποία μπορεί ενδεχομένως να σημάνει την αρχή του τέλους για την αφήγηση από ανθρώπους, εντάσσεται στην ευρύτερη στρατηγική της εταιρίας να επικρατήσει στην προσοδοφόρα και ταχέως αναπτυσσόμενη αγορά των audio book. Όμως, όπως είναι αναμενόμενο, θα έχει ως αποτέλεσμα την εντατικοποίηση των ελέγχων εις βάρος της για αντιανταγωνιστική συμπεριφορά.
Στην εφαρμογή “Books” της Apple, η αναζήτηση για “AI narration” εμφανίζει ως αποτελέσματα τα βιβλία «τα οποία αφηγείται ψηφιακή φωνή που βασίζεται σε ανθρώπινη φωνή», όπως χαρακτηριστικά αναγράφεται. Η ανάπτυξη από την Apple της τεχνητής νοημοσύνης για την αφήγηση βιβλίων θα μπορούσε να αποτελέσει μια σημαντική αλλαγή στον τρόπο με τον οποίο οι μεγάλες εταιρίες τεχνολογίας βλέπουν το μέλλον των audio book.
Εκδότες, συγγραφείς και λογοτεχνικοί πράκτορες που μίλησαν στον Guardian δήλωσαν ότι η στρατηγική αυτή, αν επιτύχει, θα μπορούσε να έχει μεγάλο αντίκτυπο στην αγορά.
Άλλοι, ωστόσο, ήταν επιφυλακτικοί.
«Η ύπαρξη αφηγητή προσδίδει καλλιτεχνική αξία στο audio book και πιστεύουμε ότι αυτό είναι ένα σημαντικό πλεονέκτημα. Πρόκειται για μια εκδοχή διαφορετική από το έντυπο βιβλίο, που έχει όμως αξία ως μορφή τέχνης», δήλωσε ο David Caron, συμπαραγωγός στον μεγαλύτερο εκδότη audio book του Καναδά. «Όταν υπάρχει συνδυασμός σπουδαίας γραφής και ταλαντούχας αφήγησης, το αποτέλεσμα είναι ξεχωριστό. Σε αυτό αξίζει να επενδύσουμε».
Είναι όμως γεγονός ότι η παραγωγή ενός audio book με ανθρώπινη φωνή μπορεί να διαρκέσει εβδομάδες και να κοστίσει στους εκδότες χιλιάδες δολάρια. Η τεχνολογία της τεχνητής νοημοσύνης υπόσχεται να μειώσει σημαντικά το κόστος.
Από την άλλη πλευρά, οι φωνές που παράγονται από υπολογιστή δεν επιτυγχάνουν πάντα τα επιθυμητά αποτελέσματα. Συγκεκριμένα, αποτυγχάνουν να κρατήσουν αμείωτη την προσοχή των ακροατών για μεγάλα χρονικά διαστήματα. Επίσης, επειδή ο τονισμός και η διακύμανση της ανθρώπινης φωνής είναι δύσκολο να προβλεφθούν και να αναπαραχθούν, συχνά παρατηρείται το φαινόμενο της «κοιλάδας της αβεβαιότητας» (uncanny valey). Με τον όρο αυτόν περιγράφεται το αρνητικό συναίσθημα που δημιουργεί στον ακροατή η τεχνητή ανθρώπινη ομιλία και το οποίο μπορεί να φθάσει μέχρι τη δυσφορία, το άγχος, ακόμη και τον θυμό.
Το επόμενο διάστημα, καθώς οι ειδικοί του κλάδου εκτιμούν ότι o κύκλος εργασιών της παγκόσμιας αγοράς audio book μπορεί να ξεπεράσει τα 35 δισ. δολάρια μέχρι το 2030, αναμένεται να κορυφωθεί η διαμάχη μεταξύ Apple, Amazon και Google για την επικράτηση. Η τεχνολογία της τεχνητής νοημοσύνης θα διαδραματίσει καταλυτικό ρόλο στη διαμόρφωση του τοπίου.
Guardian