Ahora, el juego es todo audiolibros, todo el tiempo, para la dama Bluetooth y, en cierta medida, plataformas principales como Spotify, que está experimentando con niveles de precios y paquetes para estos formatos, y acaba de lanzar una nueva programa editorial Para autores de audiolibros independientes.
“Tienes que hacer algunos movimientos rápidos”, dice ella. “Comencé a audicionar más en el espacio comercial y saltar a audiolibros, casi a tiempo completo ahora”. A pesar del hecho de que las startups como Speechki ofrecen voces sintéticas Para este caso de uso exacto, DiMercurio confía bastante en que AI no se hará cargo del audiolibro o de la voz de podcast con guión en el corto plazo. “Estamos en un espacio donde, cuando tienes un martillo, todo parece un clavo. Tienes esta herramienta grande y pesada, ai, y estamos rompiendo todo lo que podemos ver con él. Se ha quedado en ciertas ámbitos de voz en off, las que no necesitan sentirse extremadamente personal. Pero parte de la razón por la cual el podcast de ficción se convirtió en algo en la intimidad de escuchar una persona de la persona”.
Como actor, Dimercurio está interesado en cuántas emociones y “micro observaciones” puede recoger por la forma en que alguien dice una palabra. Algunos actores confían en su instinto, o hacen una suplantación, y otros miran la voz granularmente, observando, recreando y manipulando la velocidad del discurso, la inflexión y la ubicación, para funcionar como un conjunto de “palancas” para, por ejemplo, producir diferentes caracteres de audiolibros.
Cuando se trata de voz en off más en general, ella piensa que la IA ahora es pasable y que podemos llegar al punto en que es casi tan matizado como hablar con una persona, pero “no creo que alguna vez golpeará lo mismo”.
A corto plazo, espera un aplanamiento en el audio publicitario, similar a la repentina homogeneidad en el diseño gráfico hace unos años cuando parecía que todas las marcas comenzaron a verse iguales. “Casi todas las voces que escuchas, hay alguien detrás de eso”, dice ella, “incluso los AI eran una persona que grabó eso en un momento”. Pero las voces de IA están diseñadas para ser aceptables para la audiencia más amplia posible: “Por lo tanto, estamos perdiendo la especificidad, la identidad, las pequeñas peculiaridades, como nadie sEl silbato como lo hace el mío. No lo piensas, ni siquiera lo escuchas, porque es muy neutral “.
En última instancia, Dimercurio predice que los actores de voz se convertirán en un refinamiento de alta gama en algunas industrias. “Una voz humana se volverá a medida”, dice ella. “Nos convertiremos en un artículo de lujo, casi pensando en ello como la artesanía. Por lo tanto, si eres una marca de lujo, tendrás la voz de una persona real en lugar de IA en tus comerciales y en tus productos. De la misma manera que puedes obtener cerámicas y cuencos hechos a mano o podrás comprarlos de Wal-Mart”.
Un estudio de caso ahora infame que muestra el poder de una sola y distintiva voz humana se produjo en mayo pasado cuando OpenAi se vio obligado a detener el uso de su voz en el cielo. GPT-4Ouna de las cinco voces iniciales para el chatbot. Esto vino después de Scarlett Johansson, sí, su—Deir el asesor legal, alegando que OpenAi la había imitado después de que ella rechazó una solicitud de su CEO, Sam Altman, de licenciar su voz para el producto y después de que Altman tuiteó este Tweet de una sola palabra: su.