Friday, November 22, 2024
HomeTop NewsIkon Hollywood di masa lalu beralih profesi menjadi bintang baru, dengan para...

Ikon Hollywood di masa lalu beralih profesi menjadi bintang baru, dengan para selebriti yang meraup keuntungan dari kesepakatan kloning suara AI


Bintang-bintang dari zaman keemasan Hollywood terlahir kembali melalui kesepakatan kloning suara AI milik selebriti, sebuah pertanda bagaimana beberapa Kekhawatiran “Wild West” tentang peniruan AI yang tidak sah sedang ditangani oleh model bisnis baru.

ElevenLabs, sebuah perusahaan rintisan teknologi audio yang didanai oleh perusahaan modal ventura termasuk Andreessen Horowitz dan Sequoia telah menandatangani beberapa kesepakatan dengan para aktor legendaris untuk Suara Ikonik alat yang memungkinkan pengguna untuk mendengarkan suara yang dihasilkan AI melalui aplikasi buku audio. Para bintangnya termasuk Burt Reynolds, Judy Garland, James Dean, dan Sir Laurence Olivier.

ElevenLabs, yang diluncurkan pada tahun 2023, membuat audio untuk buku dan artikel berita, karakter gim video, praproduksi film, serta media sosial dan periklanan. Perusahaan ini telah bekerja sama dengan penerbit termasuk New York Times dan Washington Post dan awal tahun ini, perusahaan ini dipilih oleh Disney untuk bergabung dengan program akseleratornya.

“Anda memerlukan sekitar 30 menit audio berkualitas tinggi untuk membuat tiruan suara profesional,” kata Sam Sklar, anggota tim pengembangan ElevenLabs, dan suara-suara tersebut dihasilkan dari katalog selebritas. Setelah dibuat, suara tersebut dapat digunakan untuk membaca teks (artikel, PDF, ePub, buletin, atau konten teks lainnya). Namun, suara dan konten tersebut tidak dapat diekspor, karena semua suara didengarkan dalam aplikasi pembacaan.

Seorang pengguna bisa, misalnya, meminta James Dean menceritakan sebuah artikel kepada mereka dalam aplikasi, namun pengguna tidak dapat mengakses suara untuk konten apa pun yang belum ada dalam aplikasi.

Kesepakatan semacam ini dapat membantu menetapkan batasan untuk masa depan di mana konten suara yang dihasilkan AI tidak lagi kontroversial dan lebih merupakan wilayah yang terkontrol dan terkurasi. Google Play dan Apple Books memanfaatkan suara yang dihasilkan AI sampai batas tertentu, meskipun ada rintangan besar dalam menciptakan kembali kecepatan suara, intonasi, dan emosi manusia.

Industri AI telah diganggu oleh kekhawatiran tentang penggunaan suara selebriti, dengan OpenAI melakukan perubahan haluan pada bulan Mei setelah aktris Scarlett Johansson menuduh perusahaan tersebut merobek suaranya setelah dia menolak tawaran untuk melisensikannya.

“Kami sangat menyadari risiko yang terkait dengan media sintetis dan menganggap penggunaan alat kami secara aman dengan sangat serius,” kata Sklar. Pengamanan tersebut mencakup moderasi konten secara aktif, akuntabilitas yang dapat ditegakkan dengan larangan, dan ketentuan khusus untuk melindungi dampak Suara AI pada pemilu 2024.

Di antara generasi aktor saat ini, masih terdapat kecemasan yang signifikan seputar penggunaan AI dalam menghasilkan konten suara. Aktor suara untuk permainan video telah menimbulkan kekhawatiran, dan tahun lalu pemogokan film dan televisi memiliki akar yang signifikan dalam kecemasan atas penggunaan AI. Penggunaan suara-suara ikonik yang dijual oleh perusahaan-perusahaan perkebunan merupakan ceruk pasar yang berpotensi menghindari jebakan-jebakan ini, yang mewakili aliran pendapatan baru dari AI, bukan aliran pendapatan yang hilang karena AI.

Penggunaan suara selebriti yang mirip dengan suara manusia merupakan masalah yang sudah ada sebelum adanya AI, seperti kasus Frito Lay menggunakan suara yang mirip Tom Waits dalam iklan mereka, dan kasus Waits lainnya pada tahun 2007setelah Waits sendiri telah lama menolak tawaran iklan. AI menghadirkan jalur yang lebih mudah untuk menciptakan soundalike, dan tuntutan hukum baru-baru ini diajukan terhadap startup AI Lovo karena penggunaan yang diduga tidak pantas dan tidak diberi kompensasi aktor suara dalam menghasilkan suara AI-nya merupakan pengingat bahwa dunia pembangkitan suara AI kemungkinan akan tetap rumit dan penuh tuntutan hukum. (Lovo telah membantah klaim dalam gugatan tersebut dan juga menunjuk pada model pembagian pendapatan yang ditawarkannya kepada aktor untuk suara kloning.)

Sulit untuk menilai perlindungan di tempat-tempat tanpa meninjau bahasa khusus dari kontrak IconicVoices, kata Steve Cohen, mitra di Pollock & Cohen yang mewakili pengisi suara dalam kasus yang tidak terkait gugatan hukum menuduh adanya kloning suara tanpa izin.

ElevenLabs menunjukkan cara alat IconicVoices memperoleh izin dan mengatur penggunaan suara.

“Memberikan izin untuk menggunakan suara seseorang adalah salah satu hal mendasar,” kata Cohen. “Saya pikir faktor kuncinya adalah izin, kompensasi, dan kontrol.”

Undang-undang yang baru dan lebih jelas juga dapat menjadi penghalang bagi orang-orang yang tergoda untuk menggunakan hak pilih mereka secara tidak pantas, “bukan untuk orang-orang jahat, tetapi untuk kasus-kasus ekstrem,” kata Cohen. Namun, mengutip Bette Davis dalam “All About Eve,” ia menambahkan, “‘Kencangkan sabuk pengaman Anda; perjalanan ini akan penuh guncangan.'”

Seberapa realistis suara kloningan juga menjadi isu yang terus berkembang. Banyak ahli mengatakan bahwa karena AI tidak “mengetahui” apa yang diucapkannya, kualitas kinerjanya terbatas. Sklar mengatakan bahwa kualitas ucapan terbaru ElevenLabs tidak dapat dibedakan dari ucapan manusia yang sebenarnya. “Alat text-to-speech dari ElevenLabs dapat memahami konteks kata-kata,” katanya.

AI hanya sebagus model yang melatihnya, dan kumpulan data suara aktor menjadi bagian dari prosesnya.

“Model neural memperoleh kapabilitasnya dari meniru/mengingat nuansa dan pola yang ada dalam data pelatihannya,” kata Nauman Dawalatabad, seorang rekanan pascadoktoral di Laboratorium Ilmu Komputer dan Kecerdasan Buatan MIT dengan penelitian ekstensif dalam pembuatan suara AI. “Kualitas dan keragaman data pelatihan memengaruhi kinerja model secara signifikan.”

Penyampaian vokal bintang film dapat menambah tiruan dan pembelajaran AI dengan menyediakan “kumpulan data suara berkualitas tinggi untuk pelatihan dan penyempurnaan model besar” yang menurut Dawalatabad penting bagi proses tersebut. Namun, ia menyatakan keberatan tentang “terdengar seperti manusia” sebagai uji yang tepat untuk bidang suara AI, karena hal itu dapat memperkuat hubungan antagonis antara suara manusia dan sintetis.

Aktor suara masih terbagi pendapatnya tentang teknologi ini, dengan beberapa menolak untuk mempertimbangkan kesepakatan apa pun, tetapi yang lain mengatakan peluang untuk mengkloning suara mereka untuk produksi yang lebih cepat dan murah pada beberapa bentuk buku audio tidak dapat diabaikan. “Teknologi AI dapat membantu alur kerja. AI bukanlah alat baru bagi bakat suara, produser, dan penerbit, yang banyak di antaranya menggunakannya untuk meningkatkan kontrol kualitas mereka dalam pascaproduksi,” kata Michele Cobb, direktur eksekutif Asosiasi Penerbit Audio, kepada CNBC tahun lalu.

Model generatif terkini telah menunjukkan kemajuan substansial dibandingkan dengan iterasi sebelumnya, sehingga makin sulit membedakan antara suara palsu dan asli hanya dengan telinga, menurut Dawalatabad. Lisensi suara AI dapat meringankan beban kerja bagi pengisi suara, imbuhnya, tanpa menggantikan mereka, karena mereka “menengahi proses tersebut dengan berfokus pada pemberian koreksi atau peningkatan pada aspek-aspek yang tak terlukiskan seperti intonasi, kehangatan, dan penekanan, yang masih menghadirkan tantangan.”



Source link

RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Most Popular

Recent Comments