OpenAI meluncurkan kemampuan suara di ChatGPT September lalu. Sekarang, perusahaan Pratinjau model yang disebut Voice Engine, yang dapat menggunakan satu klip audio berdurasi 15 detik dan perintah teks untuk membuat audio yang lebih panjang. OpenAI membanggakan bahwa Mesin Suara menghasilkan suara realistis dengan infleksi dan nada, bukan drone robotik.
Menurut postingan blog OpenAI, Mesin Suara pertama kali dikembangkan pada tahun 2022 untuk mendukung fitur baca lantang ChatGPT serta text-to-speech. Sejak itu, OpenAI telah menguji Voice Engine dalam sejumlah skenario berbeda: untuk anak-anak dan non-pembaca; Untuk orang non-verbal dan orang yang kehilangan suara; Dan terjemahan. Dalam setiap kasus ini, OpenAI telah bermitra dengan perusahaan di bidang masing-masing.
OpenAI mempromosikan Sora di Hollywood. Orang-orang kreatif melawan.
OpenAI menghabiskan sebagian besar postingan blognya untuk memastikan Mesin Suara dibuat dengan aman — dan meskipun OpenAI tidak secara eksplisit menyebutkan robocall Joe Biden yang terkenal, hal ini menyiratkan: “Kami menyadari bahwa menghasilkan ucapan yang terdengar seperti suara orang membawa risiko serius, dan itu adalah “Hal ini merupakan pertimbangan utama pada tahun pemilu,” kata postingan tersebut. “Kami bekerja sama dengan AS dan mitra internasional dari seluruh pemerintahan, media, hiburan, pendidikan, masyarakat sipil, dan lainnya untuk memastikan masukan mereka dimasukkan selama pembangunan. ”
Robocall Biden kemungkinan besar dibuat menggunakan perangkat lunak yang dibuat oleh ElevenLabs, bukan produk OpenAI, tetapi Voice Engine mungkin memiliki kemampuan yang sama. Di akhir postingannya, OpenAI menyatakan bahwa karena “pendekatannya terhadap keamanan AI dan [their] “Komitmen Sukarela” (Komitmen terhadap Keselamatan, Keamanan dan Kepercayaan), Voice Engine belum dirilis secara luas.
“Kami berharap pratinjau Voice Engine ini menggarisbawahi potensinya dan juga merangsang kebutuhan untuk memperkuat ketahanan masyarakat dalam menghadapi tantangan yang ditimbulkan oleh model generatif yang semakin menarik,” tulis postingan tersebut. OpenAI kemudian menyerukan penghapusan autentikasi suara secara bertahap sebagai tindakan keamanan; Kebijakan untuk melindungi penggunaan suara masyarakat dalam AI; pendidikan; Dan lebih banyak teknologi untuk mengidentifikasi suara palsu – semua karena teknologinya sendiri.
Baca selengkapnya dan dengarkan contoh Mesin Suara di postingan blog OpenAI ini, Mengatasi tantangan dan peluang suara sintetis.
benang
Kecerdasan Buatan OpenAI