Tehlikenin farkında mısınız? Voice Engine, sanıldığı kadar masum olmayabilir.
OpenAI, sadece 15 saniyelik ses kaydı kullanarak, herhangi birinin sesinin gerçekçi bir klonunu oluşturabilen yeni yapay zeka aracı Voice Engine’i duyurdu.
Ancak yapay zeka laboratuvar yetkilileri; ABD Başkanlık seçimleri başta olmak üzere, küresel bir seçim yılında yanlış ve yanıltıcı bilgi tehdidini en aza indirebilmek için, genel sürümün şimdilik çok riskli olduğunu kabul etti.
Yani, Voice Engine teknolojisinin kullanıma sunulmasının geciktirilmesi, 50’den fazla ülkenin seçime gideceği küresel bir seçim yılında, insanların yanlış bilgilendirilme potansiyelini bir nebze de olsa önlemiş olacak.
Voice Engine aslında 2022 yılında geliştirildi ve ilk versiyonu, OpenAI’ın önde gelen yapay zeka aracı ChatGPT’de yerleşik olan “metinden sese dönüştürme” özelliği için kullanıldı.
Ancak gücü, OpenAI’ın onu daha geniş çapta yayınlamak için benimsediği “temkinli ve bilinçli” yaklaşım nedeniyle hiçbir zaman kamuya açıklanmadı.
OpenAI, Voice Engine’i duyurduğu blog yazısında “Sentetik seslerin sorumlu bir şekilde konuşlandırılması ve toplumun, bu yeni yeteneklere nasıl uyum sağlayabileceği konusunda bir diyalog başlatmayı umuyoruz. Bu konuşmalara ve bu küçük ölçekli testlerin sonuçlarına dayanarak, bu teknolojinin geniş ölçekte kullanılıp kullanılmayacağı ve nasıl kullanılacağı konusunda daha bilinçli bir karar vereceğiz.” şeklinde bir açıklama yaptı.
Şirket, yazısında, kendi uygulamalarına ve ürünlerine yerleştirmek üzere, bu teknolojiye erişim izni verdiği çeşitli iş ortaklarının, gerçek dünyadaki kullanım örneklerini paylaştı.
Eğitim teknolojisi firması Age of Learning, bu teknolojiyi, senaryolu seslendirmeler oluşturmak için kullanırken; “yapay zeka görsel hikaye anlatımı” uygulaması HeyGen, kullanıcılara, kaydedilmiş içeriklerin çevirilerini akıcı ancak orijinal konuşmacının aksanını ve sesini koruyacak şekilde oluşturma olanağı sunuyor. Örneğin, İngiliz bir konuşmacıdan alınan ses örneğiyle Almanca bir konuşma üretmek, İngiliz aksanlı Almanca bir konuşma üretir.
OpenAI, bu teknolojinin sadece bir ön gösterimini yaptığını ve Voice Engine’i şimdilik genel kullanıma açmadığını belirtti. Ancak yakın gelecekte, banka hesaplarına ve diğer hassas bilgilere erişim için, bir güvenlik önlemi olarak ses tabanlı kimlik doğrulamanın aşamalı olarak kaldırılması gibi adımları teşvik ettiğini vurguladı.
OpenAI ayrıca “yapay zeka araçlarında, bireylerin seslerinin kullanımını korumaya yönelik politikaların” araştırılması ve “aldatıcı yapay zeka içeriği olasılığı da dahil olmak üzere, yapay zeka teknolojilerinin yeteneklerini ve sınırlamalarını anlama konusunda halkın eğitilmesi” çağrısında bulundu.
Şirket, Voice Engine nesillerinin filigranlı olduğunu da belirtti. Bu da demek oluyor ki; ses klonlama aracını kullanan kuruluşlar, üretilen herhangi bir sesin kaynağını izleyebilecekler.
OpenAI, Voice Engine’i kullanan iş ortaklarına “orijinal konuşmacının, açık ve bilgilendirilmiş rızası olması” şartını koştuğunu ve geliştiricilerin, bireysel kullanıcıların kendi seslerini oluşturmalarına izin vermediğini de vurguluyor.
OpenAI, Voice Engine’i genel kullanıma açma konusunda bu kadar temkinli davranırken; rakipleri ise ses klonlama araçlarını çoktan kullanıma açtılar. ElevenLabs gibi şirketler, sadece “birkaç dakikalık ses” ile, eksiksiz bir ses klonu oluşturabiliyorlar.
Yapay zeka ile ses klonlama bu kadar gelişmişken, söylemediğimiz şeylerin bizim sesimizden paylaşılmasını nasıl önleyeceğiz; hiç belli değil.