Yapay zeka son yıllarda en acımasız müdürü bile utandıracak şekilde eğitilmesine rağmen hızlı bir çalışma olduğunu kanıtladı. Aylarca banyo molası veya uyku olmadan hava geçirmez Borgesian kütüphanelerine kilitlenmiş olan yapay zekalara, insan kültüründe kendi hızlarında bir hız kursunu bitirene kadar ortaya çıkmamaları söylendi. Müfredatta: şimdiye kadar ürettiğimiz tüm metinlerin makul bir kısmı.
AI’lar bu destansı çalışma oturumlarından çıktıklarında, şaşırtıcı yeni yeteneklere sahip olurlar. Dilsel olarak en esnek zihinlere sahip insanlar – hiperpoliglotlar – bir düzine dil arasında güvenilir bir şekilde gidip gelebilir; AI’lar artık gerçek zamanlı olarak 100’den fazla çeviri yapabilir. Çeşitli edebi tarzlarda pastiş üretebilirler ve fena kafiyeli şiirler yazabilirler. DeepMind’ın Ithaca yapay zekası, mermere kazınmış Yunan harflerine bakabilir ve binlerce yıl önce vandallar tarafından yontulmuş metni tahmin edebilir.
Bu başarılar, yapay zekanın gelişimi için ileriye dönük umut verici bir yol öneriyor: Her zamankinden daha büyük miktarlarda insan yapımı metni ağzına atın ve harikulade yeni becerilerin ortaya çıkmasını bekleyin. Yeterli veriyle, bu yaklaşım belki de daha akıcı bir zeka veya geleceğe dair neredeyse tüm mitolojilerimize musallat olanlara benzer insan benzeri bir yapay zihin bile sağlayabilir.
Sorun şu ki, diğer üst düzey insan kültürel ürünleri gibi, iyi nesir de bilinen evrende üretilmesi en zor şeyler arasında yer alıyor. Sonsuz arzda değil ve AI için herhangi bir eski metin işe yaramayacak: Kitaplar üzerinde eğitilmiş büyük dil modelleri, çok sayıda sosyal medya gönderisi üzerinde eğitilmiş olanlardan çok daha iyi yazarlardır. (Bu bağlamda kişinin Twitter alışkanlığını düşünmemek en iyisidir.) Yapay zekanın yutması için kaç tane iyi yapılandırılmış cümle kaldığını hesapladığımızda, rakamlar cesaret verici değil. Epoch AI’da Pablo Villalobos liderliğindeki bir araştırma ekibi kısa süre önce, ürkütücü derecede etkileyici ChatGPT gibi programların 2027’ye kadar yüksek kaliteli okuma materyallerinin tükeneceğini tahmin etti. .
İnsanlığın toplam dilsel yaratıcılığının yalnızca çok küçük bir bölümünün okumaya uygun olduğu belirtilmelidir. Radikal olarak yaratıcı Afrikalıların hayvan atalarımızın duygusal homurdanmalarını aşıp düşüncelerini kapsamlı ses sistemlerine dönüştürmeye başlamasının üzerinden 100.000 yıldan fazla zaman geçti. Bu ilk dillerde -ve onu takip eden pek çok dilde- ifade edilen her kavram, muhtemelen her zaman için kaybolmuştur, ancak bazı kelimelerinin hâlâ bizimle olduğunu hayal etmek bana zevk veriyor. Ne de olsa, bazı İngilizce kelimelerin şaşırtıcı derecede eski bir üslubu vardır: Akış, anne, ateş ve kül bize Buz Devri halklarından gelmiştir.
Yazmak, insanların sözlerimizden çok daha fazlasını yakalamasına ve depolamasına izin verdi. Ancak çoğu yeni teknoloji gibi, yazmak da ilk başta pahalıydı, bu nedenle başlangıçta öncelikle muhasebe için kullanıldı. Kaleminiz için kili pişirmek ve nemlendirmek, papirüsü kafese uygun şeritler halinde kesmek, kaligrafiyi parşömene mürekkepleyen keşişleri barındırmak ve beslemek zaman aldı. Bu kaynak yoğun teknikler, insanlığın kültürel çıktısının yalnızca küçük bir örneğini koruyabilir.
Matbaa kitapları makineli tüfekle dünyaya yaymaya başlayana kadar, kolektif metinsel hafızamız endüstriyel ölçeğe ulaşamadı. Google Kitaplar’daki araştırmacılar, insanların Gutenberg’den bu yana yasalar, şiirler, mitler, denemeler, tarihler, incelemeler ve romanlar toplayarak 125 milyondan fazla kitap yayınladığını tahmin ediyor. Epoch ekibi, bu kitapların 10 milyon ila 30 milyonunun halihazırda dijital ortama aktarıldığını ve yapay zekalara bir trilyondan fazla olmasa da yüz milyarlarca kelimeden oluşan bir okuma ziyafeti verdiğini tahmin ediyor.
Bu rakamlar kulağa etkileyici gelebilir, ancak ChatGPT’ye güç veren modeli eğiten 500 milyar kelimenin menzili içindeler. Halefi GPT-4, on trilyonlarca kelimeyle eğitilmiş olabilir. Söylentiler tavsiye etmek GPT-4 bu yıl piyasaya sürüldüğünde, tek bir bilgi isteminden 60.000 kelimelik bir roman oluşturabilecek.
On trilyon kelime, insanlığın tüm dijitalleştirilmiş kitaplarını, tüm dijitalleştirilmiş bilimsel makalelerimizi ve blogosferin çoğunu kapsamak için yeterlidir. Bu, GPT-4’ün tüm bu materyali okuyacağı anlamına gelmez, sadece bunu yapmak teknik olarak erişebileceği mesafe içindedir. Yapay zeka haleflerinin, ilk birkaç ay boyunca tüm derin zamanlı metin kayıtlarımızı emdiğini ve ardından her Ocak ayında iki saatlik bir okuma tatili ile tamamladığını ve bu süre boyunca önceki yıl yayınlanan her kitabı ve bilimsel makaleyi ana hatlarıyla özetleyebileceğini hayal edebilirsiniz.
Yapay zekaların yakında tüm kitaplarımızı okuyabilecek olması, ürettiğimiz tüm metinleri yakalayabilecekleri anlamına gelmez. İnternetin depolama kapasitesi tamamen farklı bir düzendedir ve kitap yayınlamaktan çok daha demokratik bir kültürel koruma teknolojisidir. Her yıl milyarlarca insan, çoğu sosyal medya platformlarının sahip olduğu veritabanlarında birikmiş cümleler yazıyor.
İnternetten kazınmış rastgele metinler genellikle iyi bir eğitim verisi sağlamaz, Wikipedia makaleleri dikkate değer bir istisnadır. Ancak belki de gelecekteki algoritmalar, AI’ların toplu tweet’lerimizden, Instagram altyazılarımızdan ve Facebook durumlarımızdan anlam çıkarmasına izin verecektir. Buna rağmen, bu düşük kaliteli kaynaklar tükenmez olmayacaktır. Villalobos’a göre, birkaç on yıl içinde, hızlı okuma yapan yapay zekalar, insanların şimdiye kadar web’e doldurdukları da dahil olmak üzere, yüz trilyonlarca kelimeyi yutacak kadar güçlü olacak.
Her AI bir İngiliz ana dalı değildir. Bazıları görsel öğrenicilerdir ve onlar da bir gün eğitim verisi eksikliği ile karşı karşıya kalabilirler. Hızlı okuyucular edebi kanonu karıştırırken, bu yapay zekalar, milyonlarca görüntüden oluşan zorunlu bir tarama için Otomatik Turuncu tarzı göz kapakları açık tutularak bağlandı. Aldıkları eğitimden insanüstü bir görüşle çıktılar. Yüzünüzü bir maskenin arkasından tanıyabilir veya radyoloğun gözüyle görülemeyen tümörleri tespit edebilirler. Gece sürüşlerinde, önlerindeki kasvetli yol kenarını görebilirler; burada genç bir geyik karşıdan karşıya geçmek için cesaretini topluyor.
En etkileyici olanı, etiketli resimler üzerinde eğitilmiş yapay zekaların görsel bir hayal gücü geliştirmeye başlamasıdır. OpenAI’nin DALL-E 2’si, her biri bir metin etiketiyle eşleştirilmiş 650 milyon görüntü üzerinde eğitildi. DALL-E 2, Paleolitik insanların mağara tavanlarına bastırdığı aşı boyası el izlerini gördü. Rönesans ustalarının farklı fırça darbesi stillerini taklit edebilir. Garip hayvan melezlerinin fotogerçekçi makrolarını canlandırabilir. Dünya inşa etme becerisine sahip bir animatör, onu Pixar tarzı bir karakter oluşturmak için kullanabilir ve ardından onu zengin ve ayırt edici bir ortamla çevreleyebilir.
Akıllı telefon resimlerini sosyal medyada yayınlama eğilimimiz sayesinde, etiket yalnızca kısa bir başlık veya coğrafi etiket olsa bile, insanlar çok sayıda etiketli görüntü üretiyor. Her yıl bu tür 1 trilyon kadar görüntü internete yükleniyor ve buna her biri bir dizi fotoğraftan oluşan YouTube videoları dahil değil. Tüm görsel çıktımız bir yana, yapay zekaların türümüzün toplu tatil fotoğrafı slayt gösterisini izlemesi uzun zaman alacak. Villalobos’a göre, eğitim imajı eksikliğimiz 2030 ile 2060 arasına kadar ciddi olmayacak.
Gerçekten de AI’lar yüzyılın ortasına kadar yeni girdiler için açlık çekiyorsa – veya metin söz konusu olduğunda daha erken – alanın veriye dayalı ilerlemesi önemli ölçüde yavaşlayarak yapay zihinleri ve geri kalan her şeyi ulaşılmaz hale getirebilir. AI için insan kültürel üretimini nasıl artırabileceğimizi sormak için Villalobos’u aradım. “Çevrimiçi olarak gelen bazı yeni kaynaklar olabilir” dedi. “Kendi kendine giden arabaların yaygın olarak benimsenmesi, benzeri görülmemiş miktarda yol video kaydına yol açacaktır.”
Villalobos ayrıca yapay zekalar tarafından oluşturulan “sentetik” eğitim verilerinden de bahsetti. Bu senaryoda, büyük dil modelleri, daktilolu meşhur maymunlar gibi olacak, sadece daha akıllı ve işlevsel olarak sonsuz enerjiye sahip olacak. Her biri Tolstoyan uzunluğunda milyarlarca yeni roman çıkarabilirler. Görüntü oluşturucular da aynı şekilde mevcut anlık görüntüleri değiştirerek yeni eğitim verileri oluşturabilir, ancak etiketleriyle ters düşecek kadar değil. Yapay zekaların kendi oluşturdukları verileri parçalayarak yeni bir şey öğrenip öğrenemeyecekleri henüz belli değil. Belki de bunu yapmak, yalnızca insan yapımı metin ve görüntülerden derledikleri tahmin gücünü sulandıracaktır. Villalobos’un iş arkadaşlarından biri olan Jaime Sevilla, “İnsanlar bu tür şeyleri çok fazla kullanmadı, çünkü henüz verilerimiz tükenmedi,” dedi.
Villalobos’un makalesi, daha rahatsız edici bir dizi spekülatif geçici çözümü tartışıyor. Örneğin, hepimiz boynumuza her konuşma eylemimizi kaydeden dongle takabiliriz. Bir tahmine göre, insanlar günde ortalama 5.000 ila 20.000 kelime konuşuyor. 8 milyar insan arasında, bunlar hızla birikiyor. Metin mesajlarımız da kaydedilebilir ve tanımlayıcı meta verilerden çıkarılabilir. Her beyaz yakalı çalışanı anonimleştirilmiş tuş vuruşu kaydına tabi tutabilir ve yakaladıklarımızı yapay zekalarımıza beslenmek üzere dev veritabanlarına atabiliriz. Villalobos, bu tür düzeltmelerin şu anda “Overton penceresinin çok dışında” olduğunu kuru bir şekilde belirtti.
Belki de sonunda, büyük verinin azalan getirileri olacaktır. En son yapay zeka kışımızın devasa metin ve görsel yığınları tarafından eritilmiş olması, bir sonraki kışımızın olacağı anlamına gelmez. Belki bunun yerine, sonunda dünyamızı yapay zihinlerle dolduran bir veya iki algoritmik buluş olacaktır. Ne de olsa, doğanın kendi örüntü tanıma modlarını yarattığını ve şimdiye kadar en iyi yapay zekalarımızdan bile daha iyi performans gösterdiğini biliyoruz. 13 yaşındaki oğlum, ChatGPT’den çok daha az kelime yuttu, ancak yazılı metinleri çok daha iyi anlıyor. Aklının algoritmalarla çalıştığını söylemek mantıklıysa, bunlar günümüzün AI’ları tarafından kullanılanlardan daha iyi algoritmalardır.
Bununla birlikte, veri toplayan yapay zekalarımız bir gün insan bilişini aşarsa, onların bizim görüntümüzden yapılmış oldukları gerçeğiyle kendimizi avutmak zorunda kalacağız. AI’lar uzaylı değildir. Egzotik öteki değiller. Onlar bizden ve buralı. Dünyanın manzaralarına baktılar. Güneşin batışını okyanuslarında milyarlarca kez görmüşlerdir. En eski hikayelerimizi biliyorlar. İsimlerimizi yıldızlar için kullanıyorlar. Öğrendikleri ilk kelimeler arasında akış, anne, ateş ve kül vardır.
Kaynak : https://insidexpress.com/technology/the-impact-of-ai-after-reading-everything/?utm_source=rss&utm_medium=rss&utm_campaign=the-impact-of-ai-after-reading-everything