Elon Musk: ‘Yapay Zekayı Besleyecek Gerçek Veri Geçen Yıl Bitti’
Tesla ve SpaceX CEO’su Musk, yapay zeka modellerini eğitmek için kullanılabilecek yüksek kaliteli eğitim verilerinin yetersiz olduğu ve kamuoyuna açık verilerin neredeyse hepsinin kullanıldığı görüşünde.
Son yıllarda yapay zeka geliştirmeye yönelen Elon Musk, sektördeki uzmanların yapay zeka eğitminde ‘sınıra yaklaşıldığı’ yönündeki fikrine katıldığını belirtti.
Tesla ve SpaceX CEO’su Musk, yapay zeka modellerini eğitmek için kullanılabilecek yüksek kaliteli eğitim verilerinin yetersiz olduğu ve kamuoyuna açık verilerin neredeyse hepsinin kullanıldığı görüşünde.
Kendi sosyal medya platformu X’te canlı bir sohbette konuşan Musk, “Artık yapay zeka eğitiminde insan bilgisinin toplamını temelde tükettik. Bu, aslında geçen yıl oldu,” dedi.
Halihazırda şirketler yapay zeka araçlarını eğitmek için metin, video, araştırma makaleleri ve romanlar dahil olmak üzere insan yapımı büyük miktarda veri topladı. Ancak bunların tedariği sınırlı.
Araştırma şirketi Epoch AI, haziran ayında, şirketlerin 2028 yılına kadar kullanılabilir metinsel verileri tüketebileceğini tahmin etmişti.
Sentetik veriler
Kısa bir süre önce OpenAI’ın eski baş bilim insanı Ilya Sutskever da NeurIPS adlı makine öğrenimi konferansında bu tartışmaya değinmişti. Sutskever, yapay zeka sektörünün “veri zirvesine” ulaştığını söylemiş ve eğitim verilerinin eksik olması nedeniyle modellerin geliştirilme biçiminin değişeceğini dile getirmişti.
Musk da söz konusu sohbette sentetik verilerin “gelecekteki yol” olduğunu savundu.
“Gerçek dünya verilerini tamamlamanın tek yolu, yapay zekanın oluşturduğu sentetik verilerdir,” diyen Musk, “Sentetik verilerle yapay zeka bir şekilde kendini ölçeklendirecek ve bu kendi kendine öğrenme sürecinden geçecek,” dedi.
Birçok uzmana göre, yakın gelecekte yapay zeka şirketleri, boşluğu kapatmak için yapay zeka modellerinin kendisinin ürettiği eğitim materyallerine güvenebilir. Bu materyallere “sentetik veri” adı veriliyor.
ChatGPT’yi geliştiren OpenAI‘ın da bu krize çözüm bulmak için Nick Ryder liderliğinde bir “Temeller Ekibi” oluşturduğu öne sürülmüştü.
Firmanın CEO’su Sam Altman, haziran ayında konuyla ilgili bir açıklama yapmış ve odak noktasının daha az veriden daha çok şey öğrenmeye kayacağını söylemişti.
Yapay zeka eğitiminde sentetik veri kullanmanın riskleri
Sentetik veri yeni bir kavram değil. Kuruluşlar uzun yıllardır birçok amaç için bu tür veri kümeleri oluşturuyor. Ancak yeni LLM’lerin gelişiyle birlikte, “sentetik veri” terimi yeni bir anlam kazandı.
Bu veriler, yapay zekanın “ya şöyle olursa” senaryolarına dayanan, yaşanması olası olayları değerlendirirken daha proaktif hale gelmesini sağlamayı amaçlıyor. Bu senaryolar yapay zekaya öngörülemeyen durumlara dair yanıtları bir insandan çok daha hızlı bir şekilde otomatikleştirme yeteneği kazandırabilir.
Ancak aynı zamanda sentetik verilerle ilgili riskler de var. Bunların başında veri kalitesi geliyor. Forbes’a göre, sentetik veriler, gerçek dünya verilerinin karmaşıklığından ve nüanslarından yoksun olabilir ve bu da gerçek dünya senaryolarında iyi performans gösteremeyen yapay zeka modellerinin geliştirilmesine yol açabilir.
Haberin orjinal haline bu linkten ulaşabilirsiniz.