Yapay Zekanın 'Bellek İkilemi': Sürekli Öğrenme Modelin 'Hafıza Kaybı' Lanetini Kırabilir mi?

Bu içerik AI tarafından çevrildi

Özet

Yapay zeka modelleri 'bellek ikilemi' ile karşı karşıya: Eğitim sonrası bilgi donuyor, yeni deneyiml

　　BroadChain tarafından öğrenildiği üzere, 25 Nisan saat 13:02'de, "Memento" filminde ana karakter, beyin hasarı nedeniyle yeni anılar oluşturamaz ve yalnızca dövmeler ve Polaroid fotoğraflarla gerçekliği birleştirmek zorunda kalır. Büyük dil modelleri (LLM'ler) de benzer bir ikilemle karşı karşıyadır: eğitim tamamlandıktan sonra, devasa miktardaki bilgi parametrelerde donar ve yeni deneyimlere dayanarak kendini güncelleyemez. Bu eksikliği gidermek için geliştiriciler ona bir "iskele" inşa etti: sohbet geçmişi kısa vadeli notlar olarak işlev görür, bir erişim sistemi harici bir defter olarak çalışır ve sistem istemleri dövmeler gibidir. Ancak model, bu yeni bilgileri asla gerçekten içselleştirmez.

　　Giderek daha fazla araştırmacı, bu bağlam içi öğrenmenin (ICL) temel sınırlamaları olduğuna inanıyor. Yalnızca cevabı dünyanın bir yerinde zaten var olan sorunları çözebilir, ancak gerçek keşif (örneğin, yeni matematiksel kanıtlar), çatışmacı senaryolar (örneğin, güvenlik saldırıları ve savunmaları) veya ifade edilmesi zor örtük bilgi gerektiren durumlar için modelin, dağıtımdan sonra yeni bilgi ve deneyimleri doğrudan parametrelere entegre edebilmesi gerekir. Bağlam içi öğrenme geçicidir; gerçek öğrenme sıkıştırma gerektirir.

　　Bu araştırma alanı "sürekli öğrenme" olarak adlandırılır. Kavram yeni olmasa da (1989 tarihli bir makaleye kadar izlenebilir), a16z crypto, bunun AI için şu anda en önemli araştırma yönlerinden biri olduğuna inanıyor. Son iki veya üç yılda model yeteneklerindeki patlayıcı büyüme, modelin "bilinen" ile "bilinebilir" arasındaki uçurumu giderek daha belirgin hale getirdi. Bu makale, bu alandaki en iyi araştırmacılardan gelen içgörüleri paylaşmayı, sürekli öğrenmenin farklı yollarını netleştirmeyi ve bu konunun girişim ekosisteminde uygulanmasını teşvik etmeyi amaçlamaktadır.

　　Parametre öğrenmeyi (yani model ağırlıklarını güncellemeyi) savunmadan önce, bağlam içi öğrenmenin gerçekten etkili olduğunu ve haklı nedenlerle baskın olmaya devam edeceğini kabul etmek gerekir. Transformer'ın özü, sıra tabanlı bir koşullu token tahmincisidir. Doğru sıra verildiğinde, ağırlıklara dokunmadan şaşırtıcı derecede zengin davranışlar elde edilebilir. Cursor'un otonom programlama aracılarını genişletme hakkındaki makalesi bir örnektir: model ağırlıkları sabittir, sistemi gerçekten yönlendiren şey bağlamın dikkatli bir şekilde düzenlenmesidir. OpenClaw ise başka bir örnektir ve aracının "kabuk tasarımını" bağımsız bir disiplin haline getirir.

　　İstem mühendisliği yeni ortaya çıktığında, birçok araştırmacı "yalnızca istemlerin" meşru bir arayüz olup olamayacağını sorguladı. Ancak bu, Transformer mimarisinin doğal bir ürünüdür, yeniden eğitim gerektirmez ve model yükseltmeleriyle otomatik olarak güçlenir. Model ne kadar güçlüyse, istem de o kadar güçlüdür. Bununla birlikte, sürekli öğrenmenin hedefi, modelin harici özel araçlara güvenmek yerine kendi bellek mimarisini öğrenmesini sağlamaktır. Bu başarılırsa, tamamen yeni bir genişleme boyutunun kilidi açılabilir.