Genel Bakış
Anthropic'in araştırması, Claude Code'un ilerleme dosyaları, test oracle'ları ve kalıcı bellek gibi orkestrasyon kalıplarını kullanarak çok günlük bilimsel hesaplama görevlerini otonom olarak nasıl tamamlayabildiğini göstermektedir.
Otonom Ajanlar İçin Uygun Görevler
- Sayısal çözücülerin yeniden uygulanması
- Eski yazılımların modern dillere dönüştürülmesi
- Büyük kod tabanlarının referans uygulamalarla karşılaştırılarak hata ayıklanması
Bu görevler en iyi şekilde hedefler iyi kapsamlı, başarı kriterleri net ve insan gözetimi sürekli değil ara sıra olduğunda çalışır.
Somut Örnek: Boltzmann Çözücü
Araştırmacılar, Claude Opus 4.6'yı JAX'ta türevlenebilir kozmolojik bir Boltzmann çözücü uygulamak için kullandı — bu kod "Big Bang'in art ışımasının — Kozmik Mikrodalga Arka Planının (CMB) — istatistiksel özelliklerini tahmin eder."
Zorluk
Bu görev araştırmacının temel uzmanlık alanının dışındaydı ancak tipik olarak "aylar ila yıllar" araştırmacı-zamanı gerektiren alan bilgisi gerektiriyordu.
Sonuç
Claude, referans CLASS uygulamasına karşı günler içinde yüzde altı doğruluk (%0.1 hedef) elde etti.
Temel Orkestrasyon Kalıpları
1. CLAUDE.md Planlama Dosyası
Claude'un sorunlar üzerinde çalışırken güncellediği üst düzey talimatlar.
2. CHANGELOG.md İlerleme Dosyası
Durumu, tamamlanan görevleri, başarısız yaklaşımları ve doğruluk kontrol noktalarını izleyen kalıcı bellek.
3. Test Oracle
Ajanın ilerlemeyi doğrulamasını sağlayan referans uygulamalar veya net ölçülebilir hedefler.
4. Git Koordinasyonu
Anlamlı çalışma birimlerinden sonra düzenli commit'ler, veri kaybını önler ve ilerleme izlemeyi sağlar.
5. Ralph Döngüsü
Görev tamamlamayı yinelemeli olarak onaylayarak "ajantik tembelliği" önleyen orkestrasyon kalıbı.
Anahtar İçgörü
"Ajanları çalıştırmamak da bir maliyete sahip. Hesaplama gücünüz ve iyi tanımlanmış başarı kriterlerine sahip projeleriniz varsa, ajanların sizin için çalışmadığı her gece masada kalan potansiyel ilerlemedir."