Bilimsel Hesaplama İçin Claude

Genel Bakış

Anthropic'in araştırması, Claude Code'un ilerleme dosyaları, test oracle'ları ve kalıcı bellek gibi orkestrasyon kalıplarını kullanarak çok günlük bilimsel hesaplama görevlerini otonom olarak nasıl tamamlayabildiğini göstermektedir.

Otonom Ajanlar İçin Uygun Görevler

Sayısal çözücülerin yeniden uygulanması
Eski yazılımların modern dillere dönüştürülmesi
Büyük kod tabanlarının referans uygulamalarla karşılaştırılarak hata ayıklanması

Bu görevler en iyi şekilde hedefler iyi kapsamlı, başarı kriterleri net ve insan gözetimi sürekli değil ara sıra olduğunda çalışır.

Somut Örnek: Boltzmann Çözücü

Araştırmacılar, Claude Opus 4.6'yı JAX'ta türevlenebilir kozmolojik bir Boltzmann çözücü uygulamak için kullandı — bu kod "Big Bang'in art ışımasının — Kozmik Mikrodalga Arka Planının (CMB) — istatistiksel özelliklerini tahmin eder."

Zorluk

Bu görev araştırmacının temel uzmanlık alanının dışındaydı ancak tipik olarak "aylar ila yıllar" araştırmacı-zamanı gerektiren alan bilgisi gerektiriyordu.

Sonuç

Claude, referans CLASS uygulamasına karşı günler içinde yüzde altı doğruluk (%0.1 hedef) elde etti.

Temel Orkestrasyon Kalıpları

1. CLAUDE.md Planlama Dosyası

Claude'un sorunlar üzerinde çalışırken güncellediği üst düzey talimatlar.

2. CHANGELOG.md İlerleme Dosyası

Durumu, tamamlanan görevleri, başarısız yaklaşımları ve doğruluk kontrol noktalarını izleyen kalıcı bellek.

3. Test Oracle

Ajanın ilerlemeyi doğrulamasını sağlayan referans uygulamalar veya net ölçülebilir hedefler.

4. Git Koordinasyonu

Anlamlı çalışma birimlerinden sonra düzenli commit'ler, veri kaybını önler ve ilerleme izlemeyi sağlar.

5. Ralph Döngüsü

Görev tamamlamayı yinelemeli olarak onaylayarak "ajantik tembelliği" önleyen orkestrasyon kalıbı.

Anahtar İçgörü

"Ajanları çalıştırmamak da bir maliyete sahip. Hesaplama gücünüz ve iyi tanımlanmış başarı kriterlerine sahip projeleriniz varsa, ajanların sizin için çalışmadığı her gece masada kalan potansiyel ilerlemedir."