Hangi İş İçin Hangi Model: Kapatılamayan Bir Kurulumun İskeleti

Dünyanın en güçlü yapay zeka modeli, bir sabah İstanbul’dan erişilemez oldu.

Tem 01, 2026

13 Haziran 2026’da ABD hükümeti bir ihracat kontrolü direktifi çıkardı. Anthropic’in en gelişmiş iki modeli Fable 5 ve Mythos 5’e, yabancı uyrukluların erişimi askıya alındı. Fiyatı ödemiştim, hesabım açıktı, dün gece aynı model kusursuz çalışıyordu. Sabah, hangi ülkenin vatandaşı olduğum yüzünden kapı yüzüme kapandı.

Dün kısıtlama gevşedi. Ama şimdi bile herkese aynı anda açılmıyor, ülke ülke açılıyor. Biz hâlâ Türkiye’ye ne zaman ve nasıl geleceğini takip ediyoruz.

Dürüst olayım. Ben o gün oturup kendi kurulumumu baştan kurmadım. Ama yeterince korktum. Çünkü işimin tamamı tek bir şirketin, tek bir modelin, tek bir hükümetin insafına bağlıydı. Ben buna “kurulum” diyordum. Aslında bir bağımlılıktı.

O korku beni araştırmaya itti. Bir model bir gecede kaybolduğunda çalışmaya devam eden bir kurulum nasıl kurulur? İşte bulduğum yol. Ben henüz uygulamadım. Ama iskeleti çıkardım, sen kopyalayabilirsin.

Şimdi konuya girelim.

İki yıl boyunca model seçmek kolaydı. Liderlik tablosunun tepesindekini seçerdin. Parayı öderdin. İşini yapardın. Çoğumuz öyle yaptık. Bütün iş akışını tek bir kapalı modele bağladın, çünkü en akıllısı oydu ve gerisini düşünmek zahmetliydi.

O mantık artık çalışmıyor. Fable 5 bunu bana canlı canlı gösterdi.

Ve tek örnek o değil. Aynı aylarda The Information bir haber yaptı: Meta kendi mühendislerine, rakiplerin araçları Claude Code ve Codex’i serbestçe kullanmayı bırakmalarını söyledi. Korku, rakip çıktıların kendi modeline sızmasıydı. Yine aynı dönemde Anthropic, OpenAI’ın API erişimini kullanım şartlarını ihlal gerekçesiyle kesti.

Bir ay içinde: bir hükümet en güçlü modelleri yabancılara kapattı, bir dev rakip araçları içeriden yasakladı, bir şirket bir başkasının erişimini kesti.

Gördüğün şey şu: erişim artık teknik bir mesele değil, politik bir mesele. Modelin, kalite ya da fiyatla hiç ilgisi olmayan sebeplerle bir gecede kaybolabilir. Yeni bir kural. Bir ticaret kavgası. Bir hukuk endişesi. Ya da senin lansman gününde bir sağlayıcı çökmesi.

Buna bir cevabın yoksa, elinde bir kurulum yok. Elinde bir bağımlılık var.

Önce şu kelimeyi netleştirelim: Açık Ağırlık (Open Source)

Terim havada uçuşuyor, kavramlar karışıyor.

Kapalı model: İstemini şirketin sunucusuna gönderirsin, onlar çalıştırır, cevabı geri gönderir. Modelin kendisine hiç dokunmazsın. Claude, GPT, Gemini böyle. Erişimini keserlerse iş biter. Fable 5’in bana yaptığı tam olarak buydu.

Açık ağırlıklı model: Şirket modelin dosyasını yayımlar. İndirirsin, kendi makinende ya da seçtiğin herhangi bir bulutta çalıştırırsın. Kimse geri alamaz. GLM-5.2, DeepSeek V4, Qwen, Kimi, Llama bu grupta.

Bir açık ağırlıklı modeli bir kez indirdin mi, hiçbir yasak ona ulaşamaz. Bir talimat, bir şirketin modeli sunmasını durdurabilir. Diskinde duran bir dosyayı geri çağıramaz.

Kapatılamayan kurulumun tüm fikri bu. Ağırlıklara sahip ol, ya da en azından bir açık ağırlıklı seçeneği hep sıcak tut. Dışarıdan kilitlenemeyen bir kapı her zaman elinin altında olsun.

Bir uyarı: 2026’da açık modeller, aradaki farkı kapattı. Bağımsız kıyaslamalarda kodlama ve ajan işlerinde en iyi açık modeller, kapalı sınırın birkaç puan gerisinde. Çoğu da token başına kat kat ucuz. En güçlülerin büyük kısmı Çinli laboratuvarlardan çıkıyor. Batıdan da Meta’nın Llama’sı, Google’ın Gemma’sı, Mistral var. Yani “açık” artık “zayıf” demek değil.

Kurulum dört kattan ibaret

Bir veri merkezine ihtiyacın yok. Temel bir sürümü bir öğleden sonrada ayağa kaldırmak mümkün. Başlangıç maliyeti sıfırla elli dolar arası. Ücretsiz katmanlar ve küçük bir kredi bakiyesiyle başlanıyor, sonra sadece kazandıran parça büyütülüyor.

Dört katman şu:

Katman 1, Modeller. Farklı üreticilerden, farklı lisanslardan iki üç açık ağırlıklı model. Güvendiğin.

Katman 2, Erişim. Onları çalıştırma yolu. Kendi makinende yerel, bir bulutta barındırılmış, ya da ikisi birden.

Katman 3, Yönlendirici. Her isteği doğru modele gönderen ve bir model düşünce otomatik yedeğe geçen tek bir giriş noktası.

Katman 4, Gizlilik. Hangi verinin nereye gideceğine dair kurallar. Hassas iş kendi sınırının içinde kalsın.

Şimdi her katmanı nasıl kuracağını tek tek yazayım.

Adım 1: Kendi bağımlılığını çıkar (15 dakika)

Koruyamadığın bir kurulumu haritalayamazsın. O yüzden ilk iş, bir model kaybolursa neyin durduğunu bulmak.

Yapay zeka dokunan her iş akışını listele. Kodlama yardımcın. İçerik taslakların. Araştırma özetlerin. Müşteri raporların. Her birinin bugün hangi tek modele bağlı olduğunu yaz.

Sonra her satır için acımasız soruyu sor: bu model bu gece yok olsa, yarın neyim durur?

Bu işi hızlandırmak için hazırladığım istem şu. Hâlâ kullanabildiğin bir asistana yapıştır.

Yapay zeka kurulumumu tek noktadan çökme riskine karşı denetlemene ihtiyacım var.

Yapay zekayı şunlar için kullanıyorum:
[İŞ AKIŞLARINI YAZ, örn. "Cursor'da kod incelemesi", 
"müşteri raporu taslakları", "haftalık araştırma özetleri"]

Her iş akışı için bana şunu söyle:
1. Hangi model/sağlayıcıya bağlı
2. O model aniden erişilemez olsa ne durur
3. O iş akışı ne kadar kritik (bloke eder / can sıkar / olsa iyi olur)
4. O görev için en iyi tek açık ağırlıklı yedek model

Kritikliğe göre sıralı bir tablo çıkar. Model adlarını net yaz.

Çıkan tablo senin tehdit haritan. “Bloke eder” satırları önce onaracağın yer. Gerisi bekleyebilir.

Araştırırken herkesin söylediği ortak şey şu: bütün risk genelde bir iki iş akışında toplanıyor. Her şeyi sağlamlaştırman gerekmiyor. Sadece gerçekten canını yakacak olanı.

Adım 2: İki katmanlı model seti seç

Kapatılamayan kurulumun ana hamlesi basit. Asla tek modele bağlı çalışma. İki tane seç. Bir iş motoru, trafiğinin çoğunu taşıyan. Bir yedek, aynı sebeple çökmeyecek olan.

Tipik kurgu şu: iş motoru olarak barındırılmış bir açık model, kodlama ağırlıklı işler için. Yedek olarak farklı bir üreticiden, kendi makinende yerel çalışan daha küçük bir model.

Yedeğin işe yaraması için tek şart var: iş motorundan, yasaklara ve çökmelere yol açan şeylerde farklı olmalı.

Farklı üretici, böylece bir şirketin sorunu senin sorunun olmaz. Farklı ülke, böylece bir hükümetin kuralı senin duvarın olmaz. Bunu artık teoriden bilmiyorum, Fable 5’te yaşadım. Farklı lisans, böylece bir hukuki değişiklik seni bloke etmez. Farklı erişim yolu, biri barındırılmış biri yerel.

Tek bir yasak, çökme ya da lisans değişikliği seni sıfıra indiremesin.

Hassas iş için tersine çevir. Yerel modeli iş beygiri, barındırılmış modeli sadece taşma için kullan.

Araştırmanın bana öğrettiği tek cümle şu: yedeğin ham puanını fazla dert etme. Her zaman açık olan biraz daha zayıf bir model, gitmiş olan bir sınır modelini döver. Erişilebilir, parlaktan iyidir.

Adım 3: Erişim katmanını kur

Modelleri nasıl çalıştıracağına karar ver. Üç yol var, çoğu insan ikisini karıştırıyor.

Yerel çalıştırma. Modeli kendi makinende çalıştırırsın. Hiçbir şey bilgisayarından çıkmaz. API anahtarı yok, aylık fatura yok, kimsenin ulaşabileceği bir kapatma düğmesi yok. İki araç işin neredeyse tamamını görüyor: Ollama ve LM Studio. İkisi de tek komutla kuruluyor ve OpenAI biçiminde bir yerel sunucu açıyor. Bu artık hobiciler işi değil. Ollama’nın açıkladığı rakama göre araç, 2026’nın ilk çeyreğinde aylık 52 milyon indirmeyi geçti.

Ne çalıştırabileceğin, belleğine bağlı. 8 GB’lık bir dizüstünde küçük modeller, otomatik tamamlama ve hafif sohbet için yeter. İyi bir ekran kartıyla 14 ila 32 milyar parametreli modeller, ciddi yerel kodlamanın tatlı noktası. Apple Silicon’lu bir Mac’te paylaşımlı bellek sayesinde çok daha büyükleri.

Yerel çalıştırmayı mümkün kılan numara nicemleme. Modeli sıkıştırıp sığdırıyorsun. 4-bit sıkıştırma başlangıç standardı: aşağı yukarı dörtte bir bellek, kalitede zar zor fark edilen bir kayıp. Model ağırlıkları için JPEG gibi düşün.

Barındırılmış çalıştırma. Açık ağırlık özgürlüğünü koruyorsun ama donanımı atlıyorsun. Bir sağlayıcı modeli çalıştırıyor, sen API’yi çağırıyorsun. Biri yasaklar ya da çökerse, aynı açık modeli başka bir sağlayıcıya taşıyorsun.

İşte sessiz süper güç: bu sağlayıcıların neredeyse hepsi OpenAI biçimini konuşuyor. Sağlayıcı değiştirmek, bir adres ve anahtar değişikliğinden ibaret. Seni tuzağa düşürülemez yapan şey bu taşınabilirlik.

Yönlendirici. Her şeyi birbirine bağlayan katman. Önüne oturuyor, tek istek gönderiyorsun, o hangi modele gideceğini seçiyor ve çökmeyi yönetiyor. Başlangıç için en çok önerilen OpenRouter, tek anahtar yüzlerce model.

Adım 4: Otomatik yedeği kur

Burada iki iş var. İkisi de tek bir korkuya iniyor: ortada kalmamak.

Ana modelde çalışırsın. Yasaklandığı, çöktüğü ya da limite takıldığı anda, listendeki sıradaki model devreye girer ve uygulaman hiç durmaz. Gecenin ikisinde telaş yok. Bu sıralı listeye “yedek zinciri” deniyor. OpenRouter’da tek bir alan:

{
  "model": "z-ai/glm-5.2",
  "models": ["z-ai/glm-5.2", "deepseek/deepseek-v4", "google/gemma-4"],
  "messages": [{ "role": "user", "content": "..." }]
}

GLM çökerse DeepSeek’i, sonra Gemma’yı dener. Üç üretici, üç ülke, tek istek. Sıfıra yasaklanamayan bir kurulum.

İkinci iş, hangi işi hangi modele göndereceğin. Kolay ve yüksek hacimli işi ucuz modele, zor yüzde onu pahalı modele. İstemleri zorluğa göre ayıran bir yönlendirme, basit çağrılarda kaliteyi bozmadan maliyeti ciddi düşürüyor. Çünkü trafiğinin çoğu artık pahalı modele değmiyor.

Kodun tamamı bir adres değişikliğinden ibaret. Bir ana, bir yedek:

python

# Sözde kod, tüm desen beş satırda
client = OpenAI(base_url=ANA_URL, api_key=ANA_ANAHTAR)
try:
    yanit = client.chat.completions.create(model=IS_BEYGIRI, messages=mesajlar)
except (RateLimit, ProviderDown):
    client = OpenAI(base_url=YEDEK_URL, api_key=YEDEK_ANAHTAR)
    yanit = client.chat.completions.create(model=YEDEK, messages=mesajlar)

Ücretsiz katmanlarda bir not: başarısız bir istek bile günlük kotanı yakar. Kontrolsüz bir yeniden deneme döngüsü, hiçbir şey üretmeden seni kurutur. Geri çekilmeli yeniden deneme ekle.

Adım 5: Gizliliği kapat

Kapatılamayan bir kurulum aynı zamanda sızdırmayan bir kurulum olmalı. Verinin nereye gittiği, hangi modeli kullandığın kadar önemli.

Çinli modellerin barındırılmış API’leri çok iyi. Ama bu API’ler verini o ülkenin yasalarına tabi sunuculardan geçirebilir. Modelin açık ağırlıkları serbest lisanslı, yani aynı modeli kendi sınırının içinde barındırmak veri yolu endişesini ortadan kaldırıyor, maliyet ve özgürlük kazancını koruyor. Regülasyonlu ya da hassas iş için çoğu zaman kararı belirleyen bu.

Araştırınca çıkardığım kural net oldu. Hassas veri, yerel ya da kendi barındırdığın açık model, hiçbir şey kontrolünden çıkmaz. Regülasyonlu veri, barındırılmış ama bölge içi bir sağlayıcıya sabitli. Gerisi, yönlendiricinin arkasında en ucuz güvenilir barındırılmış model.

Lisanslar burada ısırıyor. Ticari bir ürünü hukuk süzgecinden geçireceksen, Apache 2.0 ve MIT lisanslı modeller en hızlı temize çıkanlar. Değiştirilmiş lisanslara dikkat.

Şimdi denemen için bir şey

Eğer bu yazıyı okurken “benim de her şeyim tek modele bağlı” dediysen, bir deney yap. Ben de listemin ilk sırasına bunu koydum.

Bu hafta yaptığın gerçek beş görevi al. Her birini iş beygirinden ve bir açık ağırlıklı yedekten geçir. Çıktıları yan yana puanla. Kurmak için hazırladığım istem:

İki yapay zeka modelini [GÖREV, örn. "müşteri e-postası taslağı"] için 
karşılaştırıyorum.

İşte kendi işimden 5 gerçek örnek:
[5 GERÇEK GİRDİ YAPIŞTIR]

Her örneği iki modelde de çalıştıracağım. Bu göreve özel önem taşıyan 
(genel değil) 4 kritere göre 1-5 puanlık basit bir puan kartı kur. 
Sonra hangi modeli ne zaman kullanacağıma dair tek cümlelik bir kural ver.

Her seferinde kazanan modeli aramıyorsun. Şu satırı arıyorsun: X için iş motorunu kullan, Z için Y’ye düş. O kuralı yaz. O kural senin kurulumun.

Kapalı sınırın hâlâ doğru olduğu yer

Açık ağırlık her zaman cevap değil. Günde birkaç yüz istekten azdaysan, tek API anahtarının sadeliği her tasarruftan iyidir. Bir damla için yönlendirici kurma. Görev gerçekten sınır düzeyinde zorsa, en iyi kapalı modeller belirsiz akıl yürütmede hâlâ gerçek bir fark yaratıyor. Orada kullan. Ben de Fable 5’i, Türkiye’ye açıldığında en zor işler için kullanmaya devam edeceğim.

Amaç “kapalı model kullanma” değil. Amaç “yerine koyamayacağın tek bir modele bağımlı olma.” Kapatılamayan bir kurulum, pekâlâ bir kapalı model içerebilir. Yeter ki bir yönlendiricinin arkasında dursun ve altında bekleyen bir açık model olsun.

Son söz

Fable 5’in İstanbul’a kapandığı o sabah bana bir şey öğretti. Sorun modelin kalitesi değildi, dünyanın en iyisiydi. Sorun benim, kapatma düğmesini başkasına vermiş olmamdı. Üstelik o düğme artık bir şirketin bile değil, bir hükümetin masasındaydı.

Kurulumu kurmak bir öğleden sonra. Onu hiç düşünmemek, bir sonraki direktifte sıfıra inmek.

Sen de tek fişe mi bağlısın, yoksa yedek bir kapın var mı?

Bu bültende her hafta yapay zeka ile çalışmanın gerçeklerini yazıyorum. Parlak vaatleri değil, araştırdığım, denediğim, işe yarayanı ayıkladığım şeyleri. Abone ol, her yeni yazı sana gelsin.

#YapayZeka #AcikAgirlik #OpenWeight #YapayZekaStratejisi

Defne İncekara – Yapay Zeka Liderlik Koçu | AI Köşesi

Bu post hakkında tartışma

Daha fazlasına hazır mısınız?