Sora Yazılım
Türkçe
Türkiye merkezli özel yazılım çözümleri

Yapay Zeka İş İstasyonu Nasıl Seçilir? (2026 Satın Alma Rehberi)

Sora Yazılım Ekibi

VRAM her şeydir. Yapay zeka iş istasyonu seçiminde en kritik parametre GPU bellek kapasitesidir. Model boyutu, quantization seviyesi ve kullanım senaryosu; doğru GPU'yu, CPU'yu ve soğutma çözümünü doğrudan belirler. Bu rehber 2026'da doğru kararı vermeniz için somut veriler sunar.

Yapay Zeka İş İstasyonu Nedir ve Kime Gerekir?

Yapay zeka iş istasyonu, yüksek VRAM'li profesyonel GPU, geniş bant genişlikli CPU ve büyük kapasiteli RAM ile donatılmış, yerel LLM çıkarımı ve model eğitimi için optimize edilmiş masaüstü ya da kule bilgisayardır.

Standart bir geliştirici iş istasyonundan farkı, hesaplama yoğun yapay zeka iş yükleri için özel olarak yapılandırılmasıdır. Bir veri bilimcisi Ollama aracılığıyla 70B parametreli bir modeli yerel olarak çalıştırmak istediğinde, bulut faturası olmadan fine-tuning yapmak istediğinde ya da kurumsal veri gizliliği gereksinimleri nedeniyle iş yükünü şirket içinde tutması gerektiğinde yapay zeka iş istasyonuna ihtiyaç duyar.

Hedef kitle oldukça geniştir: ML mühendisleri, NLP araştırmacıları, görüntü işleme ekipleri, medikal görüntüleme şirketleri, finans kurumları ve üretim tesisleri bu profil altında değerlendirilebilir. Ortak nokta, düşük gecikme süresi, veri mahremiyeti veya maliyet optimizasyonu gerekçesiyle iş yükünü buluttan yerel ortama taşıma ihtiyacıdır.

Yapay zeka iş istasyonunu GPU sunucudan ayıran başlıca özellikler şunlardır: tek kullanıcı odaklı tasarım, daha düşük başlangıç maliyeti, ofis ortamına uygun gürültü ve boyut kriterleri. Bununla birlikte, ölçeklenebilirlik ve çok kiracılı çalışma söz konusu olduğunda sınırları hızla görünür hale gelir.

GPU Seçimi: VRAM Her Şeydir

GPU seçiminde VRAM kapasitesi birinci önceliktir; model ağırlıkları RAM'e sığmadığında sistem diske taşar ve performans 10-50x düşer. RTX 5090 32 GB, RTX PRO 6000 Blackwell 96 GB ve A100 80 GB 2026'nın öne çıkan seçenekleridir.

Yerel LLM çalıştırma senaryolarında kural nettir: model ağırlıkları GPU VRAM'ine tamamen yüklenmelidir; aksi hâlde sistem belleğine ya da diske taşma (offloading) gerçekleşir ve token üretim hızı dramatik biçimde düşer. Q4 quantization ile 7B model yaklaşık 4 GB, 13B model yaklaşık 8 GB, 70B model ise yaklaşık 40 GB VRAM gerektirir.

NVIDIA RTX 5090, 32 GB GDDR7 bellek ve yaklaşık 2.000 USD fiyatıyla 2026'nın tüketici sınıfı yapay zeka iş istasyonlarının referans noktasıdır. Q4 quantization ile 70B modeli çalıştırabilir; fine-tuning için ise bellek baskısı hissedilir. Çift RTX 5090 kurulumunda 64 GB birleşik VRAM, LLaMA 3.3 70B modelini rahatça barındırır ve çıkarım hızını anlamlı ölçüde artırır.

Daha ağır iş yükleri için NVIDIA RTX PRO 6000 Blackwell öne çıkar. 96 GB GDDR7 kapasitesiyle 120B+ parametreli MoE (Mixture of Experts) mimarilerini tek GPU'da barındırabilir. Yaklaşık 8.500 USD fiyatı yüksek görünse de bulut GPU maliyetleriyle kıyaslandığında 18-24 ay içinde amortisman sağlar. NVIDIA A100 80 GB ise yaklaşık 8.000-10.000 USD aralığında ikinci el pazarda hâlâ bulunabilir; NVLink desteğiyle çoklu GPU kurulumlarında tercih edilir.

GPUVRAMBellek TipiTahmini Fiyat (USD)Hedef Kullanım
NVIDIA RTX 509032 GBGDDR7~2.00070B Q4 çıkarım, orta ölçek fine-tuning
NVIDIA RTX 5090 (Çift)64 GB (birleşik)GDDR7~4.500LLaMA 3.3 70B, çok modlu görevler
NVIDIA RTX PRO 6000 Blackwell96 GBGDDR7~8.500120B+ MoE, kurumsal çıkarım
NVIDIA A100 80 GB80 GBHBM2e~8.000-10.000NVLink çoklu GPU, eğitim
NVIDIA RTX 4090 (önceki nesil)24 GBGDDR6X~1.60013B-34B modeller, giriş seviyesi

CPU ve PCIe Hat Sayısı: Çoklu GPU'nun Gizli Darboğazı

Tek GPU kurulumunda modern herhangi bir üst segment CPU yeterlidir; ancak iki veya daha fazla GPU takıldığında CPU'nun sağladığı PCIe şerit sayısı belirleyici olur. Intel Xeon w9-3475X 112 PCIe 5.0 şeridiyle bu kategorinin referansıdır.

Tek GPU ile çalışan bir yapay zeka iş istasyonunda AMD Ryzen 9 9950X veya Intel Core i9-14900K gibi tüketici CPU'ları yeterli performansı sunar. Ancak iki GPU takıldığında her birinin tam bant genişliğinde (x16) çalışması için CPU platformunun en az 32 PCIe 5.0 şeridini çift yuvaya dağıtabilmesi gerekir. Bu eşiği aşan iş yüklerinde iş istasyonu sınıfı işlemciler devreye girer.

Intel Xeon w9-3475X, 112 PCIe 5.0 şeridiyle iş istasyonu pazarının en yüksek bant genişliğini sunan işlemcisidir. W790 chipset tabanlı anakartlarla birleştiğinde dört GPU'ya eş zamanlı x16 bağlantı sağlanabilir. AMD Threadripper PRO 7995WX ise 128 PCIe 5.0 şeridi ve sekiz kanallı DDR5 bellek desteğiyle daha büyük bellek kapasitesi arayanlar için tercih edilir.

CPU seçiminde çekirdek sayısı ve saat hızı AI çıkarımında belirleyici değildir; öncelik sırası şöyledir: PCIe şerit sayısı, bellek kanalı sayısı (DDR5 bant genişliği) ve ECC desteği. Özellikle veri ön işleme ve veri yükleme adımlarında CPU darboğaz oluşturabilir; bu nedenle yüksek çekirdek sayısı fine-tuning iş yüklerinde avantaj sağlar.

Sistem Belleği, ECC ve Depolama

Yapay zeka iş istasyonlarında sistem RAM'i 64 GB minimum, 128-256 GB ideal hedeftir. ECC bellek veri bütünlüğünü korur ve kurumsal ortamlarda zorunlu sayılmalıdır. Depolama tarafında NVMe RAID, model ağırlığı yükleme sürelerini belirler.

ECC (Error-Correcting Code) bellek, rastgele bit hatalarını anında düzelterek uzun süre koşan eğitim işlerinin ya da çıkarım sunucularının hafıza bozulmasından kaynaklanan çökmelerini önler. Tüketici sınıfı platformlarda ECC desteği sınırlı ya da yoktur; Xeon ve Threadripper PRO platformları ECC'yi standart olarak destekler. Kurumsal AI iş istasyonu alımlarında ECC zorunlu kriter olarak ele alınmalıdır.

Sistem RAM kapasitesi, GPU'ya yüklenemeyen model katmanları için tampon görevi görür. 70B modeli sıkıştırılmamış (FP16) çalıştırmak yaklaşık 140 GB RAM gerektirir; bu nedenle yüksek VRAM kapasiteli sistemlerde bile 128 GB ya da 256 GB RAM tercih edilmelidir. Bellek frekansı da performansı etkiler: DDR5-5600 veya daha yüksek frekanslı kitler veri ön işleme hızını artırır.

Depolama tarafında en kritik kriter model ağırlıklarının okuma hızıdır. 70B model dosyası (Q4) yaklaşık 40 GB boyutundadır; PCIe 4.0 NVMe SSD ile bu dosya 30-40 saniyede yüklenir, RAID 0 çift NVMe konfigürasyonunda bu süre yarıya iner. İş istasyonu kurulumunda en az bir adet 2 TB NVMe SSD model deposu olarak, bir adet daha yedek ya da veri seti deposu olarak ayrılması önerilir.

Soğutma ve Güç: İki GPU'da Hava Soğutma Yetmez

Tek GPU kurulumunda 360 mm AIO su soğutma yeterlidir; iki veya daha fazla GPU takıldığında özel döngü su soğutma sistemi zorunlu hale gelir. Güç kaynağı en az 1.600 W kapasitede olmalıdır.

NVIDIA RTX 5090'ın TDP değeri 575 W olarak belirtilmiştir. İki RTX 5090 kurulumunda GPU'lardan gelen ısı yükü 1.150 W'a ulaşır; buraya CPU, bellek ve depolama ısısı eklendiğinde toplam sistem ısı yükü 1.400 W'ı aşabilir. Bu değer standart tower kasaların hava akış kapasitesinin üzerindedir. İki GPU'dan itibaren özel döngü su soğutma veya kapsamlı radyatör alanına sahip özel kasa tercih edilmelidir.

Güç kaynağı seçiminde kural basittir: tüm bileşenlerin maksimum TDP toplamının yüzde yirmi fazlasını karşılayan 80 PLUS Platinum veya Titanium sertifikalı bir PSU tercih edilmelidir. Çift RTX 5090 kurulumu için 1.600 W, üçlü GPU kurulumları için 2.000 W ve üzeri PSU önerilir. Tek PSU kapasitesi yeterli olmadığında çift PSU bağdaştırıcı modülleri de mevcuttur.

Veri merkezi dışındaki ofis ortamlarında ses seviyesi de kritik bir kriterdir. Hava soğutmalı çözümler yüksek yük altında 45-55 dB'e çıkabilirken iyi tasarlanmış su soğutma sistemleri 35-40 dB bandında kalır. Özellikle açık ofis ortamlarında çalışan veri bilimcileri için su soğutma hem termal hem akustik açıdan avantaj sunar.

Tek GPU mu, Çoklu GPU mu? Ne Zaman GPU Sunucuya Geçilmeli?

Tek GPU, çoğu bireysel geliştirici ve küçük ekip senaryosu için yeterlidir. Çoklu GPU, model boyutu veya çıkarım hızı gereksinimlerini aştığında devreye girer. Çok kullanıcılı veya sürekli çalışan senaryolarda GPU sunucu daha ekonomik olur.

Tek GPU kurulumu, 70B altı modeller için güçlü bir başlangıç noktasıdır. Kod tamamlama, belge özetleme, RAG uygulamaları ve küçük ölçekli görüntü üretimi senaryolarında RTX 5090 ile mükemmel bir kullanıcı deneyimi elde edilir. Ancak birden fazla kullanıcı aynı anda çıkarım isteği gönderdiğinde ya da model sürekli ayakta tutulması gerektiğinde tek GPU iş istasyonu darboğaz oluşturur.

Çoklu GPU kurulumuna geçiş kararı şu kriterlere bağlanabilir: çalıştırılmak istenen model tek GPU VRAM'ine sığmıyorsa, fine-tuning batch boyutu bellek baskısı yaratıyorsa veya eş zamanlı istek sayısı ikinin üzerine çıkıyorsa ikinci GPU eklenmesi değerlendirilmelidir. Form faktörü seçimi de bu kararı etkiler: kule kasa genellikle iki GPU için yeterli genişliğe sahipken üç ve üzeri GPU için rack kasaya geçiş gerekebilir.

Beş veya daha fazla kullanıcının aynı anda modele erişmesi, 7/24 çalışması gereken bir çıkarım servisi kurulması ya da birden fazla model versiyonunun eş zamanlı barındırılması senaryolarında iş istasyonu mimarisi ekonomik açıdan rekabetçi olmaktan çıkar. Bu noktada kurumsal GPU sunucu altyapısına geçiş, uzun vadede hem maliyet hem yönetilebilirlik açısından daha uygun bir seçenek sunar.

2026 Örnek Konfigürasyonlar ve Bütçe Tablosu

Giriş seviyesinde 5.500 USD, orta seviyede 7.500 USD ve üst seviyede 15.000 USD+ bütçeyle anlamlı yapay zeka iş istasyonları oluşturulabilir. Doğru seçim için iş yükü profili ve gelecek 24-36 ay projeksiyonu belirleyicidir.

SeviyeGPUCPURAMDepolamaSoğutmaTahmini Bütçe (USD)Hedef Senaryo
GirişRTX 5090 32 GBAMD Ryzen 9 9950X64 GB DDR5-56002 TB NVMe PCIe 5.0360 mm AIO~5.5007B-34B çıkarım, hafif fine-tuning
Orta (Önerilen)RTX 5090 32 GBAMD Ryzen 9 9950X128 GB DDR5-56002x 2 TB NVMe RAID360 mm AIO~7.50070B Q4 çıkarım, RAG, belge işleme
GelişmişRTX 5090 x2 (64 GB)Intel Xeon w9-3475X256 GB DDR5 ECC2x 2 TB NVMe RAIDÖzel döngü su soğutma~12.00070B+ fine-tuning, çoklu model
Üst SeviyeRTX PRO 6000 Blackwell 96 GBAMD Threadripper PRO 7995WX512 GB DDR5 ECC4x 2 TB NVMe RAIDÖzel döngü su soğutma~18.000+120B+ MoE, kurumsal çıkarım

7.500 USD bütçeli orta seviye konfigürasyon, kurumsal AI iş yüklerinin büyük çoğunluğu için pratik optimum noktayı temsil eder. RTX 5090 32 GB, Q4 quantization ile 70B modeli barındırırken Ryzen 9 9950X'in 16 çekirdeği veri ön işleme ve çoklu görev yönetimini güçlendirir. 128 GB DDR5 sistem belleği, büyük bağlam pencerelerini ve eş zamanlı çalışan uygulamaları rahatça taşır.

Üst seviye konfigürasyonlar finans, sağlık veya hukuk gibi sektörlerde hassas veri nedeniyle buluta çıkamayan ve yüksek model kalitesi gerektiren kuruluşlar için tasarlanmıştır. RTX PRO 6000 Blackwell ile 96 GB VRAM, 120B parametreli modelleri FP8 ya da FP16 precisionla çalıştırmayı mümkün kılar. Bu konfigürasyonlarda Threadripper PRO platformunun sekiz kanallı DDR5 bellek mimarisi, veri yükleme darboğazını önemli ölçüde azaltır.

Bütçe planlaması yaparken lisans ve yazılım maliyetlerini de göz önünde bulundurun: CUDA tabanlı açık kaynak çerçeveler (PyTorch, Ollama, vLLM) ücretsizdir; ancak kurumsal destek paketleri, MLOps platformları ve güvenlik çözümleri toplam sahip olma maliyetine eklenir. Donanım yatırımının yanı sıra bu kalemleri kapsayan kapsamlı bir TCO analizi için Sora AI altyapı ekibimiz ile görüşmenizi öneririz.

Sık Sorulan Sorular

Yapay zeka iş istasyonu için en iyi GPU hangisidir?

2026 itibarıyla çoğu kullanıcı için RTX 5090 (32 GB GDDR7, ~2.000 USD) en iyi maliyet-performans oranını sunar. Daha büyük modeller için RTX PRO 6000 Blackwell (96 GB) veya A100 80 GB tercih edilmelidir. GPU seçimi her zaman çalıştırılacak modelin VRAM gereksinimi üzerinden yapılmalıdır.

Yerel LLM çalıştırmak için ne kadar VRAM gerekir?

Q4 quantization ile 7B model ~4 GB, 13B model ~8 GB, 34B model ~20 GB, 70B model ~40 GB VRAM gerektirir. FP16 ile çalışmak bu değerleri iki katına çıkarır. Hedef model boyutunuzu belirleyip buna göre GPU seçin; yetmezse model diske taşar ve performans 10-50x düşer.

RTX oyun GPU'su ile veri merkezi GPU'su arasındaki fark nedir?

Tüketici RTX GPU'ları (5090 gibi) daha düşük maliyetle yüksek VRAM sunar; ancak ECC bellek desteği yoktur ve sürekli tam yük altında dayanıklılıkları veri merkezi GPU'larına göre düşüktür. A100 veya H100 gibi veri merkezi GPU'ları NVLink, ECC ve 7/24 yük dayanıklılığı sağlar; kurumsal eğitim altyapıları için tercih edilir.

Tek GPU mu, çift GPU mu almalıyım?

Bütçe kısıtıysa tek RTX 5090 ile başlayın; 70B altı modeller için fazlasıyla yeterlidir. Model 32 GB VRAM'e sığmıyorsa, çıkarım hızını artırmak istiyorsanız veya farklı modelleri eş zamanlı çalıştırmanız gerekiyorsa ikinci GPU ekleyin. Dikkat: çift GPU, su soğutma ve güçlü PSU gerektirir.

Yapay zeka iş istasyonunda ECC bellek şart mı?

Gece boyunca koşan eğitim işleri veya üretime alınan çıkarım servisleri için ECC bellek şiddetle tavsiye edilir. Saatler süren fine-tuning işlemi bir bit hatası yüzünden çökebilir. Kısa süreli geliştirme ve prototipleme senaryolarında ECC olmayan tüketici RAM de kullanılabilir.

Hazır sistem mi, özel yapım mı tercih etmeliyim?

Hazır sistemler (Dell Precision, HP Z-series) garanti ve kurumsal destek sunar; ancak genellikle GPU yükseltmesine kapalıdır ve premium fiyatlıdır. Özel yapım iş istasyonları daha iyi maliyet-performans sağlar ve GPU yükseltmesine açıktır. Kurumsal satın alma süreçleri garanti gerektirecekse hazır sistem, esneklik öncelikliyse özel yapım seçin.

Yapay zeka iş istasyonu yerine bulut GPU ne zaman mantıklıdır?

Düzensiz ve patlamalı iş yükleri, kısa süreli büyük model denemeleri veya birden fazla GPU gerektiren geçici projeler için bulut GPU daha ekonomik olabilir. Sürekli ve tahmin edilebilir iş yükleri için ise 18-24 aylık bulut maliyeti, iş istasyonu yatırımını genellikle aşar; bu durumda yerelde yatırım daha mantıklıdır.

2026'da makul bir yapay zeka iş istasyonu ne kadara mal olur?

Giriş seviyesinde ~5.500 USD (RTX 5090 + Ryzen 9 9950X + 64 GB DDR5), çoğu ekip için önerilen orta seviyede ~7.500 USD (aynı GPU + 128 GB DDR5 + RAID NVMe), kurumsal gelişmiş kullanım için 12.000-18.000 USD+ bütçe beklenmelidir. Doğru konfigürasyon için iş yükü profilinizi netleştirin.

Sonuç

Yapay zeka iş istasyonu seçimi tek bir bileşen kararından ibaret değildir. GPU VRAM kapasitesi, CPU PCIe bant genişliği, ECC bellek desteği, soğutma altyapısı ve güç kaynağı kapasitesi birlikte ele alınarak iş yüküyle eşleştirilmelidir. 2026'nın önerilen başlangıç noktası RTX 5090 tabanlı 7.500 USD bütçeli konfigürasyondur; bu sistem çoğu kurumsal yerel AI iş yükünü karşılar ve gelecekte ikinci GPU eklenmesine hazırdır.

Daha büyük model gereksinimleri, çok kullanıcılı senaryolar veya 7/24 çalışma ihtiyacı doğduğunda iş istasyonu mimarisi yetersiz kalır. Bu noktada rack altyapısına veya özel GPU sunuculara geçiş kaçınılmaz olur. Donanım seçiminizi iş yükü projeksiyonunuza ve TCO analizinize dayandırmak için Sora AI altyapı ekibimiz sizinle ücretsiz teknik değerlendirme görüşmesi yapmaktan memnuniyet duyacaktır.

Bu yazıdaki konulara ihtiyacınız mı var?

Sora Yazılım uzmanlarıyla ücretsiz keşif görüşmesi planlayın; somut bir yol haritası önerelim.