Yapay zekayı kendi makinende çalıştır.
Bulut yok, abonelik yok, veri sızıntısı yok. Hangi araç hangi senaryoya uygun, nasıl kurulur, GPU/Metal nasıl çalışır — pratik rehber.
Karşılaştırma
5 popüler local AI aracı, tek tabloda. Detay için kart üzerine tıkla.
En kolay başlangıç
İncele
Production lideri
İncele
Her yerde çalışır
İncele
GUI deneyimi
İncele
Apple Silicon native
İncele
Ollama
Tek komutla local LLM — başlangıç için ideal
Kurulum kolaylığı
Performans
vLLM
Yüksek throughput production sunucusu
Kurulum kolaylığı
Performans
llama.cpp
C++ ile yazılmış, her yerde çalışan inference motoru
Kurulum kolaylığı
Performans
LM Studio
GUI ile model indir, çalıştır, sohbet et
Kurulum kolaylığı
Performans
MLX
Apple Silicon için yerel framework
Kurulum kolaylığı
Performans
Platform desteği
| Ollama | vLLM | llama.cpp | LM Studio | MLX | |
|---|---|---|---|---|---|
| Apple Silicon | |||||
| CPU | |||||
| NVIDIA (CUDA) | |||||
| AMD (ROCm) |
Hangisini seçmeliyim?
Senaryona göre hızlı yönlendirme.
Mac'te kişisel kullanım, prototip
→ Ollama (en kolay) veya LM Studio (GUI istiyorsan)
M-serisi Mac'ten maksimum performans
→ MLX — Apple Silicon native, llama.cpp'den %20-40 hızlı
Production — eşzamanlı kullanıcılar, multi-GPU
→ vLLM — PagedAttention + continuous batching
Embedded / sınırlı donanım / kendi binary
→ llama.cpp — C++ tek ikili, RPi'den sunucuya taşınır
Terminal kullanmak istemiyorum
→ LM Studio — tıkla indir, tıkla başlat, GUI'den ayarla
Hassas veri (sözleşme, sağlık) bulutu terk etmesin
→ Ollama, llama.cpp veya MLX — tamamen offline çalışır
Local'de görsel/multimodal model çalıştırmak (LLaVA, Qwen-VL)
→ Ollama (en kolay) veya vLLM (production); LM Studio GUI'de denenebilir
Local'de function calling / tool use
→ Ollama 0.5+ native destekler; vLLM için OpenAI-uyumlu API üzerinden
Local'de fine-tune (LoRA / QLoRA)
→ Mac'te MLX (mlx_lm.lora); NVIDIA'da axolotl/unsloth, llama.cpp inference için
iOS / iPadOS uygulamasına gömmek
→ MLX Swift (Apple) veya llama.cpp (cross-platform mobil bind)