هوش مصنوعی بدون نیاز به اینترنت با Ollama

هوش مصنوعی ollama

امروزه برای طیف زیادی از کارها از هوش مصنوعی یا همان LLM ها استفاده میکنیم، از برنامه نویسی گرفته تا مشاوره پزشکی، آموزش و یادگیری و یا پرسیدن سوال هایی که روزانه با آنها مواجه می شویم.

در زمان هایی که به هر دلیلی از دسترسی به اینترنت محروم می شویم و امکان اتصال به ابزارهای هوش مصنوعی مانند چت جی پی تی یا جمنای وجود ندارد، میتوانیم با اجرای مدل های هوش مصنوعی متن باز روی کامپیوتر شخصی یک ابزار هوش مصنوعی نسبتا قابل قبول داشته باشیم.

آشنایی با Ollama

Ollama یک پلتفرم متن‌باز و سبک است که امکان اجرای مدل‌های زبانی بزرگ (LLM) را به‌صورت محلی و بدون نیاز به اینترنت فراهم می‌کند.
با Ollama می‌توانید مدل‌هایی مانند Llama 2 و Llama 3 از Meta، Mistral و Mixtral، Phi-3 از Microsoft، Gemma از Google و حتی مدل‌های سفارشی خودتان را اجرا کنید.
تمام این فرایند به‌صورت آفلاین انجام می‌شود و داده‌های شما روی سیستم شخصی‌تان باقی می‌مانند.

Ollama به‌دلیل سادگی نصب، سرعت بالا و امنیت داده‌ها در میان توسعه‌دهندگان و محققان حوزه هوش مصنوعی خیلی محبوب است.

نصب و راه اندازی Ollama

🔴 بروزرسانی شده در 17 فروردین 1405


💻 دانلود Ollama برای ویندوز

اگر از ویندوز استفاده می‌کنید، نسخه نصبی آماده را دانلود و نصب کنید:

🔗 دانلود نرم افزار Ollama نسخه ویندوز (1.6GB)


🍎 دانلود Ollama برای مک (MacOS)

برای کاربران مک، نسخه DMG ارائه شده که به‌راحتی نصب می‌شود:

🔗 دانلود نرم افزار Ollama نسخه مک (104MB)


🐧 دانلود و راه‌اندازی Ollama در لینوکس

🔹 نسخه CPU (Intel / AMD): مناسب اکثر سیستم‌های لینوکسی بدون نیاز به GPU

🔗 دانلود Ollama لینوکس x86_64 (CPU)

🔹 نسخه ARM64: مناسب Raspberry Pi و سرورهای ARM

🔗 دانلود Ollama لینوکس ARM64

🔹 نسخه AMD GPU (ROCm): مخصوص کارت‌های AMD با پشتیبانی ROCm

🔗 دانلود Ollama لینوکس با پشتیبانی AMD GPU


📦 منابع توسعه و کتابخانه‌ها

🔗 دانلود ریپازیتوری گیت هاب Ollama

🔗 دانلود کتابخانه جاوااسکریپت Ollama

🔗 دانلود کتابخانه پایتون Ollama


فایل مانیفست همه مدل ها که حتما باید دانلود کنید و کنار مدل ها قرار بدین:

(فایل مانیفست بروز شده در تاریخ 4 فروردین 1405)

دانلود فایل manifests (آپدیت 4 فروردین 1405)

این فایل را در مسیر زیر اکسترکت کنید:

%HOMEPATH%\.ollama\models

 

در نهایت مدل های مورد نیاز خود را از فهرست زیر انتخاب و دانلود نمایید. دقت داشته باشید هرچقدر که پارامترهای مدل بیشتر باشد دقت آن بیشتر است و البته نیازمندی های سخت افزاری بالاتری دارد. در ادامه این مقاله سعی میکنیم تا حد ممکن در مورد مدل ها و کاربرد هر کدام توضیحاتی رو ارائه بدیم.

مدل ها را دانلود و در این مسیر اکسترکت کنید:

%HOMEPATH%\.ollama\models\blobs

 

بروزرسانی 3 فروردین 1405

حدود 30 تا مدل جدید و بروز اضافه شد.

فایل مانیفست اصلاح شد. مشکل مدل gpt oss 120b رفع شد.

همه مدل ها بدون اشکال کار میکنند.

#نام مدلحجم تقریبی
1deepseek-r1 8b5GB
2gemma3 1b800MB
3gemma3 4b3GB
4gemma3 12b8GB
5gemma3 27b16GB
6gpt-oss 20b13GB
7gpt-oss 120b61GB
8qwen3 4b2GB
9qwen3 8b5GB
10qwen3 30b17GB
11qwen3-coder 30b17GB
12qwen3-vl 4b3GB
13qwen3-vl 8b6GB
14qwen3-vl 30b18GB
15deepseek-r1-1.5b1GB
16Dorna-partai8GB
17llama3-8b4.5GB
18phi3-3.8b-and-mini-128k2GB
19dorna2-8b4.5GB
20embeddinggemma0.5GB
21qwen-2.5-coder-0.5b0.3GB
22qwen-2.5-coder-1.5b0.9GB
23Mixtral 8x7B25GB
24phi3:14b7.3GB
25llava:7b4.4GB
26llava:13b7.5GB
27llava:34b18.8GB
28phi4:14b8.4GB
29dolphin3:8b5.5GB
30bge-m3:567m1GB
31mistral-nemo:12b6.5GB
32deepseek-coder:6.7b3.5GB
33deepseek-coder:33b17.5GB
34codegemma:2b1.5GB
35codegemma:7b4.5GB
36falcon3:1b1.6GB
37falcon3:3b1.9GB
38falcon3:7b4.5GB
39falcon3:10b5.9GB
40llava-llama3:8b5.17GB
41translategemma:4b3GB
42translategemma:12b7.5GB
43translategemma:27b16GB
44qwq:32b18.5GB
45cogito:3b2GB
46cogito:8b4.5GB
47cogito:14b8.3GB
48cogito:32b18.5GB
50*qwen3.5:4b3.1GB
51*qwen3.5:9b6.1GB
52*qwen3.5:27b16.2GB
53*qwen3.5:35b22.2GB

(نکته: برای اجرای مدل هایی که با * مشخص شده اند حتما باید برنامه Ollama رو به آخرین نسخه بروزرسانی کنید.)

راهنمای انتخاب مدل های متن باز

در لیست بالا تعدادی مدل متن باز قابل دانلود داریم که می توانید با توجه به قدرت سخت افزاری و نیاز خود یک یا چند مدل را دانلود و استفاده کنید.

✅ DeepSeek-R1 8B

مدل استدلال‌محور (Reasoning) با عملکرد قوی در حل مسائل پیچیده، تحلیل منطقی، ریاضی، تولید محتوا و کدنویسی.

کاربردها: حل مسئله، تحلیل داده، تولید متن دقیق، کمک برنامه‌نویسی
ویژگی‌ها: قدرت استدلال بالا، پاسخ‌های ساختارمند، مناسب کارهای تحلیلی
سیستم پیشنهادی:

  • RAM: حداقل 16GB
  • VRAM: حداقل 8GB (بهتر: 10GB+)
  • CPU-only: حداقل 32GB RAM

✅ DeepSeek-R1 1.5B

نسخه سبک‌تر برای اجرای سریع‌تر با حفظ بخشی از توان استدلالی.

کاربردها: کارهای روزمره، تحلیل سبک، چت
ویژگی‌ها: سبک، سریع، مناسب سیستم‌های ضعیف
سیستم پیشنهادی:

  • RAM: 8GB
  • VRAM: 4GB

✅ Gemma 3 - 1B

مدل بسیار سبک برای استفاده‌های ساده.

کاربردها: چت ساده، تولید متن کوتاه، تست و توسعه
ویژگی‌ها: سرعت بالا، مصرف پایین
سیستم پیشنهادی:

  • RAM: 4GB
  • VRAM: بدون GPU هم قابل اجرا

✅ Gemma 3 - 4B

مدل متعادل برای استفاده عمومی.

کاربردها: تولید محتوا، ترجمه، چت
ویژگی‌ها: کیفیت مناسب در کنار سرعت خوب
سیستم پیشنهادی:

  • RAM: 8GB
  • VRAM: 6GB

✅ Gemma 3 - 12B

مدل نیمه‌حرفه‌ای برای کارهای جدی‌تر.

کاربردها: تولید محتوای باکیفیت، تحلیل متن، برنامه‌نویسی
ویژگی‌ها: دقت بالاتر نسبت به مدل‌های کوچک
سیستم پیشنهادی:

  • RAM: 16GB
  • VRAM: 12GB

✅ Gemma 3 - 27B

مدل قدرتمند برای کاربردهای پیشرفته.

کاربردها: پروژه‌های حرفه‌ای، تحلیل سنگین، تولید محتوا سطح بالا
ویژگی‌ها: کیفیت بالا، نزدیک به مدل‌های بزرگ
سیستم پیشنهادی:

  • RAM: 32GB
  • VRAM: 24GB

✅ GPT-OSS 20B

مدل بزرگ و همه‌منظوره با عملکرد خوب در متن و کدنویسی.

کاربردها: تولید محتوا، تحلیل، برنامه‌نویسی
ویژگی‌ها: تعادل بین قدرت و مصرف
سیستم پیشنهادی:

  • RAM: 32GB
  • VRAM: 16–20GB

✅ GPT-OSS 120B

مدل بسیار بزرگ در سطح سازمانی.

کاربردها: تحلیل پیچیده، تولید محتوا سطح بالا، پروژه‌های سنگین
ویژگی‌ها: دقت و کیفیت بسیار بالا
سیستم پیشنهادی:

  • RAM: 128GB+
  • VRAM: 48GB+ یا Multi-GPU
  • مناسب اجرای خانگی نیست (سروری)

✅ Qwen3 4B

مدل سبک و سریع برای کارهای عمومی.

کاربردها: چت، ترجمه، تولید متن
ویژگی‌ها: بهینه و سریع
سیستم پیشنهادی:

  • RAM: 8GB
  • VRAM: 6GB

✅ Qwen3 8B

مدل متعادل با دقت خوب.

کاربردها: تولید محتوا، تحلیل، کدنویسی سبک
ویژگی‌ها: کیفیت بهتر نسبت به 4B
سیستم پیشنهادی:

  • RAM: 16GB
  • VRAM: 8–10GB

✅ Qwen3 30B

مدل قدرتمند برای کارهای حرفه‌ای.

کاربردها: تحلیل پیشرفته، تولید محتوا حرفه‌ای
ویژگی‌ها: دقت بالا، مناسب پروژه‌های جدی
سیستم پیشنهادی:

  • RAM: 32GB
  • VRAM: 24GB

✅ Qwen3-Coder 30B

مدل تخصصی برنامه‌نویسی.

کاربردها: تولید کد، دیباگ، تبدیل زبان‌ها
ویژگی‌ها: درک عمیق ساختار کد
سیستم پیشنهادی:

  • RAM: 32GB
  • VRAM: 24GB

✅ Qwen3-VL 4B

مدل چندرسانه‌ای سبک (متن + تصویر).

کاربردها: تحلیل تصویر، پاسخ به سوالات تصویری
ویژگی‌ها: پشتیبانی از ورودی تصویر
سیستم پیشنهادی:

  • RAM: 8GB
  • VRAM: 6GB

✅ Qwen3-VL 8B

نسخه قوی‌تر چندرسانه‌ای.

کاربردها: پردازش دقیق‌تر تصویر + متن
ویژگی‌ها: درک بهتر تصاویر
سیستم پیشنهادی:

  • RAM: 16GB
  • VRAM: 10GB

✅ Qwen3-VL 30B

مدل حرفه‌ای چندرسانه‌ای.

کاربردها: تحلیل پیچیده تصویر، پروژه‌های AI Vision
ویژگی‌ها: دقت بالا در تصویر + متن
سیستم پیشنهادی:

  • RAM: 32GB
  • VRAM: 24GB

✅ LLaMA 3 - 8B

مدل محبوب و بهینه از Meta.

کاربردها: چت، تولید محتوا، برنامه‌نویسی
ویژگی‌ها: پایداری و کیفیت خوب
سیستم پیشنهادی:

  • RAM: 16GB
  • VRAM: 8GB

✅ Phi-3 (3.8B / Mini 128K)

مدل سبک ولی بسیار بهینه از Microsoft.

کاربردها: چت، خلاصه‌سازی، پردازش متن
ویژگی‌ها: عملکرد عالی نسبت به سایز
سیستم پیشنهادی:

  • RAM: 8GB
  • VRAM: 4–6GB

✅ Mixtral 8x7B

مدل Mixture-of-Experts با قدرت بالا.

کاربردها: تحلیل پیشرفته، تولید محتوا حرفه‌ای
ویژگی‌ها: عملکرد نزدیک به مدل‌های خیلی بزرگ با مصرف کمتر
سیستم پیشنهادی:

  • RAM: 32GB
  • VRAM: 24GB

✅ EmbeddingGemma

مدل مخصوص تولید embedding (نه چت).

کاربردها: جستجوی معنایی، RAG، دسته‌بندی متن
ویژگی‌ها: مناسب بک‌اند و سیستم‌های جستجو
سیستم پیشنهادی:

  • RAM: 4GB
  • GPU نیاز ندارد

✅ Qwen 2.5 Coder 0.5B

مدل بسیار سبک برای کدنویسی ساده.

کاربردها: autocomplete، کد ساده
ویژگی‌ها: سریع و کم‌مصرف
سیستم پیشنهادی:

  • RAM: 4GB
  • بدون GPU

✅ Qwen 2.5 Coder 1.5B

نسخه قوی‌تر برای توسعه سبک.

کاربردها: تولید کد، اسکریپت‌نویسی
ویژگی‌ها: تعادل سرعت و دقت
سیستم پیشنهادی:

  • RAM: 8GB
  • VRAM: 4GB

✅ Dorna PartAI

مدل بومی/سفارشی (احتمالاً فارسی‌محور).

کاربردها: پردازش متن فارسی، چت
ویژگی‌ها: بهینه برای زبان فارسی
سیستم پیشنهادی:

  • RAM: 16GB
  • VRAM: 8GB

✅ Dorna 2 - 8B

نسخه بهبود یافته مدل قبلی.

کاربردها: تولید محتوا فارسی، چت پیشرفته
ویژگی‌ها: دقت بالاتر در زبان فارسی
سیستم پیشنهادی:

  • RAM: 16GB
  • VRAM: 8GB

EmbeddingGemma (~0.5B پارامتر)
مدل embedding مبتنی بر معماری ترنسفورمر برای نگاشت متن به فضای برداری با دقت بالا در semantic similarity.

کاربردها: Semantic Search، RAG، Clustering، Recommendation
ویژگی‌ها:

  • بهینه برای تولید dense vector
  • latency پایین در inference
  • مناسب ایندکس‌گذاری دیتاست‌های بزرگ
    توضیح پارامتری: با ~500 میلیون پارامتر، تمرکز روی efficiency و کیفیت embedding است نه تولید متن
    سیستم پیشنهادی:
    RAM: 4GB
    GPU: نیاز ندارد

Qwen 2.5 Coder - 0.5B (~0.5B پارامتر)
مدل ultra-lightweight برای code completion مبتنی بر نسخه distilled از Qwen.

کاربردها: autocomplete، code suggestion سبک
ویژگی‌ها:

  • optimized برای low-latency coding tasks
  • مناسب IDE integration
    توضیح پارامتری: در مقیاس زیر 1B، قابلیت reasoning محدود ولی سرعت بسیار بالا دارد
    سیستم پیشنهادی:
    RAM: 4GB
    GPU: نیاز ندارد

Qwen 2.5 Coder - 1.5B (~1.5B پارامتر)
مدل coding-oriented با درک بهتر syntax و context نسبت به نسخه 0.5B.

کاربردها: code generation، refactoring
ویژگی‌ها:

  • درک بهتر dependency در کد
  • مناسب پروژه‌های سبک تا متوسط
    توضیح پارامتری: در محدوده 1–2B، تعادل بین سرعت و semantic understanding برقرار است
    سیستم پیشنهادی:
    RAM: 6GB
    VRAM: 4GB

Mixtral 8x7B (~56B MoE پارامتر)
مدل Mixture-of-Experts با 8 expert که در هر inference فقط بخشی از آن فعال می‌شود.

کاربردها: NLP پیشرفته، reasoning، coding
ویژگی‌ها:

  • throughput بالا نسبت به dense مدل‌ها
  • scaling بسیار کارآمد
    توضیح پارامتری: اگرچه 56B پارامتر دارد، ولی active params بسیار کمتر است (MoE)، بنابراین هزینه inference پایین‌تر است
    سیستم پیشنهادی:
    RAM: 32GB+
    VRAM: 16GB+

Phi-3 14B (~14B پارامتر)
مدل dense بهینه‌شده با training dataset با کیفیت بالا.

کاربردها: reasoning، QA، coding
ویژگی‌ها:

  • performance بالا نسبت به سایز
  • instruction-following قوی
    توضیح پارامتری: در کلاس 10–15B، یکی از efficient ترین مدل‌ها از نظر quality/compute ratio
    سیستم پیشنهادی:
    RAM: 16GB
    VRAM: 10GB

LLaVA 7B (~7B پارامتر + vision encoder)
مدل multimodal با اتصال vision encoder به LLM.

کاربردها: image captioning، visual QA
ویژگی‌ها:

  • قابلیت درک تصویر + متن
  • مناسب کاربردهای سبک vision
    توضیح پارامتری: backbone 7B + encoder تصویری → مصرف VRAM بالاتر نسبت به مدل‌های pure text
    سیستم پیشنهادی:
    RAM: 12GB
    VRAM: 8GB

LLaVA 13B (~13B پارامتر)
نسخه دقیق‌تر برای multimodal reasoning.

کاربردها: تحلیل تصاویر پیچیده
ویژگی‌ها:

  • بهتر در spatial reasoning
  • پاسخ‌های دقیق‌تر
    توضیح پارامتری: در کلاس 13B، کیفیت vision-language به‌مراتب بالاتر از 7B
    سیستم پیشنهادی:
    RAM: 20GB
    VRAM: 12GB

LLaVA 34B (~34B پارامتر)
مدل high-end برای visual reasoning.

کاربردها: تحلیل حرفه‌ای تصویر
ویژگی‌ها:

  • توان بالا در context طولانی
  • مناسب کاربردهای تحقیقاتی
    توضیح پارامتری: در مقیاس 30B+، نیازمند منابع سنگین ولی خروجی بسیار دقیق
    سیستم پیشنهادی:
    RAM: 48GB+
    VRAM: 24GB+

Phi-4 14B (~14B پارامتر)
نسل جدید Phi با بهبود در reasoning depth.

کاربردها: تحلیل، reasoning، coding
ویژگی‌ها:

  • بهتر در multi-step reasoning
  • instruction tuning قوی‌تر
    توضیح پارامتری: نسبت به Phi-3، بهبود در alignment و stability
    سیستم پیشنهادی:
    RAM: 16GB
    VRAM: 10GB

Dolphin 3 - 8B (~8B پارامتر)
مدل fine-tuned برای conversational AI.

کاربردها: چت، roleplay، تولید متن
ویژگی‌ها:

  • پاسخ‌های طبیعی‌تر
  • alignment بهتر برای گفتگو
    توضیح پارامتری: در کلاس 7–8B، مناسب inference سریع با کیفیت قابل قبول
    سیستم پیشنهادی:
    RAM: 12GB
    VRAM: 8GB

BGE-M3 (~567M پارامتر)
مدل embedding چندزبانه با دقت بالا.

کاربردها: retrieval، RAG، search
ویژگی‌ها:

  • multilingual
  • state-of-the-art در embedding
    توضیح پارامتری: زیر 1B ولی بسیار optimized برای semantic tasks
    سیستم پیشنهادی:
    RAM: 6GB
    GPU: نیاز ندارد

Mistral Nemo 12B (~12B پارامتر)
مدل general-purpose optimized.

کاربردها: تولید متن، چت
ویژگی‌ها:

  • throughput بالا
  • memory efficient
    توضیح پارامتری: در کلاس 10–12B، یکی از سریع‌ترین مدل‌ها
    سیستم پیشنهادی:
    RAM: 16GB
    VRAM: 10GB

DeepSeek Coder 6.7B (~6.7B پارامتر)
مدل تخصصی برنامه‌نویسی.

کاربردها: code generation، debugging
ویژگی‌ها:

  • training روی dataset کدنویسی
  • درک syntax قوی
    توضیح پارامتری: در کلاس زیر 10B، عملکرد بسیار خوب برای coding
    سیستم پیشنهادی:
    RAM: 12GB
    VRAM: 8GB

DeepSeek Coder 33B (~33B پارامتر)
مدل پیشرفته coding.

کاربردها: پروژه‌های پیچیده
ویژگی‌ها:

  • reasoning در کد
  • پشتیبانی context بزرگ
    توضیح پارامتری: در کلاس 30B، مناسب production-level development
    سیستم پیشنهادی:
    RAM: 32GB+
    VRAM: 20GB+

CodeGemma 2B (~2B)
مدل سبک coding → مناسب low-resource inference
RAM: 6GB | VRAM: 4GB


CodeGemma 7B (~7B)
مدل coding متعادل با دقت بهتر
RAM: 12GB | VRAM: 8GB


Falcon 3 (1B / 3B / 7B / 10B)
مدل‌های general-purpose با scaling خطی کیفیت

  • 1B: lightweight inference
  • 10B: مناسب production سبک
    RAM: 4 → 16GB | VRAM: 0 → 10GB

LLaVA Llama3 8B (~8B multimodal)
نسخه جدیدتر vision + Llama3 backbone
→ بهتر در reasoning تصویری


TranslateGemma (4B / 12B / 27B)
مدل‌های تخصصی translation

  • scaling مستقیم کیفیت ترجمه با افزایش پارامتر
  • 27B نزدیک human-level

QwQ 32B (~32B)
مدل reasoning-heavy
→ مناسب chain-of-thought و مسائل پیچیده


Cogito (3B / 8B / 14B / 32B)
مدل‌های general reasoning
→ هرچه پارامتر بالاتر → دقت تحلیل بیشتر


Qwen 3.5 - 4B
یک مدل زبانی سبک و مدرن از خانواده Qwen که برای استفاده عمومی، چت، تولید محتوا، بازنویسی متن، خلاصه‌سازی و بسیاری از کارهای روزمره انتخاب مناسبی است. این مدل نسبت به مدل‌های خیلی کوچک، درک زبانی بهتری دارد و در عین حال هنوز به اندازه‌ای سبک است که روی سیستم‌های میان‌رده هم قابل اجرا باشد.

کاربردها: چت روزمره، تولید متن، خلاصه‌سازی، ترجمه سبک، بازنویسی، پاسخ‌گویی عمومی
ویژگی‌ها:

  • مدل عمومی با تعادل خوب بین کیفیت و سرعت
  • درک مناسب از متن‌های فارسی و انگلیسی
  • مناسب برای استفاده‌های روزانه و پروژه‌های سبک
  • latency پایین‌تر نسبت به مدل‌های بزرگ‌تر
    توضیح پارامتری: با حدود 4 میلیارد پارامتر، این مدل در رده مدل‌های سبک اما کاربردی قرار می‌گیرد؛ یعنی از مدل‌های 1B و 2B بسیار قوی‌تر است، اما هنوز هزینه اجرا و مصرف حافظه آن نسبتاً پایین باقی می‌ماند.
    سیستم پیشنهادی:
    RAM: حداقل 8GB
    VRAM: حداقل 6GB
    CPU-only: بهتر است 12GB RAM یا بیشتر داشته باشید

Qwen 3.5 - 9B
نسخه متعادل‌تر و جدی‌تر از Qwen 3.5 که برای کاربرانی مناسب است که کیفیت پاسخ، انسجام متن، درک بهتر سؤال و توانایی بیشتر در تحلیل را می‌خواهند، اما هنوز نمی‌خواهند وارد محدوده مدل‌های خیلی سنگین شوند. این مدل برای بسیاری از کاربردهای واقعی، نقطه تعادل بسیار خوبی بین کیفیت و منابع مصرفی ایجاد می‌کند.

کاربردها: تولید محتوا، تحلیل متن، چت پیشرفته، کمک در برنامه‌نویسی، ترجمه، خلاصه‌سازی حرفه‌ای
ویژگی‌ها:

  • کیفیت پاسخ‌گویی بالاتر نسبت به نسخه 4B
  • حفظ بهتر context و انسجام در پاسخ‌های طولانی‌تر
  • مناسب برای کارهای نیمه‌حرفه‌ای و استفاده مداوم
  • توانایی بهتر در instruction following و reasoning سبک تا متوسط
    توضیح پارامتری: با حدود 9 میلیارد پارامتر، این مدل وارد محدوده‌ای می‌شود که در آن کیفیت خروجی به‌طور محسوس از مدل‌های کوچک‌تر بالاتر می‌رود. در این کلاس، مدل می‌تواند هم در تولید متن طبیعی‌تر عمل کند و هم در تحلیل و استدلال چندمرحله‌ای، پایداری بیشتری نشان دهد.
    سیستم پیشنهادی:
    RAM: حداقل 16GB
    VRAM: حداقل 10GB
    CPU-only: بهتر است 24GB RAM یا بیشتر داشته باشید

Qwen 3.5 - 27B
یک مدل قدرتمند در کلاس 20B+ که برای کارهای سنگین‌تر، تحلیل‌های عمیق‌تر، تولید متن با کیفیت بالا، استدلال بهتر، درک context طولانی‌تر و پاسخ‌گویی دقیق‌تر طراحی شده است. این مدل برای کسانی مناسب است که می‌خواهند روی سیستم شخصی یا سرور محلی، به کیفیتی نزدیک‌تر به مدل‌های تجاری بزرگ دست پیدا کنند.

کاربردها: تحلیل پیشرفته، تولید محتوای حرفه‌ای، پاسخ‌گویی دقیق، پژوهش، استدلال چندمرحله‌ای، کدنویسی عمومی
ویژگی‌ها:

  • کیفیت پاسخ بسیار بالاتر نسبت به نسخه‌های سبک‌تر
  • انسجام بیشتر در مکالمه و متن‌های طولانی
  • مناسب برای کارهای تحلیلی و حرفه‌ای
  • عملکرد بهتر در reasoning، planning و پیروی از دستورهای پیچیده‌تر
    توضیح پارامتری: با حدود 27 میلیارد پارامتر، این مدل در رده مدل‌های سنگین local قرار می‌گیرد. در این مقیاس، مدل معمولاً درک عمیق‌تری از رابطه بین مفاهیم، ساختار سؤال و جزئیات دستور دارد و برای کارهای جدی‌تر، خروجی پایدارتر و دقیق‌تری ارائه می‌دهد.
    سیستم پیشنهادی:
    RAM: حداقل 32GB
    VRAM: حداقل 20GB
    CPU-only: بهتر است 48GB RAM یا بیشتر داشته باشید

Qwen 3.5 - 35B
بزرگ‌ترین نسخه این خانواده در لیست شما و مناسب کاربرانی است که بیشترین کیفیت ممکن را از بین نسخه‌های Qwen 3.5 می‌خواهند. این مدل برای سناریوهای حرفه‌ای‌تر، تحلیل‌های پیچیده، تولید متن با دقت بالا، پاسخ‌گویی چندمرحله‌ای، پژوهش، و کارهایی که به درک بهتر context و ساختار منطقی نیاز دارند، انتخاب بسیار قدرتمندی است.

کاربردها: تحلیل عمیق، تولید متن حرفه‌ای، پاسخ‌گویی دقیق، reasoning پیشرفته، کمک در پژوهش و برنامه‌نویسی
ویژگی‌ها:

  • قوی‌ترین نسخه Qwen 3.5 در این لیست
  • دقت بیشتر در پاسخ‌های پیچیده و چندمرحله‌ای
  • درک بهتر context طولانی و ارتباط بین بخش‌های مختلف سؤال
  • مناسب برای استفاده حرفه‌ای و workloadهای سنگین
    توضیح پارامتری: با حدود 35 میلیارد پارامتر، این مدل در کلاس مدل‌های بزرگ قرار می‌گیرد و معمولاً از نظر کیفیت خروجی، استحکام reasoning و توانایی مدیریت درخواست‌های پیچیده، به‌مراتب بالاتر از نسخه‌های 4B و 9B عمل می‌کند. البته در مقابل، مصرف حافظه و نیاز سخت‌افزاری آن نیز به‌طور محسوسی بیشتر است.
    سیستم پیشنهادی:
    RAM: حداقل 48GB
    VRAM: حداقل 24GB
    CPU-only: بهتر است 64GB RAM یا بیشتر داشته باشید

انتخاب مدل برای تازه کارها

برای کارهای عمومی روزمره روی سیستم متوسط DeepSeek-R1 8B گزینه خوبی است.

برای برنامه نویسی Qwen3-Coder 30B خیلی عالیه. اگه روی سیستمتون اجرا نمیشه میتونید از نسخه های سبک تر مثل ... استفاده کنید.

برای نیازهای سازمانی یا اینکه اگه سیستم خیلی قوی دارید GPT-OSS 120B خیلی قوی است. این مدل شبیه ترین به چت جی پی تی است. (البته در حد اون نیست.) نسخه متوسط این مدل GPT-OSS 20B است.

به طور کلی هیچ کدوم از مدل ها فارسیشون مثل چت جی پی تی یا جمنای خوب نیست ولی برای خیلی از کارها میشه ازشون استفاده کرد.


 

 در صورتی که نیاز به فایل، پلاگین یا داکیومنت غیر مرتبط به Ollama دارید، می توانید در این صفحه مطرح کنید:

دانلود داکیومنت آفلاین کتابخانه ها و درخواست فایل

 

اگر در زمینه راه‌اندازی و اجرای مدل‌های تولید تصویر تجربه کافی دارید، از شما دعوت می‌کنیم در فرآیند تست، بهینه‌سازی و راه‌اندازی این مدل‌ها با ما همکاری کنید:

دانلود ComfyUI - ساخت عکس با هوش مصنوعی (آفلاین)

 

جهت گفتگو و پرسش و پاسخ در این زمینه وارد انجمن شوید:

انجمن تخصصی گیت

(تاپیک اختصاصی برنامه Ollama)

 

📦 دانلود ریپازیتوری‌های گیت‌هاب

جستجوگر کد گیت راه اندازی شد. می‌تونید به هزاران ریپازیتوری گیت‌هاب دسترسی داشته باشید، اون‌ها رو بررسی کنید و به‌سادگی دانلودشون کنید.

دانلود از Github

برای ثبت دیدگاه وارد حساب کاربری خود شوید.