هوش مصنوعی بدون نیاز به اینترنت با Ollama

4.5 () 2 ماه قبل 15 دقیقه

هوش مصنوعی ollama

امروزه برای طیف زیادی از کارها از هوش مصنوعی یا همان LLM ها استفاده میکنیم، از برنامه نویسی گرفته تا مشاوره پزشکی، آموزش و یادگیری و یا پرسیدن سوال هایی که روزانه با آنها مواجه می شویم.

در زمان هایی که به هر دلیلی از دسترسی به اینترنت محروم می شویم و امکان اتصال به ابزارهای هوش مصنوعی مانند چت جی پی تی یا جمنای وجود ندارد، میتوانیم با اجرای مدل های هوش مصنوعی متن باز روی کامپیوتر شخصی یک ابزار هوش مصنوعی نسبتا قابل قبول داشته باشیم.

آشنایی با Ollama

Ollama یک پلتفرم متن‌باز و سبک است که امکان اجرای مدل‌های زبانی بزرگ (LLM) را به‌صورت محلی و بدون نیاز به اینترنت فراهم می‌کند.
با Ollama می‌توانید مدل‌هایی مانند Llama 2 و Llama 3 از Meta، Mistral و Mixtral، Phi-3 از Microsoft، Gemma از Google و حتی مدل‌های سفارشی خودتان را اجرا کنید.
تمام این فرایند به‌صورت آفلاین انجام می‌شود و داده‌های شما روی سیستم شخصی‌تان باقی می‌مانند.

Ollama به‌دلیل سادگی نصب، سرعت بالا و امنیت داده‌ها در میان توسعه‌دهندگان و محققان حوزه هوش مصنوعی خیلی محبوب است.

نصب و راه اندازی Ollama

🔴 بروزرسانی شده در 17 فروردین 1405

💻 دانلود Ollama برای ویندوز

اگر از ویندوز استفاده می‌کنید، نسخه نصبی آماده را دانلود و نصب کنید:

🔗 دانلود نرم افزار Ollama نسخه ویندوز (1.6GB)

🍎 دانلود Ollama برای مک (MacOS)

برای کاربران مک، نسخه DMG ارائه شده که به‌راحتی نصب می‌شود:

🔗 دانلود نرم افزار Ollama نسخه مک (104MB)

🐧 دانلود و راه‌اندازی Ollama در لینوکس

🔹 نسخه CPU (Intel / AMD): مناسب اکثر سیستم‌های لینوکسی بدون نیاز به GPU

🔗 دانلود Ollama لینوکس x86_64 (CPU)

🔹 نسخه ARM64: مناسب Raspberry Pi و سرورهای ARM

🔗 دانلود Ollama لینوکس ARM64

🔹 نسخه AMD GPU (ROCm): مخصوص کارت‌های AMD با پشتیبانی ROCm

🔗 دانلود Ollama لینوکس با پشتیبانی AMD GPU

📦 منابع توسعه و کتابخانه‌ها

🔗 دانلود ریپازیتوری گیت هاب Ollama

🔗 دانلود کتابخانه جاوااسکریپت Ollama

🔗 دانلود کتابخانه پایتون Ollama

فایل مانیفست همه مدل ها که حتما باید دانلود کنید و کنار مدل ها قرار بدین:

(فایل مانیفست بروز شده در تاریخ 4 فروردین 1405)

دانلود فایل manifests (آپدیت 4 فروردین 1405)

این فایل را در مسیر زیر اکسترکت کنید:

%HOMEPATH%\.ollama\models

در نهایت مدل های مورد نیاز خود را از فهرست زیر انتخاب و دانلود نمایید. دقت داشته باشید هرچقدر که پارامترهای مدل بیشتر باشد دقت آن بیشتر است و البته نیازمندی های سخت افزاری بالاتری دارد. در ادامه این مقاله سعی میکنیم تا حد ممکن در مورد مدل ها و کاربرد هر کدام توضیحاتی رو ارائه بدیم.

مدل ها را دانلود و در این مسیر اکسترکت کنید:

%HOMEPATH%\.ollama\models\blobs

بروزرسانی 3 فروردین 1405

حدود 30 تا مدل جدید و بروز اضافه شد.

فایل مانیفست اصلاح شد. مشکل مدل gpt oss 120b رفع شد.

همه مدل ها بدون اشکال کار میکنند.

#	نام مدل	حجم تقریبی
1	✅ deepseek-r1 8b	5GB
2	✅ gemma3 1b	800MB
3	✅ gemma3 4b	3GB
4	✅ gemma3 12b	8GB
5	✅ gemma3 27b	16GB
6	✅ gpt-oss 20b	13GB
7	✅ gpt-oss 120b	61GB
8	✅ qwen3 4b	2GB
9	✅ qwen3 8b	5GB
10	✅ qwen3 30b	17GB
11	✅ qwen3-coder 30b	17GB
12	✅ qwen3-vl 4b	3GB
13	✅ qwen3-vl 8b	6GB
14	✅ qwen3-vl 30b	18GB
15	✅ deepseek-r1-1.5b	1GB
16	✅ Dorna-partai	8GB
17	✅ llama3-8b	4.5GB
18	✅ phi3-3.8b-and-mini-128k	2GB
19	✅dorna2-8b	4.5GB
20	✅embeddinggemma	0.5GB
21	✅qwen-2.5-coder-0.5b	0.3GB
22	✅qwen-2.5-coder-1.5b	0.9GB
23	✅Mixtral 8x7B	25GB
24	✅phi3:14b	7.3GB
25	✅llava:7b	4.4GB
26	✅llava:13b	7.5GB
27	✅llava:34b	18.8GB
28	✅phi4:14b	8.4GB
29	✅dolphin3:8b	5.5GB
30	✅bge-m3:567m	1GB
31	✅mistral-nemo:12b	6.5GB
32	✅deepseek-coder:6.7b	3.5GB
33	✅deepseek-coder:33b	17.5GB
34	✅codegemma:2b	1.5GB
35	✅codegemma:7b	4.5GB
36	✅falcon3:1b	1.6GB
37	✅falcon3:3b	1.9GB
38	✅falcon3:7b	4.5GB
39	✅falcon3:10b	5.9GB
40	✅llava-llama3:8b	5.17GB
41	✅translategemma:4b	3GB
42	✅translategemma:12b	7.5GB
43	✅translategemma:27b	16GB
44	✅qwq:32b	18.5GB
45	✅cogito:3b	2GB
46	✅cogito:8b	4.5GB
47	✅cogito:14b	8.3GB
48	✅cogito:32b	18.5GB
50	*✅qwen3.5:4b	3.1GB
51	*✅qwen3.5:9b	6.1GB
52	*✅qwen3.5:27b	16.2GB
53	*✅qwen3.5:35b	22.2GB

(نکته: برای اجرای مدل هایی که با * مشخص شده اند حتما باید برنامه Ollama رو به آخرین نسخه بروزرسانی کنید.)

راهنمای انتخاب مدل های متن باز

در لیست بالا تعدادی مدل متن باز قابل دانلود داریم که می توانید با توجه به قدرت سخت افزاری و نیاز خود یک یا چند مدل را دانلود و استفاده کنید.

✅ DeepSeek-R1 8B

مدل استدلال‌محور (Reasoning) با عملکرد قوی در حل مسائل پیچیده، تحلیل منطقی، ریاضی، تولید محتوا و کدنویسی.

کاربردها: حل مسئله، تحلیل داده، تولید متن دقیق، کمک برنامه‌نویسی
ویژگی‌ها: قدرت استدلال بالا، پاسخ‌های ساختارمند، مناسب کارهای تحلیلی
سیستم پیشنهادی:

RAM: حداقل 16GB
VRAM: حداقل 8GB (بهتر: 10GB+)
CPU-only: حداقل 32GB RAM

✅ DeepSeek-R1 1.5B

نسخه سبک‌تر برای اجرای سریع‌تر با حفظ بخشی از توان استدلالی.

کاربردها: کارهای روزمره، تحلیل سبک، چت
ویژگی‌ها: سبک، سریع، مناسب سیستم‌های ضعیف
سیستم پیشنهادی:

RAM: 8GB
VRAM: 4GB

✅ Gemma 3 - 1B

مدل بسیار سبک برای استفاده‌های ساده.

کاربردها: چت ساده، تولید متن کوتاه، تست و توسعه
ویژگی‌ها: سرعت بالا، مصرف پایین
سیستم پیشنهادی:

RAM: 4GB
VRAM: بدون GPU هم قابل اجرا

✅ Gemma 3 - 4B

مدل متعادل برای استفاده عمومی.

کاربردها: تولید محتوا، ترجمه، چت
ویژگی‌ها: کیفیت مناسب در کنار سرعت خوب
سیستم پیشنهادی:

RAM: 8GB
VRAM: 6GB

✅ Gemma 3 - 12B

مدل نیمه‌حرفه‌ای برای کارهای جدی‌تر.

کاربردها: تولید محتوای باکیفیت، تحلیل متن، برنامه‌نویسی
ویژگی‌ها: دقت بالاتر نسبت به مدل‌های کوچک
سیستم پیشنهادی:

RAM: 16GB
VRAM: 12GB

✅ Gemma 3 - 27B

مدل قدرتمند برای کاربردهای پیشرفته.

کاربردها: پروژه‌های حرفه‌ای، تحلیل سنگین، تولید محتوا سطح بالا
ویژگی‌ها: کیفیت بالا، نزدیک به مدل‌های بزرگ
سیستم پیشنهادی:

RAM: 32GB
VRAM: 24GB

✅ GPT-OSS 20B

مدل بزرگ و همه‌منظوره با عملکرد خوب در متن و کدنویسی.

کاربردها: تولید محتوا، تحلیل، برنامه‌نویسی
ویژگی‌ها: تعادل بین قدرت و مصرف
سیستم پیشنهادی:

RAM: 32GB
VRAM: 16–20GB

✅ GPT-OSS 120B

مدل بسیار بزرگ در سطح سازمانی.

کاربردها: تحلیل پیچیده، تولید محتوا سطح بالا، پروژه‌های سنگین
ویژگی‌ها: دقت و کیفیت بسیار بالا
سیستم پیشنهادی:

RAM: 128GB+
VRAM: 48GB+ یا Multi-GPU
مناسب اجرای خانگی نیست (سروری)

✅ Qwen3 4B

مدل سبک و سریع برای کارهای عمومی.

کاربردها: چت، ترجمه، تولید متن
ویژگی‌ها: بهینه و سریع
سیستم پیشنهادی:

RAM: 8GB
VRAM: 6GB

✅ Qwen3 8B

مدل متعادل با دقت خوب.

کاربردها: تولید محتوا، تحلیل، کدنویسی سبک
ویژگی‌ها: کیفیت بهتر نسبت به 4B
سیستم پیشنهادی:

RAM: 16GB
VRAM: 8–10GB

✅ Qwen3 30B

مدل قدرتمند برای کارهای حرفه‌ای.

کاربردها: تحلیل پیشرفته، تولید محتوا حرفه‌ای
ویژگی‌ها: دقت بالا، مناسب پروژه‌های جدی
سیستم پیشنهادی:

RAM: 32GB
VRAM: 24GB

✅ Qwen3-Coder 30B

مدل تخصصی برنامه‌نویسی.

کاربردها: تولید کد، دیباگ، تبدیل زبان‌ها
ویژگی‌ها: درک عمیق ساختار کد
سیستم پیشنهادی:

RAM: 32GB
VRAM: 24GB

✅ Qwen3-VL 4B

مدل چندرسانه‌ای سبک (متن + تصویر).

کاربردها: تحلیل تصویر، پاسخ به سوالات تصویری
ویژگی‌ها: پشتیبانی از ورودی تصویر
سیستم پیشنهادی:

RAM: 8GB
VRAM: 6GB

✅ Qwen3-VL 8B

نسخه قوی‌تر چندرسانه‌ای.

کاربردها: پردازش دقیق‌تر تصویر + متن
ویژگی‌ها: درک بهتر تصاویر
سیستم پیشنهادی:

RAM: 16GB
VRAM: 10GB

✅ Qwen3-VL 30B

مدل حرفه‌ای چندرسانه‌ای.

کاربردها: تحلیل پیچیده تصویر، پروژه‌های AI Vision
ویژگی‌ها: دقت بالا در تصویر + متن
سیستم پیشنهادی:

RAM: 32GB
VRAM: 24GB

✅ LLaMA 3 - 8B

مدل محبوب و بهینه از Meta.

کاربردها: چت، تولید محتوا، برنامه‌نویسی
ویژگی‌ها: پایداری و کیفیت خوب
سیستم پیشنهادی:

RAM: 16GB
VRAM: 8GB

✅ Phi-3 (3.8B / Mini 128K)

مدل سبک ولی بسیار بهینه از Microsoft.

کاربردها: چت، خلاصه‌سازی، پردازش متن
ویژگی‌ها: عملکرد عالی نسبت به سایز
سیستم پیشنهادی:

RAM: 8GB
VRAM: 4–6GB

✅ Mixtral 8x7B

مدل Mixture-of-Experts با قدرت بالا.

کاربردها: تحلیل پیشرفته، تولید محتوا حرفه‌ای
ویژگی‌ها: عملکرد نزدیک به مدل‌های خیلی بزرگ با مصرف کمتر
سیستم پیشنهادی:

RAM: 32GB
VRAM: 24GB

✅ EmbeddingGemma

مدل مخصوص تولید embedding (نه چت).

کاربردها: جستجوی معنایی، RAG، دسته‌بندی متن
ویژگی‌ها: مناسب بک‌اند و سیستم‌های جستجو
سیستم پیشنهادی:

RAM: 4GB
GPU نیاز ندارد

✅ Qwen 2.5 Coder 0.5B

مدل بسیار سبک برای کدنویسی ساده.

کاربردها: autocomplete، کد ساده
ویژگی‌ها: سریع و کم‌مصرف
سیستم پیشنهادی:

RAM: 4GB
بدون GPU

✅ Qwen 2.5 Coder 1.5B

نسخه قوی‌تر برای توسعه سبک.

کاربردها: تولید کد، اسکریپت‌نویسی
ویژگی‌ها: تعادل سرعت و دقت
سیستم پیشنهادی:

RAM: 8GB
VRAM: 4GB

✅ Dorna PartAI

مدل بومی/سفارشی (احتمالاً فارسی‌محور).

کاربردها: پردازش متن فارسی، چت
ویژگی‌ها: بهینه برای زبان فارسی
سیستم پیشنهادی:

RAM: 16GB
VRAM: 8GB

✅ Dorna 2 - 8B

نسخه بهبود یافته مدل قبلی.

کاربردها: تولید محتوا فارسی، چت پیشرفته
ویژگی‌ها: دقت بالاتر در زبان فارسی
سیستم پیشنهادی:

RAM: 16GB
VRAM: 8GB

✅ EmbeddingGemma (~0.5B پارامتر)
مدل embedding مبتنی بر معماری ترنسفورمر برای نگاشت متن به فضای برداری با دقت بالا در semantic similarity.

کاربردها: Semantic Search، RAG، Clustering، Recommendation
ویژگی‌ها:

بهینه برای تولید dense vector
latency پایین در inference
مناسب ایندکس‌گذاری دیتاست‌های بزرگ
توضیح پارامتری: با ~500 میلیون پارامتر، تمرکز روی efficiency و کیفیت embedding است نه تولید متن
سیستم پیشنهادی:
RAM: 4GB
GPU: نیاز ندارد

✅ Qwen 2.5 Coder - 0.5B (~0.5B پارامتر)
مدل ultra-lightweight برای code completion مبتنی بر نسخه distilled از Qwen.

کاربردها: autocomplete، code suggestion سبک
ویژگی‌ها:

optimized برای low-latency coding tasks
مناسب IDE integration
توضیح پارامتری: در مقیاس زیر 1B، قابلیت reasoning محدود ولی سرعت بسیار بالا دارد
سیستم پیشنهادی:
RAM: 4GB
GPU: نیاز ندارد

✅ Qwen 2.5 Coder - 1.5B (~1.5B پارامتر)
مدل coding-oriented با درک بهتر syntax و context نسبت به نسخه 0.5B.

کاربردها: code generation، refactoring
ویژگی‌ها:

درک بهتر dependency در کد
مناسب پروژه‌های سبک تا متوسط
توضیح پارامتری: در محدوده 1–2B، تعادل بین سرعت و semantic understanding برقرار است
سیستم پیشنهادی:
RAM: 6GB
VRAM: 4GB

✅ Mixtral 8x7B (~56B MoE پارامتر)
مدل Mixture-of-Experts با 8 expert که در هر inference فقط بخشی از آن فعال می‌شود.

کاربردها: NLP پیشرفته، reasoning، coding
ویژگی‌ها:

throughput بالا نسبت به dense مدل‌ها
scaling بسیار کارآمد
توضیح پارامتری: اگرچه 56B پارامتر دارد، ولی active params بسیار کمتر است (MoE)، بنابراین هزینه inference پایین‌تر است
سیستم پیشنهادی:
RAM: 32GB+
VRAM: 16GB+

✅ Phi-3 14B (~14B پارامتر)
مدل dense بهینه‌شده با training dataset با کیفیت بالا.

کاربردها: reasoning، QA، coding
ویژگی‌ها:

performance بالا نسبت به سایز
instruction-following قوی
توضیح پارامتری: در کلاس 10–15B، یکی از efficient ترین مدل‌ها از نظر quality/compute ratio
سیستم پیشنهادی:
RAM: 16GB
VRAM: 10GB

✅ LLaVA 7B (~7B پارامتر + vision encoder)
مدل multimodal با اتصال vision encoder به LLM.

کاربردها: image captioning، visual QA
ویژگی‌ها:

قابلیت درک تصویر + متن
مناسب کاربردهای سبک vision
توضیح پارامتری: backbone 7B + encoder تصویری → مصرف VRAM بالاتر نسبت به مدل‌های pure text
سیستم پیشنهادی:
RAM: 12GB
VRAM: 8GB

✅ LLaVA 13B (~13B پارامتر)
نسخه دقیق‌تر برای multimodal reasoning.

کاربردها: تحلیل تصاویر پیچیده
ویژگی‌ها:

بهتر در spatial reasoning
پاسخ‌های دقیق‌تر
توضیح پارامتری: در کلاس 13B، کیفیت vision-language به‌مراتب بالاتر از 7B
سیستم پیشنهادی:
RAM: 20GB
VRAM: 12GB

✅ LLaVA 34B (~34B پارامتر)
مدل high-end برای visual reasoning.

کاربردها: تحلیل حرفه‌ای تصویر
ویژگی‌ها:

توان بالا در context طولانی
مناسب کاربردهای تحقیقاتی
توضیح پارامتری: در مقیاس 30B+، نیازمند منابع سنگین ولی خروجی بسیار دقیق
سیستم پیشنهادی:
RAM: 48GB+
VRAM: 24GB+

✅ Phi-4 14B (~14B پارامتر)
نسل جدید Phi با بهبود در reasoning depth.

کاربردها: تحلیل، reasoning، coding
ویژگی‌ها:

بهتر در multi-step reasoning
instruction tuning قوی‌تر
توضیح پارامتری: نسبت به Phi-3، بهبود در alignment و stability
سیستم پیشنهادی:
RAM: 16GB
VRAM: 10GB

✅ Dolphin 3 - 8B (~8B پارامتر)
مدل fine-tuned برای conversational AI.

کاربردها: چت، roleplay، تولید متن
ویژگی‌ها:

پاسخ‌های طبیعی‌تر
alignment بهتر برای گفتگو
توضیح پارامتری: در کلاس 7–8B، مناسب inference سریع با کیفیت قابل قبول
سیستم پیشنهادی:
RAM: 12GB
VRAM: 8GB

✅ BGE-M3 (~567M پارامتر)
مدل embedding چندزبانه با دقت بالا.

کاربردها: retrieval، RAG، search
ویژگی‌ها:

multilingual
state-of-the-art در embedding
توضیح پارامتری: زیر 1B ولی بسیار optimized برای semantic tasks
سیستم پیشنهادی:
RAM: 6GB
GPU: نیاز ندارد

✅ Mistral Nemo 12B (~12B پارامتر)
مدل general-purpose optimized.

کاربردها: تولید متن، چت
ویژگی‌ها:

throughput بالا
memory efficient
توضیح پارامتری: در کلاس 10–12B، یکی از سریع‌ترین مدل‌ها
سیستم پیشنهادی:
RAM: 16GB
VRAM: 10GB

✅ DeepSeek Coder 6.7B (~6.7B پارامتر)
مدل تخصصی برنامه‌نویسی.

کاربردها: code generation، debugging
ویژگی‌ها:

training روی dataset کدنویسی
درک syntax قوی
توضیح پارامتری: در کلاس زیر 10B، عملکرد بسیار خوب برای coding
سیستم پیشنهادی:
RAM: 12GB
VRAM: 8GB

✅ DeepSeek Coder 33B (~33B پارامتر)
مدل پیشرفته coding.

کاربردها: پروژه‌های پیچیده
ویژگی‌ها:

reasoning در کد
پشتیبانی context بزرگ
توضیح پارامتری: در کلاس 30B، مناسب production-level development
سیستم پیشنهادی:
RAM: 32GB+
VRAM: 20GB+

✅ CodeGemma 2B (~2B)
مدل سبک coding → مناسب low-resource inference
RAM: 6GB | VRAM: 4GB

✅ CodeGemma 7B (~7B)
مدل coding متعادل با دقت بهتر
RAM: 12GB | VRAM: 8GB

✅ Falcon 3 (1B / 3B / 7B / 10B)
مدل‌های general-purpose با scaling خطی کیفیت

1B: lightweight inference
10B: مناسب production سبک
RAM: 4 → 16GB | VRAM: 0 → 10GB

✅ LLaVA Llama3 8B (~8B multimodal)
نسخه جدیدتر vision + Llama3 backbone
→ بهتر در reasoning تصویری

✅ TranslateGemma (4B / 12B / 27B)
مدل‌های تخصصی translation

scaling مستقیم کیفیت ترجمه با افزایش پارامتر
27B نزدیک human-level

✅ QwQ 32B (~32B)
مدل reasoning-heavy
→ مناسب chain-of-thought و مسائل پیچیده

✅ Cogito (3B / 8B / 14B / 32B)
مدل‌های general reasoning
→ هرچه پارامتر بالاتر → دقت تحلیل بیشتر

✅ Qwen 3.5 - 4B
یک مدل زبانی سبک و مدرن از خانواده Qwen که برای استفاده عمومی، چت، تولید محتوا، بازنویسی متن، خلاصه‌سازی و بسیاری از کارهای روزمره انتخاب مناسبی است. این مدل نسبت به مدل‌های خیلی کوچک، درک زبانی بهتری دارد و در عین حال هنوز به اندازه‌ای سبک است که روی سیستم‌های میان‌رده هم قابل اجرا باشد.

کاربردها: چت روزمره، تولید متن، خلاصه‌سازی، ترجمه سبک، بازنویسی، پاسخ‌گویی عمومی
ویژگی‌ها:

مدل عمومی با تعادل خوب بین کیفیت و سرعت
درک مناسب از متن‌های فارسی و انگلیسی
مناسب برای استفاده‌های روزانه و پروژه‌های سبک
latency پایین‌تر نسبت به مدل‌های بزرگ‌تر
توضیح پارامتری: با حدود 4 میلیارد پارامتر، این مدل در رده مدل‌های سبک اما کاربردی قرار می‌گیرد؛ یعنی از مدل‌های 1B و 2B بسیار قوی‌تر است، اما هنوز هزینه اجرا و مصرف حافظه آن نسبتاً پایین باقی می‌ماند.
سیستم پیشنهادی:
RAM: حداقل 8GB
VRAM: حداقل 6GB
CPU-only: بهتر است 12GB RAM یا بیشتر داشته باشید

✅ Qwen 3.5 - 9B
نسخه متعادل‌تر و جدی‌تر از Qwen 3.5 که برای کاربرانی مناسب است که کیفیت پاسخ، انسجام متن، درک بهتر سؤال و توانایی بیشتر در تحلیل را می‌خواهند، اما هنوز نمی‌خواهند وارد محدوده مدل‌های خیلی سنگین شوند. این مدل برای بسیاری از کاربردهای واقعی، نقطه تعادل بسیار خوبی بین کیفیت و منابع مصرفی ایجاد می‌کند.

کاربردها: تولید محتوا، تحلیل متن، چت پیشرفته، کمک در برنامه‌نویسی، ترجمه، خلاصه‌سازی حرفه‌ای
ویژگی‌ها:

کیفیت پاسخ‌گویی بالاتر نسبت به نسخه 4B
حفظ بهتر context و انسجام در پاسخ‌های طولانی‌تر
مناسب برای کارهای نیمه‌حرفه‌ای و استفاده مداوم
توانایی بهتر در instruction following و reasoning سبک تا متوسط
توضیح پارامتری: با حدود 9 میلیارد پارامتر، این مدل وارد محدوده‌ای می‌شود که در آن کیفیت خروجی به‌طور محسوس از مدل‌های کوچک‌تر بالاتر می‌رود. در این کلاس، مدل می‌تواند هم در تولید متن طبیعی‌تر عمل کند و هم در تحلیل و استدلال چندمرحله‌ای، پایداری بیشتری نشان دهد.
سیستم پیشنهادی:
RAM: حداقل 16GB
VRAM: حداقل 10GB
CPU-only: بهتر است 24GB RAM یا بیشتر داشته باشید

✅ Qwen 3.5 - 27B
یک مدل قدرتمند در کلاس 20B+ که برای کارهای سنگین‌تر، تحلیل‌های عمیق‌تر، تولید متن با کیفیت بالا، استدلال بهتر، درک context طولانی‌تر و پاسخ‌گویی دقیق‌تر طراحی شده است. این مدل برای کسانی مناسب است که می‌خواهند روی سیستم شخصی یا سرور محلی، به کیفیتی نزدیک‌تر به مدل‌های تجاری بزرگ دست پیدا کنند.

کاربردها: تحلیل پیشرفته، تولید محتوای حرفه‌ای، پاسخ‌گویی دقیق، پژوهش، استدلال چندمرحله‌ای، کدنویسی عمومی
ویژگی‌ها:

کیفیت پاسخ بسیار بالاتر نسبت به نسخه‌های سبک‌تر
انسجام بیشتر در مکالمه و متن‌های طولانی
مناسب برای کارهای تحلیلی و حرفه‌ای
عملکرد بهتر در reasoning، planning و پیروی از دستورهای پیچیده‌تر
توضیح پارامتری: با حدود 27 میلیارد پارامتر، این مدل در رده مدل‌های سنگین local قرار می‌گیرد. در این مقیاس، مدل معمولاً درک عمیق‌تری از رابطه بین مفاهیم، ساختار سؤال و جزئیات دستور دارد و برای کارهای جدی‌تر، خروجی پایدارتر و دقیق‌تری ارائه می‌دهد.
سیستم پیشنهادی:
RAM: حداقل 32GB
VRAM: حداقل 20GB
CPU-only: بهتر است 48GB RAM یا بیشتر داشته باشید

✅ Qwen 3.5 - 35B
بزرگ‌ترین نسخه این خانواده در لیست شما و مناسب کاربرانی است که بیشترین کیفیت ممکن را از بین نسخه‌های Qwen 3.5 می‌خواهند. این مدل برای سناریوهای حرفه‌ای‌تر، تحلیل‌های پیچیده، تولید متن با دقت بالا، پاسخ‌گویی چندمرحله‌ای، پژوهش، و کارهایی که به درک بهتر context و ساختار منطقی نیاز دارند، انتخاب بسیار قدرتمندی است.

کاربردها: تحلیل عمیق، تولید متن حرفه‌ای، پاسخ‌گویی دقیق، reasoning پیشرفته، کمک در پژوهش و برنامه‌نویسی
ویژگی‌ها:

قوی‌ترین نسخه Qwen 3.5 در این لیست
دقت بیشتر در پاسخ‌های پیچیده و چندمرحله‌ای
درک بهتر context طولانی و ارتباط بین بخش‌های مختلف سؤال
مناسب برای استفاده حرفه‌ای و workloadهای سنگین
توضیح پارامتری: با حدود 35 میلیارد پارامتر، این مدل در کلاس مدل‌های بزرگ قرار می‌گیرد و معمولاً از نظر کیفیت خروجی، استحکام reasoning و توانایی مدیریت درخواست‌های پیچیده، به‌مراتب بالاتر از نسخه‌های 4B و 9B عمل می‌کند. البته در مقابل، مصرف حافظه و نیاز سخت‌افزاری آن نیز به‌طور محسوسی بیشتر است.
سیستم پیشنهادی:
RAM: حداقل 48GB
VRAM: حداقل 24GB
CPU-only: بهتر است 64GB RAM یا بیشتر داشته باشید

انتخاب مدل برای تازه کارها

برای کارهای عمومی روزمره روی سیستم متوسط DeepSeek-R1 8B گزینه خوبی است.

برای برنامه نویسی Qwen3-Coder 30B خیلی عالیه. اگه روی سیستمتون اجرا نمیشه میتونید از نسخه های سبک تر مثل ... استفاده کنید.

برای نیازهای سازمانی یا اینکه اگه سیستم خیلی قوی دارید GPT-OSS 120B خیلی قوی است. این مدل شبیه ترین به چت جی پی تی است. (البته در حد اون نیست.) نسخه متوسط این مدل GPT-OSS 20B است.

به طور کلی هیچ کدوم از مدل ها فارسیشون مثل چت جی پی تی یا جمنای خوب نیست ولی برای خیلی از کارها میشه ازشون استفاده کرد.

در صورتی که نیاز به فایل، پلاگین یا داکیومنت غیر مرتبط به Ollama دارید، می توانید در این صفحه مطرح کنید:

دانلود داکیومنت آفلاین کتابخانه ها و درخواست فایل

اگر در زمینه راه‌اندازی و اجرای مدل‌های تولید تصویر تجربه کافی دارید، از شما دعوت می‌کنیم در فرآیند تست، بهینه‌سازی و راه‌اندازی این مدل‌ها با ما همکاری کنید:

دانلود ComfyUI - ساخت عکس با هوش مصنوعی (آفلاین)

جهت گفتگو و پرسش و پاسخ در این زمینه وارد انجمن شوید:

انجمن تخصصی گیت

(تاپیک اختصاصی برنامه Ollama)

📦 دانلود ریپازیتوری‌های گیت‌هاب

جستجوگر کد گیت راه اندازی شد. می‌تونید به هزاران ریپازیتوری گیت‌هاب دسترسی داشته باشید، اون‌ها رو بررسی کنید و به‌سادگی دانلودشون کنید.

دانلود از Github

دیدگاه ها

برای ثبت دیدگاه وارد حساب کاربری خود شوید.