هوش مصنوعی بدون نیاز به اینترنت با Ollama

امروزه برای طیف زیادی از کارها از هوش مصنوعی یا همان LLM ها استفاده میکنیم، از برنامه نویسی گرفته تا مشاوره پزشکی، آموزش و یادگیری و یا پرسیدن سوال هایی که روزانه با آنها مواجه می شویم.
در زمان هایی که به هر دلیلی از دسترسی به اینترنت محروم می شویم و امکان اتصال به ابزارهای هوش مصنوعی مانند چت جی پی تی یا جمنای وجود ندارد، میتوانیم با اجرای مدل های هوش مصنوعی متن باز روی کامپیوتر شخصی یک ابزار هوش مصنوعی نسبتا قابل قبول داشته باشیم.
آشنایی با Ollama
Ollama یک پلتفرم متنباز و سبک است که امکان اجرای مدلهای زبانی بزرگ (LLM) را بهصورت محلی و بدون نیاز به اینترنت فراهم میکند.
با Ollama میتوانید مدلهایی مانند Llama 2 و Llama 3 از Meta، Mistral و Mixtral، Phi-3 از Microsoft، Gemma از Google و حتی مدلهای سفارشی خودتان را اجرا کنید.
تمام این فرایند بهصورت آفلاین انجام میشود و دادههای شما روی سیستم شخصیتان باقی میمانند.
Ollama بهدلیل سادگی نصب، سرعت بالا و امنیت دادهها در میان توسعهدهندگان و محققان حوزه هوش مصنوعی خیلی محبوب است.
نصب و راه اندازی Ollama
🔴 بروزرسانی شده در 17 فروردین 1405
💻 دانلود Ollama برای ویندوز
اگر از ویندوز استفاده میکنید، نسخه نصبی آماده را دانلود و نصب کنید:
🔗 دانلود نرم افزار Ollama نسخه ویندوز (1.6GB)
🍎 دانلود Ollama برای مک (MacOS)
برای کاربران مک، نسخه DMG ارائه شده که بهراحتی نصب میشود:
🔗 دانلود نرم افزار Ollama نسخه مک (104MB)
🐧 دانلود و راهاندازی Ollama در لینوکس
🔹 نسخه CPU (Intel / AMD): مناسب اکثر سیستمهای لینوکسی بدون نیاز به GPU
🔗 دانلود Ollama لینوکس x86_64 (CPU)
🔹 نسخه ARM64: مناسب Raspberry Pi و سرورهای ARM
🔹 نسخه AMD GPU (ROCm): مخصوص کارتهای AMD با پشتیبانی ROCm
🔗 دانلود Ollama لینوکس با پشتیبانی AMD GPU
📦 منابع توسعه و کتابخانهها
🔗 دانلود ریپازیتوری گیت هاب Ollama
🔗 دانلود کتابخانه جاوااسکریپت Ollama
🔗 دانلود کتابخانه پایتون Ollama
فایل مانیفست همه مدل ها که حتما باید دانلود کنید و کنار مدل ها قرار بدین:
(فایل مانیفست بروز شده در تاریخ 4 فروردین 1405)
دانلود فایل manifests (آپدیت 4 فروردین 1405)
این فایل را در مسیر زیر اکسترکت کنید:
%HOMEPATH%\.ollama\models
در نهایت مدل های مورد نیاز خود را از فهرست زیر انتخاب و دانلود نمایید. دقت داشته باشید هرچقدر که پارامترهای مدل بیشتر باشد دقت آن بیشتر است و البته نیازمندی های سخت افزاری بالاتری دارد. در ادامه این مقاله سعی میکنیم تا حد ممکن در مورد مدل ها و کاربرد هر کدام توضیحاتی رو ارائه بدیم.
مدل ها را دانلود و در این مسیر اکسترکت کنید:
%HOMEPATH%\.ollama\models\blobs
بروزرسانی 3 فروردین 1405
حدود 30 تا مدل جدید و بروز اضافه شد.
فایل مانیفست اصلاح شد. مشکل مدل gpt oss 120b رفع شد.
همه مدل ها بدون اشکال کار میکنند.
(نکته: برای اجرای مدل هایی که با * مشخص شده اند حتما باید برنامه Ollama رو به آخرین نسخه بروزرسانی کنید.)
راهنمای انتخاب مدل های متن باز
در لیست بالا تعدادی مدل متن باز قابل دانلود داریم که می توانید با توجه به قدرت سخت افزاری و نیاز خود یک یا چند مدل را دانلود و استفاده کنید.
✅ DeepSeek-R1 8B
مدل استدلالمحور (Reasoning) با عملکرد قوی در حل مسائل پیچیده، تحلیل منطقی، ریاضی، تولید محتوا و کدنویسی.
کاربردها: حل مسئله، تحلیل داده، تولید متن دقیق، کمک برنامهنویسی
ویژگیها: قدرت استدلال بالا، پاسخهای ساختارمند، مناسب کارهای تحلیلی
سیستم پیشنهادی:
- RAM: حداقل 16GB
- VRAM: حداقل 8GB (بهتر: 10GB+)
- CPU-only: حداقل 32GB RAM
✅ DeepSeek-R1 1.5B
نسخه سبکتر برای اجرای سریعتر با حفظ بخشی از توان استدلالی.
کاربردها: کارهای روزمره، تحلیل سبک، چت
ویژگیها: سبک، سریع، مناسب سیستمهای ضعیف
سیستم پیشنهادی:
- RAM: 8GB
- VRAM: 4GB
✅ Gemma 3 - 1B
مدل بسیار سبک برای استفادههای ساده.
کاربردها: چت ساده، تولید متن کوتاه، تست و توسعه
ویژگیها: سرعت بالا، مصرف پایین
سیستم پیشنهادی:
- RAM: 4GB
- VRAM: بدون GPU هم قابل اجرا
✅ Gemma 3 - 4B
مدل متعادل برای استفاده عمومی.
کاربردها: تولید محتوا، ترجمه، چت
ویژگیها: کیفیت مناسب در کنار سرعت خوب
سیستم پیشنهادی:
- RAM: 8GB
- VRAM: 6GB
✅ Gemma 3 - 12B
مدل نیمهحرفهای برای کارهای جدیتر.
کاربردها: تولید محتوای باکیفیت، تحلیل متن، برنامهنویسی
ویژگیها: دقت بالاتر نسبت به مدلهای کوچک
سیستم پیشنهادی:
- RAM: 16GB
- VRAM: 12GB
✅ Gemma 3 - 27B
مدل قدرتمند برای کاربردهای پیشرفته.
کاربردها: پروژههای حرفهای، تحلیل سنگین، تولید محتوا سطح بالا
ویژگیها: کیفیت بالا، نزدیک به مدلهای بزرگ
سیستم پیشنهادی:
- RAM: 32GB
- VRAM: 24GB
✅ GPT-OSS 20B
مدل بزرگ و همهمنظوره با عملکرد خوب در متن و کدنویسی.
کاربردها: تولید محتوا، تحلیل، برنامهنویسی
ویژگیها: تعادل بین قدرت و مصرف
سیستم پیشنهادی:
- RAM: 32GB
- VRAM: 16–20GB
✅ GPT-OSS 120B
مدل بسیار بزرگ در سطح سازمانی.
کاربردها: تحلیل پیچیده، تولید محتوا سطح بالا، پروژههای سنگین
ویژگیها: دقت و کیفیت بسیار بالا
سیستم پیشنهادی:
- RAM: 128GB+
- VRAM: 48GB+ یا Multi-GPU
- مناسب اجرای خانگی نیست (سروری)
✅ Qwen3 4B
مدل سبک و سریع برای کارهای عمومی.
کاربردها: چت، ترجمه، تولید متن
ویژگیها: بهینه و سریع
سیستم پیشنهادی:
- RAM: 8GB
- VRAM: 6GB
✅ Qwen3 8B
مدل متعادل با دقت خوب.
کاربردها: تولید محتوا، تحلیل، کدنویسی سبک
ویژگیها: کیفیت بهتر نسبت به 4B
سیستم پیشنهادی:
- RAM: 16GB
- VRAM: 8–10GB
✅ Qwen3 30B
مدل قدرتمند برای کارهای حرفهای.
کاربردها: تحلیل پیشرفته، تولید محتوا حرفهای
ویژگیها: دقت بالا، مناسب پروژههای جدی
سیستم پیشنهادی:
- RAM: 32GB
- VRAM: 24GB
✅ Qwen3-Coder 30B
مدل تخصصی برنامهنویسی.
کاربردها: تولید کد، دیباگ، تبدیل زبانها
ویژگیها: درک عمیق ساختار کد
سیستم پیشنهادی:
- RAM: 32GB
- VRAM: 24GB
✅ Qwen3-VL 4B
مدل چندرسانهای سبک (متن + تصویر).
کاربردها: تحلیل تصویر، پاسخ به سوالات تصویری
ویژگیها: پشتیبانی از ورودی تصویر
سیستم پیشنهادی:
- RAM: 8GB
- VRAM: 6GB
✅ Qwen3-VL 8B
نسخه قویتر چندرسانهای.
کاربردها: پردازش دقیقتر تصویر + متن
ویژگیها: درک بهتر تصاویر
سیستم پیشنهادی:
- RAM: 16GB
- VRAM: 10GB
✅ Qwen3-VL 30B
مدل حرفهای چندرسانهای.
کاربردها: تحلیل پیچیده تصویر، پروژههای AI Vision
ویژگیها: دقت بالا در تصویر + متن
سیستم پیشنهادی:
- RAM: 32GB
- VRAM: 24GB
✅ LLaMA 3 - 8B
مدل محبوب و بهینه از Meta.
کاربردها: چت، تولید محتوا، برنامهنویسی
ویژگیها: پایداری و کیفیت خوب
سیستم پیشنهادی:
- RAM: 16GB
- VRAM: 8GB
✅ Phi-3 (3.8B / Mini 128K)
مدل سبک ولی بسیار بهینه از Microsoft.
کاربردها: چت، خلاصهسازی، پردازش متن
ویژگیها: عملکرد عالی نسبت به سایز
سیستم پیشنهادی:
- RAM: 8GB
- VRAM: 4–6GB
✅ Mixtral 8x7B
مدل Mixture-of-Experts با قدرت بالا.
کاربردها: تحلیل پیشرفته، تولید محتوا حرفهای
ویژگیها: عملکرد نزدیک به مدلهای خیلی بزرگ با مصرف کمتر
سیستم پیشنهادی:
- RAM: 32GB
- VRAM: 24GB
✅ EmbeddingGemma
مدل مخصوص تولید embedding (نه چت).
کاربردها: جستجوی معنایی، RAG، دستهبندی متن
ویژگیها: مناسب بکاند و سیستمهای جستجو
سیستم پیشنهادی:
- RAM: 4GB
- GPU نیاز ندارد
✅ Qwen 2.5 Coder 0.5B
مدل بسیار سبک برای کدنویسی ساده.
کاربردها: autocomplete، کد ساده
ویژگیها: سریع و کممصرف
سیستم پیشنهادی:
- RAM: 4GB
- بدون GPU
✅ Qwen 2.5 Coder 1.5B
نسخه قویتر برای توسعه سبک.
کاربردها: تولید کد، اسکریپتنویسی
ویژگیها: تعادل سرعت و دقت
سیستم پیشنهادی:
- RAM: 8GB
- VRAM: 4GB
✅ Dorna PartAI
مدل بومی/سفارشی (احتمالاً فارسیمحور).
کاربردها: پردازش متن فارسی، چت
ویژگیها: بهینه برای زبان فارسی
سیستم پیشنهادی:
- RAM: 16GB
- VRAM: 8GB
✅ Dorna 2 - 8B
نسخه بهبود یافته مدل قبلی.
کاربردها: تولید محتوا فارسی، چت پیشرفته
ویژگیها: دقت بالاتر در زبان فارسی
سیستم پیشنهادی:
- RAM: 16GB
- VRAM: 8GB
✅ EmbeddingGemma (~0.5B پارامتر)
مدل embedding مبتنی بر معماری ترنسفورمر برای نگاشت متن به فضای برداری با دقت بالا در semantic similarity.
کاربردها: Semantic Search، RAG، Clustering، Recommendation
ویژگیها:
- بهینه برای تولید dense vector
- latency پایین در inference
- مناسب ایندکسگذاری دیتاستهای بزرگ
توضیح پارامتری: با ~500 میلیون پارامتر، تمرکز روی efficiency و کیفیت embedding است نه تولید متن
سیستم پیشنهادی:
RAM: 4GB
GPU: نیاز ندارد
✅ Qwen 2.5 Coder - 0.5B (~0.5B پارامتر)
مدل ultra-lightweight برای code completion مبتنی بر نسخه distilled از Qwen.
کاربردها: autocomplete، code suggestion سبک
ویژگیها:
- optimized برای low-latency coding tasks
- مناسب IDE integration
توضیح پارامتری: در مقیاس زیر 1B، قابلیت reasoning محدود ولی سرعت بسیار بالا دارد
سیستم پیشنهادی:
RAM: 4GB
GPU: نیاز ندارد
✅ Qwen 2.5 Coder - 1.5B (~1.5B پارامتر)
مدل coding-oriented با درک بهتر syntax و context نسبت به نسخه 0.5B.
کاربردها: code generation، refactoring
ویژگیها:
- درک بهتر dependency در کد
- مناسب پروژههای سبک تا متوسط
توضیح پارامتری: در محدوده 1–2B، تعادل بین سرعت و semantic understanding برقرار است
سیستم پیشنهادی:
RAM: 6GB
VRAM: 4GB
✅ Mixtral 8x7B (~56B MoE پارامتر)
مدل Mixture-of-Experts با 8 expert که در هر inference فقط بخشی از آن فعال میشود.
کاربردها: NLP پیشرفته، reasoning، coding
ویژگیها:
- throughput بالا نسبت به dense مدلها
- scaling بسیار کارآمد
توضیح پارامتری: اگرچه 56B پارامتر دارد، ولی active params بسیار کمتر است (MoE)، بنابراین هزینه inference پایینتر است
سیستم پیشنهادی:
RAM: 32GB+
VRAM: 16GB+
✅ Phi-3 14B (~14B پارامتر)
مدل dense بهینهشده با training dataset با کیفیت بالا.
کاربردها: reasoning، QA، coding
ویژگیها:
- performance بالا نسبت به سایز
- instruction-following قوی
توضیح پارامتری: در کلاس 10–15B، یکی از efficient ترین مدلها از نظر quality/compute ratio
سیستم پیشنهادی:
RAM: 16GB
VRAM: 10GB
✅ LLaVA 7B (~7B پارامتر + vision encoder)
مدل multimodal با اتصال vision encoder به LLM.
کاربردها: image captioning، visual QA
ویژگیها:
- قابلیت درک تصویر + متن
- مناسب کاربردهای سبک vision
توضیح پارامتری: backbone 7B + encoder تصویری → مصرف VRAM بالاتر نسبت به مدلهای pure text
سیستم پیشنهادی:
RAM: 12GB
VRAM: 8GB
✅ LLaVA 13B (~13B پارامتر)
نسخه دقیقتر برای multimodal reasoning.
کاربردها: تحلیل تصاویر پیچیده
ویژگیها:
- بهتر در spatial reasoning
- پاسخهای دقیقتر
توضیح پارامتری: در کلاس 13B، کیفیت vision-language بهمراتب بالاتر از 7B
سیستم پیشنهادی:
RAM: 20GB
VRAM: 12GB
✅ LLaVA 34B (~34B پارامتر)
مدل high-end برای visual reasoning.
کاربردها: تحلیل حرفهای تصویر
ویژگیها:
- توان بالا در context طولانی
- مناسب کاربردهای تحقیقاتی
توضیح پارامتری: در مقیاس 30B+، نیازمند منابع سنگین ولی خروجی بسیار دقیق
سیستم پیشنهادی:
RAM: 48GB+
VRAM: 24GB+
✅ Phi-4 14B (~14B پارامتر)
نسل جدید Phi با بهبود در reasoning depth.
کاربردها: تحلیل، reasoning، coding
ویژگیها:
- بهتر در multi-step reasoning
- instruction tuning قویتر
توضیح پارامتری: نسبت به Phi-3، بهبود در alignment و stability
سیستم پیشنهادی:
RAM: 16GB
VRAM: 10GB
✅ Dolphin 3 - 8B (~8B پارامتر)
مدل fine-tuned برای conversational AI.
کاربردها: چت، roleplay، تولید متن
ویژگیها:
- پاسخهای طبیعیتر
- alignment بهتر برای گفتگو
توضیح پارامتری: در کلاس 7–8B، مناسب inference سریع با کیفیت قابل قبول
سیستم پیشنهادی:
RAM: 12GB
VRAM: 8GB
✅ BGE-M3 (~567M پارامتر)
مدل embedding چندزبانه با دقت بالا.
کاربردها: retrieval، RAG، search
ویژگیها:
- multilingual
- state-of-the-art در embedding
توضیح پارامتری: زیر 1B ولی بسیار optimized برای semantic tasks
سیستم پیشنهادی:
RAM: 6GB
GPU: نیاز ندارد
✅ Mistral Nemo 12B (~12B پارامتر)
مدل general-purpose optimized.
کاربردها: تولید متن، چت
ویژگیها:
- throughput بالا
- memory efficient
توضیح پارامتری: در کلاس 10–12B، یکی از سریعترین مدلها
سیستم پیشنهادی:
RAM: 16GB
VRAM: 10GB
✅ DeepSeek Coder 6.7B (~6.7B پارامتر)
مدل تخصصی برنامهنویسی.
کاربردها: code generation، debugging
ویژگیها:
- training روی dataset کدنویسی
- درک syntax قوی
توضیح پارامتری: در کلاس زیر 10B، عملکرد بسیار خوب برای coding
سیستم پیشنهادی:
RAM: 12GB
VRAM: 8GB
✅ DeepSeek Coder 33B (~33B پارامتر)
مدل پیشرفته coding.
کاربردها: پروژههای پیچیده
ویژگیها:
- reasoning در کد
- پشتیبانی context بزرگ
توضیح پارامتری: در کلاس 30B، مناسب production-level development
سیستم پیشنهادی:
RAM: 32GB+
VRAM: 20GB+
✅ CodeGemma 2B (~2B)
مدل سبک coding → مناسب low-resource inference
RAM: 6GB | VRAM: 4GB
✅ CodeGemma 7B (~7B)
مدل coding متعادل با دقت بهتر
RAM: 12GB | VRAM: 8GB
✅ Falcon 3 (1B / 3B / 7B / 10B)
مدلهای general-purpose با scaling خطی کیفیت
- 1B: lightweight inference
- 10B: مناسب production سبک
RAM: 4 → 16GB | VRAM: 0 → 10GB
✅ LLaVA Llama3 8B (~8B multimodal)
نسخه جدیدتر vision + Llama3 backbone
→ بهتر در reasoning تصویری
✅ TranslateGemma (4B / 12B / 27B)
مدلهای تخصصی translation
- scaling مستقیم کیفیت ترجمه با افزایش پارامتر
- 27B نزدیک human-level
✅ QwQ 32B (~32B)
مدل reasoning-heavy
→ مناسب chain-of-thought و مسائل پیچیده
✅ Cogito (3B / 8B / 14B / 32B)
مدلهای general reasoning
→ هرچه پارامتر بالاتر → دقت تحلیل بیشتر
✅ Qwen 3.5 - 4B
یک مدل زبانی سبک و مدرن از خانواده Qwen که برای استفاده عمومی، چت، تولید محتوا، بازنویسی متن، خلاصهسازی و بسیاری از کارهای روزمره انتخاب مناسبی است. این مدل نسبت به مدلهای خیلی کوچک، درک زبانی بهتری دارد و در عین حال هنوز به اندازهای سبک است که روی سیستمهای میانرده هم قابل اجرا باشد.
کاربردها: چت روزمره، تولید متن، خلاصهسازی، ترجمه سبک، بازنویسی، پاسخگویی عمومی
ویژگیها:
- مدل عمومی با تعادل خوب بین کیفیت و سرعت
- درک مناسب از متنهای فارسی و انگلیسی
- مناسب برای استفادههای روزانه و پروژههای سبک
- latency پایینتر نسبت به مدلهای بزرگتر
توضیح پارامتری: با حدود 4 میلیارد پارامتر، این مدل در رده مدلهای سبک اما کاربردی قرار میگیرد؛ یعنی از مدلهای 1B و 2B بسیار قویتر است، اما هنوز هزینه اجرا و مصرف حافظه آن نسبتاً پایین باقی میماند.
سیستم پیشنهادی:
RAM: حداقل 8GB
VRAM: حداقل 6GB
CPU-only: بهتر است 12GB RAM یا بیشتر داشته باشید
✅ Qwen 3.5 - 9B
نسخه متعادلتر و جدیتر از Qwen 3.5 که برای کاربرانی مناسب است که کیفیت پاسخ، انسجام متن، درک بهتر سؤال و توانایی بیشتر در تحلیل را میخواهند، اما هنوز نمیخواهند وارد محدوده مدلهای خیلی سنگین شوند. این مدل برای بسیاری از کاربردهای واقعی، نقطه تعادل بسیار خوبی بین کیفیت و منابع مصرفی ایجاد میکند.
کاربردها: تولید محتوا، تحلیل متن، چت پیشرفته، کمک در برنامهنویسی، ترجمه، خلاصهسازی حرفهای
ویژگیها:
- کیفیت پاسخگویی بالاتر نسبت به نسخه 4B
- حفظ بهتر context و انسجام در پاسخهای طولانیتر
- مناسب برای کارهای نیمهحرفهای و استفاده مداوم
- توانایی بهتر در instruction following و reasoning سبک تا متوسط
توضیح پارامتری: با حدود 9 میلیارد پارامتر، این مدل وارد محدودهای میشود که در آن کیفیت خروجی بهطور محسوس از مدلهای کوچکتر بالاتر میرود. در این کلاس، مدل میتواند هم در تولید متن طبیعیتر عمل کند و هم در تحلیل و استدلال چندمرحلهای، پایداری بیشتری نشان دهد.
سیستم پیشنهادی:
RAM: حداقل 16GB
VRAM: حداقل 10GB
CPU-only: بهتر است 24GB RAM یا بیشتر داشته باشید
✅ Qwen 3.5 - 27B
یک مدل قدرتمند در کلاس 20B+ که برای کارهای سنگینتر، تحلیلهای عمیقتر، تولید متن با کیفیت بالا، استدلال بهتر، درک context طولانیتر و پاسخگویی دقیقتر طراحی شده است. این مدل برای کسانی مناسب است که میخواهند روی سیستم شخصی یا سرور محلی، به کیفیتی نزدیکتر به مدلهای تجاری بزرگ دست پیدا کنند.
کاربردها: تحلیل پیشرفته، تولید محتوای حرفهای، پاسخگویی دقیق، پژوهش، استدلال چندمرحلهای، کدنویسی عمومی
ویژگیها:
- کیفیت پاسخ بسیار بالاتر نسبت به نسخههای سبکتر
- انسجام بیشتر در مکالمه و متنهای طولانی
- مناسب برای کارهای تحلیلی و حرفهای
- عملکرد بهتر در reasoning، planning و پیروی از دستورهای پیچیدهتر
توضیح پارامتری: با حدود 27 میلیارد پارامتر، این مدل در رده مدلهای سنگین local قرار میگیرد. در این مقیاس، مدل معمولاً درک عمیقتری از رابطه بین مفاهیم، ساختار سؤال و جزئیات دستور دارد و برای کارهای جدیتر، خروجی پایدارتر و دقیقتری ارائه میدهد.
سیستم پیشنهادی:
RAM: حداقل 32GB
VRAM: حداقل 20GB
CPU-only: بهتر است 48GB RAM یا بیشتر داشته باشید
✅ Qwen 3.5 - 35B
بزرگترین نسخه این خانواده در لیست شما و مناسب کاربرانی است که بیشترین کیفیت ممکن را از بین نسخههای Qwen 3.5 میخواهند. این مدل برای سناریوهای حرفهایتر، تحلیلهای پیچیده، تولید متن با دقت بالا، پاسخگویی چندمرحلهای، پژوهش، و کارهایی که به درک بهتر context و ساختار منطقی نیاز دارند، انتخاب بسیار قدرتمندی است.
کاربردها: تحلیل عمیق، تولید متن حرفهای، پاسخگویی دقیق، reasoning پیشرفته، کمک در پژوهش و برنامهنویسی
ویژگیها:
- قویترین نسخه Qwen 3.5 در این لیست
- دقت بیشتر در پاسخهای پیچیده و چندمرحلهای
- درک بهتر context طولانی و ارتباط بین بخشهای مختلف سؤال
- مناسب برای استفاده حرفهای و workloadهای سنگین
توضیح پارامتری: با حدود 35 میلیارد پارامتر، این مدل در کلاس مدلهای بزرگ قرار میگیرد و معمولاً از نظر کیفیت خروجی، استحکام reasoning و توانایی مدیریت درخواستهای پیچیده، بهمراتب بالاتر از نسخههای 4B و 9B عمل میکند. البته در مقابل، مصرف حافظه و نیاز سختافزاری آن نیز بهطور محسوسی بیشتر است.
سیستم پیشنهادی:
RAM: حداقل 48GB
VRAM: حداقل 24GB
CPU-only: بهتر است 64GB RAM یا بیشتر داشته باشید
انتخاب مدل برای تازه کارها
برای کارهای عمومی روزمره روی سیستم متوسط DeepSeek-R1 8B گزینه خوبی است.
برای برنامه نویسی Qwen3-Coder 30B خیلی عالیه. اگه روی سیستمتون اجرا نمیشه میتونید از نسخه های سبک تر مثل ... استفاده کنید.
برای نیازهای سازمانی یا اینکه اگه سیستم خیلی قوی دارید GPT-OSS 120B خیلی قوی است. این مدل شبیه ترین به چت جی پی تی است. (البته در حد اون نیست.) نسخه متوسط این مدل GPT-OSS 20B است.
به طور کلی هیچ کدوم از مدل ها فارسیشون مثل چت جی پی تی یا جمنای خوب نیست ولی برای خیلی از کارها میشه ازشون استفاده کرد.
در صورتی که نیاز به فایل، پلاگین یا داکیومنت غیر مرتبط به Ollama دارید، می توانید در این صفحه مطرح کنید:
دانلود داکیومنت آفلاین کتابخانه ها و درخواست فایل
اگر در زمینه راهاندازی و اجرای مدلهای تولید تصویر تجربه کافی دارید، از شما دعوت میکنیم در فرآیند تست، بهینهسازی و راهاندازی این مدلها با ما همکاری کنید:
دانلود ComfyUI - ساخت عکس با هوش مصنوعی (آفلاین)
جهت گفتگو و پرسش و پاسخ در این زمینه وارد انجمن شوید:
انجمن تخصصی گیت
(تاپیک اختصاصی برنامه Ollama)
📦 دانلود ریپازیتوریهای گیتهاب
جستجوگر کد گیت راه اندازی شد. میتونید به هزاران ریپازیتوری گیتهاب دسترسی داشته باشید، اونها رو بررسی کنید و بهسادگی دانلودشون کنید.
برای ثبت دیدگاه وارد حساب کاربری خود شوید.