اصل ماجرا
مقاله راهنمای گامبه‑گام برای ساخت یک زنجیرهٔ عاملمحور محلی با استفاده از مدل Gemma 4 26B MoE، سرویس Ollama و ابزار Claude Code ارائه میدهد. با تنظیمات خاص Modelfile برای افزایش پنجرهٔ زمینه و کاهش دما، و پیکربندی تنظیمات Claude Code برای اتصال به سرور محلی، میتوانید بدون هزینهٔ توکن و محدودیتهای ابری، کد را بخوانید، ویرایش کنید و تستها را اجرا کنید. همچنین اسکریپت تأیید صحت عملکرد کل استک و نکات رفع اشکال ارائه شده است.
متن کامل ترجمهشده
برنامه نویسی ارگانیک محلی در قیمت ارزان: Claude Code + Ollama + Gemma4 این مقاله یک مجموعه کامل برنامه نویسی ارگانیک محلی را با استفاده از Ollama، Gemma 4 و Claude Code ایجاد می کند. # معرفی این را تصور کنید: یک فرآیند کار چند ارگانیک که فایل ها را می خواند، پازل ها را می نویسد، تست ها را اجرا می کند و در چهار سرویس تکرار می کند، 400 تماس API را در یک بعدازظهر انجام می دهد. آگهی می آید. شما دوباره محدودیت نرم را عبور کرده اید. هر تیکن هزینه می کند، هر پیشنهاد کد مالکیت خود را به سرور شخص ثالث می فرستد، و محدودیت های نرخ را از جلسات طولانی متوقف می کند - تنها راه حل پرداخت بیشتر است. Gemma 4 26B MoE تنها 3.8 میلیارد از پارامترهای 26 میلیارد خود رااین یک ارتقاء کوچک نیست. این تفاوت بین یک مدل است که نمی تواند به طور قابل اطمینان ابزار را بخواند و یکی است که می تواند یک حلقه عامل Claude Code را اجرا کند بدون اینکه به طور مداوم پارامترهای تماس عملکرد خود را خراب کند. این مقاله مجموعه ای کامل را ایجاد می کند: Ollama به خدمت Gemma 4 به صورت محلی، مدل فایل که از شکست های پنجره زمینه در جلسات عامل جلوگیری می کند، settings.json که Claude Code را به نقطه پایانی محلی حمل می کند، یک اسکرین تاییداتی است که تمام کار را قبل از استفاده از آن در کد واقعی تایید می کند، و یک بررسی صادقانه از آنچه را شکست می دهد و چگونه آن را اصلاح می کند. ناظران مهندسانی هستند که در حال حاضر درک می کنند که مدل های بزرگ زبان (MLLs) چیست و چه هزینه های عامل موثر است. هیچ دست دست در پایه های26B MoE از 128 متخصص کوچک استفاده می کند و تنها 8 در هر تیکن و یک متخصص مشترک را فعال می کند، با ارائه تقریبا 31B کیفیت با هزینه های رایانه ای بسیار پایین تر. نسخه های پیشین Gemma از یک مجوز شخصی گوگل با محدودیت های استفاده تجاری به اندازه کافی متفاوتی استفاده می کردند که تیم های حقوقی شرکت ها به طور معمول آن را به عنوان یک بلاک کننده نشان می دادند. Gemma 4 Apache 2.0 است، اولین برای خانواده Gemma. اگر تیم شما می خواهد این را در ابزار داخلی نصب کنید، محصولات خود را بر روی آن حمل کنید، یا آن را در خطوط تولید بدون بررسی قانونی اجرا کنید، که مسائل را به صورت عملی تغییر می دهد. // شماره هایی که در مورد آژانس های رمزنگاری اهمیت دارد // نیازهای هاردویر قبل از کشیدن یک مدل 18 گیگابایت، بدانید که شما واقعا با چه کار می کنید.14.0+ for Anthropic Messages API support # The Anthropic-compatible endpoint was added in January 2026 ollama version # Expected: ollama version is 0.22.x or higher (as of May 2026) # Windows: download the native installer from https://ollama.com # WSL2 is recommended if you want GPU passthrough on Windows After installation, Ollama starts as a background service on port 11434. Verify it is up: curl URL_1� # Expected response: Ollama is running Step 2: Pull Gemma 4 # The 26B MoE — recommended for this setup (~18 GB download) ollama pull gemma4:26b # While you wait, confirm the download is progressing ollama ps # Shows currently downloading or running models # Optional: also pull the 31B for comparison on capable hardware ollama pullmajs 18 یا نسخه بعد از آن # تایید کنید که شما در 18+ # نصب Claude Code CLI در سراسر جهان npm نصب -g @anthropic-ai/claude-code # بررسی کلمه نصب —version با Ollama در حال اجرا و Gemma 4 کشیده شده است، هیجان طبیعی بعدی این است که متغیرهای محیطی را صادر کنید و بلافاصله Claude Code را شروع کنید. # پنجره متغیر متغیر مدل Ollama برای Gemma 4 4 tokens 4K است. پنجره متغیر واقعی Gemma 4 128K–256K است. که متغیر 4K یک پیشنهاد نیست - این همان چیزی است که Ollama از آن استفاده خواهد کرد، مگر اینکه شما آن را برگردانید. در یک جلسه عامل Claude Code که فایل های منبع را می خواند، تاریخ بحث را نگه می دارد و نتایج تماس ابزار را در طی چندین حرکت نگه می دارد،این فایل به طور ناگهانی بر روی یک نگاه نامناسب از فایل کار می کند و به طور جزئی درست محصول را تولید می کند که از زیر جریان می کشد. اصلاح یک فایل مدل است که اندازه معادله صحیح و سایر پارامترهای استدلال را به یک نسخه مدل نامیده می شود. این فایل را ایجاد کنید: # ~/.ollama/Modelfiles/gemma4-claude # Gemma 4 26B MoE متغیر برای برنامه های عامل Claude Code متغیر شده است. # Bakes پنجره معادله، دمای و سیستم متغیر به مدل # بنابراین هر جلسه Claude Code با تنظیم درست آغاز می شود. # # با: # mkdir - ~/.pollama/Modelfiles # ollama ایجاد gemma4-claude -f ~/.ollama/Modelfiles/maclaude FROM gemma4:26b # پنجره معادله — 65PARAMETER num_ctx 65536 # درجه حرارت — 0.2 برای رمزنگاری عامل به طور عمدتا پایین است. # درجه حرارت بالاتر در پارامتر تماس ابزار # شکل گیری تغییر را معرفی می کند که باعث می شود که پارامتر ابزار کلود کد تماس را رد کند. # برای وظایف خلاقانه، شما این را بالاتر تنظیم می کنید. برای حلقه های عامل: پایین. پارامتر درجه حرارت 0.2 # top_p — سطوح نمونه گیری هسته ای. 0.9 تولید تمرکز می کند # در حالی که اجتناب از حلقه های تکراری است که top_p=1.0 می تواند در # جلسات عامل طولانی تولید کند. PARAMETER top_p 0.9 # repeat_penalty - مدل را برای تکرار تیک ها مجاز می کند. # 1.15 کمک می کند تا از حلقه های تماس ابزار جلوگیری کند که Gemma 4PARAMETER num_predict 4096 # System prompt — reinforces coding agent behavior and explicit # tool use discipline. Gemma 4 مزایای یادآوری به # commit to tool calls rather than describing what it would do. SYSTEM """You are a senior software engineer operating as a coding agent. When working with code: - Read files before editing them. Never assume file contents. - Make one focused change at a time and verify it before proceeding. - When a tool call fails, examine the error carefully before retrying. Do not retry with identical parameters. Diagnose first. - Prefer surgical edits over full rewrites. - Run tests after each meaningful change, not after a batch of changes. - If you are unsure about the code base structure, read more files rather thanollama/Modelfiles # Save the Modelfile content from above to this path, then build: ollama create gemma4-claude -f ~/.ollama/Modelfiles/gemma4-claude # Verify the variant was created ollama list # Should show gemma4-claude alongside gemma4:26b # Quick smoke test — verify it loads and answers ollama run gemma4-claude “What is the time complexity of binary search and why?” # Expect a clear, concise technical response within a few seconds # Wiring Claude Code to the Local Model With the model variant built, the configuration layer connects Claude Code to Ollama.با استفاده از مسیر /v1 اشتباهات تصدیق یا رفتار غیر منتظره را ایجاد می کند. // Global Settings — ~/.claude/settings.json این تنظیمات برای هر جلسه Claude Code در تمام پروژه ها اعمال می شود. این انتخاب درست است مگر اینکه شما بین مدل های محلی و ابر به طور مرتب در هر پروژه تغییر دهید. { “env”: { “ANTHROPIC_DEFAULT_SON_MODEL”: “�URL_0”: “ANTHROPIC_DEFAULT_IKHAU_TOKEN”: “ollama”, “ANTHROPIC_API_KEY”: "", “ANTHROPIC_DULT_MODEL”: “gemma4-claude”, “ANTHROPIC_DEFAULT_SON_NETMODEL”: “gem4-maclaude”, “ANTHROPIC_DEFAULT_IKHA- ANTHROPIC_API_KEY: "" آشکارا کلید را خالی می کند تا Claude Code نمی تواند به کلید واقعی Anthropic API برگردد اگر یکی اتفاق می افتد که در محیط حفره شما نصب می شود. بدون این، یک ANTHROPIC_BASE_URLmight اشتباه تنظیم می شود به API پرداخت می شود. - ANTHROPIC_MODEL نام مدل اصلی Claude Code می فرستد در درخواست ها است. این را به متغیر Modelfile شخصی خود را تنظیم کنید, gemma4-claudenotgemma4:26b. برچسب مدل خام نمی تواند پنجره زمینه را فراگیر کند. - ANTHROPIC_DEFAULT_SONNET_MODEL، ANTHROPIC_DEFAULT_HAUIK_MODEL، و ANTHROPIC_DEFAULT_OPUS_MODEL: Claudeبرای پروژه هایی که میخواهید این سرنوشت ها را از تنظیمات جهانی خود جدا کنید – ذخیره های خصوصی، پایگاه های کد حساس یا پروژه هایی که نیاز به مدل خاصی دارند – از یک فایل تنظیمات پروژه استفاده کنید: # در پروژه شما root mkdir -p .claude cat > .claude/settings.json << ‘EOF’ { “env”: { “ANTHROPIC_BASE_URL”: “�URL_0”; “ANTHROPIC_AUTH_TOKEN”: “ollama”, “ANTHROPIC_API_KEY”: “ANTHROPIC_MODEL”: “ma4-claude”, “HRANTIC_DULT_SON_claude”: “ma4-claude”, “ma-claude1 re-OPUS_HRANT_HRANT_DIC_DAL-level”, “CODE-CODEJSON اگر وجود دارد، تنظیمات جهانی برای این پروژه را افزایش می دهد. .claude/settings.json را به .gitignore خود اضافه کنید اگر تنظیمات شامل چیزی است که مربوط به محیطی است، یا آن را انجام دهید اگر شما می خواهید تمام تیم در حال اجرا اختراع محلی در مورد این پروژه است. // بررسی نصب قبل از اجرا Claude Code بر خلاف یک پایگاه کد واقعی، سه چیز را بررسی کنید: Ollama به درستی خدمت می کند، مدل به تماس های API در فرمت پیام های Anthropic پاسخ می دهد، و ابزار تماس به طور خاص کار می کند. نقطه سوم غیر قابل مذاکره است: تماس ابزار این است که چگونه Claude Code فایل ها را می خواند، پلتفرم ها را می نویسد و فرمان ها را اجرا می کند. یک مدل که نمی تواند تماس های ابزار را به درستی شکل بگیرد و در وظایف عامل اساسی شکست می کند. ضروریات:صفحه اصلی » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون ها » آیفون هابه عنوان مثال در این مقاله می توانیم به این مطلب اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مقاله می توانیم به این نکته اشاره کنیم که در این مطلببه گزارش ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا، به نقل از ایسنا.
[…]
چرا مهمه؟
این راهنما تغییر اساسی در نحوهٔ استفادهٔ مهندسان نرمافزار از مدلهای زبانی ایجاد میکند: دیگر نیازی به پرداخت هزینهٔ توکن یا مواجهه با محدودیتهای APIهای ابری نیست. تیمهای توسعه که به حریمخصوصی کدهای خود اهمیت میدهند یا در محیطهای محدود منابع کار میکنند، میتوانند با این استک محلی به سرعت و با هزینهٔ صفر وظایف خودکارسازی کد را انجام دهند. خواننده باید این خبر را جدی بگیرد چون میتواند هزینههای عملیاتی را کاهش داده، وابستگی به سرویسهای خارجی را به حداقل برساند و سرعت چرخهٔ توسعه را ارتقا دهد.
به درد کی میخوره؟
• مهندسان نرمافزار و تیمهای DevOps • شرکتهای فناوری با محدودیتهای امنیتی • توسعهدهندگان ابزارهای خودکارسازی کد • مدیران فنی که به کاهش هزینهٔ زیرساختهای ابری علاقهمندند
نظر Blue IT News
Blue IT News توصیه میکند قبل از مهاجرت کامل به این استک، یک پروژهٔ کوچک را بهعنوان آزمون بکار ببندید تا از سازگاری ابزارها با زیرساختهای موجود اطمینان حاصل کنید.
<div class=“disclosure”> این صفحه ترجمه و تفسیر کاملی از گزارش اصلی Kdnuggets است که توسط تیم تحریریه بلو آی تی نیوز به فارسی ترجمه و تحلیل شده. برای مشاهده نسخه اصلی، به منبع مراجعه کنید. </div>