ITCB + Loox Meetup — 2026

סוכנים מקומיים חינמיים

עם Claude Code, Ollama ו-OpenRouter

Claude Code Ollama LLM Agents OpenRouter

Alex Komanov

מה זה LLM?

תוכנת AI שלמדה ממאות מיליוני טקסטים באינטרנט
למדה דפוסים: איך נראה קוד טוב, איך כותבים מייל, מה הפתרון לבאג
שואלים אותה שאלה ← היא מיישמת את כל מה שלמדה ← תשובה שימושית
כמו מומחה שקרא הכל — ויכול לעזור לך עכשיו
דוגמאות: GPT-4, Claude, Llama, Gemma, Qwen

ארכיטקטורה בסיסית

טקסט
קלט

→

🧠 AI
למד מכל האינטרנט

→

טקסט
פלט

מה זה Agent (סוכן)?

LLM שיכול לבצע פעולות בעולם האמיתי
לא רק עונה על שאלות — עושה דברים!
כלים (Tools): קריאת קבצים, כתיבת קוד, גלישה באינטרנט, API calls
לולאה אינסופית: חשיבה ← פעולה ← תצפית
יכול לבצע עשרות פעולות ברצף ללא פיקוח

מחזור Agent

🧠

Think חשיבה

←

⚡

Act פעולה

←

👁️

Observe תצפית

חוזר לתחילה

הלולאה חוזרת עד להשלמת המשימה

למה להשתמש ב-Agents?

🧩

אוטונומיה מלאה

מפרקים משימות גדולות לתתי-משימות, פותרים שלב אחר שלב ומתאימים את דרך הפעולה בהתאם למה שקורה.

⚙️

ביצוע פעולות אמיתיות

בניגוד לצ'אט — הסוכן יכול לשלוח דוא"ל, לעדכן CRM, להזמין שירותים ולחייג למספרי טלפון.

⏰

זמינות ומהירות

זמינים 24/7 (כשהמחשב דולק), מספקים מענה עקבי ומצמצמים פעילויות תפעוליות בעלות ערך נמוך.

🔗

אינטגרציה מערכתית

מתחברים לבסיסי נתונים ולתוכנות ארגוניות דרך APIs כדי לבצע עבודה שוטפת באופן אוטומטי.

Claude Code

CLI tool רשמי של Anthropic
Agent מלא לפיתוח תוכנה — לא רק צ'אט
קורא, כותב, ומריץ קוד בעצמו
מבין את הפרויקט כולו — לא רק קובץ אחד
משתמש ב-Extended Thinking לבעיות מורכבות
מחיר: $20/חודש — Pro plan

זמין על:

macOS Windows 🐧 Linux

$20 לחודש יכולים לחסוך
עשרות שעות עבודה אנושית בחודש

Claude Code — Skills, Plugins & Agents

⚡

Skills

הוראות שמגדירות איך Claude גישה למשימה — קובץ .md שמופעל עם /skill-name. דוגמאות: /brainstorming, /tdd, /ultrareview

🔌

Plugins

חבילות של skills מוכנות — plug & play. מהחנות הרשמית: claude.ai/plugins. התקנה: /install-plugin. הפופולרי: superpowers (עשרות skills מובנים)

🤖

Agents

סוכני-משנה שClaude מפעיל במקביל — כל agent עם תפקיד, כלים ופרומפט משלו. יצירה: claude /agents או קובץ .md ב-~/.claude/agents/

Ollama — Run AI Locally for Free

כלי open-source להרצת AI מקומי
אין עלות! רץ על המחשב שלך
תומך בעשרות מודלים: Llama, Qwen ועוד
תומך בכלים: Claude Code, Codex ועוד

זמין על:

macOS Windows 🐧 Linux

הורדה והרצה:

ollama pull qwen3:1.7b
ollama run qwen3:1.7b
          

איך מחברים Ollama ל-Claude Code?

1

Download a model
Choose a model from the Ollama library

2

One command to start

הדרך הקלה ביותר

# Step 1: download a model
ollama pull qwen3.5

# Step 2: launch Claude Code with Ollama
ollama launch claude
          

או ידנית:

export ANTHROPIC_AUTH_TOKEN=ollama
export ANTHROPIC_BASE_URL=http://localhost:11434
claude --model qwen3.5

מודלים בענן — שתי אפשרויות

🦙

Ollama Cloud (Native)

מריץ מודלים ענקיים בענן של Ollama עצמו — אינטגרציה מובנית, ללא הגדרות API

מודלים:

Qwen3.5:cloud, DeepSeek 671B, GPT OSS 120B

מגבלות Free:

GPU-time — מתאפסת כל 5 שעות + מגבלה כל 7 ימים

אחרי Free:

Pro — $20/חודש (מודלי Qwen cloud ו-DeepSeek 671B דורשים $20 גם ללא הגעה למכסה)

🌐

OpenRouter.ai

גישה לעשרות מודלים חינמיים דרך API אחד — תואם OpenAI, ללא הורדות

מודלים:

Llama 3.3 70B, DeepSeek R1, GPT OSS 120B

מגבלות Free:

50 בקשות/יום ללא תשלום

אחרי Free:

$10 credit = 1,000 בקשות/יום

מגבלות RAM של מודלים מקומיים

גודל מודל	RAM נדרש	רמה
1B	1–2 GB	🔸 בסיסית
4B	3–4 GB	🔸 בסיסית
8B ✓	5–6 GB	🔶 סבירה
14B	9–11 GB	🔶 סבירה
32B	18–20 GB	⭐ טובה
70B	40–50 GB	⭐⭐ טובה מאוד

ה-B מייצג מיליארד פרמטרים — כמה "תאי מוח" יש למודל. ככל שהמספר גדול יותר, המודל חכם יותר — אך דורש יותר RAM.

מה לפטופ ביתי יכול להריץ?

8GB

לפטופ בסיסי

מודלים עד 4B בלבד
Llama 3.2 3B, Gemma 2 2B

16GB

לפטופ רגיל

מודלים עד 14B
Llama 3.2 8B, Qwen 2.5 14B

✓ מספיק לפיתוח קל

32GB

לפטופ מקצועי

מודלים עד 32B
DeepSeek 32B, Qwen 32B

64GB

מחשב חזק

מודלים עד 70B
Llama 3.3 70B, Qwen 70B

ככל שה-RAM גדול יותר — כך חוויית הפיתוח המקומית טובה יותר. אבל RAM גדול = לפטופ יקר יותר.

Three Distinct Tiers

DeepSeek R1 (1.5B)

Distilled from massive models — Ollama's king. Advanced reasoning on consumer hardware. Only 2GB in RAM.

Qwen 2.5 (27B)

The mid-tier standard. Vast knowledge base running on a powerful laptop. Perfect balance between cost and performance.

Claude 4 Opus

The gold standard. Anthropic's flagship cloud model. Unmatched at solving complex tasks and research.

כמה טוב המודל כותב קוד אמיתי?

% באגים אמיתיים שנפתרו (SWE-bench Verified) · 💻 = מקומי · ☁ = ענן

ביצוע משימות פיתוח אמיתיות

SWE-bench Verified — אמת המידה הסטנדרטית לכתיבת קוד.
נותנים למודל באג אמיתי מ-GitHub עם כל הקוד הרלוונטי.
שאלה: האם הפאץ' שנכתב עובר את כל בדיקות הפרויקט?
500 בעיות אמיתיות · דורש הבנת codebase גדול

DeepSeek R1 1.5B 💻 הצלחות נדירות — בעיות פשוטות מאוד בלבד

6%

Qwen 2.5 27B 💻 כ-1 מ-4 משימות — שימושי לתיקונים יומיומיים

27%

Claude Opus 4 ☁ מוביל עולמי — פותר 72% מהבאגים בפועל

72%

למה הפער כל כך גדול?

SWE-bench דורש הבנת codebase שלם — עשרות קבצים ותלויות. מודל 1.5B לא יכול להחזיק את כל ההקשר הזה.

מה זה אומר בפועל?

Qwen 27B מצליח ב-~27% מהבאגים. Claude Opus 4 — לפרויקטים מורכבים עם 72% הצלחה.

כמה טוב המודל מנהל משימה ארוכה?

% פרויקטים שהסתיימו בהצלחה (הערכה) · 💻 = מקומי · ☁ = ענן

ניהול Agent עם משימה ארוכה

משימת Agent בהקשר ארוך — הבדיקה האמיתית לפיתוח יומיומי.
ה-Agent מבצע 20+ פעולות ברצף:
קרא קבצים ← כתוב קוד ← הרץ tests ← תקן שגיאות ← commit.
כמה % מהפרויקטים הגיעו לסוף בהצלחה?

DeepSeek R1 1.5B 💻 מאבד הקשר אחרי 3-4 פעולות

~5%

Qwen 2.5 27B 💻 מסתבך באמצע — מצליח כ-1 מ-3 מקרים

~30%

Claude Opus 4 ☁ מחזיק הקשר שעות — עובד ללא הפסקה

~72%

למה מודל קטן נכשל?

בכל שלב ה-Agent חייב לזכור מה כבר עשה ומה נשאר. מודל 1.5B "שוכח" את ההיסטוריה אחרי כמה שלבים.

מה זה אומר בפועל?

Qwen 27B מצליח ב-~30% מהמשימות. Claude Opus 4 — לפרויקטים שלוקחים שעות.

💀

DeepSeek 780B דורש 500GB+ RAM...
הלפטופ שלך יש לו 16GB
זה לא הולך לעבוד

למה לא 70B/780B על לפטופ?

מודל 70B = ~40GB RAM — לפטופ 16GB לא יכול לטעון אותו
מודל 780B (DeepSeek R1 Full) = 500GB+ RAM — בלתי אפשרי על כל לפטופ
780B הוא המודל הפתוח החזק ביותר בעולם — איכות דומה ל-Claude Opus
פתרון: ענן — Ollama Cloud ו-OpenRouter מריצים 70B–780B, אך מוגבלים ב-free tier. ללא מגבלות: $20/חודש

שרת עם 512GB+ RAM להריץ DeepSeek 780B

~$10,000+

workstation מינימלי — ועדיין לא מספיק מהיר

vs

Claude Pro בענן

$20/חודש

$10,000 ÷ $20 = 500 חודשים = 41 שנה של Claude Pro

מתי כדאי לשלם $20 לחודש?

✅ כן, שווה לשלם

פרויקט מורכב ורציני

Claude Opus 4 עובד שעות ללא הפסקה

נתקעת בבאג שמודל מקומי לא פותר

פותר בעיות מורכבות שמודלים קטנים לא יכולים

שימוש כמה פעמים ביום

$20 לחודש = פחות מכוס קפה ביום

⏳ לא עכשיו

ניסיון ראשון עם AI

התחל עם מודל 4-8B מקומי, למד, ואז תחליט

פרויקט בסיסי / Hobby

מודל Qwen 27B מספיק ל-27% מהמשימות, בחינם

שימוש לעיתים רחוקות

Free tier של Ollama Cloud / OpenRouter מספיק

🎬

וידאו עם הדגמה

פתח ב־Google Drive

?

שאלות?

תודה!

Geek Of Automation

YouTube