ITCB + Loox Meetup — 2026

סוכנים מקומיים חינמיים

עם Claude Code, Ollama ו-OpenRouter

Claude Code Ollama LLM Agents OpenRouter
Alex Komanov
ITCB

מה זה LLM?

  • תוכנת AI שלמדה ממאות מיליוני טקסטים באינטרנט
  • למדה דפוסים: איך נראה קוד טוב, איך כותבים מייל, מה הפתרון לבאג
  • שואלים אותה שאלה ← היא מיישמת את כל מה שלמדה ← תשובה שימושית
  • כמו מומחה שקרא הכל — ויכול לעזור לך עכשיו
  • דוגמאות: GPT-4, Claude, Llama, Gemma, Qwen

ארכיטקטורה בסיסית

טקסט
קלט
🧠 AI
למד מכל האינטרנט
טקסט
פלט

מה זה Agent (סוכן)?

  • LLM שיכול לבצע פעולות בעולם האמיתי
  • לא רק עונה על שאלות — עושה דברים!
  • כלים (Tools): קריאת קבצים, כתיבת קוד, גלישה באינטרנט, API calls
  • לולאה אינסופית: חשיבה ← פעולה ← תצפית
  • יכול לבצע עשרות פעולות ברצף ללא פיקוח

מחזור Agent

🧠
Think חשיבה
Act פעולה
👁️
Observe תצפית
חוזר לתחילה

הלולאה חוזרת עד להשלמת המשימה

למה להשתמש ב-Agents?

🧩

אוטונומיה מלאה

מפרקים משימות גדולות לתתי-משימות, פותרים שלב אחר שלב ומתאימים את דרך הפעולה בהתאם למה שקורה.

⚙️

ביצוע פעולות אמיתיות

בניגוד לצ'אט — הסוכן יכול לשלוח דוא"ל, לעדכן CRM, להזמין שירותים ולחייג למספרי טלפון.

זמינות ומהירות

זמינים 24/7 (כשהמחשב דולק), מספקים מענה עקבי ומצמצמים פעילויות תפעוליות בעלות ערך נמוך.

🔗

אינטגרציה מערכתית

מתחברים לבסיסי נתונים ולתוכנות ארגוניות דרך APIs כדי לבצע עבודה שוטפת באופן אוטומטי.

Claude Code

  • CLI tool רשמי של Anthropic
  • Agent מלא לפיתוח תוכנה — לא רק צ'אט
  • קורא, כותב, ומריץ קוד בעצמו
  • מבין את הפרויקט כולו — לא רק קובץ אחד
  • משתמש ב-Extended Thinking לבעיות מורכבות
  • מחיר: $20/חודש — Pro plan

זמין על:

macOS Windows 🐧 Linux

$20 לחודש יכולים לחסוך
עשרות שעות עבודה אנושית בחודש

Claude Code — Skills, Plugins & Agents

Skills

הוראות שמגדירות איך Claude גישה למשימה — קובץ .md שמופעל עם /skill-name. דוגמאות: /brainstorming, /tdd, /ultrareview

🔌

Plugins

חבילות של skills מוכנות — plug & play. מהחנות הרשמית: claude.ai/plugins. התקנה: /install-plugin. הפופולרי: superpowers (עשרות skills מובנים)

🤖

Agents

סוכני-משנה שClaude מפעיל במקביל — כל agent עם תפקיד, כלים ופרומפט משלו. יצירה: claude /agents או קובץ .md ב-~/.claude/agents/

Ollama — Run AI Locally for Free

  • כלי open-source להרצת AI מקומי
  • אין עלות! רץ על המחשב שלך
  • תומך בעשרות מודלים: Llama, Qwen ועוד
  • תומך בכלים: Claude Code, Codex ועוד

זמין על:

macOS Windows 🐧 Linux

הורדה והרצה:

ollama pull qwen3:1.7b ollama run qwen3:1.7b

איך מחברים Ollama ל-Claude Code?

1
Download a model
Choose a model from the Ollama library
2
One command to start

הדרך הקלה ביותר

# Step 1: download a model ollama pull qwen3.5 # Step 2: launch Claude Code with Ollama ollama launch claude

או ידנית:

export ANTHROPIC_AUTH_TOKEN=ollama
export ANTHROPIC_BASE_URL=http://localhost:11434
claude --model qwen3.5

מודלים בענן — שתי אפשרויות

🦙

Ollama Cloud (Native)

מריץ מודלים ענקיים בענן של Ollama עצמו — אינטגרציה מובנית, ללא הגדרות API

מודלים:

Qwen3.5:cloud, DeepSeek 671B, GPT OSS 120B

מגבלות Free:

GPU-time — מתאפסת כל 5 שעות + מגבלה כל 7 ימים

אחרי Free:

Pro — $20/חודש (מודלי Qwen cloud ו-DeepSeek 671B דורשים $20 גם ללא הגעה למכסה)

🌐

OpenRouter.ai

גישה לעשרות מודלים חינמיים דרך API אחד — תואם OpenAI, ללא הורדות

מודלים:

Llama 3.3 70B, DeepSeek R1, GPT OSS 120B

מגבלות Free:

50 בקשות/יום ללא תשלום

אחרי Free:

$10 credit = 1,000 בקשות/יום

מגבלות RAM של מודלים מקומיים

גודל מודל RAM נדרש רמה
1B 1–2 GB 🔸 בסיסית
4B 3–4 GB 🔸 בסיסית
8B ✓ 5–6 GB 🔶 סבירה
14B 9–11 GB 🔶 סבירה
32B 18–20 GB ⭐ טובה
70B 40–50 GB ⭐⭐ טובה מאוד

ה-B מייצג מיליארד פרמטרים — כמה "תאי מוח" יש למודל. ככל שהמספר גדול יותר, המודל חכם יותר — אך דורש יותר RAM.

מה לפטופ ביתי יכול להריץ?

8GB
לפטופ בסיסי
מודלים עד 4B בלבד
Llama 3.2 3B, Gemma 2 2B
16GB
לפטופ רגיל
מודלים עד 14B
Llama 3.2 8B, Qwen 2.5 14B
✓ מספיק לפיתוח קל
32GB
לפטופ מקצועי
מודלים עד 32B
DeepSeek 32B, Qwen 32B
64GB
מחשב חזק
מודלים עד 70B
Llama 3.3 70B, Qwen 70B

ככל שה-RAM גדול יותר — כך חוויית הפיתוח המקומית טובה יותר. אבל RAM גדול = לפטופ יקר יותר.

Three Distinct Tiers

DeepSeek R1 (1.5B)

Distilled from massive models — Ollama's king. Advanced reasoning on consumer hardware. Only 2GB in RAM.

Qwen 2.5 (27B)

The mid-tier standard. Vast knowledge base running on a powerful laptop. Perfect balance between cost and performance.

Claude 4 Opus

The gold standard. Anthropic's flagship cloud model. Unmatched at solving complex tasks and research.

כמה טוב המודל כותב קוד אמיתי?

% באגים אמיתיים שנפתרו (SWE-bench Verified)  ·  💻 = מקומי  ·  ☁ = ענן

ביצוע משימות פיתוח אמיתיות

SWE-bench Verified — אמת המידה הסטנדרטית לכתיבת קוד.
נותנים למודל באג אמיתי מ-GitHub עם כל הקוד הרלוונטי.
שאלה: האם הפאץ' שנכתב עובר את כל בדיקות הפרויקט?
500 בעיות אמיתיות · דורש הבנת codebase גדול

DeepSeek R1 1.5B 💻 הצלחות נדירות — בעיות פשוטות מאוד בלבד
6%
Qwen 2.5 27B 💻 כ-1 מ-4 משימות — שימושי לתיקונים יומיומיים
27%
Claude Opus 4 ☁ מוביל עולמי — פותר 72% מהבאגים בפועל
72%

למה הפער כל כך גדול?

SWE-bench דורש הבנת codebase שלם — עשרות קבצים ותלויות. מודל 1.5B לא יכול להחזיק את כל ההקשר הזה.

מה זה אומר בפועל?

Qwen 27B מצליח ב-~27% מהבאגים. Claude Opus 4 — לפרויקטים מורכבים עם 72% הצלחה.

כמה טוב המודל מנהל משימה ארוכה?

% פרויקטים שהסתיימו בהצלחה (הערכה)  ·  💻 = מקומי  ·  ☁ = ענן

ניהול Agent עם משימה ארוכה

משימת Agent בהקשר ארוך — הבדיקה האמיתית לפיתוח יומיומי.
ה-Agent מבצע 20+ פעולות ברצף:
קרא קבצים ← כתוב קוד ← הרץ tests ← תקן שגיאות ← commit.
כמה % מהפרויקטים הגיעו לסוף בהצלחה?

DeepSeek R1 1.5B 💻 מאבד הקשר אחרי 3-4 פעולות
~5%
Qwen 2.5 27B 💻 מסתבך באמצע — מצליח כ-1 מ-3 מקרים
~30%
Claude Opus 4 ☁ מחזיק הקשר שעות — עובד ללא הפסקה
~72%

למה מודל קטן נכשל?

בכל שלב ה-Agent חייב לזכור מה כבר עשה ומה נשאר. מודל 1.5B "שוכח" את ההיסטוריה אחרי כמה שלבים.

מה זה אומר בפועל?

Qwen 27B מצליח ב-~30% מהמשימות. Claude Opus 4 — לפרויקטים שלוקחים שעות.

💀

DeepSeek 780B דורש 500GB+ RAM...
הלפטופ שלך יש לו 16GB
זה לא הולך לעבוד

למה לא 70B/780B על לפטופ?

  • מודל 70B = ~40GB RAM — לפטופ 16GB לא יכול לטעון אותו
  • מודל 780B (DeepSeek R1 Full) = 500GB+ RAM — בלתי אפשרי על כל לפטופ
  • 780B הוא המודל הפתוח החזק ביותר בעולם — איכות דומה ל-Claude Opus
  • פתרון: ענן — Ollama Cloud ו-OpenRouter מריצים 70B–780B, אך מוגבלים ב-free tier. ללא מגבלות: $20/חודש

שרת עם 512GB+ RAM להריץ DeepSeek 780B

~$10,000+

workstation מינימלי — ועדיין לא מספיק מהיר

vs

Claude Pro בענן

$20/חודש

$10,000 ÷ $20 = 500 חודשים = 41 שנה של Claude Pro

מתי כדאי לשלם $20 לחודש?

✅ כן, שווה לשלם

פרויקט מורכב ורציני
Claude Opus 4 עובד שעות ללא הפסקה
נתקעת בבאג שמודל מקומי לא פותר
פותר בעיות מורכבות שמודלים קטנים לא יכולים
שימוש כמה פעמים ביום
$20 לחודש = פחות מכוס קפה ביום

⏳ לא עכשיו

ניסיון ראשון עם AI
התחל עם מודל 4-8B מקומי, למד, ואז תחליט
פרויקט בסיסי / Hobby
מודל Qwen 27B מספיק ל-27% מהמשימות, בחינם
שימוש לעיתים רחוקות
Free tier של Ollama Cloud / OpenRouter מספיק
🎬

וידאו עם הדגמה

פתח ב־Google Drive
?
?
?
?
?

שאלות?

תודה!

Geek Of Automation

YouTube

1 / 20