ITCB + Loox Meetup — 2026
עם Claude Code, Ollama ו-OpenRouter
ארכיטקטורה בסיסית
מחזור Agent
הלולאה חוזרת עד להשלמת המשימה
מפרקים משימות גדולות לתתי-משימות, פותרים שלב אחר שלב ומתאימים את דרך הפעולה בהתאם למה שקורה.
בניגוד לצ'אט — הסוכן יכול לשלוח דוא"ל, לעדכן CRM, להזמין שירותים ולחייג למספרי טלפון.
זמינים 24/7 (כשהמחשב דולק), מספקים מענה עקבי ומצמצמים פעילויות תפעוליות בעלות ערך נמוך.
מתחברים לבסיסי נתונים ולתוכנות ארגוניות דרך APIs כדי לבצע עבודה שוטפת באופן אוטומטי.
זמין על:
$20 לחודש יכולים לחסוך
עשרות שעות עבודה אנושית בחודש
Skills
הוראות שמגדירות איך Claude גישה למשימה — קובץ .md שמופעל עם /skill-name. דוגמאות: /brainstorming, /tdd, /ultrareview
Plugins
חבילות של skills מוכנות — plug & play. מהחנות הרשמית: claude.ai/plugins. התקנה: /install-plugin. הפופולרי: superpowers (עשרות skills מובנים)
Agents
סוכני-משנה שClaude מפעיל במקביל — כל agent עם תפקיד, כלים ופרומפט משלו. יצירה: claude /agents או קובץ .md ב-~/.claude/agents/
זמין על:
הורדה והרצה:
הדרך הקלה ביותר
או ידנית:
מריץ מודלים ענקיים בענן של Ollama עצמו — אינטגרציה מובנית, ללא הגדרות API
מודלים:
Qwen3.5:cloud, DeepSeek 671B, GPT OSS 120B
מגבלות Free:
GPU-time — מתאפסת כל 5 שעות + מגבלה כל 7 ימים
אחרי Free:
Pro — $20/חודש (מודלי Qwen cloud ו-DeepSeek 671B דורשים $20 גם ללא הגעה למכסה)
גישה לעשרות מודלים חינמיים דרך API אחד — תואם OpenAI, ללא הורדות
מודלים:
Llama 3.3 70B, DeepSeek R1, GPT OSS 120B
מגבלות Free:
50 בקשות/יום ללא תשלום
אחרי Free:
$10 credit = 1,000 בקשות/יום
| גודל מודל | RAM נדרש | רמה |
|---|---|---|
| 1B | 1–2 GB | 🔸 בסיסית |
| 4B | 3–4 GB | 🔸 בסיסית |
| 8B ✓ | 5–6 GB | 🔶 סבירה |
| 14B | 9–11 GB | 🔶 סבירה |
| 32B | 18–20 GB | ⭐ טובה |
| 70B | 40–50 GB | ⭐⭐ טובה מאוד |
ה-B מייצג מיליארד פרמטרים — כמה "תאי מוח" יש למודל. ככל שהמספר גדול יותר, המודל חכם יותר — אך דורש יותר RAM.
ככל שה-RAM גדול יותר — כך חוויית הפיתוח המקומית טובה יותר. אבל RAM גדול = לפטופ יקר יותר.
Distilled from massive models — Ollama's king. Advanced reasoning on consumer hardware. Only 2GB in RAM.
The mid-tier standard. Vast knowledge base running on a powerful laptop. Perfect balance between cost and performance.
The gold standard. Anthropic's flagship cloud model. Unmatched at solving complex tasks and research.
% באגים אמיתיים שנפתרו (SWE-bench Verified) · 💻 = מקומי · ☁ = ענן
ביצוע משימות פיתוח אמיתיות
SWE-bench Verified — אמת המידה הסטנדרטית לכתיבת קוד.
נותנים למודל באג אמיתי מ-GitHub עם כל הקוד הרלוונטי.
שאלה: האם הפאץ' שנכתב עובר את כל בדיקות הפרויקט?
500 בעיות אמיתיות · דורש הבנת codebase גדול
למה הפער כל כך גדול?
SWE-bench דורש הבנת codebase שלם — עשרות קבצים ותלויות. מודל 1.5B לא יכול להחזיק את כל ההקשר הזה.
מה זה אומר בפועל?
Qwen 27B מצליח ב-~27% מהבאגים. Claude Opus 4 — לפרויקטים מורכבים עם 72% הצלחה.
% פרויקטים שהסתיימו בהצלחה (הערכה) · 💻 = מקומי · ☁ = ענן
ניהול Agent עם משימה ארוכה
משימת Agent בהקשר ארוך — הבדיקה האמיתית לפיתוח יומיומי.
ה-Agent מבצע 20+ פעולות ברצף:
קרא קבצים ← כתוב קוד ← הרץ tests ← תקן שגיאות ← commit.
כמה % מהפרויקטים הגיעו לסוף בהצלחה?
למה מודל קטן נכשל?
בכל שלב ה-Agent חייב לזכור מה כבר עשה ומה נשאר. מודל 1.5B "שוכח" את ההיסטוריה אחרי כמה שלבים.
מה זה אומר בפועל?
Qwen 27B מצליח ב-~30% מהמשימות. Claude Opus 4 — לפרויקטים שלוקחים שעות.
DeepSeek 780B דורש 500GB+ RAM...
הלפטופ שלך יש לו 16GB
זה לא הולך לעבוד
שרת עם 512GB+ RAM להריץ DeepSeek 780B
~$10,000+
workstation מינימלי — ועדיין לא מספיק מהיר
Claude Pro בענן
$20/חודש
$10,000 ÷ $20 = 500 חודשים = 41 שנה של Claude Pro
✅ כן, שווה לשלם
⏳ לא עכשיו
Geek Of Automation
YouTube