EPISODE · Apr 16, 2023 · 20 MIN
[36] על התאוריה של Replay Buffer עם שירלי די קסטרו שעשוע
from ExplAInable · host Tamir Nave, Mike Erlihson, Uri Goren, Hila Paz Herszfang
פרק נוסף בתחום הלמידה החיזוקית, הפעם צוללים לפרטים הטכניים עם התאוריה מאחורי Replay Bufferסוכן, יכול ללמוד רק מהפעולות שלו - מה שנקראOn Policyאו למידה גם מפעולות של סוכנים אחרים, מה שנקראOff Policyבגישת הריפליי באפר, שומרים "הקלטה" של פעולות עבר ותוצאות עבר - ודוגמים מתוכן לצרכי הלמידה.שירלי תספר לנו על המחקר שלה לגבי השפעת גודל הבאפר, והשיפור בתוצאות של אימוני מודליRL
What this episode covers
פרק נוסף בתחום הלמידה החיזוקית, הפעם צוללים לפרטים הטכניים עם התאוריה מאחורי Replay Bufferסוכן, יכול ללמוד רק מהפעולות שלו - מה שנקראOn Policyאו למידה גם מפעולות של סוכנים אחרים, מה שנקראOff Policyבגישת הריפליי באפר, שומרים "הקלטה" של פעולות עבר ותוצאות עבר - ודוגמים מתוכן לצרכי הלמידה.שירלי תספר לנו על המחקר שלה לגבי השפעת גודל הבאפר, והשיפור בתוצאות של אימוני מודליRL
NOW PLAYING
[36] על התאוריה של Replay Buffer עם שירלי די קסטרו שעשוע
No transcript for this episode yet
Similar Episodes
May 3, 2026 ·24m
Apr 26, 2026 ·21m
Apr 19, 2026 ·11m
Apr 12, 2026 ·17m