EPISODE · Jun 13, 2023 · 55 MIN
[39] על למידה חיזוקית באימון מודלי שפה RLHF עם מייק
from ExplAInable · host Tamir Nave, Mike Erlihson, Uri Goren, Hila Paz Herszfang
קשה לעבור ברחוב היום בלי לשמוע מישהו מספר לחברו על צ'אט ג'י פי טי אוLLMאחד החידושים באימון שלו, למעשה בInstructGPTהיו השימוש בלמידה חיזוקית על בסיס דאטא מתויג אנושי בתהליך הדגימהנספר על אלגוריתם הRLHFושילובו בתוך מודלי השפהLLM
What this episode covers
קשה לעבור ברחוב היום בלי לשמוע מישהו מספר לחברו על צ'אט ג'י פי טי אוLLMאחד החידושים באימון שלו, למעשה בInstructGPTהיו השימוש בלמידה חיזוקית על בסיס דאטא מתויג אנושי בתהליך הדגימהנספר על אלגוריתם הRLHFושילובו בתוך מודלי השפהLLM
NOW PLAYING
[39] על למידה חיזוקית באימון מודלי שפה RLHF עם מייק
No transcript for this episode yet
Similar Episodes
Jun 28, 2026 ·20m
Jun 21, 2026 ·106m
Jun 21, 2026 ·23m
Jun 21, 2026 ·27m
Jun 21, 2026 ·17m