EPISODE · Jun 13, 2024 · 13 MIN
#84- FineWeb, o melhor dataset pra pre-treinar LLMs.
from Vida com IA · host Filipe Lauar
Fala galera, nesse episódio do podcast eu falo sobre o dataset FineWeb, o melhor dataset open source de pre-treinamento existente até hoje. No episódio eu explico como eles fizeram a curadoria do dataset e um pouco dos resultados.Link pro grupo do whatsapp: https://chat.whatsapp.com/KJBSOV4IbHKIWmKudYiCehLink do blog da huggingface: https://huggingface.co/spaces/HuggingFaceFW/blogpost-fineweb-v1Instagram do podcast: https://www.instagram.com/podcast.lifewithaiLinkedin do podcast: https://www.linkedin.com/company/life-with-ai
What this episode covers
Fala galera, nesse episódio do podcast eu falo sobre o dataset FineWeb, o melhor dataset open source de pre-treinamento existente até hoje. No episódio eu explico como eles fizeram a curadoria do dataset e um pouco dos resultados.Link pro grupo do whatsapp: https://chat.whatsapp.com/KJBSOV4IbHKIWmKudYiCehLink do blog da huggingface: https://huggingface.co/spaces/HuggingFaceFW/blogpost-fineweb-v1Instagram do podcast: https://www.instagram.com/podcast.lifewithaiLinkedin do podcast: https://www.linkedin.com/company/life-with-ai
NOW PLAYING
#84- FineWeb, o melhor dataset pra pre-treinar LLMs.
No transcript for this episode yet
Similar Episodes
No similar episodes found.