#80- Layer pruning e Mixture of Depths.

from Vida com IA · host Filipe Lauar

Fala galera, continuando a serie de episódios sobre PEFT, nesse episoódio eu falo sobre tecnicas de otimização de inferência em LLMs. Eu falo de layer pruning, onde a gente corta algumas camadas consecutivas da rede sem perder quase nada de qualidade do modelo. Eu falo também sobre Mixture of Depths, uma tecnica semelhante ao Mixture of Experts, onde a gente usa um routing pra escolher quais tokens vão ser processados em qual camada da rede. Paper MoD: https://arxiv.org/pdf/2404.02258.pdf Paper layer pruning: https://arxiv.org/pdf/2403.17887v1.pdf Instagram do podcast: https://www.instagram.com/podcast.lifewithai Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

Episode metadata supplied by the publisher feed · Published Apr 18, 2024

Embed this episode

Attribution link and audio player

NOW PLAYING

#80- Layer pruning e Mixture of Depths.

0:00 15:12

1×

No transcript for this episode yet

We transcribe on demand. Request one and we'll notify you when it's ready — usually under 10 minutes.

Share this episode

Similar Episodes

No similar episodes found.

Similar Podcasts

No similar podcasts found.

Frequently Asked Questions

How long is this episode of Vida com IA?

This episode is 15 minutes long.

When was this Vida com IA episode published?

This episode was published on April 18, 2024.

Can I download this Vida com IA episode?

Yes. Use the download control on the episode player to save the publisher-provided media file.

URL copied to clipboard!