Ingegneria dell’Inferenza - S2P12 episode artwork

EPISODE · Apr 16, 2026 · 7 MIN

Ingegneria dell’Inferenza - S2P12

from Generazione Futuro: dialoghi con e sull'IA - Stagione 2 · host Recomb

In questo episodio esploriamo il dato che sta rivoluzionando silenziosamente il mondo dell'AI: quasi il 90% dei costi operativi non riguarda più l'addestramento dei modelli, ma la loro esecuzione quotidiana, ovvero l'inferenza. Se l'addestramento è paragonabile alla costruzione di un motore di Formula 1, l'inferenza è il carburante necessario per ogni singolo giro di pista.Analizziamo nel dettaglio l'ingegneria dell'inferenza, una disciplina emergente che punta a rendere l'innovazione tecnologica sostenibile ed efficiente. Scopriamo i segreti dello stack di inferenza e le tecniche che stanno facendo la differenza, dalla quantizzazione alla gestione intelligente della memoria con PagedAttention. Discutiamo inoltre l'impatto economico di queste scelte e i due possibili scenari futuri: un'AI centralizzata nelle mani di pochi giganti o una democratizzazione tecnologica che porta modelli potentissimi direttamente sui nostri dispositivi. Un viaggio tra bit e hardware per capire perché oggi la vera sfida non è più solo creare modelli più grandi, ma imparare a farli scorrere alla massima velocità.Tag: AI, ingegneria dell'inferenza, efficienza computazionale, ottimizzazione software, futuro dell'AI, GPU, innovazione tecnologica, sostenibilità digitale, hardware, tecnologia

In questo episodio esploriamo il dato che sta rivoluzionando silenziosamente il mondo dell'AI: quasi il 90% dei costi operativi non riguarda più l'addestramento dei modelli, ma la loro esecuzione quotidiana, ovvero l'inferenza. Se l'addestramento è paragonabile alla costruzione di un motore di Formula 1, l'inferenza è il carburante necessario per ogni singolo giro di pista.Analizziamo nel dettaglio l'ingegneria dell'inferenza, una disciplina emergente che punta a rendere l'innovazione tecnologica sostenibile ed efficiente. Scopriamo i segreti dello stack di inferenza e le tecniche che stanno facendo la differenza, dalla quantizzazione alla gestione intelligente della memoria con PagedAttention. Discutiamo inoltre l'impatto economico di queste scelte e i due possibili scenari futuri: un'AI centralizzata nelle mani di pochi giganti o una democratizzazione tecnologica che porta modelli potentissimi direttamente sui nostri dispositivi. Un viaggio tra bit e hardware per capire perché oggi la vera sfida non è più solo creare modelli più grandi, ma imparare a farli scorrere alla massima velocità.Tag: AI, ingegneria dell'inferenza, efficienza computazionale, ottimizzazione software, futuro dell'AI, GPU, innovazione tecnologica, sostenibilità digitale, hardware, tecnologia

NOW PLAYING

Ingegneria dell’Inferenza - S2P12

0:00 7:24

No transcript for this episode yet

We transcribe on demand. Request one and we'll notify you when it's ready — usually under 10 minutes.

いろはにマネーの「ながら学習」 IrohaniMoney この番組では、インターン生2人が、金融、経済、投資関連の気になる情報を分かりやすくお伝えしていきます。インターン生の会話を「ながら聴き」する感覚で一緒に勉強していきましょう!ご意見箱フォーム:https://forms.gle/TTGaVP2TJksNMKJo7ぜひお便りや感想をお待ちしています!公式X:https://x.com/irohanimoney番組のハッシュタグは「#いろはにながら」です。番組への感想をお待ちしています!いろはにマネー:https://www.bridge-salon.jp/money/姉妹サイト:https://kabu.bridge-salon.jp/姉妹サイト:https://bridge-salon.jp/(株)インベストメントブリッジ運営 French Your Way Jessica: Native French teacher founder of French Your Way Boost your French listening skills and test your comprehension with this one of a kind series of podcasts. Get the chance to listen to a real conversation between native speakers talking at normal speed AND customise your learning experience through carefully designed sets of questions (2 levels of difficulty) available for download at www.frenchvoicespodcast.com. All interviews also come with the transcript. French teacher Jessica interviews native speakers of French from around the world who share a bit of their life and passion. Where else would you meet in one same place a French yoga teacher based in Melbourne, a soap manufacturer from Provence, or a couple cycling around the world? 2 Old Ladies Walking Rozee 2 Old Ladies Walking features the journeys, insights, and light conversation between Liz and Rosie, two women of a certain age who live in the Hudson Valley of New York. From pelvic floor challenges and life with young adult children to food, bird calls, fear of “mad lamb” disease, and myriad topics in between, we cover it all while walking on the scenic trails of the northeast, or wherever our travels take us. Join us and have a listen! TV 2 - Veien til EM TV 2 og Moderne Media Velkommen til TV 2's EM podkast. Dette er tidenes første EM-podkast fra TV 2. I dagene før kamper skal Jesper Mathisen, Jan-Henrik Børslid og Espen Solbakken m/gjester lade opp. God fornøyelse! For annonsering: [email protected] booking: [email protected]

Frequently Asked Questions

How long is this episode of Generazione Futuro: dialoghi con e sull'IA - Stagione 2?

This episode is 7 minutes long.

When was this Generazione Futuro: dialoghi con e sull'IA - Stagione 2 episode published?

This episode was published on April 16, 2026.

What is this episode about?

In questo episodio esploriamo il dato che sta rivoluzionando silenziosamente il mondo dell'AI: quasi il 90% dei costi operativi non riguarda più l'addestramento dei modelli, ma la loro esecuzione quotidiana, ovvero l'inferenza. Se l'addestramento è...

Can I download this Generazione Futuro: dialoghi con e sull'IA - Stagione 2 episode?

Yes, you can download this episode by clicking the download button on the episode player, or subscribe to the podcast in your preferred podcast app for automatic downloads.
URL copied to clipboard!