PODCAST · news
Open-R1: Replica di un modello AI
by Fabio Musicco
Open-R1: Replica di un modello AI "a scatola nera"
-
3
majorana1
Il Majorana 1 è il primo processore quantistico al mondo basato su qubit topologici, progettato per essere scalabile fino a un milione di qubit su un singolo chip. Questa innovazione potrebbe permettere ai computer quantistici di risolvere problemi complessi in settori come la crittografia dei dati, la scoperta di nuovi farmaci e la scienza dei materiali. Nonostante la tecnologia sia ancora in fase di sviluppo e non immediatamente disponibile per applicazioni commerciali, Microsoft prevede che questi potenti computer quantistici saranno pronti per l'uso pratico entro pochi anni, anziché decenni.
-
2
DeepSeek R1_ La Rivoluzione dell'IA Cinese
Una analisi su DeepSeek, una startup cinese di intelligenza artificiale. Si concentra sull'impatto di DeepSeek R1, un nuovo chatbot, sui mercati azionari, in particolare su Nvidia, a causa delle sue prestazioni superiori e del basso costo computazionale rispetto a modelli simili come ChatGPT. Il video presenta confronti di benchmark, discute delle tecnologie utilizzate da DeepSeek e offre istruzioni su come provare il chatbot. Infine, si accenna anche al generatore di immagini Janus Pro 7B sviluppato dalla stessa azienda.
-
1
Open-R1_ Replica di un modello AI _a scatola nera
Con l'ausilio di NotebookLM, ho realizzato questo podcast. ecco la Timeline degli Eventi PrincipaliDeepSeek rilascia il suo modello di intelligenza artificiale (IA) "R1", un modello di ragionamento che ottiene ottimi risultati nei benchmark, e lo rende accessibile attraverso una chatbot app che scala rapidamente le classifiche dell'App Store di Apple.Poco dopo il rilascio di R1: Ricercatori di Hugging Face avviano il progetto "Open-R1", con l'obiettivo di replicare il modello R1 da zero, rendendone tutti i componenti open source, inclusi i dati di training.In corso (al momento della stesura dell'articolo): Il progetto Open-R1 raccoglie 10.000 "stelle" su GitHub in soli tre giorni. Il team di Hugging Face utilizza il proprio cluster di ricerca "Science Cluster" (768 GPU Nvidia H100) per generare dataset simili a quelli usati da DeepSeek. Il team sta anche sollecitando la partecipazione della community di IA e tech per la costruzione della pipeline di training.Futuro (prossime settimane): L'obiettivo del progetto Open-R1 è di replicare completamente R1 in poche settimane.Futuro (se il progetto ha successo): I ricercatori IA potranno usare la pipeline di training per sviluppare la prossima generazione di modelli di ragionamento open source. La replica di R1 permetterà a chiunque con accesso a GPU di creare la propria versione di R1 con i propri dati.17 luglio 2025: TechCrunch All Stage si terrà a Boston, MA.Cast dei Personaggi PrincipaliLeandro von Werra: Capo della ricerca presso Hugging Face. È uno dei leader del progetto Open-R1 e sottolinea l'importanza del lavoro di comunità per replicare R1.Elie Bakouch: Ingegnere di Hugging Face che lavora al progetto Open-R1. Sottolinea la necessità di trasparenza e controllo nel training dei modelli, evidenziando come sia fondamentale "aprire la scatola nera" di R1. Crede nei benefici dell'open source in ambito IA, nonostante i potenziali rischi.Team di Ingegneri di Hugging Face: Insieme a von Werra e Bakouch, partecipano attivamente al progetto Open-R1. Il loro obiettivo è replicare R1 e renderlo open source.DeepSeek: Laboratorio di IA cinese supportato da un hedge fund quantitativo. Ha sviluppato e rilasciato il modello di ragionamento R1, che ha ottenuto ottimi risultati. Sono criticate per la poca trasparenza sul processo di creazione di R1.OpenAI: Azienda che ha rilasciato il modello di ragionamento "o1", utilizzato come termine di paragone per la valutazione delle prestazioni di R1..
We're indexing this podcast's transcripts for the first time — this can take a minute or two. We'll show results as soon as they're ready.
No matches for "" in this podcast's transcripts.
No topics indexed yet for this podcast.
Loading reviews...
ABOUT THIS SHOW
Open-R1: Replica di un modello AI "a scatola nera"
HOSTED BY
Fabio Musicco
CATEGORIES
Loading similar podcasts...