Alibaba lancia Qwen3 sfidando i colossi dell’AI
Scopri Qwen3, la nuova famiglia di modelli linguistici di Alibaba con supporto per 119 lingue, architettura ibrida e prestazioni competitive.
/https://www.ilsoftware.it/app/uploads/2024/04/RAG-intelligenza-artificiale-RAGFlow.jpg)
La nuova famiglia di modelli linguistici avanzati Qwen3, lanciata da Alibaba, rappresenta un punto di svolta nell’evoluzione dell’Intelligenza Artificiale.
Con un range di parametri che spazia da 600 milioni a 235 miliardi, questa innovativa collezione si distingue per le sue prestazioni all’avanguardia e la capacità di adattarsi a diverse esigenze computazionali.
La linea Qwen3 include otto modelli: sei Dense e due basati sull’architettura MoE (Mixture of Experts). Tra questi, il modello di punta è il Qwen3-235B-A22B, che con i suoi 235 miliardi di parametri totali e 22 miliardi attivi, si posiziona come un concorrente diretto di modelli leader come DeepSeek-R1 e Gemini-2.5-Pro. I test sui benchmark AI più impegnativi, dalla programmazione alla matematica avanzata, hanno confermato la sua superiorità tecnica rispetto alla concorrenza.
Qwen3 supporta ben 119 lingue e dialetti
Una delle caratteristiche più distintive della famiglia Qwen3 è la sua architettura ibrida, che permette di alternare tra due modalità operative: la modalità “pensiero” per affrontare problemi complessi e la modalità “rapida” per risposte immediate. Gli utenti possono passare da una modalità all’altra semplicemente utilizzando i comandi da prompt “/think” e “/no_think“.
L’addestramento di questi modelli ha coinvolto un impressionante volume di dati, con oltre 36 trilioni di token elaborati, garantendo una conoscenza ampia e approfondita. Tra i modelli resi disponibili al pubblico, spicca il Qwen3-32B, che ha superato OpenAI o1 in benchmark come LiveCodeBench. Anche i modelli più compatti, come il Qwen3-4B, offrono prestazioni paragonabili a modelli di dimensioni maggiori della generazione precedente.
Per favorire l’accesso e l’adozione, Alibaba ha reso i modelli disponibili su piattaforme popolari come Hugging Face e ModelScope. Inoltre, l’integrazione con strumenti come Ollama, LM Studio e llama.cpp semplifica l’uso locale, sia per la ricerca che per applicazioni produttive.
Un altro elemento di forza della famiglia Qwen3 è il supporto multilingue, che comprende ben 119 lingue e dialetti, dal cinese al giapponese, fino a molte lingue europee e asiatiche. Questa caratteristica rende i modelli estremamente versatili per applicazioni globali.