Creare un'AI Locale con Ollama e LLaMA: Installazione e Interfaccia Web in Docker -

In questa guida aggiornata scopriremo come installare l’ultima versione di Ollama con LLaMA 3 su Ubuntu Server 24.04, utilizzabile sia su macchine con GPU che senza. Ti mostreremo anche come configurare un’interfaccia web moderna tramite Docker, ispirata a ChatGPT, per interagire con i modelli localmente e gratuitamente.

Questa soluzione è ideale per chi vuole avere una AI locale open source, senza costi e senza dipendere da servizi cloud esterni. Può essere usata per progetti personali, sviluppo software, testing di prompt, e perfino come assistente aziendale interno.

Cosa sono Ollama e LLaMA?

Ollama è uno strumento open source per eseguire modelli di linguaggio localmente, supporta molte architetture tra cui LLaMA, Mistral, Gemma, GPT-J ecc. È semplice da usare e funziona sia con GPU che con CPU.

Requisiti

Installazione su Windows

Se vuoi usare Ollama su Windows 10/11, puoi installarlo facilmente seguendo questi passaggi:

Vai su: https://ollama.com/download
Scarica l’installer per Windows (.exe)
Avvia l’installazione e segui la procedura guidata

Una volta installato, puoi aprire il terminale PowerShell o Prompt dei comandi e lanciare:

ollama run llama

Ollama funzionerà anche su Windows senza GPU, ma con prestazioni ridotte rispetto all’uso su Linux con CUDA.

Ubuntu Server 24.04 LTS (con o senza GPU)
Accesso sudo/root
Connessione a Internet

1. Installare Ollama su Ubuntu 24.04

Passaggi comuni (valido per CPU o GPU):

curl -fsSL https://ollama.com/install.sh | sh

Poi attiva il servizio:

sudo systemctl enable ollama
sudo systemctl start ollama

Verifica che funzioni:

ollama --version

2. Avviare LLaMA 3

Scarica e avvia l’ultima versione disponibile di LLaMA 3:

ollama run llama3
```bash
ollama run llama3

Ollama scaricherà automaticamente il modello ottimizzato (versione leggera). Per usare una versione specifica:

ollama pull llama3:8b-instruct-q4_K_M

3. Installare la Web App in Docker

Invece di usare ollama-webui, puoi installare Open WebUI, una delle interfacce più complete per Ollama. Supporta:

Upload e riassunto di documenti (PDF, TXT)
Chat multilingua
Selezione modelli e configurazione avanzata
Interfaccia utente moderna in stile ChatGPT

Installazione con Docker:

Assicurati di avere Docker installato:

sudo apt install docker.io docker-compose -y

Poi esegui:

git clone https://github.com/open-webui/open-webui.git
cd open-webui
sudo docker compose up -d

Controlla il container:

docker ps

Log:

docker logs -f open-webui

Ferma il servizio:

sudo docker compose down

La web UI sarà disponibile su:

http://localhost:3000

Oppure su http://<IP-server>:3000 da remoto.

http://localhost:3000

(Oppure l’IP della macchina server)

4. Aggiungere altri modelli (Deepseek, GPT-J, Mistral…)

Puoi scaricare modelli alternativi così:

ollama pull deepseek-coder:6.7b
ollama pull mistral
ollama pull gemma

Poi eseguirli:

ollama run deepseek-coder

Dalla web UI puoi selezionare quale modello usare.

5. Utilizzare l’interfaccia Web in stile ChatGPT

Una volta avviata la web app:

Apri il browser su http://<IP-server>:3000
L’interfaccia è ispirata a ChatGPT: una chat a due colonne con i messaggi utente e le risposte del modello ben separati in stile conversazionale.
Seleziona il modello da un menu a tendina (es. llama3, deepseek-coder, mistral, ecc.)
Inserisci i tuoi prompt nella casella in basso e premi invio per interagire

La web app supporta:

Conversazioni con contesto
Impostazione parametri come temperatura, top_k, max tokens
Cronologia delle chat
Tema scuro/chiaro

Questo la rende ideale anche per utenti non tecnici, offrendo un’esperienza simile a ChatGPT ma completamente locale e privata.

Puoi gestire:

temperature e parametri
storici delle conversazioni
avvio e spegnimento dei modelli

6. Modalità CPU vs GPU

Ollama rileva automaticamente la presenza di GPU (NVIDIA via CUDA). Se non presente, userà la CPU. Le prestazioni saranno inferiori ma funzionali per test.

Per GPU AMD o alternative: supporto in fase di sviluppo tramite ROCm.

7. Esempi prompt

Come posso installare un server web Apache su Ubuntu?
Scrivimi uno script bash che monitora l'uso della CPU
Spiega il concetto di rete VPN in parole semplici

8. Note di sicurezza

Ollama è pensato per uso locale, ma aprendo la porta pubblicamente potresti esporre l’interfaccia. Usa proxy e firewall.
Per ambienti multiutente considera un reverse proxy (es. traefik o nginx).

9. Conclusione

Grazie a Ollama puoi eseguire LLM come LLaMA 3 direttamente sulla tua macchina Linux, anche senza GPU, con una semplice interfaccia web. Ideale per testare, sperimentare o creare tool personalizzati nel tuo ambiente.

Disclaimer: Questa guida ha solo scopo informativo ed educativo. Usare LLM localmente implica responsabilità nell’utilizzo e nella gestione dei dati trattati.

Recensioni e consigli

Blog
Recensioni, guide e approfondimenti su tecnologia, open source, server Linux e infrastrutture IT. Dalla workstation al data center.

Clicca qui

Diventare Sistemista – Parte 2: Switch e Segmentazione della Rete con le VLAN

Una rete ben progettata non è solo questione di collegamenti fisici, ma anche (e soprattutto) di organizzazione logica. In questo ...

Diventare Sistemista – Parte 1: Le Reti, il Cuore dell’Infrastruttura IT

Quando si parla di sistemistica, le reti sono il fondamento su cui poggia tutta l'infrastruttura IT. In questa prima tappa ...

Diventare Sistemista Informatico: Chi è, Cosa Fa e Come Iniziare il Percorso

Il sistemista informatico è una figura chiave all’interno di qualsiasi struttura IT moderna. È colui che garantisce il corretto funzionamento ...

Warp Terminal per Windows: il Terminale Moderno per l’Help Desk Aziendale

Nel contesto di un Help Desk aziendale, l’efficienza degli strumenti a disposizione fa spesso la differenza tra una risoluzione rapida ...

Creare un’AI Locale con Ollama e LLaMA: Installazione e Interfaccia Web in Docker

In questa guida aggiornata scopriremo come installare l'ultima versione di Ollama con LLaMA 3 su Ubuntu Server 24.04, utilizzabile sia ...

Windows 11: ora l’Account Microsoft è OBBLIGATORIO! Ecco come aggirare il blocco

Con l’ultimo aggiornamento destinato agli utenti del programma Windows Insider, Microsoft ha rimosso uno degli escamotage più usati per evitare ...

Wazuh: Sicurezza Open Source per tutti i Server

Nel panorama attuale della cybersecurity, le aziende devono affrontare minacce sempre più sofisticate. In questo contesto, Wazuh si afferma come ...

Cloud Sovrano

La Nuova Frontiera della Sicurezza e Sovranità Digitale per le Aziende Europee Nel contesto attuale, caratterizzato da una crescente attenzione ...

Green IT: Sostenibilità Digitale e Riduzione dell’Impatto Ambientale

Nel panorama informatico odierno, sempre più aziende e professionisti si interrogano su come coniugare l’innovazione tecnologica con il rispetto per ...

Come Guadagnano Coloro che Forniscono Software Open Source?

Quando si parla di software open source, spesso si pensa a un modello basato sulla condivisione gratuita del codice sorgente ...

Low-Code No-Code: La Rivoluzione dello Sviluppo Software alla Portata di Tutti

Lo sviluppo software è tradizionalmente considerato un ambito riservato a programmatori esperti, ma negli ultimi anni un nuovo trend sta ...

GNU e la Rivoluzione del Software Libero: Storia e Filosofia

La nascita di GNU e la filosofia del software libero rappresentano uno spartiacque importante nella storia dell’informatica. Tutto ha inizio ...

Servizi Sistemistici

Nel blog troverai anche contenuti dedicati alla gestione di ambienti server Linux e Windows, con articoli su installazione, configurazione, manutenzione ordinaria e troubleshooting.
Affronterò temi legati all’infrastruttura IT aziendale, come la progettazione e la gestione di reti complesse, includendo firewall, VPN, VLAN, segmentazione della rete e sicurezza informatica.
Uno spazio pensato per condividere esperienze pratiche, soluzioni tecniche e best practice utili a professionisti, tecnici e appassionati del settore.