DeepSeek R1 auf dem Raspberry Pi 5 deployen –...

I. Vorbereitung

Raspberry Pi 5: 8 GB oder 16 GB RAM empfohlen
Speichergerät: Mindestens 32 GB hochgeschwindigkeits MicroSD (A2-Klasse empfohlen)
Kühllösung: Aktiver Lüfter oder Metall-Kühlkörper (anhaltend hohe Last erzeugt Wärme)
Stromversorgung: Offizielles 27W PD-Netzteil (5V 5A)

64-Bit-System flashen:
- Raspberry Pi OS Lite (64-bit) herunterladen
- Mit Raspberry Pi Imager flashen

Erstkonfiguration:

sudo raspi-config
# SSH/VNC aktivieren, Dateisystem erweitern, SWAP auf 2048 MB setzen

sudo apt update && sudo apt full-upgrade -y
sudo apt install -y git curl python3-pip cmake

SWAP-Konfiguration bearbeiten:

sudo nano /etc/dphys-swapfile
# Ändern zu: CONF_SWAPSIZE=2048
sudo systemctl restart dphys-swapfile

GPU-Speicherzuweisung konfigurieren:

sudo nano /boot/config.txt
# Hinzufügen: gpu_mem=128

curl -fsSL https://ollama.ai/install.sh | sh

ollama run deepseek-r1:7b

Hinweis: Für Raspberry Pi 5 die 7B-Version wählen (größere Modelle benötigen mehr RAM)

ollama serve
# Standard-Endpunkt: http://localhost:11434

Quantisierte Modelle verwenden: INT4 oder INT8 wählen zur Reduzierung des Speicherbedarfs
Kontextlänge begrenzen: max_context_length auf 2048 oder weniger setzen
Batch-Verarbeitung: Mehrere Anfragen zusammenfassen wenn möglich
Temperatur überwachen: Gerätetemperatur unter 80 °C halten