Sizing und Anforderungen
Diese Seite ist Betriebsleitlinie auf Basis der aktuellen Architektur. Sie ist keine harte Produktgrenzen-Matrix.
Was Last im System treibt
Die wichtigsten Lastmultiplikatoren sind:
- Anzahl aktiver Tenants
- Polling-Frequenz fuer Messages, Payloads, Packages und Artifacts
- Umfang historischer Backfills
- Payload-Download-Tiefe
- Archive-Frequenz und Retention
- Anzahl gleichzeitiger User
- Anzahl aktiver Celery-Worker-Prozesse
- ob PostgreSQL und Redis intern oder extern betrieben werden
Eingebaute Intervall-Defaults
Aktuelle Plattform-Metrik-Defaults:
- Host-Metriken alle
600Sekunden - Django-Metriken alle
300Sekunden - Storage-Quick-Snapshots alle
3600Sekunden - Storage-Deep-Snapshots alle
21600Sekunden
Aktuelles Dispatch-Limit fuer geplante Reports:
50Jobs pro Periodic-Pass
Kleine Installation
Sinnvoll fuer:
1bis5User- niedriges bis moderates Alert-Volumen
- wenige Tenants
- begrenzte Payload- und Archive-Tiefe
Empfohlenes Setup:
- SQLite kann akzeptabel sein
- interner Redis kann akzeptabel sein
- Worker-Profil
safeoderbalanced
Startleitlinie Infrastruktur:
- CPU:
2vCPU - RAM:
4 GB - Disk:
20bis50 GB - Storage: persistenter Mount fuer
/app/data
Betriebshinweise:
- Polling konservativ halten
- schwere Cold-Backfills nicht in Peak-Zeiten fahren
- akzeptieren, dass interner Redis keine Persistenz hat
Mittlere Installation
Sinnvoll fuer:
- mehrere Admins
- regelmaessige Background-Verarbeitung
- hoeheres Message-Volumen
- relevante Archive- und Payload-Nutzung
Empfohlenes Setup:
- PostgreSQL empfohlen
- externer Redis empfohlen
- Worker-Profil
balanced
Startleitlinie Infrastruktur:
- CPU:
4vCPU - RAM:
8bis16 GB - Disk:
100 GBaufwaerts, je nach Archiv-Retention - Netzwerk: stabiler, latenzarmer Pfad zu Redis und PostgreSQL
Betriebshinweise:
- Queue-Monitoring wird Pflicht
- Table-Growth-Review gehoert in die Regelbetriebsroutine
- Archive sollten auf gemountetem oder gemanagtem persistentem Storage liegen
Grosse Installation
Sinnvoll fuer:
- viele Tenants
- konstante CPI-Ingestion
- schwerere Payload-Inspektion
- breites operatives Reporting
Empfohlenes Setup:
- dediziertes oder gemanagtes PostgreSQL
- dedizierter oder gemanagter Redis
- Worker-Profil
fastoder custom nur nach evidenzbasiertem Tuning
Startleitlinie Infrastruktur:
- CPU:
8vCPU oder mehr - RAM:
16bis32 GBoder mehr - Disk: primaer nach DB-Wachstum und Archiv-Retention dimensionieren
- Storage: starke IOPS sind wichtiger als nur Rohkapazitaet
Betriebshinweise:
- Queue-Tiefen kontinuierlich beobachten
- DB-Write-Latenz und Vacuum-Verhalten verfolgen
- getrennte Infrastruktur-Services sind stark zu bevorzugen
CPU-Aspekte
CPU-Bedarf steigt durch:
- viele Celery-Worker
- Archive-Export und Komprimierung
- PDF-Export
- AI-Task-Ausfuehrung
- Message-Parsing und Batch-Processing
Das Container-Image bringt ausserdem Chromium, Java, PostgreSQL, Redis, Nginx und Python-Runtime mit und ist deshalb kein schlankes Single-Process-Image.
RAM-Aspekte
Der Idle-Footprint wird beeinflusst durch:
- Gunicorn mit
4Workern und2Threads - viele Celery-Worker-Prozesse
- internes PostgreSQL
- internen Redis
- Python-Prozessduplikation ueber mehrere Worker-Gruppen
Bei knappen Ressourcen sind die ersten sicheren Hebel:
- Celery-Concurrency reduzieren
- externes PostgreSQL nutzen
- externen Redis nutzen
- Archive und Cold-Backfills moderat halten
Disk- und IOPS-Aspekte
Disk-Bedarf wird bestimmt durch:
- SQLite-Write-Amplification bei SQLite-Betrieb
- PostgreSQL-Tabellen- und Indexwachstum
- Archive-Exporte
- Job- und Service-Logs
- Payload- und Attachment-Retention
IOPS werden wichtig, wenn:
- viele Worker gleichzeitig schreiben
- Archive-Cleanup schwere DB-Wartung anstoesst
- Storage-Snapshots waehrend aktiver Ingestion laufen
Netzwerk-Aspekte
Netzwerkqualitaet ist relevant fuer:
- PostgreSQL-Roundtrips
- Redis-Roundtrips
- CPI-API-Calls
- E-Mail-Delivery
- gemanagte AI-Backends
Wenn Redis oder PostgreSQL remote sind, verbessert niedrige Latenz den Queue-Durchsatz und das Lock-Verhalten.
Praktische Tuning-Reihenfolge
Wenn der Durchsatz nicht reicht, ist die sicherste Reihenfolge:
- Queue-Tiefe und Redis-Health validieren
- DB-Latenz und Write-Druck validieren
- Polling-Frequenzen und Cold-Backfill-Verhalten pruefen
- erst dann Worker-Concurrency erhoehen
Diese Reihenfolge passt zu den tatsaechlichen Flaschenhaelsen der aktuellen Architektur.