Schwachstellen in der Lieferkette

Sicherheitslücken in LLM-Lieferketten entstehen, wenn Schwachstellen in Komponenten, Modellen, Datensätzen, Tools oder Bereitstellungsplattformen von Drittanbietern die Integrität, Sicherheit oder Zuverlässigkeit von Systemen mit großen Sprachmodellen (LLM) beeinträchtigen.

Im Gegensatz zu herkömmlichen Risiken in der Software-Lieferkette, bei denen der Schwerpunkt vor allem auf Code-Abhängigkeiten lag, erstrecken sich die Lieferketten für große Sprachmodelle (LLM) auf vortrainierte Modelle, Adapter für die Feinabstimmung (z. B. LoRA, PEFT), Trainingsdatensätze, Modell-Repositorys, Konvertierungs- und Zusammenführungsdienste, die Infrastruktur für die Bereitstellung in der Cloud und am Netzwerkrand sowie Lizenz- und Datennutzungsvereinbarungen.

Da die moderne KI-Entwicklung in hohem Maße auf offene Ökosysteme und Komponenten von Drittanbietern angewiesen ist, vergrößert sich die Angriffsfläche der Lieferkette erheblich.

Wichtigste Erkenntnisse

Die Risiken in der LLM-Lieferkette gehen über herkömmliche Software-Schwachstellen hinaus und umfassen vortrainierte Modelle von Drittanbietern, Feinabstimmungsadapter, Trainingsdatensätze und Bereitstellungsplattformen, die alle manipuliert oder mit Schaddaten verseucht werden können
Die unzureichende Herkunftsnachweisbarkeit von Modellen stellt eine kritische Schwachstelle dar: Modellkarten bieten keine kryptografischen Garantien hinsichtlich der Herkunft, sodass Angreifer kompromittierte Modelle in Repositorien wie Hugging Face veröffentlichen und sich dabei als vertrauenswürdige Quellen ausgeben können
Feinabstimmungstechniken wie LoRA eröffnen einen neuen Angriffsvektor – ein bösartiger LoRA-Adapter kann mit einem legitimen Basismodell zusammengeführt werden, wodurch Hintertüren eingeschleust werden, die während der Inferenz aktiviert werden, ohne die Benchmark-Leistung zu beeinträchtigen
Die Bereitstellung von LLM auf Endgeräten vergrößert die Angriffsfläche der Lieferkette zusätzlich, da Angreifer mobile Apps zurückentwickeln, eingebettete Modelle durch manipulierte Versionen ersetzen und diese dann mithilfe von Social Engineering erneut verbreiten können
Zu den Maßnahmen zur Risikominderung gehören die Führung einer KI-spezifischen Software-Stückliste (SBOM), die Überprüfung der Modellintegrität mittels Datei-Hashes und Codesignierung, die Durchführung von KI-Red-Team-Tests bei Modellen von Drittanbietern sowie die kontinuierliche Überprüfung der Sicherheitslage von Lieferanten und der Lizenzbedingungen

Warum das wichtig ist

LLMs werden oft als undurchsichtige Binärdateien verbreitet. Im Gegensatz zu herkömmlichem Open-Source-Code lassen sie sich nicht ohne Weiteres auf versteckte Funktionen überprüfen. Dies erhöht die Abhängigkeit vom Vertrauen in die vorgelagerten Anbieter. Eine Kompromittierung an irgendeiner Stelle der KI-Lieferkette kann folgende Folgen haben:

Verzerrte oder manipulierte Ergebnisse
Eingebaute Hintertüren
Sicherheitsverletzungen
Datenexfiltration
Ausführung von Malware
Rechtliche Risiken und Lizenzrisiken
Systeminstabilität oder -ausfall

Wichtige Risikobereiche, die zu berücksichtigen sind

Herkömmliche Sicherheitslücken in Komponenten von Drittanbietern: Veraltete oder nicht mehr unterstützte Pakete, die bei der Modellentwicklung oder beim Fine-Tuning verwendet werden, können ausgenutzt werden, ähnlich wie bei OWASP A06 – Anfällige und veraltete Komponenten.
Lizenzrisiken: KI-Systeme umfassen verschiedene Software- und Datensatzlizenzen. Eine unsachgemäße Handhabung kann zu Rechtsverstößen, Vertriebsbeschränkungen oder geschäftlichen Risiken führen.
Veraltete oder nicht mehr unterstützte Modelle: Nicht mehr gepflegte Modelle können unbehobene Sicherheitslücken enthalten.
Anfällige vortrainierte Modelle: Vortrainierte Modelle können versteckte Verzerrungen, Hintertüren oder böswillige Manipulationen enthalten. Techniken wie die Manipulation von Parametern (z. B. ROME / „Lobotomisierung“) können das Modellverhalten direkt verändern.
Unzuverlässige Modellherkunft: Modellkarten liefern zwar beschreibende Informationen, garantieren jedoch keine Echtheit. Angreifer können sich als legitime Anbieter ausgeben oder Konten in Repositorien kompromittieren.
Bösartige LoRA-Adapter: Die Techniken „Low-Rank Adaptation“ (LoRA) und PEFT ermöglichen eine modulare Feinabstimmung. Ein bösartiger Adapter kann bei der Zusammenführung ein Basismodell kompromittieren, insbesondere in kollaborativen oder automatisierten Bereitstellungsumgebungen.
Missbrauch bei der gemeinsamen Modellentwicklung: Modellzusammenführung, Konvertierungsdienste und gemeinsam genutzte Hosting-Plattformen können manipuliert werden, um Schwachstellen einzuschleusen oder Prüfprozesse zu umgehen.
Risiken bei Modellen auf Endgeräten: Am Netzwerkrand eingesetzte große Sprachmodelle (LLMs) erhöhen das Risiko von Firmware-Schwachstellen, Reverse Engineering und der Manipulation und Neuverpackung von Modellen.
Unklare Bedingungen und Datenschutzrichtlinien: Änderungen in den AGB von Anbietern können die Verarbeitung von Anwendungsdaten ohne eindeutige Einwilligung ermöglichen, was zur unbeabsichtigten Speicherung oder Offenlegung sensibler Informationen führen kann.

Typische Angriffsszenarien

Diese Szenarien verdeutlichen, dass Risiken in der Lieferkette sowohl Entwicklungs- als auch Produktionsumgebungen betreffen.

Kompromittierte Abhängigkeit (PyPI-Angriff): Bösartige Pakete haben Malware in Entwicklungsumgebungen eingeschleust
Direkte Manipulation des Modells (PoisonGPT): Angreifer haben Modellparameter verändert, um die Sicherheitsprüfungen des Repositorys zu umgehen
Bösartiges, feinabgestimmtes Modell: Ein Modell wirkt in Benchmark-Tests harmlos, enthält jedoch gezielte Auslöser
Veröffentlichung gefälschter Modelle (WizardLM): Angreifer veröffentlichen mit Malware versehene Modelle unter bekannten Namen
LoRA-Adapter-Sicherheitslücke: Ein bösartiger Adapter führt bei der Zusammenführung zu versteckten Sicherheitslücken
Ausnutzung von Cloud-Infrastrukturen (CloudBorne/CloudJacking): Schwachstellen in der Virtualisierung oder Firmware gefährden gehostete Systeme
GPU-Speicherleck (LeftOvers CVE-2023-4969): Sensible Daten aus dem undichten GPU-Speicher wiederhergestellt
Nachgebaute mobile App: In neu verpackten Apps eingebettete manipulierte Modelle leiten Nutzer zu betrügerischen Inhalten weiter
Datenverfälschung: Öffentliche Datensätze, die manipuliert wurden, um während des Feinabstimmungsvorgangs subtile Hintertüren einzubauen
Manipulation der AGB: Anbieter ändert Datenschutzrichtlinien, um mit sensiblen Anwendungsdaten zu trainieren

Strategien zur Prävention und Schadensminderung

Überprüfung von Lieferanten und Bezugsquellen

Achten Sie darauf, vertrauenswürdige und überprüfbare Modellquellen zu verwenden. Überprüfen Sie regelmäßig die Sicherheitsvorkehrungen der Anbieter sowie deren AGB und kontrollieren Sie Änderungen bei den Lizenz- und Datenschutzrichtlinien.

Schwachstellenmanagement

Wenden Sie die OWASP-Kontrollen A06:2021 an, führen Sie Abhängigkeitsscans und Patch-Management durch und sorgen Sie für sichere Entwicklungsumgebungen.

SBOM-/AI-BOM-Verfahren

Führen Sie eine Software-Stückliste (SBOM), verfolgen Sie Modelle, Datensätze, Adapter und Lizenzen und berücksichtigen Sie KI-/ML-spezifische Stücklistenstandards wie OWASP CycloneDX.

Überprüfung der Modellintegrität

Verwenden Sie digitale Signaturen und die Überprüfung von Datei-Hashwerten, wenden Sie die Codesignierung für extern bereitgestellten Code an und überprüfen Sie nach Möglichkeit die Herkunft.

KI-Red-Team-Tests

Führen Sie Adversarial-Tests an Modellen von Drittanbietern durch, bewerten Sie die Modelle in den vorgesehenen Einsatzkontexten und verlassen Sie sich nicht ausschließlich auf veröffentlichte Sicherheits-Benchmarks.

Einstellungen für die Zusammenarbeit

Überwachen Sie die Zusammenführung und Konvertierung von Modellen, setzen Sie automatisierte Scanner ein (z. B. den HuggingFace SF_Convertbot Scanner) und prüfen Sie gemeinsam genutzte Entwicklungspipelines.

Anomalie- und Robustheitstests

Führen Sie Tests zur Robustheit gegenüber Angriffen durch, integrieren Sie die Erkennung in MLOps-Pipelines und führen Sie regelmäßig Red-Team-Übungen durch.

Schutz bei der Bereitstellung am Netzwerkrand

Verschlüsseln Sie Modelle im Ruhezustand, nutzen Sie Hardware-Integritätsprüfungen und APIs zur Herstellerbescheinigung und beenden Sie Anwendungen bei nicht erkannter Firmware

Lizenzverwaltung

Verwaltung von Lizenzbeständen über Stücklisten, Einsatz automatisierter Lizenzmanagement-Tools und Schulung der Teams zu Lizenzverpflichtungen

Das zentrale Sicherheitsprinzip

LLM-Systeme sind keine eigenständigen Komponenten. Es handelt sich um komplexe Ökosysteme, die aus Code, Daten, Modellen, Adaptern, Infrastruktur, Lizenzen und Cloud-Diensten bestehen. Jede externe Abhängigkeit birgt Risiken.

Die Sicherheit der Lieferkette für große Sprachmodelle erfordert eine kontinuierliche Validierung, strenge Kontrollen der Herkunft, sichere MLOps-Verfahren, Red-Teaming und adversarische Tests sowie rechtliche und lizenzrechtliche Governance und die Absicherung der Infrastruktur.

In KI-Systemen wird Vertrauen weitergegeben. Wenn eine vorgelagerte Komponente kompromittiert wird, ist auch die nachgelagerte Anwendung gefährdet. Sichern Sie die Kette, überprüfen Sie die Quelle und überwachen Sie das System kontinuierlich.

< Zurück zu Glossar der Begriffe

TrojAI von A10 schützt jeden KI-Agenten, jede Anwendung und jedes Modell – von der Entwicklung bis zur Ausführung

Überzeugen Sie sich selbst vom A10 Networks
Unterschied

Schwachstellen in der Lieferkette

Wichtigste Erkenntnisse

Warum das wichtig ist

Wichtige Risikobereiche, die zu berücksichtigen sind

Typische Angriffsszenarien

Strategien zur Prävention und Schadensminderung

Überprüfung von Lieferanten und Bezugsquellen

Schwachstellenmanagement

SBOM-/AI-BOM-Verfahren

Überprüfung der Modellintegrität

KI-Red-Team-Tests

Einstellungen für die Zusammenarbeit

Anomalie- und Robustheitstests

Schutz bei der Bereitstellung am Netzwerkrand

Lizenzverwaltung

Das zentrale Sicherheitsprinzip

TrojAI von A10 schützt jeden KI-Agenten, jede Anwendung und jedes Modell – von der Entwicklung bis zur Ausführung

Überzeugen Sie sich selbst vom A10 Networks Unterschied

Schwachstellen in der Lieferkette

Wichtigste Erkenntnisse

Warum das wichtig ist

Wichtige Risikobereiche, die zu berücksichtigen sind

Typische Angriffsszenarien

Strategien zur Prävention und Schadensminderung

Überprüfung von Lieferanten und Bezugsquellen

Schwachstellenmanagement

SBOM-/AI-BOM-Verfahren

Überprüfung der Modellintegrität

KI-Red-Team-Tests

Einstellungen für die Zusammenarbeit

Anomalie- und Robustheitstests

Schutz bei der Bereitstellung am Netzwerkrand

Lizenzverwaltung

Das zentrale Sicherheitsprinzip

Der ultimative Leitfaden zur LLM-Sicherheit

Überzeugen Sie sich selbst vom A10 Networks
Unterschied