Zum Inhalt springen Weiter zur Suche
Testversion
Glossar 

Was ist eine HFT-Infrastruktur? Hochfrequenzhandel erklärt

Unter HFT-Infrastruktur versteht man den spezialisierten Technologie-Stack, der es Hochfrequenzhandelsunternehmen ermöglicht, Tausende von Aufträgen pro Sekunde mit einer Präzision im Mikrosekundenbereich auszuführen. Der HFT-Stack umfasst alle Ebenen, die zur Erreichung dieser Geschwindigkeit erforderlich sind: Netzwerkkonnektivität, Colocation-Einrichtungen, Marktdatenerfassung, Pipelines zur Auftragsausführung sowie die Anwendungsbereitstellungsinfrastruktur, die diese Komponenten miteinander verbindet. Diese Handelsfähigkeit mit geringer Latenz ermöglicht es Unternehmen, Arbitrage-Chancen zu nutzen, die für langsamere Händler nicht erreichbar sind. Der weltweite HFT-Markt erreichte im Jahr 2024 ein Volumen von 10,36 Milliarden US-Dollar, wobei bis 2030 ein Wachstum von 7,7 Prozent prognostiziert wird; HFT macht etwa 50 bis 60 Prozent des US-Aktienhandelsvolumens aus.

Wichtigste Erkenntnisse

  • Die HFT-Infrastruktur umfasst den gesamten Technologie-Stack, einschließlich Netzwerkkonnektivität, Colocation, Marktdaten-Pipelines und Anwendungsbereitstellung, der es Unternehmen ermöglicht, Tausende von Aufträgen pro Sekunde mit einer Genauigkeit im Mikrosekundenbereich auszuführen.
  • Die Netzwerkleistung bildet die Grundlage der HFT-Infrastruktur: Jede Komponente ist darauf ausgelegt, Latenzzeiten zu beseitigen, Jitter zu reduzieren und eine deterministische Ausführung in großem Maßstab zu gewährleisten.
  • Lastenausgleich und Datenverkehrsmanagement verteilen Marktdaten und Orderflüsse auf die HFT-Ausführungssysteme, ohne dass dabei Engpässe entstehen, die die Konsistenz der Ausführung beeinträchtigen
  • Im Gegensatz zur herkömmlichen Handelsinfrastruktur legen HFT-Systeme mehr Wert auf Konsistenz und Vorhersehbarkeit als auf Flexibilität und optimieren jede Komponente im Hinblick auf eine wiederholbare Ausführung mit geringer Varianz.

Warum die Netzwerkleistung die Grundlage des HFT ist

Jeder Handel beginnt mit einem Signal, das ein physisches Netzwerk durchläuft. Beim öffentlichen Internet-Routing zwischen den großen Finanzzentren können sich durch Routing-Änderungen, Überlastungen und Warteschlangen an Zwischenknoten Verzögerungen von 60 Millisekunden oder mehr ansammeln. Für eine HFT-Strategie, bei der es auf Mikrosekunden ankommt, sind 60 Millisekunden ein Ausschlusskriterium.

Bei der Gestaltung von HFT-Netzwerken hat Determinismus Vorrang vor dem reinen Durchsatz. Weniger Knoten, eigene Glasfasertrassen und direkte Querverbindungen zu den Handelsplätzen reduzieren sowohl die mittlere Latenz als auch deren Streuung. Eine Hundertstel Mikrosekunde reicht für die meisten Ausführungsentscheidungen im HFT aus. Die Netzwerke müssen diesen Standard auch unter Volllast aufrechterhalten, einschließlich volatiler Handelsphasen, in denen eine schlecht konzipierte Konnektivität den Wettbewerbsvorteil untergräbt – unabhängig von der mittleren Latenz.

Was sind die Kernkomponenten einer HFT-Infrastruktur?

Co-Location und Proximity-Hosting

Bei der Colocation werden Handelsserver im selben Gebäude wie die Matching-Engines der Börsen untergebracht – eine Praxis, die in großen Finanzrechenzentren üblich ist. Damit wird der unvermeidbaren physikalischen Realität der räumlichen Entfernung Rechnung getragen: Jeder Fuß Glasfaserkabel zwischen einem Handelsserver und einer Matching-Engine erhöht die Round-Trip-Latenz. Die Colocation ermöglicht eine deterministische Konnektivität mit minimaler Anzahl an Hops, die auf keine andere Weise nachgebildet werden kann.

Netzwerkkonnektivität und Routing

Direkte Querverbindungen zu Börsennetzwerken umgehen das öffentliche Internet-Routing vollständig. Bei der Kernel-Bypass-Vernetzung werden Pakete direkt von der Netzwerkkarte in den Speicher der Handelsanwendung weitergeleitet, ohne das Betriebssystem zu durchlaufen, wodurch eine weitere Ursache für Latenz und Jitter beseitigt wird. HFT-Netzwerke sind so konzipiert, dass dieselben Daten bei jeder Ausführung denselben Pfad nehmen und im selben Zeitfenster ankommen, selbst unter Volllast.

Erfassung von Marktdaten

Marktdaten-Feeds übertragen pro Instrument Zehntausende von Kursaktualisierungen pro Sekunde. Ein Unternehmen, das an mehreren Handelsplätzen handelt, muss unter Umständen insgesamt Millionen dieser Nachrichten pro Sekunde verarbeiten, und die Latenz der Feed-Handler – also die Zeit zwischen einem Marktereignis an der Börse und dem Empfang dieser Daten durch die Strategie – ist ein entscheidender Wettbewerbsfaktor. Feed-Handler liefern diese Aktualisierungen über Multicast-Verbindungen mittels Glasfaserkabeln mit extrem geringer Latenz, normalisieren dabei die Datenformate und leiten die Aktualisierungen mit minimalem Verarbeitungsaufwand an die Strategieebene weiter.

Pipelines zur Auftragsabwicklung und -ausführung

Sobald eine Strategie ein Signal generiert, übermittelt die Ausführungs-Pipeline den Auftrag über das FIX-Protokoll und den Direct Market Access (DMA), wobei Makler als Vermittler umgangen werden, um direkt auf die Orderbücher der Börsen zuzugreifen. Risikokontrollen vor dem Handel werden inline im Ausführungsweg durchgeführt und müssen innerhalb von Nanosekunden abgeschlossen sein. Die angestrebten Round-Trip-Latenzen variieren je nach Strategie: Bei statistischer Arbitrage sind Latenzen im niedrigen Mikrosekundenbereich zulässig, während beim kontinuierlichen Market-Making möglicherweise Kurszyklen im Sub-Mikrosekundenbereich erforderlich sind, um eine adverse Selektion zu vermeiden.

Die Rolle der Anwendungsbereitstellung in der HFT-Infrastruktur

Die Infrastruktur zur Anwendungsbereitstellung – einschließlich Lastenausgleich, Datenverkehrsmanagement und Verbindungsrouting – bestimmt, wie effizient Marktdaten und Orderflüsse auf die Ausführungssysteme verteilt werden und ob diese Verteilung zeitliche Abweichungen in der Pipeline verursacht.

Eine co-lokierte Bereitstellung, bei der mehrere Strategien über einen Servercluster hinweg ausgeführt werden, erfordert einen Lastausgleich, der Feeds und Orderflüsse so verteilt, dass es auf einzelnen Knoten nicht zu einem Stau in den Warteschlangen kommt. Bei standortübergreifenden Bereitstellungen, die sich über New York, London und Tokio erstrecken, leitet der globale Server-Lastausgleich (GSLB) Orderflüsse auf der Grundlage von Echtzeit-Latenz und Ressourcenverfügbarkeit an den optimalen Ausführungsstandort weiter. Veraltete Routing-Entscheidungen, die Orders an einen Knoten mit verminderter Leistungsfähigkeit leiten, verursachen eine Latenz, die nachgelagert nicht mehr ausgeglichen werden kann.

Die Infrastruktur zur Anwendungsbereitstellung hat zudem Auswirkungen auf die Einhaltung gesetzlicher Vorschriften. MiFID II schreibt vor, dass HFT-Marktteilnehmer auf EU-Märkten ihre Geschäftsuhren auf eine Abweichung von maximal 100 Mikrosekunden gegenüber der UTC synchronisieren müssen. In den USA verlangen die „Consolidated Audit Trail“-Vorschriften der FINRA eine Synchronisation mit einer Abweichung von maximal 50 Millisekunden gegenüber der NIST-Atomuhr. Lastverteiler und Verkehrsmanagementsysteme, die Zeitunsicherheiten in den Ausführungsweg einbringen, führen neben Leistungseinbußen auch zu regulatorischen Risiken.

HFT-Infrastruktur im Vergleich zur Standard-Handelsinfrastruktur

Die Standard-Handelsinfrastruktur und die HFT-Infrastruktur nutzen zwar dieselben physischen Komponenten, unterscheiden sich jedoch erheblich in ihrer Konzeption, wobei sich diese Unterschiede durch alle Ebenen ziehen:

  • Hardware: HFT nutzt Bare-Metal-Server; gemeinsam genutzte Cloud-Umgebungen führen bei der Ausführung in der Produktion zu zu großen Schwankungen bei der Latenz.
  • Netzwerk: HFT nutzt ein Netzwerk, das den Kernel umgeht, sowie eigene Glasfaserverbindungen; die Standardinfrastruktur nutzt gemeinsam genutzte Netzwerkstacks und Carrier-Routing.
  • Lastverteilung: HFT erfordert unter Spitzenauslastung deterministische Routing-Entscheidungen im Sub-Millisekunden-Bereich; die Standardinfrastruktur lässt größere Schwankungen zu.
  • Überwachung: HFT betrachtet die Latenzmessung als kontinuierliche Produktionsfunktion mit Zeitstempelung für jede einzelne Stufe; die Standardinfrastruktur nutzt periodische Leistungserfassungen.

Wie A10 Networks die Leistung der HFT-Infrastruktur A10 Networks

Der A10 Thunder® Application Delivery Controller (Thunder ) bietet leistungsstarkes Lastausgleichs- und Datenverkehrsmanagement für Umgebungen, in denen die Konsistenz der Ausführung eine zwingende Voraussetzung ist. Thunder verteilt Marktdaten-Feeds und Orderflüsse über Ausführungscluster hinweg mit der Präzision, die latenzempfindliche Finanzanwendungen erfordern, und verhindert so den Aufbau von Warteschlangen und Ressourcenkonflikte, die zu zeitlichen Abweichungen führen.

Bei standortübergreifenden Bereitstellungen, die sich über wichtige Finanzzentren erstrecken, leitet der globale Server-Load-Balancing-MechanismusThunder die Orderflüsse auf der Grundlage von Echtzeit-Latenz und Ressourcenverfügbarkeit an den optimalen Ausführungsort weiter. Das Failover-Routing gewährleistet die Kontinuität der Ausführung, wenn einzelne Knoten ausfallen, und unterstützt so die kontinuierliche Verfügbarkeit, die Marktteilnehmer während der Handelszeiten benötigen.

Die A10-Handelslösungen mit geringer und extrem geringer Latenz wurden speziell für die Anforderungen des Hochfrequenzhandels entwickelt und bieten bei diesen Transaktionen eine Latenz von unter 2 Mikrosekunden. A10 unterstützt zudem die TLS-Verschlüsselung für den FIX/ETI-Datenverkehr und erfüllt damit künftige Compliance-Anforderungen der Finanzbörsen, ohne dabei an Geschwindigkeit einzubüßen.

A10 Control ermöglicht eine zentralisierte Verwaltung und Analyse aller Thunder und bietet Echtzeit-Einblick in Datenverkehrsmuster, Latenzkennzahlen und den Zustand der Infrastruktur. In Umgebungen, in denen Compliance-Anforderungen eine wichtige Rolle spielen, gewährleisten die zentralisierten Protokollierungs- und Warnfunktionen die Einhaltung der Anforderungen an die Zeitstempelgenauigkeit und den Prüfpfad, die durch die MiFID-II- und FINRA-CAT-NMS-Vorschriften vorgeschrieben sind.


Häufig gestellte Fragen

Beim algorithmischen Handel werden regelbasierte Strategien automatisch ausgeführt, wobei die Latenz in der Regel im Millisekundenbereich liegt. Die HFT-Infrastruktur ist ein spezialisierter Teilbereich, der durch Colocation, Kernel-Bypass-Netzwerke und die Optimierung der Ausführungs-Pipeline im Submikrosekundenbereich ergänzt wird, um auf Mikrosekundenebene wettbewerbsfähig zu sein. Alle HFT-Unternehmen nutzen algorithmische Strategien, aber nicht alle Unternehmen im algorithmischen Handel benötigen eine Infrastruktur auf HFT-Niveau.

Aktien und Aktienderivate machen den größten Anteil am HFT-Volumen aus. Auch bei Futures, Optionen und Devisen ist eine erhebliche HFT-Aktivität zu verzeichnen. Kryptomärkte arbeiten derzeit mit einer Latenz von Millisekunden und sind damit aufgrund von Einschränkungen der Börseninfrastruktur langsamer als herkömmlicher HFT, obwohl institutionelle Handelsplätze diesen Rückstand zunehmend verringern.

MiFID II schreibt vor, dass HFT-Teilnehmer an EU-Märkten ihre Geschäftsuhren auf eine Abweichung von maximal 100 Mikrosekunden gegenüber der UTC synchronisieren und detaillierte Handelsaufzeichnungen führen müssen; Verstöße können mit Geldbußen von bis zu 5 Millionen Euro geahndet werden. Die CAT-NMS-Regeln der FINRA schreiben in den USA einen Synchronisationsstandard von 50 Millisekunden vor. Diese Anforderungen prägen die Zeitstempel-Infrastruktur im gesamten Ausführungsstapel.

Für HFT-Unternehmen stellt die Latenzregression – also eine Verschlechterung der Ausführungsgeschwindigkeit aufgrund von Hardwareänderungen, Umleitungen im Netzwerk oder Software-Updates – ein ständiges Risiko dar, das möglicherweise keine offensichtlichen Warnsignale auslöst. Eine zweite wichtige Kategorie bilden außer Kontrolle geratene Algorithmen, die Aufträge schneller generieren, als Risikokontrollen diese eindämmen können. Redundanz, Failover-Routing und Positionslimits vor dem Handel sind gängige Maßnahmen zur Risikominderung.

In HFT-Umgebungen erfolgt eine kontinuierliche Latenzmessung mit präziser Zeitstempelung in jeder Pipeline-Stufe. Die Tail-Latenz und der Jitter werden als primäre Kennzahlen erfasst, wobei bei Spitzenwerten und Verschlechterungen Echtzeit-Warnmeldungen ausgegeben werden. Wartungsfenster werden außerhalb der Handelszeiten angesetzt, und Änderungen an der Infrastruktur durchlaufen vor der Bereitstellung in der Produktion eine Simulation und ein Backtesting. Die Teams streben während der Handelszeiten eine Verfügbarkeit von 99,999 Prozent an.

Nicht für den Live-Handel geeignet. Public cloud weisen Schwankungen bei der Latenz auf, wodurch sie für die HFT-Ausführung im Produktionsbetrieb ungeeignet sind. Echte Colocation, also die Unterbringung von Bare-Metal-Servern in den Rechenzentren der Börsen, bleibt der Standard für den Live-Handel. Cloud-Infrastrukturen werden üblicherweise für Backtesting, Strategieentwicklung und Risikoanalysen genutzt, bei denen keine Präzision im Mikrosekundenbereich erforderlich ist.

< Zurück zu Glossar der Begriffe