Was ist Low-Latency-Trading?
Wettbewerbsvorteile durch eine auf Geschwindigkeit ausgelegte Infrastruktur
Der Handel mit geringer Latenz ist eine Strategie, die von Finanzinstituten eingesetzt wird, um die Verzögerung – gemessen in Millisekunden oder Mikrosekunden – zwischen einem Handelssignal und der Ausführung eines Auftrags zu minimieren. Indem sie schneller handeln als konkurrierende Marktteilnehmer, nutzen Unternehmen Kurschancen, die an den Märkten für Aktien, Terminkontrakte, Devisen und Optionen nur kurzzeitig bestehen. Im Jahr 2007 berechnete eine große globale Investmentbank, dass jede Millisekunde Latenzzeit jährlich 100 Millionen US-Dollar an entgangenen Gewinnen kostete, und das Wettbewerbsfenster ist seitdem nur noch kleiner geworden.
Der Handel mit geringer Latenz ist weniger eine einzelne Technik als vielmehr ein Fachgebiet, das Hardware-Entwicklung, Software-Architektur, Netzwerkdesign und die physische Infrastruktur umfasst, die diese Transaktionen ermöglichen. Was als „gering“ gilt, wird immer weiter nach unten verschoben. Der Handel mit extrem geringer Latenz bezieht sich in der Regel auf Round-Trip-Ausführungszeiten von unter einer Millisekunde; die fortschrittlichsten Systeme arbeiten im einstelligen Mikrosekundenbereich.
Wichtigste Erkenntnisse
- Auf wettbewerbsintensiven Finanzmärkten wirkt sich die Leistungsfähigkeit der Infrastruktur direkt auf die Rentabilität aus, da sich das Zeitfenster zwischen einem Marktsignal und der Handelsausführung innerhalb von Mikrosekunden schließen kann
- Netzwerkhardware, die räumliche Nähe der Colocation-Standorte, die Protokollauswahl und die Anwendungsbereitstellung verursachen jeweils Verzögerungen, die sich zu einem erheblichen Wettbewerbsnachteil summieren
- Der Hochfrequenzhandel (HFT) ist eine Strategie, die sich durch Handelsvolumen und Haltedauer auszeichnet, während der Handel mit geringer Latenz eine infrastrukturelle Disziplin ist, die viele Strategien ermöglicht, darunter auch den HFT
- Allgemeine Lastverteiler verursachen einen Verarbeitungsaufwand, der die für Finanzhandelssysteme erforderliche Leistung im Mikrosekundenbereich beeinträchtigt
Warum Latenzzeiten auf den Finanzmärkten eine Rolle spielen
Märkte reagieren auf Informationen. Wenn sich ein Kurs an einer Börse ändert, entstehen kurzzeitig Preisunterschiede auf verbundenen Märkten und Handelsplätzen, bevor andere Marktteilnehmer diese Lücke schließen. Jede Millisekunde Verzögerung bietet schnelleren Wettbewerbern die Möglichkeit, zuerst zu handeln.
Die Latenzzeit ist besonders für Unternehmen von Bedeutung, die an verschiedenen Märkten kontinuierlich Kauf- und Verkaufskurse veröffentlichen. Wenn sich die Marktbedingungen ändern, müssen diese Unternehmen ihre Kurse schneller aktualisieren als ihre Konkurrenten, um zu vermeiden, dass sie zu ungünstigen Konditionen kaufen oder verkaufen, weil sich der Markt bereits zu ihren Ungunsten entwickelt hat. Der algorithmische Handel macht mittlerweile rund 70 Prozent des Handelsvolumens am US-Aktienmarkt aus, und in diesem Umfeld agiert ein Unternehmen mit einer deutlich höheren Latenzzeit auf der Grundlage anderer – und schlechterer – Informationen.
Die regulatorischen Rahmenbedingungen berücksichtigen Latenzzeiten, ohne jedoch konkrete Zielvorgaben festzulegen. In den Vereinigten Staaten hat die SEC-Verordnung NMS im gesamten National Market System Verpflichtungen zur bestmöglichen Ausführung festgelegt, und die FINRA-Regel 15c3-5 (die Market Access Rule) verpflichtet Broker-Dealer, Risikomanagementkontrollen für automatisierte Handelssysteme einzurichten. In Europa schreibt die MiFID II den Akteuren im algorithmischen Handel Teststandards, Risikokontrollen und Anforderungen an Schutzmechanismen vor. Jeder Rahmen geht davon aus, dass Unternehmen ihre Ausführungsgeschwindigkeiten messen und dokumentieren können.
So funktioniert der Handel mit geringer Latenz
Die Ausführung eines Handelsgeschäfts beginnt mit einem Marktdatenereignis: einer Kursaktualisierung, die von einer Börse oder einem alternativen Handelsplatz eingeht. Das Handelssystem nimmt diese Daten auf, gleicht sie mit der Strategielogik ab, generiert einen Auftrag, übermittelt diesen an die Börse und erhält eine Bestätigung. Die Round-Trip-Latenz für das Handelsgeschäft umfasst den gesamten Zyklus, vom ersten eingehenden Datenpaket bis zur Rückmeldung, wobei jede Millisekunde berücksichtigt wird.
Unternehmen unterteilen diesen Zyklus in einzelne Komponenten: Latenzzeit der Datenübertragung (Zeit vom Börsensystem zum Handelssystem), Rechenzeit für die Strategie, Zeit für die Auftragserstellung, Netzwerkübertragungszeit (ausgehend), Bearbeitungszeit an der Börse und Netzwerkübertragungszeit (eingehend). Jede dieser Komponenten wird separat gemessen und optimiert, um zusätzliche Effizienzgewinne zu erzielen.
Wesentliche Komponenten einer Handelsinfrastruktur mit geringer Latenz
Netzwerkhardware und Colocation
Durch Colocation werden Handelsserver in denselben Rechenzentren untergebracht wie die Abgleichsysteme der Börsen, wodurch die Datenübertragungswege von Kilometern auf Meter verkürzt werden. In wichtigen Knotenpunkten wie dem Standort der CME Group in Aurora (Illinois), dem Equinix NY4 in Secaucus und dem London LD4 setzen die Börsen Vorschriften zur gleichmäßigen Verkabelung durch, um Standortvorteile zu verhindern; danach ist die Hardware-Unterscheidung die wichtigste verbleibende Variable.
Herkömmliche Netzwerkkarten (NICs) verursachen durch den Overhead des Betriebssystems eine Latenz von 20 bis 50 Mikrosekunden. Kernel-Bypass-Technologien wie DPDK ordnen den Speicher der Netzwerkkarte direkt den Anwendungen zu und reduzieren diese Latenz auf 1 bis 5 Mikrosekunden. FPGAs gehen noch einen Schritt weiter und führen Logik in der Hardware mit Reaktionszeiten im Nanosekundenbereich für feste Aufgaben wie das Parsen von Marktdaten und Risikoprüfungen aus. Bei Routen, bei denen große Entfernungen unvermeidbar sind, erreichen Mikrowellen- und HF-Verbindungen eine Round-Trip-Zeit von etwa 8 Millisekunden zwischen den wichtigsten US-Finanzzentren, verglichen mit etwa 13 Millisekunden bei Standard-Glasfaserverbindungen.
Optimierte Routenführung und Protokollauswahl
Handelsumgebungen mit geringer Latenz stützen sich auf direkte Querverbindungen innerhalb von Colocation-Einrichtungen, wobei dedizierte Glasfaserverbindungen genutzt werden, um das öffentliche Routing zu umgehen, sowie auf direkte Marktdatenfeeds anstelle von konsolidierten Feeds, die zu Verarbeitungsverzögerungen führen. Das Financial Information eXchange (FIX)-Protokoll ist der Standard für die Auftragserteilung in traditionellen Märkten und wird gegenüber REST oder WebSockets bevorzugt, da es den protokollbedingten Overhead minimiert. Auf der leistungssensibelsten Ebene bieten proprietäre Binärprotokolle weitere Reduzierungen, wobei die Unterstützung durch die Börsen variiert.
Anwendungsbereitstellung und Lastausgleich
Groß angelegte Handelssysteme verteilen die Arbeitslasten über die gesamte Infrastruktur. Die Normalisierung von Marktdaten, das Auftragsmanagement, Risikoprüfungen und das Routing der Orderausführung laufen parallel ab, wobei der Lastausgleich bestimmt, wie die Anfragen durch diese Umgebung geleitet werden. In einem typischen Unternehmenskontext übernimmt ein Application Delivery Controller (ADC) diese Aufgabe neben der TLS/SSL-Entlastung, Zustandsprüfungen und der Traffic-Shaping-Funktion.
Allgemeine ADCs verursachen durch Verbindungsmanagement, Deep Packet Inspection und SSL-Verarbeitung einen zusätzlichen Verarbeitungsaufwand. Dies mag in den meisten Unternehmensanwendungen ein akzeptabler Kompromiss sein, beeinträchtigt jedoch die für Handelssysteme erforderliche Reaktionsgeschwindigkeit im Mikrosekundenbereich. Finanzumgebungen erfordern eine Lastverteilung, die speziell auf Workloads mit hohem Durchsatz und geringer Latenz ausgelegt ist.
Handel mit geringer Latenz vs. Hochfrequenzhandel
Der Handel mit geringer Latenz und der Hochfrequenzhandel (HFT), die oft synonym verwendet werden, sind zwar miteinander verbundene, aber dennoch unterschiedliche Konzepte.
HFT ist eine Handelsstrategie, die sich durch sehr hohe Ordervolumina, Haltezeiten von Millisekunden bis Sekunden und geringe Gewinnspannen auszeichnet, die sich über ein enormes Transaktionsvolumen hinweg summieren. HFT-Unternehmen erzielen Gewinne, indem sie auf flüchtige Preisunterschiede zwischen verwandten Märkten und Handelsplätzen reagieren, bevor langsamere Marktteilnehmer darauf reagieren können.
Der Handel mit geringer Latenz ist eine Frage der Infrastruktur. Jede Strategie, die von einer schnelleren Ausführung profitiert – sei es Hochfrequenzhandel (HFT), die Ausführung großer Orders zur Minimierung der Marktauswirkungen oder signalgesteuerter algorithmischer Handel –, ist auf eine Infrastruktur mit geringer Latenz angewiesen.
Diese Unterscheidung ist für die Planung von Bedeutung. Ein HFT-Betrieb benötigt Colocation, FPGAs, Kernel-Bypass-Netzwerke und auf die Nanosekunde optimierte direkte Marktdatenfeeds. Ein Unternehmen, das sich auf die Ausführung großer Aufträge mit minimalen Kursauswirkungen konzentriert, benötigt schnelles, deterministisches Routing und eine zuverlässige Anwendungsbereitstellung, jedoch keine Reaktionszeiten im Submikrosekundenbereich. Durch die Abstimmung der Infrastrukturinvestitionen auf die tatsächlichen Latenzanforderungen lassen sich sowohl Unter- als auch Überinvestitionen in Hardware vermeiden, die für die jeweilige Strategie nicht erforderlich ist.
Wie A10 Networks Handelsinfrastrukturen mit geringer Latenz A10 Networks
Thunder® ADC bietet Lastenausgleich mit hohem Durchsatz und geringer Latenz für Umgebungen, in denen der Verarbeitungsaufwand im Mikrosekundenbereich liegt. TCP-Optimierung, TLS/SSL-Offloading für moderne Verschlüsselungssuiten und die Beschleunigung der Anwendungsleistung reduzieren die Latenz zusätzlich. Der globale Server-Lastenausgleich (GSLB) erweitert diese Funktion auf geografisch verteilte Handelsinfrastrukturen und unterstützt so die Routing-Optimierung sowie die Geschäftskontinuität über Handelsplätze und Regionen hinweg.
Die A10-Handelslösungen mit geringer und extrem geringer Latenz wurden speziell für die Anforderungen des FIX-Protokoll-Handels entwickelt und bieten eine Latenz von unter 2 Mikrosekunden für Hochfrequenzhandelstransaktionen. A10 unterstützt zudem TLS-Verschlüsselung für den FIX/ETI-Datenverkehr und erfüllt damit künftige Compliance-Anforderungen der Finanzbörsen, ohne dabei an Geschwindigkeit einzubüßen.
ThreatX von A10 Networks bietet Schutz für Webanwendungen und APIs, ohne die mit Latenz verbundene Einbuße, die bei Architekturen auftritt, bei denen mehrere Überprüfungswerkzeuge hintereinander geschaltet sind. Indem ThreatX Signale über den gesamten Transaktionsverlauf hinweg korreliert, anstatt Anfragen isoliert zu prüfen, reduziert es Fehlalarme und den Verarbeitungsaufwand, der die zeitkritische API-Leistung beeinträchtigt.
Häufig gestellte Fragen
Aktien-, Termin- und Devisenmärkte sind die latenzempfindlichsten Märkte, auf denen algorithmische Strategien einen Großteil des Handelsvolumens ausmachen und kursbewegende Informationen sich innerhalb von Millisekunden verbreiten. Options- und Anleihemärkte haben im Zuge der zunehmenden algorithmischen Aktivität eine Infrastruktur mit geringer Latenz eingeführt. Kryptowährungsmärkte hinken der traditionellen Finanzwelt hinsichtlich der Verfügbarkeit von Colocation hinterher, was die erreichbare Mindestlatenz für Strategien mit digitalen Vermögenswerten einschränkt.
In den Vereinigten Staaten regelt die SEC-Verordnung NMS das National Market System und erlegt den Marktteilnehmern Verpflichtungen zur bestmöglichen Ausführung auf. Die FINRA-Regel 15c3-5 (die „Market Access Rule“) verpflichtet Broker-Dealer, Risikokontrollen für automatisierte Handelssysteme einzurichten. In Europa schreibt die MiFID II den Teilnehmern am algorithmischen Handel Teststandards, Risikokontrollen und Anforderungen an Schutzmechanismen vor. Die Einhaltung aller dieser Rahmenbedingungen erfordert, dass Unternehmen ihre Ausführungsgeschwindigkeit messen und dokumentieren.
Unternehmen messen die Latenz über alle Komponenten hinweg: Latenz des Marktdaten-Feeds, Verarbeitungszeit der Strategie und Round-Trip-Latenz der Order (von der Übermittlung bis zur Bestätigung). Testumgebungen bilden die Produktionsinfrastruktur ab, und durch kontinuierliche Überwachung werden Leistungseinbußen aufgrund von Software-Updates, Netzwerkänderungen oder Hardware-Umstellungen erkannt. Unternehmen nutzen zudem synthetische Orders und Zeitstempelvergleiche, um festzustellen, an welchen Stellen sich die Latenz im gesamten Stack aufbaut.
Public cloud führt zu Latenzschwellen, die weit außerhalb des Mikrosekundenbereichs liegen, den die geschwindigkeitskritischsten Strategien erfordern. Echte Colocation – die Unterbringung von Servern in derselben Einrichtung wie die Matching-Engines der Börsen – bleibt eine Domäne dedizierter lokaler oder Colocation-Rechenzentren. Hybride Modelle sind weit verbreitet, beispielsweise die Nutzung der Cloud für Backtesting, Strategieentwicklung und weniger latenzempfindliche Workloads sowie eine colokierte lokale Infrastruktur für den Live-Handel, der eine Ausführung im Sub-Millisekundenbereich erfordert.
Netzwerkanbieter bestimmen die Konnektivität zwischen Handelsinfrastruktur und Börsen sowie zwischen geografisch getrennten Handelsplätzen. Bei Strategien, die mehrere Handelsplätze umfassen – wie beispielsweise die Ausnutzung von Preisunterschieden zwischen Chicagoer Terminkontrakten und New Yorker Aktien –, legt der Netzwerkpfad die Mindestlatenz fest, bevor Optimierungen auf Systemebene zum Tragen kommen. Anbieter, die dedizierte Glasfaserstrecken, Mikrowellen- oder HF-Verbindungen sowie direkte Querverbindungen in großen Colocation-Zentren anbieten, ermöglichen Unternehmen einen Pfad mit der physikalisch geringstmöglichen Latenz für eine bestimmte Strecke.
Das hängt von der Strategie ab. Bei den meisten Handelsstrategien ist das Erreichen einer Latenz von unter einer Millisekunde das Ziel, insbesondere beim Hochfrequenz- und algorithmischen Handel, wobei sich eine Genauigkeit im Nanosekundenbereich zunehmend als Maßstab etabliert. Unternehmen, die große Aufträge mit minimalen Auswirkungen auf den Markt ausführen, können eine höhere Latenz tolerieren als HFT-Unternehmen, die reine Arbitrage-Strategien verfolgen.