Professionelles Audio und Linux sind keine Gegensätze. Das Audiosystem besteht aus verschiedenen Ebenen und Soundservern, die man kennen und richtig einsetzen sollte. Was genau sind Alsa, Pulseaudio, Pipewire und Jack? Wie arbeiten sie zusammen (oder auch nicht) und welche ist die beste Audioschnittstelle für professionelles Audio mit Linux?
Inhaltsverzeichnis
Audio-Schnittstellen unter Linux
- ALSA ist die Basis für Audio bei nahezu allen Linux-Systemen und ist im Kernel integriert. Sowohl PCM-Audio und MIDI werden darüber grundlegend ermöglicht. ALSA kann nur mit einem anderen Gerät/Programm kommunizieren.
- Pulseaudio ist ein sogenanntes Audio-Framework, das auf ALSA aufbaut. Es ist vereinfacht gesagt die Schnittstelle zu Desktop-Software, etwa Browser oder Mediaplayer, dass mehrere Quellen gleichzeitig Sound ausgeben können. PulseAudio unterstützt nur Ausgabe.
- Pipewire soll/wird irgendwann Pulseaudio ablösen, manche Distributionen wie Fedora haben den Schritt bereits hinter sich. Pipewire geht etwas besser mit CPU-Systemressourcen um, funktioniert stabiler mit Bluetooth und soll Probleme mit JACK-Verbindungen zum Desktop-Audio beheben.
- JACK ist die professionell eingesetzte Audio-Schnittstelle, die ua. vom Ardour-Entwickler mitentwickelt wurde. JACK ermöglicht low-latency Audio und MIDI – quasi Echtzeit-Audio bei geringen Latenzen. Außerdem lassen sich Programme mit JACK-Schnittstelle untereinander verbinden und können so Audio- und MIDI-Daten austauschen.
Unterschiede zu Windows und macOS
Mit macOS ist es einfach: Es gibt nur CoreAudio — für Consumer und Pro-Audio für Echtzeit-Audio. Wer mehrere Interfaces nutzen möchte nutzt zB. Blackhole. CoreAudio wurde von Apple entwickelt und ist seit Jahren Standard und funktioniert zuverlässig. Alternativen gibt es nicht.
Windows nutzt verschiedene Audio-Schnittstellen: WSS, Wasapi, WDM und ASIO. Wobei ASIO nicht von Microsoft, sondern von Steinberg (dem Entwicklungsstudio hinter der DAW Cubase und dem VST-Plugin-Standard) für Windows entwickelt wurde. ASIO ermöglicht Quasi-Echtzeitaudio für Audioanwendungen mit verträglichen Latenzen.
Linux Audio für Profis: Welche Schnittstelle ist die richtige für mich?
Dank JACK ist es möglich, Audio professionell mit Linux in nahezu-Echtzeit zu verarbeiten. ALSA ist mit einem einzigen, nutzbaren Gerät ist für viele Anwendungsgebiete zu beschränkt. PulseAudio beherrscht kein MIDI und kann auch nicht als Recording-Schnittstelle genutzt werden.
Nutzt die DAW Ardour beispielsweise ALSA, kann PulseAudio nicht mehr ALSA verwenden und es kommen keine Systemsounds oder Klänge aus dem Browser mehr zu den Boxen. Das passiert auch, wenn JACK selbst ALSA „blockiert“ — doch dafür gibt es Software-Brücken, mit denen Systemsounds trotzdem über JACK abgespielt werden. Etwa, wenn du einen Song laufen lässt, und dazu Gitarre spielen möchtest. Oder einen virtuellen Synthesizer auf Drums.
Über den Daumen gepeilt lässt sich festhalten:
- Nutzt du nur die DAW und sonst nichts, ist ALSA die Plattform deiner Wahl
- PipeWire steckt momentan für professionelles Audio noch in den Kinderschuhen und führt auf verschiedenen Systemen noch zu regelmäigen Abstürzen und ist im Zusammenspiel mit DAWs mit großer Vorsicht zu genießen. (Stand 02/2023) Routing kann über qpwgraph erfolgen.
- Sollen Klänge anderer Programme in der DAW aufgenommen werden, etwa virtuelle Klangerzeuger wie ein Standalone-Synthesizer oder Guitarix als Gitarrenverstärler-Simulation, führt kein Weg an JACK vorbei. Über Programme wie qjackctl oder Cadence verwaltest und startest du JACK und ziehst beispielsweise mit Catia virtuelle Strippen. Alternativ geht das alles auch über das Terminal — aber wer gibt sich das freiwillig? (Bitte in dem Fall Kommentar scheiben – ich will die Vorteile kennen lernen!)
- Willst du nur Mischen, dannist PulseAudio grundlegend genau so gut, wie die anderen Systeme.
(M)ein Wunsch als Content Creator an die Entwicklerstudios:
So sehr ich mein Linux-System mag und als alternativlos erachte: Aktuell ist es umständlicher mit Linux, professionelles Audio an den Start zu bringen. Es funktioniert dann jedoch tadellos und in meinen Messungen sogar mit geringerer Latenz als mit offiziellen ASIO-Treibern unter Windows 10.
Ohne die hervorragende Arbeit der ALSA- und JACK-Teams würde (Pro-)Audio unter Linux sehr alt aussehen. Ein großes Danke an dieser Stelle.
Wünschenswert wäre ein einziges, stabil und flexibel einsetzbares Audio-System wie unter macOS. Ein Mix aus ALSA und JACK. Ob es dann ALSA2, ALCK oder JASA heißt … eigentlich egal. Hauptsache es wird einmal angedacht – aus Nutzersicht wäre es ein Zugewinn, wenn es ähnlich gut wie Core Audio funktioniert. Selbst ASIO ist einfacher zu handhaben.
Wäre das mit Linux auch so einfach, würde eine Einstiegshürde für viele wegfallen. Zwar sind Multimedia-Distributionen ein Zwischenschritt, aber die Superlösung ist das auch nicht. Zwangs-DIY gehört zwar zur Linux-Kultur irgendwie dazu, ich würde als Kreativschaffender eine einfach nutzbare Variante trotzdem besser finden. Denn ein Betriebssystem ist für die meisten ein Werkzeug und keine Beschäftigungstherapie.
Danke – mir war nie so ganz klar, wie sich die Systeme unterscheiden.
Und ja, ich bastele zwar gerne an Linux rum, aber ich bin auch nicht in erster Linie Musiker. Und jedes Mal diesen Audiokram aufzusetzen finde ich auch etwas mühsam.
Habe gerade vorgestern mit JJazzlab was machen wollen und musste da auch erstmal ein Midigerät über JACK mit der Soundausgabe koppeln…
… womit wir zum Strippenziehen in der Konsole kommen: in der Anleitung, wurde genau das beschrieben – das ist meiner Meinung nach der einzige Vorteil, da man nicht sagen muss „Dann von oben rechts das rote Kabel an HW:1,0 anfügen…“; Text mit Text finde ich da einfacher als von einem Bild auf ein anderes, ggf. ganz anders aussehendes zu übertragen.
Als Frau in der Branche muss ich dir danke sagen. Ich finde Gendern auf diesem Blog toll, die Linux-Szene ist leider voller Männer und männlicher Ansichten. Bitte weiter machen, für mich ein Grund, diesen Blog meinen Kolleginnen zu zeigen. Gerne mehr zu 3D-Animation.
Für 3D-Animation bin ich leider nicht der Richtige, da ich damit selbst keine Berührungspunkte habe. Ich hoffe immer noch auf eine Person, die sich dem Thema für diesen Blog annehemen kann.
Du Schreibst:
(M)ein Wunsch als Content Creator an die Entwicklerstudios: usw.
Pipewire ist genau das. Extrem mächtig und gut gemacht. Ich nutzte es seit ca. 2 Jahren absolut problemlos.
Es braucht nur etwas einlesen und Verständnis um es sicher zu nutzen.
Das galt Seinerzeit aber auch für Jack.
Die Pipewire Wicki und die von Arch sind sehr zu empfehlen, auch für andere Distros.
Für mich hat es sich extrem gelohnt. Seit ich es verstanden habe ist Ruhe eingekehrt……
Vielen Dank für einen weiteren tollen Artikel!
Das ist der Knackpunkt an der Sache. Solange Einlesen Pflicht ist (und es eben aktuell im Pro-Audio-Bereich zuverlässig zu fehlern führt) ist es (noch) nicht gut genug. Aber es wird.
Naja, ich komme aus einer Zeit, in der ohne lesen am Rechner gar nichts ging, wenn Audio das Thema war. Aber auch heute ist lesen sehr gut um etwas zu verstehen. Bei mir läuft Pipewire extrem stabil und das seit 2 Jahren. Leider erwarten wir immer, dass es ohne Aufwand einfach so geht. Dadurch sind wir extrem abhängig von denen die es und vorsetzten. Aber das ist ein anderes Thema…… Lesen und verstehen hat enorme Vorteile, ist aber Aufwendig.
Grüße
Ich verstehe, was du meinst. Ich empfinde es aber nicht zwingend als „abhängig sein“, wenn Software funktioniert. Klar sind wir alle auf Andere angewiesen, egal ob Big Tech Konzern oder OS-Dev in seinem Schlafzimmer. Du bist abhängig von den Hardware-Firmen, den entsprechenden Treibern zur hochkomplexen Technik. Das lässt sich zwar alles selbst stricken, aber die Frage ist, ob der Aufwand sich am Ende rechtfertigt. Am Ende bin ich Nutzer und möchte kein Dev sein. Ich möchte auch in einem Haus wohnen und es nicht bauen, auch wenn mir bei beidem die Grundlagen bekannt sind. Andere können das besser und man kann nicht alles beherrschen. Abhängigkeit minimieren finde ich immer gut – und ich kenne auch das Phänomen Handbuch/RTFM, auch wenn ich die 1980er nicht mit der damaligen Computertechnik erlebt habe, sondern erst in den 1990ern an die Tasten gelassen wurde.
Nutzt du Pipewire als Pro-Audio-Schnittstelle oder als Alltags-Audio-System? Letzteres ist problemlos für mich möglich, aber mit 16-Ch-In Interfaces, die mit JACK/ALSA problemlos und geringster Latenz ohne XRUNS funktionieren, hatte ich trotz stundenlanger Config-Fummelei mit Pipewire nur Probleme und bin nicht zum Ziel gekommen. Vielleicht gebe ich der Sache zeitnah nochmal eine Chance.
Hallo Claudius.
Ich nutze Pipewire auch als Pro Audio Schnittstelle bis runter zu 64 Samples. Je nach dem was ich gerade mache. Manchmal binde ich darüber auch mehrere Interface gemeinsam ein. ZB Tascam 16×08 und Motu M4. Das allerdings mit Bitwig was Pipewire nativ unterstützt.
Melde die Karten mit dem Pulseaudio-Lautstärke Programm als Pro Audio Karten im System an.