Klingt für mich mehr nach einer sehr groben Einschätzung ohne technischen Background. Ich halte die Annahme sogar für falsch.
Man muss unterscheiden zwischen Audio Raytracing und dem 3D Sound. Cerny hat das ganz klar nicht in einen Topf geworfen, er sagte im RT Abschnitt etwas von man kann es für Audio einsetzen und braucht dafür nur relativ wenig RT Performance. Schatten und Reflektionen brauchen deutlich mehr. Da unterscheiden sich die Konsolen nicht sonderlich, beide brauchen die RT Cores hier. Diese Berechnungen dienen dazu, herauszufinden, woher Ton kommen kann, wie er durch die Umgebung gebrochen wird und so weiter.
Was die Tempest Engine macht ist ein ganz anderer Bereich. Hier werden die positionalen Informationen aus obigen Berechnungen hinein gegeben, zusammen mit den programmatischen seitens der Entwickler. Diese Informationen werden dann auf das virtuelle Kopfmodell umgerechnet, was dem Benutzer möglichst gut entsprechen soll (5 Profile zum Launch, später vermutlich mehr, jeder wählt das möglichst ähnliche aus). Das beeinflusst "nur", wie der Ton an die Ohren weitergegeben wird, um eine Räumlichkeit zu simulieren. In diesem Bereich macht Microsoft AFAIK gar nichts.
EDIT: nicht ganz, sie haben auch noch dedizierte Hardware zur Tonberechnung:
Project Acoustics – Incubated over a decade by Microsoft Research,
Project Acoustics accurately models sound propagation physics in mixed reality and games, employed by many AAA experiences today. It is unique in simulating wave effects like diffraction in complex scene geometries without straining CPU, enabling a much more immersive and lifelike auditory experience. Plug-in support for both the Unity and Unreal game engines empower the sound designer with expressive controls to mold reality. Developers will be able to easily leverage Project Acoustics with Xbox Series X through the addition of a new custom audio hardware block.
Aber von HRTF ist da nicht die Rede.