Large-Language-Modelle haben einen immensen Bedarf an Rechenleistung. Wir zeigen, wie man mit Apples Metal-API sequenziellen Code von der CPU auf die GPU lädt.