DirectX 10 und 11 sind AFAIK in der Lage die Prozessorlast auch ohne entsprechende Programmierung auf die Kerne zu verteilen. Das geht natürlich erst ab Vista.
XP ist ohnehin nur ausgelegt, um maximal 2 Kerne zu nutzen. Übrigens auch mit ein Grund, warum die Portierung von DX10/11 auf XP aufgegeben wurde.
Wie gesagt: Die 4+4 "Kerne" teilen sich in dem Beispiel schon die Arbeit, aber es bringt keinen Geschwindigkeitsvorteil, weil die Software dafür nicht ausgelegt ist. Immerhin minimiert es nach meinem Wissensstand Ruckler und Ladezyklen, da die einzelnen Kerne so etwas mehr Puffer haben.