Queste sono le volte che vorrei il forum avesse un discord od una chat vocale. Vengo da 12 ore di correzione di codice e le mie dita sono al limite

.
Quindi mi limiterò a rispondere in modo estremamente succinto.
1) No non serve che riesca a correggere errori enormi. Si usa una strategia mista che da un lato sfrutta i dati del motion capture, dall'altro un essere umano che vada a sistemare i problemi più evidenti. Se vedi l'effetto si estende in modo progressivo a diverse parti del corpo molto separate fra di loro come i singoli arti. Questo consente di avere un sistema di riferimento locale (o meglio un insieme di essi) per il movimento più facile da matchare individualmente ed evitare "effetti di bordo" con pezzi di arti dislocati. Ed hanno usato una sorta di tagli nascosti per nascondere le transizioni se noti. Mi rendo conto che la risposta è un po' vaga, ma spiegarlo meglio significa scrivere un papiro

.
E comunque saresti sopreso della consistenza con cui una persona è in grado di ripetere una coreografia. Non ho mai fatto danza in modo serio, ma la mia esperienza col karate è che è estremamente facile una volta che sai muovere il tuo corpo riprodurre movimenti in modo ripetibile.
>>>se il software ha questa capacità di correggere l'imperfetto accoppiamento delle due riprese, non dovrebbe poter essere in grado di estrarre tutta l'informazione dal video "normale"?
Ci sono dei papers di machine learning su questo che lavorano con singoli stream di immagini e provano ad indovinare la profondità di ogni punto ed animare uno scheletro, ma in generale no, si usano sistemi di tracking esterni con multiple camere per avere angoli diversi e risolvere il soggetto in 3d. Ed un sacco di intervento umano come dicevo prima. La tecnologia non è ancora al livello da poter automatizzare questi step del tutto.
2) Ci sono un po' di tecniche diverse, personalmente farei delle foto ad alta risoluzione della modella da più angoli e li applicherei al manichino nelle parti ancora "umane". Quello che vedi fra i vari buchi è sostanzialmente la texture applicata sulle parti tenute solide.