これではなくて https://www.w3.org/2001/06/utf-8-test/UTF-8-demo.html
うー、とにかくおかしなUTF-8というのを集めたテスト用のファイルをどっかで見てるんだよ…
これだ!
UTF-8 decoder capability and stress test https://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-test.txt
とはいえ、UTF-8 decoder capability and stress testであっても、下位サロゲート→上位サロゲートの順に記述した場合のテストは無い。
というか、UTF-8においてはサロゲートペアの概念は無い(使わない)のでサロゲートペアを示すエンコードが行われたとしてもマトモに表示できなくて当然…で良いんだよね?