MacBook Airを入手したので。NSS (https://developer.mozilla.org/en-US/docs/Mozilla/Projects/NSS) に含まれるbltestでのベンチデータ。比較対象にAWSのm6g.mediumのデータを置いておく
Apple M1 with ARM Crypto Extension (xcode's clang)
# mode in symmkey opreps cxreps context op time(sec) thrgput
aes_ecb_e 24Gb 256 1B 0 0.000 10000.000 10.001 2Gb
aes_ecb_d 23Gb 256 1B 0 0.000 10000.000 10.000 2Gb
aes_cbc_e 7Gb 256 532M 0 0.000 10000.000 10.000 812Mb
aes_cbc_d 24Gb 256 1B 0 0.000 10000.000 10.001 2Gb
# mode in opreps cxreps context op time(sec) thrgput
sha1_e 8Gb 282M 0 0.000 10000.000 10.000 861Mb
sha256_e 8Gb 155M 0 0.000 10000.000 10.000 828Mb
AWS m6g.medium with ARM Crypto Extension (Ubuntu's clang 10)
# mode in symmkey opreps cxreps context op time(sec) thrgput
aes_ecb_e 8Gb 256 550M 0 0.000 10000.000 10.000 840Mb
aes_ecb_d 7Gb 256 502M 0 0.000 10000.000 10.000 766Mb
aes_cbc_e 6Gb 256 465M 0 0.000 10000.000 10.000 710Mb
aes_cbc_d 6Gb 256 442M 0 0.000 10002.000 10.002 674Mb
# mode in opreps cxreps context op time(sec) thrgput
sha1_e 4Gb 141M 0 0.000 10000.000 10.000 430Mb
sha256_e 3Gb 66M 0 0.000 10000.000 10.000 354Mb
AES-CBCモードのEncryptionだけなぜか遅いという結果。ECBモードだと変わらないので、clangが生成したコードがApple M1のパイプラインでペナルティが発生するような状態と推測される。
なお、ARM Crypto Extensionを無効にすることもできるので、その場合。
Apple M1 without ARM Crypto Extension
# mode in symmkey opreps cxreps context op time(sec) thrgput
aes_ecb_e 2Gb 256 155M 0 0.000 10000.000 10.000 236Mb
aes_ecb_d 2Gb 256 143M 0 0.000 10000.000 10.001 218Mb
aes_cbc_e 1Gb 256 133M 0 0.000 10000.000 10.000 203Mb
aes_cbc_d 1Gb 256 130M 0 0.000 10000.000 10.000 199Mb
# mode in opreps cxreps context op time(sec) thrgput
sha1_e 3Gb 108M 0 0.000 10000.000 10.000 331Mb
sha256_e 1Gb 21M 0 0.000 10000.000 10.000 113Mb
AWS m6g.medium without ARM Crypto Extension
# mode in symmkey opreps cxreps context op time(sec) thrgput
aes_ecb_e 1Gb 256 82M 0 0.000 10000.000 10.000 126Mb
aes_ecb_d 1Gb 256 80M 0 0.000 10000.000 10.000 122Mb
aes_cbc_e 1Gb 256 81M 0 0.000 10000.000 10.000 124Mb
aes_cbc_d 1Gb 256 73M 0 0.000 10000.000 10.000 112Mb
# mode in opreps cxreps context op time(sec) thrgput
sha1_e 1Gb 45M 0 0.000 10000.000 10.000 139Mb
sha256_e 872Mb 16M 0 0.000 10000.000 10.000 87Mb
0 件のコメント:
コメントを投稿