ToDo:
https://r25.jp/article/560392031878166383
そうそう、やっぱホリエモンいい人ぽいよね、と思ったけど、よく考えると割と普通のことばっか書いてあった
映画のジャイアンみたいな…
(17:14)
適当に色々走らせてみる。
CPU-avx2-256 50.062899 GFLOPS t=150 CPU-avx2-512 36.600433 GFLOPS t=14 CPU-avx2-1024 41.914810 GFLOPS t=10 CPU-blas-256 245.587644 GFLOPS t=732 CPU-blas-512 359.621543 GFLOPS t=134 CPU-blas-1024 507.372811 GFLOPS t=24 GPU-mine-64 64.069479 GFLOPS t=12221 GPU-mine-256 246.106109 GFLOPS t=734 GPU-mine-1024 137.683075 GFLOPS t=10 GPU-cublas-64 68.099346 GFLOPS t=12989 GPU-cublas-256 1666.332399 GFLOPS t=4967 GPU-cublas-1024 3462.507099 GFLOPS t=162
CPU-avx2 は Haswell 向けになかむらさんの文章見て適当に書いたコード。当時は BLAS とここまで差が無かったと思うし、なんかヘンなので後で見る。
GPU-mine はもっとどうでもいい、本気で適当に書いたもの。おいおいこんな適当なコードで BLAS に勝つんかと思った
GPU 自体は GTX 1060 3GB というやつで、 Pascal 世代らしい。 1152 コアで最大 1.76GHz 。理論は 4TFLOPS らしい?
次は、最近買ったノートPCにて
CPU-avx2-256 37.796423 GFLOPS t=113 CPU-avx2-512 26.427590 GFLOPS t=10 CPU-avx2-1024 36.619350 GFLOPS t=10 CPU-blas-256 4.165613 GFLOPS t=13 CPU-blas-512 4.127086 GFLOPS t=10 CPU-blas-1024 3.944004 GFLOPS t=2 GPU-mine-64 29.070758 GFLOPS t=5545 GPU-mine-256 57.308421 GFLOPS t=172 GPU-mine-1024 20.952593 GFLOPS t=10 GPU-cublas-64 46.641611 GFLOPS t=8897 GPU-cublas-256 505.182081 GFLOPS t=1506 GPU-cublas-1024 1028.495491 GFLOPS t=48
CPU-blas の成績は明らかにおかしい。 GPU は MX150 というやつで、こいつも Pascal 世代らしい。 384 コアで最大 1.04Ghz 。理論(?) 1.127 TFLOPS、かな?
10 万強で 1kg 強の ノート PC で TFLOPS 出てるんだなあ
(22:58)
前 | 2018年 7月 |
次 | ||||
日 | 月 | 火 | 水 | 木 | 金 | 土 |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
全てリンクフリーです。 コード片は自由に使用していただいて構いません。 その他のものはGPL扱いであればあらゆる使用に関して文句は言いません。 なにかあれば下記メールアドレスへ。