<< 11/22 >>
First Last

matmul

XLAなし: 249.18 GFLOPS
XLAあり: 240.35 GFLOPS (3.6%遅い、多少レイテンシがあるぽい)

 def gen_graph():
     N = 1024
     a = tf.Variable(tf.random_normal([N, N]), name='a')
     b = tf.Variable(tf.random_normal([N, N]), name='b')
     r = tf.matmul(a, b, name='result')
     return r