XLAなし: 249.18 GFLOPS
XLAあり: 240.35 GFLOPS (3.6%遅い、多少レイテンシがあるぽい)
def gen_graph():
N = 1024
a = tf.Variable(tf.random_normal([N, N]), name='a')
b = tf.Variable(tf.random_normal([N, N]), name='b')
r = tf.matmul(a, b, name='result')
return r