はじめてのにき(2008-09-16)

2008-09-16

_ イベントvsスレッド

http://morihyphen.hp.infoseek.co.jp/log2/200809.html#091530

あー説得されるなぁ。このへんは考えるたびに違う結論になる気がするんだよな。今はスレッド派。 woさんと想定してる例が全然違う感じがして、結局適材適所的なんじゃないかと思ったりとか。一度イベント派vsスレッド派の宗教闘争とかするべきだな。

とりあえず前教えてもらった正反対の主張をはっておく。

http://www.spa.is.uec.ac.jp/~kinuko/survey/body/events-are-bad.html

で、この話で僕がとりあえず最初に想定するのは webサーバ的なサーバで、サーバの main thread が accept した fd を別スレッド以下 slave とでも呼ぶに渡すとかそういう。で、そいうモデルだと slave から main の方に送るデータってほとんど無いあたりで、違いが出てくるのかなぁ。データが密接に絡めが絡むほどスレッドの方が不利になってくるのは真だと思うし。

で少なくともこいうモデル考えてる時は、状態遷移表とかきちんとやらんでもうやむやにしきれちゃうケースが多いんじゃないかなぁ…と思う。

とりあえずこっち系モデルでぱっと思いつくイベントうざい例として、

void handleRequestSimple(int fd) {
  read(fd);
  // hogehoge
  write(fd);
}

とかいう関数をリクエストが来るたびに呼ぶとする。スレッドの方は

threadLibrary.create(&handleRequest);

とかしてて(もちろん現実的には thread pool なんだろうけど)、イベントの方は

eventLibrary.register(&handleRequest);

とかしてる感じだとする。

hogehoge が簡単な処理なら良いんだけど、例えば proxy みたいに他のサーバからデータ取ってくるようなケースだとすると、スレッドなら

void handleRequest(int fd) {
  read(fd);
  foo();
  requestAnotherServer();
  bar();
  write(fd);
}

とかそのまま書きゃいいわけだけど、イベントの方だと、

void handleRequestDone(int fd) {
  bar();
  write(fd);
}

void handleRequest(int fd) {
  read(fd);
  foo();
  requestAnotherServerAsync(bind(handleRequestDone, fd));
}

とかになるのかな。まずこの関数増やすとかうざいんだけど、それはまぁ問題ないとして、例えば bar がバグってた時に本当にうざいんだよな。スタックトレースとか見ると、スレッドの方は、

bar
handleRequest
thread_main

とかになるのかな。で、イベントの方は、

bar
handleRequestDone
EventLibrary::loop
...
main

とかになって、これだと何がイヤだって言うと誰が handleRequestDone を呼んだのかわかんなくなってるっていう点。手続き的な思考に慣れてる身としては、気持ち的には handleRequestDone は handleRequest が呼んでるつもりだったんだけど、それがスタックトレースに無くて、バグを追跡しにくい、っていうような。

何かしら callback というのは書く方もイマイチだと思うけど、少なくとも第三者によるコードの可読性を損ねるというのはほぼ間違いないんじゃないかと思う。

まぁでもこのへんは僕のわかる範囲でも偏った議論で、デバッガがイベントモデルサポートみたいなのを入れてくれればいいんじゃね、スレッドはほどほどのサポートあるんだから不公平な比較だ、みたいな話と、スレッドは無限に作るわけにはいかない、っていう話がある。

後者の方はつまり、 thread pool に thread がえーとさっきの論文紹介によると10万スレッドあるとして、いやそんだけあったら大丈夫だろ…って感じがするけど、その10万全てがその全てが requestAnotherServer に使われてしまうと、 requestAnotherServer を伴わないような、簡単な処理 handleRequestSimple とかをする余裕があるのにできなくなってしまって、結局イベントモデル的なものを併用しなくちゃいけなくなる、っていう話。いやまぁ10万スレッドあるなら大丈夫な気もするが…

あとまぁどうでもいいけど重要な話として、 10万スレッドもあるとデバッグが別の意味でムズいという話が。つまりどれが重要なスレッドなのかさっぱりわからなくて、デバッガなどでスタックトレース見る時にどのスレッド見ればいいのー的な。まぁこれもデバッガおよびランタイムが賢くなればなんとかなるか。

あとまぁレースコンディションとかあると再現しにくいバグが出うるっていう wo さんの指摘はその通りだと思うし、

あーうーんやっぱ適材適所的な感じなのかなぁ。スレッドベースの GUI ライブラリとかあるのかな。キーボードを待つスレッドとマウスを待つスレッドと… みたいなの。

ふーむ

(09:51)

_ イテレータとスレッド論争

http://twitter.com/kinaba/statuses/922906127

これ微妙に面白いなぁ本質的ではなさそうだけど例えとしてはなんかよくわかる。

しかし考えるとすぐによくわからんくなるので、一度俺はスレッドの明日を守る守護神であるという設定で wo さんととっくみあいが起きる程度の論争とかすべきなんだと思う。

まーでも適材適所くさい気がするなぁ。僕がよく見るような、単一の機能を提供してるようなサーバとか、裏でなんかしつつユーザになんか見せる、とかその程度の単順なサーバだとたいていスレッドの方が良さげに思う。

あと上に書いたような、ユーザのリクエスト処理してる間に時間かかる処理しなきゃなんないような、つまるところプロキシサーバみたいな物体も割とスレッドな物体じゃないかなぁと思う。あとユーザが長時間セッションをはってコマンドを順々に叩いてくるような物体も、手続き的に書けるって意味でまぁ嬉しいかな。

で、複雑に内部状態を変更しつつも長時間かかる IO があるようなものはどうすればいいのだろうね…

あとそうだ。小さいものは貧乏症的な意味で thread 使いたくない。 sevilwm の ipc 部分は thread で書いた方がラクだったと思うけど、そういう理由で select でやってる。

(23:56)

_ ここらで

scheme の人が言及
shiro さん降臨

というような流れがあると考えなくてすんで大変嬉しい。

(23:57)

本日のツッコミ(全2件) [ツッコミを入れる]

_ wo (2014-05-24 05:24)

可読性については、↓継続があれば綺麗に書けるという話があるので、イベントでもスレッドでもあまり差は無いと思います。
http://www.seas.upenn.edu/~lipeng/homepage/unify.html
現状Haskellしか実装無いとか、デバッガが対応してないとかは確かにそうですが、理想的には差が無いはずです。
で、可読性に差が無いのであれば、マルチスレッド特有の問題をわざわざ持ち込む必要は無いので、コンパイラやランタイムが完成してる理想世界では、マルチスレッド必要無しは主張できるかと。
と、書いてて「記述しやすいかどうか」の問題と「プリエンプティブか否か」の問題の気がしてきたので、「イベント vs マルチスレッド」という対立がちょっと問題をややこしくしてる気がが。

_ shinh (2014-05-24 05:24)

あーなるほど calback が継続になっちゃうのですね…要は thread みたいな書き方でイベント的に書けちゃう、と。なんとなくあっさりと完全に説得された気がします。「プリエンプティブか否か」だけまで問題が落ちれば、速度以外にはスレッドのメリット無い、気がしますね。

要は速度気にしないならコルーチンマンセー的な感じですかね…

とっくみあいをすることなく負けてしまった。

ツッコミ・コメントがあればどうぞ! E-mailアドレスは公開されません。

本日のリンク元

全てリンクフリーです。コード片は自由に使用していただいて構いません。その他のものはGPL扱いであればあらゆる使用に関して文句は言いません。なにかあれば下記メールアドレスへ。


		2008年 9月
日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30