Shiro Kawai
shiro****@lava*****
2002年 11月 19日 (火) 18:59:13 JST
不完全な文字列に関してもう少し考えてみたんですが、 ゴミコードの処理はportに全部任せるのが良いような 気がしてきました。 外から取り込むデータは必ずportを通るわけですし、 内部で生成される文字列でもstring portの使用を推奨 しています。read-block等で取り込んだ不完全な文字列を スキャンする場合でも、string portでやれますし、 効率も悪くはないはずです。 書きかけで放ってあるのですが、portがイリーガルな 文字コードを見た時に取るアクションをカスタマイズ できるようにする予定です。 そうすれば、文字列には完全な文字列かバイト列しか無い、 と割り切って、セマンティクスも明確になりそうです。 --shiro From: Kimura Fuyuki <fuyuk****@hadal*****> Subject: Re: [Gauche-devel-jp] incomplete-string Date: Sat, 16 Nov 2002 20:21:14 +0900 > 私は基本的に後者のつもりで理解していました。つまり、 > > complete string == character stream > incomplete string == byte stream (1バイト文字しか扱わない処理系の文字列) > > しかしどうも前者のような挙動をしてくれる箇所があるので、こりゃなんでか > なと。不完全な文字列でも内部的に勝手にコード変換したりしてくれそうな気 > がしてちょっと使うのが怖かったです。まあ md5 を書いて大丈夫そうなのは > わかりましたが。 > > 個人的にはバイトストリング案に賛成ですが、実際問題ゴミコード混じりのメー > ルなんかが山ほど来ることを考えると、なかなかそう単純化するわけにはいか > ないもしれません。