話題(スレッド): U+FF5E「~」と U+301C「〜」等の区別について

U+FF5E「~」と U+301C「〜」等の区別について (2011-09-07 03:01, miau, #59487)

Migu 1M をプログラミング等で使用しているのですが、表題のように
変換方式によって異なる文字に割り当てられるような文字の中に
区別がつきにくいものがいくつかあります。

すべての似たような文字で区別をつけるのは不可能だと思っていますが、
このように意図せず別の文字になってしまうケースについて、
それぞれの区別がつきやすいように字形を変更していただけないでしょうか?

参考までに、eucJP-open から Unicode へ
・Windows 風(eucJP-ms)に へ変換を行った場合
・それ以外(eucJP-0201、eucJP-ascii)で変換を行った場合
で差異がある文字の一覧を記載いたします。

eucJP-open Windows方式 それ以外で発生しえる変換先
0x5C U+005C \ U+00A5 ¥
0x7E U+007E ~ U+203E ‾
0xA1B1 U+FFE3  ̄ U+203E ‾
0xA1BD U+2015 ― U+2014 —*
0xA1C0 U+FF3C \ U+005C \
0xA1C1 U+FF5E ~ U+301C 〜**
0xA1C2 U+2225 ∥ U+2016 ‖
0xA1DD U+FF0D - U+2212 −*
0xA1EF U+FFE5 ¥ U+00A5 ¥
0xA1F1 U+FFE0 ¢ U+00A2 ¢*
0xA1F2 U+FFE1 £ U+00A3 £*
0xA2CC U+FFE2 ¬ U+00AC ¬*
0x8FA2B7 U+FF5E ~ U+007E ~
0x8FA2C3 U+FFE4 ¦ U+00A6 ¦

※「*」を付加したものについては、MS ゴシックでは半角で表示されており区別が可能になっています。
 (反面 U+2014 や U+2212 が U+002D「-」と区別つきにくくなっていますが・・・)
※「**」を付加したものについては、Windows XP 以前(?)では逆の波線で表示されており識別が容易でした。
 現在でも MS ゴシックのビットマップフォントでは、かろうじて識別が可能です。

これらの文字がすべて識別可能であればベストですが、
特に発生しやすい表題の 2 文字だけでも対応していただけると、非常に助かります。

メッセージ #59487 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: U+FF5E「~」と U+301C「〜」等の区別について (2011-10-02 20:41, itouhiro, #59899)

20111002版で、U+301Cだけ修正しました。
U+301Cの波線の向きを逆にしてあります。
あとの文字は、CJK Ambiguous widthなども考慮したいと思うので、これから検討します。
#59487 への返信

メッセージ #59899 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: U+FF5E「~」と U+301C「〜」等の区別について (2011-10-03 01:30, miau, #59910)

早速のご対応ありがとうございます。

「波線が逆向きに表示されて困る」とか「~ と同じ向きで表示されるべきだ」
みたいな意見が上がってきたら申し訳ないのですが、
個人的には区別がつきやすくなってすごく助かります。
#59899 への返信

メッセージ #59910 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: U+FF5E「~」と U+301C「〜」等の区別について (2012-04-12 00:13, itouhiro, #63190)

20120411版で、U+301C以外の文字も対応しました。
以下の画像をご参照ください。MS ゴシックとなるべく同じにしました。

http://f.hatena.ne.jp/itouhiro/20120412000737
(この画像で文字の高さが20111002と20120411版で違ってみえるのは、
 表示環境、フォント環境が違う(UbuntuLinux10.04+FreeType/Windows7+gdi++)
 ためであり、データ的には文字の高さは変わっていません)

その画像は以下のHTMLを表示したものです。
http://mix-mplus-ipa.sourceforge.jp/migu/20120118ambiguous.html
#59910 への返信

メッセージ #63190 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: U+FF5E「~」と U+301C「〜」等の区別について (2012-08-06 00:14, miau, #64958)

新バージョンに気づかず反応が遅くなってしまいました。
私の環境でも確認したのですが、期待どおりの動作になっています。

文字コードの細かい検証ではMS ゴシックに切り替えたりしていたのですが、
これで Migu 1M を常用できそうです。

わざわざご対応いただきありがとうございました。
#63190 への返信

メッセージ #64958 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: U+FF5E「~」と U+301C「〜」等の区別について (2012-09-10 14:02, k_e, #65458)

申し訳ありませんが、今作業しているプロジェクトではUTF-8テキストでは、WAVE DASHを使うように
統一されておりまして、非常に違和感があります。
MS ゴシックのほうもVista以降ではWAVE DASHの字形が修正されていますので、見た目のずれが
発生してしまいます。

元のバージョンも用意していただくわけにはいかないでしょうか?

よろしくお願いします。
#59910 への返信

メッセージ #65458 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: U+FF5E「~」と U+301C「〜」等の区別について (2012-09-11 18:00, itouhiro, #65467)

等幅フォントの話でしょうか? であれば「Migu 2MだけはWAVE DASH(U+301C)の字形をFULLWIDTH TILDE(U+FF5E)と同じにする」という案はどうでしょうか。もし、するとしても次回のリリースになりますが。

ただし次回を待たなくても、Miguフォントは改変可能ライセンスなので、ttfファイルを修正する手段もあります。FontForgeに読み込んでU+301Cを横方向に反転させてTrueType保存すればよいです。

参考画像: http://f.hatena.ne.jp/itouhiro/20120911175641
#65458 への返信

メッセージ #65467 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: U+FF5E「~」と U+301C「〜」等の区別について (2012-09-12 21:27, k_e, #65480)

お返事ありがとうございます。

ご指摘のとおり等幅フォントの話です。
Migu 2Mだけでも対応していただければ非常に助かります。

ttf修正も時間があれば試してみたいと思います。

ありがとうございました。
#65467 への返信

メッセージ #65480 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: U+FF5E「~」と U+301C「〜」等の区別について (2012-10-31 07:48, itouhiro, #66056)

20121030版で「Migu 2MだけはWAVE DASH(U+301C)の字形をFULLWIDTH TILDE(U+FF5E)と同じにする」に対応しました。
#65480 への返信

メッセージ #66056 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: U+FF5E「~」と U+301C「〜」等の区別について (2012-11-26 01:34, live-gon, #66420)

波ダッシュは「上がって下がる」が正しい字形で、XP等での誤った字形は Vista 以降で修正されていますし、Migu でも、上がって下がるの字形になって欲しいです。
まあ、つまり「~ と同じ向きで表示されるべきだ」という意見をここで述べさせていただきます。個人的区別をしたいのであれば、それこそフォントが改変可能なので、左右反転させればよいんじゃないかと。
#59910 への返信

メッセージ #66420 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: U+FF5E「~」と U+301C「〜」等の区別について (2012-11-26 15:36, itouhiro, #66427)

MiguフォントのWAVEDASHはこのままにする予定です。理由は、Miguフォントに「ほんらい同じ字形の文字でも、別のコードを割り当てられているなら、なるべく違う字形にしたい(漢数字の一と長音のーなど)」という方針を持たせているからです。
不満がある人はMigMix使ってくださればよいと考えています。

それに、MiguフォントのWAVEDASHはUnicode仕様書どおりです。Unicodeフォントとして、まちがってはいないのです。Unicode仕様書を直すのは http://slashdot.jp/~yasuoka/journal/357074 みると難しいみたいですね。

あと個人的には、現在Windowsの市場占有率が高いこと、私がWindowsユーザーだというのもあります。Windowsが衰退して日本語の波ダッシュをUnicodeのWAVEDASHとして入力する人が多数派になるようなら再考したいですね。
#66420 への返信

メッセージ #66427 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: U+FF5E「~」と U+301C「〜」等の区別について (2012-11-26 20:07, live-gon, #66433)

Migu フォントが間違っている、といっているわけではないです。リンク先にある通り(Wikipedia にも記述がありますが)UNICODE 仕様書の例示字形が間違っていて、徐々に各OSのフォントが正しく対応していっている、という状況のようです。
個人的には、波の左右反転じゃない方向で差異が付くとありがたいのですが(各「横棒」の差異のように)、Migu の方針については了解しました。回答ありがとうございます。
#66427 への返信

メッセージ #66433 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: U+FF5E「~」と U+301C「〜」等の区別について (2015-07-12 16:05, itouhiro, #76515)

20150712版でMiguフォントの U+301C(WAVEDASH) と U+FF5E(FULLWIDTH TILDE) の字形を変更しました。
理由は以下です。

・Unicode仕様書でWAVEDASHの字形が修正された。
  http://internet.watch.impress.co.jp/docs/special/20150307_691658.html
・IT市場の中心がモバイルになり、モバイル環境でWindowsの存在感がなくなった。

Unicode仕様書ではU+FF5EとU+301Cが同じ字形になると思いますが、Miguフォントは以下のように見分けがつくようにしました。

・U+301C(WAVEDASH)はM+のオリジナル字形を使用する。
・U+FF5E(FULLWIDTH TILDE) はU+301Cの字形を元に、上下をより振幅させた改変字形とする。
#66433 への返信

メッセージ #76515 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする