フォーラム: 公開討議 (スレッド #37777)

OED EPWING辞書の完全一致検索等について (2016-06-08 11:54 by kunio40 #78153)

大久保様

OED EPWING辞書を愛用させていただいております。
EBwin Ver.4.3.2.0で検索していて気付いたのですが、見出し語が「chromosome Biol.」、「chromosphere Astron.」、「chromotype Photogr.」、「metopomancy Obs.」などで、chromosomeなどの第1単語を完全一致検索するとヒットしませんが、前方一致検索するとヒットします。
ちなみに、「logocentrism, n. Linguistic Philos.」の場合、完全一致、前方一致両検索でヒットします。
検索プログラム上、品詞の有無がキーになっているのでしょうか。
また、metopomancyについては、OEDでは、
[f. Gr. µέτωπο-ν forehead + µαντεία divination: see -mancy.]
のところ、EBwinでは、
[f. Gr. µ?τωπο-ν forehead + µαντε?α divination: see -mancy.]
と文字化けがあります。
なにか解決策があるのでしょうか。

メッセージ #78153 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: OED EPWING辞書の完全一致検索等について (2016-06-08 20:22 by ohkubo-k #78159)

ご利用ありがとうございます。

[メッセージ #78153 への返信]
> 検索プログラム上、品詞の有無がキーになっているのでしょうか。

はい。
久しぶりにプログラムを見直したところ、品詞の前に付く , がカギでした。
全文コピペしているため、文字が斜体や太字になっているかの情報は失われます。
仕方が無いので、私の変換プログラムでは見出し行(その項目の一行目)について
・, があれば、行頭からそれまでを見出しとする
・, がなければ、行全体を見出し語とする
としていました。
このため
・「logocentrism, n. Linguistic Philos.」の見出し語は "logocentrism"
・「chromosome Biol.」の見出し語はそれ全体
になっていました。
完全一致での振る舞いの違いは、このためです。

OEDの見出し語行について、改めて調べてみました。
たとえば "† aa1 Obs." という見出し行は、実際は"† aa1"だけが見出し語で、"Obs." は斜体での追加情報です。
OEDの見出しは、常に単一の単語からなるのか調べたところ、
  Achilles' heel
  Achilles' tendon
のように、そうでないものもありました。少ないとはいえ、OEDですので大量にあるはずです。
とはいえ、" Obs.", "Geol." などは、明らかに見出し語ではありません。
こういう自明の語については、見出し語から除くようにした改良した方が良さそうです。

-----------------------------------
† aa1 Obs.
‖ aa2 Geol.
‖ aandblom S. Afr.
aaron2 Herb.
Aaron's-beard Herb.
Aaron's Rod
† ab1 Obs. rare—1.
‖ abaciscus Arch.
abaction rare.
† abactor Obs.
‖ abaculus Arch.
† abada Obs.
† abaisance Obs.
abalone U.S.
A band Histology.
‖ abandeˈrado Obs.
‖ abandum Law.
・・・・
---------------------------------

> また、metopomancyについては、OEDでは、
> [f. Gr. µέτωπο-ν forehead + µαντεία divination: see -mancy.]
> のところ、EBwinでは、
> [f. Gr. µ?τωπο-ν forehead + µαντε?α divination: see -mancy.]
> と文字化けがあります。
> なにか解決策があるのでしょうか。

これは私の変換プログラムのミスです。
άέήίΰϊϋόύώは、UnicodeのU+03xx ブロックと、U+1F00ブロックの二カ所にあります。
 https://ja.wikipedia.org/wiki/Unicode%E4%B8%80%E8%A6%A7_0000-0FFF
 https://ja.wikipedia.org/wiki/Unicode%E4%B8%80%E8%A6%A7_1000-1FFF
私は常々 U+1Fxx の方を使っていて、U+03xxの方は、外字登録すべきなのに、未登録文字のチェック範囲から漏れていました。
このため、全文コピペで έ などと正しくコピーできているのに、変換中に ? に変わってしまっていました。
これは、変換プログラム(&外字設定)の修正で直ります。


ご指摘いただいた二点とも、変換プログラム側の修正で対応できます。
もし、オリジナルの全文コピペテキストをもう削除されてしまっていたら、もう一度全文コピペしていただかなければなりませんが・・・・・・・。


今週末に、プチロワ・ロワ仏の変換プログラムの更新を公開する準備をしています。
巻末PDFをページ画像に変換して、こんな感じになります。全部Javaと私の変換キットだけで処理できます。
 http://classicalepwing.osdn.jp/etc/petit2.png
 http://classicalepwing.osdn.jp/etc/petit5.png
 http://classicalepwing.osdn.jp/etc/petit6.png
OEDは諸々確認するため、来週末になるとおもいます。
#78153 への返信

メッセージ #78159 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: OED EPWING辞書の完全一致検索等について (2016-06-08 20:31 by ohkubo-k #78160)

> たとえば "† aa1 Obs." という見出し行は、実際は"† aa1"だけが見出し語で、"Obs." は斜体での追加情報です。
> † aa1 Obs.
> ‖ aa2 Geol.

EBStudioでEPWING化するとき、†は取り除いて検索できるように指定していますので、「† aa1 Obs.」の検索見出し語は「aa1 Obs.」になっています。
辞書によっては数字とか ( ) なども除く指定をしていることがあります。
実に簡単なことですが、辞書の引き心地(?)がガラッと変わることがあります。

この設定は、EBStudioの オプション→詳細設定→INDEX→見出しの中でインデックスに記録しない記号 ― その他任意 で指定してます。
今再確認したら、「†()[],.」でした。少なくとも ‖ の(除外指定)追加が必要ですね。
うむむ。
#78159 への返信

メッセージ #78160 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: OED EPWING辞書の完全一致検索等について (2016-06-08 20:41 by ohkubo-k #78161)

> 今再確認したら、「†()[],.」でした。少なくとも ‖ の(除外指定)追加が必要ですね。

でも今、EBPocket for iOS で「aandblom」を前方一致検索したら「‖ aandblom S. Afr. 」がちゃんと見つかりました。
「‖」は外字扱いなので、そもそも見出し語からは除かれていたのか・・・?

他に変な例にお気づきでしたら、どうぞお知らせください。
私がOEDを引くのは、年に数回なので(そしてOEDの最終兵器たる偉大さに驚く)、おかしいところにはまず気がつきません。
#78160 への返信

メッセージ #78161 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: OED EPWING辞書の完全一致検索等について (2016-06-09 05:09 by kunio40 #78165)

[メッセージ #78161 への返信]
大久保様

詳しい御検証誠にありがとうございます。

> 他に変な例にお気づきでしたら、どうぞお知らせください。
> 私がOEDを引くのは、年に数回なので(そしてOEDの最終兵器たる偉大さに驚く)、おかしいところにはまず気がつきません。

私も最低週に1回調べるくらいなので、また気付いた点が出た時点でお知らせいたします。
OEDEPWING化の偉業を成し遂げられた大久保様に深く感謝しております。
#78161 への返信

メッセージ #78165 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: OED EPWING辞書の完全一致検索等について (2016-06-09 04:58 by kunio40 #78164)

[メッセージ #78159 への返信]

大久保様

早速の御回答誠にありがとうございます。

> ご指摘いただいた二点とも、変換プログラム側の修正で対応できます。
> もし、オリジナルの全文コピペテキストをもう削除されてしまっていたら、もう一度全文コピペしていただかなければなりませんが・・・・・・・。

修正可能の由、実現すれば使い勝手がますますよくなります。

> 今週末に、プチロワ・ロワ仏の変換プログラムの更新を公開する準備をしています。
> 巻末PDFをページ画像に変換して、こんな感じになります。全部Javaと私の変換キットだけで処理できます。
>  http://classicalepwing.osdn.jp/etc/petit2.png
>  http://classicalepwing.osdn.jp/etc/petit5.png
>  http://classicalepwing.osdn.jp/etc/petit6.png
> OEDは諸々確認するため、来週末になるとおもいます。

両仏和の修正を楽しみにしております。
#78159 への返信

メッセージ #78164 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: OED EPWING辞書の完全一致検索等について (2016-06-18 18:57 by ohkubo-k #78218)

修正版を公開しました。
http://projectzephyr.osdn.jp/oed.html

修正版での画面例です。
https://osdn.jp/ticket/download.php?group_id=7237&tid=36400&file_id=5271
#78164 への返信

メッセージ #78218 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: OED EPWING辞書の完全一致検索等について (2016-06-21 16:44 by kunio40 #78230)

[メッセージ #78218 への返信]
大久保様

> 修正版を公開しました。
> http://projectzephyr.osdn.jp/oed.html

修正版の御公開誠にありがとうございます。
早速、修正の上動作確認いたしました。
取り急ぎ御礼まで。
#78218 への返信

メッセージ #78230 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする