話題(スレッド): Apteサンスクリット辞典製作について

Apteサンスクリット辞典製作について (2014-01-14 22:22, ohkubo-k, #71294)

Monierサンスクリット辞典のほかに、Apteサンスクリット辞典も有用なのだそうです。

以前、Apte辞典の検索サイトはいくつか見つけたものの、
http://www.aa.tufs.ac.jp/~tjun/sktdic/
http://dsal.uchicago.edu/dictionaries/apte/
辞書全体のテキストデータが見つからず、ここのエントリを順にダウンロードするようなプログラムを書こうにも、どういう順番で何が並んでるのかも分からず、諦めていました。

しかし今日改めて検索して、
http://sourceforge.net/projects/sandic/
で、検索プログラムを辞書データが公開されているのを見つけました。
Monier, Apteの他に、もう2つの辞書データまでありました。
こちらは著作権の問題なく、全文テキストもありましたので、何とかなりそうです。

2014年春のリリースにするつもりです。

メッセージ #71294 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-04-10 13:11, kunna, #75910)

お世話になります。

Apte、Monierが検索可能になるというのは便利です。
もし、可能であれば、ケルン大で公開されているものも、EPWING化していただけると非常にうれしいのですが、お願いいたします。

http://www.sanskrit-lexicon.uni-koeln.de/

上掲の2つの他にCappellerは初学者には有用ですし、仏典を扱う人にはEdgertonのBHS Dicは外せないものです。また、Böhtlingk and RothがEPWING化されたら、非常に大きな功績となるぐらいのことと思います。

[メッセージ #71294 への返信]
> Monierサンスクリット辞典のほかに、Apteサンスクリット辞典も有用なのだそうです。
>
> 以前、Apte辞典の検索サイトはいくつか見つけたものの、
> http://www.aa.tufs.ac.jp/~tjun/sktdic/
> http://dsal.uchicago.edu/dictionaries/apte/
> 辞書全体のテキストデータが見つからず、ここのエントリを順にダウンロードするようなプログラムを書こうにも、どういう順番で何が並んでるのかも分からず、諦めていました。
>
> しかし今日改めて検索して、
> http://sourceforge.net/projects/sandic/
> で、検索プログラムを辞書データが公開されているのを見つけました。
> Monier, Apteの他に、もう2つの辞書データまでありました。
> こちらは著作権の問題なく、全文テキストもありましたので、何とかなりそうです。
>
> 2014年春のリリースにするつもりです。
#71294 への返信

メッセージ #75910 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-04-11 09:12, ohkubo-k, #75917)

kunnaさん、こんにちは。ご利用ありがとうございます。

ケルン大学が公開しているデータはMonier辞典のEPWING化の時利用しており、ほぼ同じフォーマットでそのほかの辞書データも公開されていました。
というわけで、EPWING化は変換プログラムの多少の修正であっさり済みました。

https://sourceforge.jp/projects/classicalepwing/releases/63114
cae-150411.zip - Cappeller
bhs-150411..zip - EdgertonのBHS
pw-150411.zip - Böhtlingk and Roth
です。
なお、PWのために外字を1文字(鋭アクセント付のG)追加しました。
EBWin/EBPocketで外字のUnicode置換表示をしている場合は、ebseries-conf-150411.zip のなかにある、CLSSKT.{map, plist} に差し替えてください。

サンスクリットについては全く分かりませんので、それらしいものになっていることくらいしかわかりません。ちょっと使っていただいて良さそうかどうか、ご確認いただけますでしょうか。
#75910 への返信

メッセージ #75917 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-04-11 09:46, kunna, #75918)

ohkubo-kさん
お返事ありがとうございます。

早速DLして、使わせていただきます。
しばらく使ってみて、フィードバックできることがありましたらご連絡しますね。
フォーマットが似ているのであれば、他の辞書の変換もお願いするかもしれません。

辞書類が手軽に持ち運べるというのは、非常に助かります。
実際、サンスクリットを勉強していくと、辞書をそろえるだけでも大変で、それを使って勉強するとなると、場所の制約もされるという…

本当に助かります、ありがとうございます。

#75917 への返信

メッセージ #75918 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-04-18 11:37, kunna, #75959)

ohkubo-kさん

お世話になっております。

早速、使用させていただいております。

こちらの環境のせいか、デーヴァナーガリーがうまく表示されないようです。
結合文字の表示がうまくいっていないのと、基本の文字と母音の記号が分離してしまっている等がありました。

しかし、デーヴァナーガリー表記は、ローマナイズ方法が確立しているので、必要ないと思われます。そこで、見出し語のデーヴァナーガリー表記をなくして、ローマナイズ表記のみにしていただければと思います。
また、語の解説、本文中のデーヴァナーガリーを、ローマ字表記にしていただけると幸いです。

宜しくお願いします。
#75917 への返信

メッセージ #75959 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-04-18 17:43, ohkubo-k, #75962)

ひょっとすると入れ違いになってしまったかもしれませんが、今日(土曜)午前に修正版をアップしました。

http://classicalepwing.sourceforge.jp/download.html#sanskrit

修正内容は、先週の試作品ではデーヴァナーガリー単語全体の欠落や、斜体・太字・改行などの扱いが正しくなかった箇所の修正です。
どれもケルン大学が公開しているデータで、基本的に同じ形式なのですが、辞書ごとに微妙に違うところがあり、個別に対応する必要がありました。
ついでに、サ仏辞典なども追加しました。

私はサンスクリットのことは全く分かりません。
デーヴァナーガリーの表示について、数年前に別の方にアドバイスをいただきながら何度も修正を重ねてようやくできたものです。必要ないので消す、というのは、作業としてはちょっとした修正なのですが、心情として残念なところがあります。
デーヴァナーガリーあり・なしで辞書形式を分けるのか・・。
出来ることなら、あまり辞書形式を増やしたくはありません。

ローマ字表記にしても、京都ハーバード方式と、アクセント記号付き文字を使う方法と2つあります。

私は、Windows 7(と8.1), EBWin4, MS UI Gothic でちゃんと表示できています。
もちろん、外字はUnicode表示できるように、CLSSKT.map を使っています。
外字のUnicode表示を使わない場合、16x16ドットの画像表示で、母音・子音は別文字で表示されます。
Unicode表示をしていて、それでも文字の結合がうまく行かない場合、フォントを変えてみてはいかがでしょうか。
Linux Libertineのような、フリーの多言語文字フォントを使うこともできます。
 http://www.linuxlibertine.org/index.php?id=91&L=1
どういう環境で表示がうまくなかったのでしょうか。
#75959 への返信

メッセージ #75962 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-04-18 18:43, kunna, #75964)

[メッセージ #75962 への返信]

ohkubo-kさん

お世話になってます。

デーヴァナーガリー表記に関しては、解決しました。
CLSSKT.mapのコピー場所を間違えていたという、お恥ずかしいオチでした。
デーヴァナーガリーに関しては承知しました。

質問と依頼があります。
Böhtlingk PW in kürzerer Fassungについてですが、サンスクリット語のアクセント(デーヴァナーガリーのアクセント)が表示されないのですが、これはこちらの環境の問題でしょうか?
環境としては、win7、Ebwin4、ebseries-conf-150411.zipの設定ファイルを使用しています。

また、Böhtlingk and Roth Grosses Petersburger Wörterbuchも変換していただけないでしょうか?

よろしくお願いします。
#75962 への返信

メッセージ #75964 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-04-18 19:12, kunna, #75965)

[メッセージ #75962 への返信]

五月雨式で申し訳ありません。

修正依頼です。
kSemaの項目を見ていて気付いたのですが、アクセント位置がずれていると思われます。

योग【yoga】〈yoǵa〉 (auch प्रयुज्【prayuj】〈prayuj́〉)

とありますが、アクセントはyogaのoにつきます。
また、prayujも,uにアクセントがつきます。
おそらく、アクセント位置が後ろにずれてしまっているのではないかと推測されます。
#75962 への返信

メッセージ #75965 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-04-20 21:53, ohkubo-k, #75971)

ご確認ありがとうございます。
外字表示がうまくできたようで、何よりです。

PWについてだけ、アクセント表示まわりを修正しました。
http://sourceforge.jp/projects/classicalepwing/releases/63143

いままではアクセント記号をすべて省略していました(ローマ字表記では、たしかに一文字ずれていました)。
こちらでいかがでしょうか。

問題なさそうでしたら、週末に、それ以外+もう一冊を公開しなおします。
やっぱり、サンスクリットは難しいです・・・
#75965 への返信

メッセージ #75971 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-04-21 17:14, kunna, #75977)

迅速な修正、ありがとうございます。

早速、確認させていただきます。

サンスクリットの辞書の配置なんかは原理が解ってしまえば納得がいくものだったりするんですよね。
音声言語学的にいうところの、舌の閉鎖の奥から順に配置されているというのが基本だったりします。

デーヴァナーガリーにアクセントがつくと、おおっ!!って感じですね。
Böhtlingk RothのPWは、アクセントがついているのが重要で、古典期よりも古い文献を読む場合に必要不可欠です。
これが、鞄に入れて持ち歩けるようになるというと、驚くほど便利になりますね。
#75971 への返信

メッセージ #75977 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-04-26 07:27, ohkubo-k, #75991)

ケルン大のウェブサイトを参考に、アクセント表記ありに直してみました。
いままで ṃ だったローマ字表記も、ṁ に改めました(両方の表記方法があるようですが、ケルン大に合わせました)。

http://classicalepwing.sourceforge.jp/download.html#sanskrit

以前公開した Monier-Williams などもとにかく全部作り直しました。
Böhtlingk and Roth Grosses Petersburger Wörterbuch も追加しました。

#75977 への返信

メッセージ #75991 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-05-08 15:32, kunna, #76086)

使用させていただいております。

PWのGrossの方ですが、語彙の方のSktのアクセントが飛んでしまっているようです。
語彙の方の見出し語のアクセントがなくなっているのと、本文中のSktのアクセントの一部がなくなっています。
アクセントには種類があるので、原本と比較して確認中です。

[メッセージ #75991 への返信]
> ケルン大のウェブサイトを参考に、アクセント表記ありに直してみました。
> いままで ṃ だったローマ字表記も、ṁ に改めました(両方の表記方法があるようですが、ケルン大に合わせました)。
>
> http://classicalepwing.sourceforge.jp/download.html#sanskrit
>
> 以前公開した Monier-Williams などもとにかく全部作り直しました。
> Böhtlingk and Roth Grosses Petersburger Wörterbuch も追加しました。
>

#75991 への返信

メッセージ #76086 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-06-12 17:33, kunna, #76324)

PW Gross 本文中のSktアクセントの件です。

ヴェーダ文献内で、同じアクセント記号でもアクセントのつけ方が違ったりしているので、デーヴァナーガリーからアルファベットに変換する際に一括でできない可能性が高いので、アルファベットで本文中のアクセントがないのは仕方ないという結論に達しました。

さらに、依頼なのですが、GrassmanのWörterbuch zum Rig Vedaもコンバートしていただけると助かります。

よろしくお願いします。

[メッセージ #76086 への返信]
> 使用させていただいております。
>
> PWのGrossの方ですが、語彙の方のSktのアクセントが飛んでしまっているようです。
> 語彙の方の見出し語のアクセントがなくなっているのと、本文中のSktのアクセントの一部がなくなっています。
> アクセントには種類があるので、原本と比較して確認中です。
>
> [メッセージ #75991 への返信]
> > ケルン大のウェブサイトを参考に、アクセント表記ありに直してみました。
> > いままで ṃ だったローマ字表記も、ṁ に改めました(両方の表記方法があるようですが、ケルン大に合わせました)。
> >
> > http://classicalepwing.sourceforge.jp/download.html#sanskrit
> >
> > 以前公開した Monier-Williams などもとにかく全部作り直しました。
> > Böhtlingk and Roth Grosses Petersburger Wörterbuch も追加しました。
> >
>

#76086 への返信

メッセージ #76324 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-06-15 21:41, ohkubo-k, #76351)

こんにちは。ご確認ありがとうございました。

[メッセージ #76324 への返信]
> ヴェーダ文献内で、同じアクセント記号でもアクセントのつけ方が違ったりしているので、デーヴァナーガリーからアルファベットに変換する際に一括でできない可能性が高いので、アルファベットで本文中のアクセントがないのは仕方ないという結論に達しました。

CAE, PW, PWE の3つについては、アクセント情報ありと無しの見出し語情報がありました。見出し語についてだけ、アクセント(/)ありに変えてみました。検索の際は、/ なしのKH表記で検索してみてください。
本文中のサンスクリットについては、4月に公開したもの以上の情報はありませんでした。

> さらに、依頼なのですが、GrassmanのWörterbuch zum Rig Vedaもコンバートしていただけると助かります。

こちらも公開しました。ただ、見出し語のアクセント情報はなかったので、EPWING版でもアクセントなしです。ギリシャ語の単語があるべきところも、ギリシャ文字の情報はもとからありませんでしたので、表示できていません。
外字を1文字だけ追加しましたので、これをご利用の際は EBseries専用ファイルも最新にしてください(更新しなくても使えますが)。

いずれも
 http://classicalepwing.sourceforge.jp/download.html#sanskrit
からお試しください。

同じケルン大学が公開しているファイルなのですが、同一形式のようでいて、実は個々に微妙に違うところが厄介でした。お気づきの点がありましたら、どうぞお知らせください。
#76324 への返信

メッセージ #76351 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-07-08 15:09, kunna, #76490)

ありがとうございます。

使いながら、チェックしているところです。
また何かありましたら、ご連絡いたします。
#76351 への返信

メッセージ #76490 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-11-25 18:06, kunna, #77245)

お世話になっております。

非常に便利になりました、ありがとうございます。

細かいところですが、気づいた点があります。

おそらく、下記記号

が、変換されず、
„
となっております。

修正していただけると幸いです。

メッセージ #77245 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

Re: Apteサンスクリット辞典製作について (2015-11-26 20:34, ohkubo-k, #77258)

こんにちは、ご指摘ありがとうございます。

外字の設定が漏れていたため、„ がそのまま表示されていたのでした。
 https://osdn.jp/ticket/download.php?group_id=4407&tid=35786&file_id=5223
外字設定を追加して、正しく表示されるようになりました。
 https://osdn.jp/ticket/download.php?group_id=4407&tid=35786&file_id=5224

„ が出ていたいくつかの辞書について修正版を公開しました。
 http://classicalepwing.osdn.jp/download.html#sanskrit
このEPWINGデータをご利用ください。
また、EBWin/EBPocket/Logophileをご利用の場合は、
 http://classicalepwing.osdn.jp/download.html#unieb
にある gaiji-conf-151126.zip の中の CLSSKT.{map, plist, hgai} も更新して頂くとビットマップ画像の外字ではなく、Unicode文字の „ として表示されます。

Unicode文字そのもの(„ とか ñ とか)が外字定義に登録されているかは機械的にチェックしていましたが、„ のような指定についてはチェックしていなかったのが敗因でした。ほかの辞書でもひょっとしたらあるかも知れませんね。
#77245 への返信

メッセージ #77258 への返信×

ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする