フォーラム: 公開討議 (スレッド #34113)

フィードバック (2013-06-10 00:11 by Takamine #69046)

大久保様
 いつもEPWINGでお世話になっております。大久保様が今度公開してくださったツールを何年前から待ち望んでおりました。さっそくダウンロードさせていただいて変換に取り掛かってみました。ド素人の私にも数分間で変換に成功できたのは大久保様のお陰です。ありがとうございました。当方はプラットフォームwindows7 x86、メモリー2gという環境でやってみました。当時購入したCDROMを何処かにやったかを思い出せず、手元にある何年前からEPWING化したものをTXTにして後はおっしゃった通りのやり方で挑みました。これで長年の願いを叶えて本当によかったと思っております。ありがとうございました。

もう一つ伺いたいんですが、下のサイトにある日本語wordnet及び英語版wordnetをEPWING化することは可能でしょうか。ご都合のいい時にご検討いただければと思います。
http://nlpwww.nict.go.jp/wn-ja/index.ja.html

https://wordnet.princeton.edu/wordnet/download/

メッセージ #69046 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-10 16:21 by 小西 #69050)

大久保様には、classic epwingや青空文庫EPWING版など貴重な辞書類でいつもお世話になっております。貴サイトからダウンロードさせていただいたものを重宝しております。ありがとうございます。

Takamineさんのお話に便乗させてください。次のサイトの字源をEPWING化できますでしょうか。http://wagang.econ.hc.keio.ac.jp/zigen/
いろいろ検索してみたのですが、stardictフォーマットの辞書が作り出されてはいるようですが、今は入手困難となっているようです。

あと、個人的な妄想なんですが、白川静先生の「字通」(http://www.amazon.co.jp/gp/aw/d/4582636012/ref=mp_s_a_1_1?qid=1370847276&sr=8-1&pi=AA75)と角川学芸出版の「角川古語大辞典」(http://www.kadokawagakugei.com/cd/#)のそれぞれのEPWING化を首を長くして待っております。両方のCD-ROMを前々から購入してコンピュータにインストールして有難く使っておりますが、他の辞書との串刺し検索機能が欲しいですし、アンドロイドやIOSでも使いたいんです。万が一、その余裕がおありでしたら、ご検討いただければと思っております。
#69046 への返信

メッセージ #69050 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-10 21:49 by ohkubo-k #69052)

Takamine様
早速のご利用ありがとうございます。あのCD-ROM版の検索方法がどうも好きになれなかったのが私だけでなくて、ほっとしました。

WordNetのことは、全く存じませんでした。こんな物がフリーで公開されていたとは!!!
というわけで、試しにEPWINGにしてみました。既に機械的に処理しやすいXMLファイルになっていましたので、特に難しいことはありませんでした。
 http://sourceforge.jp/projects/thesaurusex/downloads/58979/wordnet-130610.zip/
まだ試作品です。これと英語版のデータと組み合わせれば、かなり強力な参考資料になると思います。改めて別サイトで公開する予定です。
#69046 への返信

メッセージ #69052 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-11 11:36 by Takamine #69062)

大久保様

早速試作品をダウンロードさせていただきました。これを先日公開してくださったEPWING化ツールで変換した日本語大シソーラスと相互参照しながら、辞書を読むライフを楽しんでおります。素晴らしいプロジェクトに大変感謝しております。ありがとうございます。

EPWINGがUnicodeを扱えないとはいえ、大久保様のご貢献でその可能性を更に伸ばしていると思っております。EPWINGのファンにとって大久保様が心強い味方です。重ねて御礼を申し上げたいと思います。

一つ情報提供になるかどうか分かりませんが、下記のサイトにあるJAPANESE/ENGLISH DICTIONARY PROJECTやJapanese Proper Names Dictionary Files、Tanaka Corpus、tatoebaプロジェクトなどの辞書ファイルをEPWING化したもの(tatoebaプロジェクトを除く)が何年前に一度出ておりましたが、一向に更新していないようです。もしご興味がおありでしたら、更新して別プロジェクトとして公開していただければと存じます。度々申し訳ありません。
1.JAPANESE/ENGLISH DICTIONARY PROJECT
http://www.csse.monash.edu.au/~jwb/edict_doc.html#IREF01
2.Japanese Proper Names Dictionary Files
http://www.csse.monash.edu.au/~jwb/enamdict_doc.html
3.Tanaka Corpus
http://www.edrdg.org/wiki/index.php/Tanaka_Corpus
4.tatoebaプロジェクト
http://tatoeba.org/jpn/downloads
#69052 への返信

メッセージ #69062 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-10 22:17 by ohkubo-k #69053)

小西様

ご利用ありがとうございます。お役に立っているようで何よりです。

お尋ねの漢和・古語辞典のEPWING化ですが、その種の辞書は大量の漢字を外字として登録しなければならず、技術的に難しいところがあります。
EPWINGは1990年代の規格で、内部はJIS第1/第2水準のShiftJISコードです。第3/第4水準の特殊な漢字は全て外字として登録しないと、表示できません。
漢和辞典などの場合、外字が数千件になるかもしれません。確かEPWINGの仕様上、外字の最大数は8千個ほどでした。この制限に引っかかるとどうしようもありません。

前々から思っていることですが、やはりEPWINGの過去の資産価値は十分認めるにしても、どこかでEPWINGを捨てなければならないと思います。
例えば、PDIC/Unicode版ですと、Unicodeテキストを扱えます。
しかし大変残念なことに、1件ずつ手入力で単語登録する際はUnicodeで問題ないのに、大量のデータをファイルから一括登録する場合はShiftJIS限定となっています。また外字も使えません。
このため、市販品のデータから何とかテキストデータを抜き出せたとしても、PDIC/Unicodeに一括登録できません。
もし出来れば、EBWin/EBMac/EBPocketはPDICファイルも読めるので、EPWING辞書と串刺し出来るのですが・・・・。

ずっと西洋古典関係の電子辞書を作ってきて、そちらのノウハウはいろいろあるのですが、漢字の扱いについてはまだよく分かっていません。なにかうまい方法がない物か(個人的に作ってみたい電子辞書もあるので)、今も思案中です。
何か技術的なブレイクスルーがあれば、ある日あっさりと出来てしまうかも知れませんが、残念ながら今はよく分かりません。
#69046 への返信

メッセージ #69053 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-11 01:34 by 小西 #69059)

大久保様

さっそくのご教示、ありがとうございました。おっしゃった通り、手動で外字作り作業をやるとなると、ちょっと手強そうですね。直接UnicodeTXTを扱えるなら、話がはやいかもしれませんが。

ついでにですが、wikipedia EPWING版もノートパソコンやスマホに入れてあります。下記のサイトからダウンロードさせていただいております。そちらでは、日本語版のwikipediaだけではなく、英語版やフランス語版、中国語版など、多言語版のウィキペディアを定期的にEPWINGに変換して一般公開されています。特に、中国語版では、日本語にはない漢字もUnicode拡張とかいう作業により、綺麗に表示されているようです。もしもこの情報をご存知でなかったら、そこから何かお力になれるところがあるかもしれないと思って、勝手にリンクを貼らせていただいたのです。https://sites.google.com/site/boookends/

もう一つ伺いたいんですが、英英辞書のCD-ROM版をEPWING化する際に、外字など殆ど要らないようですから、より簡単に実現できるでしょうか。たびたび申し訳ありませんが。ご教授お願い致します。
#69053 への返信

メッセージ #69059 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-11 21:59 by ohkubo-k #69071)

小西様

なるほど、Bookendsにある外字定義を利用すれば、一番面倒な作業をせずに済みます。
 https://sites.google.com/site/boookends/title/conversion
ここにあるデータが、EPWING化には非常に重要です。
これを自前で作るのは相当な手間だろうな、と思っていました。
これで全て解決するわけではありませんが、これを元に作業すればかなり楽になります。
いろいろ試してみて、技術的に可能かどうか、ノウハウの蓄積から始めるつもりです。

BookendsはEPWINGデータの作成に FreePWINGを使っているようですが、私はEBWinなどの作者でもあるhishida氏のEBStudioを使っています。基本的に似ているのですが異なる所もあります。最初の壁は突破できたかな、と思っております。
#69046 への返信

メッセージ #69071 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-11 22:12 by ohkubo-k #69072)

Takamine様

私はただのソフトウェア技術者ですので、言語学やその方面のことは全く分かっておりません。
Tatoebaプロジェクトは、最初何が何だか分かりませんでしたが、恐るべき物だと思いました。既にこんな物があったとは・・・・・・・・

とりあえず、日英だけのEPWINGデータを作ってみました。
 http://sourceforge.jp/projects/thesaurusex/downloads/58982/tatoeba-jpneng-130611.zip/
英単語で検索すると、それを含む英文例の一覧が出て、その文番号をクリックすると、それに関係する日本語文(つまり和訳)が見られます。
単純な辞書でもシソーラスでもなく、日英だけでもかなりの量のデータになりました。
その他たくさんの言語や音声データをどうやってまとめるか、どう作ると面白く、役に立ちそうか、WordNetと併せていろいろ試してみます。

面白そうな辞書データサイトがありましたら(この掲示板でも、私の他のプロジェクトの掲示板でも)、どうぞお知らせ下さい。
これは私の趣味プロジェクトですので、何のお約束も出来ませんが、「そんな物があったのか!!」というのを知らずにいるのと、知っていて保留するのとでは全く意味が違いますので。青空文庫をEPWING化したとき、正直な所いったい何に使うのかと思ったのでですが、不思議なことにあればあったで使うのです。
#69046 への返信

メッセージ #69072 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-27 22:43 by Takamine #69282)

大久保様

日本語版wordnet及びtatoebaプロジェクトの公開、ありがとうございました。

言語やコーパス、対照言語学をやっている私のような人にとって、大久保様が公開してくださった貴重なプロジェクトが心強い友のような存在です。コロケーションや格関係なども調べられますし、他の国語辞典や英和和英辞書と相互参照しながら、言語の移り変わりなども確認できます。本当に助かっております。重ねて御礼を申し上げます。

tatoebaの他の言語のプロジェクトも楽しみにしております。



#69072 への返信

メッセージ #69282 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-12 07:26 by ohkubo-k #69080)

小西様

英英辞典のEPWING化の件ですが、たしかに外字処理はそれほど面倒ではないのですが、市販辞書のEPWING化で最も困難なのは、辞書のデータをテキストとして取り出す作業です。これの方がはるかに難しいことがあります。
ロワイヤル仏和辞典のように、何の暗号化もされていないHTMLファイルが市販品に付いていることはきわめて稀です。通常は暗号化されているか、暗号化されていなくてもどういう形式でデータが格納されているかを調べなければなりません。

『日本語大シソーラス』の場合は、LogoVista形式のファイルで、これはEPWINGを元にしているらしく、EBDumpというソフトで何の苦もなく全文データを取り出せました。
研究社羅和辞典のEPWING化の際は、辞書データの暗号解読をせず、全項目の全自動コピペ(コピー&ペースト)で全文テキストを取り出しました。
 http://projectzephyr.sourceforge.jp/kenkyusya-lajp.html
OED v4のCD-ROMも同様の方法で全文テキストを取り出し、EPWINGの試作はしております。ただし途中で必ず失敗したり、手作業でいろいろやらないと完全にならず、まだ直すべき所があるので公開はしておりません(ずっと作業放置状態だと今思い出しました)。
全文コピペ方式の欠点は、太字・斜体と言ったスタイル情報が全て欠落することです。

他の有志の方が、様々な辞書のEPWING化キットを公開されていますが、辞書の暗号(あるいは一般に公開されていないファイルフォーマット)を解読することは、著作権上(または商法など)問題になる可能性があります。個人として作業する分には問題ない、と書いてあるサイトもありますが、法律事務所に問い合わせた所、真っ黒ではないが真っ白でもなく、そういう判例もないので断言できず、仮に無罪だとしても訴訟沙汰になるようなことは避けるべき(やるかどうかは自己責任でどうぞ)とのことでした。
#69046 への返信

メッセージ #69080 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-12 11:15 by 小西 #69081)

大久保様

早速のご教示、ありがとうございます。ご指摘の通り、暗号化されている辞書を解読し、別の形で再利用することは著作権に違反することになりかねませんので、やらないほうがいいかもしれませんね。

これとはちょっと似たような話なのですが、何年前から、stardictという辞書引きソフトがHuzhengという人(もともとLinuxの達人で、今はお坊さんになったそうだ)によって開発され、辞書ファイル(中に市販の辞書の暗号を解いてstardict用辞書に変換しているものも少なくない)も多くの人の力で色々作られてきましたが、著作権の問題が指摘され、HPの閉鎖に続き、辞書ファイルもダウンロードできなくなっているのが現状です。もしも、stardict辞書ファイルをアレンジしてEPWING化したら、著作権違反になるでしょうかね。ネットで色々検索してみたのですが、英辞郎をstardict化する手順に関する記事がいくつか見つかりました。その逆の方向でstardict用ファイルをPDIC一行形式に変換する方法も書かれています。が、その手順を踏まえ、PDIC一行形式に変換(最終的にはEPWINGに変換するのが目的)しようと試みてみましたが、うまくいかず、失敗する例がほとんどでした。そこで、お尋ねしたいんですが、stardict用ファイルをEPWINGに変換するツールキットとかプログラムというのは技術的には可能でしょうか。stardictについては下記のサイトが参考になるかもしれません。

A:https://code.google.com/p/stardict-3/
B:http://code.google.com/p/stardictproject/downloads/list
C:http://dongle.seesaa.net/article/132344046.html
D:http://d.hatena.ne.jp/huixing/20100527/kitajiro_stardict
#69080 への返信

メッセージ #69081 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2015-07-02 16:28 by kunio40 #76451)

[メッセージ #69081 への返信]

小西様

>そこで、お尋ねしたいんですが、stardict用ファイルをEPWINGに変換するツールキットとかプログラムというのは技術的には可能でしょうか。

最近、StarDict対応のEBWin 4.2.0がリリース(下記URL参照)され、EPWING辞書として検索できるようになりました。

http://ebstudio.info/manual/EBWin4/EBWin4.html

御参考まで。


#69081 への返信

メッセージ #76451 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2014-05-30 10:58 by kunio40 #73221)

[メッセージ #69080 への返信]
> 小西様
>
> 英英辞典のEPWING化の件ですが、たしかに外字処理はそれほど面倒ではないのですが、市販辞書のEPWING化で最も困難なのは、辞書のデータをテキストとして取り出す作業です。これの方がはるかに難しいことがあります。
> ロワイヤル仏和辞典のように、何の暗号化もされていないHTMLファイルが市販品に付いていることはきわめて稀です。通常は暗号化されているか、暗号化されていなくてもどういう形式でデータが格納されているかを調べなければなりません。
>
> 『日本語大シソーラス』の場合は、LogoVista形式のファイルで、これはEPWINGを元にしているらしく、EBDumpというソフトで何の苦もなく全文データを取り出せました。
大久保様

EPWING化なさった数々の電子辞書を大変便利に使わせていただいています。
まだ、試作段階とお伺いしていますOED V4のEPWING化をぜひ完成して公開していただきたく切にお願い申し上げます。

> 研究社羅和辞典のEPWING化の際は、辞書データの暗号解読をせず、全項目の全自動コピペ(コピー&ペースト)で全文テキストを取り出しました。
>  http://projectzephyr.sourceforge.jp/kenkyusya-lajp.html
> OED v4のCD-ROMも同様の方法で全文テキストを取り出し、EPWINGの試作はしております。ただし途中で必ず失敗したり、手作業でいろいろやらないと完全にならず、まだ直すべき所があるので公開はしておりません(ずっと作業放置状態だと今思い出しました)。
> 全文コピペ方式の欠点は、太字・斜体と言ったスタイル情報が全て欠落することです。
>
> 他の有志の方が、様々な辞書のEPWING化キットを公開されていますが、辞書の暗号(あるいは一般に公開されていないファイルフォーマット)を解読することは、著作権上(または商法など)問題になる可能性があります。個人として作業する分には問題ない、と書いてあるサイトもありますが、法律事務所に問い合わせた所、真っ黒ではないが真っ白でもなく、そういう判例もないので断言できず、仮に無罪だとしても訴訟沙汰になるようなことは避けるべき(やるかどうかは自己責任でどうぞ)とのことでした。
#69080 への返信

メッセージ #73221 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2014-05-31 09:30 by ohkubo-k #73232)

kunio40さま

ご利用ありがとうございます。お役に立っているようで何よりです。

> まだ、試作段階とお伺いしていますOED V4のEPWING化をぜひ完成して公開していただきたく切にお願い申し上げます。

一年以上放置状態でした。青空WINGやWordNetなどに取り組んでいてすっかり忘れていました。
今は、6月に公開する予定のもの(↓)をいろいろ準備中です。これが片付いたら再チャレンジしてみます。

★英仏独伊西のWiktionary(画像・音声付き)
 http://classicalepwing.sourceforge.jp/etc/cat.png
 http://classicalepwing.sourceforge.jp/etc/chat.png
 http://classicalepwing.sourceforge.jp/etc/katze.png など

★欧州評議会の多言語議事録(20か国語以上)
http://www.europarl.europa.eu/sides/getDoc.do?pubRef=-//EP//TEXT+CRE+20010912+ITEMS+DOC+XML+V0//EN&language=EN
 http://classicalepwing.sourceforge.jp/etc/eucorpus.png

あと、4月にようやく発売になったLogoVistaのリーダーズ第3版をEPWINGに変換するソフトも一応できています。ただまだ新規発売中ですし、営業妨害っぽいことはしたくありませんので公開は控えています。
 http://classicalepwing.sourceforge.jp/etc/ask.png
 http://classicalepwing.sourceforge.jp/etc/make.png
 http://classicalepwing.sourceforge.jp/etc/make2.png
 http://classicalepwing.sourceforge.jp/etc/talk.png
 http://classicalepwing.sourceforge.jp/etc/talk1.png
 http://classicalepwing.sourceforge.jp/etc/sake-wo.png
#73221 への返信

メッセージ #73232 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2014-05-31 11:23 by kunio40 #73233)

[メッセージ #73232 への返信]
大久保様

御多忙中のところ、早速御回答を賜り、誠にありがとうございます。
再チャレンジいただけるとのこと、なにとぞよろしくお願い申し上げます。
6月公開御予定のWiktionaryを楽しみにしております。
機会がございましたら、【用例中心】経済ビジネス英語表現辞典CD-ROM(根岸裕編、大修館書店)のEPWING化をお願い申し上げます。

> kunio40さま
>
> ご利用ありがとうございます。お役に立っているようで何よりです。
>
> > まだ、試作段階とお伺いしていますOED V4のEPWING化をぜひ完成して公開していただきたく切にお願い申し上げます。
>
> 一年以上放置状態でした。青空WINGやWordNetなどに取り組んでいてすっかり忘れていました。
> 今は、6月に公開する予定のもの(↓)をいろいろ準備中です。これが片付いたら再チャレンジしてみます。
>
> ★英仏独伊西のWiktionary(画像・音声付き)
>  http://classicalepwing.sourceforge.jp/etc/cat.png
>  http://classicalepwing.sourceforge.jp/etc/chat.png
>  http://classicalepwing.sourceforge.jp/etc/katze.png など
>
> ★欧州評議会の多言語議事録(20か国語以上)
> http://www.europarl.europa.eu/sides/getDoc.do?pubRef=-//EP//TEXT+CRE+20010912+ITEMS+DOC+XML+V0//EN&language=EN
>  http://classicalepwing.sourceforge.jp/etc/eucorpus.png
>
> あと、4月にようやく発売になったLogoVistaのリーダーズ第3版をEPWINGに変換するソフトも一応できています。ただまだ新規発売中ですし、営業妨害っぽいことはしたくありませんので公開は控えています。
>  http://classicalepwing.sourceforge.jp/etc/ask.png
>  http://classicalepwing.sourceforge.jp/etc/make.png
>  http://classicalepwing.sourceforge.jp/etc/make2.png
>  http://classicalepwing.sourceforge.jp/etc/talk.png
>  http://classicalepwing.sourceforge.jp/etc/talk1.png
>  http://classicalepwing.sourceforge.jp/etc/sake-wo.png

#73232 への返信

メッセージ #73233 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-12 12:53 by 小西 #69086)

大久保様

度々申し訳ありませんが、今日色々検索してみたところ、下記にあるサイトにたどり着きました。
著作権の切れた(?)あるいはフリーの辞書データをstardictに変換したものがダウンロードできるサイトです。
ご参考までにと思って、再度お邪魔した次第です。

http://www.stardict.org/download.php#
#69046 への返信

メッセージ #69086 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-29 15:50 by ohkubo-k #69302)

Takamineさま

WordNetの英語、日本語、日英統合版を公開しました。
 http://wordnetepwing.sourceforge.jp/
統合版は、なかなか面白いものになっていると思います。

TATOEBA projectの方も、先日の日英版のほかに、日英独仏伊西羅(ラテン語)の試作品を暫定公開しました。
 http://tatoebaepwing.sourceforge.jp/
まだまだ開発中です。例文が膨大になるため、EPWING化に4時間くらいかかり、直すべき箇所に気がついてもなかなか作業が進みません。
これもなかなか面白いものだと思います。
どういう言語をまとめるか(全部はいずれ作るにしても、通常は邪魔なだけ?といってどういう組み合わせがいいのか??)は、なにかご要望がありましたらお知らせください。
ロシア語とか、アラビア語、ヘブライ語など、どこに入れればよいのか・・・。

#69046 への返信

メッセージ #69302 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

RE: フィードバック (2013-06-30 14:39 by Takamine #69318)

大久保様

日本語版wordnet及びtatoebaプロジェクトのEPWING版を精力的に作成し、公開してくださって、ありがとうございました。
早速ダウンロードさせていただいて、今快適に使わせていただいております。ありがとうございます。

気がつけば、青空文庫を楽しみながら、日本語大シソーラスやWordNet、TATOEBA projectなどを時折引いて、言葉の泉に引きずり込まれていく自分がいました。読書生活も勿論、辞書読み生活も楽しいものがありますね。言葉や例文集を読んでいるうちに、色々気づかされることが多く、それらを更に辞書で調べて未知の世界へと旅立っていくのは本当に楽しいですね。大久保様のお陰です。ありがとうございます。

また、面白い辞書データが見つかったら、ご報告いたしますね。


#69046 への返信

メッセージ #69318 への返信×

Wiki文法は使えません
ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする