プロジェクトシンプルリスト ソフトウェアダウンロードマップ

132 件のプロジェクトが条件に合致します
最終更新日: 2018-01-10 15:11

Julius

Julius は音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。数万語彙の連続音声認識を一般のPC上でほぼ実時間で実行でき,認識率は90%以上です。言語モデル・音響モデルを任意に入れ替えられ,高い汎用性を持ちます.

主要対話語: 英語, 日本語
オペレーティングシステム: Linux, Windows, OS非依存
プログラミング言語: C
ユーザインタフェース: コンソール(テキストベース)
活発さ: 1
活発さ順位: 186位
登録日: 2002-09-09 14:38
最終更新日: 2010-12-24 13:53

galatea

Galatea Project は、擬人化音声対話エージェントのツールキット Galatea Toolkit を開発し、オープンソースで公開提供するプロジェクトです。顔、声、音声合成テキスト、認識文法、対話の流れなどはカスタマイズ可能で、これを用いて容易に人間の顔と表情を持ち、音声で対話する自分独自のエージェントを作成することができます。また、構成要素(音声認識、音声合成、顔画像合成など)を別々に無償で利用することもできます。

Linux および Windows に対応する各種モジュールを公開しています。

使用許諾

Galatea Project

開発状況: 4 - ベータ
対象ユーザ: 開発者
主要対話語: 英語, 日本語
オペレーティングシステム: Linux, Windows
プログラミング言語: C++, Java, Ruby
ユーザインタフェース: X11アプリケーション, Win32 (MS Windows)
登録日: 2005-02-01 09:33
最終更新日: 2018-12-25 17:07

Open JTalk

Open JTalk は、修正BSDライセンスの元で配布されている日本語テキスト音声合成システムです。Open JTalk は、オープンソースの形態素解析エンジンの MeCab(和布蕪、めかぶ)、奈良先端大学を中心にして開発された形態素解析用辞書の naist-jdic、隠れマルコフモデル(HMM)に基づく音声合成エンジン hts_engine を用いています。

最終更新日: 2018-06-02 16:53

GoldenDict

機能豊富な辞書検索プログラムであり、複数の形式の辞書をサポート、完全なマークアップにより完璧な記事レンダリング、イラストおよびその他のコンテンツの保持などの機能をサポートします。

オペレーティングシステム: MacOSX, Linux, Windows NT/2000, Windows Vista, Windows XP
プログラミング言語: C++
ユーザインタフェース: Qt
最終更新日: 2011-12-26 14:04

linphone

Linphoneは、GTK+とコンソール・インタフェースを備えた音声と映像を扱うインターネット電話です。これは、SIPプロトコルを使用しており、ほとんどのSIPクライアント並びにゲートウェイと互換性があります。これは、Speex、GSM、G711、G722、ilbc、amr、Theora、H263-1998、MPEG4、H264、VP8及びsnowのような様々な音声と映像コーデックを使うことができます。

最終更新日: 2015-01-24 05:08

NoiseGator (Noise Gate)

軽量ノイズ ゲート アプリケーションにオーディオ入力をオーディオ出力を介してオーディオのルートです。リアルタイム オーディオ レベルは、分析し、オーディオ バイパスとして通常平均レベルがしきい値を上回る場合。しかし平均レベルがしきい値を下回る場合、ゲートは閉じてし、オーディオをカットします。仮想オーディオ ケーブルを使用するとサウンド input(microphone) をいずれかのノイズ ゲートとして機能したり output(speakers) に聞こえます。もともと誰もが話していたときにバック グラウンド ノイズをカットする Skype 用に設計された、それはあなた自身のマイクからの騒音のゲートまたはあなたのスピーカーを通してあなたのマイクを再生する使用できます。要件: - これを実行する Java 6 またはそれ以降が必要です。-仮想オーディオ ケーブル (または多くのポートを持つ 2 番目のサウンド カードまたはサウンド カードと共に実質の 1) VOIPs で使用するために必要です。Mac ユーザーは !SoundFlower を使用することができます、Windows ユーザーが VAC(paid) または声のチェンジャー ソフトウェアに付属している無料のものを使用できます。

(機械翻訳)
主要対話語: 英語
オペレーティングシステム: OS非依存, MacOSX, Linux, Windows, Windows 7, Windows Vista, Windows XP, Windows XP
プログラミング言語: Java
ユーザインタフェース: Java Swing
最終更新日: 2018-12-25 23:13

MMDAgent

MMDAgent は、音声対話システムを構築するためのツールキットです。ユーザーは、ユーザー自身のダイアログのシナリオ、3D のエージェント、および声をデザインできます。このソフトウェアは修正 BSD ライセンスでリリースされます。

最終更新日: 2008-07-24 11:29

Speex

Speex はパテントフリーの圧縮形式で、特に音声に適しています。2-45 kbpsの範囲の低ビットレートでの音声通信に特化しています。想定している用途には、VoIP、インターネット越しの音声ストリーミング、オーディオブック、音声データの記録保存(例えばボイスメール)が含まれます。

最終更新日: 2009-03-25 07:41

FAAC

FAACプロジェクトは、AACエンコーダFAACおよびAACデコーダFAAD2からなります。これは、複数のMPEG4オブジェクトタイプ(LC,Main,LTP,HE AAC,PS)およびファイルフォーマット(ADTS AAC, raw AAC, MP4)、マルチチャンネル, ギャップレスのエンコードおよびデコードをサポートし、MP4のメタデータタグもサポートします。このコーデックは、標準準拠のオーディオアプリケーションと互換性があります。

最終更新日: 2016-05-05 00:02

Aozoravoice2 ms haruka Windows10

ここに紹介する読み上げソフト等は、SAPI5規格の音声合成エンジンと、 Microsoft Office 2010用の音声合成エンジン『Microsoft Speech Platform』に対応しています。

☆☆☆☆☆☆☆最新情報☆☆☆☆☆☆☆
Windows10のMicrosoft Ayumi MobileとMicrosoft Ichiro MobileのSAPI5化を紹介しております。
Aozoravoice2の設定のWin10のMicrosoft Haruka DesktopとMicrosoft Ayumi MobileとMicrosoft Ichiro Mobileも提供しています。
☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆

Microsoft Speech Platform 11.0のインストールの仕方は、MS Harukaのインストール手引きをご覧下さい。
日本語のMS Harukaと英語(US)のen-US_ZiraProのSAPI5化も紹介しております(32bitOSかつ32bitソフト用のみ)。
また、Microsoft Speech Platformには、日本語、英語、ドイツ語等が用意されていますのでご活用下さい。

青空文庫をmp3に変換するソフトであるAozoravoice2の設定ファイルのMisaki版と、MS Haruka版を提供しています。

http://bbs.kakaku.com/bbs/-/BBSTabNo=0/SortID=9685323/ 
青空文庫 http://www.aozora.gr.jp/ http://ja.wikipedia.org/wiki/%E9%9D%92%E7%A9%BA%E6%96%87%E5%BA%AB

お勧めの読み上げソフトは、NoahさんのText To Wavです。テキスト(txt)の読み上げやmp3(lameが必要)に変換が出来ます。
http://noah0.blog119.fc2.com/blog-category-2.html

Text To Wavは、読み上げ部分をハイライトしてくれる為、語学の勉強に最適です。

また、発達障害の読み障害の方の教材として使えるようです。http://cogdiv.wordpress.com/2009/02/25/%E8%AA%AD%E3%81%BF%E4%B8%8A%E3%81%92%E6%94%AF%E6%8F%B4%EF%BC%9Asapi5%E3%81%AB%E5%AF%BE%E5%BF%9C%E3%81%97%E3%81%9Ftexttowav/

Microsoft Word のアドオンになる和太鼓も発達障害の読み障害の方の教材として、
今、最も注目を集めています。
http://www.geocities.jp/jalpsjp/
http://www.geocities.jp/jalpsjp/wordaico/wordaico.html


フリーのスクリーンリーダ として、NVDA 日本語版があります。
http://sourceforge.jp/projects/nvdajp/
http://mahoro-ba.net/e1584.html

99 SAMPLE MS HARUKA ver10.2.zip 10.2のMS Harukaのサンプル
05 win10.zip Microsoft Ayumi MobileとMicrosoft Ichiro MobileのSAPI5化とHarukaとAyumiとIchiroのAozoravoise2の設定
04 MS Haruka.zip MS Harukaのインストール手引き
03 MISAKI.zip  Aozoravoise2のMISAKI用の設定  
02 MS HARUKA-AOZORA2.zip MS Harukaのインストール手引きとAozoravoise2のMS Haruka用の設定
01 SAMPLE MS HARUKA.zip MS Harukaのサンプル 夏目漱石の「我輩は猫である」の一部をmp3化したもの

オペレーティングシステム: Windows 7, Windows Vista, Windows XP
トピック: スピーチ
登録日: 2011-05-29 14:49
最終更新日: 2005-11-14 13:35

PHP Voice

PHP Voice は、以前には PHP-VXML (Voice XML)として知られており、音声指示でコンピュータを操作するために必要なユーザーインターフェースを構築するための PHP スクリプトを用いた XML ベースの言語の VXML です。 PHP Voice は、PHP を用いた音声アプリケーションの開発を支援する4つのクラスを持っています。PHP Voice は、音声合成マークアップ言語 1.0 、音声認識文法仕様 1.0、音声ブラウザコールコントロール CCXML 1.0 および音声拡張マークアップ言語( VoiceXML ) 2.0 をサポートしています。

最終更新日: 2007-10-10 13:37

FlowDesigner

!FlowDesigner はデータ フロー指向開発環境です。それは小さく、再利用可能なビルディング ブロックを組み合わせることで複雑なアプリケーションの構築に使用できます。いくつかの方法でも Simulink と !LabView のようなほとんどのいずれかのクローン 。

(機械翻訳)
最終更新日: 2008-12-23 17:37

eSpeak

eSpeak は良質の英語と他の言語のテキストを音声にコンパクトなエンジンです。その明確な調音と良いイントネーションは、長いテキストの記事を聞くために適した。コマンド行からテキスト ファイルを話すことができるし、お祭りやその他の同様のプログラムに代わるものとして「話し手」KDE TTS システム内のそして Gnome 音声ドライバーとして動作します。Windows SAPI5 とコマンドライン バージョンも利用できます。

(機械翻訳)
最終更新日: 2013-03-03 19:13

MisterHouse

MisterHouseは、UnixとWindowsで使えるホームオートメーションのプログラムで、Perlで書かれています。声による命令、Webブラウザ、時刻、シリアルポートとX10のデータ、外部ファイルなどに応答させることができます。Text to Speechエンジンを介して音声で話をさせることもできます。

最終更新日: 2004-09-28 09:44

Sphinx-4

Sphinx-4 は、不特定話者、連続音声認識システムです。