Julius は音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。数万語彙の連続音声認識を一般のPC上でほぼ実時間で実行でき,認識率は90%以上です。言語モデル・音響モデルを任意に入れ替えられ,高い汎用性を持ちます.
登録日: 2002-09-09 14:38
|
関連プロジェクトスクリーンリーダーNVDA日本語版, GalateaTalk, SNP Monitor!, galatea, Arduino VB Lab |
機能豊富な辞書検索プログラムであり、複数の形式の辞書をサポート、完全なマークアップにより完璧な記事レンダリング、イラストおよびその他のコンテンツの保持などの機能をサポートします。
関連プロジェクトJulius, Dumpper, PukiWiki, Berry Linux, SmillaEnlarger |
Linphoneは、GTK+とコンソール・インタフェースを備えた音声と映像を扱うインターネット電話です。これは、SIPプロトコルを使用しており、ほとんどのSIPクライアント並びにゲートウェイと互換性があります。これは、Speex、GSM、G711、G722、ilbc、amr、Theora、H263-1998、MPEG4、H264、VP8及びsnowのような様々な音声と映像コーデックを使うことができます。
関連プロジェクトMedia Player Classic - Homecinema, OpenTween, MPC-BE, VirtualDubMod-jp, PukiWiki |
その他に 1 つの自然言語から !SubRip 形式で字幕を翻訳します。Google 翻訳 API なしに基づいているため支払いなし。翻訳は、自動と手動のスペル チェッカーがあります。
関連プロジェクトスクリーンリーダーNVDA日本語版, SmillaEnlarger, Dumpper, galatea, Julius |
MMDAgent は、音声対話システムを構築するためのツールキットです。ユーザーは、ユーザー自身のダイアログのシナリオ、3D のエージェント、および声をデザインできます。このソフトウェアは修正 BSD ライセンスでリリースされます。
関連プロジェクトMPC-BE, GalateaTalk, Speech Signal Processing Toolkit(SPTK), Media Player Classic - Homecinema, Win32 Disk Imager |
FAACプロジェクトは、AACエンコーダFAACおよびAACデコーダFAAD2からなります。これは、複数のMPEG4オブジェクトタイプ(LC,Main,LTP,HE AAC,PS)およびファイルフォーマット(ADTS AAC, raw AAC, MP4)、マルチチャンネル, ギャップレスのエンコードおよびデコードをサポートし、MP4のメタデータタグもサポートします。このコーデックは、標準準拠のオーディオアプリケーションと互換性があります。
関連プロジェクトPukiWiki, SmillaEnlarger, HandBrake日本語版, Julius, Dumpper |
Speex はパテントフリーの圧縮形式で、特に音声に適しています。2-45 kbpsの範囲の低ビットレートでの音声通信に特化しています。想定している用途には、VoIP、インターネット越しの音声ストリーミング、オーディオブック、音声データの記録保存(例えばボイスメール)が含まれます。
関連プロジェクトDumpper, Julius, SmillaEnlarger, PukiWiki, PeaZip |
Open JTalk は、修正BSDライセンスの元で配布されている日本語テキスト音声合成システムです。Open JTalk は、オープンソースの形態素解析エンジンの MeCab(和布蕪、めかぶ)、奈良先端大学を中心にして開発された形態素解析用辞書の naist-jdic、隠れマルコフモデル(HMM)に基づく音声合成エンジン hts_engine を用いています。
関連プロジェクトスクリーンリーダーNVDA日本語版, SmillaEnlarger, galatea, Julius, Dumpper |
軽量ノイズ ゲート アプリケーションにオーディオ入力をオーディオ出力を介してオーディオのルートです。リアルタイム オーディオ レベルは、分析し、オーディオ バイパスとして通常平均レベルがしきい値を上回る場合。しかし平均レベルがしきい値を下回る場合、ゲートは閉じてし、オーディオをカットします。仮想オーディオ ケーブルを使用するとサウンド input(microphone) をいずれかのノイズ ゲートとして機能したり output(speakers) に聞こえます。もともと誰もが話していたときにバック グラウンド ノイズをカットする Skype 用に設計された、それはあなた自身のマイクからの騒音のゲートまたはあなたのスピーカーを通してあなたのマイクを再生する使用できます。要件: - これを実行する Java 6 またはそれ以降が必要です。-仮想オーディオ ケーブル (または多くのポートを持つ 2 番目のサウンド カードまたはサウンド カードと共に実質の 1) VOIPs で使用するために必要です。Mac ユーザーは !SoundFlower を使用することができます、Windows ユーザーが VAC(paid) または声のチェンジャー ソフトウェアに付属している無料のものを使用できます。
関連プロジェクトGalateaTalk, MPC-BE, Win32 Disk Imager, Speech Signal Processing Toolkit(SPTK), Media Player Classic - Homecinema |
PHP Voice は、以前には PHP-VXML (Voice XML)として知られており、音声指示でコンピュータを操作するために必要なユーザーインターフェースを構築するための PHP スクリプトを用いた XML ベースの言語の VXML です。 PHP Voice は、PHP を用いた音声アプリケーションの開発を支援する4つのクラスを持っています。PHP Voice は、音声合成マークアップ言語 1.0 、音声認識文法仕様 1.0、音声ブラウザコールコントロール CCXML 1.0 および音声拡張マークアップ言語( VoiceXML ) 2.0 をサポートしています。
関連プロジェクトDarik's Boot and Nuke (DBAN), プロパティエディタ, Julius, DeSmuME, PukiWiki |
!FlowDesigner はデータ フロー指向開発環境です。それは小さく、再利用可能なビルディング ブロックを組み合わせることで複雑なアプリケーションの構築に使用できます。いくつかの方法でも Simulink と !LabView のようなほとんどのいずれかのクローン 。
関連プロジェクトAmateras, SharpDevelop-jp, SmillaEnlarger, プロパティエディタ, Julius |
eSpeak は良質の英語と他の言語のテキストを音声にコンパクトなエンジンです。その明確な調音と良いイントネーションは、長いテキストの記事を聞くために適した。コマンド行からテキスト ファイルを話すことができるし、お祭りやその他の同様のプログラムに代わるものとして「話し手」KDE TTS システム内のそして Gnome 音声ドライバーとして動作します。Windows SAPI5 とコマンドライン バージョンも利用できます。
関連プロジェクトStepMania Japan, PeerCast IM, iReport-Designer for JasperReports, 円盤複写屋, Media Player Classic - Homecinema |
Sphinx-4 は、不特定話者、連続音声認識システムです。
関連プロジェクトスクリーンリーダーNVDA日本語版, SmillaEnlarger, Julius, Dumpper, StepMania Japan |
MisterHouseは、UnixとWindowsで使えるホームオートメーションのプログラムで、Perlで書かれています。声による命令、Webブラウザ、時刻、シリアルポートとX10のデータ、外部ファイルなどに応答させることができます。Text to Speechエンジンを介して音声で話をさせることもできます。
関連プロジェクトDumpper, Julius, XiaomiFirmwareUpdater, SmillaEnlarger, Hinemos |
CMU Sphinx 音声認識システムは、オープンソースに移行中です。配布物には、ライブラリ (libsphinx2) と、それにリンクすることで動作するいくつかの小さな例が含まれています。
関連プロジェクトスクリーンリーダーNVDA日本語版, SmillaEnlarger, Julius, Dumpper, StepMania Japan |