ソフトウェアダウンロードマップ

最終更新日: 2009-03-25 07:41

FAAC

FAACプロジェクトは、AACエンコーダFAACおよびAACデコーダFAAD2からなります。これは、複数のMPEG4オブジェクトタイプ(LC,Main,LTP,HE AAC,PS)およびファイルフォーマット(ADTS AAC, raw AAC, MP4)、マルチチャンネル, ギャップレスのエンコードおよびデコードをサポートし、MP4のメタデータタグもサポートします。このコーデックは、標準準拠のオーディオアプリケーションと互換性があります。

ライセンス: GNU General Public License v2 (GPLv2), GNU Lesser General Public License v2.1 (LGPLv2.1)

オペレーティングシステム: SymbianOS, MacOSX, POSIX (Linux,BSD,Solaris など), POSIX (Linux,BSD,Solaris など), Windows, BeOS

プログラミング言語: C

トピック: コミュニケーション, ハム(アマチュア無線), インターネット電話, Freecode.com, SourceForge.net, インターネット, マルチメディア, サウンド/オーディオ, キャプチャ/録音, CDオーディオ, CDリッピング, プレイヤ, MP3, スピーチ, 変換, アーカイビング, 圧縮

ユーザインタフェース: Web環境

5.0

投票数 1

最終更新日: 2008-07-24 11:29

Speex

Speex はパテントフリーの圧縮形式で、特に音声に適しています。2-45 kbpsの範囲の低ビットレートでの音声通信に特化しています。想定している用途には、VoIP、インターネット越しの音声ストリーミング、オーディオブック、音声データの記録保存（例えばボイスメール）が含まれます。

ライセンス: BSD 3-Clause License (aka "BSD New" or "BSD Simplified" License)

オペレーティングシステム: SymbianOS, MacOSX, POSIX (Linux,BSD,Solaris など), Windows, Windows

プログラミング言語: C

トピック: コミュニケーション, インターネット電話, Telephony, Freecode.com, SourceForge.net, マルチメディア, サウンド/オーディオ, スピーチ, アーカイビング, 圧縮

最終更新日: 2013-03-03 19:13

MisterHouse

MisterHouseは、UnixとWindowsで使えるホームオートメーションのプログラムで、Perlで書かれています。声による命令、Webブラウザ、時刻、シリアルポートとX10のデータ、外部ファイルなどに応答させることができます。Text to Speechエンジンを介して音声で話をさせることもできます。

ライセンス: GNU General Public License v2 (GPLv2)

オペレーティングシステム: POSIX (Linux,BSD,Solaris など), Windows, Windows

プログラミング言語: Perl

トピック: Freecode.com, SourceForge.net, インターネット, HTTPサーバ, マルチメディア, サウンド/オーディオ, スピーチ, その他, モニタリング

ユーザインタフェース: Web環境

最終更新日: 2008-12-23 17:37

eSpeak

eSpeak は良質の英語と他の言語のテキストを音声にコンパクトなエンジンです。その明確な調音と良いイントネーションは、長いテキストの記事を聞くために適した。コマンド行からテキストファイルを話すことができるし、お祭りやその他の同様のプログラムに代わるものとして「話し手」KDE TTS システム内のそして Gnome 音声ドライバーとして動作します。Windows SAPI5 とコマンドラインバージョンも利用できます。

(機械翻訳)

ライセンス: GNU General Public License v2 (GPLv2)

オペレーティングシステム: POSIX (Linux,BSD,Solaris など)

プログラミング言語: C++

トピック: Freecode.com, マルチメディア, サウンド/オーディオ, スピーチ

最終更新日: 2013-11-14 02:07

CMU Sphinx

CMU Sphinx 音声認識システムは、オープンソースに移行中です。配布物には、ライブラリ (libsphinx2) と、それにリンクすることで動作するいくつかの小さな例が含まれています。

ライセンス: BSD 3-Clause License (aka "BSD New" or "BSD Simplified" License)

オペレーティングシステム: POSIX (Linux,BSD,Solaris など), Linux, Windows, Windows, Windows

プログラミング言語: C, Perl

トピック: Freecode.com, SourceForge.net, マルチメディア, サウンド/オーディオ, スピーチ

最終更新日: 2004-09-28 09:44

Sphinx-4

Sphinx-4 は、不特定話者、連続音声認識システムです。

ライセンス: BSD 3-Clause License (aka "BSD New" or "BSD Simplified" License)

オペレーティングシステム: MacOSX, POSIX (Linux,BSD,Solaris など), POSIX (Linux,BSD,Solaris など), Linux, Windows, Windows

プログラミング言語: Java

トピック: Freecode.com, SourceForge.net, マルチメディア, サウンド/オーディオ, スピーチ

最終更新日: 2005-11-14 13:35

PHP Voice

PHP Voice は、以前には PHP-VXML (Voice XML)として知られており、音声指示でコンピュータを操作するために必要なユーザーインターフェースを構築するための PHP スクリプトを用いた XML ベースの言語の VXML です。 PHP Voice は、PHP を用いた音声アプリケーションの開発を支援する４つのクラスを持っています。PHP Voice は、音声合成マークアップ言語 1.0 、音声認識文法仕様 1.0、音声ブラウザコールコントロール CCXML 1.0 および音声拡張マークアップ言語（ VoiceXML ） 2.0 をサポートしています。

ライセンス: GNU General Public License v2 (GPLv2)

プログラミング言語: PHP, PHP

トピック: コミュニケーション, Telephony, Freecode.com, マルチメディア, サウンド/オーディオ, サウンド統合, スピーチ, ソフトウェア開発, テキスト処理

ユーザインタフェース: ツールキット/ライブラリ

最終更新日: 2007-10-10 13:37

FlowDesigner

!FlowDesigner はデータフロー指向開発環境です。それは小さく、再利用可能なビルディングブロックを組み合わせることで複雑なアプリケーションの構築に使用できます。いくつかの方法でも Simulink と !LabView のようなほとんどのいずれかのクローン。

(機械翻訳)

ライセンス: GNU General Public License v2 (GPLv2), GNU Lesser General Public License v2.1 (LGPLv2.1)

オペレーティングシステム: POSIX (Linux,BSD,Solaris など), HP-UX, Linux, SunOS/Solaris, Windows, Windows, Windows, Windows

プログラミング言語: C++

トピック: Freecode.com, SourceForge.net, マルチメディア, サウンド/オーディオ, 解析, スピーチ, 科学/工学, 人工知能, ソフトウェア開発, フレームワーク

ユーザインタフェース: ツールキット/ライブラリ

最終更新日: 2012-11-02 21:41

SpeechLion

!SpeechLion はデスクトップコマンドと制御のための音声認識アプリケーションです。スフィンクス 4 認識に基づいているし、簡単な音声コマンドを使用して Linux デスクトップを制御するユーザーことができます。いくつかの例のコマンドは、「ボリュームミュート」「ヘルプを表示する」、「次のウィンドウ」「マウスをクリックして」"ブラウズ google"。!SpeechLion は、Web Firefox 簡単な Emacs、ウィンドウコントロール、ボリュームコントロールや使用量の詳細を介してブラウジングのためのハイレベルコマンドを認識します。アドホックキーボードショートカットとマウス操作のための低レベルのコマンドもあります。

(機械翻訳)

ライセンス: GNU General Public License v2 (GPLv2)

オペレーティングシステム: POSIX (Linux,BSD,Solaris など)

プログラミング言語: Java

トピック: デスクトップ環境, Freecode.com, マルチメディア, サウンド/オーディオ, スピーチ

最終更新日: 2004-10-25 23:57

Snack sound toolkit

スナックサウンドの拡張子追加サウンド再生/録音と音の可視化のためのコマンドなど波形とスペクトログラム。メモリ内のサウンドオブジェクト、ベースファイルのオーディオ、ストリーミングオーディオ、MP3、AIFF、AU WAV ファイル形式、同期および非同期の再生をサポートしています。可視化キャンバスアイテムタイプリアルタイムで更新し、postscript を出力することができます。スナック C API を使用して新しいコマンドおよびファイル形式を追加できます。

(機械翻訳)

ライセンス: BSD 3-Clause License (aka "BSD New" or "BSD Simplified" License), GNU General Public License v2 (GPLv2)

オペレーティングシステム: MacOSX, POSIX (Linux,BSD,Solaris など), BSD, HP-UX, IRIX, Linux, SunOS/Solaris, Windows, Windows

プログラミング言語: C, Python, Tcl

トピック: Freecode.com, SourceForge.net, マルチメディア, サウンド/オーディオ, 解析, キャプチャ/録音, エディタ, スピーチ, 科学/工学, ビジュアライゼーション, ソフトウェア開発

ユーザインタフェース: ツールキット/ライブラリ