cpdetector は異なる戦略を統合するコードページの検出のための小さなまだ巧妙なフレームワークです。ネットワーク上のテキスト データにアクセスするサード パーティ製ソフトウェアのライブラリとして使用可能性があります。ベスト プラクティスに基づく実装並べ替えおよびそのコードページに基づいたドキュメントの大規模なコレクションを変換できるコマンド ライン ツールのフォームも含まれます。利用可能な戦略を含める: jchardet (除外、周波数解析と推測している) HTML 文字セット プロパティの検知、XML エンコーディング宣言の。