blanco Framework は オープンソースのJava, C#.NET, JavaScript, VB.NET, PHP, Ruby, Python言語用開発フレームワークです。Excelブック様式の設計書を入力してソースコードを自動生成します。各ツールは疎結合で部分利用が可能。EclipseプラグインまたはAntTaskで提供。
blancoHtmlParserは HTML を解析するための Javaライブラリ(jarファイル)です。
※他の blanco Frameworkプロダクト群と異なり、blancoHtmlParserはソースコード自動生成処理系ではありません。通常の実行ライブラリによる提供となります。
[特徴]
・SAXハンドラーのように HTMLパース処理を進めるのが特徴です。
ただし、XMLのパースとは異なり、開始・終了 が対になって発生するとは限りません。
・HTMLの内容を「そのまま」イベント発生させます。
・パースとシリアライズがある程度の可逆性を実現します。
blancoHtmlParser と blancoHtmlSerializer を使って、属性値の " 忘れを修正したり、
要素名の大文字統一、属性名の小文字統一などを 簡単に実現することができます。
・アトリビュート内のホワイトスペースは解除されます。
[ステータス]
1.blancoHtmlParser : 開発版
[開発者]
1.伊賀敏樹 (IGA Tosiki / いがぴょん): 開発および維持メンテ担当
2.山本耕司 (ymoto) : 開発、レビュー、試験実施、リリース判定。
[ライセンス]
1.blancoHtmlParser は ライセンス として Eclipse Public License 1.0 と GNU Lesser General Public License をデュアルライセンスとして採用しています。
[JDK]
コンパイルおよび実行には、JDK 1.5 以降が必要です。
[依存するライブラリ]
コンパイル及び実行には下記のライブラリを必要とします。
クラスパスに含めるようにしてください。
1.その他の blanco Framework
概要: このプロダクトは 実行時に blanco Framework各種プロダクトに依存して動作します。
ライセンス: GNU Lesser General Public License
※依存ライブラリのEPL化を実施予定です。
2008.11.30 (0.0.6)
アトリビュートの処理にバグがあったのを修正。
TODO 考慮不足。アトリビュートの値中の¥エスケープ? (そもそもエスケープ記号は?)
TODO &の実体参照テスト
TODO &が実体参照なしで出た場合は?
TODO > が実体参照なしで出た場合は?
2008.11.29 (0.0.5)
throws IOException が抜けたメソッドがあったので修正。
2008.11.29 (0.0.4)
文字エンコーディング判定処理を追加。
TODO 似たエンコーディングに読み替えるスイッチが欲しい。例 Shift_JIS → Windows-31J など。
その場合、オリジナル・エンコーディングは保持が必要か?
x-jis なんて記載は、もう存在しないかもしれないが、これも読み替える。など。
なお、大文字・小文字は かなりいいかげんなものも多い点に注意。
TODO JSP の文字エンコーディング指定も読み込める可能性について検討したい。