ダウンロードリスト

プロジェクト概要

blanco Framework は オープンソースのJava, C#.NET, JavaScript, VB.NET, PHP, Ruby, Python言語用開発フレームワークです。Excelブック様式の設計書を入力してソースコードを自動生成します。各ツールは疎結合で部分利用が可能。EclipseプラグインまたはAntTaskで提供。

リリース時刻: 2009-08-09 22:47
blancoHtmlParser blancoHtmlParser-0.1.8

名前 サイズ ハッシュ 日付 ダウンロード数
blancoHtmlParser-0.1.8-src.zip 2.33 MB 2009-08-09 22:47 86

リリースノート

blancoHtmlParserは HTML を解析するための Javaライブラリ(jarファイル)です。
概念的には「字句解析 (Lexical Analysi)」を担います。構文解析やHTML正常化については別のプロダクトが担当します。
※他の blanco Frameworkプロダクト群と異なり、blancoHtmlParserはソースコード自動生成処理系ではありません。通常の実行ライブラリによる提供となります。

[特徴]
・SAXハンドラーのように HTMLパース処理を進めるのが特徴です。
ただし、XMLのパースとは異なり、startElement と endElement とが必ずしも対になって発生するとは限りません。
※HTML の仕様により、省略されたオプションタグなどが存在する場合などには startElement と endElement
は対には発生しません。
※blancoHtmlNormalizer を利用して HTML を予め正常化しておくと、startElemnet と endElement
を対に発生させることができます。
・HTMLの内容をイベント発生させます。
・パースとシリアライズがある程度の可逆性を実現します。
blancoHtmlParser と blancoHtmlSerializer を使って、ほんの少し HTML を変更することが可能です。
・アトリビュート内のホワイトスペースは解除されます。

[ステータス]
1.blancoHtmlParser : 安定版

[開発者]
1.伊賀敏樹 (IGA Tosiki / いがぴょん): 開発および維持メンテ担当
2.山本耕司 (ymoto) : 開発、レビュー、試験実施、リリース判定。

[ライセンス]
1.blancoHtmlParser は ライセンス として Eclipse Public License 1.0 と GNU Lesser General Public License をデュアルライセンスとして採用しています。

[JDK]
コンパイルおよび実行には、JDK 1.5 以降が必要です。

[依存するライブラリ]
コンパイル及び実行には下記のライブラリを必要とします。
クラスパスに含めるようにしてください。
1.その他の blanco Framework
概要: このプロダクトは 実行時に blanco Framework各種プロダクトに依存して動作します。
ライセンス: GNU Lesser General Public License
※依存ライブラリのEPL化を実施予定です。

変更履歴

2009.07.08 (0.1.8)
XHTML の自己閉じタグを処理できるようにする。

2009.07.07 (0.1.7)
パーサーの基本挙動として「発生した文字列をそのままイベント発生」のルールの記載がありましたが、
そうではないので、ドキュメントを訂正しました。
CDATA 内の処理を少し改善。