ย้ายบล็อกไปที่ bact.cc แล้วนะครับ

พ.ร.บ.คอมพิวเตอร์
หยุด ร่างพ.ร.บ.คอมพิวเตอร์
พื้นที่เก็บข้อมูลออนไลน์ ฟรี 2GB จาก Dropbox (sync กับ Windows, Linux, Mac, iPhone, Android ฯลฯ ได้)

2006-01-30

Java DOM parser for real-world HTML

JTidy can be used as a tool for cleaning up malformed and faulty HTML. In addition, JTidy provides a DOM interface to the document that is being processed, which effectively makes you able to use JTidy as a DOM parser for real-world HTML.

เฮ้ อันนี้น่าสนใจ เผื่อเอามาดึงเว็บไปอ่านได้

HTML DOM นี่ไม่ค่อยเจอแฮะ หมายถึงที่เป็น API/lib ให้เอามาสร้างโปรแกรมได้น่ะ เจอแต่ XML DOM แล้วถ้าเอกสารมันไม่ well-formed ก็มักจะมีปัญหา

1 comment:

Anonymous said...

ของ php ก็มีเหมือนกันครับ
http://pear.php.net/package/XML_HTMLSax