bact' is a name: open standards

Showing posts with label open standards. Show all posts

2009-06-02

on various things, digital this and information that

[ปรับปรุง 12:46: เพิ่ม Greenstone และลิงก์ libraryhub.in.th ขอบคุณ @markpeak]

[ปรับปรุง 2009.07.17: แก้ไขข้อมูลเกี่ยวกับระบบบรรณารักษ์ที่คลาดเคลื่อน ขอบคุณ อ.บุญเลิศ]

สี่ห้าวันที่ผ่านมา บุกตะลุยเก็บข้อมูลเกี่ยวกับห้องสมุดและระบบสารสนเทศดิจิทัลให้ :=3

ไม่ได้เน้นไปที่พวก Library 2.0 มากนัก อยากรู้เรื่องระบบข้างใต้เพิ่มเติมมากกว่า การประยุกต์ข้างบนคิดว่าพอเข้าใจไอเดียบ้างแล้วส่วนหนึ่ง (ลองดู นำเสนอโดย @iteau และ @projectlib เกี่ยวกับเรื่องนี้และ TCDC Resource Center - @iteau เขียนควันหลงนิดนึง) เดี๋ยวลองเอามาประกอบกัน

เว็บ DegreeTutor แนะนำโอเพ่นซอร์ส ILS (integrated library system) 3 ตัว ได้แก่ Koha, Evergreen ILS, และ VuFind ทุกตัวทำงานกับ OPAC (open public access catalog) ได้หมด :

Koha เป็น ILS ที่ติดตั้งง่าย มีหลายที่ในเมืองไทยใช้แล้ว เช่น ห้องสมุดดิจิทัลของ STKS (โชว์ในงาน LibCamp), ห้องสมุดวุฒิสภา, ม.อุบลก็กำลังเตรียมใช้, บล็อก STKS สวทช. เขียนถึงเยอะเหมือนกัน
Evergreen ILS เขาว่าเป็นระบบ fault-tolerance เลยทีเดียว มั่นใจได้
VuFind เป็น Library Resource Portal ที่มาครอบ ILS เพื่อขยายความสามารถของ OPAC ให้เป็น OPAC 2.0 [อ.บุญเลิศ] ยังอยู่ในช่วงพัฒนา (RC) อาจจะยังไม่เรียบร้อยนัก แต่มีความสามารถเยอะ ใช้ระบบค้นหาของ Apache Solr หายห่วง โครงการห้องสมุดดิจิทัลคิดดี กำลังเล็งว่าอาจจะเอามาเป็นหน้ากากครอบฐานข้อมูลย่อย ๆ ต่าง เพื่อให้ผู้ใช้ใช้งานง่ายขึ้น

เสริมจากความเห็นโดย อ.บุญเลิศ คือ ทั้ง Koha และ Evergreen นั้น เป็น ILS ที่มีความสามารถเทียบเท่ากับ ILS ที่ขายกัน ระดับ VTLS, InnoPAC/Millenium ILS, และ Horizon/SirsiDynix

ส่วน ILS รุ่นเล็กลงไป คือ OpenBiblio และ PHPMyLibrary

งานหลักอันนึงของห้องสมุดก็คือ การทำ catalog หนังสือ หรือป้อนข้อมูลหนังสือเข้าไปในระบบ เพื่อให้สืบค้นและยืมคืนได้ ซึ่งก็ใช้แรงงานไม่น้อย ถ้ามีเครื่องทุ่นแรงก็คงจะดี นึกไอเดียประมาณ CDDB หรือ freeDB.org ที่เราเสียบซีดีเพลงเข้าเครื่อง แล้วโปรแกรมเล่นเพลงก็จะไปค้นฐานข้อมูลที่คนอื่นเขาใส่ข้อมูลชื่อเพลงชื่อนักร้องไว้เราแล้ว เราไม่ต้องใส่เองหมด เว้นว่าหาไม่เจอ เราก็ใส่เข้าไปหน่อย แล้วคนอื่นจะได้ใช้ด้วย เอาแบบนั้น สำหรับเมตาดาต้าหนังสือ ก็จะได้ ‡biblios.net โครงการเพิ่งเริ่มได้ไม่นาน แต่ดูดีทีเดียว มาจาก LibLime ผู้ร่วมพัฒนา Koha

นอกจากสารสนเทศที่เป็นหนังสือเล่มแล้ว ก็ยังมีเอกสารที่ไม่ใช่หนังสือ ซึงตอนนี้ก็เป็นดิจิทัลได้จำนวนมากแล้ว วิธีหนึ่งที่นิยมและมีประสิทธิภาพก็คือ self-archiving คือเก็บของใครของมัน ใครผลิตคนนั้นก็เก็บ เป็น institutional repository แต่แชร์ข้อมูลค้นหากันได้ ระบบจัดเก็บสารสนเทศองค์กรที่เป็นโอเพ่นซอร์สและใช้โปรโตคอล OAI-PMH สำหรับแลกเปลี่ยนเมตาดาต้าเพื่อการค้นหา มีสองตัว :

DSpace เมืองไทยมีใช้หลายที่ เช่น คลังปัญญาจุฬาฯ โดย สถาบันวิทยบริการ จุฬาลงกรณ์มหาวิทยาลัย, ห้องสมุดดิจิทัลคิดดี โดย เอไอที, สำนักงานคณะกรรมการการศึกษาขั้นพื้นฐาน และ มศว., NSTDA Knowledge Repository (สวทช.) โดย ศูนย์บริการความรู้ทางวิทยาศาสตร์และเทคโนโลยี
EPrints เมืองไทยเท่าที่ทราบ ไม่มีใครใช้ ผมดูแล้วมันน่าจะลงง่ายกว่าแฮะ (จากประสบการณ์ส่วนตัว ระหว่าง UIMA กับ GATE พบว่า GATE ปวดหัวน้อยกว่า ผมเลยคิดว่า จะลอง EPrints ก่อนละกัน เหตุผลแถ ๆ :p)

@markpeak แนะนำอีกตัว (thx!) คือ Greenstone เท่าที่ค้น ๆ ดูคร่าว ๆ อันนี้ ไม่ได้เป็น institutional repository software เหมือนกับ DSpace หรือ EPrints เสียทีเดียว แต่เป็น digital library software (ดูจากบล็อกนี้ ผมเองก็ยังตอบไม่ได้ว่า แต่ละอย่างมันต่างกันชัด ๆ อย่างไร คิดว่ามันก็ทับ ๆ กันอยู่เยอะ แต่กรณีของ IR นี่ เรื่อง self-archiving น่าจะเป็นลักษณะสำคัญอันนึง) Greenstone นี่น่าสนใจมาก เขาบอกว่าสนับสนุนหลายภาษา มีภาษาไทยด้วย (ยังไม่ได้ค้นต่อว่าที่ว่า สนับสนุนภาษา เนี่ย แปลว่าอะไร) มี UNESCO หนุน โอเพ่นซอร์ส และสนับสนุนโปรโตคอล OAI-PMH ร่วมพัฒนาโดยมหาลัยที่สร้าง WEKA data mining workbench/toolkit ดูดีนะเนี่ย

open archives, collections, repositories, libraries พวกนี้ นอกจากจะเปิดให้ดูเฉย ๆ แล้ว ถ้าจะให้มีประโยชน์จริง ๆ มันก็ควรจะค้นหาได้แบบ programmable หน่อย หรืออย่างน้อยก็มีวิธีในการค้นหาเหมือน ๆ กันนิดนึง ผู้ใช้จะได้ไม่ต้องเรียนรู้เยอะ ก็เลยเป็นที่มาของมาตรฐานในการค้นหา รวมไปถึงการแลกเปลี่ยนเมตาดาต้าแบบอัตโนมัติด้วย

เอาง่ายที่สุด ก็น่าจะใช้ OpenSearch สืบค้นได้ (ถ้านึกไม่ออกว่า OpenSearch คืออะไร ตัวช่องค้นหาบนแถบเครื่องมือใน Internet Explorer 7+ และ Mozilla Firefox 3+ ต่างก็สืบค้นจากบริการที่เราระบุ ผ่าน OpenSearch ... อืม ยังไม่ชัด แต่ก็ดูใกล้ตัวหน่อยนึง) แล้วส่งผลลัพธ์ออกมาเป็น RSS/Atom รูปแบบข้อมูลยอดนิยม, ถ้ามี JSON ล่ะก็แจ๋ว ในแง่การเขียนโปรแกรมโดยเฉพาะฝั่ง browser-side

ชุดต่อมา มาจากกลุ่ม Open Archives Initiative มีตัวชูโรงคือ OAI-PMH ที่พูดถึงก่อนหน้านี้ เอาไว้แลกเปลี่ยนเมตาดาต้า :

สำหรับการสืบค้นสารสนเทศ ดูมาตรฐาน Z39.50 (ISO 23950: Information Retrieval (Z39.50): Application Service Definition and Protocol Specification) และ SRU (Search/Retrieve via URL) คู่กับ CQL (Contextual Query Language). ‡biblios.net ที่พูดถึงก่อนหน้านี้ รองรับ SRU/CQL ด้วย

ข้อกำหนดเมตาดาต้าที่ได้รับนิยมนำไปปรับใช้มากที่สุดในเว็บนั้น คือ Dublin Core Metadata Initiative (DMCI) ซึ่งคนที่ใช้งานเอกสาร XML ต่าง ๆ อาจจะพอคุ้นเคย ใน namespace dc: ซึ่งถูกนำไปใช้กับรูปแบบเอกสาร XML หลายชนิด OAI เองก็ใช้ Dublin Core

ความเห็นเพิ่มเติมจาก อ.บุญเลิศ ขณะนี้ DCMI ก็ยอมรับแล้วว่า DC ไม่ใช่มาตรฐานเดียวที่ใช้ได้ มีการทำ Cross กับเมทาดาทาอื่นแล้ว ลองหาอ่านได้จาก DC conference ต่างๆ ได้ครับ

สำหรับรูปแบบข้อมูลผลลัพธ์จากการสืบค้นสารสนเทศอื่น ๆ ก็เช่น MARCXML ซึ่งพัฒนาต่อมาจากปู่ MARC มีช่องข้อมูลมากมาย เรียกได้ว่าครบถ้วน แต่ก็ซับซ้อนปวดหัว, ต่อมาจึงมี Metadata Object Description Schema (MODS) ซึ่งอยู่ระหว่างกลาง MARC กับ Dublin Core (ซึ่งมีช่องข้อมูลน้อยมาก ๆ ประมาณว่าใช้ได้กับงานอย่าง RSS Feed จะให้ใช้กับห้องสมุดก็ขาดตกไปหลายอย่าง) เรียกว่า MODS มีช่องข้อมูลที่จำเป็นต้องใช้บ่อย ๆ ในงานห้องสมุด ในขณะเดียวกันก็ไม่ซับซ้อนจนเกินไป, Metadata Authority Description Schema (MADS) เป็นมาตรฐานที่ออกมาใช้คู่กับ MODS

acronyms ที่พ่นออกมามากมายข้างบน เกินครึ่งกำหนดโดยห้องสมุดรัฐสภาสหรัฐ (Library of Congress) ที่เหลือก็โดยห้องสมุดของมหาวิทยาลัยหรือศูนย์วิจัยต่าง ๆ

ใครสนใจเรื่องพวกนี้ โดยเฉพาะที่ใช้โอเพ่นซอร์ส อัปเดตข่าวสารได้จากเว็บไซต์เหล่านี้ (แนะนำเพิ่มเติมได้)

oss4lib - Open Source Systems for Libraries
code4lib - coders for libraries, libraries for coders กลุ่มเป้าหมายจะเน้นนักพัฒนามากกว่า oss4lib
บล็อก STKS - ภาษาไทย มีเรื่องการจัดการความรู้ เรื่องห้องสมุดดิจิทัลอยู่เรื่อย ๆ โดยเฉพาะซอฟต์แวร์ที่เป็นโอเพ่นซอร์ส
LibraryHub - โดย @projectlib เรื่องห้องสมุดในแง่มุมต่าง ๆ (ไม่ได้เน้นเฉพาะเรื่องซอฟต์แวร์)

นอกจากเรื่อง digital repositories แล้วถ้ามีเรื่องการอนุรักษ์ preservation, digitization ควรดู TEI ไว้ด้วย Text Encoding Initiative เป็นชุดข้อแนะนำในการบันทึกข้อความมาอยู่ในระบบดิจิทัล พร้อม ๆ กับคำแนะนำในการบันทึกคำอธิบายข้อมูลต่าง ๆ (annotation) ด้วย การทำ archiving, preservation ในลักษณะนี้ ถือเป็นคีย์สำคัญสำหรับ สาขา ที่เรียกว่า digital humanities (มนุษยศาสตร์ดิจิทัล) ซึ่งส่วนหนึ่งเป็นการใช้เครื่องมือดิจิทัลศึกษาเอกสาร (และบันทึกผลการวิเคราะห์ไปเป็น annotation อีกชั้น layer นึงบนเอกสาร)

เอ้อ ถ้าอยากทำ OCR มีทูลคิตโอเพ่นซอร์สชื่อ OCRopus ลองแล้ว ใช้ได้เลย มันเชื่อมชิ้นส่วนที่จำเป็นในงาน OCR เข้าด้วยกัน ทั้งส่วนแปลงไฟล์ฟอร์แมต หมุนรูป ทำ layout analysis ทำตัวแบบภาษา และการแปลงภาพเป็นตัวอักษร ตัว engine ที่ใช้แปลงภาพเป็นตัวอักษร ตอนนี้ใช้ tesseract อยู่ โอเพ่นซอร์สเช่นกัน ทั้งหมดนี้เขียนด้วย C แต่มี Python binding ถ้าต้องการ ชุด OCRopus และ tesseract นี้มี Google สนับสนุนการวิจัยและพัฒนา คาดว่าน่าจะเป็นตัวเดียวกับที่ใช้เป็นส่วนหนึ่งของระบบ Google Book Search ผมลองคอมไพล์แล้วรันเล่นดู เจ๋งดี ถ้าใช้ tesseract เฉย ๆ ผลลัพธ์จะเป็น plain text แต่ถ้าใช้ OCRopus tool chain มันได้มาเป็น HTML เลย (hOCR microformat) ซึ่งแปลว่าเราจะได้ layout และ style มาด้วย ตัวหนา ตัวเอียง มาหมด

แสกนเข้ามาแล้ว มันก็ต้องมีที่ผิดบ้างแหละ มากน้อยแล้วแต่ จะช่วยกันแก้ไขได้ยังไง ? ลองดูตัวแบบจากโครงการ Distribute Proofreaders (DP) (แนะนำโดย @thai101 ขอบคุณมาก ๆ ครับ) ซึ่งเป็นการเปิดให้อาสาสมัครบนอินเทอร์เน็ตมาช่วยกันพิสูจน์อักษร แก้ตัวสะกดผิด โดยโครงการนี้เจาะจงไปที่การแสกนหนังสือที่ไม่มีหรือพ้นการคุ้มครองลิขสิทธิ์ไปแล้ว (เป็นสมบัติสาธารณะหรืออยู่ใน Public Domain) พิสูจน์อักษร แล้วก็ส่งต่อหนังสือที่เสร็จสมบูรณ์แล้ว ให้กับ Project Gutenberg ต่อไป ตัวแบบของ DP นี้อาจจะเอามาปรับใช้กับโครงการอื่น ๆ ก็ได้

ทั้งหมดที่กล่าวนี้ จะเห็นว่าในส่วนของมาตรฐานก็เป็นมาตรฐานเปิด ส่วนซอฟต์แวร์ก็มีทางเลือกที่เป็นโอเพ่นซอร์ส แรงงานหรือก็มีคนยินดีร่วมเป็นอาสาสมัคร (ถ้าระบบมันไม่ใช้ยากเกินจนท้อไปเสียก่อน) อนาคตดูดีทีเดียว วงการห้องสมุด

งงกันมาพอสมควรแล้ว โพสต์นี้ไม่ได้ช่วยให้ใครเข้าใจอะไรขึ้นมาได้แน่ ผมเองก็ไม่เข้าใจ แต่มันพอจะทำให้เห็นความเชื่อมโยง อย่างน้อยก็ของตัวย่อมหาศาลที่จะบุกรุกเข้ามาในชีวิตคุณ ถ้าอยากจะเข้าไปสนุกในสนามห้องสมุดิจิทัล โปรดสังเกตว่าผมใช้คำว่า เข้าไป ไม่ใช่ เข้ามา เพราะผมเองก็ยังไม่ได้อยู่ในสนามนั้น :p ถ้าพัฒนาโปรแกรมอินเทอร์เน็ตได้ สนใจงานพวกนี้ อาจจะเฉี่ยวไปเฉี่ยวมาหน่อย ลองดู Jobs @Opendream

ถ้าอยากอ่านอีก โดดไป ~~ProjectLib~~ LibraryHub เลย หรือแจม LibCamp (ภาพงาน) ที่เดี๋ยวจะมีอีก ผมไม่รับผิดชอบแล้ว! มึน!

อยากมึนหนัก? เผ่นไปบล็อก iTeau โลด จริง ๆ ก็อาจจะไม่มึนนะ เขาเขียนอธิบายดีน่ะ ยกจอก :)

follow @projectlib @iteau @markpeak @kengggg และ @klaikong

อยากมีร้านสำหรับนั่งอ่านหนังสือ

technorati tags: digital library, open archive, Opendream, digitization, metadata, open source, free software, standards

2008-05-19

The Hague Declaration, call for signers

Support free and open information standards, for transparency, for equality, for participatory, for communication rights, for information freedom, and for freedom of expression. — please consider signing the The Hague Declaration.

ขอเชิญพิจารณาและร่วมลงชื่อใน “คำประกาศเฮก” (The Hague Declaration) เพื่อสนับสนุนมาตรฐานดิจิทัลแบบเปิดและเสรี และเรียกร้องให้รัฐบาลทั่วโลกใช้และส่งเสริมมาตรฐานแบบเปิดและเสรี เพื่อความเท่าเทียมและโปร่งใสในการเข้าถึงข้อมูล มีส่วนร่วมในการปกครอง และใช้บริการของรัฐ ผ่านทางระบบอิเล็กทรอนิกส์ (e-Government) โดยไม่ถูกเลือกปฏิบัติ ตามสิทธิและเสรีภาพของเราใน ปฏิญญาสากลว่าด้วยสิทธิมนุษยชน และตามรัฐธรรมนูญ

มาตรา ๕๖ บุคคลย่อมมีสิทธิได้รับทราบและเข้าถึงข้อมูลหรือข่าวสารสาธารณะ ในครอบครองของหน่วยราชการ หน่วยงานของรัฐ รัฐวิสาหกิจ หรือราชการส่วนท้องถิ่น เว้นแต่ การเปิดเผยข้อมูลหรือข่าวสารนั้นจะกระทบต่อความมั่นคงของรัฐ ความปลอดภัยของประชาชน หรือส่วนได้เสียอันพึงได้รับความคุ้มครองของบุคคลอื่น หรือเป็นข้อมูลส่วนบุคคล ทั้งนี้ตามที่กฎหมายบัญญัติ

ในการจะเข้าถึงข้อมูลเหล่านั้นได้ แม้หน่วยงานรัฐจะ “เปิดเผยข้อมูล” แล้ว แต่หากข้อมูลดังกล่าว ไม่ได้อยู่ในรูปแบบที่เป็นมาตรฐานแบบเปิดและเสรี ก็อาจมีอุปสรรคในการเปิดดูได้ในปัจจุบันหรือในอนาคต การให้รัฐใช้มาตรฐานแบบเปิดและเสรีจึงเป็นการรับประกันว่า ข้อมูลข่าวสารของรัฐที่ควรเปิดเผยจะได้รับเปิดเผยและเรียกดูได้อย่างเสรีตลอดไป ทั้งในปัจจุบันและอนาคต

ร่วมลงชื่อ

technorati tags: open standards, e-government, The Hague Declaration

2008-03-06

Open Document Standard, e-Government, and Universal Information Access

ต่อเรื่อง open document standard มาตรฐานเอกสารแบบเปิด ที่ใน duocore ตอนที่ 66 ลืมพูด/เวลาไม่พอเลยข้ามไป

open standard นี่ ทั้งตัว format และ protocol ทุกอย่างที่เกี่ยวข้องเลยนะ

มาตรฐานเอกสารแบบเปิด กับระบบรัฐบาลอิเล็กทรอนิกส์ (e-Government)

เช่นเรื่อง backoffice ระบบบริหารจัดการข้อมูลของระบบราชการ หน่วยงานรัฐ ที่ต้องประมวลผลเอกสารมาก ๆ ทั้งภายในหน่วยงานเอง ระหว่างหน่วยงานรัฐ และกับภาคเอกชน ประชาชน

ถ้าไม่ใช่ฟอร์แมตเปิด การสร้างซอฟต์แวร์ระบบที่จะอ่าน/เขียนเอกสารเหล่านั้นได้อย่างอัตโนมัติ ก็ลำบาก (ต้อง reverse engineering แกะสเปกกันวุ่นวาย) แถมยังไม่สามารถมั่นใจเต็ม 100% ได้ว่าจะอ่าน/เขียนได้ตรงเป๊ะ ซึ่งก็อาจทำให้ข้อมูลบางอย่างตกหล่นสูญหายได้ ยิ่งคิดว่าในกระบวนการทำงานจะต้องมีการส่งเอกสารกันหลายทอด อ่าน/เขียนกันหลายรอบ ก็เป็นไปได้ที่การสูญหายดังกล่าวจะสะสมเยอะขึ้นได้ด้วย

มาตรฐานเอกสารแบบเปิด กับการเข้าถึงข้อมูลข่าวสารถ้วนหน้า (universal information access)

นอกจากนี้ กรณีที่สเปกรูปแบบเอกสารที่มันปิด ไม่ได้เป็นมาตรฐานเปิด ก็ทำให้มีโอกาสอยู่มาก ที่จำนวนโปรแกรมที่จะมาอ่าน/เขียนเอกสารเหล่านั้นได้ มันจะมีอยู่อย่างจำกัด และโดยมากก็มักจะเป็นโปรแกรมของผู้กำหนดสเปกเท่านั้น ที่จะอ่าน/เขียนได้สมบูรณ์ ก็เท่ากับว่า มี "การผูกขาดโปรแกรมในการอ่าน/เขียน" อยู่กลาย ๆ

เช่น กรณีที่หน่วยงานราชการเผยแพร่เอกสารในรูปแบบ .doc (หรือ .xls, .ppt) อย่างเดียว (พูดถึงกรณีเมื่อก่อน ที่ยังไม่ได้เปิดสเปก) เท่ากับบังคับให้ประชาชนต้องมี Windows หรือ Mac OS X เป็นอย่างน้อย เพื่อที่จะใช้โปรแกรม Word Viewer, Excel Viewer เพื่อจะดูเอกสารดังกล่าวได้ (แบบเต็ม 100% ไม่ต้องกลัวว่าจะมีข้อมูลอะไรสำคัญหายหรือเพี้ยนไป) ซึ่งซอฟต์แวร์ดังกล่าวเป็นซอฟต์แวร์ที่ต้องซื้อ -- หรือกรณีถ้าต้องกรอกแบบฟอร์มส่งหน่วยงานรัฐ เช่น ยื่นภาษี แบบประกันสังคม ก็จำเป็นต้องซื้อ Office อีกชุดหนึ่งด้วย (เพื่อให้แก้ไขได้) -- ซึ่งตรงนี้ก็อาจจะขัดกับหลักเรื่อง “การไม่เลือกปฏิบัติ ด้วยฐานะทางเศรษฐกิจ” (?)

ยกตัวอย่าง ประเทศนอร์เวย์ ที่ กระทรวงปฏิรูปการบริหารราชการ ของเขา ประกาศให้หน่วยงานรัฐต้องเผยแพร่ เอกสารในรูปแบบ open standard คือ HTML, PDF กับ OpenDocument (จะมีแบบ non-open ด้วยก็ได้ แต่ต้องมีแบบ open เสมอ)
ดูข่าว: Norway mandates government use of ODF

สหภาพยุโรปและหลายมลรัฐในสหรัฐอเมริกา ก็กำลังจะประกาศระเบียบทำนองนี้เช่นกัน

มาตรฐานเอกสารแบบเปิด กับการเข้าถึงข้อมูลข่าวสารถ้วนหน้า กรณีของประเทศไทย

สำหรับการเปิดเผยข้อมูลข่าวสารของทางราชการ ประเทศไทยมี “พระราชบัญญัติข้อมูลข่าวสารของทางราชการ พ.ศ.๒๕๔๐” ให้หน่วยงานรัฐเปิดเผยข้อมูลต่าง ๆ ให้แก่ประชาชน — โดยยึดหลักนโยบาย “เปิดเผยเป็นหลัก ปกปิดเป็นข้อยกเว้น”

กรณีเผยแพร่ข้อมูลในรูปแบบเอกสารอิเลกทรอนิกส์ที่ใช้ ฟอร์แมตที่ไม่ใช่ มาตรฐานเปิด ก็จะทำให้ประชาชนส่วนหนึ่งไม่สามารถเข้าถึงข้อมูลดังกล่าวได้ ซึ่งอาจผิดรัฐธรรมนูญ 2550 มาตรา 30 (ดูรธน.และพรบ.ดังกล่าวข้างล่าง)

หน่วยงานที่ดูแลเรื่องนี้ของไทยคือ สำนักงานคณะกรรมการข้อมูลข่าวสารของราชการ (สขร.)

รัฐธรรมนูญแห่งราชอาณาจักรไทย พุทธศักราช ๒๕๕๐

มาตรา ๓๐

บุคคลย่อมเสมอกันในกฎหมายและได้รับความคุ้มครองตามกฎหมายเท่าเทียมกัน

ชายและหญิงมีสิทธิเท่าเทียมกัน

การเลือกปฏิบัติโดยไม่เป็นธรรมต่อบุคคลเพราะเหตุแห่งความแตกต่างในเรื่อง ถิ่นกำเนิด เชื้อชาติ ภาษา เพศ อายุ ความพิการ สภาพทางกายหรือสุขภาพ สถานะของบุคคล ฐานะทางเศรษฐกิจ หรือสังคม ความเชื่อทางศาสนา การศึกษาอบรม หรือความคิดเห็นทางการเมืองอันไม่ขัดต่อบทบัญญัติ แห่งรัฐธรรมนูญ จะกระทำมิได้

มาตรการที่รัฐกำหนดขึ้นเพื่อขจัดอุปสรรคหรือส่งเสริม ให้บุคคลสามารถใช้สิทธิและเสรีภาพ ได้เช่นเดียวกับบุคคลอื่น ย่อมไม่ถือเป็นการเลือกปฏิบัติโดยไม่เป็นธรรมตามวรรคสาม

พระราชบัญญัติข้อมูลข่าวสารของทางราชการ พ.ศ. ๒๕๔๐

หมวด ๑ การเปิดเผยข้อมูลข่าวสาร

มาตรา ๗

หน่วยงานของรัฐต้องส่งข้อมูลข่าวสารของราชการอย่างน้อยดังต่อไปนี้ลงพิมพ์ในราชกิจจานุเบกษา
(๑) โครงสร้างและการจัดองค์กรในการดำเนินงาน
(๒) สรุปอำนาจหน้าที่ที่สำคัญและวิธีการดำเนินงาน
(๓) สถานที่ติดต่อเพื่อขอรับข้อมูลข่าวสารหรือคำแนะนำในการติดต่อกับหน่วยงานของรัฐ
(๔) กฎ มติคณะรัฐมนตรี ข้อบังคับ คำสั่ง หนังสือเวียน ระเบียบ แบบแผน นโยบาย หรือการตีความ ทั้งนี้ เฉพาะที่จัดให้มีขึ้น โดยมีสภาพอย่างกฎ เพื่อให้มีผลเป็นการทั่วไปต่อเอกชนที่เกี่ยวข้อง
(๕) ข้อมูลข่าวสารอื่นตามที่คณะกรรมการกำหนด

ข้อมูลข่าวสารใดที่ได้มีการจัดพิมพ์เพื่อให้แพร่หลายตามจำนวนพอสมควรแล้ว ถ้ามีการลงพิมพ์ในราชกิจจานุเบกษาโดยอ้างอิง ถึงสิ่งพิมพ์นั้นก็ให้ถือว่าเป็นการปฏิบัติตามบทบัญญัติวรรคหนึ่งแล้ว ให้หน่วยงานของรัฐรวบรวมและจัดให้มีข้อมูลข่าวสารตามวรรคหนึ่ง ไว้เผยแพร่เพื่อขายหรือจำหน่ายจ่ายแจก ณ ที่ทำการ ของหน่วยงานของรัฐแห่งนั้นตามที่เห็นสมควร

มาตรา ๙

ภายใต้บังคับมาตรา ๑๔ และมาตรา ๑๕ หน่วยงานของรัฐต้องจัดให้มีข้อมูลข่าวสารของราชการอย่างน้อยดังต่อไปนี้ ไว้ให้ประชาชนเข้าตรวจดูได้ ทั้งนี้ ตามหลักเกณฑ์และวิธีการที่คณะกรรมการกำหนด
(๑) ผลการพิจารณาหรือคำวินิจฉัยที่มีผลโดยตรงต่อเอกชน รวมทั้งความเห็นแย้งและคำสั่งที่เกี่ยวข้องในการพิจารณาวินิจฉัย ดังกล่าว
(๒) นโยบายหรือการตีความที่ไม่เข้าข่ายต้องลงพิมพ์ในราชกิจจานุเบกษาตามมาตรา ๗ (๔)
(๓) แผนงาน โครงการ และงบประมาณรายจ่ายประจำปีของปีที่กำลังดำเนินการ
(๔) คู่มือหรือคำสั่งเกี่ยวกับวิธีปฏิบัติงานของเจ้าหน้าที่ของรัฐซึ่งมีผลกระทบถึงสิทธิหน้าที่ของเอกชน
(๕) สิ่งพิมพ์ที่ได้มีการอ้างอิงถึงตามมาตรา ๗ วรรคสอง
(๖) สัญญาสัมปทาน สัญญาที่มีลักษณะเป็นการผูกขาดตัดตอนหรือสัญญาร่วมทุนกับเอกชนในการจัดทำบริการสาธารณะ
(๗) มติคณะรัฐมนตรี หรือมติคณะกรรมการที่แต่งตั้งโดยกฎหมาย หรือโดยมติคณะรัฐมนตรี ทั้งนี้ ให้ระบุรายชื่อรายงาน ทางวิชาการ รายงาน ข้อเท็จจริง หรือข้อมูลข่าวสารที่นำมาใช้ในการพิจารณาไว้ด้วย
(๘) ข้อมูลข่าวสารอื่นตามที่คณะกรรมการกำหนด

ข้อมูลข่าวสารที่จัดให้ประชาชนเข้าตรวจดูได้ตามวรรคหนึ่ง ถ้ามีส่วนที่ต้องห้ามมิให้เปิดเผยตามมาตรา ๑๔ หรือมาตรา ๑๕ อยู่ด้วย ให้ลบหรือตัดทอนหรือทำโดยประการอื่นใดที่ไม่เป็นการเปิดเผยข้อมูลข่าวสาร ส่วนนั้น บุคคลไม่ว่าจะมีส่วนได้เสียเกี่ยวข้องหรือไม่ก็ตาม ย่อมมีสิทธิเข้าตรวจดู ขอสำเนาหรือขอสำเนาที่มีคำรับรองถูกต้องของข้อมูลข่าวสารตามวรรคหนึ่งได้

ในกรณีที่สมควรหน่วยงานของรัฐโดยความเห็นชอบของคณะกรรมการ จะวางหลักเกณฑ์เรียกค่าธรรมเนียม ในการนั้นก็ได้ ในการนี้ให้คำนึงถึงการช่วยเหลือผู้มีรายได้น้อยประกอบด้วย ทั้งนี้ เว้นแต่จะมีกฎหมายเฉพาะบัญญัติไว้เป็นอย่างอื่น คนต่างด้าวจะมีสิทธิตามมาตรานี้เพียงใดให้เป็นไปตามที่กำหนดโดยกฎกระทรวง

Towards universal information access...

เรื่องของ การเข้าถึงข้อมูลข่าวสารถ้วนหน้า (universal information access) นี่ มีหลายประเด็น นอกเหนือจากเรื่องมาตรฐานเปิด เช่น ยังมีเรื่องของ ความสามารถในการเข้าถึง (accessibility) หรือพูดง่าย ๆ ว่า ความสะดวกในการใช้งาน ด้วย — ถ้าบนเว็บก็คือ web accessibility เช่น ตัวอักษรเล็กไปมั๊ย สีอ่านยากมั๊ย เพราะบางคนมีปัญหาทางสายตา หรือ เมนูใช้ลำบากเกินไปรึเปล่า เพราะบางคนมีความบกพร่องทางร่างกายทำให้คลิกเมาส์เร็ว ๆ ไม่ได้ หรือว่าข้อมูลนั้นค้นหาเจอได้ง่ายรึเปล่า ฯลฯ อะไรพวกนี้ ก็จะเกี่ยวกับเรื่องการออกแบบสารสนเทศและการใช้งาน (information design/interaction design) อยู่ด้วย — คืออันนี้ไม่ได้พูดถึงว่าต้องง่ายสุด ๆ นะ แต่อย่างน้อยต้องยากไม่เกินระดับที่จะทำให้เป็นอุปสรรคในการเข้าถึงข้อมูลข่าวสาร

ซึ่งบางประเทศ บางเมืองในสหรัฐอเมริกา เช่น นิวยอร์ก ได้ประกาศกฎหมายบังคับให้เว็บของหน่วยงานรัฐทุกแห่ง ต้องสอบผ่านมาตรฐานเรื่อง web accessibility นี้แล้ว

ดูเรื่องนี้ต่อได้ที่ Wikipedia และ W3C

สำหรับนอกเว็บ แต่ยังเกี่ยวข้องกับข้อมูลข่าวสารแบบดิจิทัลอยู่ ก็เช่น พวก kiosk ตู้บริการข่าวสารตามถนน ตามท่ารถ สถานที่ราชการ บริการสาธารณะ พวกนี้ก็ต้องออกแบบมาให้ทุก ๆ คนใช้ได้ด้วย เช่น ผู้มีปัญหาด้านประสาทสัมผัส หูไม่ค่อยดี ตาฝ้าฟาง ก็ต้องใช้ได้ หรือมีความบกพร่องทางกายภาพ นั่งรถเข็น หรือมือพิการ ก็ต้องใช้ได้

อย่าง ตู้บริการข่าวสาร ที่มีแป้นเหยียบให้ใช้เท้าเลือกเมนูได้ แทนการใช้มือกดหน้าจอสัมผัส หรือ ปุ่มขอความช่วยเหลือจากพนักงานเดินรถที่สถานีรถไฟ ที่ต้องมีปุ่มที่ต่ำกว่าระดับปกติด้วย เพื่อให้คนที่นั่งรถเข็นกดได้สะดวก และไมค์และลำโพงก็ต้องมีอีกชุดที่อยู่ในตำแหน่งใกล้เคียงกับปุ่มอีกปุ่มที่ว่าด้วย

เหล่านี้คือสิ่งที่จะช่วยให้ พลเมืองทุกคน สามารถเข้าถึงข้อมูลข่าวสารต่าง ๆ ได้อย่างเท่าเทียมกันมากขึ้น

technorati tags: information access, open standard, accessibility

2007-12-27

Time for Unicode ?

เราควรจะเปลี่ยนไปใช้รหัสข้อมูลอะไรดี ? สำหรับเอกสารภาษาไทยในโลกยุคอินเทอร์เน็ต

จะ Windows-874, TIS-620 หรือ ISO-8859-11 ก็คงไม่เพียงพอแล้ว สำหรับโลกยุคอินเทอร์เน็ตและสังคมพหุภาษา แม้แต่เอกสาร “ภาษาไทย” ในปัจจุบันก็ยังมีตัวอักษรละตินหรือสัญลักษณ์พิเศษต่าง ๆ แทรกอยู่มากมาย ซึ่งบางตัวก็ไม่ได้มีอยู่ทั้งใน Windows-874, TIS-620 และ ISO-8850-11

ได้เวลาเปลี่ยนมาใช้ Unicode ให้หมดรึยังนะ ?
(สำหรับงานส่วนใหญ่ ที่ขนาดพื้นที่จัดเก็บข้อมูล/แบนด์วิธ ไม่ได้เป็นข้อจำกัดสำคัญอีกต่อไปแล้ว)

ทั้งหน้าเว็บ ไฟล์เอกสาร metadata โค้ดโปรแกรมต่าง ๆ

แต่จะใช้อะไรดี UTF-8 หรือ UTF-16 ?

Windows NT ขึ้นไป, Windows CE, Java, .NET, Mac OS X และ Qt แพลตฟอร์มเหล่านี้ ใช้ UTF-16 เป็น native character set
แต่ถ้าเป็นโลก Unix และอินเทอร์เน็ต UTF-8 ก็แพร่หลายกว่า

ถ้าพูดถึงเฉพาะที่เกี่ยวข้องกับอินเทอร์เน็ต ไปใช้ UTF-8 กันให้หมดเลยดีมั๊ย ? สำหรับข้อมูลภาษาไทย ทั้งหน้าเว็บ ฐานข้อมูล metadata ฯลฯ

ข้อดี-ข้อเสีย ? อะไรคืออุปสรรค ?

technorati tags: Thai, UTF-8, UTF-16

2007-12-12

Provinces of Thailand HTML selection box

HTML option's values according to TIS 1099-2535 Standard for Province Identification Codes for Data Interchange

ค่า value ของแต่ละ option ตาม รหัสจังหวัดเพื่อการแลกเปลี่ยนข้อมูล (มอก. 1099-2535)

download: จังหวัดในประเทศไทย HTML selection box

technorati tags: Thailand, HTML, province

2007-10-19

ISO 11940 - Transliteration of Thai

ระหว่างหาข้อมูลแก้บั๊ก Thai (URL) romanization ใน DokuWiki (ซึ่งที่แลบกำลังจะเปลี่ยนไปใช้) ก็ไปเจอนี่

ISO 11940 - Transliteration of Thai

เขาใช้ตัวอักษรละตินเป็นพื้น แล้วก็มีขีดโน่นขีดนี่เพื่อแยกย่อยตัวอักษรลงไปอีก หน้าตาก็จะประมาณตัวละตินที่ใช้เขียนภาษาเวียดนาม หรือตุรกี ทำนองนั้น

เท่าที่ดู ISO 11940 นี่ เป็นการถอดรูปตัวสะกด ไม่ใช่การถ่ายเสียงอ่าน เช่น (ตัวอย่างจากวิกิพีเดีย):
[ถ่ายเสียงตามราชบัณฑิตฯ ← เขียนด้วยตัวอักษรไทย → ถอดรูปตาม ISO 11940]

Phasa Thai ← ภาษาไทย → p̣hās̛̄āịthy

Chiang Mai ← เชียงใหม่ → echīyngıh̄m̀

ดูแล้วเพี้ยน ๆ ดี - -"

CLDR ก็เอามาตรฐาน ISO 11940 นี้ไปปรับใช้เหมือนกัน

technorati tags: Thai, transliteration, ISO, standards

Unicode CLDR 1.5 Released

สมาคมยูนิโคดออก CLDR รุ่น 1.5 แล้ว (เมื่อสามเดือนที่แล้ว - วันที่ 31 ก.ค. 2550)

CLDR (Common Locale Data Repository) เป็นฐานข้อมูลข้อมูลท้องถิ่น (locale data) สำหรับนำไปดัดแปลงซอฟต์แวร์ให้ทำงานได้เข้ากับแต่ละภาษาและท้องถิ่น ตัวอย่างข้อมูลที่ CLDR มีให้ เช่น รูปแบบวันที่ เวลา เขตเวลา ตัวเลข ค่าเงิน การเรียงลำดับข้อความ ฯลฯ

CLDR 1.5 มีข้อมูลสำหรับ 135 ภาษาและ 149 พื้นที่ หรือนับเป็นทั้งหมด 394 ชุดข้อมูลท้องถิ่น และมีข้อมูลมากกว่ารุ่นที่แล้วถึง 42% โดยข้อมูลทั้งหมดมาจากผู้ร่วมโครงการกว่า 160 ราย โดยรายหลักมี Adobe, Apple, Google, IBM, Sun และตัวแทนจากหลายประเทศ ซึ่งรวมถึงอาสาสมัครทั่วโลกด้วย (สำหรับประเทศไทย มีพี่สัมพันธ์ ระรื่นรมย์ เจ้าเก่า, คุณณิชชา กำโชคภัทรพร, และคุณสุวิทย์ ศรีวิไลฤทธิ์ เข้าร่วม — เห็นพี่สัมพันธ์เคยมาถาม ๆ ในอีเมลกลุ่มของ LTN/Thai Linux Working Group อยู่บ้าง)

CLDR เดิมเป็นโครงการของ OpenI18N โดยมีสมาชิกก่อตั้งคือ IBM, Sun และ OpenOffice.org ก่อนที่ยูนิโคดจะรับเข้าเป็นโครงการในความดูแล (ตั้งแต่ CLDR 1.1)

ตัวอย่างแพลตฟอร์มที่รองรับ CLDR เช่น .NET Framework และ Java platform ส่วนโปรแกรมที่นำไปใช่ ก็เช่น OpenOffice.org (แน่นอน)

ดูข้อมูลเพิ่มเติมได้ที่ http://unicode.org/cldr/ และ Wikipedia

technorati tags: i18n, data, Unicode

2007-10-16

Web Accessibility Thailand

update: คุณ iake แนะนำมา:
TotalValidator สำหรับตรวจสอบความถูกต้องของโครงสร้างหน้าเว็บ

การใช้สีตัวอักษรกับสีพื้นหลังที่ไม่กลมกลืนกันจนเกินไป
การใช้แท็ก HTML ที่ถูกต้องตรงกับจุดประสงค์ของแท็ก
การระบุคำอธิบายเพิ่มเติม เพื่อช่วยโปรแกรมอ่านหน้าจอที่คนตาบอดใช้ (เช่นในแอตทริบิวต์ alt ในแท็ก img)
ฯลฯ

เหล่านี้จะช่วยให้ข้อมูลบนอินเทอร์เน็ต สามารถเข้าถึงได้โดยเสมอภาคและเท่าเทียมกัน ไม่ว่าจะสภาพทางกายของผู้ใช้จะอย่างไร ... ซึ่งเป็นไปตามหลักสิทธิขั้นพื้นฐาน (และได้รับรองไว้ในรัฐธรรมนูญ)

“การเลือกปฏิบัติโดยไม่เป็นธรรมต่อบุคคล เพราะแห่งความแตกต่างในเรื่อง ถิ่นกำเนิด เชื้อชาติ ภาษา เพศ อายุ สภาพทางกาย หรือสุขภาพ สถานะบุคคล ... จะกระทำมิได้”

ลองตรวจสอบดูว่า เว็บของคุณ ของหน่วยงานของคุณ ขององค์กรที่คุณติดต่อ สามารถเข้าถึงได้โดยทุกคนอย่างเสมอภาคและเท่าเทียมกันหรือไม่
โดยใช้เครื่องมือง่าย ๆ ที่:
http://astec.nectec.or.th/web_check/
(ลองแจ้งผลมาดูกันหน่อย ว่าเป็นอย่างไร แล้วลองบอกผู้ดูแลเว็บนั้นถึงเรื่องนี้)

(หรือใช้ http://www.totalvalidator.com/
คุณ iake แนะนำมา ตัวนี้ตรวจได้หลายหมวด ทั้ง web accessibility, HTML, ตัวสะกด ฯลฯ)

โดยเมื่อคลิกเพื่อตรวจหน้าเว็บแล้ว ระบบจะแจ้งให้โดยละเอียดว่า มีจุดไหนบ้างของหน้าเว็บ ที่ไม่ตรงตามข้อกำหนดหรืออาจก่อปัญหาในการเข้าถึงได้ พร้อมมีคำแนะนำในการปรับปรุง

สรุปการตรวจสอบ

รายละเอียดจุดที่ไม่ตรงกับข้อกำหนด

เว็บนี้จัดทำโดย ศูนย์วิจัยและพัฒนาเทคโนโลยีสิ่งอำนวยความสะดวกสำหรับคนพิการ (ASTEC) เนคเทค

ที่ ASTEC ยังมีเอกสารเผยแพร่เกี่ยวกับ web accesibility และ accessibility ทั่วไป ที่น่าสนใจ ให้ศึกษาอีกเป็นจำนวนมาก
เช่น หลักการออกแบบที่เป็นธรรมสำหรับเทคโนโลยีสารสนเทศ, การใช้ CSS เพื่อให้ทุกคนเข้าถึงเว็บได้, Flash ที่ทุกคนเข้าถึงได้

สำหรับตัวข้อกำหนดด้าน web accessibility ระดับสากล ดูได้ที่ Web Content Accessibility Guidelines (WCAG)

เรื่อง accessibility นี้แน่นอนว่าครอบคลุมไปถึง พระราชบัญญัติข้อมูลข่าวสารของราชการ พ.ศ. 2540 (และทุก ๆ เรื่อง) ด้วย ดังนั้นในกรณีที่ประชาชนผู้พิการหรือทุพลภาพมีความต้องการจะเข้าถึงข้อมูลข่าวสารของราชการ รัฐก็ต้องมีหน้าที่จัดหาและอำนวยความสะดวกให้ประชาชนรายนั้น ได้เข้าถึงข้อมูลได้เท่าเทียมกับผู้มีสภาพทางกายครบถ้วนอย่างเสมอกันเช่นกัน โดยไม่มีข้อยกเว้น

อ่านต่อ

วันทนีย์ พันธชาติ: เทคโนโลยีสารสนเทศเพื่อพัฒนาคุณภาพชีวิตของคนพิการ
อธิบายและให้ภาพกว้างเพื่อความเข้าใจเกี่ยวกับ สถานภาพคนพิการในประเทศไทย, การนำเทคโนโลยีสารสนเทศมาพัฒนาคุณภาพชีวิตของคนพิการ, และเทคโนโลยีสำหรับคนพิการประเภทต่าง ๆ
(ผู้เขียน ปัจจุบันเป็น ผู้อำนวยการ ASTEC)

mk: Accessibility for Disability
ประสบการณ์และความคิดในฐานะผู้ใช้และผู้พัฒนาคนหนึ่ง

ป.ล. เพิ่งเห็นในหน้าทีมงาน ว่าพี่คนนึงในที่เรียนเอกอยู่ที่สถาบัน ทำงานอยู่ที่แล็บ ASTEC ด้วย จุดไต้ตำตอ - -"

เพิ่มเติม (2008.03.06): ปกป้องทำ สไลด์แนะนำเรื่อง web accessibility เอาไว้ (เสนอในงาน BarCamp Bangkok ครั้งแรก)

[ ลิงก์ Web Accessibility Check | ผ่าน poakpong ]

technorati tags: accessibility, web, ASTEC

2007-08-30

OOXML Advertorial -- NoOOXML

OOXML ทำเนียน

วันนี้เจอโฆษณา “Open XML” ใน ฐานเศรษฐกิจ ฉบับวันที่ 30 ส.ค. - 1 ก.ย. 2550 หน้า 34 (เซคชั่น "ตลาด-ตลาดภูมิภาค")

หน้าตาทำเหมือนเป็นบทความ ขึ้นหัวใหญ่ว่า

“ธุรกิจไทย คนไทย มีทางเลือกหรือไม่ในเวทีระดับโลก
ประเทศไทยควรโหวตรับมาตรฐานการจัดเก็บเอกสารใหม่หรือไม่...”

ในนั้นมียกคำพูดจากบุคคลในวงการไอทีต่าง ๆ เช่นจาก คุณฟูเกียรติ จุลนวล ผู้จัดการฝ่ายกลยุทธ์และแพลตฟอร์ม บริษัท ไมโครซอฟท์ (ประเทศไทย) จำกัด คุณสมเกียรติ อึ้งอารี ประธานกรรมการบริหาร บริษัท ซีเนียร์ คอม จำกัด นายกสมาคมอุตสาหกรรมซอฟต์แวร์ไทย (ATSI) คุณสุวิภา วรรณสาธพ ผู้อำนวยการเขตอุตสาหกรรมซอฟต์แวร์ประเทศไทย (ซอฟต์แวร์พาร์ค)

ตรงกลาง ๆ “บทความ” ตอนหนึ่งเขียนว่า

“ที่สำคัญ การโหวตครั้งนี้เป็นการทำให้ภาษาไทยได้เข้าไปเป็นหนึ่งในมาตรฐานโลก ซึ่งหากต่อไปจะมีการพัฒนาแอพพลิเคชั่นอะไรขึ้นมาแล้ว ภาษาไทยก็จะเป็นหนึ่งภาษาที่ถูกนำไปพิจารณาด้วย แม้ว่าจะมีผู้ใช้เฉพาะในประเทศไทยเท่านั้น”

... จริงหรือไม่ครับ ?
(แต่เป็นการใช้ภาษาที่ดูดีทีเดียว เขียนแบบให้ความหวังมากในที่แรก จะมีภาษาไทยแน่ ๆ ... แต่ในตอนสุดท้ายก็ทิ้งระยะความรับผิดชอบแบบนิ่ม ๆ .. จะถูกนำไปพิจารณาเท่านั้นแหละนะ ไม่ได้สัญญาอะไรมากกว่านี้)

อีกตอนหนึ่งเขียนว่า

“วันนี้เรากำลังมีทางเลือกในการที่จะมีอีกมาตรฐานที่ช่วยในการจัดเก็บเอกสารไว้ใช้งาน ประเทศไทยอาจจะไม่จำเป็นต้องรับรองให้ Open XML เป็นมาตรฐาน ISO ก็ได้ แต่ถามว่า วันนี้เรามีมาตรฐานที่เหมาะสมที่ช่วยในการจัดกับเอกสารที่เรามีใช้งานอยู่แล้วในองค์กร รวมถึงมาตรฐานที่ช่วยให้เอกสารของเราสามารถทำงานร่วมกับระบบงานต่าง ๆ ที่มีใช้งานอยู่แล้วในองค์กร”

อ่านโดยรวมทั้งหมดแล้ว จะเน้นกลุ่มองค์กรที่ใช้งานไมโครซอฟท์ออฟฟิศอยู่แล้ว และสร้างความไม่แน่ใจเกิดขึ้นว่า ถ้า Open XML ไม่ได้เป็นมาตรฐาน ISO แล้วเอกสารทั้งหมดของพวกเขา จะทำงานกับระบบอื่น ๆ ในโลกไม่ได้

ก็ติดตามตรวจสอบกันไปครับ ใครพูดจริงเท็จ พูดครึ่งเดียว พูดบิดเบือน ...

แล้ว สมอ. ของไทย จะเชื่อใคร โหวตให้ใคร เพื่อเห็นแก่ประโยชน์ของใคร ... ก็ดูกันไป

พวกเราจะไปมีส่วนร่วมอะไรได้ไหม ??

ลองอ่าน รวมความเห็น OOXML จากหลายฝ่าย ที่ Blognone

ถ้าใครพิจารณาแล้ว ไม่สนับสนุนการมีอีกมาตรฐาน (ตอนนี้ ISO มีมาตรฐานการจัดเก็บเอกสารอยู่แล้ว ชื่อว่า OpenDocument)
ก็ไปลงชื่อคัดค้านกัน ที่ No OOXML (ในนั้นมีเหตุผลให้อ่านเป็นข้อ ๆ เลย ลองอ่านดู)

(เลือกรูปอื่น ๆ ไปแปะเว็บ ได้จาก NoOOXML Banners)

technorati tags: OOXML, standard, vote, no

2007-06-20

International Press Telecommunication Council

International Press Telecommunication Council
IPTC focussed on developing and publishing Industry Standards for the interchange of news data.

IPTC News Exchange Formats (inc. NewsML), IPTC NewsCodes (taxonomies, controlled vocabularies), IPTC Photo Metadata

มาตรฐานแลกเปลี่ยนข้อมูลข่าว

technorati tags: news, metadata, standards

2006-06-04

OpenSearch

OpenSearch is a set of simple formats for the sharing of search results. Any website that has a search feature can make their results available in OpenSearch format. Other tools, like web browser integrated search service, can then read those search results.

See what major browsers will do with this OpenSearch: Firefox 2, IE 7, and Opera 9.

tags: OpenSearch

2006-04-19

2-4 May - Regional Conference on Open Standard:

โหมโฆษณากันหน่อย :P

Regional Conference on Open Standard:
The key to an Open ICT Ecosystem
Bangkok, Thailand. 2-4 May 2006

เป็นการประชุมเกี่ยวกับมาตรฐานเปิด ในเรื่องไอซีทีและกิจการที่เกี่ยวข้อง (Health care, Life sciences, Logistics, Supply Chain Management, Business Process Management, Enterprise Resource Planning, Open Source Software)

Sponsored by SIPA, IBM, Oracle, Intel, NECTEC, and Cisco. In cooperation with UNDP-APDIP.

ไปได้ก็ไปกันครับ ฝากบอกต่อ ๆ กันด้วย

2005-04-09

DTD, W3C XML Schema, RELAX NG, Schematron, Examplotron

What is your choice? Why?

2005-03-31

Unicode, XML, TEI, Ω and Scholarly Documents

โดย Yannis HARALAMBOUS เสนอที่ 16th International Unicode Conference, Amsterdam, 2000

สองตัวแรกส่วนใหญ่คงเคยได้ยินกันมาบ้างแล้ว อยากรู้รายละเอียด ลองอ่าน Unicode, XML

TEI คือ Text Encoding Initiative เป็นคล้ายๆ "ข้อแนะนำ" สำหรับการจัดเก็บข้อมูลในคอมพิวเตอร์ ก่อนหน้านี้ใช้ SGML ตอนนี้เริ่มค่อยๆ ปรับเปลี่ยนมาใช้ XML ละ

หมายเหตุ: SGML, XML เป็นเพียงแค่ markup language หรือพูดอีกอย่างคือ เป็นเพียงแค่เครื่องมือในการเข้ารหัสเท่านั้น แต่ไม่ได้บอกว่า จะเข้ารหัสยังไง ตัวอย่างเช่น สมมติมี โคลงสี่สุภาพอยู่บทนึง จะเก็บยังไง เก็บทั้งบทรวมกันเป็นก้อนเดียวโดยใส่เครื่องหมายแบ่งบรรทัดลงไปด้วย หรือว่าแยกเป็นสี่ส่วน แต่ละส่วนมีโครงสร้างเหมือนกัน แล้วให้แต่ละส่วนเก็บแต่ละบาท (โคลงสี่สุภาพ 1 บท มี 4 บาท) แล้วจากนั้นค่อยใส่สี่บาทนี้เข้าไปในตัวบทอีกที แล้วเอาตัวบทไปใส่ในตัวโคลงอีกที ฯลฯ อะไรพวกนี้ นี่คือสิ่งที่ TEI ทำ
แล้วเอาไปใช้ทำอะไรอ่ะ? – ดู The Oxford Text Archive ได้ เค้าเก็บเอกสารต่างๆ หลายประเภท เอาไว้ในรูปแบบอิเล็กทรอนิกส์

ส่วน Ω (เพิ่งเคยเห็นวันนี้) คือส่วนขยายของ TeX เพื่อรองรับ Unicode (ไม่ใช่ จมูกหมีอันใหญ่ แต่อย่างใด)

ได้ลิงก์ของบทความนี้มาจากบล็อกพี่พูลลาภ ขอบคุณมากครับ :)
พอดีกำลังดูเรื่อง TEI กะ Unicode อยู่ อันนี้ใช้ได้เลย มีพูดถึงประเด็นที่น่าสนใจและน่าจะเอามาใช้ได้ด้วย thanx thanx :D

2005-03-21

The New FSF: Free Service Foundation ?

(Yahoo ซื้อ Flickr แล้วนะ)

ใช้ IM ของ MSN (MSN Messenger)
ใช้บล็อกกะอีเมล ของ Google (Blogspot, GMail)
ใช้อัลบั้มรูปกะอีเมล ของ Yahoo (Flickr)

กระจัดกระจาย

เออ ดี แบ่งกันไปให้หมด ปวดหัว อยากได้ทุกอย่าง ที่เดียว ID เดียวอ่ะ
ต้องทำเองมั๊ยเนี่ย -_-"

แต่ทำเองก็ไม่ดีหรอก เพราะว่าจริงๆ ไอ้พวกนี้มันจะใช้ได้ดี มีคุณค่าขึ้นมา ก็ดีตรงที่เครือข่าย
ลำพัง application น่ะ มันก็เฉยๆ แต่มันดีขึ้นมาได้มากๆ ก็ด้วยคนที่เข้าไปใช้
ถ้าทำเองสร้างเอง ใช้อยู่คนเดียว มันก็ไม่มีพลังจาก social network ตรงนั้น
อย่าง Flickr ถ้ามันเชื่อมไปอัลบั้มชาวบ้านไม่ได้ (ผ่านทาง tag, ทาง contacts) มันก็แทบไม่มีอะไรต่างกะอัลบั้มรูปออนไลน์สมัยเก่าเลย

จะหวังให้มีการเชื่อมข้ามเครือข่าย? เปิดให้ใครๆ ก็เข้ามาเชื่อมได้?
(เช่น เราตั้งพื้นที่ส่วนตัวของเราขึ้นมาเอง บนเซิร์ฟเวอร์เราเอง แล้วให้ไปเชื่อมกับ Flickr, Blogspot, MSN Spaces โยง contacts กันไปมาได้)
ผ่านทาง Web API กลาง ... ฝันเหอะ แค่โปรโตคอล IM นี่ยังรอกันไม่เลิกเลย

เราต้องการ Free Service Foundation ?
ต่อไปใครจะสนใจว่าใช้ "ซอฟต์แวร์" อะไร .. มีใครสนใจบ้างนะ?
ถ้ามือถือของเรา ('โทรศัพท์มือถือ'? ป่าว ผมบอกแค่ 'มือถือ' มันเป็นอะไรมากกว่านั้นไปแล้วนี่) ทำอะไรได้ทุกอย่างที่เราต้องการ ผ่านบริการต่างๆ ทั้งฟรี และบอกรับสมาชิก
ใครจะสนใจว่าบริการเหล่านั้นใช้ซอฟต์แวร์อะไร ทำงานอะไร?
(โอเค สนนิดหน่อย ก่อนตัดสินใจใช้ เหมือนอ่านพวกหนังสือเครื่องเสียง เปรียบเทียบรุ่น สเปก ราคา ต่างๆ ก่อนซื้อ, แต่หลังจากนั้น เราก็ลืมไปเลย วันๆ กดรีโมตอย่างเดียว ไม่ได้สนแล้วว่าสเปกมันอะไรบ้าง ฟังเพลงเพราะ เลือกแทร็คได้ ทำอะไรๆ อย่างที่ต้องการได้ พอแล้ว เอาเวลาไปคิดเรื่องอื่นบ้าง ปวดหัว)

FSF เก่า (S สำหรับ Software/ซอฟต์แวร์) ก็ยังต้องมีอยู่ สำหรับสิ่งต่างๆ ที่อยู่ข้างใต้ (ผู้ใช้จะสนใจมันรึเปล่าไม่รู้ล่ะ แต่ของพื้นฐานมันต้องมี ไม่มีไม่ได้)
แต่เราคงต้องมี FSF ใหม่ (S สำหรับ Service/บริการ) เพิ่มขึ้นมาด้วย
ซอฟต์แวร์เป็นชิ้นๆ ไม่ได้ต่อกันเป็นบริการ ก็เหมือนแขนข้าง ขาข้าง ไม่ได้เอามาต่อกัน ความสามารถก็จำกัด?

มาตรฐานเปิด อย่างมาตรฐานเอกสาร พวก OpenDocument หรือพวกลูกหลาน XML อะไรทั้งหลายแหล่นั่น ก็น่าจะเป็นจุดเริ่มต้น เป็นพื้นฐาน ของ FSF ใหม่นี้ได้
แต่อันนั้นมันกำหนดแค่ มาตรฐานข้อมูล ไม่ได้มีเรื่อง มาตรฐานการแลกเปลี่ยน

มาตรฐานการแลกเปลี่ยน พื้นฐานสุดตอนนี้ ก็คงเป็น TCP/IP, แล้วก็มีพวก web services ทั้งหลายมาซ้อนอยู่ด้านบน บอกว่าจะแลกเปลี่ยนกันยังไง ข้อตกลงต่างๆ (คำว่า protocol/โปรโตคอล แปลตรงๆ ก็คือ ข้อตกลง/พิธีสาร นั่นเอง)
แต่อย่างโปรแกรมที่เราใช้กันอยู่ทุกวัน อย่างการเขียนบล็อก เว็บแต่ละที่ ถึงจะใช้ web service เหมือนกัน แต่ก็มี api ต่างกัน ไม่ได้มีอะไรที่ใช้ร่วมกันเลย (ส่วนการอ่านนี่ ก็คงผ่าน RSS, RDF, Atom อะไรพวกนี้ อันนี้ดีหน่อย)

หรือเราจะมีทางมีโปรโตคอลกลางสำหรับแชร์ contact list รึเปล่า? และบริการอื่นๆ ด้วย (สมุดนัดหมาย?)
แบบว่าลิขสิทธิ์ถือโดยองค์กรกลางอะไรซักอย่าง แล้วสัญญาอนุญาตการใช้งาน ก็เป็นแบบเสรี (Free Service License? .. ผมก็ตั้งชื่อไปงั้นแหละ ยังนึกไม่ออกว่ามันจะออกมาเป็นไง)
แล้วเจ้าเซิร์ฟเวอร์ที่ให้บริการนี่ ก็ใครจะตั้งขึ้นมาก็ได้ เป็นลักษณะ distributed, decentralized กระจาย, ไม่รวมศูนย์
(อย่างของ Drupal? ชื่อเดียวล็อกอินเข้าเว็บ Drupal ที่ไหนก็ได้? .. หรือว่าอย่าง Liberty Alliance ที่เป็นระบบ single sign-on?)

สมมติ ผมตั้งเซิร์ฟเวอร์ (อาจจะที่โน๊ตบุ๊คผมนี่แหละ เป็น peer-to-peer ก็ได้) ของผมขึ้นมาเอง ใช้ซอฟต์แวร์ "Miss Photo" (นามสมมติ)เอาไว้เก็บรูปถ่ายต่างๆ ของผม มี รูปวัด รูปทะเล
จะมีทางยังไง ให้มันโยงหน้าที่แสดงรูปทะเลของผม เข้ากับรูปทะเลของคนอื่นๆ ที่เค้าใช้ซอฟต์แวร์ "ePhoto" ได้โดยอัตโนมัติ
ถ้าไม่มีมาตรฐานกลางเรื่องโปรโตคอล เรื่อง api เราไม่น่าจะทำได้นะ
แล้วถ้าไม่มีองค์กรอะไรที่เราเชื่อถือได้มาดูแลเรื่องนี้ .. อะไรจะมารับรองว่า มันจะเป็นกลาง และเสรีไปตลอด?

โมเดล ซอฟต์แวร์เสรี จะมาช่วยสร้าง บริการเสรี ได้รึเปล่า?

Free Service Foundation .. ตอนนี้ไกลตัวเราเกินไปมั๊ย?

หมายเหตุ: อยากเขียนเป็นภาษาอังกฤษนะ เผื่อคนชาติอื่นๆ จะได้อ่านด้วย
แต่ตะกี้มันแบบ ระเบิดออกมาทันทีน่ะ ยังไงถ่ายทอดเป็นภาษาแม่มันก็ไหลกว่า (จินตนาการไม่ถูกจำกัดด้วยความอ่อนหัดทางภาษา)
แต่ตอนนี้ก็ขี้เกียจแปลละ เหมือนที่พยายามจะพูด พูดเป็นภาษาไทยยังไม่ค่อยชัดเจนเลย แปลเป็นภาษาอังกฤษแล้วจะไปกันใหญ่ -_-

2005-02-01

Vote YES for OpenDocument

open source เปิดรหัสโปรแกรมว่าทำงานอย่างไรอย่างเดียวไม่พอ ต้องเปิดเผยด้วยว่าเก็บข้อมูลอย่างไร

OpenOffice.org 1.0 format --> Open Office XML --> OpenDocument format

OpenOffice.org 1.0 format นั้นเป็นรูปแบบการจัดเก็บ ที่โปรแกรม OpenOffice.org รุ่น 1.x ทั้งหลายใช้ รวมไปถึง ปลาดาวออฟฟิศ ออฟฟิศทะเล และ StarOffice ด้วย

ต่อมา ทาง Sun Microsystems ก็ได้เสนอรูปแบบนี้ไปยัง OASIS เพื่อพัฒนาเป็นมาตรฐาน โดยได้รับการสนับสนุนจากบริษัทและองค์กรอื่นๆ ในอุตสาหกรรม และเปลี่ยนชื่อเป็น Open Office XML

และเมื่อเร็วๆ นี้ รูปแบบนี้ก็ได้ถูกเสนอต่อไปยัง ISO เพื่อพิจารณาเป็นมาตรฐานสากล และเปลี่ยนชื่อเป็น OpenDocument

OpenDocument เป็นรูปแบบข้อมูลสำหรับการจัดเก็บเอกสารในสำนักงาน โดยมีพื้นฐานอยู่บนมาตรฐานสากลอย่าง XML และมาตรฐานอื่นๆ เช่น SVG, Dublin Core, MathML คือพยายามจะไม่สร้างอะไรใหม่ขึ้นมาถ้าไม่จำเป็น พยายามใช้ของเดิมๆ ให้มากที่สุด

สหภาพยุโรปเป็นเหมือน 'ลูกค้า' รายใหญ่ ที่รอดูอยู่ ว่าจะเลือกใช้รูปแบบไหนดี ระหว่าง Office XML ของไมโครซอฟต์ กับ OpenDocument ซึ่งมีผู้ดูแลคือ OASIS และผู้สนับสนุนมากมายอย่าง OpenOffice.org, KOffice, Sun, IBM, HP, Novell, Adobe, Corel และอีกเพียบ

ทั้งสองรูปแบบ ต่างก็พยายามวิ่งเต้นกับคณะกรรมการของสหภาพยุโรปเป็นการใหญ่ เพื่อหวังจะให้รูปแบบของตนเป็นมาตรฐานในงานภาครัฐทั้งหมดของสหภาพยุโรป
โดยทางอียู ก็ได้มีการพิจารณาทั้งสองรูปแบบ และให้ข้อเสนอแนะกับทั้งสองค่าย เพื่อนำไปปรับปรุงรูปแบบของตนต่อไป ก่อนจะมีการพิจารณาใหม่อีกรอบ

โดยทางสหภาพยุโรปนี่ เค้ามีคณะทำงานเรื่องนี้มานานแล้ว ชื่อโครงการก็คือ 1dok โดย 1dok นี่ก็เป็นสมาชิกของ OASIS ด้วย

นอกจากสหภาพยุโรปแล้ว ทางรัฐแมสซาชูเซตต์ในสหรัฐอเมริกา ก็มีท่าทีแข็งขันต่อเรื่องความโปร่งใสของการจัดเก็บเอกสารอิเลกทรอนิกส์ด้วย

ตอนนี้ ฉบับร่าง ของ OpenDocument 1.0 ก็ออกมาให้สาธารณชนดูกันแล้ว รอรับคำแนะนำต่างๆ เพื่อไปปรับปรุง

อ่านๆ มานี่ ไม่ต้องบอกก็พอเดาได้ ว่าผมเชียร์ OpenDocument :P

ไม่รู้ว่างานนี้ คุณ James Clark ที่ตอนนี้อยู่ SIPA จะช่วยดันเรื่องนี้กับทางภาครัฐของประเทศไทยได้รึเปล่า

รวมทั้งทาง Sun, IBM, HP, Novell ประเทศไทย จะมีพูดถึงเรื่องนี้กันบ้างมั๊ย?

OpenOffice.org 2.0 และ KOffice 1.4 จะใช้ OpenDocument เป็นรูปแบบหลัก/ปริยาย (native/default)

2004-11-11

Standard-compliant Web Design

มีเบราเซอร์ที่ทำตามมาตรฐานแล้ว ก็ต้องมีเว็บที่ทำตามมาตรฐานด้วย -- ไม่งั้นก็ไม่มีใครใช้

Standard-compliant web browser (like Firefox, Konqueror, Mozilla Suite, Netscape, Opera, and Safari) goes best with standard-compliant website.

Promoting standard-compliant browser alone is not enough. To gaining more momentum, and also general web audiences "peace of mind", we have to further promoting the web standards.

The more webs comply to the standards, the less trouble the user will faced with standard-compliant browsers -- the easier for users to switch.

For developers, here're few good books on designing website to comply with web standards: Eric Meyer on CSS, Designing with Web Standards, and HTML & XHTML: The Definitive Guide. Also please refers to the standard bodies like W3C, OASIS, etc.

WaSP: "The Web Standards Project is a grassroots coalition fighting for standards that ensure simple, affordable access to web technologies for all."

Btw, the standard encoding for Thai characters on the Internet (e.g. for webpages) is TIS-620. Read more about it, here. Or if your page is going to be multilingual, just use UTF-8.

charset ของตัวอักษรไทย คือ TIS-620 เขียนเว็บไทยทุกครั้ง อย่าลืม ตั้งให้ถูกต้อง

Use W3C Markup Validation Service to check if your web page is conform to web standards or not. ตรวจสอบว่าหน้าเว็บของคุณ เขียนขึ้นมาตรงตามมาตรฐานรึเปล่า

Update: แก้ทุก "complaint" เป็น "compliant", ขอบคุณพี่เทพครับ.

2004-10-18

W3C XForms in OO.o

OpenOffice.org 2.0 will use W3C XForms standard for its form functionalities.

Microsoft Office 2003 also have the similar form functionalities, in its InfoPath. InfoPath is built on top of XPath and XSLT (among other technologies), but it doesn't supports XForms, yet.

Mozilla will supports XForms as well.

2004-06-08

Of independent businesses

from GonzoMofo @ blogs sun com:

Java == platform independence
XML == application independence
JXTA == network independence

2004-06-05

open document format

ของเก่า ขอเล่าใหม่อีกรอบ (ในบล็อก)

1dok.org is an initiative by European Union to develop and standardize the document formats. It is based on the OASIS Open Office XML Format, which itself based on the OpenOffice.org XML File Format.

June 03, 2004, Pavel Janik, an OpenOffice.org developer, blogged:
EU eGovernment policy-makers encourage the uptake of open document formats

good reads:
.intro -- Thinking XML: The open office file format
.in-depth -- OpenOffice.org XML Essentials—Using OpenOffice.org’s XML Data Format