ย้ายบล็อกไปที่ bact.cc แล้วนะครับ

พ.ร.บ.คอมพิวเตอร์
หยุด ร่างพ.ร.บ.คอมพิวเตอร์
พื้นที่เก็บข้อมูลออนไลน์ ฟรี 2GB จาก Dropbox (sync กับ Windows, Linux, Mac, iPhone, Android ฯลฯ ได้)
Showing posts with label open data. Show all posts
Showing posts with label open data. Show all posts

2010-12-30

Thailand Open Data Catalog บัญชีข้อมูลเปิดของไทย

Open Data Thailand เป็นสมุดทะเบียนสำหรับชุดข้อมูลและเนื้อหาแบบเปิด เว็บไซต์นี้ทำงานด้วยซอฟต์แวร์ CKAN ซึ่งทำให้การค้นหา แบ่งปัน และใช้ข้อมูลซ้ำ ไปเป็นได้โดยง่าย โดยเฉพาะการทำงานเหล่านั้นด้วยวิธีการอัตโนมัติด้วยคอมพิวเตอร์

Open Data Thailand is an open registry of data and content packages. Harnessing the CKAN software, this site makes it easy to find, share and reuse content and data, especially in ways that are machine automatable.

ไอเดียของ Open Data Catalog คือ พยายามรวบรวมข้อมูลสาธารณะและข้อมูลภาครัฐ ที่เปิดเผยอยู่แล้วในอินเทอร์เน็ต แต่อาจจะกระจัดกระจายอยู่ หรืออยู่ในรูปแบบที่นำไปใช้ต่อไม่สะดวก มาจัดระบบระเบียบ ให้ค้นหาได้ง่าย เพื่อส่งเสริมการนำข้อมูลเหล่านี้ไปใช้ต่อ เพื่อประโยชน์ของสาธารณะ และหวังผลในเชิงรณรงค์ให้สังคมเห็นความสำคัญของการเปิดเผยข้อมูลสาธารณะในรูปแบบที่นำไปประมวลผลต่อได้โดยง่าย เพื่อกระตุ้นให้ภาครัฐเปิดเผยข้อมูลเหล่านี้ในรูปแบบที่เหมาะสมเองต่อไปในอนาคต ให้เป็นพันธกิจที่รัฐต้องมีต่อสาธารณะ

หลักการข้อมูลภาครัฐแบบเปิด (Open Government Data Principles)

ติดตามข่าว Open Data และ Data Journalism ได้จาก Guardian.co.uk Data Store

technorati tags: , ,

2010-12-28

สัมภาษณ์ @klaikong เรื่อง "ข้อมูลสาธารณะแบบเปิด" กับการพัฒนาเศรษฐกิจ-สังคม-การเมือง #opendata #opengov

Klaikong and Data visualization

ผมสัมภาษณ์ พี่แต๊ก ไกลก้อง ไวทยการ (@klaikong) เอาไว้เมื่อวันที่ 4 ธ.ค. 2553 ที่ผ่านมา ระหว่างเวิร์กช็อป “Open Data Hackathon” ที่ Opendream คุยกันเรื่องความเคลื่อนไหว “ข้อมูลภาครัฐแบบเปิด” หรือ “ข้อมูลสาธารณะแบบเปิด” (Open Government Data หรือ Open Public Data) กับความจำเป็นของสังคมไทยที่ภาครัฐจะต้องเปิดเผยข้อมูลให้สาธารณะเข้าถึงได้ เพื่อให้ทุกภาคส่วนสามารถร่วมพัฒนาประเทศไปพร้อม ๆ กัน ด้วยการตัดสินใจบนข้อมูลที่รอบด้าน ในสถานการณ์โลกที่เปลี่ยนแปลงไปอย่างรวดเร็ว วันนี้เพิ่งถอดเทปเสร็จ

มีคุยกันเรื่องรูปแบบข้อมูล รวมถึงความเป็นไปได้ในการจะออกกฎระเบียบที่เกี่ยวข้อง :

เรื่องมาตรฐานข้อมูลเนี่ย ประเทศเราทำไม่ได้จริงซะที คุยกันมานานแล้ว ว่าจะต้องมีระบบมาตรฐาน จะต้องมี standard อะไรต่าง ๆ XML ฯลฯ แต่ถึงทุกวันนี้ เท่าที่เห็น ร้อยละ 80 ข้อมูลก็ยังอยู่ในรูปแบบ PDF ซึ่งอันนี้มันสะท้อนเรื่องวิธีคิดว่า ข้อมูลนี้ก็ยังเป็นข้อมูลของหน่วยงานนั้นอยู่ ถ้าอยากได้ข้อมูลดิบ (raw data) เพื่อจะเอาไปใช้ก็ต้องขออนุญาตก่อน เพราะ PDF มันเอาไปใช้ทำอะไรต่อไม่ได้ ไฟล์ PDF มันสะท้อนความเป็นเจ้าเข้าเจ้าของของข้อมูลอยู่

ถ้าเราพูดถึงการแลกเปลี่ยนข้อมูล ตัว PDF ก็ไม่ได้ออกแบบมาเพื่อจุดประสงค์นี้ ... มันไปจบแค่การเปิดเอกสารเพื่อดู ... ข้อมูลที่อิเล็กทรอนิกส์ที่จะแลกเปลี่ยนกันแล้วมีประโยชน์เอาไปใช้ต่อได้ มันต้อง “อ่านด้วยเครื่องได้” (machine readable)

สำหรับภาครัฐแล้ว เรามองอินเทอร์เน็ตเป็นสื่อ ดูได้จากการเอากฎหมายสื่อมาใช้กับอินเทอร์เน็ต พอมองเป็นสื่อนั่นแปลว่าการเปิดข้อมูลคือการเผยแพร่ แค่เผยแพร่ก็จบ ... มันไม่ใช่ มันต้องไม่จบแค่ขั้นการเผยแพร่

คุยกันเรื่องมิติทางการปกครอง การพัฒนาท้องถิ่น และเศรษฐกิจ ของข้อมูลสาธารณะแบบเปิด :

ถ้าเราคิดว่า ข้อมูลภาครัฐทั้งหมดนั้นมันสร้างขึ้นมาด้วยเงินภาษี ด้วยเงินของสาธารณะ ข้อมูลภาครัฐเหล่านี้ก็ควรจะเป็นข้อมูลสาธารณะ ซึ่งเมื่อคิดได้ดังนี้แล้ว ข้อหนึ่งก็คือ มันต้องเปิดให้สามารถเข้าถึงได้ สองคือ ต้องเปิดในลักษณะที่ทุกคนสามารถเอาข้อมูลนั้นไปใช้ต่อได้ โดยไม่มีข้อจำกัด

การรวบรวมข้อมูลยังไงมันก็เป็นแบบล่างขึ้นบน แต่ปรากฎว่าเมื่อข้อมูลมันไหลขึ้นไปสู่ข้างบนแล้ว มันไม่เคยไหลกลับมาสู่ข้างล่างเลย ... เวลาเราพูดถึงการกระจายอำนาจ สิ่งสำคัญอย่างหนึ่งก็คือ ท้องถิ่นต้องมีชุดข้อมูลเพื่อให้ทำงานได้ ให้ตัดสินใจได้ แต่ที่ผ่านมาท้องถิ่นไม่เคยมีข้อมูลเลย แล้วก็เลยไม่มีทักษะในการใช้ข้อมูลไปด้วย ... ดังนั้น หนึ่งเลย ข้อมูลที่ท้องถิ่นส่งขึ้นไป ต้องถูกส่งกลับลงมาให้ท้องถิ่นใช้ด้วย

ทุกคนต้องใช้ข้อมูลในการตัดสินใจ โครงการนี้จะดีหรือไม่ดีกับบ้านฉันไหมตัวฉันไหม ก็จะทำให้ไม่ถูกฝ่ายหนึ่งฝ่ายใด ไม่ว่าจะฝ่ายสนับสนุนหรือคัดค้าน ใช้การโน้มน้าวได้ ทุกคนมีข้อมูล และตัดสินใจบนข้อมูลเหล่านี้

เวลาเราบอกว่าเปิดให้ “ทุกคน” เข้าถึงได้ มันรวมถึงภาคธุรกิจด้วย ซึ่งถ้าภาคธุรกิจนำข้อมูลเหล่านี้ไปใช้ แล้วมันสร้างความเจริญทางเศรษฐกิจให้กับประเทศได้ มันก็เหมาะสม ซึ่งตราบใดที่ข้อมูลเหล่านี้มันไม่กระทบต่อสิทธิส่วนบุคคลของประชาชนหรือเป็นภัยต่อความมั่นคง มันก็ควรจะต้องถูกเปิด

อ่านฉบับเต็มที่บล็อกโอเพ่นดรีม - ไกลก้อง ไวทยการ: "Open Data จะทำให้ประเทศเราวิ่งได้เร็วขึ้นอีกมาก"

ปี 2554 ที่จะถึงนี้ โอเพ่นดรีม, ChangeFusion, ธนาคารโลก สำนักงานกรุงเทพ และเพื่อน ๆ รวมถึงเครือข่ายพลเมืองเน็ต จะมีกิจกรรมเกี่ยวกับ Open Public Data ตลอดทั้งปี ตามความถนัดและจุดเน้นของแต่ละองค์กร ขอเชิญชวนทุกคนที่สนใจมาแจมกัน - ติดตามความเคลื่อนไหวได้ที่ OpenData.in.th

technorati tags: , , , ,

2010-12-15

วารสารศาสตร์ข้อมูล: เราควรจะขอบคุณวิกิลีกส์ #wikileaks #opendata

ความน่าเชื่อถือของวิชาชีพนักข่าวนักหนังสือพิมพ์ วิกิลีกส์ และ วารสารศาสตร์ข้อมูล

Roy Greenslade (twitter: @GreensladeR) เขียน ; อาทิตย์ สุริยะวงศ์กุล (@bact) แปลและเรียบเรียง

(CNN) 30 ก.ค. 2553 – การโพสต์เอกสารเกี่ยวกับสงครามในอัฟกานิสถาน 92,000 ฉบับ บนวิกิลีกส์ (WikiLeaks) เป็นตัวแทนของการฉลองชัยของสิ่งที่ผมเรียกว่า “วารสารศาสตร์ข้อมูล” (data journalism)

แน่นอนว่ามันต้องมีแหล่งข่าวที่เป็นบุคคล ใครสักคนในที่ไหนสักแห่ง ส่งต่อข้อมูลเหล่านี้ไปยังเว็บไซต์วิกิลีกส์ แต่ไม่ว่าผู้แจ้งความไม่ชอบมาพากลคนนี้จะเป็นใคร มันก็ไม่ได้สำคัญเท่ากับว่า เนื้อหาของเอกสารเหล่านี้มันบอกอะไรกับเรา

ข้อมูลดิบดังกล่าว เป็นขุมทรัพย์ขนาดใหญ่สำหรับนักหนังสือพิมพ์ในสามสำนักข่าว – นิวยอร์กไทมส์ (New York Times สหรัฐอเมริกา), เดอะการ์เดียน (The Guardian สหราชอาณาจักร), และ แดร์สปีเกล (Der Spiegel เยอรมนี) – ที่จะขุดค้นหาข่าวจากมัน อย่างไรก็ตาม ไม่ได้มีเฉพาะนักข่าวเหล่านั้นเท่านั้น บันทึกประจำวันจากสงครามอัฟกานิสถานนั้นอยู่บนอินเทอร์เน็ต ที่ใครก็เข้าไปขุดค้นสมบัติหาข้อมูลได้

เรื่องเหล่านี้จริง ๆ แล้วไม่ใช่เรื่องใหม่อะไร นักหนังสือพิมพ์ทำเรื่องเหล่านี้มานานแล้ว พวกเขาอ่านกองเอกสารทีละหน้าทีละหน้า เพื่อมองหาสิ่งผิดปกติ ข้อเท็จจริงเพียงหนึ่งหรือสองชิ้น ซึ่งจะนำไปสู่สกู๊ปสำคัญ

แต่ก็นั่นล่ะ เราต้องยอมรับว่า นักหนังสือพิมพ์ที่ทำงานดังที่กล่าวมา แทบจะไม่หลงเหลืออยู่แล้ว มันทั้งใช้เวลาและแรงงาน แล้วก็ไม่มีสีสันตื่นตาตื่นใจ มันไม่มีสเน่ห์ดึงดูด ด้วยแรงกดดันในองค์กรข่าวสมัยใหม่ ที่จำเป็นต้องทำงานให้มีประสิทธิภาพคุ้มราคา มันเป็นเรื่องยากที่บรรณาธิการข่าวจะอนุญาตให้นักข่าวใช้เวลามาก ๆ ไปกับกองเอกสารท่วมหัว

ความสำเร็จของ “วารสารศาสตร์ข้อมูล” หรือการทำข่าวจากข้อมูลดิบนั้นมักจะถูกลืม ตัวอย่างหนึ่งโดดเด่นก็คือ กรณีข่าวสืบสวนโดยหนังสือพิมพ์ซันเดย์ไทมส์ (Sunday Times) ที่ตามติดกรณียาระงับประสาทของบริษัทยาเยอรมันที่ถูกถอนออกจากตลาดในปี 1961 หลังจากพบว่ามีผลกระทบรุนแรงต่อทารก

ระหว่างการสืบสวนดังกล่าว ซันเดย์ไทมส์จ่ายเงินเพื่อซื้อเอกสารภายในจำนวนมากของบริษัทดังกล่าว และต้องแปลมันทั้งหมดเป็นภาษาอังกฤษ ซึ่ง ฟิลลิป ไนท์ลีย์ (Phillip Knightley) หนึ่งในทีมข่าวกล่าวว่าพวกเขาใช้เวลาเกือบหนึ่งปี ทำงานอย่างหนัก เพื่อทำความเข้าใจเอกสารเหล่านั้น

ถึงในปี 1968 จะยังเป็นสมัยที่ซันเดย์ไทมส์มีกำลังคนพร้อมเพรียง และยินดีที่จะจัดสรรทรัพยากรให้กับทีมนักข่าวสืบสวน ไนท์ลีย์ก็ยังบอกกับเราว่า คนก็ยังสงสัยอยู่ดี ว่ามันจะคุ้มค่าหรือ ที่จะทำข่าวที่ต้องใช้ทั้งเงินและเวลายาวนานขนาดนี้

แม้ในที่สุดข่าวสืบสวนชิ้นนี้จะประสบความสำเร็จ และนำไปสู่การจ่ายเงินชดเชยที่ดีขึ้นแก่ผู้เสียหาย แต่ดูเหมือนว่า ความสงสัยต่อความคุ้มค่าในการลงทุนทำ “วารสารศาสตร์ข้อมูล” ก็ยังคงฝังแน่นอยู่ในองค์กรข่าวส่วนใหญ่ของสหราชอาณาจักร โดยเฉพาะสำนักพิมพ์ที่กำลังจะตัดงบประมาณของกองบรรณาธิการ

แน่นอนว่า ข่าวสืบสวนคดีวอเตอร์เกต (Watergate) ในต้นทศวรรษ 1970 โดย Bob Woodward และ Carl Bernstein ที่ได้รับการยกย่องว่าเป็นสกู๊ปข่าวที่ยิ่งใหญ่ที่สุดตลอดกาล นั้นมีความสำคัญ รายงานชิ้นดังกล่าวอาศัยแหล่งข่าวที่ปิดเป็นความลับ ที่รู้จักกันในชื่อ “Deep Throat” และตั้งแต่นั้นมา นักหนังสือพิมพ์ก็ตกเป็นทาสของแหล่งข่าวที่เปิดเผยไม่ได้เหล่านี้เสียเอง แต่ข่าวแบบนี้แหละที่มีสเน่ห์ดึงดูด

แหล่งข่าวที่เปิดเผยไม่ได้ ได้กลายเป็นวิถีชีวิตของวารสารศาสตร์สมัยใหม่ ผมเคยบอกกับนักศึกษาวารสารศาสตร์ของผมอย่างนั้นเสมอ ๆ แต่ตอนนี้ผมยอมรับแล้วว่า ผมให้ความสำคัญกับมันมากเกินไป จนให้ความสำคัญน้อยเกินไปกับการค้นหา อ่าน และวิเคราะห์ข้อมูลดิบ

ถ้าหนังสือพิมพ์นั้น เป็นร่างแรกของประวัติศาสตร์ อย่างที่เรานักหนังสือพิมพ์มักอ้างกัน เราก็ควรจะต้องทำงานให้ใกล้เคียงกับนักประวัติศาสตร์เสียหน่อย บรรดานักประวัติศาสตร์พยายามมองหาแหล่งข้อมูลชั้นต้น เพื่อที่จะสร้างความเข้าใจที่ดีขึ้นกับเหตุการณ์ในอดีต

สิ่งที่สำคัญมาก ๆ ของข้อมูลต่างๆ ในวิกิลีกส์นั้นคือ มันเป็นข้อมูลที่ทันสมัย มันทำให้นักหนังสือพิมพ์และสาธารณะเข้าใจชัดเจนขึ้น ว่าเกิดอะไรขึ้นกันแน่ในอัฟกานิสถาน ในแง่นี้ ข้อมูลเหล่านี้ที่ทุกคนเข้าไปอ่านได้ ช่วยมอบความเข้าใจที่มีค่ามหาศาลให้กับเรา

อย่างไรก็ตาม การโพสต์เอกสารขึ้นอินเทอร์เน็ตโดยตัวมันเองไม่ใช่การทำข่าว มันเป็นเพียงจุดเริ่มต้นของกระบวนการข่าว มันยังต้องการการวิเคราะห์ วางบริบท และในบางกรณี การเซ็นเซอร์ที่จำเป็นเพื่อที่จะปกป้องปัจเจกบุคคลที่ถูกระบุในเอกสารดังกล่าว

ผมทราบว่า นักข่าวอาชีพไม่ได้เป็นคนเพียงกลุ่มเดียวที่สามารถทำงานนี้ได้ แต่พวกเขาส่วนใหญ่ มีทักษะที่จำเป็นต่าง ๆ ดังกล่าว และมีความรู้ที่จะทำให้พวกเขาทำงานดังกล่าวได้ดี การรายงานโดย เดอะการ์เดียน และ นิวยอร์กไทมส์ แสดงให้เห็นอย่างชัดเจน

มันอาจจะไม่ได้นำไปสู่การเปลี่ยนแปลงอะไรโดยทันที ไม่มีประธานาธิบดีต้องออกจากตำแหน่ง เหมือนกรณีวอเตอร์เกต แต่สิ่งที่ถูกทำให้ปรากฏจากเอกสาร คือการยืนยันสิ่งที่สื่อในสหราชอาณาจักรและสหรัฐอเมริกาสงสัยมาโดยตลอด เกี่ยวกับสถานการณ์ในอัฟกานิสถาน ว่ามันเลวร้ายและมีแต่จะแย่ลง ๆ นับตั้งแต่ปี 2004 มันตบหน้ารายงานประเมินอย่างเป็นทางการที่แสนสวยงาม

ข้อมูลดิบทั้งหมดดังกล่าวมานั้น เชื่อถือได้มากกว่า เพราะมันเป็นรายงานโดยทหารในสนามรบจริง ๆ ว่าพวกเขาพบเห็นและประสบอะไรบ้าง มันไม่มีการปั่นข่าว ตัวรายงานนั้นอาจไม่ได้เป็นวัตถุวิสัย – ซึ่งก็ไม่เคยมีอะไรที่เป็นเช่นนั้น – แต่รายงานเหล่านี้ก็ไม่ได้ถูกเขียนขึ้นเพื่อจะมีอิทธิพลต่อการตัดสินใจทางการเมือง

ใช่ เราอาจพูดได้ว่า การที่วิกิลีกส์โพสต์ข้อมูลอ่อนไหวดังกล่าวในพื้นที่สาธารณะ ในตัวมันเองนั้นก็ไม่ได้เป็นวัตถุวิสัยอยู่แล้ว แต่ผมขอสนับสนุนสิ่งที่ จูเลียน อัสซานจ์ (Julian Assange) หัวหน้าบรรณาธิการของวิกิลีกส์ เรียกร้องต่อองค์กรข่าวต่าง ๆ ให้เปิดเผยข้อมูลดิบออกสู่สาธารณะให้มากขึ้น

เขาเชื่อว่าการกระทำดังกล่าว จะทำให้กิจกรรมของงานข่าวโปร่งใสมากขึ้น ในการสัมภาษณ์เมื่อไม่นานนี้ เขายืนกรานว่า “วารสารศาสตร์ควรจะเป็นเหมือนวิทยาศาสตร์มากขึ้น” และเสริมว่า: “มากที่สุดเท่าที่จะเป็นไปได้ ข้อเท็จจริงต่าง ๆ จะต้องถูกตรวจสอบยืนยันได้ ถ้านักหนังสือพิมพ์ต้องการที่จะให้วิชาชีพของพวกเขามีความน่าเชื่อถือไว้วางใจได้มากขึ้น พวกเขาจำเป็นต้องเดินไปในทิศทางนั้น เคารพคนอ่านให้มากขึ้น”

โดยธรรมชาติของตัวมันเอง การทำข่าวจากแหล่งข่าวบุคคล (source journalism) ย่อมถูกปิดบังไม่ให้สาธารณะได้เห็น การทำข่าวจากข้อมูลดิบ (data journalism) นั้นเปิดเผยมากกว่า โดยเฉพาะเมื่อข้อมูลดิบนั้นถูกโพสต์ขึ้นอินเทอร์เน็ต เพราะในกรณีที่มีการวิเคราห์ข้อมูลชุดเดียวกันในแนวทางที่ต่างกัน ข้อมูลดิบเหล่านั้นมันอนุญาตให้สาธารณะตัดสินได้ว่าการวิเคราะห์อันไหนที่น่าเชื่อถือกว่า

เรานักหนังสือพิมพ์ ควรจะต้องดีใจที่มีเว็บไซต์อย่างวิกิลีกส์อยู่ นั่นเพราะไม่ว่าจะอย่างไรก็ตาม หน้าที่ที่สำคัญที่สุดของเราก็คือการเปิดเผยข้อมูลที่เกี่ยวข้องกับประโยชน์สาธารณะ ที่คนที่มีความเชื่อเป็นอย่างอื่นต้องการจะเก็บมันเป็นความลับ

เว็บไซต์ดังกล่าวสมควรจะได้รับการสรรเสริญชื่นชมจากพวกเรา และมันจำเป็นจะต้องได้รับการปกป้องจากการคุกคามของพลังฝ่ายขวา ที่หาทางจะหลีกเลี่ยงจากการถูกเปิดโปง


Roy Greenslade เป็นศาสตราจารย์ด้านวารสารศาสตร์ ที่มหาวิทยาลัยซิตี้ยูนิเวอร์ซิตี้ ลอนดอน เขาเขียนบล็อกรายวันเกี่ยวกับสื่อให้กับเว็บไซต์ The Guardian และเขียนคอลัมน์รายสัปดาห์ในหนังสือพิมพ์ London Evening Standard เขาเป็นนักวิจารณ์สื่อมา 18 ปี โดยก่อนหน้านั้นเขาเป็นบรรณาธิการของหนังสือพิมพ์ Daily Mirror ของสหราชอาณาจักร บรรณาธิการบริหารของ Sunday Times และผู้ช่วยบรรณาธิการของ The Sun

เรียบเรียงจาก “We should be thankful for WikiLeaks” โดย Roy Greenslade ตีพิมพ์ในเว็บไซต์ CNN.com 30 ก.ค. 2553 (ลิงก์ต่าง ๆ ที่แทรกในเอกสารนี้โดยผู้แปลเอง)

* ดาวน์โหลดบทความนี้ ในรูปแบบ PDF (Scribd)

บทความที่เกี่ยวข้อง: มานะ ตรีรยาภิวัฒน์ : โลกอนาคตที่ไม่มีการผูกขาดความจริง

เข้าถึงเนื้อหาของ WikiLeaks จากเมืองไทย ได้ที่เว็บไซต์ ThaiLeaks.info
โดยทุกคนสามารถดาวน์โหลดเนื้อหาทั้งหมดของวิกิลีกส์ได้ทาง torrent

technorati tags: , , , , , ,