ย้ายบล็อกไปที่ bact.cc แล้วนะครับ

พ.ร.บ.คอมพิวเตอร์
หยุด ร่างพ.ร.บ.คอมพิวเตอร์
พื้นที่เก็บข้อมูลออนไลน์ ฟรี 2GB จาก Dropbox (sync กับ Windows, Linux, Mac, iPhone, Android ฯลฯ ได้)
Showing posts with label SEO. Show all posts
Showing posts with label SEO. Show all posts

2011-01-19

ตลก ภาพยนตร์ คลังปัญญาไทย "Wisdom Society" [update]

สุดเขตสเลดเป็ด เป็นภาพยนตร์ที่ตลกดีนะครับ หัวใจหล่อมาก

"ภาพยนตร์" @ คลังปัญญาไทย

จากบทความ ภาพยนตร์ เว็บไซต์คลังปัญญาไทย

ภาพยนตร์ [ลิงก์ไป http://www.movie.kapook.com/] (Cinematographic Works) หมายถึง สื่อเคลื่อนไหวที่สะท้อนเหตุการณ์ทางสังคม การเมือง และ วัฒนธรรมที่สร้างขึ้นเป็นระบบมาตรฐานโดยฝีมือคนไทย ได้แก่ ภาพยนตร์ข่าว ภาพยนตร์สารคดี ภาพยนตร์เรื่อง เป็นต้น ผู้ที่มีบทบาทสำคัญต่อวงการภาพยนตร์ที่อยู่ในข่ายการพิจารณาผลงาน ได้แก่ ผู้สร้าง ผู้กำกับ นักพากย์ นักแสดง ผู้ประพันธ์เพลงประกอบ

ภาพยนตร์ คือ ไม่ว่าจะเป็นชนิดฟิล์มเนกาทิฟ (negative) หรือฟิล์มโพซิทิฟ (positive) ซึ่งได้ถูกถ่าย อัด หรือกระทำด้วยวิธีใด ๆ ให้ปรากฏรูปหรือเสียงหรือทั้งรูปและเสียง เป็นเรื่องหรือเหตุการณ์ หรือข้อความอันจักถ่ายทอดรูปหรือเสียง หรือทั้งรูปและเสียงได้ด้วยเครื่องฉายภาพยนตร์หรือเครื่องอย่างอื่นทำนองเดียวกัน และหมายความตลอดถึงฟิลม์ซึ่งได้ถูกถ่าย อัด หรือทำด้วยวิธีใด ๆ ให้ปรากฏสี เพื่ออัดลงในฟิลม์ชนิดดังกล่าว เป็นสาขาที่สร้างสรรค์ผลงานทางศิลปะในรูปของภาพเคลื่อนไหว และเป็นส่วนหนึ่งของอุตสาหกรรมบันเทิงภาพยนตร์ คือ ภาพนิ่ง หลาย ๆ ภาพเรียงติดต่อกันอย่างต่อเนื่อง และเมื่อนำเอาภาพนิ่งเหล่านั้นมาฉายดูทีละภาพด้วยอัตราความเร็วในการฉายต่อภาพเท่า ๆ กัน ภาพนิ่งเหล่านั้นจะกลายเป็นภาพเคลื่อนไหวที่ต่อเนื่องกันเป็นธรรมชาติ

  • ยังไม่ต้องดูเนื้อหา เอาแค่การเขียนก่อน มันคืองานตัดแปะน่ะ ย่อหน้าแรกจากเว็บไซต์สำนักงานคณะกรรมการวัฒนธรรมแห่งชาติ ย่อหน้าสองจากวิกิพีเดียไทย แล้วเพิ่มคำว่า ภาพยนตร​์ หมายถึง/คือ เข้าไปต้นประโยค ให้มันดูดีขึ้น(?)
  • ที่เนื้อหา ย่อหน้าแรกที่ตัดมาแปะ จริง ๆ แล้วไม่ได้เป็นความหมายหรือเรื่องเกี่ยวกับภาพยนตร์ แต่เป็นเกณฑ์การคัดเลือกศิลปินแห่งชาติ ... คือมันผิดฝาผิดตัว
  • เข้าใจว่า KPI 80,000 เรื่อง (ฉลอง 80 พรรษา™ [cliché]) นี่คงนับจำนวนเอาอย่างเดียว เนื้อหาจะยังไงก็ช่างมันเถอะ เพราะนี่มันงานการกุศล (อาสาสมัคร ทำฟรี?)
  • เด็กและเยาวชน (ตามภาษาใน หลักการและเหตุผล ของโครงการ) จะได้อ่านอะไรก็ช่างเขาเถอะ ถูกบ้าง ผิดบ้าง มีสาระบ้าง ไม่มีบ้าง ก็ดีกว่าไม่มีอะไรให้อ่าน (เช่น ให้เด็กเข้าใจว่า ภาพยนตร์คือ สื่อเคลื่อนไหว...ที่สร้างขึ้นเป็นระบบมาตรฐานโดยฝีมือคนไทย เป็นต้น)
  • ที่สัญญาอนุญาต เนื้อหาย่อหน้าสอง นำมาจากวิกิพีเดียไทย ซึ่งอนุญาตให้เผยแพร่ภายใต้สัญญาอนุญาตครีเอทีฟคอมมอนส์ แบบแสดงที่มา-อนุญาตแบบเดียวกัน ซึ่งเงื่อนไขหนึ่งคือ ต้องแสดงสัญญาอนุญาตให้เห็นชัดเจนด้วย แต่หาไม่พบในเว็บไซต์คลังปัญญาไทย
  • มันเป็นวิกิ ใคร ๆ ก็ใส่เนื้อหาได้ ตาม log แจ้งว่า ผู้ใส่ 2 ย่อหน้านั้น คือ Sawitree.bunditcenter (ชื่อพ้องกับ บัณฑิตเซ็นเตอร์ หรือ kapook.com หนึ่งใน พันธมิตรเนื้อหา และเป็นโฮสต์ให้กับเว็บไซต์คลังปัญญาไทย)
    Kapook.com links inserted to PanyaThai wiki
  • น่าสนใจ ที่คำว่า ภาพยนตร์ คำแรกเลย ลิงก์ไปหาหน้าเว็บภาพยนตร์ของกระปุก.คอม http://www.movie.kapook.com/ เราสามารถสงสัยได้ว่าหน้าเว็บดังกล่าว มีความเกี่ยวข้องหรือคุณค่าในทางเนื้อหามากน้อยเพียงใด ที่จะถูกบรรจุไว้ในบทความนี้ (เพื่อการเปรียบเทียบ บทความ ภาพยนตร์ ในวิกิพีเดียไทย มีลิงก์ไปหา 2 เว็บไซต์ คือศูนย์รวมข้อมูลหนังไทยของมูลนิธิหนังไทย กับเว็บไซต์ IMDb) อย่างไรก็ตามการมีลิงก์จากคลังปัญญาไทยไปยัง kapook.com น่าจะทำให้มีทราฟฟิกวิ่งไปหา รวมถึงมีผลในทาง ranking อันดับเว็บด้วย (SEO)
  • มันเป็นวิกิ ใคร ๆ ก็ใส่เนื้อหาได้ ตาม log แจ้งว่า ผู้ใส่ลิงก์นั้น คือ Sweetmuffin
    Kapook.com links inserted to PanyaThai wiki
  • ถ้าไปดูปูมแก้ไขบทความของ Sweetmuffin ในคลังปัญญาไทย จะเห็นว่า เต็มไปด้วยการแทรกลิงก์ไปหาหน้าเว็บใน kapook.com เช่น ภูกระดึง, พิพิธภัณฑ์, สมุนไพร, เกย์, ...
  • คลังปัญญาไทย จัดทำโดย สมาคมผู้ดูแลเว็บไทย ร่วมกับ สำนักงานกองทุนสนับสนุนการสร้างเสริมสุขภาพ โดยมี กระทรวงศึกษาธิการ Pantip.com Kapook.com เป็นพันธมิตรสนับสนุนเนื้อหา
  • หลังจากที่โครงการนี้ เจ๊ง ดันไม่เกิด ผ่านไป 3 ปี รัฐบาลไทยมีโครงการ คลังความรู้ อันใหม่อีกแล้ว จ้างบริษัท AsiaOnline ใช้คอมพิวเตอร์แปลบทความในวิกิพีเดียอังกฤษ ให้เป็นไทย คาดว่าจะเป็นโครงการถลุงเงินเล่นเช่นกัน (contribution ในแง่เทคโนโลยี machine translation นั้น อาจจะมี เป็นตัวทดสอบ เป็น dataset สำหรับการวิจัยต่อไปในอนาคตก็ว่าไป แต่ในแง่การเป็นสารานุกรม-ที่แก้ไขปรับปรุงได้-นั้นไม่น่าจะรอด ไม่มีชุมชนเข้าไปร่วมด้วย และสำหรับกรณีเทคโนโลยีการแปลภาษา ใครจะเป็นผู้ได้ร่วมถือสิทธิ์ในเทคโนโลยีนั้น? ... กรณีนี้รัฐไทยเอาเงินไปลงด้วย)
  • อย่างไรก็ดี โครงการคลังปัญญาไทย ก็เป็นโครงการที่มีประโยชน์มาก โดยเฉพาะหน้า หลักการแลเหตุผล ที่จะเป็นตัวอย่างให้เราศึกษาได้ว่า ความเชื่อหรือมายาคติเกี่ยวกับอินเทอร์เน็ตชนิดไหน ที่เราสามารถนำมาใช้เขียนเพื่อเป็นข้อเสนอโครงการ เพื่อขอทุนฯลฯ ได้บ้าง สมควรคั่นหน้าเอาไว้อย่างยิ่ง (ความรู้ส่วนหนึ่งที่สกัดได้จากหน้านี้: ภัยทางอินเทอร์เน็ต เว็บไซต์ไม่เหมาะสม ลามกอนาจาร ความรุนแรง การนัดกันไปฆ่าตัวตายผ่านเว็บไซต์ การใช้อินเทอร์เน็ตอย่างสร้างสรรค์ ถวายเป็นพระราชกุศล พระบรมราโชวาท นวัตกรรม เว็บ 2.0 ความรู้อย่างพอเพียง จิตสาธารณะ ... ลองเอาไปใส่ใน proposal ดูนะครับ)
  • เรื่องตรวจสอบก็อย่าไปพูดอะไรมาก คนในวงการเดียวกัน ก็ต้องช่วย ๆ กัน แล้วทุกอย่างที่ทำก็เพื่อชาติเพื่อแผ่นดินด้วย จะตรวจสอบมาก ๆ คนไทยหรือเปล่า ? มือไม่พายเอาเท้าราน้ำ คิดลบ ไม่คิดบวก

เพิ่ม 20 ม.ค. 2554 มีผู้แจ้งมา (จาก Facebook) ให้ไปดูที่ท้ายหน้า http://bhumibol.panyathai.or.th/ จะพบเนื้อหาส่วน พระอัจฉริยภาพ ที่ใส่มาตั้งแต่ปี 2550 มีเรื่องพระเจ้าเอกทัศน์ด้วยแฮะ (= เยาวชนไทยจากโรงเรียนทั่วประเทศ ก็เรียนรู้แบบนี้มาได้ 3 ปีแล้ว)

bhumibol.panyathai.or.th

เรื่องนี้โทษใครเป็นรายบุคคลไม่ได้เลยจริง ๆ เพราะลักษณะของวิกิ มันเปิดให้ใคร ๆ ก็เข้ามาแก้ไขได้ (แต่หน้านี้ก็เป็นลิงก์ที่อยู่กลางหน้าแรกเลยนะ หรา) ดังนั้นก็เป็นไปได้ ที่จะถูกป่วน หรือมีเนื้อหาที่ไม่มีคุณภาพถูกใส่เข้ามา อยากได้ของดี ๆ ก็ต้องช่วยกันทำ ว่างั้น

อย่างไรก็ตาม มันก็สะท้อนความล้มเหลวของโครงการเช่นกัน ในการจะสร้างชุมชนขึ้นมา เพื่อพัฒนาเนื้อหาให้มีคุณภาพ

โครงการอย่างวิกิพีเดียไทย ก็ประสบปัญหาเช่นนี้ไม่ต่างกัน มีการตัดแปะเนื้อหาที่ไม่ได้คุณภาพมาใส่อยู่เสมอ ๆ ที่ต่างก็คือ มันมีชุมชนที่จะมาช่วยกันแก้ ช่วยกันเกลา ช่วยกันตรวจสอบ (แล้วมันก็รันของมันมาได้ 8 ปี บนพื้นฐานของงานอาสาสมัครล้วน ๆ มีบทความแล้ว 65,000 บทความ)

พูดง่าย ๆ ว่า ถึงทีมคลังปัญญาไทย จะบอกว่าประสบความสำเร็จในแง่ จำนวนบทความ และจำนวนคนเข้าดู (ซึ่งก็ต้องโน๊ตไว้ด้วยว่า เป็นเชิงปริมาณ ไม่ได้พูดถึงเชิงคุณภาพ) แต่ก็ล้มเหลวในแง่ผลักดันให้เกิดชุมชนเพื่อเนื้อหาคุณภาพ ตามที่บรรยายไว้ในหน้าอธิบายโครงการว่า: สามารถตรวจสอบความถูกต้องของข้อมูลเองได้ เพื่อให้แหล่งข้อมูลนี้ สามารถขยายตัวได้เร็ว อีกทั้งยังมีเนื้อหาที่กว้างขวาง หลากหลายและมีคุณภาพ โดยการเปิดโอกาสให้เกิดความร่วมมือจากผู้เชี่ยวชาญในความรู้สาขาต่างๆในเชิงสร้างสรรค์ — ลองดูจากปูมการแก้ไข (ย้อนหลัง 2500 ครั้ง ซึ่งก็ย้อนไปถึงม.ค. 2551 โน่น) มีที่ active อยู่น้อยคนมาก ที่เข้ามาแก้บ่อย ๆ และก็ดูจะหายไปหมดแล้ว

สภาพคลังปัญญาไทยตอนนี้ก็เลยไม่ต่างอะไรกับถังใส่บทความตัดแปะ ที่พอพ้นช่วงเปิดตัว ลงสื่ออะไรกันเสร็จ ก็ทำต่อสักพัก แล้วก็ปล่อยมันไว้อย่างนั้นแหละ (แต่ก็ยังดีกว่าเว็บไซต์หลายอันที่ทำแล้วทิ้งจริง ๆ นะ พวกไม่ต่ออายุโดเมนอะไรแบบนี้) ตลกที่ร้ายกว่าคือ พอเมษายน 2553 มันก็ถูก monetize ใช้ประโยชน์ ด้วยการใส่ลิงก์ในบทความต่าง ๆ ให้ชี้ไปหาเว็บท่าที่โฮสต์เว็บไซต์คลังปัญญาไทยอยู่ (kapook.com) (ซึ่งเรื่องนี้ไม่พบอยู่ใน หลักการและเหตุผล แต่อย่างใด)

มีประโยชน์มั๊ย มี ทุกอย่างมีที่ทางของตัวมันเอง อินเทอร์เน็ตเป็นพื้นที่อิสระ เราจะใส่อะไรเข้าไปก็ได้ ประเด็นมันอยู่ที่ว่า คุณจะเคลมอะไร แค่นั้นแหละ เคลมอะไร ไปเพื่ออะไร แล้วสุดท้ายจริง ๆ แล้วคุณทำอะไร

เพิ่ม 20 ม.ค. 2554 14:37 พบว่า เซิร์ฟเวอร์ของคลังปัญญาไทย วันที่ไม่ได้ตั้งให้ตรงกับเวลาจริงนะครับ ที่ตรวจสอบ ณ ปัจจุบัน (จากหน้า ปรับปรุงล่าสุด) เวลาของเซิร์ฟเวอร์วันนี้ (20 ม.ค. 2554) ระบุว่าเป็นวันที่ 25 เมษายน 2547 ... หนักข้อเลยครับ สงสัยจะไม่ได้ดูแลจริง ๆ - -"

ทางบ้านส่งมาทาง Google Buzz:

strong-fuckyou

oh-kapook

technorati tags: , , , ,

2009-06-07

ช่วงช่วง หลินฮุ่ย เคอิโงะ เสื้อแดง เอ็นจีวี นักศึกษา แพนด้า SEO OCR

OCRopus โอเพ่นซอร์สทูลคิตสำหรับงาน OCR รุ่น 0.4 ออกแล้วครับ น่าจะคอมไพล์อะไรต่าง ๆ ได้ง่ายขึ้นบนแพลตฟอร์มที่ไม่ใช่ GNU/Linux ครับ

ดาวน์โหลดได้ทันทีที่เว็บไซต์ OCRopus (โอเพ่นซอร์ส Apache License 2.0)

ที่หน้าเว็บ Course: OCRopus สอนการใช้งานและปรับแต่ง OCRopus มีวิธีเขียน Lua และ C++ เพื่อเรียกใช้ OCRopus ด้วย

แม้ OCRopus จะรองรับการเพิ่มเติมภาษาใหม่ ๆ เข้าไปได้ แต่ก็ต้องลงแรงหน่อย ตอนนี้ยังใช้ไทยไม่ได้โดยทันที

สำหรับคนที่มองหาตัวที่อ่านภาษาไทยได้ และไม่แพงนัก ลองหา ArnThai (อ่านไทย) มาทดสอบดู มีทั้งบนวินโดวส์และลีนุกซ์ (รุ่นบนลีนุกซ์เก่ากว่าหน่อย) ติดต่อเนคเทคได้ ถ้าสนใจนำไปใช้ ที่เคยถาม สามารถตกลงสัญญาอนุญาตได้หลายแบบ

สำหรับตัวที่มีประสิทธิภาพดีกว่านั้นและมีความสามารถเพิ่มเติมอื่น ๆ ที่อ่านไทยได้ คือ ABBYY FindReader อ่าน PDF ได้ ใช้ได้หลายภาษา (ทายอัตโนมัติ) คง document logical structure, formatting, style, ฟอนต์, และตาราง อู้ฟู่หรูหรามาก (ขอบคุณ @sarasinb และ @thai101 สำหรับข้อมูล)

รีวิวซอฟต์แวร์ OCR ต่าง ๆ บนลีนุกซ์ : โดย groundstate, โดย Peter Selinger. บทความ optical cahracter recogntion ที่วิกิพีเดียภาษาอังกฤษ มีลิงก์ไปหาซอฟต์แวร์ต่าง ๆ ด้านล่างสุด.

technorati tags: , , , ,