ย้ายบล็อกไปที่ bact.cc แล้วนะครับ

พ.ร.บ.คอมพิวเตอร์
หยุด ร่างพ.ร.บ.คอมพิวเตอร์
พื้นที่เก็บข้อมูลออนไลน์ ฟรี 2GB จาก Dropbox (sync กับ Windows, Linux, Mac, iPhone, Android ฯลฯ ได้)

2009-06-02

on various things, digital this and information that

[ปรับปรุง 12:46: เพิ่ม Greenstone และลิงก์ libraryhub.in.th ขอบคุณ @markpeak]

[ปรับปรุง 2009.07.17: แก้ไขข้อมูลเกี่ยวกับระบบบรรณารักษ์ที่คลาดเคลื่อน ขอบคุณ อ.บุญเลิศ]

สี่ห้าวันที่ผ่านมา บุกตะลุยเก็บข้อมูลเกี่ยวกับห้องสมุดและระบบสารสนเทศดิจิทัลให้ :=3

ไม่ได้เน้นไปที่พวก Library 2.0 มากนัก อยากรู้เรื่องระบบข้างใต้เพิ่มเติมมากกว่า การประยุกต์ข้างบนคิดว่าพอเข้าใจไอเดียบ้างแล้วส่วนหนึ่ง (ลองดู นำเสนอโดย @iteau และ @projectlib เกี่ยวกับเรื่องนี้และ TCDC Resource Center - @iteau เขียนควันหลงนิดนึง) เดี๋ยวลองเอามาประกอบกัน

เว็บ DegreeTutor แนะนำโอเพ่นซอร์ส ILS (integrated library system) 3 ตัว ได้แก่ Koha, Evergreen ILS, และ VuFind ทุกตัวทำงานกับ OPAC (open public access catalog) ได้หมด :

  • Koha เป็น ILS ที่ติดตั้งง่าย มีหลายที่ในเมืองไทยใช้แล้ว เช่น ห้องสมุดดิจิทัลของ STKS (โชว์ในงาน LibCamp), ห้องสมุดวุฒิสภา, ม.อุบลก็กำลังเตรียมใช้, บล็อก STKS สวทช. เขียนถึงเยอะเหมือนกัน
  • Evergreen ILS เขาว่าเป็นระบบ fault-tolerance เลยทีเดียว มั่นใจได้
  • VuFind เป็น Library Resource Portal ที่มาครอบ ILS เพื่อขยายความสามารถของ OPAC ให้เป็น OPAC 2.0 [อ.บุญเลิศ] ยังอยู่ในช่วงพัฒนา (RC) อาจจะยังไม่เรียบร้อยนัก แต่มีความสามารถเยอะ ใช้ระบบค้นหาของ Apache Solr หายห่วง โครงการห้องสมุดดิจิทัลคิดดี กำลังเล็งว่าอาจจะเอามาเป็นหน้ากากครอบฐานข้อมูลย่อย ๆ ต่าง เพื่อให้ผู้ใช้ใช้งานง่ายขึ้น

เสริมจากความเห็นโดย อ.บุญเลิศ คือ ทั้ง Koha และ Evergreen นั้น เป็น ILS ที่มีความสามารถเทียบเท่ากับ ILS ที่ขายกัน ระดับ VTLS, InnoPAC/Millenium ILS, และ Horizon/SirsiDynix

ส่วน ILS รุ่นเล็กลงไป คือ OpenBiblio และ PHPMyLibrary

งานหลักอันนึงของห้องสมุดก็คือ การทำ catalog หนังสือ หรือป้อนข้อมูลหนังสือเข้าไปในระบบ เพื่อให้สืบค้นและยืมคืนได้ ซึ่งก็ใช้แรงงานไม่น้อย ถ้ามีเครื่องทุ่นแรงก็คงจะดี นึกไอเดียประมาณ CDDB หรือ freeDB.org ที่เราเสียบซีดีเพลงเข้าเครื่อง แล้วโปรแกรมเล่นเพลงก็จะไปค้นฐานข้อมูลที่คนอื่นเขาใส่ข้อมูลชื่อเพลงชื่อนักร้องไว้เราแล้ว เราไม่ต้องใส่เองหมด เว้นว่าหาไม่เจอ เราก็ใส่เข้าไปหน่อย แล้วคนอื่นจะได้ใช้ด้วย เอาแบบนั้น สำหรับเมตาดาต้าหนังสือ ก็จะได้ ‡biblios.net โครงการเพิ่งเริ่มได้ไม่นาน แต่ดูดีทีเดียว มาจาก LibLime ผู้ร่วมพัฒนา Koha

นอกจากสารสนเทศที่เป็นหนังสือเล่มแล้ว ก็ยังมีเอกสารที่ไม่ใช่หนังสือ ซึงตอนนี้ก็เป็นดิจิทัลได้จำนวนมากแล้ว วิธีหนึ่งที่นิยมและมีประสิทธิภาพก็คือ self-archiving คือเก็บของใครของมัน ใครผลิตคนนั้นก็เก็บ เป็น institutional repository แต่แชร์ข้อมูลค้นหากันได้ ระบบจัดเก็บสารสนเทศองค์กรที่เป็นโอเพ่นซอร์สและใช้โปรโตคอล OAI-PMH สำหรับแลกเปลี่ยนเมตาดาต้าเพื่อการค้นหา มีสองตัว :

  • DSpace เมืองไทยมีใช้หลายที่ เช่น คลังปัญญาจุฬาฯ โดย สถาบันวิทยบริการ จุฬาลงกรณ์มหาวิทยาลัย, ห้องสมุดดิจิทัลคิดดี โดย เอไอที, สำนักงานคณะกรรมการการศึกษาขั้นพื้นฐาน และ มศว., NSTDA Knowledge Repository (สวทช.) โดย ศูนย์บริการความรู้ทางวิทยาศาสตร์และเทคโนโลยี
  • EPrints เมืองไทยเท่าที่ทราบ ไม่มีใครใช้ ผมดูแล้วมันน่าจะลงง่ายกว่าแฮะ (จากประสบการณ์ส่วนตัว ระหว่าง UIMA กับ GATE พบว่า GATE ปวดหัวน้อยกว่า ผมเลยคิดว่า จะลอง EPrints ก่อนละกัน เหตุผลแถ ๆ :p)

@markpeak แนะนำอีกตัว (thx!) คือ Greenstone เท่าที่ค้น ๆ ดูคร่าว ๆ อันนี้ ไม่ได้เป็น institutional repository software เหมือนกับ DSpace หรือ EPrints เสียทีเดียว แต่เป็น digital library software (ดูจากบล็อกนี้ ผมเองก็ยังตอบไม่ได้ว่า แต่ละอย่างมันต่างกันชัด ๆ อย่างไร คิดว่ามันก็ทับ ๆ กันอยู่เยอะ แต่กรณีของ IR นี่ เรื่อง self-archiving น่าจะเป็นลักษณะสำคัญอันนึง) Greenstone นี่น่าสนใจมาก เขาบอกว่าสนับสนุนหลายภาษา มีภาษาไทยด้วย (ยังไม่ได้ค้นต่อว่าที่ว่า สนับสนุนภาษา เนี่ย แปลว่าอะไร) มี UNESCO หนุน โอเพ่นซอร์ส และสนับสนุนโปรโตคอล OAI-PMH ร่วมพัฒนาโดยมหาลัยที่สร้าง WEKA data mining workbench/toolkit ดูดีนะเนี่ย

open archives, collections, repositories, libraries พวกนี้ นอกจากจะเปิดให้ดูเฉย ๆ แล้ว ถ้าจะให้มีประโยชน์จริง ๆ มันก็ควรจะค้นหาได้แบบ programmable หน่อย หรืออย่างน้อยก็มีวิธีในการค้นหาเหมือน ๆ กันนิดนึง ผู้ใช้จะได้ไม่ต้องเรียนรู้เยอะ ก็เลยเป็นที่มาของมาตรฐานในการค้นหา รวมไปถึงการแลกเปลี่ยนเมตาดาต้าแบบอัตโนมัติด้วย

เอาง่ายที่สุด ก็น่าจะใช้ OpenSearch สืบค้นได้ (ถ้านึกไม่ออกว่า OpenSearch คืออะไร ตัวช่องค้นหาบนแถบเครื่องมือใน Internet Explorer 7+ และ Mozilla Firefox 3+ ต่างก็สืบค้นจากบริการที่เราระบุ ผ่าน OpenSearch ... อืม ยังไม่ชัด แต่ก็ดูใกล้ตัวหน่อยนึง) แล้วส่งผลลัพธ์ออกมาเป็น RSS/Atom รูปแบบข้อมูลยอดนิยม, ถ้ามี JSON ล่ะก็แจ๋ว ในแง่การเขียนโปรแกรมโดยเฉพาะฝั่ง browser-side

ชุดต่อมา มาจากกลุ่ม Open Archives Initiative มีตัวชูโรงคือ OAI-PMH ที่พูดถึงก่อนหน้านี้ เอาไว้แลกเปลี่ยนเมตาดาต้า :

สำหรับการสืบค้นสารสนเทศ ดูมาตรฐาน Z39.50 (ISO 23950: Information Retrieval (Z39.50): Application Service Definition and Protocol Specification) และ SRU (Search/Retrieve via URL) คู่กับ CQL (Contextual Query Language). ‡biblios.net ที่พูดถึงก่อนหน้านี้ รองรับ SRU/CQL ด้วย

ข้อกำหนดเมตาดาต้าที่ได้รับนิยมนำไปปรับใช้มากที่สุดในเว็บนั้น คือ Dublin Core Metadata Initiative (DMCI) ซึ่งคนที่ใช้งานเอกสาร XML ต่าง ๆ อาจจะพอคุ้นเคย ใน namespace dc: ซึ่งถูกนำไปใช้กับรูปแบบเอกสาร XML หลายชนิด OAI เองก็ใช้ Dublin Core

ความเห็นเพิ่มเติมจาก อ.บุญเลิศ ขณะนี้ DCMI ก็ยอมรับแล้วว่า DC ไม่ใช่มาตรฐานเดียวที่ใช้ได้ มีการทำ Cross กับเมทาดาทาอื่นแล้ว ลองหาอ่านได้จาก DC conference ต่างๆ ได้ครับ

สำหรับรูปแบบข้อมูลผลลัพธ์จากการสืบค้นสารสนเทศอื่น ๆ ก็เช่น MARCXML ซึ่งพัฒนาต่อมาจากปู่ MARC มีช่องข้อมูลมากมาย เรียกได้ว่าครบถ้วน แต่ก็ซับซ้อนปวดหัว, ต่อมาจึงมี Metadata Object Description Schema (MODS) ซึ่งอยู่ระหว่างกลาง MARC กับ Dublin Core (ซึ่งมีช่องข้อมูลน้อยมาก ๆ ประมาณว่าใช้ได้กับงานอย่าง RSS Feed จะให้ใช้กับห้องสมุดก็ขาดตกไปหลายอย่าง) เรียกว่า MODS มีช่องข้อมูลที่จำเป็นต้องใช้บ่อย ๆ ในงานห้องสมุด ในขณะเดียวกันก็ไม่ซับซ้อนจนเกินไป, Metadata Authority Description Schema (MADS) เป็นมาตรฐานที่ออกมาใช้คู่กับ MODS

acronyms ที่พ่นออกมามากมายข้างบน เกินครึ่งกำหนดโดยห้องสมุดรัฐสภาสหรัฐ (Library of Congress) ที่เหลือก็โดยห้องสมุดของมหาวิทยาลัยหรือศูนย์วิจัยต่าง ๆ

ใครสนใจเรื่องพวกนี้ โดยเฉพาะที่ใช้โอเพ่นซอร์ส อัปเดตข่าวสารได้จากเว็บไซต์เหล่านี้ (แนะนำเพิ่มเติมได้)

  • oss4lib - Open Source Systems for Libraries
  • code4lib - coders for libraries, libraries for coders กลุ่มเป้าหมายจะเน้นนักพัฒนามากกว่า oss4lib
  • บล็อก STKS - ภาษาไทย มีเรื่องการจัดการความรู้ เรื่องห้องสมุดดิจิทัลอยู่เรื่อย ๆ โดยเฉพาะซอฟต์แวร์ที่เป็นโอเพ่นซอร์ส
  • LibraryHub - โดย @projectlib เรื่องห้องสมุดในแง่มุมต่าง ๆ (ไม่ได้เน้นเฉพาะเรื่องซอฟต์แวร์)

นอกจากเรื่อง digital repositories แล้วถ้ามีเรื่องการอนุรักษ์ preservation, digitization ควรดู TEI ไว้ด้วย Text Encoding Initiative เป็นชุดข้อแนะนำในการบันทึกข้อความมาอยู่ในระบบดิจิทัล พร้อม ๆ กับคำแนะนำในการบันทึกคำอธิบายข้อมูลต่าง ๆ (annotation) ด้วย การทำ archiving, preservation ในลักษณะนี้ ถือเป็นคีย์สำคัญสำหรับ สาขา ที่เรียกว่า digital humanities (มนุษยศาสตร์ดิจิทัล) ซึ่งส่วนหนึ่งเป็นการใช้เครื่องมือดิจิทัลศึกษาเอกสาร (และบันทึกผลการวิเคราะห์ไปเป็น annotation อีกชั้น layer นึงบนเอกสาร)

เอ้อ ถ้าอยากทำ OCR มีทูลคิตโอเพ่นซอร์สชื่อ OCRopus ลองแล้ว ใช้ได้เลย มันเชื่อมชิ้นส่วนที่จำเป็นในงาน OCR เข้าด้วยกัน ทั้งส่วนแปลงไฟล์ฟอร์แมต หมุนรูป ทำ layout analysis ทำตัวแบบภาษา และการแปลงภาพเป็นตัวอักษร ตัว engine ที่ใช้แปลงภาพเป็นตัวอักษร ตอนนี้ใช้ tesseract อยู่ โอเพ่นซอร์สเช่นกัน ทั้งหมดนี้เขียนด้วย C แต่มี Python binding ถ้าต้องการ ชุด OCRopus และ tesseract นี้มี Google สนับสนุนการวิจัยและพัฒนา คาดว่าน่าจะเป็นตัวเดียวกับที่ใช้เป็นส่วนหนึ่งของระบบ Google Book Search ผมลองคอมไพล์แล้วรันเล่นดู เจ๋งดี ถ้าใช้ tesseract เฉย ๆ ผลลัพธ์จะเป็น plain text แต่ถ้าใช้ OCRopus tool chain มันได้มาเป็น HTML เลย (hOCR microformat) ซึ่งแปลว่าเราจะได้ layout และ style มาด้วย ตัวหนา ตัวเอียง มาหมด

แสกนเข้ามาแล้ว มันก็ต้องมีที่ผิดบ้างแหละ มากน้อยแล้วแต่ จะช่วยกันแก้ไขได้ยังไง ? ลองดูตัวแบบจากโครงการ Distribute Proofreaders (DP) (แนะนำโดย @thai101 ขอบคุณมาก ๆ ครับ) ซึ่งเป็นการเปิดให้อาสาสมัครบนอินเทอร์เน็ตมาช่วยกันพิสูจน์อักษร แก้ตัวสะกดผิด โดยโครงการนี้เจาะจงไปที่การแสกนหนังสือที่ไม่มีหรือพ้นการคุ้มครองลิขสิทธิ์ไปแล้ว (เป็นสมบัติสาธารณะหรืออยู่ใน Public Domain) พิสูจน์อักษร แล้วก็ส่งต่อหนังสือที่เสร็จสมบูรณ์แล้ว ให้กับ Project Gutenberg ต่อไป ตัวแบบของ DP นี้อาจจะเอามาปรับใช้กับโครงการอื่น ๆ ก็ได้

ทั้งหมดที่กล่าวนี้ จะเห็นว่าในส่วนของมาตรฐานก็เป็นมาตรฐานเปิด ส่วนซอฟต์แวร์ก็มีทางเลือกที่เป็นโอเพ่นซอร์ส แรงงานหรือก็มีคนยินดีร่วมเป็นอาสาสมัคร (ถ้าระบบมันไม่ใช้ยากเกินจนท้อไปเสียก่อน) อนาคตดูดีทีเดียว วงการห้องสมุด

งงกันมาพอสมควรแล้ว โพสต์นี้ไม่ได้ช่วยให้ใครเข้าใจอะไรขึ้นมาได้แน่ ผมเองก็ไม่เข้าใจ แต่มันพอจะทำให้เห็นความเชื่อมโยง อย่างน้อยก็ของตัวย่อมหาศาลที่จะบุกรุกเข้ามาในชีวิตคุณ ถ้าอยากจะเข้าไปสนุกในสนามห้องสมุดิจิทัล โปรดสังเกตว่าผมใช้คำว่า เข้าไป ไม่ใช่ เข้ามา เพราะผมเองก็ยังไม่ได้อยู่ในสนามนั้น :p ถ้าพัฒนาโปรแกรมอินเทอร์เน็ตได้ สนใจงานพวกนี้ อาจจะเฉี่ยวไปเฉี่ยวมาหน่อย ลองดู Jobs @Opendream

ถ้าอยากอ่านอีก โดดไป ProjectLib LibraryHub เลย หรือแจม LibCamp (ภาพงาน) ที่เดี๋ยวจะมีอีก ผมไม่รับผิดชอบแล้ว! มึน!

อยากมึนหนัก? เผ่นไปบล็อก iTeau โลด จริง ๆ ก็อาจจะไม่มึนนะ เขาเขียนอธิบายดีน่ะ ยกจอก :)

follow @projectlib @iteau @markpeak @kengggg และ @klaikong

อยากมีร้านสำหรับนั่งอ่านหนังสือ

technorati tags: , , , , , , ,

12 comments:

Mk said...

มาเสริมให้อีกหน่อยครับ

ตัว digital repository อีกตัวที่นิยมคือ Greenstone ถ้าจำไม่ผิด STKS จะใช้ของค่ายนี้ ส่วน DSpace ในไทยจะเป็นของค่าย AIT

MARC/MODS เมืองไทยมีใช้ที่เดียวคือ มสธ.

เรื่องมาตรฐาน คนที่รู้เรื่องนี้ดีมากคนนึงคือ ไกลก้อง ซึ่งเรียนมาทางนี้โดยตรงที่ มสธ. (เคยพาผมกับเก่งไปคุยกับ อ. เขา ก็เยี่ยมมากเช่นกัน)

Mk said...

อีกเรื่องคือ projectlib เค้าย้ายที่เป็น libraryhub.in.th แทนละ

bact' said...

mk: STKS น่าจะใช้ DSpace เป็น backend แล้วครอบด้วย Koha นะ
http://library.stks.or.th:8080/dspace/Greenstone และ libraryhub เดี๋ยวไปดู แต้งกิ้ว

bact' said...

เหมือน Greenstone จะออกไปทาง digital library
ส่วน DSpace กับ EPrints นั้นเป็น IR
(แต่ทาง EPrints ก็บอกว่า DSpace เป็น digital library ถ้าใช้ทำ IR จริง ๆ ต้องปรับจูนอีก)

bact' said...

เอ หรือ Koha กับ DSpace ของสวทช. ที่ STKS ทำมันจะต่างคนต่างอยู่ว่า เริ่มไม่ชัวร์

bact' said...

ลืมลิงก์ Distributed Proofreaders
http://www.pgdp.net/c/

(ขอบคุณ @thai101)

bact' said...

follow @stksthailand and LISNews for (digital) library updates

latest update:
“Query-free” federated search

bact' said...

สอนใช้งาน OCRopus
http://ocrocourse.iupr.com/

OCRopus รุ่น 0.4 ออกแล้ว ดาวน์โหลดได้ที่เว็บไซต์ OCRopus ครับ

บุญเลิศ อรุณพิบูลย์ said...

อ่านแล้วขออนุญาตชี้แจงและเสริมดังนี้ครับ

1) Institutional Repository, Digital Collection, Digital Archives เป็น sub-set ของ Digital Library

โดย IR เน้นการเก็บเอกสารที่เป็นผลงานทางวิชาการของบุคลากรในสถานบัน (มักเป็นสถาบันการศึกษา) เช่น งานวิจัย วิทยานิพนธ์

Digital Collection เก็บทุกอย่างที่เป็น Digital Media

Digital Archives ก็เน้นเก็บเอกสารจดหมายเหตุที่แปลงเป็นดิจิทัลแล้ว

2) STKS ใช้ Greenstone (GS) ทำ Digital Collection เพื่อทำ LiveDL ให้กับผู้ใช้ที่ไม่พร้อมเรื่องเครือข่าย เพราะจุดเด่น Greenstone คือ Export to DVD ได้เจ๋ง

และใช้ GS เป็นเครื่องมือประกอบการแนะนำเรืื่องมาตรฐานการเตรียมสื่อดิจิทัล และเมทาดาทา เพราะรองรับเมทาดาทาได้ทุกค่ายที่มี

3) มสธ. ใช้ Greenstone ทำพิพิธภัณฑ์พระบาทสมเด็จพระปกเกล้า แต่เลือกใช้ MODS/METS เป็นเมทาดาทาแทน DC

4) STKS ไ่ม่สนับสนุนให้ใช้ DC เพียงเมทาดาทาเดียว ต้องพิจารณาจากลักษณะงานด้วย เช่น ถ้าทำ e-Museum ก็แนะนำให้เลือก CDWA โดยรายละเอียดศึกษาได้จากเว็บ stks ค้น "รอบรู้เมทาดาทา"

5) STKS ไม่ได้ใช้ DSpace แล้วนำ Koha มาครอบ เพราะเป็นคนละโปรแกรม คนละหลักการบรรณารักษ์

DSpace เป็นซอฟต์แวร์ในกลุ่ม DL ที่สนับสนุน IR ในขณะที่ Koha เป็นซอฟต์แวร์ในกลุ่ม Automated Library แบบ ILS (Integrated Library System) เป็นคนละเรื่องกันเลยครับ

ดังนั้น DSpace ก็ส่วน DSpace และ Koha ก็ส่วน Koha ครับ

้http://stks.or.th/nstdair เป็น IR ที่ำทำด้วย Dspace

http://stks.or.th/library เป็น Automated Libs ที่ทำด้วย Koha ให้บริการยืมคืนหนังสือตัวเล่ม/วารสารของห้องสมุด

แต่ AIT นำ VuFind มาครอบทั้ง Koha และ DSpace เป็นโครงการ Kids-D

ประมาณนี้ก่อนนะครับ เพราะอยากให้เนื้อหาสาขาวิชาบรรณารักษ์/สารสนเทศ ไม่เพี้ยนนะครับ

บุญเลิศ อรุณพิบูลย์ said...

ขอนำเนื้อหาที่เขียนใน http://bact.blogspot.com/2009/06/on-various-things-digital-this-and.html มาชี้แจงครับ

...เว็บ DegreeTutor แนะนำโอเพ่นซอร์ส ILS (integrated library system) 3 ตัว ได้แก่ Koha, Evergreen ILS, และ VuFind ทุกตัวทำงานกับ OPAC (open public access catalog) ได้หมด : ....

1) OPAC เป็นโมดูลหนึ่งของ ILS (รายละเอียดอ่านได้ที่ stks.or.th/wiki เทคโนโลยีห้องสมุด)
2) Koha, Evergreen เป็น OSS ILS มีความสามารถเท่ากัน
3) VuFind ไม่ใช่ ILS แต่เป็น Library Resource Portal ที่มาครอบ ILS เพื่อขยายความสามารถของ OPAC ให้เป็น OPAC 2.0
4) ดังนั้น Koha, Evergreen และ VuFind ไม่ใช่ทำงานกับ OPAC ได้หมด นะครับ

....Koha OPAC รุ่นเล็ก ติดตั้งง่าย มีหลายที่ในเมืองไทยใช้แล้ว เช่น ห้องสมุดดิจิทัลของ STKS (โชว์ในงาน LibCamp), ห้องสมุดวุฒิสภา, ม.อุบลก็กำลังเตรียมใช้, บล็อก STKS สวทช. เขียนถึงเยอะเหมือนกัน....

1) Koha ไม่ใช่ OPAC รุ่นเล็ก เพราะ Koha เป็น ILS โดย OPAC เป็นโมดูลหนึ่งของ ILS ที่ต้องมี
2) Koha ไม่ใช่รุ่นเล็ก เพราะเทียบเท่ากับ Commercial ILS ระดับ VTLS, InnoPAC, Horizon
3) ILS รุ่นเล็ก คือ OpenBiblio และ PHPMyLibrary

ตัวช่วยในการ catalog ตอนนี้ STKS กำลังรณรงค์ 2D Barcode (QR Code) (รายละเอียดในเว็บ stks เช่น) โดยคาดหวังว่าสำนักพิมพ์ซึ่งต้องขอ CIP (ค้นจาก stks แล้วกันครับ) จากหอสมุดแห่งชาติ จะต้องพิมพ์นำ CIP มาพิมพ์เป็น 2D Barcode ในหนังสือ พอห้องสมุดได้หนังสือ ก็ยิงด้วย Barcode Reader โปรแกรมก็จะดึงข้้อมูล CIP ที่เป็น 2D Barcode ไป Fill ใน ILS ให้อัตโนมัติ แต่ยังไม่ก้าวเท่าไร เพราะติดที่หอสมุดแห่งชาติ

.....ข้อกำหนดเมตาดาต้าที่ได้รับนิยมนำไปปรับใช้มากที่สุดในเว็บนั้น คือ Dublin Core Metadata Initiative (DMCI) .....

ขณะนี้ DCMI ก็ยอมรับแล้วว่า DC ไม่ใช่มาตรฐานเดียวที่ใช้ได้ มีการทำ Cross กับเมทาดาทาอื่นแล้ว ลองหาอ่านได้จาก DC conference ต่างๆ ได้ครับ

bact' said...

ขอบคุณครับที่ชี้แจงจุดที่ยังไม่เข้าใจและไม่แน่ใจหลายประเด็น

ผมสนใจในแนวของ AIT ที่มีตัวอะไรซักอย่างมาครอบ เพื่อให้ผู้ใช้ค้นหาได้จากอินเทอร์เฟซเดียว
ไม่ต้องเข้าหลายอัน

ระบบห้องสมุดปัจจุบันของมหาลัยจำนวนมากที่เคยใช้ ผมคิดว่ามันโยนภาระที่ไม่จำเป็นไปให้ผู้ใช้ คือผู้ใช้ต้องทราบว่า สิ่งที่ต้องการจะหา เป็นเอกสารประเภทไหน ถ้าไม่ทราบก็ต้องหามันทีละฐานข้อมูล

สำหรับผู้ใช้ที่ต้องการจะหาตามประเด็น ไม่ใช่หาตามประเภทเอกสาร ก็ต้องไล่ทุกฐานข้อมูลเอง

ปัญหาลักษณะเดียวกันนี้พบกับฐานข้อมูลของศูนย์มานุษยวิทยาสิรินธรเช่นกัน คือมีฐานข้อมูลวิจัยตามประเด็นอย่างน้อยหกเจ็ดฐาน มีฐานข้อมูลวิจัยตามลักษณะของทุนวิจัยอีกสี่ฐาน สมมติผู้ใช้ต้องการจะหาข้อมูลเช่นเรื่อง "มอญ" ก็อาจจะต้องค้นในฐานข้อมูลชาติพันธุ์ ฐานข้อมูลมอญศึกษา ฐานข้อมูลงานวิจัยขนาดเล็ก ฯลฯ ซึ่งก็พบว่าไม่สะดวกเท่าไหร่

ในมุมมองผู้ใช้ ผมคิดว่าถ้าอินเทอร์เฟซสามารถลดความสะดวกเหล่านั้นไปได้ backend ข้างใต้จะเป็นอะไร หลากหลายเท่าไหน ก็น่าจะไม่มีปัญหาครับ
ทั้งนี้ก็คงจะต้องมี vocaburary เพื่อจะลิงก์เทียบข้อมูลจากฐานที่มีระบบ classification ไม่เหมือนกันด้วย (คล้าย ๆ ontology ในสายเวชสารสนเทศ)

บุญเลิศ อรุณพิบูลย์ said...

เห็นด้วยอย่างยิ่งครับ และเป็นความหวังของชาวบรรณารักษ์ด้วยครับที่จะมีเครื่องมือทำ union search ให้เค้าครับผม (เฉพาะหน่วยงานที่เปิดระบบนะครับ เพราะมีอีกเยอะที่ปิดตั้งแต่ใจแล้วครับ)