ย้ายบล็อกไปที่ bact.cc แล้วนะครับ

พ.ร.บ.คอมพิวเตอร์
หยุด ร่างพ.ร.บ.คอมพิวเตอร์
พื้นที่เก็บข้อมูลออนไลน์ ฟรี 2GB จาก Dropbox (sync กับ Windows, Linux, Mac, iPhone, Android ฯลฯ ได้)

2007-10-29

Hong Kong InnoCentre

InnoCentre is a Hong Kong one-stop shop for innovations and creativities.

The InnoCentre is jointly run by Hong Kong Science & Technology Parks and Hong Kong Design Centre. It aims to cultivate a cluster of high-value added design activities among design professionals and user industries.

Services that will be provided, including:

  • grade A office for small and medium design companies
  • design incubation programme for start-up companies
  • education, training and professional development
  • exhibitions, seminars and workshops
  • a resource centre

The InnoCentre is located at
72 Tat Chee Avenue, Kowloon Tong

Give-away HK design links:

But, oh, well, in Thailand, you know it, they're going to scale-down its design center, TCDC. Wow.

Save TCDC !

[ link DesignSmart Initiative ]

technorati tags: , ,

2007-10-26

Thai UTF-8 localisation in phpBB

อัพเดท: 2007.11.02 คุณ SuperToy_nc (ผู้ดูแลชุดภาษาไทยของ phpBB ในปัจจุบัน) แจ้งมาว่า ชุดภาษาไทยของ phpBB 2 นั้น มีให้ดาวน์โหลดเป็น UTF-8 อยู่แล้ว ที่เว็บไซต์ phpBB.com
ใครที่จะติดตั้งใหม่ และจะใช้ UTF-8 ก็ไปดาวน์โหลดได้จากเว็บไซต์ phpBB ได้โดยตรงเลย ไม่ต้องแปลงอย่างที่แสดงข้างล่างนะครับ
(ข้างล่างนี้ เป็นกรณีที่ มีชุดภาษาที่เป็น TIS-620 (หรือ encoding อื่น ๆ) ติดตั้งอยู่แล้ว และต้องการจะแปลงของเดิมนี้เป็น UTF-8 — กรณีนี้กรณีเดียวเท่านั้น)
และ phpBB ทั้งรุ่น 2 และ 3 ต่างก็ใช้ UTF-8 ได้ทั้งคู่
ส่วนใครอยากดูวิธีลง phpBB ตั้งแต่ตั้งต้น ก็ไปดูได้ที่หน้าเว็บ http://supertoy.host.sk/howto/phpbb.html (ภาษาไทย, มีภาพประกอบ)
ขอขอบคุณคุณ SuperToy_nc มา ณ ที่นี้ด้วยครับ ที่ช่วยชี้แจงอธิบายและส่งลิงก์มาให้
และขอโทษทุกท่านที่อาจทำให้เข้าใจผิด คิดว่าตัวชุดภาษาไทยของ phpBB มันไม่มีแบบ utf-8 ต้องมาแปลงเองด้วยครับ

ส่วนใครที่ใช้ธีมตระกูล *silver แล้วมีปัญหา ภาษาไทยที่หัวเรื่องหมวดหมู่มันแสดงโย้ ๆ (โดยเฉพาะถ้าดูใน Firefox บนลีนุกซ์)
ให้ไปดูที่โฟลเดอร์ templates/ชื่อธีม แล้วแก้ไฟล์ *.css และไฟล์ *_header.tpl ทั้งหลาย (ซึ่งมี css อยู่ที่หัว)
โดยเอา letter-spacing ออกไปซะ และถ้ามีพวก text-align ที่เป็น justify ก็เอาออกไปด้วย หรือแก้เป็น left
(ที่ตัวอักษรมันโย้ เพราะว่าตัวเบราว์เซอร์มันคำนวณระยะห่างตัวอักษรผิดครับ มันเอาพวกสระบนล่างและวรรณยุกต์ไปคำนวณ spacing ด้วย ก็เลยเป็นอย่างนั้น จริง ๆ ควรจะที่เว็บเบราว์เซอร์ให้มันจัดให้ถูก ๆ แต่ตอนนี้ก็เลี่ยงแบบนี้ไปก่อนได้)

ก่อนแก้ .cattitle letter-spacing = 1px:
phpBB / letter-spacing: 1px

หลังแก้ ลบ letter-spacing ทิ้งไปเลย:
phpBB / no letter-spacing

(ตัวข้อความที่เปลี่ยนไปไม่เกี่ยวกะ css นะ อันนั้นอยู่ในส่วนที่แปลเพิ่มเติม)


[โพสต์ดั้งเดิมเริ่มที่นี่]

ที่ภาควิชารับผิดชอบเป็นศูนย์ประสานงานภาคกลางของงานประกวดซอฟต์แวร์ National Software Contest (NSC)
พี่ที่แล็บจะทำเว็บบอร์ด ด้วย phpBB แต่ติดว่าตัว ชุดภาษาไทย (Thai language pack) [ที่ติดตั้งอยู่เดิม] มันมีปัญหากับรหัสอักขระ utf-8

ผมไม่อยากเปลี่ยนฐานข้อมูลเป็น tis-620 อยากจะใช้ให้ทั้งหมดเป็น utf-8 เลยคิดว่าน่าจะมาแก้ที่ตัว phpBB ที่ตัวชุดภาษา

ชุดภาษาใน phpBB จะติดตั้งอยู่ที่ไดเรกทอรีชื่อ “language” ข้างในก็จะมีไดเรกทอรีย่อยของแต่ละภาษาอยู่ ของภาษาไทยอยู่ใน “lang_thai” ผมก็ทำสำเนาอีกชุดซะ มาเป็น “lang_thai-utf8” กันเหนียว

ที่ต้องทำตอนแรก ก็คือแปลงพวกไฟล์ข้อความ จากรหัส tis-620 ให้เป็น utf-8 ซะก่อน ในชุดภาษามีไฟล์หลัก ๆ อยู่ 4 อัน คือ lang_main.php, lang_admin.php, lang_bbcode.php, lang_faq.php
ส่วนไฟล์สำหรับช่วยการค้นหา search_stopwords.txt และ search_synonyms.txt นั้น เป็นภาษาอังกฤษล้วน ก็ไม่ต้องทำอะไร
(สำหรับไฟล์ในไดเรกทอรี email นั้น จะแปลงหรือไม่แปลงก็ได้ ไม่เกี่ยวกับเว็บ)

iconv -f tis-620 -t utf-8 lang_xxx.php > lang_xxx.php

จากนั้นแก้ $lang['ENCODING'] ในไฟล์ lang_main.php ให้เป็น utf-8 ด้วย:

$lang['ENCODING'] = 'utf-8';

ถึงขั้นนี้ ตัว phpBB ก็จะแสดงภาษาไทยได้แล้ว โดยใช้ utf-8
แต่ยังไม่เสร็จ เพราะตอนโพสต์ข้อมูลมันจะยังเพี้ยนอยู่ ตัวอักษรไทยในหัวข้อมันจะถูกแปลงไปเป็น &#nnnn;
อัพเดท: ลองทดสอบอีกที เอ แค่แก้ตัวชุดภาษาอย่างเดียวมันก็เวิร์กแล้วนี่นา สงสัยก่อนหน้าที่ไม่เวิร์ก (ตัว charset ยังเป็น iso-8859-1) คงเป็นเพราะแคชยังค้างอยู่ ยังไงถ้าใครจะลองทำตาม ก็ลองทำแบบไม่แก้แม่แบบ (ขั้นตอนด้านล่าง) ดูก่อนนะครับ แล้วถ้าไม่ได้จริง ๆ ค่อยแก้แม่แบบอีกที

ตาม หน้า Support ของ phpBB (I am seeing &#nnnn; sequences output instead of what I typed!) เขาว่า นี่เป็นเพราะ phpBB ยังไม่รองรับ utf-8 ... อ้าว เวร อุตส่าห์แก้+แปลเพิ่มมาตั้งเยอะ ไม่รู้ล่ะ ยังไงฉันก็จะใช้ให้ได้
(อัพเดท 2007.11.02: ปัญหาที่เกิดตามหน้า support นั้น ไม่ใช่ว่า phpBB ไม่รองรับ utf-8 แต่น่าจะเป็นตัว template (theme) นั้น ๆ มันไม่ยอมเปลี่ยน charset declaration ของ HTML page ให้เป็นไปตามที่ตั้งไว้ใน $lang['ENCODING'] วิธีแก้ในกรณีนี้ ก็คือไม่ต้องใช้ตัวแปรที่ว่า แต่ฮาร์ดโค้ดไปเลย ตามที่แสดงด้านล่าง)

มันก็มีวิธี hack ๆ ก็คือ แทนที่จะใช้ตัวแปร S_CONTENT_ENCODING สำหรับ charset ใน header/meta ของ HTML เราก็ hard code มันไปซะเลย ใช้กำลังเข้าบังคับ

โดยเข้าไปแก้ที่ไฟล์ *_header.tpl ของแม่แบบที่เราจะใช้ ซึ่งพวกแม่แบบนี่ ก็จะอยู่ในไดเรกทอรี “templates”

ในที่นี้ เว็บบอร์ด NSC ภาคกลาง ใช้แม่แบบชื่อ subSilver ซึ่งมีไฟล์เฮดเดอร์อยู่สองไฟล์ คือ overall_header.tpl และ simple_header.tpl ก็แก้มันทั้งคู่

ดูบรรทัดบน ๆ แก้จาก:

<meta http-equiv="Content-Type" content="text/html; charset={S_CONTENT_ENCO
DING}">

เป็น:

<!-- <meta http-equiv="Content-Type" content="text/html; charset={S_CONTENT_ENCO
DING}"> -->
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

คือบังคับเลย ว่า “แกต้องเป็น utf-8 นะ เข้าใจไหม ?”
อัพเดท: บางทีอาจจะไม่ต้องแก้ขั้นตอนนี้ก็ได้ แก้แต่ตัวชุดภาษาก็พอ

แก้เสร็จแล้วลอง ๆ โพสต์ดูนะครับ ว่าได้รึเปล่า ลองกดดูซอร์สด้วย ว่าที่แสดงผล กับ HTML code มันเหมือนกันรึเปล่า

ส่วนนี่คือหน้าตาของที่ nsc.siit.net/webboard
Screenshot

สำหรับไฟล์ชุดภาษาที่แปลงเป็น utf-8 แล้ว ดาวน์โหลดได้ที่ http://arthit.googlepages.com/lang_thai-utf8.tar.gz โดยผมได้แปลเพิ่มเติมเอาไว้บางส่วนด้วย (ส่วนใหญ่จะเป็นพวกคำพื้น ๆ ที่ยังใช้ภาษาอังกฤษอยู่ เช่น admin, moderator, email, username, password ทำนองนี้) — เดี๋ยวจะส่งให้กับทางผู้ดูแลแพคเกจต่อไป

นอนดีกว่า - -"

technorati tags: , , ,

a dream

บางทีเราก็นึกอยากจะขึ้นไปร้องเต้นเล่นดนตรี บนเวทีของตัวเอง เหงื่อออก วิ่งไปวิ่งมา เสียงคนมีความสุข

bact' is a friend 2022 ticket

bact' is a friend '22 cassette

bact' is a friend '22 promo

[ ลิงก์ says-it.com ]

technorati tags: ,

2007-10-25

a voice of TCDC staff

ยุบ/ย้ายทีซีดีซี อีกหนึ่งในมาตรการ “ลบเหลี่ยม” ประเทศไทย

Save TCDC

เสียงจากพนักงานทีซีดีซีคนหนึ่ง (ตัวเน้นของผมเอง):
kanteera's blog

จากการที่ดร.สุรพล วิรุฬรักษ์ ผู้อำนวยการศูนย์สร้างสรรค์งานออกแบบคนปัจจุบัน ลงมาพบปะพูดคุยกับพนักงาน TCDC ในช่วงเช้าวันนี้ ... ทำให้ทราบข้อมูลอะไรหลายๆอย่างกระจ่างขึ้น

1. ดร.สุรพล จะดำรงตำแหน่งผู้อำนวยการศูนย์สร้างสรรค์งานออกแบบจนถึงวันที่ 31 ธันวาคม 2550 นี้เท่านั้น และระหว่างนี้จะมีการคัดเลือกผู้อำนวยการศูนย์สร้างสรรค์งานออกแบบอีกครั้ง
(ซึ่งนายไชยยงค์ รัตนอังกูร ผู้อำนวยการศูนย์คนก่อนจะได้กลับเข้ามาเป็น 1 ในตัวเลือกอีกครั้ง) ซึ่งดร.สุรพลคาดว่าผลน่าจะออกมาราวๆเดือนพฤศจิกายนนี้...ว่าใครจะเป็นผู้อำนวยการศูนย์ฯ

2. TCDC จะย้ายทั้งส่วนห้องสมุดและนิทรรศการไปที่จามจุรีสแควร์ โดยตัวศูนย์จะตั้งอยู่ที่ชั้น 2 และ 3 ส่วน Office จะอยู่ที่ชั้น 12
(ตัวศูนย์ย้ายไปที่จามจุรีสแควร์ทั้งหมด ไม่ได้โดนแยกส่วนนิทรรศการไปที่สถาบันพิพิธภัณฑ์ตามที่ผู้ใหญ่เค้าคาดการณ์ ตอนแรก .... ส่วน Shop คาดว่าอาจย้ายไปอยู่ที่สถาบันพิพิธภัณฑ์การเรียนรู้แห่งชาติ ซึงอาจทำให้กลุ่มเป้าหมายกลายเป็น คุณแม่ที่รอรับลูกจากโรงเรียนราชินี เด็กนักเรียนโรงเรียนตั้งตรงจิตวิทยา สวนกุหลาบ ฯลฯ T-T ส่วน MCB อาจย้ายไปอยู่ที่จามจุรีสแควร์ด้วยกัน แต่ทุกอย่างยังไม่แน่นอนเพราะต้องรอดูพื้นที่ก่อน)

3. TCDC จะดำเนินงานและใช้ชื่อ TCDC ต่อสาธารณชนได้เหมือนเดิม
(TCDC ถูกยุบรวมกับสถาบันพิพิธภัณฑ์การเรียนรู้แห่งชาติ และอยู่ภายใต้การดูแลของบอร์ดใหม่เพียงบอร์ดเดียวภายใต้ชื่อองค์กรใหม่ที่ ยุบรวมกันแล้วนี้ คือ TDCC หรือ Thailand Discovery and Creative Center แต่ทางศูนย์สร้างสรรค์ฯสามารถใช้ชื่อ TCDC ในการดำเนินงานต่อหน้าสาธารณชนได้เหมือนเดิม ..... ไม่ต้องใช้ชื่อ TDCC

แต่ทั้งนี้ไม่ว่าจะเป็นทางสถาบันพิพิธภัณฑ์หรือ TCDC เวลาเซ็นเอกสารราชการใดๆก็ตามจะต้องให้บอร์ด TDCC เป็นผู้เซ็นให้ ......

4. มติการยุบรวม .... ไม่สามารถแก้ไขอะไรได้แล้ว ...
แต่เรื่องการย้ายศูนย์ ...... เรายังสามารถอุทธรณ์ได้
.... แม้ความหวังจะน้อยนิด
แต่เราก็พูดได้ว่า .... อาจมีการเปลี่ยนแปลงได้

5. สรุปประเด็นข้อสงสัยของพนักงานในที่ประชุมแยกออกเป็น 2 ข้อใหญ่ๆ
(ข้อนี้พูดตามเหตุการณ์ที่เกิดขึ้นในที่ประชุม ... อาจดูเข้าข้าง TCDC มาก ... โปรดอ่านอย่างมีวิจารณญาณแล้วกันค่ะ)

คือ

5.1 ทำไมต้องจามจุรีสแควร์ .... ถ้าเรื่องค่าเช่าแพง ... ก่อนหน้านี้มีการคำนวณค่าเช่าต่อพื้นที่แล้ว .. ปรากฎว่าใกล้เคียง ... ทำไมเราต้องย้ายเพื่อเสียเงินค่าตกแต่งใหม่ .... หรือเพราะบอร์ด OKMD ส่วนใหญ่จบจุฬามา .... บวกกับเรื่องปัญหาพื้นที่ให้เช่าที่ยังว่างอยู่* .... ไหนจะปัญหาภาพลักษณ์ TCDC ที่จะเปลี่ยนไปอีก ... ถ้าจะให้ชัดเจนควรมีการวัดผลกันไปเลยว่าที่เก่ากับที่ใหม่อันไหนดีเรื่อง อะไร อันไหนแย่เรื่องอะไร .... ทำให้โปร่งใส .... ว่าทำไมต้องย้าย (ก่อนหน้านี้ดูมาจริงๆ 7 ที่ ตัดมาเป็นตัวเลือกเหลือ 4 ที่และฟันธงเลือกที่จุฬา ซึ่งในที่ประชุมถามว่า 4 ที่ที่ว่านอกจากจุฬาแล้วมีอะไรบ้าง ดร.สุรพลตอบว่า ผมจำไม่ได้ ....... !!!!!!!!!! จนบัดนี้ พนักงาน TCDC ยังไม่มีใครรู้เลย ... ตามถามกันมาตั้งแต่มีข่าวว่าจะย้ายแล้วนะเนี่ย T-T )

5.2 ตั้งแต่ TCDC โดนมตินู่นนี่มา ..... TCDC จะเป็นคนสุดท้ายที่รู้ข่าว ไม่เคยได้มีโอกาสเข้าไปร่วมหารือกับการตัดสินใจ .... ทั้งๆที่เป็นคนทำงาน แต่กลับไม่มีโอกาสแสดงความคิดเห็น .... รู้อีกที ออกมติไปแล้ว ... พนักงานจึงอยากร้องขอความเป็นธรรมในเรื่องนี้ด้วย ....

ซึ่ง ดร.สุรพล ก็รับปากว่าจะนำเรื่องทั้งหมดเข้าที่ประชุมของบอร์ด OKMD ในวันพรุ่งนี้ ....

ป.ล. กรุณาอ่านอย่างมีวิจารณญาณ ..... ไว้มีข่าวอะไรคืบหน้า .... จะมาแจ้งให้ทราบค่ะ
(อย่าลืมนะคะ ... ว่ายังมีเปอร์เซนต์ที่จะมีการเปลี่ยนแปลงอีกเรื่อยๆ .... บทสรุปนี้อาจยังไม่ฟันธงก็ได้ เพราะแพลนงานจริงๆในอนาคต ... ยังไม่มีความชัดเจนเลย )

* ดูข่าวไทยรัฐ (19 ต.ค. 50) ย่อหน้าสุดท้าย:

ผู้สื่อข่าวรายงานด้วยว่า ก่อนหน้านี้คณะกรรมการบริหารของ สบร. ได้มีมติให้ย้ายพื้นที่ตั้งทีซีดีซีและหน่วยงานภายใต้ สบร.ไปอยู่อาคารจามจุรี-สแควร์ ซึ่งมีมูลค่าโครงการกว่า 400 ล้านบาท ซึ่งได้ดำเนินการอย่างเร่งด่วน โดยคณะอนุกรรมการพิจารณาสรรหาสถานที่ทำการแห่งใหม่ ประกอบด้วย นายสุเมธ ชุมสาย ณ อยุธยา และนายนิธิ สถาปิตานนท์ ได้เลือกพื้นที่จากเอกชนรายเดียว ขณะที่โครงการดังกล่าวยังไม่แล้วเสร็จและขายพื้นที่ไม่ได้ นอกจากนี้ ยังได้คัดเลือกผู้บริหารโครงการจากบริษัท A49 ที่นายนิธิมีหุ้นส่วนอยู่.

จริง ๆ มันก็ค่อนข้างยากเหมือนกัน สำหรับตัวอ.นิธิ เพราะ A49 เป็นบริษัทใหญ่ที่รับงานเยอะ แถมยังมีบริษัทในเครือที่ทำโน่นทำนี่หลายอย่าง ตั้งแต่นิตยสารไปจนถึงก่อสร้าง ดังนั้นจึงมีโอกาสที่จะเกิดการ “ทับซ้อน” แบบนี้ได้ง่าย

อย่างไรก็ตาม สำหรับทางรัฐก็ควรจะตรวจสอบเรื่องที่เป็นข่าวด้วย ไม่อย่างนั้นก็จะเป็นเหมือนอย่างที่เคยกล่าวหาคนอื่นเสียเอง ... แล้วอะไรคือความชอบธรรมในการรัฐประหารที่อ้างกัน ? และสำหรับตัวบุคคลที่เกี่ยวข้อง ก็ควรจะเลือกเอาสักอย่าง เพื่อจะได้เกิดความโปร่งใส

(หมายเหตุ: น้องชายผมและเพื่อนจำนวนหนึ่ง เคย/ทำงานกับบริษัทในเครือ A49)

Save TCDCลงชื่อคัดค้านรายชื่อ

[ ลิงก์ Save TCDC | ผ่าน anpanpon ]

technorati tags: , ,

2007-10-23

seminar on Chairat's "Nation-State"

“รัฐ-ชาติกับ (ความไร้) ระเบียบโลกชุดใหม่” — ผมชอบหนังสือเล่มนี้มาก
คู่กับ “วาทกรรมการพัฒนา” ของ อ.ไชยรัตน์ เช่นกัน


ขอเชิญเข้าร่วมเสวนาวิจารณ์หนังสือ

รัฐ-ชาติกับ (ความไร้) ระเบียบโลกชุดใหม่
Nation-State and the New World (Dis)Order

วันพุธที่ 24 ตุลาคม 2550
เวลา 13.30 – 17.00 น.
ห้อง 102 คณะรัฐศาสตร์ มหาวิทยาลัยธรรมศาสตร์

นำเสนอโดย:

ไชยรัตน์ เจริญสินโอฬาร [wp]
ภาควิชาการเมืองการปกครอง คณะรัฐศาสตร์ ม.ธรรมศาสตร์

วิจารณ์โดย:

ดำเนินรายการโดย:

บัณฑิต จันทร์โรจนกิจ
คณะรัฐศาสตร์ ม.รามคำแหง

จัดโดย:

[ ลิงก์ ฟ้าเดียวกัน | ผ่าน ประชาไท ]

technorati tags: , ,

2007-10-22

Thai Internal Security Act, latest draft

เปิดร่าง พ.ร.บ.ความมั่นคง (ซอฟท์เวอร์ชั่น) ฉบับด่วนที่สุด !

โดยที่ปัจจุบันมีปัญหาเกี่ยวกับความมั่นคงจากบุคคลหรือกลุ่มบุคคลที่มีหลากหลาย มีความรุนแรง รวดเร็ว สามารถขยายตัวจนส่งผลกระทบเป็นวงกว้าง และมีความสลับซับซ้อน จนอาจกระทบต่อเอกราชและบูรณภาพแห่งอนาคต ก่อให้เกิดความไม่สงบเรียบร้อยในประเทศ และเป็นภยันตรายต่อความสงบสุขของประชาชน

ดังนั้น เพื่อให้สามารถป้องกัน และระงับภัยที่เกิดขึ้นได้อย่างทันท่วงที จึงสมควรกำหนดให้มีหน่วยปฏิบัติงานหลักเพื่อรับผิดชอบดำเนินการรักษาความ มั่นคงในราชอาณาจักร ตลอดจนบูรณาการและประสานการปฏิบัติร่วมกับทุกส่วนราชการ ส่งเสริมให้ประชาชนเข้ามามีส่วนร่วมในการป้องกันและรักษาความมั่นคง รวมทั้งเสริมสร้างความเข้มแข็งในท้องถิ่นของตน เพื่อป้องกันภยันตรายที่เกิดขึ้นตั้งแต่ในยามปกติ และในยามที่เกิดสถานการณ์อันเป็นภัยต่อความมั่นคงในพื้นที่ใดพื้นที่หนึ่ง และกำหนดให้มีมาตรการและกลไกควบคุมการใช้อำนาจเป็นการเฉพาะตามระดับความ รุนแรงของสถานการณ์ เพื่อให้สามารถแก้ไขสถานการณ์ได้อย่างมีประสิทธิภาพ และเป็นเอกภาพจึงจำเป็นต้องตราพระราชบัญญัตินี้

อ่านต่อที่: http://tinyurl.com/33cz76

technorati tags: , ,

ITSBLOGPARTY no.2: Party, Community, Charity

อิฐบล็อกปาร์ตี้

Let’s have a blast with ITSBLOGPARTY no.2: Party, Community, Charity

Date: Friday October 26, 2007
Venue: Blur (New Petchaburi Road)
Time: 9.00pm-01.30am

Once again create some good vibe for yourself and the society by coming to ITSBLOGPARTY.
Anyone comes with winter clothes you will get a ticket discount from 300 baht to ONLY 200 baht! All the clothes will be donated to the ones in need in the Northern provinces in Thailand by Thai Rural Development Camp, Bachelor of Economics, Thammasat University.
Get your ass there before 9 p.m. get 2 beers!
But after that only 1 would be enough for the lazy ass! Lol!!
A little reminder! Please dress under the theme of “global warming” so something plain, minimalist or anything you think would show that you care about the world!!

ร่วมกันทำบุญไปกับเราอีกครั้ง โดยนำเสื้อผ้าหน้าหนาวที่ท่านมีอยู่ หรือจะซื้อให้ใหม่ก็ได้นะจ๊ะมาในวันงาน
เสื้อผ้าทั้งหมดนี้จะนำไปบริจาคให้แก่ผู้ด้อยทางภาคเหนือ โดยจะนำไปให้แก่ค่ายอาสาของ นักศึกษามหาวิทยาลัยธรรมศาสตร์ คณะเศรษฐศาสตร์ภาคภาษาอังกฤษ และยังสามารถเป็น ส่วนลดราคาบัตรจาก 300 เหลือ 200 บาทอีกด้วย
มากันก่อน 3 ทุ่ม จัดเบียร์ไปสอง
หลังสามทุ่ม เอาไป 1 ขวดพอ
อย่าลืม! ขอย้ำ! การแต่งตัวให้ครั้งนี้เป็นธีม ช่วยเหลือโลกร้อน ขอแบบสบายๆ เรียบๆ ชิวๆ minimal เข้าไว้นะจ๊ะ!

Live bands: The Mousses, The Richman Toy, Saliva Bastards

Expect: Indierock, Garage rock, Electrorock, Rock n' roll from the 50s onward by DJ Bingii (Specialization)

(โปสเตอร์ครั้งที่แล้ว ที่ YeSindie)

[ ลิงก์ ItsBlogParty | ผ่าน momokomotion ]

technorati tags: , ,

2007-10-19

Three Laws of Thais (fictional)

[เรื่องแต่ง]

กฎสามข้อของหุ่นยนต์ (ตามที่ ไอแซค อาซิมอฟ เสนอ)

1. ต้องปกป้องมนุษย์
2. ต้องเชื่อฟังมนุษย์ เว้นแต่จะขัดกับกฎข้อ 1
3. ต้องป้องกันตัวเอง เว้นแต่จะขัดกับกฎข้อ 1 หรือ 2

(หมายเลขข้อ เป็นลำดับก่อนหลัง)

ภายหลังได้เพิ่มกฎข้อที่ศูนย์เข้าไป (จิสการ์ดเริ่มคิด และดานีลขบจนสำเร็จ) และปรับกฎที่เหลือ กลายเป็น

0. ต้องปกป้องมนุษยชาติ
1. ต้องปกป้องมนุษย์ เว้นแต่จะขัดกับกฎข้อ 0
2. ต้องเชื่อฟังมนุษย์ เว้นแต่จะขัดกับกฎข้อ 0 หรือ 1
3. ต้องป้องกันตัวเอง เว้นแต่จะขัดกับกฎข้อ 0, 1 หรือ 2

[คำอธิบายคือ หากไม่มีมนุษยชาติ ก็ไม่มีที่เหลือ]

----

กฎสามข้อของคนไทย (ตามที่ บทบรรณาธิการโพสต์ทูเดย์ 11 ต.ค. 2550 เสนอ)

1. ต้องปกป้องสถาบันชาติ
2. ต้องปกป้องสถาบันศาสน์
3. ต้องปกป้องสถาบันกษัตริย์

(หมายเลขข้อใส่ไว้เพื่ออ้างอิง ไม่ได้เป็นลำดับก่อนหลัง)

ดานีล*อาจคิดว่าควรจะมีกฎข้อที่ศูนย์ด้วย

0. ต้องปกป้องสถาบันประชาชน

[ด้วยคำอธิบายเดียวกัน]


----

*หมายเหตุ: ทั้ง ห. ดานีล โอลิวาล์ว และ ห. จิสการ์ด ราเวนตอล์ฟ เป็นหุ่นยนต์ไร้สัญชาติ – ไม่ใช่ทั้งคน ไม่ใช่ทั้งไทย — ถ้าคิดตามบทบรรณาธิการฯ ดังกล่าวก็คือ ไม่มีทางเข้าใจประเทศไทยอันแสนพิเศษนี้ดอก




ติดตามนิยายวิทยาศาสตร์คสาสสิกของ ไอแซค อาซิมอฟ และนักเขียนท่านอื่น ๆ ได้ในงานหนังสือ 17-28 ตุลานี้ครับ ศูนย์ประชุมแห่งชาติสิริกิติ์ บูท W02 โซนเอทเรียม มีเรื่องแปลเรื่องใหม่ออกมาแล้วด้วยคือ “วาทกะแด่ผู้ล่วงลับ” (ชื่ออังกฤษ: Speaker for the Dead - ภาคต่อของ Ender's Game) แปลโดย อ.ยรรยง เต็งอำนวย เช่นเคย

Speaker for the Dead book cover

และสำหรับผู้สนใจ พูดคุยเรื่องนิยายวิทยาศาสตร์ได้ที่เมลกลุ่ม secondfoundation#googlegroups.com



โพสต์นี้ เพื่อสนับสนุน ‘อรพิณ ยิ่งยงพัฒนา’ ผู้เขียนบทความ 'สื่อ' ที่เสนอให้จำกัดเสรีภาพ? ตอบกลับบทบรรณาธิการโพสต์ทูเดย์ วันที่ 11 ตุลาคม พ.ศ. 2550
และสนับสนุนบทความดังกล่าว ด้วยการ
“ขอยืนหยัดคัดค้าน[บทบรรณาธิการโพสต์ทูเดย์]อย่างสุดกำลัง”

technorati tags: , ,

ISO 11940 - Transliteration of Thai

ระหว่างหาข้อมูลแก้บั๊ก Thai (URL) romanization ใน DokuWiki (ซึ่งที่แลบกำลังจะเปลี่ยนไปใช้) ก็ไปเจอนี่

ISO 11940 - Transliteration of Thai

เขาใช้ตัวอักษรละตินเป็นพื้น แล้วก็มีขีดโน่นขีดนี่เพื่อแยกย่อยตัวอักษรลงไปอีก หน้าตาก็จะประมาณตัวละตินที่ใช้เขียนภาษาเวียดนาม หรือตุรกี ทำนองนั้น

ISO 11940

เท่าที่ดู ISO 11940 นี่ เป็นการถอดรูปตัวสะกด ไม่ใช่การถ่ายเสียงอ่าน เช่น (ตัวอย่างจากวิกิพีเดีย):
[ถ่ายเสียงตามราชบัณฑิตฯ ← เขียนด้วยตัวอักษรไทย → ถอดรูปตาม ISO 11940]

Phasa Thai ← ภาษาไทย → p̣hās̛̄āịthy

Chiang Mai ← เชียงใหม่ → echīyngıh̄m̀

ดูแล้วเพี้ยน ๆ ดี - -"

CLDR ก็เอามาตรฐาน ISO 11940 นี้ไปปรับใช้เหมือนกัน

technorati tags: , , ,

Unicode CLDR 1.5 Released

สมาคมยูนิโคดออก CLDR รุ่น 1.5 แล้ว (เมื่อสามเดือนที่แล้ว - วันที่ 31 ก.ค. 2550)

CLDR (Common Locale Data Repository) เป็นฐานข้อมูลข้อมูลท้องถิ่น (locale data) สำหรับนำไปดัดแปลงซอฟต์แวร์ให้ทำงานได้เข้ากับแต่ละภาษาและท้องถิ่น ตัวอย่างข้อมูลที่ CLDR มีให้ เช่น รูปแบบวันที่ เวลา เขตเวลา ตัวเลข ค่าเงิน การเรียงลำดับข้อความ ฯลฯ

CLDR 1.5 มีข้อมูลสำหรับ 135 ภาษาและ 149 พื้นที่ หรือนับเป็นทั้งหมด 394 ชุดข้อมูลท้องถิ่น และมีข้อมูลมากกว่ารุ่นที่แล้วถึง 42% โดยข้อมูลทั้งหมดมาจากผู้ร่วมโครงการกว่า 160 ราย โดยรายหลักมี Adobe, Apple, Google, IBM, Sun และตัวแทนจากหลายประเทศ ซึ่งรวมถึงอาสาสมัครทั่วโลกด้วย (สำหรับประเทศไทย มีพี่สัมพันธ์ ระรื่นรมย์ เจ้าเก่า, คุณณิชชา กำโชคภัทรพร, และคุณสุวิทย์ ศรีวิไลฤทธิ์ เข้าร่วม — เห็นพี่สัมพันธ์เคยมาถาม ๆ ในอีเมลกลุ่มของ LTN/Thai Linux Working Group อยู่บ้าง)

CLDR เดิมเป็นโครงการของ OpenI18N โดยมีสมาชิกก่อตั้งคือ IBM, Sun และ OpenOffice.org ก่อนที่ยูนิโคดจะรับเข้าเป็นโครงการในความดูแล (ตั้งแต่ CLDR 1.1)

ตัวอย่างแพลตฟอร์มที่รองรับ CLDR เช่น .NET Framework และ Java platform ส่วนโปรแกรมที่นำไปใช่ ก็เช่น OpenOffice.org (แน่นอน)

ดูข้อมูลเพิ่มเติมได้ที่ http://unicode.org/cldr/ และ Wikipedia

technorati tags: , ,

2007-10-16

Web Accessibility Thailand

update: คุณ iake แนะนำมา:
TotalValidator สำหรับตรวจสอบความถูกต้องของโครงสร้างหน้าเว็บ

WCAG2.0?

การใช้สีตัวอักษรกับสีพื้นหลังที่ไม่กลมกลืนกันจนเกินไป
การใช้แท็ก HTML ที่ถูกต้องตรงกับจุดประสงค์ของแท็ก
การระบุคำอธิบายเพิ่มเติม เพื่อช่วยโปรแกรมอ่านหน้าจอที่คนตาบอดใช้ (เช่นในแอตทริบิวต์ alt ในแท็ก img)
ฯลฯ

เหล่านี้จะช่วยให้ข้อมูลบนอินเทอร์เน็ต สามารถเข้าถึงได้โดยเสมอภาคและเท่าเทียมกัน ไม่ว่าจะสภาพทางกายของผู้ใช้จะอย่างไร ... ซึ่งเป็นไปตามหลักสิทธิขั้นพื้นฐาน (และได้รับรองไว้ในรัฐธรรมนูญ)

“การเลือกปฏิบัติโดยไม่เป็นธรรมต่อบุคคล เพราะแห่งความแตกต่างในเรื่อง ถิ่นกำเนิด เชื้อชาติ ภาษา เพศ อายุ สภาพทางกาย หรือสุขภาพ สถานะบุคคล ... จะกระทำมิได้”

ลองตรวจสอบดูว่า เว็บของคุณ ของหน่วยงานของคุณ ขององค์กรที่คุณติดต่อ สามารถเข้าถึงได้โดยทุกคนอย่างเสมอภาคและเท่าเทียมกันหรือไม่
โดยใช้เครื่องมือง่าย ๆ ที่:
http://astec.nectec.or.th/web_check/
(ลองแจ้งผลมาดูกันหน่อย ว่าเป็นอย่างไร แล้วลองบอกผู้ดูแลเว็บนั้นถึงเรื่องนี้)

(หรือใช้ http://www.totalvalidator.com/
คุณ iake แนะนำมา ตัวนี้ตรวจได้หลายหมวด ทั้ง web accessibility, HTML, ตัวสะกด ฯลฯ)

โดยเมื่อคลิกเพื่อตรวจหน้าเว็บแล้ว ระบบจะแจ้งให้โดยละเอียดว่า มีจุดไหนบ้างของหน้าเว็บ ที่ไม่ตรงตามข้อกำหนดหรืออาจก่อปัญหาในการเข้าถึงได้ พร้อมมีคำแนะนำในการปรับปรุง

Web Accessibility check overview
สรุปการตรวจสอบ

Web Accessibility check details
รายละเอียดจุดที่ไม่ตรงกับข้อกำหนด

เว็บนี้จัดทำโดย ศูนย์วิจัยและพัฒนาเทคโนโลยีสิ่งอำนวยความสะดวกสำหรับคนพิการ (ASTEC) เนคเทค

ที่ ASTEC ยังมีเอกสารเผยแพร่เกี่ยวกับ web accesibility และ accessibility ทั่วไป ที่น่าสนใจ ให้ศึกษาอีกเป็นจำนวนมาก
เช่น หลักการออกแบบที่เป็นธรรมสำหรับเทคโนโลยีสารสนเทศ, การใช้ CSS เพื่อให้ทุกคนเข้าถึงเว็บได้, Flash ที่ทุกคนเข้าถึงได้

สำหรับตัวข้อกำหนดด้าน web accessibility ระดับสากล ดูได้ที่ Web Content Accessibility Guidelines (WCAG)


เรื่อง accessibility นี้แน่นอนว่าครอบคลุมไปถึง พระราชบัญญัติข้อมูลข่าวสารของราชการ พ.ศ. 2540 (และทุก ๆ เรื่อง) ด้วย ดังนั้นในกรณีที่ประชาชนผู้พิการหรือทุพลภาพมีความต้องการจะเข้าถึงข้อมูลข่าวสารของราชการ รัฐก็ต้องมีหน้าที่จัดหาและอำนวยความสะดวกให้ประชาชนรายนั้น ได้เข้าถึงข้อมูลได้เท่าเทียมกับผู้มีสภาพทางกายครบถ้วนอย่างเสมอกันเช่นกัน โดยไม่มีข้อยกเว้น

อ่านต่อ

วันทนีย์ พันธชาติ: เทคโนโลยีสารสนเทศเพื่อพัฒนาคุณภาพชีวิตของคนพิการ
อธิบายและให้ภาพกว้างเพื่อความเข้าใจเกี่ยวกับ สถานภาพคนพิการในประเทศไทย, การนำเทคโนโลยีสารสนเทศมาพัฒนาคุณภาพชีวิตของคนพิการ, และเทคโนโลยีสำหรับคนพิการประเภทต่าง ๆ
(ผู้เขียน ปัจจุบันเป็น ผู้อำนวยการ ASTEC)

mk: Accessibility for Disability
ประสบการณ์และความคิดในฐานะผู้ใช้และผู้พัฒนาคนหนึ่ง

ป.ล. เพิ่งเห็นในหน้าทีมงาน ว่าพี่คนนึงในที่เรียนเอกอยู่ที่สถาบัน ทำงานอยู่ที่แล็บ ASTEC ด้วย จุดไต้ตำตอ - -"

เพิ่มเติม (2008.03.06): ปกป้องทำ สไลด์แนะนำเรื่อง web accessibility เอาไว้ (เสนอในงาน BarCamp Bangkok ครั้งแรก)

[ ลิงก์ Web Accessibility Check | ผ่าน poakpong ]

technorati tags: , ,

2007-10-15

agents.mi.th

ถ้ากองทัพไทยจะลองเปลี่ยนลุค เอาให้ทันสมัย
ลองใช้ชื่อโดเมน agents.mi.th
;)

Agent Smith

บุกอินเทอร์เน็ต!

(ภาพประกอบจาก Flickr โดย jimmyroq ใช้ตามสัญญาอนุญาตครีเอทีฟคอมมอนส์ by-sa 2.0)

technorati tags:

JavaFX Script demo code

โค้ดตัวอย่าง JavaFX จาก Planet JFX
นาฬิกาเข็ม, ตัวดูรูป
ลองลอกตัวอย่างโค้ด JavaFX Script ในวิกิไปแปะในโปรแกรม JavaFXPad ดู มันจะโชว์แบบเวลาจริงเลย ว่ากำลังแก้กำลังทำอะไรอยู่

ดูจากไลบรารี/API ที่เตรียมมาให้แล้ว ซึ่งเรียกใช้ไลบรารีจาก Java SE และ Java ME ได้ กลุ่มเป้าหมายของ JavaFX Framework ก็น่าจะเป็น Rich Internet Application สำหรับอุปกรณ์พกพาระดับสมาร์ทโฟนขึ้นไป จนถึงเครื่องตั้งโต๊ะ ทั้งออนไลน์และออฟไลน์
หรือถ้าดูตามสเปคเครื่องแล้ว ก็คือตั้งแต่พวก CDC, CLDC, และ MIDP (มือถือส่วนใหญ่ตอนนี้ใช้ MIDP) ไปจนถึงเครื่องพีซีธรรมดา

สนใจเรื่องนี้ ติดตามได้ที่บล็อก deans4j

technorati tags: , ,

2007-10-14

criticism & lese majeste case (well, again)

นายประจิณ แสดงความเห็นต่อกรณีคดีหมิ่นพระบรมเดชานุภาพว่า คดีนี้น่ากลัว แต่ก็ท้าทาย เพราะคิดว่า คนไทยหลายคนอึดอัดกับคดีอย่างนี้เหมือนกัน น่าจะมีซักคนต่อสู้คดีนี้แบบยุติธรรมซักตั้ง

“โลกเปลี่ยนแล้วไม่ควรมีกฎหมายแบบนี้ ขนาดสมัยพระพุทธเจ้ายังไม่มีกฎหมายแบบนี้ ที่บอกว่าห้ามว่า ตอนที่ออกพรรษา พระพุทธเจ้ายังปวารณากับพระภิกษุ ว่าถ้ามีข้อบกพร่องให้พระภิกษุตำหนิได้ ขนาดพระพุทธเจ้ายังให้ตำหนิได้ ยุคสมัยนี้น่าจะคุยกันได้ ถ้าผิดก็ใช้กฎหมายหมิ่นประมาท ไม่ใช่ห้ามวิจารณ์เลย” นายประจิณ กล่าวและว่า จะลองดูกับคดีนี้ เพื่อให้เป็นประโยชน์กับคนไทยในภายภาคหน้า แต่เสี่ยงหน่อย

จากข่าว: กองปราบเรียกสอบ ‘พยาน’ คดีกระทู้ประชาไทอาจเข้าข่าย ‘หมิ่นฯ’

กฎหมายที่ประหลาดที่สุดในระบบกฎหมาย ในแง่ที่ว่า ผู้ฟ้องไม่จำเป็นต้องเป็นผู้เสียหายก็ได้ ใครอยากฟ้องก็ฟ้องได้เลย
ที่สุดกฎหมายนี้ก็เลยกลายเป็นเครื่องมือกลั่นแกล้งทางการเมืองมาโดยตลอด


ผมเห็นว่าประเทศนี้อ่อนแอเรื่องวัฒนธรรมการวิจารณ์เหลือเกิน
ตัวอย่างใกล้ ๆ ตัว ที่เห็นก็คือ มีอยู่ช่วงหนึ่งน่าจะครึ่งปีได้แล้ว ที่ผมเข้าดู ๆ ในวิกิพีเดียไทยบ่อยหน่อย
ผมเห็นผู้ใช้รายหนึ่งชื่อ patiwat พยายามจะแสดงความเห็นชี้แนะเกี่ยวกับบทความจำนวนหนึ่ง ทั้งเรื่องของความถูกต้องของข้อมูล เรื่องความน่าเชื่อถือ และการอ้างอิง
บ่อยครั้ง ที่เสียงตอบรับที่ได้จากคนกลุ่มหนึ่งในวิกิพีเดียไทย ถ้าไม่ใช่เทมเพลต {{ก็แก้ซะ}}
ก็จะเป็นคำถากถางเหน็บแนม หรือไม่ก็พฤติกรรมประหลาด ๆ
(ผมคิดว่าคนทำเขาก็คงจะมีเหตุผลมีตรรกะของเขา เพียงแต่ผมยังไม่รู้ไม่เข้าใจเท่านั้นเอง - อยากจะเข้าใจกันมากกว่านี้)

วิกิพีเดีย เป็น สารานุกรม-เสรี ที่ได้รับอิทธิพลแนวคิดอย่างมากมาจากวัฒนธรรมโอเพนซอร์ส/ซอฟต์แวร์เสรี
(กระทั่งตัวสัญญาอนุญาตที่วิกิพีเดียเลือกใช้ ก็ริเริ่มโดยมูลนิธิซอฟต์แวร์เสรี)
แน่นอนว่า ในวัฒนธรรมโอเพนซอร์ส/ซอฟต์แวร์เสรี เราให้ความสำคัญกับการลงมือทำอย่างมาก ใครอยากได้อะไรก็ลงมือทำเอาเอง

“show me the code”

แต่ก็ชุมชนโอเพนซอร์ส/ซอฟต์แวร์เสรีนี้แหละ ที่ให้ความสำคัญกับการติชมอย่างตรงไปตรงมาเช่นกัน

“given enough eyeballs, all bugs are shallow”
“ขอให้มีสายตาเฝ้ามองมากพอ บั๊กทั้งหมดก็เป็นเรื่องง่าย”

เราจะรู้ได้อย่างไรว่าโค้ดนี้ทำงานได้ดีหรือไม่ ถ้าเราไม่ฟังเสียงวิจารณ์ติชม ? เราจะแก้บั๊กซอฟต์แวร์กันอย่างไร ถ้าไม่มีคนแจ้งว่ามีบั๊ก ?


ผมไม่รู้ว่าสังคมไทยทั่วไปมีทัศนคติอย่างไร กับการวิพากษ์วิจารณ์ หรือเห็นว่า การวิพากษ์วิจารณ์ ก็เป็นเหมือนกับการ “เอาเท้าราน้ำ” ในสุภาษิต “มือไม่พายอย่าเอาเท้าราน้ำ” ? ไม่ทำก็ห้ามวิจารณ์ ?

ท่าทีบางส่วนในสังคมออนไลน์ที่ผมเจอมา ดังกล่าวไปข้างต้น กับท่าทีหลายอย่างของรัฐที่เจอในข่าว รวมถึงท่าทีของคนในระบบยุติธรรมไทยบางคนที่ฟ้องปิดเว็บ ThaiJustice.com เพราะหาเว็บนั้น 'หมิ่นศาล' เนื่องจากไปวิพากษ์วิจารณ์การทำงานของศาล ทำให้ผมอยากจะเชื่อว่าสังคมไทย โดยเฉพาะคนในระบบราชการ-อนุรักษนิยม คงจะรับไม่ได้กับการวิพากษ์วิจารณ์จริง ๆ

อย่างไรก็ตาม สกว.ทำให้ผมสบายใจขึ้นมาบ้าง เพราะดูแล้วคงจะไม่ได้คิดอย่างนั้นแน่ อีกทั้งยังเห็นความสำคัญของการวิจารณ์ จึงได้สนับสนุนโครงการวิจัยเกี่ยวกับวัฒนธรรมการวิจารณ์ในสังคมไทยมาอย่างต่อเนื่อง ตั้งแต่ปี พ.ศ. 2542 พร้อมทั้งตีพิมพ์หนังสือในชุดนี้ออกมาเป็นจำนวนมาก ก็ขอให้โครงการบรรลุผลดังที่ตั้งไว้ด้วยเถอะครับ ผมเอาใจช่วย!


จะทำ ก็ต้องพร้อมถูกวิจารณ์

ถ้าไม่พร้อมถูกวิจารณ์ ก็ไม่ควรจะมีสิทธิ์ได้ทำอะไร

จะเอาแค่อย่างใดอย่างหนึ่งไม่ได้ มันต้องมาคู่กัน

ถ้าจะมีอำนาจ ก็ต้องพร้อมมี ความรับผิด (accountability) ความรับผิดชอบ (responsibility) และพร้อมถูกวิพากษ์วิจารณ์ ซึ่งรวมถึงในสื่อและในงานวิชาการด้วย

พวก ultra-royalist น่าจะคิดตรงนี้เสียบ้าง

technorati tags: , ,

14 October 2007 / today

วันนี้ 14 ตุลา

ไม่มีอะไรเปลี่ยนแปลงนัก

อุดมการณ์ “เสรีภาพ เสมอภาค” ถูกบิดเบือนไปเป็น “สมานฉันท์”
คนเราจะสมานฉันท์กันได้อย่างไร ถ้าไม่ได้อยู่บนพื้นฐานของความเสมอภาค
“สมานฉันท์” เพื่อกด เพื่อหยุด โครงสร้างลำดับชั้นของสังคม, ที่ไม่เสมอภาค, ให้แช่แข็งอยู่อย่างนั้น ?

แนวรบใหม่ในพื้นที่เสมือน สู้กันหนักขึ้น ด้วยชุดพ.ร.บ.ไฮเทค ...

technorati tags: ,

2007-10-13

edit PDF metadata using pdftk

แก้เมตาดาตา (อภิข้อมูล/ข้อมูลที่อธิบายข้อมูล) ด้วย pdftk
ง่ายมาก ๆ (แม้ทุกอย่างจะเป็นคอมมานด์ไลน์ก็เถอะ)

ก่อนอื่นไปดาวน์โหลด pdftk ก่อน
(เป็นซอฟต์แวร์เสรีด้วยนะ ฟรี — ถ้าใครใช้ Ubuntu ก็ sudo apt-get install pdftk ได้เลย, สำหรับ Windows ก็ดาวน์โหลดไฟล์ .exe มาใช้ได้เลย ไม่ต้องติดตั้ง)

แล้วทำตามนี่เลย Setting PDF Metadata

ขั้นตอนโดยคร่าวก็คือ สกัดเมตาดาตาออกมาเก็บไว้ในไฟล์ข้อความก่อน
จากนั้นก็ไปแก้ไฟล์ข้อความนั้นจนพอใจ (ตามฟอร์แมตที่กำหนด เป็นคู่ของ InfoKey และ InfoValue)
แล้วสุดท้ายก็เขียนเมตาดาตาใหม่ จากไฟล์ข้อความที่ปรับปรุงแล้ว

ตัวอย่างไฟล์ PDF ที่ผ่านการแก้ไขเมตาดาตาโดย pdftk


โปรแกรม pdftk เป็น command-line front-end ของไลบรารี iText ซึ่งเป็นไลบรารีสำหรับสร้างและแก้ไขไฟล์ PDF เขียนด้วย Java ... เพื่อความสะดวก pdftk ใช้วิธีคอมไพล์ iText ด้วย gcj ให้เป็น native code แล้วเอามาลิงก์กับโปรแกรม pdftk ซึ่งเขียนด้วย C++

นอกจากจะใช้แก้เมตาดาตาอย่างตัวอย่างข้างบนแล้ว ยังสร้างใช้ pdftk ในการแยกหน้า รวมหน้า หมุนหน้า ฯลฯ ได้ด้วย ลองดูตัวอย่างการใช้

สำหรับคนที่จะเขียนโปรแกรมอ่านเขียน PDF:
iText นี่ใช้สำหรับสร้างและแก้ไข ส่วนถ้าจะอ่าน/parse ให้ใช้ PDFBox
... PDF Processing (is) Fun

technorati tags: ,

how to spot Alien

พรุ่งนี้ว่าจะไปดูหนัง Helvetica
หนัง typography ในวาระครบรอบ 50 ปี ตัวพิมพ์ Helvetica

วันนี้ไปเดิน ๆ ดูนิทรรศการมาแล้วรอบนึง แบบผ่าน ๆ ที่เวิลด์เทรดเซ็นทรัลเวิลด์ อยู่ข้างหน้า B2S / Playground เลย ที่เอาหนังมาฉายนี่ เป็นส่วนหนึ่งของเทศกาลออกแบบกรุงเทพ 2550 ซึ่งมีหลายงานย่อย ๆ เยอะแยะ ไปทั้งเดือนตุลานี้เลย

แบบว่าเพื่อเป็นการเตรียมตัวในการไปดูหนังวันพรุ่งนี้ เลยค้น ๆ เน็ต เจอนี่
How to spot Arial
สนุกดี เขาชี้ข้อแตกต่างระหว่าง Helvetica (1957) กับ Arial (1982) ซึ่งดูเผิน ๆ คล้ายกันมาก

Helvetica 'R' vs Arial 'R'
(Helvetica แดง / Arial ฟ้า)

อย่างที่สังเกตง่าย ๆ เลยน่าจะเป็นตัว R ที่ของ Helvetica จะเกือบดิ่ง ๆ ลงแล้วมีขางอนขึ้น ส่วน Arial จะเป็นเฉียง ๆ ลงมาเป็นแนวเดียว
ตัว t ที่ของ Helvetica ปลายบนสุดจะตัดตรง แต่ Arial จะตัดเฉียง
ตัว G ที่ของ Helvetica จะมีติ่งยื่นลงมาด้านขวา แต่ Arial ไม่มี
... ยังไงลองตามลิงก์ไปดูครับ

[to anpanpon: เสียใจด้วยแก พรุ่งนี้โต๊ดกับรินก็จะไปดู วะฮ่ะ]

technorati tags: ,

2007-10-12

14 October 2007 / seminar

ข่าวจาก โครงการเอเชียตะวันออกเฉียงใต้ศึกษา มหาวิทยาลัยธรรมศาสตร์ ครับ

ขอเชิญร่วมฟังการอภิปราย
“เจตนารมณ์ 14 ตุลา ในสถานการณ์ปัจจุบัน”

เสาร์ 13 ตุลาคม 2550
13.00-16.00 น.
ณ ห้องอดุลย์ วิเชียรเจริญ ชั้น 2 คณะศิลปศาสตร์ (ศศ.201)
มหาวิทยาลัยธรรมศาสตร์ ท่าพระจันทร์

ร่วมอภิปรายโดย จาตุรนต์ ฉายแสง, นิธินันท์ ยอแสงรัตน์, วิจิตร ศรีสังข์

ดำเนินการอภิปรายโดย จรัล ดิษฐาอภิชัย

จัดโดย โครงการเอเชียตะวันออกเฉียงใต้ศึกษา คณะศิลปศาสตร์ มธ. ร่วมกับ กลุ่มเพื่อนรัฐธรรมนูญ 2540

(ไม่เสียค่าใช้จ่าย)

สำรองที่นั่ง 0-2613-2672, 0-2613-2599

technorati tags: ,

2007-10-11

Thammasat University international students 2006-2007

ทดสอบความรู้ HTML table — Tables in HTML documents, HTML 4.01 (W3 Recommendation)
นอกจากตัวนี้แล้ว ก็ยังมี Tables modules ใน XHTML2 (W3C Working Draft) และ Tabular data ใน HTML 5.0 (working draft) ที่อ่านแล้ว งง เอาไว้ก่อน - -"

และในโอกาสที่สภามหาวิทยาลัยธรรมศาสตร์อนุมัติจัดตั้ง “วิทยาลัยนานาชาติปรีดี พนมยงค์” เราก็จะเอาข้อมูลนักศึกษานานาชาติของมธ.มาเล่นกัน — Data taken from TU's Office for International Affairs


Table 1. Number of international students by field of study
Organization/Field of study Number of students
Total (17 fields of study) 309
Office of International Affairs 90
Thai Studies (TS) 90
Commerce and Accountancy 89
Business Administration (BBA) 87
Finance (MIF) 1
Marketing (MIM) 1
Sirindhorn International Institute of Technology 71
Communication 14
Civil Engineering 13
Common and Graduate Studies 10
Management Technology 9
Mechanical Engineering 9
Chemical Engineering 8
Industrial Engineering 8
Economics 23
Economics (BE) 23
Political Science 20
International Relations (MIR) 20
Liberal Arts 12
British and American Studies (BAS) 11
Southeast Asian Studies (SEAS) 1
Engineering 4
Civil Engineering 2
Mechanical Engineering 2

Table 2. Number of international students by continents
Continent Number of students
Americas 128
Belize, Canada, Mexico, USA
Europe 110
Austria, Belgium, Denmark, Finland, France, Germany, The Netherlands, Norway, Spain, Sweden, Switzerland, United Kingdom
Asia 65
Bangladesh, Burma, Cambodia, China, Egypt, India, Laos, Malaysia, South Korea, Sri Lanka, Taiwan, Uzbekistan, Vietnam
Oceania 5
Australia
Africa 1
Morocco

Table 3. Top 10 countries of where international students came from
Country Number of students
USA 112
Japan 24
Denmark 21
Germany 21
France 15
Sweden 13
Canada 12
Finland 11
Taiwan 11
Norway 7

ป.ล. [HTML table] เพิ่งรู้ว่า table มี tbody ได้หลายอัน และ tfoot ต้องมาก่อน tbody (ซึ่ง make sense เพราะตัวรับข้อมูลควรจะรู้ข้อมูลเกี่ยวกับตารางให้ครบทั้งหมดก่อน ก่อนจะรับข้อมูล tbody ที่เหลือ ซึ่งอาจจะใหญ่มาก ๆ) — ลองกดดูซอร์สโค้ด

technorati tags: , , ,

2007-10-10

reflexelfer

ในวาระครบรอบหนึ่งปีที่เมืองไทย (และในโอกาสที่บังเอิญได้ของดีมาชิ้นหนึ่ง) ผมมีความยินดีที่จะแลกเปลี่ยนเรียนรู้ และสำรวจตรวจตราตนเอง (be reflexive) กับเพื่อนๆ ทุกคน-ที่หลงเข้ามาในพื้นที่แห่งนี้

จากข้อเขียนที่ได้อ่าน ความคิดที่ได้สัมผัส หรืออากัปกริยาเมื่อได้พบเจอกัน
ผมใคร่รู้สิ่งที่ไม่ดี ไม่เหมาะ ไม่ควร ไม่ชอบ ฯลฯ ของตัวผม ในความคิดมุมมองของคุณ
(กิจกรรมนี้ผมเคยทำเมื่อตอนไปเขาชนไก่กับเพื่อน ๆ ที่โรงเรียนเมื่อนานมาแล้ว นัยว่าเลียนแบบมาจากที่สงฆ์เขาทำกันเมื่อเข้าพรรษา)

เยอะครับ นอกจากเรื่องโลเล เอาแน่เอานอนไม่ได้ มาสายประจำแล้ว ก็ยังมีอีกสารพัดจุกจิก ขวางหูขวางตา งี่เง่าไม่เข้าท่าอีกเยอะ

พิมพ์ส่งกันมาได้หมด ในช่องความเห็นด้านล่างนี้ เพื่อทุกคนได้อ่าน
(หรือหากไม่สะดวก อยากให้ผมอ่านเป็นการส่วนตัว ส่งเมลมาที่ art *at* siit /dot/ net)

แน่นอน ดังที่สงฆ์ท่านปฏิบัติ ใด ๆ ที่กล่าวตักเตือนกันนี้ ผมถือเป็นประโยชน์ต่อตัวผม และจะไม่ถือโทษโกรธใด ๆ เด็ดขาด

และด้วยความขอบคุณมาก ๆ ที่ทุก ๆ คน จะช่วยว่ากล่าวตักเตือน วิพากษ์วิจารณ์ แสดงความคิดเห็นรู้สึกกัน ... ในโอกาสนี้ ผมขอมอบหนังสือ
“ค่อนศตวรรษประชาธิปไตยไทย ที่เต็มไปด้วยขวากหนาม” (โดย ส.ศิวรักษ์ - หนังสือที่กำลังถูกแบนอยู่ตอนนี้); และ
“20 ปี ปาฐกถาพิเศษ ป๋วย อึ๊งภากรณ์” (จัดพิมพ์โดย คณะเศรษฐศาสตร์ มหาวิทยาลัยธรรมศาสตร์)
แก่สองความเห็นที่จริงใจจนแทงใจดำ ทำผมมือสั่น พลันจะร้องไห้ด้วยความตื้นตันได้มากที่สุด :)
(เป็น ‘ของขวัญ’ ไม่ใช่ ‘รางวัล’ — นี่ไม่ใช่การประกวดนะ)

เปิดรับไปเรื่อย ๆ จนหมด เดือนตุลา นี้ละกัน :D
... เรียนเชิญ

(จะถูกสันติบาลจับไหมนี่ ? :P)

ป.ล. เรื่องที่อยู่จัดส่ง เดี๋ยวจะติดต่อกันทีหลัง ต่างประเทศก็ส่ง ขอให้ไปรษณีย์ไปถึงเถอะ

technorati tags: ,

2007-10-09

nothing (on earth) can escape the gravity

(ต่อจาก What is LOVE ? เมื่อวาน)

“ ไม่ว่า Ultra-royaliste [‘ผู้เกินกว่าราชา’] จะเจตนาหรือไม่ก็ตาม ประวัติศาสตร์ฝรั่งเศสบอกเราว่า สถาบันกษัตริย์กลับมามีอำนาจก็ด้วย Ultra-royaliste และ สถาบันกษัตริย์ต้องล่มสลายไปตลอดกาลก็ด้วย Ultra-royaliste อีกเช่นกัน ”

— ปิยบุตร แสงกนกกุล, Ultra-royaliste กับการฟื้นฟูและล่มสลายของกษัตริย์ฝรั่งเศส, onopen.com

ความพยายามที่จะเพิ่มอำนาจสถาบัน และความพยายามที่จะยกบุคคลบางจำพวกให้มีฐานะใกล้เคียงสถาบัน กลับจะยิ่งทำให้สถาบันเสื่อมลง จนถึงจุดที่ไม่อาจคืนย้อนกลับ...


ข่าว (Thailand plans tougher lese majeste law): รอยเตอร์, ประชาไท, ไทยรัฐ

ร่างพ.ร.บ. (เสนอพรุ่งนี้ - 10 ตุลา): ขยายกม.หมิ่นฯ คลุมองคมนตรี, ห้ามเสนอข่าวคดีหมิ่นฯ

ข้อมูลกฎหมายหมิ่นพระบรมฯ เปรียบหลายประเทศ โดย รอยเตอร์

[ ผ่าน Etat de droit, mk, FACT ]

technorati tags: , ,

2007-10-08

What is LOVE ?



ดาวน์โหลด “ภาคที่ 1 สถาบันกษัตริย์กับรัฐธรรมนูญ”
จากหนังสือ “ค่อนศตวรรษประชาธิปไตยไทย ที่เต็มไปด้วยขวากหนาม” โดย ‘ส.ศิวรักษ์’
พิมพ์ครั้งที่ 1 พ.ศ. 2550 สำนักพิมพ์ศึกษิตสยาม ISBN 974768649X

http://factdata.googlepages.com/sulaksa.pdf

(รวบรวมเป็นเอกสารอิเล็กทรอนิกส์โดย คนชายขอบ / ขอบคุณสันติบาล ที่ทำให้ผมรู้จักหนังสือเล่มนี้)


เราจะรักกันแบบไหนดี
โบราณ(ใครก็ไม่รู้ ที่เราชอบอ้าง)ท่านว่า รักวัวให้ผูก รักลูกให้ตี
คือมีอะไรก็ต้องว่ากล่าวตักเตือนกัน สอนกัน วิพากษ์วิจารณ์กันได้

ก็ถามตัวเองกันแต่ละคน เรารักกันจริง ๆ รึเปล่า ?

ชาติ ศาสนา พระมหากษัตริย์ เรารักกันแบบไหน

รักชาติ ด้วยการยืนเคารพธงชาติ ด้วยการแซ่ซ้องสรรเสริญชาติ ชาติฉันดีกว่าใคร ๆ วิเศษกว่าใคร ๆ (ไอ้เจ๊ก ไอ้ลาว ไอ้ฝรั่งขี้นก ฯลฯ)

รักศาสนา ด้วยการยกมือไหว้รูปบูชา ด้วยการยกให้ศาสนานั้นนี้เป็นศาสนาประจำชาติ ด้วยการปฏิเสธการวิพากษ์ทั้งหลาย ไม่ว่าจะเป็นข้อคิดข้อเขียน หรือกระทั่งงานศิลปะ

รักกษัตริย์ ด้วยการยืนเคารพเพลงสรรเสริญ ด้วยการอ้างกษัตริย์ในทุกกิจกรรม-จนกลายเป็นเครื่องมือทางการตลาด (ที่คณะรัฐประหารก็ยังเลือกใช้) ด้วยการปฏิเสธการวิพากษ์ใด ๆ โดยไม่คำนึงถึงแม้เจตนา

สังคมพิธีกรรม

คนบางพวก ก็เข้าใจจิตวิทยามวลชน สร้างสรรค์ความเชื่อ
ต้องรักแบบเดียววิธีเดียวกับที่ฉันรัก รักแบบไหนวิธีไหนที่ผิดแผกไปจากนี้ เรียกว่าไม่รัก
ฉันเป็นคนกำหนดนิยาม “ความรัก”
ถ้าไม่รักแบบที่ฉันกำหนด ก็อยู่คนละพวกกับฉัน และเป็นคนดีไม่เท่าฉัน เป็นคนชั่ว

เมื่อการแสดงความรัก เป็น พิธีกรรม
คนนิยามการแสดงความรัก เป็น ศาสดา
“ความรัก” คืออะไร ก็ไม่สำคัญแล้ว
อย่าตั้งคำถามกับศาสดา เจ้าคนบาป

ก็รักแบบนี้กันนี่เอง ที่ยิ่งรัก ก็ดูจะยิ่งเสื่อม


หมายเหตุ: ขณะนี้กำลังมีการแก้กฎหมายอาญา
(1) ให้ขยายการหมิ่นพระบรมฯ ให้รวมไปถึง พระราชโอรส พระราชธิดา ประธานองคมนตรี องคมนตรี และผู้แทนพระองค์ ; และ
(2) ให้อำนาจศาลในการสั่งห้ามให้มีการโฆษณาข้อเท็จจริง พฤติการณ์ต่าง ๆ การวิพากษ์วิจารณ์ หรือความเห็นเกี่ยวกับคดีความผิดต่อพระมหากษัตรดิย์ พระราชินี รัชทายาท หรือผู้สำเร็จราชการแทนพระองค์ – เสนอข่าวก็ไม่ได้
(กดที่หมายเลขเพื่อดาวน์โหลดร่างพ.ร.บ.แก้ไขเพิ่มเติมฯ)

ถาม ถ้าศาลไม่ต้องการให้พูดข้อเท็จจริง แล้วศาลต้องการอะไร ?

(เพิ่มเติมต่อที่ nothing can escape the gravity — เมื่อการยกย่องอะไรมากเกินไป กลับนำไปสู่การเสื่อมของสิ่งนั้น)

[ ลิงก์ ประชาไท | ผ่าน คนชายขอบ ]

technorati tags:

Remember, Remember the Sixth of October

สัปดาห์ที่ผ่านมามีเรื่องครบรอบหลายอย่าง ที่เกี่ยวข้องกับชีวิตผม

2 ตุลา .. 26 ปีที่แล้ว วันเกิดเพื่อนที่เจอกันที่เบอร์ลิน

3 ตุลา .. 17 ปีที่แล้ว วันรวมชาติเยอรมัน “Tag der Deutschen Einheit” หลังจากกำแพงเบอร์ลินพังลง

4 ตุลา .. ปีที่แล้ว ผมลาเบอร์ลิน

5 ตุลา .. ปีที่แล้ว ถึงกรุงเทพ ไปงานแต่งงานเพื่อนที่เจอกันที่เอดินบะระ-จบธรรมศาสตร์รุ่นเดียวกัน

6 ตุลา .. 31 ปีที่แล้ว ที่ธรรมศาสตร์ สังหารหมู่นักศึกษาและประชาชน

7 ตุลา .. 58 ปีที่แล้ว “Tag der Republik” วันก่อตั้ง DDR เยอรมนีตะวันออก ที่ ๆ ผมเคยทำงาน

จริง ๆ แล้วผมเป็นคนขี้ลืม

technorati tags: , ,

2007-10-07

Economic Lecture Series #1

ซีรี่ส์บรรยายเศรษฐศาสตร์ครั้งที่ 1:
“การปฏิรูปการเมืองไทย: บทวิเคราะห์เชิงเศรษฐศาสตร์สถาบัน”

โดย อ.ปกป้อง จันวิทย์ (อาจารย์เศรษฐศาสตร์ มธ.)
ผู้ดำเนินรายการ: ผศ.ดร.ภูรี สิรสุนทร (อาจารย์เศรษฐศาสตร์ มธ.)

จันทร์ 8 ตุลาคม 2550
14:00 น.
ณ ห้องกิจกรรม หอสมุดป๋วย อึ๊งภากรณ์ มหาวิทยาลัยธรรมศาสตร์ ศูนย์รังสิต

หมายเหตุ: คณะเศรษฐศาสตร์ มหาวิทยาลัยธรรมศาสตร์ ร่วมกับ หอสมุดป๋วย อึ๊งภากรณ์ ที่ศูนย์รังสิต ร่วมกันจัด Economic Lecture Series เป็นประจำทุกเดือนในช่วงเปิดภาคการศึกษา


ดาวน์โหลด เอกสารประกอบการสัมมนาวิชาการประจำปี 2550 หนังสือรวมบทความสัมมนาที่แจกในงาน และไฟล์เสียง ได้ที่ http://www.econ.tu.ac.th/seminar

ไฟล์หนังสือรวมบทความทั้งเล่ม (แยก 4 ส่วน):
ส่วนที่ 1, ส่วนที่ 2, ส่วนที่ 3, ส่วนที่ 4

wp: institutional economics

technorati tags: , , , ,

2007-10-04

give name, guess nationality

เดาเชื้อชาติจากชื่อ-ที่สะกดในภาษาไทย
(ในเว็บเขียนไว้ว่างั้น แต่ถ้าดูที่ผลลัพธ์ มันน่าจะเป็นชื่อประเทศมากกว่านะ)

โครงการ (ซีเนียร์โปรเจกต์) ของนักเรียนกลุ่มนึงที่ภาค ลองเล่นดูครับ NC

https://kindml.siit.tu.ac.th/~kobkrit/nc/

ฐานข้อมูลจะมีชื่อไทย จีน ญี่ปุ่น เกาหลี อยู่ซะเยอะ นอกนั้นไม่ค่อยมาก จะเห็นว่าเดาผิดอยู่เป็นระยะ ๆ แต่สอนโปรแกรมมันได้นะครับ ถ้าผิดก็บอกมัน มันก็จะค่อย ๆ เรียนรู้ไปครับ

(ใส่ชื่อตัวเอง แล้วเค้าบอกว่าเราเป็น อิสราเอล ญี่ปุ่น - -")

นี่ผลลัพธ์ของผม (ยิ่งติดลบมาก แปลว่าโอกาสยิ่งน้อย) ใครได้อะไรยังไงบ้าง ? :)

Japan = -24.5005977488
Thailand = -26.0099782994
China = -34.1434349411
Malaysia = -54.4917107892

สงสัยยังเรียนไม่พอ :D


อีกตัวนึง จากกลุ่มเดียวกัน เป็นบริการ “ตัดหน่วยคำ” (TCC - Thai Character Cluster)
https://kindml.siit.tu.ac.th/~kobkrit/tcc/
ลองดูครับ

technorati tags: , ,

2007-10-03

YAiTRON/LEXiTRON "ancient" word

ถามวีร์และคนอื่น ๆ

ตอนนี้พยายามทำความสะอาด YAiTRON (LEXiTRON ฉบับ XML) เพิ่มเติมอยู่

ผมลองสั่งหาคำว่า “(คำโบราณ)” ในอีลีเมนต์ translation-similar ใน YAiTRON เจองี้ (ถ้าหาในอีลีเมนต์ translation เฉย ๆ จะเจอเยอะกว่านี้)

$ cat yaitron.xml | grep -n -e \<translation-similar.*\(คำโบ
832513:  <translation-similar lang="tha">ชาวเรือ, กะลาสี (คำโบราณ)</translation-similar>
947329:  <translation-similar lang="tha">(คำโบราณ) (ทางวรรณคดี)</translation-similar>
952697:  <translation-similar lang="tha">(คำโบราณ หรือทางวรรณคดี)</translation-similar>

อยากรู้ว่า เจ้าหมายเหตุว่า “(คำโบราณ)” หรืออะไรประมาณนี้เนี่ย มันควรจะไปเก็บอยู่ตรงไหนดีครับ ที่ตัวอีลีเมนต์ entry (ซึ่งเป็นอีลีเมนต์แม่ของ translation-similar) หรือว่าจะไปเก็บเป็นแอตทริบิวต์ของอีลีเมนต์ translation-similar หรือว่าอย่างอื่น ??
(ในสเปคปัจจุบันของ YAiTRON แนะนำให้เก็บหมายเหตุพวกนี้ลงอีลีเมนต์ชื่อ note แต่อยากให้มัน machine-readable อ่ะ)

เช่น ปัจจุบันเป็นงี้

<entry lang="eng">
 <headword>seafarer</headword>
 <translation lang="tha">คนเดินเรือ</translation>
 <translation-similar lang="tha">ชาวเรือ, กะลาสี (คำโบราณ)</translation-similar>
 <lexitron id="63739"/>
</entry>

ที่เสนอแบบที่ 1 (“คำโบราณ” บ่งชี้ “seafarer”):

<entry lang="eng" >
 <ancient>true</ancient>
 <headword>seafarer</headword>
 <translation lang="tha">คนเดินเรือ</translation>
 <translation-similar lang="tha">ชาวเรือ</translation-similar>
 <translation-similar lang="tha">กะลาสี</translation-similar>
 <lexitron id="63739"/>
</entry>

ที่เสนอแบบที่ 2.1 (“คำโบราณ” บ่งชี้ทุกคำใน translation-similar):

<entry lang="eng">
 <headword>seafarer</headword>
 <translation lang="tha">คนเดินเรือ</translation>
 <translation-similar lang="tha" ancient="true">ชาวเรือ</translation-similar>
 <translation-similar lang="tha" ancient="true">กะลาสี</translation-similar>
 <lexitron id="63739"/>
</entry>

แบบที่ 2.2 (“คำโบราณ” บ่งชี้เฉพาะ “กะลาสี”):

<entry lang="eng">
 <headword>seafarer</headword>
 <translation lang="tha">คนเดินเรือ</translation>
 <translation-similar lang="tha">ชาวเรือ</translation-similar>
 <translation-similar lang="tha" ancient="true">กะลาสี</translation-similar>
 <lexitron id="63739"/>
</entry>

คือไม่แน่ใจว่า “คำโบราณ” ในหมายเหตุ (ในวงเล็บ) เนี่ย มันเป็นตัวบ่งชี้อะไร
ตัวบ่งชี้ คำศัพท์ (seafarer) หรือว่าตัวบ่งชี้คำแปล (ชาวเรือ, กะลาสี)

ใครมีความเห็นไรมั่งครับ ?

อีกอันที่น่าสนใจ เอาไว้พิจารณาประกอบก็คือ มันมี entry แบบนี้ด้วยอันนึง:

<entry lang="eng">
 <pos>N</pos>
 <headword>weeds</headword>
 <translation lang="tha">เสื้อผ้าสีดำซึ่งเดิมเป็นชุดสวมใส่ของแม่ม่าย</translation>
 <translation-similar lang="tha">(คำโบราณ หรือทางวรรณคดี)</translation-similar>
 <lexitron id="80641"/>
</entry>

จะเห็นว่าใน translation-similar ไม่มีคำแปลอะไรอยู่เลย มีแต่หมายเหตุ แบบนี้ แปลว่าหมายเหตุใน translation-similar ไม่ได้บ่งชี้ตัวคำแปลใน translation-similar .. แต่บ่งชี้คำศัพท์ (weeds) น่ะสิ ?? คิดแบบนี้ได้ไหม ?

หรือ ... แต่เนื่องจากเจอแบบนี้แค่อันเดียว ก็อาจจะถือว่ามันเป็นข้อผิดพลาด ไม่ต้องสนใจ จะได้ไหม?

นอกเรื่อง: ข้อมูล LEXiTRON ที่ให้ดาวน์โหลดได้* ซึ่งเอามาทำ YAiTRON (โดยวีร์ ผ่านทางทางคุณพูนลาภอีกที) มันเป็นรุ่นเมื่อหลายปีก่อน คือ 2.0 (หรือก่อนหน้านั้น) ส่วนรุ่นล่าสุดที่ใช้บนเว็บ คือ 2.2 เค้าไม่มีให้ดาวน์โหลด

Dictionary Thai→English English→Thai
WordsSenses WordsSenses
LEXiTRON 2.135,000?53,000?
LEXiTRON 2.251,000?79,000?
YAiTRON32,35040,85453,53483233

* ต้องสมัครสมาชิกก่อนถึงจะดาวน์โหลดได้ แต่หน้าเว็บสำหรับสมัครก็ดันบอก PHP error อีเมลไปตามที่อยู่ที่แจ้งไว้ ก็ตีกลับ ... - -"

technorati tags: , , ,

Thai National Corpus project

Thai National Corpus project

โครงการ “คลังข้อมูลภาษาไทยแห่งชาติ”
เป้าหมายตัวอย่างการใช้ภาษาไทย 80 ล้านคำ

ใครสนใจจะมอบงานเขียนของตนให้กับโครงการนี้ ก็เชิญที่หน้า “สนใจส่งผลงานเข้าร่วมโครงการ” ครับ มีรายละเอียดบอกอยู่ ว่าต้องทำอย่างไร

ในการศึกษาด้านภาษาศาสตร์ (รวมถึงงานด้านการประมวลผลภาษาธรรมชาติ) นั้น ทรัพยากรที่สำคัญมากอย่างหนึ่ง ก็คือ “คลังข้อมูลภาษา” (corpus/linguistic corpus) ซึ่งเป็นคล้าย ๆ ฐานข้อมูลขนาดใหญ่ ที่เก็บข้อมูลการใช้ภาษาของแต่ละภาษาแต่ละท้องถิ่นเอาไว้ (ใหญ่แค่ไหนนี่ ไม่ได้มีกำหนด แต่มีหลักเกณฑ์อยู่ว่า จะต้องมีปริมาณและความหลากหลายพอที่จะเป็นตัวแทนของภาษาหนึ่ง ๆ ในท้องที่หนึ่ง ๆ ในช่วงเวลาหนึ่ง ๆ ได้ — ดูจากคลังหลายอันแล้ว ก็อยู่ที่ประมาณ 30 ล้านคำขึ้นไป แต่ถ้าเป็นคลังแบบเฉพาะทางก็อาจจะไม่ต้องใหญ่เท่านั้นก็ได้) โดยคลังนี้นอกจากจะใช้ศึกษาลักษณะการใช้ภาษา (เช่น “ค่ะ” เจอใช้เมื่อไหร่ แล้ว “คะ” เจอเมื่อไหร่ หรือ “วิ่ง” มีที่ใช้อย่างไรบ้าง) หรือเอาไปทำพจนานุกรมได้แล้ว ข้อมูลสถิติจากคลังยังสามารถนำไปสร้างแบบจำลองเพื่อนำมาใช้ในงานประมวลผลภาษาธรรมชาติด้วยคอมพิวเตอร์ได้อีก

หลายภาษาหลายพื้นที่ก็เห็นความสำคัญตรงนี้ และได้จัดทำคลังข้อความภาษาของตนขึ้น ภาษาที่บุกเบิกก่อนใคร ก็คือภาษาอังกฤษอเมริกัน นั่นคือ Brown Corpus โดยมหาวิทยาลัยบราวน์ ซึ่งข้อมูลส่วนหนึ่งถูกนำไปใช้ทำพจนานุกรม American Heritage Dictionary และต่อมาก็มีโครงการ American National Corpus ซึ่งอยู่ในระหว่างจัดทำ (ได้ 22 ล้านคำแล้ว เป้าหมาย 100 ล้านคำ), สำหรับภาษาอังกฤษในสหราชอาณาจักรก็มี British National Corpus, The Bank of English ตัวนี้ใหญ่มาก ณ ปัจจุบันมีอยู่ประมาณ 525 ล้านคำ เป็นตัวที่ใช้ทำพจนานุกรม Collins COBUILD English Language Dictionary, โครงการ Scottish Corpus of Texts and Speech ซึ่งอยู่ในระหว่างจัดทำ หรือภาษาอื่น ๆ เช่น Hellenic National Corpus (ภาษากรีก), National Corpus of Irish, Hungarian National Corpus ฯลฯ

สำหรับภาษาไทยนั้น ที่ผ่านมาหลายหน่วยงานก็มีทำเช่นกัน แต่ก็เป็นการทำใช้กันภายใน เพราะติดปัญหาลิขสิทธิ์ ทำให้ไม่สามารถเผยแพร่ได้ จะมีก็เพียงคลังออร์คิดของเนคเทค (ORCHID - ข้อมูลจากคลังนี้เอาไปทำพจนานุกรม LEXiTRON) ที่ไม่มีปัญหาเรื่องลิขสิทธิ์ แต่ก็มีขนาดเล็กมาก คือเพียง 4 แสนคำ เท่านั้น และข้อมูลข้างในทั้งหมดก็มาจากบทความวิชาการด้านคอมพิวเตอร์และอิเล็กทรอนิกส์เพียงด้านเดียว (domain เดียว และ genre เดียว) คือไม่สามารถถือได้ว่าเป็นตัวแทนภาษาไทยที่ใช้กันทั่วไป

ก็เลยมี “โครงการคลังข้อมูลภาษาไทยแห่งชาติ” นี้เกิดขึ้น โดยตั้งเป้าเก็บข้อมูลภาษาไทยในการใช้งานทุกประเภท (ทุก domain และ genre ที่รู้ว่ามี) เป็นจำนวนไม่น้อยกว่า 80 ล้านคำ (ใหญ่กว่าออร์คิด 200 เท่า) งานนี้มีภาควิชาภาษาศาสตร์ คณะอักษรศาสตร์ จุฬาลงกรณ์มหาวิทยาลัยเป็นผู้ดำเนินการหลัก โดยได้รับความร่วมมือและสนับสนุนจากองค์กรอื่น ๆ รวมทั้งสำนักพิมพ์หลายแห่งด้วย

ใครมีงานเขียน เอกสาร หรืออะไรที่คิดว่า สามารถยกให้เป็นสาธารณสมบัติได้ ก็ลองส่งดูนะครับ (พวก เว็บล็อก ข่าว ประกาศ แถลงข่าว โฆษณา แผ่นพับ ใบปลิว บันทึกช่วยจำ หรือ จดหมายส่วนตัว ก็รับนะครับ เอาหมด)

แถวนี้คนขีด ๆ เขียน ๆ เยอะ ลองดูครับ – ฝากบอกต่อ ๆ กันด้วย ;)

[ ลิงก์ โครงการคลังข้อมูลภาษาไทยแห่งชาติ ]

technorati tags: ,

Bloggers and Democracy in Burma

พม่าจากสายตาของ ประชาชนพม่า

Burma Peace Group: บทบาทของ blogger กับการเคลื่อนไหวเพื่อประชาธิปไตยในพม่า

สำนักข่าวทางเลือก freeburma.org, irrawaddy.org และ mizzima.com

บล็อกเกอร์พม่า เช่น ko-htike.blogspot.com และ mmedwatch.blogspot.com

[ ผ่าน พิณ พัฒนา ]

technorati tags: , , ,