ย้ายบล็อกไปที่ bact.cc แล้วนะครับ

พ.ร.บ.คอมพิวเตอร์
หยุด ร่างพ.ร.บ.คอมพิวเตอร์
พื้นที่เก็บข้อมูลออนไลน์ ฟรี 2GB จาก Dropbox (sync กับ Windows, Linux, Mac, iPhone, Android ฯลฯ ได้)
Showing posts with label Google. Show all posts
Showing posts with label Google. Show all posts

2011-02-18

Punctual translation with punctuation marks

ความแตกต่างของคำแปลโดย Google Translate ที่เกิดจากการมีและไม่มีเครื่องหมายวรรคตอน วันนี้พบโดยบังเอิญ (2011.02.18):

  • "ถ่ายในห้อง (มีเครื่องหมายคำพูด) → "shot in the room.
  • ถ่ายในห้อง (ไม่มีเครื่องหมายคำพูด) → Taken in the room.

นี่อาจจะบอกได้ว่า Google Translate ใช้เครื่องหมายวรรคตอนในการคำนวณสถิติเพื่อใช้ในการแปลด้วย

เท่าที่เคยพบ งานทางด้านการประมวลผลภาษาธรรมชาติจำนวนมาก ไม่ค่อยสนใจเครื่องหมายวรรคตอนเท่าไหร่ (เว้นสาขา natural language generation และ discourse analysis) บางทีกรองทิ้งไปเลยก็มี

Say, Bilge and Akman, Varol (1997). Current Approaches to Punctuation in Computational Linguistics

Jones, Bernard (1996). What’s The Point? A (Computational) Theory of Punctuation

Jones, Bernard (1994). Exploring the role of punctuation in parsing natural language text

technorati tags: , ,

2010-09-21

[20-22 ก.ย.] follow #ial2010 ตามงาน Internet at Liberty 2010

Internet at Liberty 2010 เวิร์กช็อปและสัมมนา สองวันครึ่ง เรื่องเสรีภาพอินเทอร์เน็ต จัดโดย Google และมหาวิทยาลัย Central European University ที่บูดาเปสต์ ฮังการี

หัวข้อเกี่ยวข้องถึงนโยบายการกำกับอินเทอร์เน็ต การเข้าถึงอินเทอร์เน็ต อินเทอร์เน็ตเพื่อการพัฒนาสังคม ประชาธิปไตย และการศึกษา

มีนักเทคโนโลยี นักกฎหมาย นักนโยบายอินเทอร์เน็ต นักวิชาการ นักกิจกรรมสังคม บล็อกเกอร์ และนักหนังสือพิมพ์จากทั่วโลก เข้าร่วม โดยเฉพาะจากประเทศและภูมิภาคที่เสรีภาพในการแสดงความคิดเห็นและสิทธิมนุษยชนถูกคุกคาม ทั้งในพื้นที่ออฟไลน์และรุกเข้าสู่พื้นที่ออนไลน์

ชมสด — 21-22 กันยายน 2553, 14:00-23:15 เมืองไทย (9:00-18:15 UTC+2)

ทวีตติดแฮชแท็ก #IAL2010

มีชาวบ้านแถวนี้ไปร่วมอย่างน้อยสามคน @bact (ผม เครือข่ายพลเมืองเน็ต/โอเพ่นดรีม) @jiew (จีรนุช เปรมชัยพร หนังสือพิมพ์ประชาไท) และ @supinya (สุภิญญา กลางรณงค์ คณะกรรมการรณรงค์เพื่อการปฏิรูปสื่อ)

แถม: ชมบันทึกจากงาน Internet Governance Forum ครั้งที่ 5 ลิทัวเนีย

technorati tags: , , ,

2009-11-23

Chromium OS (Chrome OS) มาแล้น มีซอร์สด้วย

Chromium OS มาแล้น @kengggg กำลังหาทางยัดฟอนต์ไทยใส่ลงไปอยู่ ใครมีฟอนต์อะไรน่าใช้ + สัญญาอนุญาตประมาณ BSD หรือโอเพนซอร์สอื่น ๆ ลองบอกเขาดูครับ

ดูหน้าตาแล้ว ก็น่าจะเหมาะกะเน็ตบุ๊กดีนะ

ถ้าจะ build เอง ไปเอาซอร์สที่ chromium.org ต้องมี Linux ถึงจะ build ได้
ถ้าขี้เกียจ ไปเอา vm image ได้ที่ gdgt.com (ต้องลงทะเบียน-ฟรี ใช้ Facebook Connect ได้) ได้ image มาแล้ว รันกะ VMWare หรือ VirtualBox (ตัวหลังนี้ฟรี-โอเพนซอร์ส)

โหลดมาเสร็จ ก็ติดตั้ง ใครไม่ถนัด VirtualBox TechCrunch โชว์วิธีติดตั้ง แบบทีละขั้น

ไปดู @markpeak รีวิว ที่ blognone

technorati tags: , ,

2008-12-15

accounting tool for (un)accountable business

rt @suntiwong
http://tinyurl.com/6zp3ed รายงานสด คะแนนโหวตนายก คะแนนต่อคะแนน

a Thai netizen uses free online tools to report today prime minister vote. Look at the vote summary at http://tinyurl.com/6zp3ed (Google Spreadsheet), and follow the minute-by-minute updates at http://twitter.com/suntiwong (Twitter).

ทำด้วย Google Spreadsheet, กระจายข่าวด้วย Twitter

technorati tags: , , , ,

2008-10-23

Gmail's smarter auto-responses

กูเกิลแล็บส์มาอีกแล้ว คราวนี้เพิ่มพลังจีเมลด้วย “canned responses” หรือระบบตอบจดหมายอัตโนมัติ ที่เราตั้งล่วงหน้าได้ว่า ถ้ามีจดหมายที่มีคำสำคัญนี้ จากคนนั้น ให้ตอบไปว่ายังไง ประหยัดเวลาตอบอีเมลซ้ำ ๆ ซาก ๆ :p

อย่างถ้ามีคำว่า “viagra” มาในเมล เราก็ตั้งให้ตอบกลับไปได้ว่า “Thanks. I do already have good sexes.” อะไรแบบนี้เป็นต้น :p

technorati tags: , ,

2008-02-27

Papers Written by Googlers

Research papers by people at Google

including ones by Peter Norvig, Dominic Widdows, Marius Pasca ... and of course Sergey Brin and Lawrence Page themselves !

ผลงานวิจัยตีพิมพ์จากกูเกิล คนพวกนี้เขาขยันคิดอะไรกันออกมาทุกวัน ?

Peter Norvig นั่นเป็นเจ้าพ่อ AI เขียนหนังสือ Artificial Intelligence: A Modern Approach (ร่วมกับ Stuart Russell) น่าจะเป็นหนังสือ AI ที่ใช้ในชั้นเรียนมากที่สุด

Dominic Widdows เขียนหนังสือที่ผมชอบมากเล่มนึง คือ Geometry and Meaning เราจะแทน/วัด “ความหมาย” ด้วยเรขาคณิตได้ไหม ? เป็นหนังสือที่ให้ไอเดียอะไรใหม่ ๆ เยอะมาก ที่สำคัญคือ อ่านง่าย ตัวอย่างประกอบเยอะ รูปประกอบก็ทำดี

ส่วนใครสนใจเรื่อง open-domain question answering system และเรื่องที่เกี่ยวข้อง เช่นพวก named entity ก็ตามงานของ Marius Pasca นี่ไว้ เขาเขียนหนังสือด้านนี้ไว้เล่มนึงด้วย คือ Open-Domain Question Answering from Large Text Collections ผมไม่เคยอ่าน แต่หนังสือของ สำนักพิมพ์ CSLI ส่วนใหญ่จะไม่น่าผิดหวัง

... สองคนหลังนั่น ? ก็คนก่อตั้งกูเกิลไง ... เขาเคยเป็นนักวิจัยมาก่อนนะ :P

technorati tags: , ,

2007-05-24

The $25,000,000,000 Eigenvector

บทความอธิบาย พีชคณิตเส้นตรง พีชคณิตเชิงเส้น สิ่งสำคัญของอัลกอริธึม PageRank ของ Google, โดย Kurt Bryan

The $25,000,000,000 Eigenvector: The Linear Algebra Behind Google, in the Education section of the August 2006 issue of SIAM Review. This is a paper I wrote with Tanya Leise at Amherst College. It gives an undergraduate-oriented explanation of the beautiful and simple linear algebra that lies behind an important facet of Google's PageRank algorithm. The page has some demo code.

[ผ่าน siit.net]

update 2007.05.25: แก้จาก “พีชคณิตเส้นตรง” เป็น “พีชคณิตเชิงเส้น” - ขอบคุณ พ่อหมาอ้วน

technorati tags:

2007-01-27

Cameraphone Reports, Tags and Labels, Censorship Code of Conduct

ลิงก์ที่ดองไว้หลายวัน ยังไม่ได้อ่านเลย

  • NYC 911 to Accept Cellphone Pics and Video — จารย์มะนาวน่าจะสนใจ พลเมืองในฐานะหูตาของผู้รักษากฎหมาย .. ไว้อีกหน่อยถ้ามีกล้องมือถือจับภาพ "พับเล็ก ๆ" ตามสี่แยกได้ คงสนุก
  • Labels Not Tags, Says Google — มันต่างกันยังไง ? ฉลาก? กะ ป้าย? - -"
  • Microsoft, Google Agree to NGO Code of Conduct — เกี่ยวกะเรื่องเซ็นเซอร์ ไมโครซอฟต์กะกูเกิลจะร่วมกันร่างแนวทางปฏิบัติในการเรื่องการเซ็นเซอร์

technorati tags: , , , , ,

2006-09-06

Google n-gram are belong to YOU

กูเกิล แจกโมเดล n-gram ซึ่้งกูเกิลใช้ในงานวิจัยต่าง ๆ เช่น การแปลภาษาอัตโนมัติ การแก้ตัวสะกดอัตโนมัติ การสกัดสารสนเทศ ฯลฯ โดยโมเดลนี้สร้างจากคำมากกว่า 1 ล้านล้านคำ โดยจะแจกจ่ายผ่าน LDC ในรูปของ DVD 6 แผ่น

LDC นี่ เป็นหน่วยงานที่ทำงานด้านข้อมูลภาษาศาสตร์ พวกคลังข้อความ (corpus) ข้อมูลที่แจกจ่ายโดย LDC มีหลายประเภท บางประเภทต้องเป็นสมาชิก (เสียเงินค่าสมาชิกแพงอยู่) จึงจะเรียกดูได้ บางประเภทซื้อแยกต่างหากได้โดยไม่ต้องเป็นสมาชิก บางประเภทก็ฟรี — แต่กรณี DVD 6 แผ่นนี่ ยังไงคงต้องเสียค่าส่งแน่ ๆ

Google Research Blog announced:

... we decided to share this enormous dataset with everyone. We processed 1,011,582,453,213 words of running text and are publishing the counts for all 1,146,580,664 five-word sequences that appear at least 40 times. There are 13,653,070 unique words, after discarding words that appear less than 200 times.

Watch for an announcement at the LDC, who will be distributing it soon, and then order your set of 6 DVDs.

ใครอยากจะลอง เชิญได้เลย! :P

via information retrieval

tags: | | |

2006-07-28

Google Code Hosting

, a Google way for open source repository (think SourceForge).

Its issue tracker and search capability (feat. search by tag) are very interesting.

via NewsForge via /.

tags:

2006-06-27

Picasa Web Albums

กูเกิ้ลมีของใหม่มาให้เล่นอีกแล้ว Picasa Web Albums

ก็เป็นอัลบั้มภาพออนไลน์น่ะแหละ ไม่ได้มีอะไรเป็นพิเศษ
ความสามารถต่าง ๆ ก็ยังเป็นรอง Flickr อยู่เยอะ โดยเฉพาะเรื่อง social network นั่นคือ ไม่มีเลย - -"
tagging ก็ไม่มี หรือการใส่โน๊ตในรูปก็ไม่มี .... ไม่มีอะไรซักอย่างเลยนะเนี่ย

แต่อย่างไรซะ ที่มันดีกว่าก็คือ เนื้อที่ฟรีที่ให้เยอะ คือ 250 MB เมื่อเทียบกับ ~200 รูป ของ Flickr
นั่นคือ ถ้าเราอัพรูปขนาด (MB) เล็ก ๆ ก็จะแสดงรูปในอัลบั้มได้เยอะขึ้น ซึ่งผมชอบ :P
(จริง ๆ ไอ้ 200 รูปของ Flickr นี่ มันคือข้อจำกัดในการแสดง ไม่ใช่ข้อจำกัดในการอัพ คือจะส่งเข้าไปเท่าไหร่ก็ได้ แต่จะแสดงได้เฉพาะ 200 รูปล่าสุด ที่เก่ากว่านั้นจะถูกซ่อนไว้ -- ถ้าเราเอารูปใหม่ออกไป รูปเก่า ๆ ก็จะกลับมาแสดงเหมือนเดิม)

อ้อ แต่ถ้าอยากได้เนื้อที่เพิ่ม ก็เหมือน Flickr ครับ จ่ายตังค์ค่าสมาชิกรายปีซะ 25 USD/ปี ก็จะได้เนื้อที่เพิ่มอีก 6 GB ... โหลดมันเข้าไปเถอะ

ที่รู้สึกว่าต่างชัดเจนอีกอย่างก็คือ มันใช้ง่ายมาก ก็คงเป็นเพราะมันไม่ค่อยมีความสามารถอะไรหวือหวาด้วยล่ะ

อย่างถ้าสำหรับคนเข้ามาดู โผล่มาหน้าแรก ก็มีให้เลือกว่าจะดูอัลบั้มไหน พอกดเข้าไป ก็เลื่อนซ้ายเลื่อนขวา แค่นั้นแหละ ไม่มีอะไรมากไปกว่านี้ อ้อ มีให้ใส่ความเห็นได้ด้วย

สำหรับคนอัพ เจ้าของอัลบั้ม ถ้าใช้โปรแกรม Picasa Web (ไม่ใช่ Picasa นะ อันนี้ตัวใหม่ เป็นเบต้าอยู่) มันจะมีปุ่ม "Web Albums" นั่นแหละ อยากอัพรูปไหน ก็กดปุ่มนั้น อัพเป็นชุดก็ได้ ง่ายอีกแล้ว :P

อ้อ ไอ้เจ้า Picasa Web นี่ ตอนนี้มีแค่บน Windows นะครับ แต่คนใช้โอเอสอื่น ก็ยังอัพผ่านทางเว็บได้ อาจจะไม่สะดวกหน่อย ถ้าอัพเยอะ ๆ

เคยเอามาลองหลายรอบแล้ว Picasa แต่ก็เฉย ๆ ไม่ได้ชอบเท่าไหร่ แต่พอมี Web Albums เพิ่มมานี่ คิดว่าก็คงใช้ไปเรื่อย ๆ ละ

ใครที่ถ่ายรูปมาแล้วอยากแบ่งเพื่อน ๆ ดูง่าย ๆ ไม่ต้องยุ่งยากล็อกอินลงทะเบียนแบบพวก Ofoto และอยากใส่รูปได้เยอะ ๆ หน่อย ไม่จำกัดจำเขี่ยแบบ Flickr (แบบที่ไม่จ่ายตังค์) แนะนำตัวนี้ครับ :)

นี่อัลบั้มผม http://picasaweb.google.com/arthit

tags:

2006-04-18

All Google services, explained

List of Google services and tools บริการทุกอย่างของกูเกิ้ล มีให้ดูหมด พร้อมคำอธิบาย

2005-03-22

จากข่าว AFP ฟ้อง Google -- เรื่องประหลาด

โพสต์ตอบที่ blognone ไม่ติดซักที มาเขียนที่นี่เลยละกัน หมดเรื่อง

ไปอ่านนี่ก่อน AFP ฟ้อง Google News

คุณ lew ผู้รายงานข่าว ให้ความเห็นทำนองว่า ไม่เข้าใจว่า AFP จะฟ้อง Google ทำไม “เป็นเรื่องน่าตลก” แค่เอารูปเล็กๆ มาใช้เอง

ซึ่งผมไม่เห็นด้วย ก็ตอบไปประมาณว่า แบบนี้แสดงว่าส่งเสริมคนชุบมือเปิบสิ
(รูปเล็กรูปใหญ่ มันก็ต้องถ่ายมาเหมือนกันแหละ)

คุณ lew ก็ตอบมาว่า ถ้า Google News เป็นการชุบมือเปิบ แล้วมันต่างอะไรจาก search engine ?
พร้อมเสริมว่า ถ้า AFP ไม่อยากให้ใครได้ข่าว ก็จำกัดให้เว็บเข้าได้เฉพาะสมาชิกซะสิ หรือไม่ก็ป้องกันวิธีอื่น ไม่เห็นต้องไปฟ้องเลย และ มองไม่เห็นเหตุผลอื่น "นอกจากอยากเป็นข่าวเอง"

ผมเองก็จะตอบในนั้นล่ะนะ แต่มันไม่ติด ขอต่อข้างล่างนี่เลยละกัน


ค้นข้อมูล --> แสดงลิงก์ --> ต้องกดลิงก์ ไปที่เว็บแหล่งข่าว ถึงจะอ่านได้

Google News --> แสดงข่าว --> ไม่ต้องกดลิงก์ไปไหน อ่านข่าวอย่างย่อได้เลย

ดูๆ มันน่าจะต่างนะ


แหม ก็ AFP เปิดเว็บขึ้นมาเอง ...
เป็นความผิดของ AFP ไปซะงั้น

แบบนี้อัดเพลงจากวิทยุก็ไม่ผิดกฏหมายลิขสิทธิ์ล่ะเนอะ
ค่ายเทปดันเอาแผ่นมาให้ดีเจเปิดออกอากาศเองนี่


AFP จะเปิดเว็บมาทำไม ถ้าจะไม่ให้คนอื่นมาอ่านข่าว?

ใครๆ ก็เปิดเว็บครับ เดี๋ยวนี้
ไม่จำเป็นต้องหาประโยชน์ทางตรงบนเว็บก็ได้
บริษัทน้ำปลายังเปิดเลย
(เท่าที่เล่นๆ ดู ก็ไม่เห็นว่าเค้าจะขายน้ำปลาบนเว็บ)
ก็เปิดไปเพื่อประชาสัมพันธ์บริษัท/สินค้า สร้างภาพพจน์ เพิ่มช่องทางสื่อสารกับลูกค้า อะไรก็ได้
อ้อมๆ แบบนี้ก็นับเป็นประโยชน์ได้เหมือนกัน

แล้วอันที่จริง AFP ก็เปิดให้คนทั่วไปเข้าไปอ่านข่าวด้วย (ก็อย่างที่คุณ lew เข้าไปอ่านนั่นแหละ)

ใครๆ จะ **เข้าไป** อ่านก็ได้
--> คือ อ่านที่เว็บ AFP (แปลอีกที คือ ไม่ให้เอาไปอ่านที่อื่น)

"ใครๆ ก็เข้าไปอ่านได้" นี่ ไม่ได้แปลว่า "ใครๆ จะเอาข่าวไปใช้ก็ได้" นะครับ

จากข่าว AFP suing Google for copyright infringement

AFP said it has informed Google that it is not authorized to use AFP's copyrighted material as it does and has asked Google to cease and desist from infringing its copyrighted work.

AFP alleged that Google has ignored such requests and as of the filing date of the lawsuit "continues in an unabated manner to violate AFP's copyrights."

AFP ได้แจ้ง Google ไปแล้ว ว่าการนำข่าวของเค้าไปใช้เนี่ย มันละเมิดลิขสิทธิ์นะ
แต่ Google ไม่สนใจต่อคำร้องนั้น, AFP จึงได้ดำเนินการฟ้องร้องหลังจากนั้น


ระบบสมาชิก ไฟล์ robots.txt หรืออะไรก็ไม่สำคัญ
ถ้าของมันมีเจ้าของอยู่ และเจ้าของไม่ได้บอกว่า ให้เอาไปใช้ได้ ก็ไม่ควรจะเอาไปใช้

ประตูบ้านข้างๆ เปิดอ้าซ่าอยู่ ไม่ยอมปิด แถมยังไม่มีป้าย "ห้ามขโมย"
แสดงว่าเราเดินเข้าไปขโมยของได้ ... ไม่ผิด?
(แถมถ้าเราไปแจ้งตำรวจ ก็ดันเป็นเรื่องตลกซะอีกแหน่ะ)


และลองนึกจากอีกฟาก

ถ้าเราเป็นลูกค้า AFP ล่ะ เราจะรู้สึกยังไง?

ทำไมเราต้องจ่ายตังค์ซื้อข่าว ซื้อรูป เพื่อจะมาลงหนังสือพิมพ์เรา เพื่อจะมาออกทีวีช่องของเรา
แต่ Google ไม่เห็นต้องจ่ายอะไรเลย
...แบบนี้เลือกปฏิบัติหนิ

เผลอๆ ถ้าไม่ทำอะไร AFP เองก็มีสิทธิโดนลูกค้าตัวเองฟ้องได้ด้วยซ้ำ
ฐานทำการค้าไม่เป็นธรรม ใครจะไปรู้


คิดเห็นยังไง บอกกันได้ครับ


Update: ในที่สุด ก็สามารถโพสต์ลิงก์แบบครึ่งๆ กลางๆ ไปที่เว็บ blognone โน่นได้ หลังจากพยายามมาหลายครั้ง ทั้งจากที่บ้านเมื่อวาน ที่ทำงานวันนี้ และที่บ้านวันนี้อีกหลายรอบ
เดี๋ยวจะลองดูอีกที ว่าจะโพสต์ความเห็นยาวๆ อย่างคนอื่นได้บ้างรึเปล่า

Update 2: คิดว่าเว็บ blognone เค้าคงตั้งสคริปต์กันโฆษณามั้ง ถ้ามีลิงก์ จะโพสต์ไม่ติด

2004-11-22

Google Scholar (beta)

It search peer-reviewed papers, theses, books, preprints, abstracts and technical reports.

Some highlighted features:

  • search from many online database
  • provide direct link to downloading the paper
  • "view as HTML", so you can read it right on the browser
  • citation information (times + link to the citing papers)
  • many versions of a paper available
  • free service

Just try it and you will love it.

There're some advanced search syntax too, like
" author:witten string theory "

(Thanks Chris for introducing me this)

About Google Scholar

2004-10-15

Google Desktop Search

คุณกำลังประสบปัญหาเหล่านี้ ใช่หรือไม่

หาเบอร์โทรศัพท์กิ๊กในเมลเก่าๆ ไม่เจอ ไม่รู้ว่าหายไปอยู่ไหน (หลังจากที่ต้องลบในมือถือทิ้งไป เพราะแฟนเริ่มระแคะระคาย)

รูปน้องแนทที่เคยเปิดดูในเน็ตเมื่ออาทิตย์ก่อน ไม่รู้ว่าหายไปไหน ดันลืมเซฟไว้ซะด้วย

หาการบ้านที่เก็บไว้ของปีที่แล้วไม่เจอ เลยไม่รู้จะลอกอะไรดี (ปีนี้ต้องลงใหม่อีกรอบ)

และอื่นๆ จิปาถะ ปวดหัว กวนใจวัยรุ่น

กูเกิ้ลเดสก์ท็อป นวัตกรรมใหม่จากกูเกิ้ล จะช่วยขจัดปัญหาเหล่านั้นให้สิ้นซาก

กูเกิ้ลเดสก์ท็อป ทะลุทะลวงซอกซอนชอนไชไซ้แทรกแบกหน้าไปหาทุกอย่างที่คุณต้องการ. ไม่ว่าจะเป็น จดหมาย/นัดหมายในเอาท์ลุค หรือเอาท์ลุคเอ็กซ์เพรส, เอกสารไมโครซอฟต์ออฟฟิศ, ข้อความใน เอโอแอล เมสเซนเจอร์, แคชของอินเืทอร์เน็ตเอ็กซ์พลอเรอร์, และเอกสารข้อความปกติ

ด้วยพละกำลังการค้นหาจากเสริช์เอนจิ้นอันดับหนึ่งของโลก ในขนาดเล็กจิ๋ว พอที่จะใส่ลงในเครื่องคอมพิวเตอร์ตัวน้อยของคุณได้ ปัญหาต่างๆ ของคุณก็จะหมดไป

กูเกิ้ลเดสก์ท็อป เปิดให้ดาวน์โหลดแล้ววันนี้ สำหรับ วินโดวส์ และ วินโดวส์

ซาร่า..

โอ้ว พระเจ้า มันเยี่ยมไปเลยจอร์จ