วิธีใช้งาน Google OCR Engine



วิธีใช้งาน Google OCR Engine

Google OCR Engine English Language Test3

OCR คือ Optical character recognition แปลว่า การรู้จำอักขระทางแสง เราได้ทดสอบ Google OCR Engine ซึ่งมีมาให้ ในระบบการนำเข้าไฟล์ของ Google Drive  วิธีการก็คือเก็บไฟล์ในรูปแบบ .pdf ไว้ในที่เก็บข้อมูลไฟล์เอกสารต่างๆ (Drive) ซึ่งเราทดสอบทั้งสองภาษาคืออังกฤษและไทย เครื่องมือนี้ใช้ในการแปลงตัวอักษรที่อยู่ในไฟล์ .pdf ให้เป็นตัวพิมพ์อยู่ในรูปแบบของเอกสาร Google และสามารถส่งออกมาเป็นไฟล์ word หรือไฟล์อื่นๆให้เราแก้ไขได้

 

Google OCR Engine English Language Test1

Google OCR Engine English Language Test1

เริ่มต้นด้วยการนำเข้าไฟล์ โดยเราสแกนไฟล์ โดยใช้เครื่องสแกนเอกสารในสำนักงานของเรา ในภาพผมสแกนมาสองนามสกุลคือ .pdf และ .tif  ซึ่งพบว่า .tif นำมาทดสอบแล้ว ไม่มีอะไรเกิดขึ้นเมื่อใช้ OCR ขั้นตอนนี้ผมคิดว่าต้องใช้เครื่องสแกนที่เลือกให้เป็น ความชัดเจนสูง High Resolution ขยายตัวอักษรให้ใหญ่หน่อยมีขนาดมาตรฐานที่ Google แนะนำว่า ตัวอักษรในแต่ละบรรทัดต้องมีความสูงอย่างน้อย 10 พิกเซล (pixels) และทำตามข้อกำหนดอื่นๆ ของ Google จึงจะได้ผลการแปลงเอกสารด้วยระบบ OCR ที่สมบูรณ์กว่า)

ตัวอย่างนี้เป็นไฟล์ .pdf ที่แสกนมาจากเอกสารภาษาอังกฤษเป็น โบร์ชัวร์ของ บริษัทฯ CRM-C ผู้เชี่ยวชาญงาน Cloud  Computing ด้่านระบบ CRM , Project Management, Google Apps for Business และ Google Products อื่นๆ อาทิ Google Drive Cloud Storage และ Google Map for Business

 

Google OCR Engine English Language Test2

Google OCR Engine English Language Test2

ให้ ทำเครื่องหมายถูก ที่หน้าข้อความ 3 ข้อความคือ
1. Convert documents, presentations, spreadsheets, and drawings to corresponding Google Docs format
2. Convert text from PDF and image files to Google documents
ในส่วนของ Document language ให้เลือกเป็น ภาษาอังกฤษ (English)
3. Confirm settings before each upload

ถ้าไม่ขึ้นกล่องข้อความมาให้ติ๊ก จะต้องไปทำอีกที่หนึ่ง

OCR Upload Setting

OCR Upload Setting

สมมติว่าไม่ขึ้นกล่องข้อความ ให้เรามาทำตรงนี้แทน เมื่อเวลาที่เรา Upload เอกสารจะมีกล่องเด้งขึ้นมาทางด้านมุมล่างขวามือ ให้เข้าที่ setting และทำเครื่องหมายถูกหน้าข้อความทั้งสาม

Google OCR Engine English Language Test3

Google OCR Engine English Language Test3

เมื่ออับโหลดไฟล์ข้อมูลสำเร็จ จะมีข้อความขึ้นว่า “files have been uploaded” ที่ด้านบนของหน้าจอ หากไฟล์ไหนอับโหลดไม่สำเร็จ ให้กดปุ่มลองใหม่ (Retry) ที่ด้านหลังไฟล์ที่อับโหลด ในกล่องอับโหลด ที่มุมซ้ายล่างดังภาพ หากกด Retry แล้วยังไม่ได้ให้ลองอับโหลดเฉพาะไฟล์ที่อับโหลดไม่สำเร็จแบบเดี่ยวๆ และถ้าไม่ได้ก็กด Retry จนกว่าจะได้

Google OCR Engine English Language Test4

Google OCR Engine English Language Test4

เมื่ออับโหลดสำเร็จและเปิดไฟล์ใน Google Drive จะได้เอกสารดังภาพด้านบน ตัวนี้แปลงมาจากไฟล์สกุล .pdf

 

Google OCR Engine English Language Test5

Google OCR Engine English Language Test5

ภาพนี้เราจะได้ การแปลงข้อมูลในไฟล์จาก .pdf มาเป็นเอกสาร Google โดยระบบ Google OCR Engine ออกมา ซึ่งสามารถดาวน์โหลด (Down load) หรือ นำออก (Export) เป็นเอกสารไฟล์ word หรือ เอกสารอื่นๆ เพื่อใช้งานได้ต่อ

จะเห็นว่าเครื่องมือนี้ยังแปลงได้ไม่ดีนัก หลายๆคำอ่านไม่ออกและผิด ซึ่ง Google ได้แจ้งไว้ว่าเอกสารต้องมีความชัดเจนสูงเป็น High Resolution จึงจะใช้ได้ดี และมีข้อกำหนดในระบบ Google OCR Engine อื่นๆอีก อ่านเพิ่มเติมที่ About Optical Character Recognition in Google Drive (คุณอาจต้องเข้าสู่ระบบ log in Google ก่อนจึงจะอ่านข้อมูลนี้ได้)

อย่างไรก็ตามผมได้ทดสอบจากเอกสารทั่วไปที่ไม่มีความชัดเจนสูงนัก เนื่องจากคิดว่าเป็นสิ่งที่ผู้ใช้งานทั่วไปใช้บ่อย การจะให้ได้ OCR ที่มีประสิทธิภาพ ต้องแปลงเอกสารให้มีความละเอียดสูงและตรงข้อกำหนดของ Google ก่อนที่จะอับโหลดเข้าไปใน Google Drive

ด้านล่างเป็นภาพการทดสอบเอกสารภาษาไทย ซึ่งใช้วิธีการเดียวกับวิธีข้างต้น ซึ่ง Google รองรับภาษาไทยและมีตัวเลือกให้เลือกเป็นภาษาไทยเวลาอับโหลดเอกสารเข้าสู่ Drive

Google OCR Engine Thai Language Test1

Google OCR Engine Thai Language Test1

กำลังอับโหลดไฟล์ .pdf เข้า Google Drive เพื่อทดสอบระบบ OCR

สาเหตุที่ผม จัดเก็บ save ไฟล์แบบไม่มีชื่อและเป็นตัวเลขเพราะต้องการจะทดสอบประสิทธิภาพของการค้นหาไฟล์ของ Google ว่าสามารถค้นหาไฟล์ที่ผ่านการ OCR เจอหรือเปล่า เนื่องด้วยอยากทดสอบการค้นหาระดับลึกลงไปในเนื้อหาของไฟล์ว่ามีคำใดอยู่ในไฟล์แล้วจะหาเจอหรือไม่

หากแปลงออกมาแบบอ่านไม่ออก ก็ไม่สามารถเจอได้แล้วครับ วิธีแก้แนะนำให้จัดเก็บในชื่อที่ง่ายต่อการจดจำหรือมีข้อความบางส่วนที่คิดว่าเราอาจจะกลับมาหาอยู่ในไฟล์นั้นๆ แนะนำให้พิพม์ลงไปในไฟล์เลยครับ เพราะหลังจากผ่านกระบวนการแปลงแล้ว เหมือน Google เอาภาพของไฟล์เราแปะลงบนไฟล์เอกสารของ Google ซึ่งสามารถพิมพ์อะไรลงไปได้ครับ

Google OCR Engine Thai Language Test2

Google OCR Engine Thai Language Test2

จากภาพจะเห็นตัวเลือกภาษาไทย (Thai)

 

Google OCR Engine Thai Language Test3

Google OCR Engine Thai Language Test3

อับโหลดสำเร็จ

 

Google OCR Engine Thai Language Test4

Google OCR Engine Thai Language Test4

เอกสารที่ใส่เข้าไปสแกนจากเครื่องสแกนเนอร์ เป็นหน้าจากหนังสือเล่มหนึ่งในออฟฟิส

 

Google OCR Engine Thai Language Test5

Google OCR Engine Thai Language Test5

เมื่อ OCR ของ Google แปลงออกมาพบว่าอ่านไม่รู้เรื่อง ซึ่งอาจเป็นไปได้ว่าเอกสารที่อับโหลดไม่ตรงข้อกำหนดคือ มีความชัดเจนสูง High Resolution และข้อกำหนดอื่นๆ ซึ่งหากทำตามข้อกำหนดเหล่านั้น คาดว่าจะได้การแปลงเอกสารที่สมบูรณ์กว่ามาก

*เพิ่มเติมเรื่องที่เกี่ยวข้อง : ขณะนี้ Canon สามารถสแกนเอกสารแล้วส่งเข้า Google Drive ได้แล้ว  รวมทั้งส่งเข้าระบบ Cloud อื่นๆ อาทิเช่น Salesforce CRM

แนะนำบริษัทฯ CRM-C เป็นผู้ให้บริการ Google Apps for Business  ซึ่งหากต้องการใช้ Google Drive ในองค์กรธุรกิจของคุณ คุณสามารถซื้อผ่านบริษัทฯในประเทศไทยได้

0 Comments

Leave a reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>