|
|
|
 |
OCR คืออะไร
ก่อนอื่นต้องรู้ก่อนว่า OCR นั่นย่อมาจาก Optical Character Recognition (OCR) ซึ่งเป็นกระบวนการของการแปลงสื่อสิ่งพิมพ์ เช่น เอกสาร นิตยสาร สัญญา หรือข้อมูลอะไรก็ตามที่อยู่ในรูปของเอกสารกระดาษ ให้กลายเป็นเป็นข้อความ หรือให้มีความฉลาดมากขึ้นกว่าการเป็น ข้อความธรรมดา ก็คือ สามารถบันทึกไปเป็นไฟล์ประมวลผลคำที่แก้ไขได้ง่าย และบันทึกเก็บไว้ได้ ด้วยเทคโนโลยีนี้ได้เปิดโอกาส ให้สามารถเลือกใช้วัสดุ หรืออุปกรณ์อื่นๆเพื่อใช้ในการสำรองข้อมูล โดยพื้นที่ที่ใช้งานที่ก็ไม่ต้องมาก ซึ่งต่างกับการเก็บข้อมูลที่ยังคงอยู่ในรูปแบบของการะดาษ เทคโนโลยี OCR ได้ยังผลกระทบเป็นอย่างมากกับแนวทางแห่งการจัดเก็บข้อมูล แบ่งปันข้อมูล และ แก้ไขข้อมูล ก่อนที่เทคโนโลยี Optical Character Recognition นี้เกิดขึ้น ถ้ามีคนต้องการเปลี่ยนหนังสือให้ไปเป็น ข้อมูลในโปรแกรมการประมวลผลคำ แต่ละหน้าๆของหนังสือเล่มนั้น จะต้องพิมพ์คำแล้วคำเล่าจนครบ |
เทคโนโลยีด้าน OCR ต้องการทั้งฮาร์ดแวร์และซอฟต์แวร์เพื่อส่งเสริมซึ่งกันและกัน สำหรับระบบ OCR ที่มีความสลับซับซ้อน จำเป็นต้องใช้แผงวงจรเพิ่มเติมติดตั้งไว้ในอุปกรณ์คอมพิวเตอร์ หรืออุปกรณ์เพื่อการอ่านข้อมูล OCR พิเศษเหล่านี้ ตัวอย่างเช่น เครื่องสแกนเอกสารเช็ค ก็จะมีอุปกรณ์พิเศษเพื่อ "อ่านรหัส MICR" ที่ปรากฎอยู่บนหน้าเอกสารเช็คดังกล่าว จากนั้นก็สามารถนำผลลัพธ์ทีได้ส่งไปยังระบบ ICAS หรือ ให้ออกมาเป็นเพียง Text File ธรรมดาๆ ก็ได้ เป็นต้น เพื่อที่จะให้สามารถจบกระบวนการต่างๆได้ด้วยตัวเอง |
| เครื่องสแกนชนิดใช้แสงและเลนส์ (Optical scanner) จะสแกนข้อความบนหน้ากระดาษ แล้วแตกข้อมูลตัวอักษร มาสู่อนุกรมแบบจุด ซึ่งเรียกว่า “บิตแมป"ซอฟต์แวร์สามารถอ่านอักษรที่ใช้กันทั่วไปๆได้ และแยกแยะระหว่างเส้นเริ่มต้นและสิ้นสุด บิตแมปนี้สุดท้ายจะถูกแปลไปเป็นข้อความคอมพิวเตอร์ |
| ในขณะที่เทคโนโลยี Optical Character Recognition ได้ถูกทำให้ก้าวหน้ามากใหลายๆปีที่ผ่านมา แต่ก็ยังไม่ดีหากนำมาใช้งานกับข้อมูลประเภทลายมือ หรือ แบบอักษรที่มีลักษณะคล้ายกับลายมือ มีหลายๆระบบที่อยู่ในอุตสาหกรรมธนาคาร ที่ใช้เทคโนโลยี OCR เพื่อที่จะลองอ่านข้อมูลที่เป็นจำนวนเงินบนเช็คซึ่งใช้มือเขียน และทำงานไปพร้อมๆกับความสามารถของคอมพิวเตอร์ อ่านเส้นทาง และหมายเลขบัญชี |
| |
 |
| |
|