Review Metode Ekstraksi Fitur dan Klasifikasi Citra pada Optical Character Recognition

May 23, 2017 | Autor: Katya Chandrika | Categoría: Pengolahan Citra, Teknik Informatika
Share Embed


Descripción

Abstrak—Pengenalan karakter atau Optical Character Recognition (OCR) adalah sebuah sistem yang memuat teks berupa kumpulan karakter berbentuk citra, kemudian melakukan preprocessing pada citra, ekstraksi fitur, mengklasifikasikan berdasar citra yang diekstraksi (hasil berbentuk matriks dan vektor), kemudian fitur yang dikenali akan disimpan pada suatu tempat penyimpanan dan akhirnya citra akan dikenali berdasarkan derajat kemiripannya dengan fitur citra yang telah disimpan. Secara singkat, OCR dapat mengkonversi karakter berupa citra menjadi karakter ASCII yang dapat dibaca oleh komputer. Melalui perkembangannya, metode-metode untuk pengenalan karakter juga bertambah. Dalam paper ini akan dibahas secara ringkas tentang pengertian beserta cara kerja atau algoritma metode-metode dalam ekstraksi fitur dan klasifikasi citra kemudian juga perbandingan kelebihan serta kelemahan antara metode-metode tersebut. Kata kunci—OCR, character recognition, ekstraksi fitur, klasifikasi, citra I. PENGENALAN ANYAK penelitian yang telah dilakukan pada bidang pengolahan citra khususnya pengenalan pola. Pengenalan pola adalah suatu ilmu yang dapat mengelompokkan pola berdasarkan ciri-ciri yang dimiliki oleh pola itu sendiri. Beberapa aplikasi dari pengenalan pola adalah automatic identification (mesin identifikasi otomatis). Automatic identification menjadi sebuah solusi untuk mengatasi input data yang dilakukan secara tradisional yaitu melalui periferal keyboard. Pengenalan karakter atau Optical Character Recognition (OCR) adalah contoh dari automatic identification yang memproses teks citra berupa dokumen tercetak maupun tulisan tangan dikonversi menjadi karakter ASCII yang dapat dibaca oleh komputer [1][2]. Paper lain mengatakan bahwa OCR adalah sebuah sistem yang memuat teks berupa kumpulan karakter berbentuk citra, kemudian melakukan preprocessing pada citra, ekstraksi fitur, mengklasifikasikan berdasar citra yang diekstraksi (hasil berbentuk matriks dan vektor), kemudian fitur yang dikenali akan disimpan pada suatu tempat penyimpanan dan akhirnya citra akan dikenali berdasarkan derajat kemiripannya dengan fitur citra yang telah disimpan [3]. Sehingga secara singkat dapat dikatakan bahwa OCR mampu mengenali karakter berdasarkan citra. Pada era 1950-an evolusi teknologi berkembang sangat pesat sehingga pemrosesan data menjadi sebuah bidang yang penting. Input data dilakukan dengan menggunakan punched card yang tidak efektif dalam menangani peningkatan jumlah data. Pada saat itu pula, mesin pembaca. Mesin OCR pertama digunakan untuk mengkonversi laporan penjualan secara tertulis untuk diinputkan pada komputer. Meski mesin OCR telah diperkenalkan untuk diperjual-belikan pada tahun 1950-an, hanya beberapa ribu yang terjual hingga tahun 1986. Hal ini terjadi karena biaya sistem OCR yang melambung tinggi [4][5]. Saat ini, OCR telah banyak diaplikasikan di berbagai bidang, sebagai contoh pengenalan plat nomor kendaraan, pengenalan smart card, penginputan data secara otomatis, pengenalan kode pos dan lainnya. Melalui perkembangannya, metode-metode untuk pengenalan karakter juga bertambah. Dalam paper ini akan dibahas secara ringkas tentang pengertian beserta cara kerja atau algoritma metode-metode dalam ekstraksi fitur dan klasifikasi citra kemudian juga perbandingan kelebihan serta kelemahan antara metode-metode tersebut. II. TEKNIK EKSTRAKSI FITUR DAN KLASIFIKASI CITRA Pada awalnya ada dua metode dasar yang digunakan dalam OCR yaitu template matching (matrix matching) dan ekstraksi fitur [6][3]. Ekstraksi fitur dilakukan saat tahap pre-processing citra, dan selebihnya metode template matching dapat diganti oleh beberapa pendekatan lain yang diusulkan seperti klastering dan klasifikasi untuk proses klasifikasi citra [2][7]. Dalam bab ini akan dibahas teknik-teknik dalam pengenalan karakter sesuai dengan alurnya yaitu (1) input citra (2) segmentasi (3) ekstraksi fitur (4) klasifikasi.
Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.