Optical Character Membuat Hidup Anda Lebih Mudah - CRUDPRO

Optical Character Membuat Hidup Anda Lebih Mudah

Optical Character Recognition (OCR) mendefinisikan proses mekanis atau elektronik mengubah gambar yang dipindai dari tulisan tangan, input, atau teks yang dicetak menjadi teks yang dikodekan oleh mesin.

Dalam posting blog ini, Anda akan belajar tentang:

  • Apa itu OCR
  • Bagaimana Cara Kerja Pengenalan Karakter optical — Dijelaskan kepada Orang Non-Teknis
  • Mengapa OCR adalah gadget pemasaran baru

Teruslah membaca dan Anda akan mendapatkan jawaban yang Anda cari tanpa kebingungan.

Menjelaskan teknologi yang kompleks dapat menyebabkan teks yang sulit dibaca. Teks yang penuh dengan istilah teknis, penjelasan yang menyesatkan, dan contoh yang dipilih dengan cermat. Kami tidak dapat menjelaskan OCR tanpa menggunakan terminologi, tetapi kami akan mencoba meminimalkannya. Jadi kabar baiknya adalah Anda tidak perlu menjadi teknisi yang ahli untuk mempelajari apa itu OCR dan cara kerjanya.

Jika Anda sudah tahu apa itu OCR, lewati bagian pendahuluan. Lihat contoh cara kerjanya atau apa yang dapat dilakukan teknologi.

Apa itu OCR?

Seperti yang telah disebutkan, OCR adalah singkatan dari Optical Character Recognition. Teknik ini berkaitan dengan masalah mengenali semua jenis karakter. Itu dapat mengenali karakter tulisan tangan dan cetakan dan mengubahnya menjadi teks yang dapat dibaca mesin.

Teknik ini berkaitan dengan masalah mengenali semua jenis karakter.

Pikirkan nomor seri atau kode apa pun yang terdiri dari angka dan huruf yang perlu didigitalkan. OCR dapat digunakan untuk mengubah kode-kode ini menjadi keluaran digital. Teknik ini menggunakan berbagai teknik. Sangat sederhana, gambar yang diambil diproses sebelumnya dan teks diekstraksi dan dikenali. Beberapa saat kemudian, saya akan menjelaskan teknik yang baru saja saya sebutkan, tetapi Anda dapat langsung melompat.

Apa yang tidak diperhitungkan dalam OCR adalah sifat sebenarnya dari objek yang dipindai. Itu hanya "melihat" teks yang Anda coba konversi. Jika Anda ingin perangkat Anda mengenali sifat objek dan teks di atasnya, Anda perlu menggabungkan teknologi yang berbeda. Sebagai contoh, mari kita lihat apa yang dapat kita lakukan dengan OCR dan augmented reality.

Jika Anda ingin perangkat Anda mengenali sifat objek dan teks di atasnya, Anda perlu menggabungkan teknologi yang berbeda.

Berbagai metode OCR

Mari kita lihat tiga langkah pengenalan karakter optik, pra-pemrosesan gambar, pengenalan karakter itu sendiri, dan pasca-pemrosesan keluaran.

Pra-pemrosesan

Perangkat lunak OCR sering melakukan praproses gambar untuk meningkatkan peluang pengenalan yang berhasil. Tujuan dari image preprocessing adalah untuk memperbaiki data image. Oleh karena itu, distorsi yang tidak diinginkan ditekan dan fitur gambar tertentu ditingkatkan. Keduanya penting untuk diproses lebih lanjut.

pengenalan karakter

Di bagian pengenalan karakter yang sebenarnya, penting untuk memahami apa itu ekstraksi fitur. Jika data input ke algoritma terlalu besar untuk diproses, kumpulan fitur yang dipilih akan menjadi kecil. Fitur-fitur yang dipilih ini diharapkan menjadi fitur-fitur penting. Mengatur redundansi yang dicurigai. Performa ditingkatkan dengan menggunakan kumpulan data yang dikurangi, bukan kumpulan data besar pertama.

Ini penting dalam proses OCR karena algoritme perlu mendeteksi bagian atau bentuk tertentu dari gambar atau aliran video digital.

Pengolahan pasca

Post-processing adalah teknik koreksi kesalahan lain yang menjamin akurasi OCR. Jika output dibatasi oleh leksikon, akurasi dapat lebih ditingkatkan. Dengan cara ini, algoritme dapat kembali ke, misalnya, daftar kata yang diizinkan untuk muncul dalam dokumen yang dipindai.

Juga, dalam beberapa aplikasi, OCR digunakan tidak hanya untuk kata-kata yang sesuai, tetapi juga untuk angka dan kode. Untuk menangani berbagai jenis input dengan lebih baik, penyedia OCR telah mulai mengembangkan sistem OCR tertentu. Sistem ini dapat memproses gambar khusus. Berbagai metode optimasi telah digabungkan untuk lebih meningkatkan akurasi pengenalan. Misalnya, mereka menggunakan aturan bisnis, representasi standar, atau informasi kaya yang terkandung dalam gambar berwarna. Strategi mengintegrasikan teknik optimasi yang berbeda disebut "OCR berorientasi aplikasi" atau "OCR yang disesuaikan". Ini digunakan di bidang-bidang seperti OCR kartu nama, OCR faktur, dan OCR kartu ID.

Kemungkinan untuk menggunakan OCR

Kemungkinan untuk menggunakan perangkat lunak pengenalan karakter optik tersebar luas. Seperti yang telah disebutkan, OCR dapat dikombinasikan dengan teknologi seperti augmented reality. Tapi teknologinya sendiri sudah sangat kuat. Berikut ini adalah beberapa contoh kemungkinan kasus penggunaan yang menyertakan perangkat lunak OCR.

Proses identifikasi

Paspor dan ID Anda memiliki zona yang dapat dibaca mesin yang dapat dipindai (MRZ). OCR dapat mempercepat proses identifikasi dan pendaftaran orang di perbatasan dan pos pemeriksaan lainnya. Oleh karena itu, berguna bagi petugas imigrasi dan satpam lainnya.

Kampanye pemasaran

Ada banyak kampanye pemasaran seluler yang inovatif di luar sana. Banyak perusahaan menggunakan kode untuk mendapatkan pelanggan mereka ke dalam kompetisi kecil. Pertimbangkan semua kode voucher yang dapat dimasukkan dan digunakan pelanggan. Atau pikirkan nomor yang tercetak di bagian dalam tutup botol yang perlu Anda kumpulkan. Semua kampanye ini dapat memanfaatkan OCR dengan mengintegrasikan perangkat lunak ke dalam aplikasi yang ada. Melakukan hal itu meminimalkan rintangan pendaftaran online dan proses memasukkan serangkaian angka dan huruf.

Cari tahu bagaimana Karlsberg menggunakan OCR dalam kampanye pemasaran.

Proses pembayaran

Nomor Rekening Bank Internasional (IBAN) membantu mengidentifikasi rekening bank lintas batas. Panjang IBAN bisa bermacam-macam dan bisa terdiri dari angka dan huruf. Untuk memfasilitasi transaksi lintas batas, aplikasi perbankan dapat dengan mudah mengintegrasikan perangkat lunak OCR. Dengan begitu, pelanggan dapat memindai IBAN tanpa harus mengetikkannya.

alat OCR

Ada banyak perangkat lunak pengenalan karakter optik yang khusus untuk satu kasus penggunaan tertentu. Misalnya, scan kartu kredit dan scan dokumen. Namun, OCR membantu berbagai bagian kehidupan kita. Oleh karena itu, menggunakan perangkat lunak yang berbeda untuk setiap kasus penggunaan bisa sedikit membosankan.

Tesseract adalah mesin OCR open source yang populer di kalangan pengembang OCR. Meskipun terkadang sulit untuk diimplementasikan dan dimodifikasi, alternatif OCR yang gratis dan kuat belum ada di pasaran untuk waktu yang lama. Anyline menawarkan SDK OCR yang dapat Anda unduh secara gratis. Ini berfungsi dengan baik di seluler sebagai lawan dari Tesseract.

Tautan yang lebih nyaman