研究目的
Mengembangkan sistem Optical Character Recognition (OCR) menggunakan algoritma Template Matching Correlation untuk mengkonversi citra digital menjadi teks dengan akurasi yang baik.
研究成果
Algoritma Template Matching Correlation efektif untuk pengenalan karakter huruf cetak dengan rata-rata akurasi 92,90%. Sistem yang dibangun dapat mengkonversi citra digital ke teks dengan baik, namun dapat ditingkatkan dengan penambahan proses ekstraksi ciri dan perluasan ke huruf tulisan tangan.
研究不足
Sistem hanya efektif untuk huruf cetak, tidak untuk tulisan tangan. Membutuhkan banyak data referensi template untuk hasil optimal. Preprocessing mungkin tidak menghilangkan semua gangguan dalam citra.
1:Experimental Design and Method Selection:
Sistem OCR dirancang dengan proses preprocessing (binerisasi, segmentasi, normalisasi) dan pengenalan menggunakan algoritma Template Matching Correlation.
2:Sample Selection and Data Sources:
Citra uji digital dalam format BMP atau JPG dengan berbagai jenis huruf (Arial, Times New Roman, Comic Sans MS, Cambria, Courier New) dan ukuran (12pt, 20pt, 36pt) digunakan sebagai input.
3:List of Experimental Equipment and Materials:
Komputer PC dengan spesifikasi tertentu, perangkat lunak MATLAB
4:12 (R2011a), dan sistem operasi Windows 7 Professional. Experimental Procedures and Operational Workflow:
Citra dimasukkan, preprocessing dilakukan (binerisasi menggunakan metode Otsu, segmentasi, normalisasi dengan interpolasi bicubic), lalu pengenalan karakter dengan Template Matching Correlation, dan hasil disimpan sebagai file teks.
5:Data Analysis Methods:
Tingkat keberhasilan dihitung berdasarkan persentase karakter yang dikenali dengan benar dari total karakter dalam citra.
独家科研数据包,助您复现前沿成果,加速创新突破
获取完整内容