Hari ke 18 : Upload file gambar text ke Google Docs

Optical Character Recognition (OCR) memungkinkan Anda ekstrak teks dari gambar dengan menggunakan algoritma komputer secara otomatis. Gambar dapat diproses secara individual (.jpg, .png, dan .gif) atau dalam dokumen PDF multi-page (.pdf). Untuk informasi lebih lanjut tentang OCR, periksa http://en.wikipedia.org/OCR.

File cocok untuk OCR dapat berasal dari beberapa sumber:

–         Gambar atau file PDF yang diperoleh menggunakan flatbed scanner

–         Foto yang diambil menggunakan kamera digital atau ponsel

Upload gambar atau file PDF digunakan untuk mengekstrak bagian-bagian teks, yang dikonversi ke dalam Google Docs.

Untuk hasil ekstraksi terbaik, gambar atau file PDF harus memenuhi persyaratan tertentu, diantaranya :

  • Resolusi : file dengan resolusi tinggi akan bekerja dengan baik. Sebagai aturan praktis, sebaiknya setiap baris teks dalam dokumen menjadi setidaknya 10 pixel height.
  • Orientasi : Hanya dokumen dengan teks kiri-ke-kanan secara horisontal yang dikenal. Jika Anda secara tidak sengaja telah scan atau capture dokumen dalam orientasi yang berbeda, silahkan menggunakan program manipulasi gambar untuk memutar foto sebelum meng-upload ke Google Docs.
  • Bahasa, huruf dan rangkaian karakter : mesin OCR hanya mendukung set karakter Latin pada tahap ini, jadi untuk contoh teks bahasa Jepang, teks Arab, atau tangan teks tertulis tidak akan terdeteksi. Common font seperti Arial dan Times New Roman akan menghasilkan hasil terbaik.
  • Kualitas gambar : gambar sharp bahkan dengan pencahayaan dan kontras jelas akan bekerja terbaik. Motion blur atau fokus kamera yang buruk akan menurunkan kualitas teks dideteksi.

Keterbatasan ukuran file

Ukuran maksimum untuk gambar (.jpg, .png, dan .gif) dan file PDF (.pdf) adalah 2MB. Untuk file PDF, kita hanya melihat 10 halaman pertama ketika mencari teks untuk mengekstrak.

Pengolahan waktu

OCR dapat memakan waktu lebih lama dari upload lain ke Google Docs. Dalam banyak kasus, berikut waktu pemrosesan :

–         file Gambar (.jpg, .png, dan .gif) dapat berlangsung hingga 30 detik

–         file PDF (.pdf) dapat berlangsung hingga semenit

Catatan :

Ketika pengolahan dokumen Anda, elemen seperti format teks dasar seperti teks tebal dan miring, ukuran font dan jenis, dan jeda baris, pendektesian tidak selalu berhasil. Demikian halnya dengan format teks dan penataan elemen seperti bullet dan nomor daftar, tabel, kolom teks, catatan kaki atau catatan akhir dan kemungkinan untuk hilang.

Berikut langkah – langkah untuk upload dan convert file image text :

1. Setelah Anda login ke email SBM Anda (http://mail.sbm-itb.ac.id), klik pada documents atau ketik http://docs.sbm-itb.ac.id.

Open Docs

2. Klik tombol Upload.

Select Uploads

3. Pilih file yang akan di upload, beri tanda checklist (v) pada option Convert text from PDF or image… dan akan diproses selama upload berlangsung.

Select Uploads

4. Upload berhasil, klik pada link file untuk melihat hasilnya atau klik << Back to Google Docs untuk kembali ke halaman depan Google Docs.

Upload Success

5. Berikut hasil upload file image text dengan format .jpg.

Result2

Selamat mencoba….Happy googling…. 🙂

<< Prev Tips