Tuesday, July 04, 2017

Bad Accuracy of Pattern Distinguisher


Hari ini aku implementasi module pattern distinguisher. Gunanya adalah mengenali kalau ada pattern dokumen yang berbeda. Inputnya adalah file pdf, module ini bisa nentuin apakah file invoice pdf dengan pattern serupa pernah dimasukkan sebelumnya, atau belum.

Kenapa perlu pattern distinguisher? Sebelum ML model nge-learning lokasi dari field tertentu, kita butuh mengkategorisasi dokumen berdasarkan patternnya. Ini cukup sulit karena GIMANA CARANYA COBA NGEPROGRAM KOMPUTER YANG BISA NGEBEDAIN TEMPLATE INVOICE PDF (kalo diketahui teks dan lokasinya).

Hari ini aku lama di eksplorasi SQLite karena kita butuh database buat nyimpen data training yang udah dimasukkan. Lama sekali nggak working setelah nyoba banyak workaround. Kebanyakan error bodoh dah, nggak perlu aku buang waktu di bug ga jelas kayak gini seharusnya. Tapi akhirnya working.

Setelah seharian implemen algo pake some kind of geometri, ternyata akurasinya nggak begitu bagus. Dua dokumen yang harusnya dari template yang sama (pattern similarity 100%), tapi cuma dianggep mirip 75%. Dan untuk hari ini aku masih nggak paham itu kenapa. Semoga besok bisa nemu bugnya.

Thao gives me these, today! Terlalu baik dah tiap hari dikasih makanan.
Makan di warung deket stasiun karena kejebak hujan ga bisa pulang

Related Articles

0 comment:

Post a Comment