Penggunaan Fitur Kimia Fisik dan Posisi Atom untuk Prediksi Struktur Sekunder Protein

Abstract

Prediksi struktur sekunder protein adalah salah satumasalah yang sudah lama dibahas dalam bidang bioinformatika.Berbagai metode telah diterapkan namun masalah akurasibelum mencapai hasil yang maksimal. Penelitian ini dilakukanuntuk membangun suatu model prediksi struktur sekunderprotein dengan menggunakan decision tree dengan fitur kimiafisik dan posisi atom. Penentuan setiap kelas dalam prosesklasifikasi struktur sekunder protein dalam penelitian iniberdasarkan pembelajaran terhadap pola masukan dalam prosespelatihan. Data diperoleh dari Protein Data Bank (PDB) padaalamat http://www.rcsb.org/. Sementara informasi struktursekunderproteindiperolehmelaluialamatwebsitehttp://swift.cmbi.ru.nl/gv/dssp/. Sejumlah 75809 alpha-helix (H),41785 untuk bheta-sheet (E), dan 80346 untuk coil (C) digunakansebagai data set pada penelitian ini. Pola masukan diperolehmelalui proses sliding window dari sekuen asam amino denganekstraksi fitur kimia fisik dan posisi atom. Model prediksidengan cross validation tanpa fitur posisi atom menghasilkannilai akurasi 90.49%, sedangkan untuk pengujian denganunknown data akurasinya menurun menjadi 51.29%. Akurasimenggunakan fitur posisi atom sebesar 90.17% dengan crossvalidation dan 50.83% jika diujikan pada unknown data.Kata Kunci— asam amino, decision tree, kimiafisik, prediksistruktur protein, posisi atom