Analisis Data Biologis dalam Mengidentifikasi Gen atau Protein yang Memiliki Pola Ekspresi Serupa
DOI:
https://doi.org/10.55382/jurnalpustakadata.v5i1.1008Kata Kunci:
unsupervised learning, PCA, ekspresi proteinAbstrak
Ekspresi protein dalam data biologis umumnya memiliki kompleksitas tinggi dan dimensi besar, sehingga menyulitkan pengenalan pola secara langsung. Studi ini memanfaatkan algoritma Spectral Clustering untuk mengeksplorasi struktur tersembunyi dalam kumpulan data ekspresi protein. Langkah awal mencakup pembersihan data dengan imputasi nilai hilang menggunakan metode rata-rata serta normalisasi fitur numerik menggunakan StandardScaler. Dataset terdiri dari 1.080 observasi dan 77 atribut numerik hasil percobaan pada tikus. Proses pengelompokan dilakukan dengan pendekatan berbasis graf, menggunakan parameter empat klaster dan afinitas nearest neighbors. Selanjutnya, dilakukan reduksi dimensi melalui teknik Principal Component Analysis (PCA) untuk menghasilkan representasi dua dimensi yang mudah divisualisasikan. Hasil pengelompokan memperlihatkan pemisahan yang mencerminkan perbedaan biologis antar sampel. Hal ini menunjukkan bahwa metode tak terawasi seperti Spectral Clustering efektif dalam mengungkap struktur laten pada data ekspresi protein dan dapat menjadi dasar bagi analisis klasifikasi berbasis karakteristik biologis.
Unduhan
##submission.downloads##
Diterbitkan
Cara Mengutip
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2025 Muhammad Haikal Akmal, Dimas Pangestu, Dzilhulaifa Siregar, Khaila Mukti Harahap, Mhd. Furqan

Artikel ini berlisensi Creative Commons Attribution 4.0 International License.