Analisis Data Biologis dalam Mengidentifikasi Gen atau Protein yang Memiliki Pola Ekspresi Serupa

Penulis

  • Muhammad Haikal Akmal Universitas Islam Negeri Sumatera Utara
  • Dimas Pangestu Universitas Islam Negeri Sumatera Utara
  • Dzilhulaifa Siregar Universitas Islam Negeri Sumatera Utara
  • Khaila Mukti Harahap Universitas Islam Negeri Sumatera Utara
  • Mhd. Furqan Universitas Islam Negeri Sumatera Utara

DOI:

https://doi.org/10.55382/jurnalpustakadata.v5i1.1008

Kata Kunci:

unsupervised learning, PCA, ekspresi protein

Abstrak

Ekspresi protein dalam data biologis umumnya memiliki kompleksitas tinggi dan dimensi besar, sehingga menyulitkan pengenalan pola secara langsung. Studi ini memanfaatkan algoritma Spectral Clustering untuk mengeksplorasi struktur tersembunyi dalam kumpulan data ekspresi protein. Langkah awal mencakup pembersihan data dengan imputasi nilai hilang menggunakan metode rata-rata serta normalisasi fitur numerik menggunakan StandardScaler. Dataset terdiri dari 1.080 observasi dan 77 atribut numerik hasil percobaan pada tikus. Proses pengelompokan dilakukan dengan pendekatan berbasis graf, menggunakan parameter empat klaster dan afinitas nearest neighbors. Selanjutnya, dilakukan reduksi dimensi melalui teknik Principal Component Analysis (PCA) untuk menghasilkan representasi dua dimensi yang mudah divisualisasikan. Hasil pengelompokan memperlihatkan pemisahan yang mencerminkan perbedaan biologis antar sampel. Hal ini menunjukkan bahwa metode tak terawasi seperti Spectral Clustering efektif dalam mengungkap struktur laten pada data ekspresi protein dan dapat menjadi dasar bagi analisis klasifikasi berbasis karakteristik biologis.

Unduhan

Data unduhan belum tersedia.

##submission.downloads##

Diterbitkan

2025-06-19

Cara Mengutip

Akmal, M. H. ., Pangestu, D. ., Siregar, D. ., Harahap, K. M. ., & Furqan, M. . (2025). Analisis Data Biologis dalam Mengidentifikasi Gen atau Protein yang Memiliki Pola Ekspresi Serupa. Jurnal Pustaka Data (Pusat Akses Kajian Database, Analisa Teknologi, Dan Arsitektur Komputer), 5(1), 44–47. https://doi.org/10.55382/jurnalpustakadata.v5i1.1008