SKB CPNS Analis Data Ilmiah Ahli Pertama 2026: Materi, Soal & Tryout Lengkap

Fakta: Lebih dari 80% peserta gagal di tahap SKB bukan karena tidak pintar, tapi karena salah fokus belajar.

Kalau kamu sedang mempersiapkan SKB CPNS untuk jabatan Analis Data Ilmiah Ahli Pertama, halaman ini akan jadi senjata utama kamu. 🔥

Banyak peserta CPNS gugur di tahap SKB karena kurang memahami materi jabatan yang diujikan. Untuk membantu kamu lebih siap, halaman ini menyajikan materi, contoh soal, dan tryout SKB CPNS khusus untuk jabatan Analis Data Ilmiah Ahli Pertama, agar proses belajar jadi lebih fokus dan peluang lulus semakin besar.

Materi Pokok SKB CPNS Analis Data Ilmiah Ahli Pertama

Materi pokok SKB CPNS untuk jabatan Analis Data Ilmiah Ahli Pertama berikut merangkum ruang lingkup kompetensi, pengetahuan teknis, dan tugas jabatan yang menjadi fokus penilaian dalam seleksi SKB CPNS. Pelajari setiap bagian secara bertahap agar pemahaman lebih menyeluruh.

  • Pengenalan ilmu data dalam Analis Data Ilmiah
  • Penelusuran dan pengelolaan data dan informasi ilmiah
  • Rancangan kerja Analisis Data Ilmiah
  • Pengumpulan dan persiapan data
  • Manajemen data
  • Basis data
  • Data mining
  • Analisis dan interpretasi data

Simulasi Tryout SKB CPNS Analis Data Ilmiah Ahli Pertama

Melalui simulasi tryout SKB CPNS untuk jabatan Analis Data Ilmiah Ahli Pertama, kamu bisa berlatih soal yang mendekati ujian sebenarnya sekaligus mengevaluasi kesiapan sebelum menghadapi tes SKB.

Tryout
Tryout untuk jabatan ini akan tersedia

Kami sedang menyiapkan paket tryout SKB khusus untuk Analis Data Ilmiah Ahli Pertama. Nantinya kamu bisa latihan soal sesuai kisi-kisi resmi dan dapat pembahasan lengkap.

  • Soal sesuai materi pokok jabatan
  • Pembahasan detail & indikator kompetensi
  • Skor otomatis + pembanding nasional
Coming soon

Contoh Soal SKB CPNS Analis Data Ilmiah Ahli Pertama

Berikut contoh soal SKB CPNS untuk jabatan Analis Data Ilmiah Ahli Pertama.

Soal 1
Ilmu data (data science) dalam konteks Analis Data Ilmiah mencakup integrasi berbagai disiplin ilmu. Manakah kombinasi disiplin ilmu yang paling tepat membentuk fondasi utama ilmu data?
A. Ekonomi, Sosiologi, dan Politik
B. Kimia, Fisika, dan Teknik
C. Psikologi, Pendidikan, dan Sejarah
D. Statistik, Ilmu Komputer, dan Pengetahuan Domain
E. Matematika, Biologi, dan Fisika
Jawaban: D
Ilmu data merupakan bidang interdisipliner yang mengintegrasikan statistik untuk analisis inferensial, ilmu komputer untuk pemrosesan dan algoritma, serta pengetahuan domain/substansi untuk interpretasi hasil yang bermakna. Kombinasi ini memungkinkan Analis Data Ilmiah mengolah data mentah menjadi wawasan yang dapat ditindaklanjuti.
Soal 2
Tahapan dalam siklus hidup data (data lifecycle) yang tepat untuk seorang Analis Data Ilmiah dimulai dari...
A. Pengumpulan data
B. Preservasi data
C. Perencanaan
D. Publikasi data
E. Analisis data
Jawaban: C
Siklus hidup data yang ideal dimulai dari perencanaan (menentukan tujuan dan kebutuhan data), kemudian pengumpulan data, pemrosesan, analisis, preservasi, dan berbagi data. Perencanaan menjadi fondasi agar seluruh tahapan berikutnya terarah dan efisien.
Soal 3
Perbedaan utama antara data terstruktur (structured data) dan data tidak terstruktur (unstructured data) adalah...
A. Data terstruktur memiliki format dan skema tetap, data tidak terstruktur tidak memiliki format baku
B. Data terstruktur membutuhkan kapasitas penyimpanan lebih besar
C. Data terstruktur hanya berasal dari sumber internal, data tidak terstruktur dari sumber eksternal
D. Data terstruktur tidak dapat dicari, data tidak terstruktur mudah dicari
E. Data terstruktur lebih sulit dianalisis dibanding data tidak terstruktur
Jawaban: A
Data terstruktur memiliki format tetap dengan skema yang telah ditentukan (seperti tabel dalam basis data relasional), sedangkan data tidak terstruktur tidak memiliki model data yang telah ditentukan sebelumnya (seperti teks, gambar, video, atau audio).
Soal 4
Kegiatan penelusuran data ilmiah yang valid dan kredibel sebaiknya diprioritaskan pada sumber-sumber berikut, KECUALI...
A. Data resmi dari BPS atau kementerian terkait
B. Repositori institusi seperti RIN atau BRIN
C. Jurnal ilmiah terindeks Scopus atau Web of Science
D. Blog pribadi peneliti
E. Publikasi dari lembaga penelitian terakreditasi
Jawaban: D
Data ilmiah yang valid dan kredibel bersumber dari jurnal terindeks bereputasi, data resmi pemerintah, repositori institusi, dan publikasi ilmiah terpercaya. Blog pribadi tidak melalui proses peer-review dan tidak memiliki otoritas keilmuan yang dapat dipertanggungjawabkan.
Soal 5
Strategi penelusuran literatur ilmiah yang efektif menggunakan metode operator Boolean. Fungsi operator 'AND' dalam pencarian basis data ilmiah adalah...
A. Memperluas pencarian dengan salah satu kata kunci muncul
B. Mempersempit pencarian dengan mengharuskan kedua kata kunci muncul
C. Mencari kata kunci dengan urutan yang tepat
D. Mengurangi hasil pencarian dengan mengecualikan kata kunci tertentu
E. Mencari kata kunci dalam judul artikel saja
Jawaban: B
Operator Boolean AND digunakan untuk mempersempit hasil pencarian dengan mengharuskan kedua kata kunci muncul bersama dalam dokumen yang sama. Hal ini berbeda dengan OR yang memperluas pencarian. Semakin banyak operator AND yang digunakan, hasil pencarian akan semakin spesifik dan terbatas. [cite: 1354, 1355, 1356]
Soal 6
Dalam rancangan kerja analisis data ilmiah, komponen 'ruang lingkup' (scope) pada kerangka analisis sebaiknya mendefinisikan...
A. Jadwal libur tim peneliti
B. Nama-nama peneliti yang terlibat
C. Batasan variabel, periode waktu, dan cakupan geografis penelitian
D. Jumlah halaman laporan akhir
E. Anggaran yang diperlukan untuk penelitian
Jawaban: C
Ruang lingkup dalam rancangan kerja analisis data ilmiah harus secara jelas mendefinisikan batasan variabel, periode waktu, cakupan geografis, dan subjek penelitian. Hal ini penting untuk memastikan analisis tetap fokus dan hasilnya tidak melampaui batasan data yang tersedia.
Soal 7
Prinsip SMART dalam perumusan tujuan analisis data ilmiah memiliki kepanjangan yang tepat, yaitu...
A. Systematic, Meaningful, Actionable, Reproducible, Traceable
B. Simple, Measurable, Accurate, Reliable, Testable
C. Structured, Managed, Analyzed, Reported, Transferred
D. Standard, Minimum, Average, Range, Total
E. Specific, Measurable, Achievable, Relevant, Time-bound
Jawaban: E
Prinsip SMART adalah kriteria perumusan tujuan yang efektif: Specific (spesifik, tidak ambigu), Measurable (terukur secara kuantitatif/kualitatif), Achievable (dapat dicapai dengan sumber daya yang ada), Relevant (relevan dengan kebutuhan), dan Time-bound (memiliki batas waktu yang jelas).
Soal 8
Dalam pengumpulan data primer untuk penelitian ilmiah, teknik sampling yang memberikan peluang yang diketahui (known) dan bukan nol bagi setiap anggota populasi untuk terpilih disebut...
A. Probability sampling
B. Convenience sampling
C. Purposive sampling
D. Quota sampling
E. Snowball sampling
Jawaban: A
Probability sampling adalah teknik sampling di mana setiap elemen populasi memiliki peluang yang diketahui dan bukan nol untuk terpilih menjadi sampel. Definisi 'peluang yang sama' secara spesifik merujuk pada Simple Random Sampling, namun untuk kategori besar Probability Sampling, syarat utamanya adalah peluang tersebut dapat dihitung dan tidak nol.
Soal 9
Tahapan data cleaning (pembersihan data) yang bertujuan menangani nilai outlier adalah...
A. Mengidentifikasi dan menangani nilai ekstrem yang tidak wajar
B. Menstandarisasi penulisan huruf kapital
C. Menghapus semua data yang kosong (missing value)
D. Mengubah format tanggal menjadi seragam
E. Menghapus data duplikat
Jawaban: A
Outlier adalah nilai ekstrem yang berbeda secara signifikan dari sebagian besar data. Penanganan outlier dapat dilakukan dengan identifikasi (menggunakan boxplot, z-score, atau IQR), kemudian tindakan koreksi, imputasi, atau penghapusan sesuai konteks keilmuan.
Soal 10
Tingkat pengukuran data yang memiliki nilai nol mutlak (absolute zero) sehingga perbandingan rasio dapat dilakukan secara bermakna adalah...
A. Rasio
B. Likert
C. Interval
D. Ordinal
E. Nominal
Jawaban: A
Skala rasio adalah tingkat pengukuran tertinggi dengan karakteristik: memiliki urutan (order), jarak yang sama (interval), dan nilai nol yang bermakna (absolute zero). Contoh: berat badan, tinggi badan, pendapatan, usia, dan jumlah. Dengan nol mutlak, pernyataan 'dua kali lebih berat' menjadi bermakna.
Soal 11
Manajemen data ilmiah yang baik menurut Peraturan BRIN Nomor 2 Tahun 2025 tentang Tata Kelola Data Riset dan Inovasi mewajibkan setiap data riset memiliki...
A. Format file rahasia
B. Hak paten eksklusif
C. Harga jual komersial
D. Tanda tangan basah peneliti
E. Metadata terstandar dan produsen data yang jelas
Jawaban: E
Peraturan BRIN Nomor 2 Tahun 2025 tentang Tata Kelola Data Riset dan Inovasi mengatur bahwa setiap data riset harus memiliki metadata yang terstandar, produsen data yang jelas, dan penanggung jawab data yang ditetapkan untuk menjamin akuntabilitas dan traceability data sepanjang siklus hidupnya.
Soal 12
Prinsip FAIR dalam manajemen data ilmiah merupakan akronim dari...
A. Findable, Accessible, Interoperable, Reusable
B. Flexible, Adaptive, Innovative, Responsive
C. Factual, Analytical, Interpretive, Representational
D. Formatted, Archived, Indexed, Referenced
E. Fast, Accurate, Integrated, Reliable
Jawaban: A
Prinsip FAIR adalah standar internasional untuk manajemen data ilmiah yang baik: Findable (dapat ditemukan melalui metadata yang kaya), Accessible (dapat diakses dengan protokol standar), Interoperable (dapat diintegrasikan dengan sistem lain), dan Reusable (dapat digunakan ulang dengan lisensi yang jelas).
Soal 13
Dalam basis data relasional, fungsi FOREIGN KEY adalah...
A. Kunci yang mengurutkan data secara otomatis
B. Kunci yang membatasi jumlah data dalam tabel
C. Kunci yang digunakan untuk mempercepat pencarian data
D. Kunci yang merujuk ke primary key tabel lain untuk menghubungkan tabel
E. Kunci utama yang mengidentifikasi setiap baris secara unik
Jawaban: D
Foreign key adalah kolom atau kumpulan kolom dalam suatu tabel yang merujuk pada PRIMARY KEY di tabel lain. Foreign key digunakan untuk membangun relasi antar tabel dan menjaga referential integrity, memastikan bahwa nilai dalam foreign key harus ada di tabel yang dirujuk.
Soal 14
Perintah SQL yang digunakan untuk mengambil data dari database adalah...
A. INSERT
B. CREATE
C. DELETE
D. UPDATE
E. SELECT
Jawaban: E
SELECT adalah perintah DQL (Data Query Language) dalam SQL yang berfungsi untuk mengambil atau menampilkan data dari satu atau lebih tabel dalam database. SELECT dapat dikombinasikan dengan WHERE, ORDER BY, GROUP BY, dan klausa lainnya. [cite: 1378, 1379, 1380]
Soal 15
Dalam data mining, teknik yang digunakan untuk menemukan kelompok-kelompok data yang memiliki kemiripan karakteristik tanpa adanya label kelas sebelumnya disebut...
A. Clustering
B. Regresi
C. Klasifikasi
D. Prediksi
E. Asosiasi
Jawaban: A
Clustering adalah teknik unsupervised learning yang bertujuan mengelompokkan data berdasarkan kemiripan atribut tanpa adanya label kelas yang telah ditentukan sebelumnya. Contoh algoritma clustering: K-Means, Hierarchical Clustering, DBSCAN.
Soal 16
Algoritma data mining Apriori digunakan untuk menemukan...
A. Klasifikasi ke dalam kategori
B. Pola asosiasi antar item dalam transaksi
C. Deteksi outlier
D. Pengelompokan data berdasarkan kemiripan
E. Prediksi nilai numerik
Jawaban: B
Algoritma Apriori adalah algoritma association rule mining yang digunakan untuk menemukan hubungan asosiatif atau pola 'if-then' antar item dalam dataset transaksional. Contoh penerapan: market basket analysis untuk mengetahui produk yang sering dibeli bersamaan.
Soal 17
Interpretasi data ilmiah yang valid harus mempertimbangkan ukuran effect size karena...
A. Effect size sama dengan nilai p-value
B. Effect size menghilangkan kebutuhan akan standar deviasi
C. Effect size hanya digunakan untuk data kualitatif
D. Effect size mengukur besaran dampak praktis, melengkapi signifikansi statistik
E. Effect size menggantikan uji hipotesis
Jawaban: D
Effect size mengukur besarnya dampak atau kekuatan hubungan antar variabel, tidak hanya signifikansi statistik. Nilai p-value yang kecil (signifikan) belum tentu berarti dampaknya penting secara praktis jika effect size-nya kecil. Effect size membantu peneliti menilai makna praktis dari temuan.
Soal 18
Jenis visualisasi data yang paling tepat untuk menunjukkan distribusi frekuensi dari suatu variabel kontinu adalah...
A. Scatter plot
B. Bar chart
C. Pie chart
D. Histogram
E. Line chart
Jawaban: D
Histogram adalah grafik yang menampilkan distribusi frekuensi data kontinu dengan membagi rentang nilai ke dalam interval (bin) dan menampilkan frekuensi setiap interval. Histogram efektif untuk melihat bentuk distribusi data (normal, skewed, bimodal), kemunculan outlier, dan sebaran data secara keseluruhan.
Soal 19
Uji statistik parametrik yang tepat untuk membandingkan rata-rata dua kelompok independen adalah...
A. Independent t-test
B. Paired t-test
C. Chi-square
D. ANOVA satu arah
E. Mann-Whitney U
Jawaban: A
Independent t-test (atau two-sample t-test) adalah uji parametrik yang digunakan untuk membandingkan rata-rata dua kelompok yang independen/tidak berpasangan, dengan asumsi data berdistribusi normal dan varians homogen.
Soal 20
Korelasi Pearson digunakan untuk mengukur...
A. Prediksi nilai variabel dependen
B. Hubungan linear antara dua variabel kontinu
C. Hubungan kausal antar variabel
D. Perbedaan rata-rata antar kelompok
E. Pengelompokan data berdasarkan kemiripan
Jawaban: B
Korelasi Pearson (r) mengukur kekuatan dan arah hubungan linear antara dua variabel kontinu. Nilai r berkisar antara -1 hingga +1, di mana -1 menunjukkan korelasi negatif sempurna, +1 korelasi positif sempurna, dan 0 tidak ada korelasi linear.
Soal 21 Premium
Konsep 'Big Data' dalam ilmu data dicirikan oleh 5V. Kelima V tersebut adalah...
A. Volume, Velocity, Variety, Veracity, Value
B. Variable, Vector, Virtual, Visual, Verbal
C. Vertical, Voluntary, Verified, Valuable, Vast
D. Volume, Vision, Verification, Validation, Visualization
E. Value, Variation, Viability, Volatility, Virtuality
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 22 Premium
Seorang Analis Data Ilmiah mendapatkan tugas untuk menganalisis data genomik yang berukuran sangat besar (ratusan GB) dengan struktur yang kompleks. Pendekatan komputasi yang paling tepat untuk menangani skala data tersebut adalah...
A. Analisis manual menggunakan kalkulator
B. Google Sheets dengan formula dasar
C. Microsoft Excel dengan pivot table
D. Komputasi terdistribusi menggunakan Hadoop atau Spark
E. SPSS dengan analisis statistik standar
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 23 Premium
Dalam penelusuran informasi ilmiah, seorang Analis Data Ilmiah menemukan artikel yang tidak memiliki informasi tahun publikasi, volume, dan nomor halaman, serta tidak terindeks di database bereputasi. Berdasarkan kaidah keilmuan, sumber tersebut sebaiknya...
A. Disimpan untuk referensi pribadi
B. Dikutip tanpa mencantumkan metadata yang hilang
C. Ditinggalkan dan mencari sumber terindeks yang lengkap
D. Digunakan hanya untuk data pendukung
E. Tetap digunakan dengan mencantumkan disclaimer
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 24 Premium
Seorang Analis Data Ilmiah menggunakan aplikasi manajemen referensi Zotero/Mendeley dalam penelusuran literatur. Fitur yang paling membantu untuk secara otomatis mengekstrak metadata dari file PDF adalah...
A. Duplicate detection
B. Note taking
C. Group library sharing
D. Citation formatting
E. PDF metadata extraction
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 25 Premium
Dalam menyusun rancangan kerja analisis data ilmiah, seorang Analis Data Ilmiah perlu mengidentifikasi potensi bias. Bias yang terjadi karena partisipan yang bertahan dalam studi memiliki karakteristik berbeda dengan yang drop out disebut...
A. Confounding bias
B. Publication bias
C. Attrition bias
D. Selection bias
E. Recall bias
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 26 Premium
Dalam rancangan kerja analisis data, penentuan ukuran sampel (sample size) yang tepat harus mempertimbangkan...
A. Jumlah variabel yang tersedia dalam dataset
B. Anggaran penelitian saja
C. Effect size, alpha, power, dan desain penelitian
D. Preferensi pribadi peneliti
E. Jumlah peneliti yang tersedia
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 27 Premium
Dalam pengumpulan data primer melalui survei, seorang Analis Data Ilmiah menemukan tingkat non-response rate yang tinggi (45%). Tindakan yang paling tepat untuk mengatasi potensi bias akibat non-response adalah...
A. Mengabaikan non-response dan melanjutkan analisis
B. Melakukan follow-up pada non-responden dan membandingkan karakteristiknya
C. Mengganti non-responden dengan data fiktif
D. Menghapus seluruh data survei
E. Memperkecil target sampel awal
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 28 Premium
Seorang Analis Data Ilmiah menerima dataset dengan nilai missing pada variabel pendapatan sebesar 30%. Metode imputasi yang paling tepat untuk menangani missing pada data dengan distribusi skewed adalah...
A. Penghapusan seluruh baris dengan missing (listwise deletion)
B. Mode imputation
C. Penghapusan variabel pendapatan dari analisis
D. Mean imputation
E. Median imputation
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 29 Premium
Dalam persiapan data, proses normalisasi data dengan metode Min-Max scaling akan mengubah data ke dalam rentang...
A. [0, 1]
B. [0, ∞]
C. [-∞, ∞]
D. [-1, 1]
E. [1, 100]
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 30 Premium
Peraturan BRIN Nomor 2 Tahun 2025 tentang Tata Kelola Data Riset dan Inovasi mengatur bahwa data riset yang dihasilkan dari kegiatan riset dan inovasi yang dibiayai oleh APBN wajib...
A. Dikelola dan disimpan dalam repositori yang ditetapkan BRIN
B. Dijual kepada pihak komersial untuk pendapatan negara
C. Dirahasiakan secara permanen
D. Dimusnahkan setelah proyek selesai
E. Diberikan secara eksklusif kepada peneliti utama
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 31 Premium
Dalam manajemen data ilmiah, Data Management Plan (DMP) atau Rencana Pengelolaan Data harus mencakup komponen berikut, KECUALI...
A. Standar metadata yang akan digunakan
B. Rencana preservasi data jangka panjang
C. Kebijakan akses dan pembagian data
D. Jenis data dan format file yang akan dihasilkan
E. Rincian gaji setiap peneliti
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 32 Premium
Seorang Analis Data Ilmiah diminta untuk mengintegrasikan data dari beberapa tabel dalam basis data relasional untuk analisis. Hubungan antara tabel 'Peneliti' (dengan kolom: id_peneliti, nama) dan tabel 'Publikasi' (dengan kolom: id_publikasi, id_peneliti, judul) adalah...
A. One-to-many
B. Many-to-many
C. Zero-to-many
D. One-to-one
E. Many-to-one
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 33 Premium
Dalam basis data, proses indexing pada tabel database bertujuan untuk...
A. Mengenkripsi data dalam database
B. Membatasi jumlah data yang dapat disimpan
C. Mempercepat operasi pencarian dan pengambilan data
D. Mengamankan data dari akses tidak sah
E. Mengurangi redundansi data
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 34 Premium
Perintah SQL berikut yang benar untuk menghitung nilai rata-rata dari kolom 'score' dalam tabel 'hasil_penelitian' adalah...
A. SELECT MEAN(score) FROM hasil_penelitian
B. SELECT AVG(score) FROM hasil_penelitian
C. SELECT SUM(score) FROM hasil_penelitian
D. SELECT COUNT(score) FROM hasil_penelitian
E. SELECT TOTAL(score) FROM hasil_penelitian
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 35 Premium
Seorang Analis Data Ilmiah melakukan data mining pada dataset catatan medis elektronik. Teknik yang paling tepat untuk menemukan pola kombinasi diagnosis yang sering muncul bersamaan pada pasien adalah...
A. Regresi linear
B. Association rule mining dengan Apriori
C. Klasifikasi dengan decision tree
D. Analisis deret waktu
E. Clustering dengan K-Means
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 36 Premium
Dalam evaluasi model klasifikasi data mining, metrik yang mengukur proporsi positif yang diidentifikasi dengan benar dari seluruh data yang benar-benar positif disebut...
A. F1-Score
B. Recall
C. Specificity
D. Precision
E. Accuracy
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 37 Premium
Seorang Analis Data Ilmiah membangun model prediksi menggunakan dataset dengan jumlah fitur (variabel) yang sangat besar (high-dimensional data). Teknik yang paling tepat untuk mengurangi dimensi tanpa kehilangan informasi signifikan adalah...
A. Principal Component Analysis (PCA)
B. Normalisasi data
C. Imputasi missing value
D. One-hot encoding
E. Feature scaling
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 38 Premium
Dalam interpretasi hasil analisis regresi linear berganda, nilai R-squared (R²) yang mendekati 1 mengindikasikan bahwa...
A. Sebagian besar variasi variabel dependen dapat dijelaskan oleh model
B. Model tidak memiliki variabel prediktor yang signifikan
C. Data tidak berdistribusi normal
D. Tidak ada hubungan antar variabel
E. Model mengalami overfitting yang parah
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 39 Premium
Seorang Analis Data Ilmiah menemukan bahwa data yang dianalisis tidak memenuhi asumsi normalitas untuk uji parametrik. Uji alternatif non-parametrik yang tepat untuk membandingkan dua kelompok independen adalah...
A. Paired t-test
B. Wilcoxon signed-rank test
C. Kruskal-Wallis test
D. Friedman test
E. Mann-Whitney U test
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 40 Premium
Dalam visualisasi data ilmiah, penggunaan grafik batang (bar chart) dengan sumbu Y yang tidak dimulai dari nol (zero baseline) dapat menyebabkan...
A. Distorsi persepsi perbedaan antar kelompok
B. Tidak ada dampak pada interpretasi
C. Penghematan ruang tampilan yang efisien
D. Peningkatan akurasi interpretasi data
E. Kemudahan dalam membaca nilai presisi
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 41 Premium
Seorang Analis Data Ilmiah melakukan analisis deret waktu (time series analysis) pada data curah hujan 10 tahunan. Komponen musiman (seasonal component) dalam data deret waktu mengacu pada...
A. Perubahan struktural akibat kebijakan
B. Nilai outlier ekstrem yang tidak biasa
C. Pola berulang dalam periode waktu tetap, seperti tahunan atau bulanan
D. Tren jangka panjang yang terus meningkat
E. Fluktuasi acak yang tidak dapat diprediksi
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 42 Premium
Berdasarkan Peraturan BRIN Nomor 2 Tahun 2025, produsen data (data producer) dalam tata kelola data riset dan inovasi memiliki kewajiban untuk...
A. Mengabaikan standar metadata yang ditetapkan
B. Memusnahkan data setelah publikasi artikel
C. Mendokumentasikan data dan mengunggahnya ke repositori BRIN
D. Membatasi akses data hanya untuk dirinya sendiri
E. Menjual data kepada pihak manapun untuk keuntungan pribadi
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 43 Premium
Dalam konteks Satu Data Indonesia (Perpres Nomor 39 Tahun 2019), data yang akan dibagikan antar kementerian/lembaga harus memenuhi standar tertentu. Standar yang dimaksud mencakup...
A. Standar metadata, standar kode referensi/data induk, dan standar skema data
B. Standar harga data dan standar lisensi komersial
C. Standar bahasa pemrograman dan standar sistem operasi
D. Standar jumlah pengguna dan standar frekuensi update
E. Standar kecepatan akses dan standar kapasitas penyimpanan
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 44 Premium
Seorang Analis Data Ilmiah perlu melakukan query SQL untuk mengambil 10 record pertama dari tabel 'dataset_penelitian' yang diurutkan berdasarkan 'tanggal_input' terbaru. Query yang benar adalah...
A. SELECT * FROM dataset_penelitian ORDER BY tanggal_input DESC LIMIT 10
B. SELECT * FROM dataset_penelitian WHERE ROWNUM <= 10 ORDER BY tanggal_input DESC
C. SELECT FIRST 10 * FROM dataset_penelitian ORDER BY tanggal_input
D. SELECT TOP 10 * FROM dataset_penelitian ORDER BY tanggal_input ASC
E. SELECT * FROM dataset_penelitian LIMIT 10 ORDER BY tanggal_input DESC
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 45 Premium
Dalam data mining, masalah 'overfitting' pada model prediktif terjadi ketika model...
A. Hanya bekerja pada data kategorikal
B. Tidak dapat melakukan prediksi sama sekali
C. Terlalu kompleks dan belajar noise dari data training
D. Terlalu sederhana untuk menangkap pola dalam data
E. Memiliki akurasi yang sama pada data training dan testing
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 46 Premium
Seorang Analis Data Ilmiah menggunakan metode cross-validation dalam evaluasi model. Metode k-fold cross-validation dengan k=10 berarti...
A. Model dilatih 10 kali dengan parameter yang berbeda
B. 10% data digunakan untuk testing, 90% untuk training, satu kali proses
C. Data dibagi menjadi 10 bagian, 9 bagian untuk testing, 1 untuk training
D. Proses validasi diulang 10 kali dengan data training yang sama
E. Data dibagi menjadi 10 bagian, setiap bagian bergantian menjadi data testing
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 47 Premium
Dalam analisis interpretasi data, confounder (variabel perancu) adalah variabel yang...
A. Berhubungan dengan independen dan dependen, menciptakan asosiasi semu
B. Meningkatkan validitas internal penelitian
C. Hanya berhubungan dengan variabel dependen
D. Hanya berhubungan dengan variabel independen
E. Tidak memiliki hubungan dengan variabel apapun
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 48 Premium
Seorang Analis Data Ilmiah menyajikan data dalam bentuk boxplot. Dari boxplot tersebut, titik-titik di luar 'whisker' (garis vertikal dari box) mengindikasikan adanya...
A. Data yang hilang (missing values)
B. Nilai rata-rata (mean) dari data
C. Data yang telah dinormalisasi
D. Nilai median dari data
E. Outlier atau nilai ekstrem
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 49 Premium
Dalam penelitian ilmiah, p-hacking (atau data dredging) mengacu pada praktik yang tidak etis yaitu...
A. Melakukan banyak uji statistik hingga menemukan hasil signifikan secara tidak sah
B. Mempublikasikan data mentah untuk transparansi
C. Menggunakan software statistik berlisensi
D. Melakukan uji normalitas sebelum uji parametrik
E. Menggunakan teknik machine learning untuk analisis
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses
Soal 50 Premium
Seorang Analis Data Ilmiah diminta membandingkan efektivitas tiga metode pembelajaran (A, B, C) terhadap hasil ujian siswa. Uji statistik yang paling tepat untuk menganalisis perbedaan rata-rata dari tiga kelompok independen tersebut adalah...
A. Paired t-test
B. Mann-Whitney U test
C. One-way ANOVA
D. Chi-square test
E. Independent t-test
🔒 Soal Premium
Upgrade untuk melihat pembahasan lengkap
Buka Akses

Tips Lulus SKB CPNS Analis Data Ilmiah Ahli Pertama

Agar peluang lulus SKB CPNS untuk jabatan Analis Data Ilmiah Ahli Pertama semakin besar, peserta perlu memahami karakter soal dan fokus pada kompetensi yang diuji. Berikut beberapa tips yang dapat diterapkan saat persiapan hingga pelaksanaan SKB CPNS.

  • Pahami materi pokok jabatan. Pelajari kompetensi teknis, tugas, dan fungsi jabatan secara menyeluruh agar jawaban tetap relevan.
  • Latihan soal SKB secara rutin. Biasakan menjawab soal esai atau studi kasus untuk melatih alur berpikir dan ketepatan jawaban.
  • Perhatikan konteks instansi. Sesuaikan jawaban dengan peran jabatan di instansi yang dilamar.
  • Susun jawaban secara sistematis. Gunakan poin atau langkah yang jelas agar mudah dipahami oleh penguji.
  • Ikuti tryout SKB. Tryout membantu mengukur kesiapan, mengatur waktu, dan mengenali pola penilaian.

Persiapan yang matang menjadi kunci utama dalam menghadapi SKB CPNS. Dengan mempelajari materi pokok, berlatih soal, dan mengikuti tryout SKB CPNS untuk jabatan Analis Data Ilmiah Ahli Pertama, peserta dapat meningkatkan pemahaman dan kepercayaan diri sebelum ujian. Semoga panduan ini membantu perjalananmu menuju kelulusan CPNS.

Pertanyaan Seputar SKB CPNS Analis Data Ilmiah Ahli Pertama

SKB CPNS Analis Data Ilmiah Ahli Pertama adalah seleksi kompetensi bidang yang menguji kemampuan teknis sesuai jabatan yang dilamar.
Materi SKB CPNS Analis Data Ilmiah Ahli Pertama meliputi materi teknis jabatan, regulasi terkait, serta tugas dan fungsi jabatan.
Jumlah soal SKB CPNS umumnya berkisar 80 hingga 100 soal dalam bentuk pilihan ganda, dengan durasi pengerjaan 90 menit. Soal berjumlah 100 diberikan jika materi tidak dominan hitungan, sementara 80 soal digunakan jika materi dominan hitungan.
Untuk lulus SKB CPNS Analis Data Ilmiah Ahli Pertama, pelajari materi jabatan, latihan soal secara rutin, dan ikuti simulasi tryout.
SKB CPNS tidak memiliki passing grade tetap, namun nilai akan digabung dengan SKD dan diranking sesuai formasi.
Soal SKB CPNS Analis Data Ilmiah Ahli Pertama tidak sama setiap tahun, namun pola materi dan kompetensi yang diujikan relatif serupa sesuai kebutuhan jabatan.
Tingkat kesulitan SKB CPNS Analis Data Ilmiah Ahli Pertama tergantung pemahaman materi, namun dapat ditingkatkan dengan latihan yang konsisten.