Statistics Forum

Uncategorized, Statistics in our lifesNovember 16, 2008 10:47 am

1. Andi Hakim Nasution (1932-2002) founder Statistics in Indonesia
Prof. Dr. Ir. H. Andi Hakim Nasution lahir di Jakarta, 30 Maret 1932 dan wafat 4 Maret 2002 di Bogor. Sarjana pertanian ke-4 yang lulus dengan predikat cum laude dari Fakultas Pertanian Universitas Indonesia 1958 (sekarang Institut Pertanian Bogor). Gelar “Doctor of Philosophy” diraihnya pada tahun 1964 dari Departement of Experimental Statistics, North Carolina State University, Raleigh, NC, USA. Tesisnya An Evaluation of Two Procedures to Estimate Genetic and Environmental Parameters in a Partial Diallel and Selfing Test Crossing Design.
Pernah menjabat sebagai Guru Besar Statistika dan Genetika Kuantitatif, juga Rektor Institut Pertanian Bogor sampai tahun 1987. Sejak Desember 1991 ia menjadi Dekan FMIPA (Fakultas Matematika dan Ilmu Pengetahuan Alam) IPB.
Anggota Tim Penulis Buku Manusia dan Alam Sekitar, buku-buku matematika untuk SD, SMP, SMA. Penerjemah buku seri Matematika untuk orang tua dan guru, serta anggota Tim Adaptasi buku Biologi Umum. Beliau pun menjadi anggota merangkap Sekretaris Nasional IndonesiaPerhimpunan Biometrika internasional “Biometrics”, anggota merangkap Ketua Ikatan Statistika Indonesia, anggota American Statistical Association, International Statistical Institute, Philippine Statistical Association, dan Xlassification Society of America.

Kegiatannya dalam bidang penulisan sudah dimulai sejak SMA. Beberapa bukunya telah terbit dalam bidang matematika dan statistika. Selain itu, beliau pun aktif menulis karangan-karangan yang bersifat umum dalam harian-harian dan majalah-majalah.

Basic Statistics, Statistics in our lifesOctober 28, 2008 5:53 am

Oleh : CAHYAT ROHYANA, SE., MM.

Pendahuluan
Penggunaan metode statistik dalam penelitian ilmiah telah dirintis sejak tahun 1880
ketika F. Galton pertamakali menggunakan korelasi dalam penelitian ilmu hayat. Ketika
itu penggunaan metoda statistik dalam biologi maupun sosial belum lazim, bahkan pada
akhir abad ke-19 Karl Pearson, pelopor penggunaan metoda statistik, mendapat kecaman.
Saat ini, metoda statistik telah digunakan sebagai metoda penelitian ilmiah di berbagai
bidang ilmu pengetahuan, baik ilmu alam/science maupun ilmu sosial.
Arti Statistik
Statistik adalah kumpulan angka-angka yang melukiskan atau menggambarkan sesuatu
persoalan, biasanya disusun dalam tabel atau daftar, sering disertai diagram atau grafik
dan keterangan-keterangan lain seperlunya (Sudjana, 1989).
Contoh: statistik produksi, statistik penghasilan, statistik perdagangan, statistik keuangan,
statistik harga, statistik perusahaan, statistik perbankan, dll.
Definisi yang lain, statistik adalah metode atau asas-asas guna “mengerjakan” atau
“memanipulasi” data kuantitatif agar angka-angka tersebut “berbicara” (Anto Dajan,
1995).
Beberapa Istilah Dalam Statistik
Statistika:
Pengetahuan yang mempelajari cara-cara pengumpulan bahan-bahan atau keterangan,
pengolahan serta penganalisisannya, dan penarikan kesimpulan yang beralasan
berdasarkan penganalisisan yang dilakukan.
Statistika Deskriptif:
Pengumpulan data, penyajian data, pembuatan tabel-tabel dan grafik-grafik dan
melakukan perhitungan-perhitungan untuk menentukan statistik
Statistika Induktif:
Melakukan penaksiran tentang karakteristik populasi, pembuatan prediksi, menentukan
ada atau tidak adanya asosiasi antara karakteristik populasi dan pembuatan kesimpulan
secara umum mengenai populasi.
Data:
Bahan atau keterangan yang dinyatakan dalam angka-angka dan kebenarannya harus
dapat dipercaya atau dapat diandalkan.

Populasi:
Kumpulan seluruh subjek/observasi dalam penelitian.
A population consist of all subjects (human or otherwise) that are being studied.
Sampel:
Bagian dari populasi.
A sample is a subgroup of population.
Hubungan antara statistik deskriptif dengan inferens.
Peranan metode statistik dalam kehidupan manusia modern
a. Bidang ekonomi dan manajemen perusahaan: alat pengambilan keputusan.
1. Bidang produksi:
- Penetapan standar kualitas dan pengawasan kualitas
- Pengawasan terhadap efisiensi kerja
- Test terhadap metode atau produk baru
2. Bidang akuntansi:
- Penyesuaian yang bertalian dengan perubahan harga
- Hubungan antara ongkos dan volume produksi
3. Bidang pemasaran:
- Penyelidikan tentang preferensi konsumen
- Penaksiran potensi pasaran bagi produk baru
- Penelitian mengenai potensi pasar di daerah baru
- Penetapan harga
- Penelitian terhadap efektifnya cara mengiklankan produk
- Test terhadap efektifitas meteode penjualan
b. Peranan statistik di bidang penelitian
- Alat perencanaan eksperimen dan evaluasi hasil eksperimen
- Teknik pengawasan serta penanggulangan kesalahan
- Teknik penentuan kombinasi faktor-faktor yang akan diuji
- Perkembangan eksperimen lapangan (field experiment)
- Berbagai riset di pabrik-pabrik kertas, tekstil, bahan farmasi, gelas, karet, dll.
- Riset di bidang kesehatan umum, keamanan jalan, psikologi, sosiologi,
antropologi, dll.
Matematika, Teori Statistik, dan Ekonometrik
Teori statistik merupakan cabang dari matematika terapan (applied mathematics), yang
berbasis ilmu matematika murni yaitu teori probabilita. Teori statistik yang lengkap
selain meliputi teori probabilita, juga meliputi konsekuensi teoritis dari asas-asas
randomisasi, asas-asas penaksirann parameter, dan asas-asas pengujian hipotesis. Fungsi
statistisi adalah memberi peralatan bagi para peneliti ilmiah. Dari sustu fenomena khusus,
ia mengembangkan sebuah model matematis yang mendekati kondisi-kondisi
eksperimen, selanjutnya memberi prosedur untuk memecahkan masalah.
Kemajuan-kemajuan yang diperoleh penelitian ilmiah membutuhkan eksperimen yang
sifatnya makin kompleks dan khusus. Di beberapa bidang penelitian, seorang peneliti
bahkan mengalami kesulitan dalam menggunakan peralatan statistik. Hal ini dapat
dimengerti karena jika metodenya semakin khusus, maka keluwesannya menjadi agak
berkurang. Penggunaan metode statistik dalam eksperimen tertentu memerlukan
modifikasi dan perbaikan. Perkembangan tersebut memungkinkan timbulnya statistik
terapan (applied statistics).

Teori Ekonomi, Matematika, Statistik dan Ekonometrika
Dalam teori ekonomi makro maupun mikro, para ekonom banyak meletakkan dasar-dasar
teoritis tentang hubungan antara dua atau beberapa variabel ekonomi. Dalam ekonomi
mikro, dikenal hukum permintaan yang menggambarkan secara hipotetis hubungan
antara jumlah komoditi yang diminta dengan tingkat harga satuan yang berbeda dari
komoditi tersebut. Dalam ekonomi makro, hubungan yang hipotetios antara besaran
pendapatan dan konsumsi, antara besarann tabungan dann konsumsi, dan sebagainya.
Besaran variabel-variabel ekonomi dan hubungan antara variabel-variabel ekonomi
tersebut umumnya dapat diukur secara kuantitatif dan keabsahan hubungan antar variabel
tersebut dapat diuji secara statistik. Metode pengukuran maupun pengujian yang
demikian itu merupakan inti dari metode ekonometrika.
Pada hakekatnya, ekonometrika memberi pengetahuan dasar tentang perumusan teori
ekonomi ke dalam model matematika. Hubungan antar variabel di atas dirumuskan dalam
bentuk model teoritis dan matematis. Proses perumusannya membutuhkan pengetahuan
matematika dan teori ekonomi yang cukup baik. Selanjutnya metode statistik
memberikan cara untuk mengukur variabel ekonomi, hubungan antar variabel, dan
menguji validitas asumsi-asumsi serta hubungan variabel yang hipotetis tersebut.
Jadi, dasar ekonometrika adalah teori ekonomi. Matematika dibutuhkan untuk
merumuskan model teoritisnya, sedangkan statistik dibutuhkan untuk mengukur dan
menguji asumsi serta hubungan antara variabel ekonomi yang dinyatakan dalam model
matematika.

Statistik dan Komputer
Penggunaann komputer untuk mengolah data kuantitatif dan melakukan komputasi
statistik yang serba rumit merupakan suatu kebutuhan mendesak bagi para peneliti dan
statistisi. Penggunaan komputer dalam kegiatan pengolahan maupun komputasi data akan
meningkatkan efisiensi apabila beberapa karakteristik pengolahan dan komputasi data di
atas dapat dipenuhi:
- Volume data yang cukup besar.
- Tugas pengolahan maupun komputasi menjadi lebih ekonomis jika dibandingkan
dengan cara lain.
- Tugas pengolaha maupun komputasi data yang membutuhkan penyelesaian secara
cepat.
- Ketepatan atau ketelitian hasil pengolahan data.
- Pengolahan maupun komputasi data yang sifatnya sangat rumit.

Penutup
Statistics consists of conducting studies to collect, organize, summarize, analyze, and
draw conclusions.

Factor AnalysisOctober 23, 2008 2:11 pm

Factor Analysis - SPSS
________________________________________
•    First Read Principal Components Analysis.
    The methods we have employed so far attempt to repackage all of the variance in the p variables into principal components.  We may wish to restrict our analysis to variance that is common among variables.  That is, when repackaging the variables’ variance we may wish not to redistribute variance that is unique to any one variable.  This is Common Factor Analysis.  A common factor is an abstraction, a hypothetical dimension that affects at least two of the variables.  We assumed that there is also one unique factor for each variable, a factor that affects that variable but does not affect any other variables.  We assume that the p unique factors are uncorrelated with one another and with the common factors.  It is the variance due to these unique factors that we shall exclude from our FA.

Iterated Principal Factors Analysis
    The most common sort of FA is principal axis FA, also known as principal factor analysis.  This analysis proceeds very much like that for a PCA.  We eliminate the variance due to unique factors by replacing the 1’s on the main diagonal of the correlation matrix with estimates of the variables’ communalities. Recall that a variable’s communality, its SSL across components or factors, is the amount of the variable’s variance that is accounted for by the components or factors.  Since our factors will be common factors, a variable’s communality will be the amount of its variance that is common rather than unique.  The R2  between a variable and all other variables is most often used initially to estimate a variable’s communality.
    Using the beer data, change the extraction method to principal axis:
 
    Take a look at the initial communalities (for each variable, this is the R2  for predicting that variable from an optimally weighted linear combination of the remaining variables).  Recall that they were all 1’s for the principal components analysis we did earlier, but now each is less than 1.  If we sum these communalities we get 5.675.  We started with 7 units of standardized variance and we have now reduced that to 5.675 units of standardized variance (by eliminating unique variance).
 
    For an iterated principal axis solution SPSS first estimates communalities, with R2 ’s, and then conducts the analysis.  It then takes the communalities from that first analysis and inserts them into the main diagonal of the correlation matrix in place of the R2 ’s, and does the analysis again.  The variables’ SSL’s from this second solution are then inserted into the main diagonal replacing the communalities from the previous iteration, etc. etc., until the change from one iteration to the next iteration is trivial.
    Look at the communalities after this iterative process and for a two-factor solution.  They now sum to 5.60.  That is, 5.6/7 = 80% of the variance is common variance and 20% is unique.  Here you can see how we have packaged that common variance into two factors, both before and after a varimax rotation:
 
    The final rotated loadings are:
 
    These loadings are very similar to those we obtained previously with a principle components analysis.

Reproduced and Residual Correlation Matrices
    Having extracted common factors, one can turn right around and try to reproduce the correlation matrix from the factor loading matrix.  We assume that the correlations between variables result from their sharing common underlying factors.  Thus, it makes sense to try to estimate the correlations between variables from the correlations between factors and variables.  The reproduced correlation matrix is obtained by multiplying the loading matrix by the transposed loading matrix.  This results in calculating each reproduced correlation as the sum across factors (from 1 to m) of the products (r between factor and the one variable)(r between factor and the other variable).  For example, for our 2 factor iterative solution the reproduced correlation between COLOR and TASTE = (r for color - Factor1)(r for taste - Factor 1) + (r for color - Factor 2)(r for taste - Factor2) = (.95)(.94) + (.06)(-.02) = .89. The original r between color and taste was .90, so our two factors did indeed capture the relationship between Color and Taste.
    The residual correlation matrix equals the original correlation matrix minus the reproduced correlation matrix.  We want these residuals to be small.  If you check “Reproduced” under “Descriptive” in the Factor Analysis dialogue box, you will get both of these matrices:
 
Nonorthogonal (Oblique) Rotation
    The data may be better fit with axes that are not perpendicular.  This can be done by means of an oblique rotation, but the factors will now be correlated with one another.  Also, the factor loadings (in the pattern matrix) will no longer be equal to the correlation between each factor and each variable.  They will still be standardized regression coefficients (Beta weights), the A’s in the   formula presented at the beginning of the handout on principle components analysis.  The correlations between factors and variables are presented in a factor structure matrix.
    I am not generally comfortable with oblique rotations, but for this lesson I tried a Promax rotation (a varimax rotation is first applied and then the resulting axes rotated to oblique positions):
 
    Notice that this solution is not much different from the previously obtained varimax solution, so little was gained by allowing the factors to be correlated.

Exact Factor Scores
    One may wish to define subscales on a test, with each subscale representing one factor.  Using an "exact" weighting scheme, each subject’s estimated factor score on each factor is a weighted sum of the products of scoring coefficients and the subject’s standardized scores on the original variables.
    The regression coefficients (standardized scoring coefficients) for converting scores on variables to factor scores are obtained by multiplying the inverse of the original simple correlation matrix by the factor loading matrix. To obtain a subject’s factor scores you multiply e’s standardized scores (Z’s) on the variables by these standardized scoring coefficients.  For example, subject # 1’s Factor scores are:
Factor 1:      (-.294)(.41) + (.955)(.40) + (-.036)(.22) + (1.057)(-.07) + (.712)(.04) +
        (1.219)(.03) + (-1.14)(.01) = 0.23.
Factor 2:      (-.294)(.11) + (.955)(.03) + (-.036)(-.20) + (1.057)(.61) + (.712)(.25) +
        (.16)(1.219) + (-1.14)(-.04) = 1.06
    SPSS will not only compute the scoring coefficients for you, it will also output the factor scores of your subjects into your SPSS data set so that you can input them into other procedures.  In the Factor Analysis window, click Scores and select Save As Variables, Regression, Display Factor Score Coefficient Matrix.
 
    Here are the scoring coefficients:
 
    Look back at your data sheet.  You will find that two columns have been added to the right, one for scores on Factor 1 and another for scores on Factor 2.
    The input data included two variables (SES and Group) not included in the factor analysis.  Just for fun, try conducting a multiple regression predicting subjects’ SES from their factor scores and also try using Student’s t to compare the two groups’ means on the factor scores.  Do note that the scores for factor 1 are not correlated with those for factor 2.  Accordingly, in the multiple regression the squared semipartial correlation coefficients are identical to squared zero-order correlation coefficients and the  .

 


 

Basic Statistics, Experimental Design (ANOVA), Linear Regression, Correlation, Non parametric Statistics, Parametric Statistics, Statistics in our lifesOctober 21, 2008 11:01 am

Dalam kehidupan sehari-hari, sering kita dihadapkan pada situasi akibat adanya kenaikan maupun penurunan. Misal kenaikan BBM, harga Sembako, jumlah pemudik, penurunan nilai tukar rupiah, daya beli masyarakat dan lain-lain.
Pemerintah juga sering menyampaikan bahwa kenaikan atau penurunan yang terjadi tidak signifikan.

Untuk menyatakan ada kenaikan atau penurunan haruslah didasarkan pada data yang ada dan untuk bisa menjawab atau menyatakan itu semua harus didasarkan pada prosedur yang obyektif.
Pengujian secara statistik dapat digunakan sebagai alat untuk menilai keadaan tersebut.
Hal ini perlu dilakukan untuk menghindari penarikan kesimpulan terlalu dini.

Proses pengujian statistik bertumpu pada hipotesis (dugaan) awal. Sudah barang tentu hipotesis tersebut akan dismpulkan berdasarkan data yang dikumpulkan, yaitu hipotesis didukung oleh data atau tidak didukung data.

Pendekatan formal dalam pengujian secara statistik adalah diawali dengan perumusan masalah, penyusunan hipotesis awal, pengamatan terhadap populasi sasaran dan menghitung statistik-uji serta diakhiri dengan menetapkan hipotesis awal didukung oleh data atau tidak.
Nilai-nilai statistik yang memenuhi kriteria untuk menolah hipotesis awal disebut daerah kritis dari pengujian hipotesis awal.

Telah banyak ditulis dalam buku-buku teks statistik bahwa ada dua kesalahan yang mungkin terjadi pada pengujian hipotesis, yaitu kesalahan tipe I (α) dan kesalahan tipe II (β). Pada pengujian hipotesis lebih mudah mendapatkan nilai α dibandingkan dengan mendapatkan nilai β.

Dengan berdasarkan nilai α inilah baru disusun prosedur untuk mendapatkan nilai β. Karena untuk mendapatkan nilai β prosedurnya agak panjang sehingga kurang mendapatkan perhatian.

Padahal nilai β berhubungan dengan sensitivitas atau kekuatan pengujian dari hipotesis yang diajukan. Alangkah indahnya bila dalam pengujian hipotesis juga melihat berapa nilai β disamping nilai α.

Sebagian besar pengguna statistik jarang merinci nilai hipotesis tandingan apalagi memperhitungkan nilai β.

Dalam kajian-kajian ilmiah sering ditemukan suatu kesimpulan yaitu tidak ada atau ada perbedaan yang nyata (signifikan) antara dua rata-rata atau perlakuan, akan tetapi tidak ada penjelasan lebih lanjut tentang makna dari kesimpulan tersebut dan tindakan yang harus dilakukan atau disarankan.

Penentuan nilai α berdasarkan hipotesis awal adalah merupakan nilai peluang hipotesis awal adalah benar, sedangkan nilai β berfungsi sebagai alat untuk melihat arah dari penolakan hipotesis awal.

Ada tidaknya perbedaan secara nyata (signifikan) dari suatu hipotesis menunjukkan seberapa kuat petunjuk atau kecenderungan yang diperoleh dari pengamatan untuk melemahkan hipotesis awal. Oleh karenanya, hasil pengujian yang mempunyai daerah kritis dengan peluang 1% lebih kuat disbanding daerah kritis yng mempunyai peluang 5%.

Apabila pada suatu pengujian hipotesis menunjukkan adanya perbedaan yang nyata secara statistic (menurut prosedur statistic) tidak lain dan tidak bukan adalah petunjuk untuk menolak hipotesis awal yang diajukan.

Hal yang sering terjadi adalah salah penafsiran dari kata ada beda nyata, yaitu menafsirkan ada perbedaan secara harafiah (sesungguhnya/nyata), padahal ada beda disini harus diartikan sebagai peluang munculnya kejadian atau resiko melakukan kesalahan dalam penarikan kesimpulan.

 

Ditulis Oleh: Dr. Brodjol Sutijo Suprih Ulama MS   
Wednesday, 10 September 2008

Basic Statistics, Statistics in our lifes 10:20 am

Beberapa waktu yang lalu ada seorang rekan yang bertanya kepada saya. Namun karena pertanyaannya cukup mendasar dan filosofi banget, baru bisa saya jawab kemarin. Saya pikir para statistisi dan orang-orang yang dekat dengan istilah ini juga perlu tahu, mudah-mudahan kita bisa sama-sama berdiskusi disini. Ok, langsung saja dah!!!

1. Statistika itu apa sih??

Sebenarnya ini adalah pertanyaan keempat, tetapi saya jadikan pertanyaan pertama karena berkaitan dengan pemahaman mendasar tentang materi pertanyaan lain. Apa itu statistika?  Statistika adalah cabang ilmu matematika yang berurusan dengan cara-cara/teknik-teknik pengorganisasian (sering berarti mereduksi) data dalam suatu bentuk yang lebih sederhana sehingga akan mudah untuk ‘dibaca’. Data yang kita peroleh dalam kehidupan sehari-hari dapat menjadi sangat banyak, sehingga dapat menimbulkan kebingungan jika tidak diorganisasikan. Misalnya sebagai mahasiswa anda memperoleh nilai untuk mata kuliah-mata kuliah yang telah diambil. Dalam satu semester anda bisa memperoleh 4-5 nilai. Dalam 2 tahun bisa diperoleh 16-20 nilai. Nilai-nilai itu tentu akan bervariasi, ada yang B, ada yang C bahkan mungkin D atau E. Jika anda ditanya bagaimana prestasi anda di bangku kuliah? Bagaimana menjawabnya? Apakah seperti ini: “Ya ada yang B ada yang C ada yang D, ada juga yang E.” ? Atau mungkin disebutkan semua nilainya? Tentu saja jika orang yang bertanya pada anda punya waktu cukup banyak untuk mendengar daftar nilai anda. Tapi ada cara yang lebih sederhana untuk ‘menceritakan’ prestasi anda. Dengan mencari rerata nilai anda dengan memperhitungkan jumlah sks yang telah diambil (yang kemudian disebut dengan IPK). Atau anda bisa juga menyebutkan nilai terbaik yang didapatkan dari semua mata kuliah yang telah diambil (nilai maksimal) atau nilai terburuk (nilai minimal). Dan banyak cara lainnya. Cara-cara untuk menyajikan data dengan sederhana inilah yang kemudian disebut dengan statistik. Well, semoga bisa menjawab pertanyaan di atas dengan memuaskan.

2. Kenapa kita butuh statistika?

Pertanyaan ini agak terjawab dengan penjelasan yang saya berikan di no 1. Mengapa kita butuh statistika? Karena di sekitar kita ada begitu banyak data kuantitatif (dalam bentuk angka) dan tentu saja kita tidak dapat mengelakkan diri dari data-data tersebut. Dan seringkali kita perlu menggunakan data tersebut atau menyajikannya baik pada diri sendiri maupun orang lain. Tidak jarang juga kita mengambil keputusan berdasarkan data tersebut.

Misalnya ketika kita akan memilih sebuah kelas yang diajar dosen A, kita merasa perlu tahu ‘medan perang’ dengan paling tidak bertanya-tanya pada orang yang pernah diajar dosen A. Atau kita bisa melihat track record dosen A tersebut dalam memberi nilai, apakah dia termasuk dosen pelit atau murah hati. Caranya? Tentu saja dengan melihat daftar nilai yang dikeluarkan dosen tersebut, dan membandingkan prosentase (baik secara intuitif maupun empiris) mahasiswa yang memperoleh A, B, C,D,dan E. Perbandingan ini akan kita jadikan dasar keputusan untuk mengambil kelas tersebut atau tidak. Bagi mahasiswa yang mencari tantangan (atau cari gara-gara?) tentu saja akan mengambil kelas yang prosentase A dan B jauh lebih kecil dari C.

Misalnya lagi, dalam sebuah polling mengenai isu reorganisasi lembaga kemahasiswaan, kita ingin tahu bagaimana sikap mahasiswa terhadap isu tersebut. Apakah secara umum mahasiswa setuju atau tidak setuju dengan adanya reorganisasi. Karena keterbatasan tenaga dan dana, maka yang ditanyai sikapnya hanyalah sampel dari mahasiswa. Setelah kita hitung proporsi yang setuju dan tidak, kita perlu mengetahui apakah dalam populasi juga berlaku proporsi yang ada dalam sampel. Maka kita perlu meminta bantuan statistika untuk menyelesaikannya.

Dan banyak lagi lainnya.

3. Gimana jadinya dunia ini tanpa statistika?

Wah… ini agak sulit jawabnya tapi sekaligus mudah. Banyak sekali temuan ilmiah (khususnya dalam bidang psikologi yang saya tahu) didasarkan pada hasil analisis statistik, dari analisis yang sederhana sampai yang rumit. Kita mengenal tipe-tipe kepribadian yang muncul akhir-akhir ini (seperti Big 5 Personality Factor) karena adanya Teknik Analisis Faktor. Kita bisa mengembangkan tes kecerdasan dan menentukan tingkat kecerdasan dalam bentuk skor IQ karena adanya penggunaan mean dan standard deviasi, juga analisis kesalahan pengukuran.

Efektivitas terapi (baik psikologis maupun medis) seringkali juga dibuktikan dengan memanfaatkan analisis statistik.Selain itu juga adanya tingkat resiko penggunaan obat sebesar sekian persen, karena dibalik itu ada analisis statistik yang mengestimasi besarnya kemungkinan terjadinya resiko. Hal ini berlaku juga dengan crime rate, tingkat kematian ibu dan bayi, tingkat kecelakaan, resiko investasi, dsb.

Belum termasuk di dalamnya penelitian-penelitian yang berusaha mencari faktor yang dominan dari sekian banyak faktor yang ikut terlibat dalam mencetuskan wabah demam berdarah, yang memampukan kita untuk melakukan pencegahan wabah. Atau faktor yang ikut terlibat dalam terjadinya kenakalan remaja, sehingga kita bisa tahu apa yang perlu kita lakukan agar kaum muda kita tidak terlibat narkoba, dan kenakalan lain. Atau penelitian mengenai bahan-bahan tahan gempa dengan tingkat kelenturannya sendiri-sendiri. Dan masih banyak lainnya….

Can you imagine a world without such things?

4.Kenapa orang harus belajar statistika?

Tidak ada yang mengharuskan anda untuk belajar statistika. Anda bisa mengabaikannya. Tapi tentu saja statistika menjadi syarat agar bisa menyelesaikan kuliah di suatu program studi tertentu (misal psikologi).

Mengapa menjadi syarat di suatu program studi? Karena ada anggapan bahwa perkembangan ilmu di suatu program studi tersebut tidak dapat dilepaskan dari statistika. Temuan-temuan ilmiah yang diterapkan dalam ilmu tersebut banyak mendapat bantuan dari statistika. Pengujian efektivitas terapi, atau pengujian efektivitas pengajaran, dsb seringkali tidak dapat dipisahkan dari penggunaan teknik statistik.

Oleh karena itu, penting bagi orang-orang yang mempelajari ilmu tersebut, untuk mengetahui cara-cara yang telah dipakai untuk memperoleh ilmu yang mereka pelajari saat ini. Termasuk di dalamnya analisis statistik.

Harapan di balik itu tentu saja, agar kita bisa mengembangkan pengetahuan kita sendiri dengan baik, dan tidak terus menerus menjadi ‘budak pengetahuan’ atau ‘pelanggan tetap pengetahuan’ dari orang lain (atau bangsa lain). Kita harus bisa menjadi tuan atas pengetahuan ilmiah kita sendiri. Bisa kritis dan tidak terus menerus dibodohi oleh orang lain hanya karena kita benci angka.Ada orang bilang wah tes ini valid… ya ikut memakai, yang lain bilang terapi ini bagus… ya ikut-ikutan, dst. Ada yang bilang kos-kosan menyebabkan free sex… ya percaya saja, ada yang bicara tentang SQ-EQ-FQ-DQ-nanti mungkin ada QQ (kiyu-kiyu) ya kita manggut-manggut dengan takjub. Lalu kapan giliran kita yang bicara begitu?

Bagi saya pribadi, mempelajari statistika juga membantu dalam mendisiplinkan pola pikir. Baik dalam kehidupan sehari-hari maupun dalam kehidupan akademik. Misalnya berhati-hati dalam mengambil kesimpulan, khususnya tanpa data yang jelas. Atau tidak memegang asumsi secara berlebihan dengan pertimbangan tidak semua orang memegang asumsi yang sama, dsb.

Ya, tidak ada yang mengharuskan anda belajar statistika, tapi jika kita bisa memperoleh manfaat darinya mengapa tidak mencoba? Why don’t you give it a try?