Statistics Forum

Basic Statistics, Experimental Design (ANOVA), Linear Regression, Correlation, Non parametric Statistics, Parametric Statistics, Statistics in our lifesOctober 21, 2008 11:01 am

Dalam kehidupan sehari-hari, sering kita dihadapkan pada situasi akibat adanya kenaikan maupun penurunan. Misal kenaikan BBM, harga Sembako, jumlah pemudik, penurunan nilai tukar rupiah, daya beli masyarakat dan lain-lain.
Pemerintah juga sering menyampaikan bahwa kenaikan atau penurunan yang terjadi tidak signifikan.

Untuk menyatakan ada kenaikan atau penurunan haruslah didasarkan pada data yang ada dan untuk bisa menjawab atau menyatakan itu semua harus didasarkan pada prosedur yang obyektif.
Pengujian secara statistik dapat digunakan sebagai alat untuk menilai keadaan tersebut.
Hal ini perlu dilakukan untuk menghindari penarikan kesimpulan terlalu dini.

Proses pengujian statistik bertumpu pada hipotesis (dugaan) awal. Sudah barang tentu hipotesis tersebut akan dismpulkan berdasarkan data yang dikumpulkan, yaitu hipotesis didukung oleh data atau tidak didukung data.

Pendekatan formal dalam pengujian secara statistik adalah diawali dengan perumusan masalah, penyusunan hipotesis awal, pengamatan terhadap populasi sasaran dan menghitung statistik-uji serta diakhiri dengan menetapkan hipotesis awal didukung oleh data atau tidak.
Nilai-nilai statistik yang memenuhi kriteria untuk menolah hipotesis awal disebut daerah kritis dari pengujian hipotesis awal.

Telah banyak ditulis dalam buku-buku teks statistik bahwa ada dua kesalahan yang mungkin terjadi pada pengujian hipotesis, yaitu kesalahan tipe I (α) dan kesalahan tipe II (β). Pada pengujian hipotesis lebih mudah mendapatkan nilai α dibandingkan dengan mendapatkan nilai β.

Dengan berdasarkan nilai α inilah baru disusun prosedur untuk mendapatkan nilai β. Karena untuk mendapatkan nilai β prosedurnya agak panjang sehingga kurang mendapatkan perhatian.

Padahal nilai β berhubungan dengan sensitivitas atau kekuatan pengujian dari hipotesis yang diajukan. Alangkah indahnya bila dalam pengujian hipotesis juga melihat berapa nilai β disamping nilai α.

Sebagian besar pengguna statistik jarang merinci nilai hipotesis tandingan apalagi memperhitungkan nilai β.

Dalam kajian-kajian ilmiah sering ditemukan suatu kesimpulan yaitu tidak ada atau ada perbedaan yang nyata (signifikan) antara dua rata-rata atau perlakuan, akan tetapi tidak ada penjelasan lebih lanjut tentang makna dari kesimpulan tersebut dan tindakan yang harus dilakukan atau disarankan.

Penentuan nilai α berdasarkan hipotesis awal adalah merupakan nilai peluang hipotesis awal adalah benar, sedangkan nilai β berfungsi sebagai alat untuk melihat arah dari penolakan hipotesis awal.

Ada tidaknya perbedaan secara nyata (signifikan) dari suatu hipotesis menunjukkan seberapa kuat petunjuk atau kecenderungan yang diperoleh dari pengamatan untuk melemahkan hipotesis awal. Oleh karenanya, hasil pengujian yang mempunyai daerah kritis dengan peluang 1% lebih kuat disbanding daerah kritis yng mempunyai peluang 5%.

Apabila pada suatu pengujian hipotesis menunjukkan adanya perbedaan yang nyata secara statistic (menurut prosedur statistic) tidak lain dan tidak bukan adalah petunjuk untuk menolak hipotesis awal yang diajukan.

Hal yang sering terjadi adalah salah penafsiran dari kata ada beda nyata, yaitu menafsirkan ada perbedaan secara harafiah (sesungguhnya/nyata), padahal ada beda disini harus diartikan sebagai peluang munculnya kejadian atau resiko melakukan kesalahan dalam penarikan kesimpulan.

 

Ditulis Oleh: Dr. Brodjol Sutijo Suprih Ulama MS   
Wednesday, 10 September 2008

Linear Regression, CorrelationOctober 20, 2008 6:51 am

A linear regression line has an equation of the form Y = a + bX, where X is the explanatory variable and Y is the dependent variable. The slope of the line is b, and a is the intercept (the value of y when x = 0).

see tutorial in here!

Linear Regression, Correlation 6:39 am

Linear regression attempts to model the relationship between two variables by fitting a linear equation to observed data. One variable is considered to be an explanatory variable, and the other is considered to be a dependent variable. For example, a modeler might want to relate the weights of individuals to their heights using a linear regression model.

Before attempting to fit a linear model to observed data, a modeler should first determine whether or not there is a relationship between the variables of interest. This does not necessarily imply that one variable causes the other (for example, higher SAT scores do not cause higher college grades), but that there is some significant association between the two variables. A scatterplot can be a helpful tool in determining the strength of the relationship between two variables. If there appears to be no association between the proposed explanatory and dependent variables (i.e., the scatterplot does not indicate any increasing or decreasing trends), then fitting a linear regression model to the data probably will not provide a useful model. A valuable numerical measure of association between two variables is the correlation coefficient, which is a value between -1 and 1 indicating the strength of the association of the observed data for the two variables.

A linear regression line has an equation of the form Y = a + bX, where X is the explanatory variable and Y is the dependent variable. The slope of the line is b, and a is the intercept (the value of y when x = 0).

Basic Statistics, Linear Regression, CorrelationOctober 17, 2008 2:40 am

In probability theory and statistics, correlation, (often measured as a correlation coefficient), indicates the strength and direction of a linear relationship between two random variables. In general statistical usage, correlation or co-relation refers to the departure of two variables from independence. In this broad sense there are several coefficients, measuring the degree of correlation, adapted to the nature of data.

A number of different coefficients are used for different situations. The best known is the Pearson product-moment correlation coefficient, which is obtained by dividing the covariance of the two variables by the product of their standard deviations. Despite its name, it was first introduced by Francis Galton.[1]

 

Taken from : wikipedia.org