Tampilkan postingan dengan label ekonomi. Tampilkan semua postingan
Tampilkan postingan dengan label ekonomi. Tampilkan semua postingan

Selasa, 10 Agustus 2021

Goal Programming (Program Optimasi Tujuan Ganda)

GOAL PROGRAMMING

(Program Optimasi Tujuan Ganda)

Artikel ini Saya tulis ketika memelajari riset operasi. 

'Cites :
Sundaya, Y. 2005. Teori dan Latihan Metode Optimasi : Linear Programming. Perpustakaan Pribadi. Cimahi.

Meskipun saat ini solusi masalah optimasi dengan jumlah tujuan yang banyak telah disupport oleh banyak perangkat, namun logika dibalik cara kerja perangkat tersebut perlu dipahami logikanya. Artikel ini semoga bisa membantu memahami logika atau cara kerja optimasi tersebut. Materi pada artikel ini disadur dari :
Taha, H. 1997. Operations Research an Introduction Sixth Edition. Prentice-Hall International. London.

Pendahuluan

Linear Programming berfungsi untuk mencari solusi optimum dengan fungsi tujuan tunggal. Terdapat situasi dimana sebuah sistem mungkin memiliki tujuan berganda. Sebagai contoh, seorang politikus berjanji untuk mengurangi pinjaman nasional dan secara simultan mengurangi penerimaan pajak. Dalam situasi itu tidak mungkin menemukan soulsi tunggal yang mengoptimisasi tujuan yang bertolak belakang. Kita dapat mencari solusi yang kompromis didasarkan pada kepentingan relatif dari masing-masing tujuan.

Teknik goal programming digunakan untuk memecahkan masalah dengan model tujuan berganda. Ide prinsipnya adalah mengkonversi tujuan ganda awal ke dalam sebuah tujuan tunggal. Lebih lanjut, modal akan menghasilkan solusi efisien sebab hal itu tidak mungkin optimum yang terkait dengan masalah yang memiliki tujuan yang saling bertolak belakang.

Formulasi Goal Programming

Gagasan Goal Programming diilustrasikan dengan sebuah contoh. Misalnya, Bandung yang memiliki penduduk sebanyak 20 000 orang. Dewan kota kemudian sedang merumuskan pengembangan penerimaan pajak. Pajak tahunan yang diperoleh dari perumahan sebesar Rp 550 juta. Pajak tahunan dari makanan dan minuman dan penjualan umum sebesar Rp 35 juta dan Rp 55 juta, secara berurutan. Konsumsi gas lokal tahunan diperkirakan sebesar 7.5 juta galon. Dewan kota ingin mengembangkan tingkat pajak di dasarkan atas empat tujuan utama, yaitu :

Penerimaan pajak harus sekurang-kurangnya sebesar Rp 16 juta untuk memenuhi komitmen keuangan kota;
Pajak makanan dan minuman tidak lebih dari 10% dari seluruh pajak yang dikumpulkan;
Pajak penjualan umum tidak lebih dari 20% dari seluruh pajak yang dikumpulkan; dan
Pajak gas tidak lebih dari 0.2 rupiah per galon.

Misalnya, variabel xp, xf, dan xs menunjukkan tingkat pajak (dinyatakan sebagai proporsi) untuk perumahan, makanan dan minuman, serta penjualan umum dan variabel xg sebagai paja gas dalam rupiah per galon.
Tujuan dewan kota dapat dinyatakan sebagai berikut :

550xp + 35xf + 55xs + 0.075xg ³ 16 ... penerimaan pajak

35xf ≤ 0.1(550xp + 35xf + 55xs + 0.075xg) ... pajak makanan dan minuman

55xs ≤ 0.2(550xp + 35xf + 55xs + 0.075xg) ... pajak penjualan umum

xg ≤ 2 ... pajak gas

xp, xf, xs, xg ³ 0

Kendala tersebut diringkas sebagai berikut :

550xp +    35xf + 55xs + 0.075xg ³ 16

  55xp – 31.5xf + 5.5xs + 0.0075xg ³ 0

110xp + 7xf – 44xs + 0.015xg ³ 0

xg ≤ 2

xp, xf, xs, xg ³ 0

Masing-masing ketidaksamaan dari model menunjukkan sebuah tujuan yang mana aspirasi dewan kota terpenuhi. Bagaimanapun tujuan tersebut saling bertolak belakang dan pekerjaan yang terbaik adalah mencoba untuk mencapai solusi yang kompromis.

Tahapan untuk mencapai solusi yang kompromis tersebut adalah pertama, masing-masing ketidaksamaan dikonversi ke dalam tujuan yang fleksibel yang mana kendala dapat dilanggar, jika diperlukan. Dalam kasus Kota Bandung, tujuan yang fleksibel dapat dinyatakan sebagai berikut :
550xp +    35xf + 55xs + 0.075xg + S1+ - S1- = 16
  55xp – 31.5xf + 5.5xs + 0.0075xg + S2+ - S1- = 0
110xp + 7xf – 44xs + 0.015xg + S3+ -  S3- = 0
xg + S4+ - S4- = 2
xp, xf, xs, xg ³ 0
si+, si- ³ 0, i = 1, 2, 3, 4

Variabel non negatif Si+ dan Si- disebut dengan variabel deviasional sebagai mereka menunjukkan diviasi (penyimpangan) di atas dan di bawah sisi kanan kendala ke “i”. Variabel deviasional Si+ dan Si- bersifat dependen, dan karenanya tidak dapat menjadi variabel basic secara simultan. Artinya bahwa setiap iterasi simplex, satu dari dua variabel deviasional dapat diasumsikan bernilai positif. Jika, ketidaksamaan “i” semula berbentuk ≤ dan si+ nya > 0, kemudian tujuan ke “i” akan dipenuhi, dengan cara lain, jika si- > 0, maka tujuan ke “i” tidak dapat dipenuhi. Esensinya, pengertian variabel deviasional memutuskan kita untuk memenuhi atau melanggar tujuan ke “i”. Inilah bentuk fleksibilitas dari goal programming ketika mencoba untuk mencapai solusi yang kompromis. Secara alamiah salah satu solusi kompromis yang baik adalah menemukan minimisasi dari jumlah dengan mana masing-masing jumlah dilanggar.

Dalam model Kota Bandung sebelumnya, tiga kendala pertama berbentuk “³” dan kendala keempat berbentuk “≤”, keempat variabel deviasional menunjukkan jumlah dengan mana tujuan yang saling terkait dapat dilanggar. Kemudian, solusi kompromis yang harus ditemukan untuk memenuhi keempat tujuan yang memungkinkan sebagai berikut :
Minimisasi G1 = S1+
Minimisasi G2 = S2+
Minimisasi G3 = S3+
Minimisasi G4 = S4-

Fungsi tersebut adalah minimisasi syarat ikatan terhadap kendala persamaan dari model.

Bagaimana kita dapat mengoptimisasi model tujuan ganda dengan tujuan yang bertolak belakang ? Dua metode telah dikembangkan untuk memenuhi tujuan ini, yaitu [1] metode pembobotan (weighting method) - WM dan [2] metode pengutamaan (preemtif method) - PM. Masing-masing metode didasarkan atas konversi tujuan berganda ke dalam tujuan tunggal.

Melalui WM, sebuah fungsi tujuan tunggal dibentuk sebagai jumlah bobot dari fungsi yang menunjukkan tujuan dari masalah. Sedangka dalam PM dimulai dengan memprioritaskan atau mengutamakan tujuan dalam susunan yang terpenting. Model kemudian dioptimisasi dengan menggunakan satu tujuan pada suatu waktu, dan dalam beberapa cara bahwa nilai optimum dari tujuan prioritas tertinggi tidak dikurangi oleh tujuan prioritas terendah.

Tujuan kedua metode berbeda. Dalam pengertian bahwa kedua metode tersebut tidak akan secara umum menghasilkan solusi yang sama. Masing-masing metode, bagaimanapun, dapat diklaim superior sebab masing-masing teknik didesain untuk memenuhi kencenderungan pembuatan keputusan tertentu.

Sebagai ilustrasi dikemukakan salah satu contoh persoalan yang diselesaikan dengan menggunakan kedua metode tersebut. Perusahaan TopAd merupakan perusahan periklanan baru dengan 10 orang tenaga kerja telah menerima kontrak untuk mempromosikan produk baru. Agen tersebut dapat mengiklankan melalui radio dan televisi. Tabel berikut menyajikan data mengenai jumlah orang yang dapat dicapai oleh masing-masing bentuk iklan dan biaya serta tenaga kerja yang dibutuhkan.

 

Data/Iklan Minimal

 

Radio

Televisi

Pembukaan (dalam juta orang)

4

8

Biaya (dalam juta dollar)

8

24

Tenaga Bantuan

1

2


Selanjutnya, dalam kontrak TopAd dilarang untuk menggunakan lebih dari 6 menit dari iklan radio. Dengan penambahan, iklan dalam radio dan televisi perlu untuk mencapai sekurang-kurangnya 45 juta orang. TopAd telah menyusun anggaran untuk proyek tersebut sebesar $100 000. Berapa menit iklan di radio dan iklan di televisi yang harus digunakan oleh TopAd ?

Katakanlah, x1 dan x2 adalah jumlah menit yang dialokasilan untuk iklan di radio dan iklan di televisi secara berurutan. Formulasi goal programming untuk masalah tersebut dinyatakan sebagai berikut :
Minimisasi G1 = S1+ (penuhi tujuan pembukaan)
Minimisasi G2 = S2- (penuhi anggaran tujuan)
Syarat Ikatan :
4x1 + 8x2 + S1+ - S1- = 45 (tujuan pembukaan) ... [1]
8x1 + 24x2 + S2+ - S2- = 100 (tujuan anggaran) ... [2]
x1 + 2x2 ≤ 10 (batasan tenaga kerja) ... [3]
x1 ≤ 6 (batasan radio) ... [4]
x1, x2, S1+, S2+, S1-, S2- ³ 0 ... [5]

Kemudian, TopAd menganggap bahwa tujuan pembukaan dua kali lebih penting dari tujuan anggaran, maka kombinasi fungsi tujuan tersebut dinyatakan sebagai berikut :

Minimisasi Z = 2G1 + G2 = 2S1+ + S2-
Dengan syarat ikatan [1] s.d [5]

Solusi dengan menggunakan program Lindo menghasilkan Z = 10, x1 = 5 menit, x2 = 2.5 menit dan S1+ = 5 juta orang. Seluruh variabel sisanya sama dengan nol.

Dengan demikian, alokasi iklan untuk radio sebanyak 5 menit dan ilan di televisi sebanyak 2.5 menit akan menjaring orang sebanyak [(4x5) + (8x2.5) = 40 juta orang] dengan biaya atas kedua jenis ilan tersebut sebesar [(8x5) + (24x2.5) = 100 ribu).

Kenyataannya bahwa nilai optimum dari Z tidak sama dengan nol, hal itu menunjukkan bahwa sekurang-kurangnya salah satu dari tujuan tidak tercapai. Secara khusus, S1+ = 5, artinya bahwa tujuan pembukaan (dari sekurang-kurangnya 45 juta orang) adalah kehilangan 5 juta individu. Sebaliknya, tujuan anggaran (tidak melebihi $100 000).

Goal Programming hanya menghasilkan sebuah solusi yang efisien terhadap masalah, yang mana tidak secara perlu mencapai optimum. Sebagai contoh, jika misalnya x1 = 6 dan x2 = 2, makaakan menghasilkan tujuan pembukaan yang sama [(4x6) + (8x2) = 40 juta orang), sedangkan biaya akan menurun [(8*6) + (24*2) = 96 ribu). Esensinya, Goal Programming hanya menemukan solusi yang hanya memenuhi tujuan dari model. Beberapa kekurangan dalam mencapai solusi oprimum memunculkan pertanyaan mengenai kemungkinan Goal Programming sebagai sebuah teknik optimasi.

Contoh Aplikasi


           

 

Selasa, 18 Januari 2011

BEBERAPA ANALISIS STATISTIK DENGAN MENGGUNAKAN SAS

BEBERAPA ANALISIS STATISTIK DENGAN MENGGUNAKAN SAS

Artikel ini disadur dari :
http://www.ats.ucla.edu/stat/sas/whatstat/whatstat.htm

Pendahuluan

Halaman ini menunjukkan bagaimana melakukan sejumlah pengujian statistik dengan menggunakan software SAS. Setiap bagian menampilkan gambaran ringkas pengujian statistik dengan menggunakan perintah dan output SAS dan ditambah dengan interpretasi ringkas terhadap outputnya.
Dalam memutuskan pilihan pengujian yang tepat untuk digunakan, penting untuk mempertimbangkan jenis variabelnya. Apakah variabelnya berbentuk kategorikal, ordinal atau interval, dan apakah variabel tersebut terdistribusi secara normal ? (lihat link).

Seputar Data File ”hsb”

Pada halaman ini banyak digunakan contoh data file dengan nama hsb2. Data file ini mengandung 200 pengamatan dari suatu sampel siswa sekolah menengah atas, dimana di dalamnya terkandung informasi mengenai aspek demografinya seperti jenis kelamin (female), status sosial ekonomi (ses) dan latar belakang etnisnya (race). Kemudian terkandung juga informasi mengenai skor hasil ujiannya, seperti : ujian membaca (read), menulis (write), matematika (math), dan kajian sosial (socst). Kita dapat menggunakan data tersebut dengan membuka link ini ”klik”. Kita dapat menyimpan file tersebut dimanapun, tapi dalam contoh yang akan disajikan, kita asumsikan data file tersebut disimpan dalam folder ”c:\mydata\hsb2.sas7bdat”.

Pengujian Satu Sampel

Metode ini ditujukan untuk menguji apakah nilai tengah atau rata-rata sampel (dari variabel interval yang didistribusikan secara normal), secara signifikan berbeda dari nilai yang ditetapkan dalam hipotesis penelitian. Sebagai contoh, kita dapat menggunakan data ”hsb2” untuk menguji, dan kita akan menguji apakah skor rata-rata menulis siswa berberda signifikan dari 50. Kita dapat melakukannya dengan menggunakan bahasa program SAS sebagai berikut :

proc ttest data = "c:\mydata\hsb2" h0 = 50;
  var write;
run;

Hasilnya ditampilkan sebagai berikut :

The TTEST Procedure
                                         Statistics
               Lower CL         Upper CL Lower CL         Upper CL
Variable     N     Mean    Mean     Mean  Std Dev Std Dev  Std Dev Std Err
write      200   51.453  52.775   54.097   8.6318  9.4786   10.511  0.6702

                T-Tests
Variable      DF    t Value    Pr > |t|
write        199       4.14      <.0001

Nilai tengah variabel “write” untuk contoh tersebut adalah 52.775, yang mana secara statistik berbeda signifikan dari nilai skor 50. Karena itu, kita dapat menyimpulkan bahwa kelompok siswa tersebut signifikan memiliki nilai rata-rata nilai menulis yang lebih tinggi dari 50.

Pengujian Satu Median Sampel

Metode ini digunakan untuk menguji apakah median suatu sampel berbeda signifikan dari nilai yang ditetapkan dalam hipotesis penelitian. Kita akan menggunakan variabel yang sama yaitu ”write. Pengujiannya dilakukan seperti dalam pengujian satu sampel di atas, namun kita tidak menggunakan asumsi bahwa intervalnya terdistribusi normal. Kita menggunakan asumsi bahwa variabel ”write” adalah variabel ordinal. Selanjutnya, kita akan menguji apakah median skor ujian menulis (write) berbeda secara signifikan dari 50. Opsi ”loccount” dalam pernyataan ”proc univariate” menyajikan lokasi jumlah (count) dari data yang ditunjukkan pada bagian bawah hasil pengujian (output).

proc univariate data = "c:\mydata\hsb2" loccount mu0 = 50;
  var write;
run;

Hasilnya ditampilkan sebagai berikut :

              Basic Statistical Measures
    Location                    Variability

Mean     52.77500     Std Deviation            9.47859
Median   54.00000     Variance                89.84359
Mode     59.00000     Range                   36.00000
                      Interquartile Range     14.50000

           Tests for Location: Mu0=50
Test           -Statistic-    -----p Value------
Student's t    t  4.140325    Pr >  |t|    <.0001
Sign           M        27    Pr >= |M|   0.0002
Signed Rank    S    3326.5    Pr >= |S|   <.0001

Location Counts: Mu0=50.00

Count                Value

Num Obs > Mu0          12
Num Obs ^= Mu0         198
Num Obs < Mu0          72

Kita dapat menggunakan uji “sign” atau “ signed rank test”. Perbedaannya, uji “sign rank test” memerlukan variabel dari distribusi simetris. Hasilnya menunjukkan bahwa media variabel ”write” berbeda dengan 50 secara statistik.

Uji Binomial

Metode ini digunakan untuk menguji apakah proporsi pada variabel dependen jenis kategorikal dua tingkat (two-level) berbeda signifikan dari nilai yang menjadi hipotesis penelitian. Contoh, dengan menggunakan data ”hsb2”, kita akan menguji apakah proporsi perempuan (female) berbeda signifikan dari 50 persen atau 0.5. Kita akan menggunakan pernyataan ”exact” untuk menghasilkan ”p-values” yang eksak.

proc freq data = "c:\mydata\hsb2";
  tables female / binomial(p=.5);
  exact binomial;
run;

Hasilnya ditampilkan sebagai berikut :

The FREQ Procedure
                                   Cumulative    Cumulative
female    Frequency     Percent     Frequency      Percent
-----------------------------------------------------------
     0          91       45.50            91        45.50
     1         109       54.50           200       100.00

Binomial Proportion for female = 0
-----------------------------------
Proportion (P)               0.4550
ASE                          0.0352
95% Lower Conf Limit         0.3860
95% Upper Conf Limit         0.5240

Exact Conf Limits
95% Lower Conf Limit         0.3846
95% Upper Conf Limit         0.5267

   Test of H0: Proportion = 0.5

ASE under H0                 0.0354
Z                           -1.2728
One-sided Pr <  Z            0.1015
Two-sided Pr > |Z|           0.2031

Exact Test
One-sided Pr <=  P           0.1146
Two-sided = 2 * One-sided    0.2292

Sample Size = 200

Hasilnya menunjukkan bahwa tidak ada perbedaan statistik yang signifikan (p= .2292). Dengan perkataan lain, proporsi perempuan dalam sampel tersebut tidak berbeda signifikan dari hipotesisnya, 50%.


Chi-square goodness of fit

Metode dapat digunakan untuk menguji apakah pengamatan terhadap proporsi variabel kategorikal berbeda dari proporsi yang ditetapkan dalam hipotesis penelitian. Sebagai contoh, suatu populasi terdiri dari 10 persen Hispanic, 10 persen Asia, 10 persen Afrika-Amerika dan 70 persen Kulit Putih. Selanjutnya, kita ingin menguji apakah pengamatan terhadap proporsi tersebut secara signifikan berbeda dari hipotesis terhadap proporsi tersebut. Pernyataan SAS untuk melakukan pengujian tersebut adalah :

proc freq data = "c:\mydata\hsb2";
  tables race / chisq testp=(10 10 10 70);
run;

Hasil estimasinya adalah

The FREQ Procedure
                                    Test     Cumulative    Cumulative
race    Frequency     Percent     Percent     Frequency      Percent
--------------------------------------------------------------------
   1          24       12.00       10.00            24        12.00
   2          11        5.50       10.00            35        17.50
   3          20       10.00       10.00            55        27.50
   4         145       72.50       70.00           200       100.00

     Chi-Square Test
for Specified Proportions
-------------------------
Chi-Square         5.0286
DF                      3
Pr > ChiSq         0.1697

Sample Size = 200

Hasilnya menunjukkan bahwa komposisi rasial dalam sampel tidak berbeda signifikan dari nilai yang ditetapkan dalam hipotesis (chi-square dengan derajat kebebasan = 5.0286, p = .1697).

Pengujian Dua Sampel Independen

Metode ini digunakan ketika kita ingin membandingkan nilai tengah variabel interval yang didistribusikan secara normal untuk dua kelompok yang independen. Sebagai contoh, dengan menggunakan data ”hsb2”, katakanlah kita ingi menguji apakah nilai tengah variabel ”write” sama antara pria dan wanita.

proc ttest data = "c:\mydata\hsb2";
  class female;
  var write;
run;

Hasilnya disajikan sebagai berikut

The TTEST Procedure
                                           Statistics
                              Lower CL      Upper CL Lower CL           Upper CL
Variable  female        N     Mean    Mean    Mean   Std Dev  Std Dev  Std Dev  Std Err
write     0             91    47.975  50.121  52.267 8.9947   10.305   12.066   1.0803
write     1            109    53.447  54.991  56.535 7.1786   8.1337    9.3843  0.7791
write     Diff (1-2)          -7.442   -4.87  -2.298 8.3622   9.1846   10.188   1.3042

                               T-Tests
Variable    Method           Variances      DF    t Value    Pr > |t|
write       Pooled           Equal         198      -3.73      0.0002
write       Satterthwaite    Unequal       170      -3.66      0.0003

                    Equality of Variances
Variable    Method      Num DF    Den DF    F Value    Pr > F
write       Folded F        90       108       1.61    0.0187

Hasilnya menunjukkan bahwa terdapat perbedaan signifikan antara skor nilai menulis pria dan wanita (t = -3.73, p = .0002). Dengan perkataan lain, wanita memiliki skor nilai menulis In other words, females have a statistically significantly higher mean score on writing (54.991) than males (50.121).

Pengujian Wilcoxon-Mann-Whitney test

Metode ini analog dengan non-parametrik terhadap pengujian sampel independen dan dapat digunakan ketika kita tidak menggunakan asumsi bahwa variabel dependen adalah variabel interval yang berdistribusi normal. Sekurang-kurangnya kita menggunakan asumsi bahwa variabelnya adalah ordinal. Dengan menggunakan data ”hsb2” contohnya disajikan sebagai berikut :

proc npar1way data = "c:\mydata\hsb2" wilcoxon;
  class female;
  var write;
run;

Hasilnya adalah

The NPAR1WAY Procedure

            Wilcoxon Scores (Rank Sums) for Variable write
                    Classified by Variable female

                      Sum of      Expected       Std Dev          Mean
female       N        Scores      Under H0      Under H0         Score
----------------------------------------------------------------------
0           91        7792.0       9145.50    406.559086     85.626374
1          109       12308.0      10954.50    406.559086    112.917431

                  Average scores were used for ties.

   Wilcoxon Two-Sample Test

Statistic             7792.0000

Normal Approximation
Z                       -3.3279
One-Sided Pr <  Z        0.0004
Two-Sided Pr > |Z|       0.0009

t Approximation
One-Sided Pr <  Z        0.0005
Two-Sided Pr > |Z|       0.0010

Z includes a continuity correction of 0.5.

Hasilnya menyatakan bahwa terdapat perbedaan signifikan secara statistik antara nilai skor menulis pria dan wanita (z = -3.329, p = 0.0009).

Pengujian Chi-square

Metode ini digunakan bila kita ingin melihat hubungan antara dua variabel kategorikal. Dalam SAS, opsi ”chisq” digunakan pada pernyataan ”tables” untuk memperoleh pengujian statistik dan nilai p-value nya. Dengan menggunakan data ”hsb2”, kita coba menguji hubungan antara jenis sekolah (schtyp) dan jenis kelamin siswa (female). Perlu diingat bahwa, pengujian chi-square menggunakan asumsi bahwa nilai harapan setiap sel adalah 5 atau lebih besar dari 5. Asumsi ini mudah ditemukan dalam contoh di bawah ini. Bagaimanapun, bila asumsi ini tidak ditemukan dalam data kita, maka dapat digunakan pengujian Fisher’s exact.

proc freq data = "c:\mydata\hsb2";
  tables schtyp*female / chisq;
run;

Hasilnya disajikan sebagai berikut :

The FREQ Procedure
Table of schtyp by female
schtyp(type of school)
          female
Frequency|
Percent  |
Row Pct  |
Col Pct  |       0|       1|  Total
---------+--------+--------+
       1 |     77 |     91 |    168
         |  38.50 |  45.50 |  84.00
         |  45.83 |  54.17 |
         |  84.62 |  83.49 |
---------+--------+--------+
       2 |     14 |     18 |     32
         |   7.00 |   9.00 |  16.00
         |  43.75 |  56.25 |
         |  15.38 |  16.51 |
---------+--------+--------+
Total          91      109      200
            45.50    54.50   100.00

Statistics for Table of schtyp by female

Statistic                     DF       Value      Prob
------------------------------------------------------
Chi-Square                     1      0.0470    0.8283
Likelihood Ratio Chi-Square    1      0.0471    0.8281
Continuity Adj. Chi-Square     1      0.0005    0.9815
Mantel-Haenszel Chi-Square     1      0.0468    0.8287
Phi Coefficient                       0.0153
Contingency Coefficient               0.0153
Cramer's V                            0.0153

Sample Size = 200

Hasilnya menunjukkan bahwa tidak ada perbedaan signifikan antara jenis sekolah yang dipilih dengan jenis kelamin (chi-square dengan satu derajat kebebasan = 0.0470, p = 0.8283).
Mari kita lihat contoh lainnya yang melihat hubungan antara jenis kelamin (female) dan status sosial ekonomi (ses). Poin pada contoh ini adalah satu atau setiap variabel dapat memiliki lebih dari dua level, dan variabel tersebut tidak memiliki jumlah level yang sama. Dalam contoh ini, variabel female memiliki dua level (pria dan wanita), dan variabel ses memiliki tiga level (rendah, menengah dan tinggi).

proc freq data = "c:\mydata\hsb2";
  tables female*ses / chisq;
run;

Hasilnya disajikan sebagai berikut :

The FREQ Procedure
Table of female by ses
female     ses
Frequency|
Percent  |
Row Pct  |
Col Pct  |       1|       2|       3|  Total
---------+--------+--------+--------+
       0 |     15 |     47 |     29 |     91
         |   7.50 |  23.50 |  14.50 |  45.50
         |  16.48 |  51.65 |  31.87 |
         |  31.91 |  49.47 |  50.00 |
---------+--------+--------+--------+
       1 |     32 |     48 |     29 |    109
         |  16.00 |  24.00 |  14.50 |  54.50
         |  29.36 |  44.04 |  26.61 |
         |  68.09 |  50.53 |  50.00 |
---------+--------+--------+--------+
Total          47       95       58      200
            23.50    47.50    29.00   100.00

Statistics for Table of female by ses
Statistic                     DF       Value      Prob
------------------------------------------------------
Chi-Square                     2      4.5765    0.1014
Likelihood Ratio Chi-Square    2      4.6789    0.0964
Mantel-Haenszel Chi-Square     1      3.1098    0.0778
Phi Coefficient                       0.1513
Contingency Coefficient               0.1496
Cramer's V                            0.1513

Sample Size = 200

Hasilnya menunjukkan bahwa tidak ada hubungan signifikan secara statistik antar variabel jenis kelamin dengan status ekonomi (chi-square dengan derajat kebebasan sama dengan 2 = 4.5765, p = 0.1014).

Penguian Fisher's exact

Metode ini digunakan ketika kita ingin menggunakan pengujian chi-square, tapi satu atau lebih sel data memiliki frekuensi harapan sama dengan lima atau kurang dari lima. Perlu diingat bahwa pengujian chi-square menggunakan asumsi bahwa setiap sel memiliki frekuensi harapan sama dengan dan lebih besar dari 5, tapi pengujian Fisher’s tidak menggunakan asumsi demikian. Contoh pengujiannya disajikan sebebagai berikut :

proc freq data = "c:\mydata\hsb2";
  tables schtyp*race / fisher;
run;

Hasilnya disajikan sebagai berikut :

The FREQ Procedure
Table of schtyp by race
schtyp(type of school)     race
Frequency|
Percent  |
Row Pct  |
Col Pct  |       1|       2|       3|       4|  Total
---------+--------+--------+--------+--------+
       1 |     22 |     10 |     18 |    118 |    168
         |  11.00 |   5.00 |   9.00 |  59.00 |  84.00
         |  13.10 |   5.95 |  10.71 |  70.24 |
         |  91.67 |  90.91 |  90.00 |  81.38 |
---------+--------+--------+--------+--------+
       2 |      2 |      1 |      2 |     27 |     32
         |   1.00 |   0.50 |   1.00 |  13.50 |  16.00
         |   6.25 |   3.13 |   6.25 |  84.38 |
         |   8.33 |   9.09 |  10.00 |  18.62 |
---------+--------+--------+--------+--------+
Total          24       11       20      145      200
            12.00     5.50    10.00    72.50   100.00

Statistics for Table of schtyp by race

Statistic                     DF       Value      Prob
------------------------------------------------------
Chi-Square                     3      2.7170    0.4373
Likelihood Ratio Chi-Square    3      2.9985    0.3919
Mantel-Haenszel Chi-Square     1      2.3378    0.1263
Phi Coefficient                       0.1166
Contingency Coefficient               0.1158
Cramer's V                            0.1166

WARNING: 38% of the cells have expected counts less
         than 5. Chi-Square may not be a valid test.

       Fisher's Exact Test
----------------------------------
Table Probability (P)       0.0077
Pr <= P                     0.5975

Sample Size = 200

Hasilnya menyatakan bahwa tidak ada hubungan signifikan secara statistik antara ras dan jenis sekolah (p = 0.5975). Perlu dicatat bahwa pengujian Fisher's exact test tidak memiliki "test statistic", tapi menghitung p-value secara langsung.

One-way ANOVA

Metode ini digunakan bila kita memiliki varibel independen kategorikal (dengan dua atau lebih katgori), dan interval variabel dependennya didistribusikan secara normal, serta kita akan menguji perbedaan nilai tengah variabel dependen yang dipecah oleh tingkat variabel independen. Sebagai contoh, dengan menggunakan data ”hsb2” katakanlah kita mau menguji apakah nilai tengah variabel write berbeda antara tiga jenis program (prog).

proc glm data = "c:\mydata\hsb2";
  class prog;
  model write = prog;
  means prog;
run;
quit;

Hasilnya disajikan sebagai berikut :
The GLM Procedure
   Class Level Information
Class         Levels    Values
prog               3    1 2 3

Number of observations    200


Dependent Variable: write   writing score
                                        Sum of
Source                      DF         Squares     Mean Square    F Value    Pr > F
Model                        2      3175.69786      1587.84893      21.27    <.0001
Error                      197     14703.17714        74.63542
Corrected Total            199     17878.87500

R-Square     Coeff Var      Root MSE    write Mean
0.177623      16.36983      8.639179      52.77500

Source                      DF       Type I SS     Mean Square    F Value    Pr > F
prog                         2     3175.697857     1587.848929      21.27    <.0001

Source                      DF     Type III SS     Mean Square    F Value    Pr > F
prog                         2     3175.697857     1587.848929      21.27    <.0001

Level of             ------------write------------
prog           N             Mean          Std Dev

1             45       51.3333333       9.39777537
2            105       56.2571429       7.94334333
3             50       46.7600000       9.31875441

Nilai tengah variabel dependen secara signifikan berbeda untuk setiap level jenis program. Bagaimanapun, kita tidak tahi jika perbedaannya adalah hanya antara kedua tingkat atau semua tingkat. F test model sama dengan F test progam, karena prog hanya satu-satunya variabel yang dimasukan ke dalam model. Jika variabel lain dimasukan juga, maka F test dari model akan berbeda dari prog. Kita juga dapat melihat bahwa siswa dalam program akademik memiliki skor nilai tengah menulis yang lebih tinggi dibandingkan siswa program vokasional.

Pengujian Kruskal Wallis

Metode ini digunakan ketika kita memiliki variabel independen dengan dua atau lebih tingkat dan variabel dependen yang bersifat ordinal. Dengan perkataan lain, pengujian tersebut merupakan versi non-parametrik dari ANOVA.       

proc npar1way data = "c:\mydata\hsb2";
  class prog;
  var write;
run;
The NPAR1WAY Procedure

           Wilcoxon Scores (Rank Sums) for Variable write
                    Classified by Variable prog

                    Sum of      Expected       Std Dev          Mean
prog       N        Scores      Under H0      Under H0         Score
--------------------------------------------------------------------
1         45        4079.0       4522.50    340.927342     90.644444
3         50        3257.0       5025.00    353.525185     65.140000
2        105       12764.0      10552.50    407.705133    121.561905

                 Average scores were used for ties.


   Kruskal-Wallis Test

Chi-Square         34.0452
DF                       2
Pr > Chi-Square     <.0001

Hasilnya menunjukkan bahwa terdapat perbedaan yang signifikan pada setiap jenis program (chi-square dengan dua degrees of freedom = 34.0452, p = 0.0001).


Pengujian Pasangan (Paired t-test)

Pengujian ini digunakan ketika kita memiliki dua pengamatan yang terkait. Contohnya adalah pengamatan per subjek, dan kita ingin melihat jika distribusi normal nilai tengah variabel interval nya berbeda satu sama lain.

proc ttest data = "c:\mydata\hsb2";
  paired write*read;
run;
The TTEST Procedure
                                       Statistics

                      Lower CL          Upper CL  Lower CL           Upper CL
Difference         N      Mean    Mean      Mean   Std Dev  Std Dev   Std Dev  Std Err
write - read     200    -0.694   0.545    1.7841    8.0928   8.8867    9.8546   0.6284

                  T-Tests

Difference         DF    t Value    Pr > |t|

write - read      199       0.87      0.3868

Hasilnya menunjukkan bahwa nilai tengah variabel membaca secara statistik tidak berbeda signifikan dengan nilai tengah variabel write (t = 0.87, p = 0.3868).

*Semoga bermanfaat*


FITUR MICROSOFT MATH ADD-IN

  FITUR MICROSOFT MATH ADD-IN Yuhka Sundaya Departemen Ekonomi Pembangunan Unisba 2022 Klik menu “mathematics” pada MS.Word, sedemikian hing...