Pages

Senin, 19 Desember 2011

Sekilas tentang ARIMA

Peramalan merupakan bagian penting bagi setiap perusahaan/organisasi bisnis dalam  setiap pengambilan keputusan manajemen yang sangat signifikan. Peramalan menjadi dasar bagi perencanaan jangka panjang perusahaan. Dalam area fungsional finansial, peramalan  memberikan dasar dalam menentukan anggaran dan pengendalian biaya. Pada bagian pemasaran, peramalan penjualan dibutuhkan untuk merencanakan produk baru, kompensasi  tenaga perjual, dan beberapa keputusan penting lainnya. Selanjutnya, pada bagian produksi  dan operasi menggunakan data-data peramalan untuk perencanaan kapasitas,fasilitas, produksi, penjadwalan, dan pengendalian persediaan.
Peramalan dapat diartikan sebagai penggunaan data masa lalu dari sebuah variabel  atau kumpulan variabel untuk mengestimasikan nilai dimasa yang akan datang. Untuk  membuat peramalan dimulai dengan mengeksplorasi data dari waktu yang lalu dengan mengembangkan pola data tersebut.
Metode Peramalan
1. Metode Kualitatif (Non-Statistik)
Metode ini digunakan dimana tidak ada model matematik, biasanya dikarenakan data yang ada tidak cukup representatif untuk meramalkan masa yang akan datang. Peramalan ini menggunakan pertimbangan pendapat para pakar yang ahli dibidangnya. Teknik model peramalan kualitatif berusaha untuk menggunakan penilaian (judgement) atau faktor  subyektif individu dalam peramalan. Model ini sangat berguna terutama ketika faktor  subyektif diharapkan sangat penting  atau ketika data kuantitatif yang akurat sulit didapatkan.
Analisis kualitatif dapat menjadi teknik peramalan yang sangat berguna jika memungkinkan  pengumpulan dan organisasi yang sistematis untuk data yang diturunkan dari  opini yang tidak terbias dan terinformasi tetapi metode-metode kualitatif dapat memberikan hasil yang membias ketika beberapa individu tertentu mendominasi proses peramalan melalui reputasi, kekuatan kepribadian atau posisi stategis dalam organisasi.
2. Metode Kuantitatif (Statistik)
Teknik peramalan kuantitatif sangat beragam, dikembangkan dari berbagai disiplin  ilmu dan untuk berbagai maksud. Setiap teknik yang akan dipilih memiliki sifat, ketepatan,  tingkat kesulitan dan biaya tersendiri yang harus dipertimbangkan. Makridakis, Wheelwright dan McGee (1992) menjelaskan bahwa pada umumnya peramalan kuantitatif dapat diterapkan bila terdapat tiga kondisi berikut.
1. Tersedia informasi tentang masa lalu (data historis).
2. Informasi tersebut dapat dikuantitatifkan dalam bentuk numerik.
3. Dapat diasumsikan bahwa beberapa aspek pola masa lalu akan terus berlanjut di masa mendatang.
Peramalan dengan menggunakan metode deret waktu didasarkan pada pendugaan masa  depan yang dilakukan berdasarkan nilai masa lalu dari suatu variabel dan atau  kesalahan peramalan di masa lalu. Tujuan metode peramalan deret waktu seperti itu adalah  menemukan pola dalam deret data historis dan mengekstrapolasikan pola dalam deret data tersebut ke masa depan.
Pembagian metode mana yang akan digunakan didasarkan pada sifat data stationer (stabil) atau tidak stationer.
1. Peramalan untuk data stationer
Data stationer  adalah data dimana rata-rata nilainya tidak berubah dari waktu ke waktu (bersifat stabil). Untuk data dengan sifat seperti ini salah satunya dapat diramalkan dengan menggunakan metode Moving Average.
2. Peramalan untuk data tidak stationer
Data tidak stationer mempunyai ciri adanya trend, seasonal (pengaruh musim) atau siklis. Metode yang digunakan sesuai dengan ciri-ciri tersebut sebagai berikut.
- Data dengan adanya pola trend
Trend ditandai dengan adanya kecenderungan arah data bergerak menaik (growth) atau menurun (decline) pada jangka panjang. Metode peramalan yang dapat digunakan untuk kondisi ini yaitu dengan menggunakan metode Kuadrat Terkecil (Least Square Method).
-  Data dengan adanya pengaruh seasonal
Seasonal ditandai dengan adanya pola perubahan yang berulang secara otomatis dari tahun ke tahun. Metode peramalan yang digunakan: dekomposisi data, exponential smoothing, Winter dan ARIMA.
-  Data dengan adanya pengaruh siklis
Siklis adalah fluktuasi bergelombang data yang terjadi di sekitar garis trend, sulit diprediksi karena cenderung tidak stabil. Metode peramalan yang digunakan: dekomposisi data, model-model ekonometrik, regresi berganda dan ARIMA.

ARIMA

 Pengertian ARIMA (Autoregressive Integrated Moving Average)
Model ARIMA (p,d,q) merupakan campuran antara AR(p), MA(q) yang telah distasionerkan dengan melakukan pembedaan sebanyak d kali. Model umum ARIMA (p,d,q) yaitu
Øp (B) (1-B)d Zt = Өq (B) at
Dimana: (B) Zt = Zt-1               ;           (B)2 Zt = Zt-2                ;           (B) at = at-1

Telah dijelaskan bahwa tidak  mudah menentukan p dan q. Box dan Jenkins menawarkan 4 (empat) langkah-langkah permodelan ARIMA.
1.      Identifikasi
Mengidentifikasi data dilakukan statisioner dalam varians dan statisioner dalam means. Untuk melakukan identifikasi statisioner dalam varians dilakukan transformasi box cox. Data dikatakan telah stasioner dalam varians jika nilai Rounded Value (lambda) sama dengan 1. Jika data tidak stasioner dalam varians maka menggunakan transformasi box-cox yang sesuai dengan nilai rounded value pada pengujian yang pertama. Identifikasi selanjutnya yaitu statisioner dalam means yang dapat di lihat pada gambar time series plot. Data dikatakan telah stasioner dalam means jika time series plot dapat ditarik garis tengah secara lurus. Jika data belum stasioner dalam means maka dilakukan differencing.
Lamdha (λ) value
Transformation
λ = 2
Y' = Y pangkat dua
λ = 0,5
Y' = akar Y
λ = 0
Y' = ln Y
λ = -0,5
Y' = 1/ akar Y
λ = -1
Y' = 1/Y
2.      Estimasi
Setelah p dan q ditentukan, mengestimasi parameter AR dan MA yang ada pada model. Estimasi ini bisa menggunakan teknik kuadrat terkecil sederhana maupun dengan metode estimasi tidak linier. Menentukan model awal dengan ACF dan PACF.
3.      Tes Hipotesis
Setelah model ARIMA nya ditentukan, parameternya telah diestimasi, kemudian kita akan cek apakah model ARIMA lain yang lebih cocok atau sama cocoknya dengan model terpilih. Syarat asumsi yang digunakan sebagai berikut.

a. White noise
Pada pengujian ini digunakan pengujian L-jung Box, dengan hipotesis sebagai berikut.
Hipotesis:
H0 : Data telah white noise
H1 : Data tidak white noise
b. Residual Normal
Pada pengujian ini digunakan hasil output pengujian residual kolmogorov smirnov,dengan hipotesis sebagai berikut.
Hipotesis:
H0 : Residual telah berdistribusi normal
H1 : Residual tidak berdistribusi normal
c. Signifikansi parameter
Hipotesis:
H0 : Data tidak signifikan
H1 : Data telah signifikan
Sebaliknya, bila tidak memenuhi salah satu asumsi maka harus melakukan pilihan ulang dari awal lagi. Oleh sebab itu, metodologi Box-Jenkins disebut juga suatu proses iterasi.
4. Tes Diagnostik
            Pada tahap ini, akan dipilih model yang terbaik dengan kriteria kebaikan model yaitu dengan memilih berdasarkan nilai MSE, MA, AIC, SBC dan lain-lain.
5. Ramalan
Secara umum dan pada banyak hal, ramalan yang diperoleh  dengan menggunakan model ARIMA lebih reliabel bila dibandingkan dengan ramalan yang menggunakan model ekonometri biasa.

Ø Rincian Tahapannya yaitu sebagai berikut.
1.      Tahap Identifikasi
Seperti yang telah didiskusikan terdahulu, alat utama untuk identifikasi model ARIMA adalah Fungsi Autokorelasi (ACF) dan Fungsi Autokorelasi Parsial (PACF) melalui korelogramnya. ACF mengukur korelasi antar pengamatan dengan jeda k, sedangkan PACF mengukur korelasi antar pengamatan dengan jeda k dan dengan mengontrol korelasi antar dua pengamatan dengan jeda kurang dari k. PACF adalah korelasi antara yt dan yt-k setelah menghilangkan efek yt yang terletak diantara kedua pengamatan tersebut β Ingat bahwa dalam regresi berganda, k mengukur tingkat perubahan terhadap y bila xk berubah satu unit dengan β menganggap regresor lainnya konstan. k disebut juga koefisien regresi parsial. Acuan model ACF dan PACF sebagai berikut.
Model
Pola ACF
Pola PACF
AR (p)
Menyusut secara eksponensial atau pola gelombang sinusoidal yang tidak begitu jelas
Ada tiang pancang sampai lag p
MA (q)
Ada tiang pancang yang jelas sampai lag q
Menyusut secara eksponensial
ARMA (p,q)
Menyusut secara eksponensial
Menyusut secara eksponensial

2.      Tahap Estimasi Model ARIMA
Dari proses identifikasi, kita menduga bahwa series yang dianalisis merupakan proses ARIMA  maka modelnya sebagai berikut:
Yt = δ + a1 Yt-1 + a2 Yt-2 + . . .+ et
3.      Tahap Tes Diagnostik
Untuk meyakinkan apakah ARIMA merupakan model  yang cocok dengan data yang dianalisis, kita perlu menguji apakah residual dari model tersebut merupakan white noise  (random) atau tidak.  Untuk itu lakukan tahapan sebagai berikut.
     i.      Estimasi model ARIMA
   ii.      Hitung residual dari model tersebut
 iii.      Hitung ACF dan PACF kemudian plot
 iv.      Uji apakah ACF dan PACF signifikan signifikan, ini merupakan indikasi 
   v.      Bila ACF dan PACF tidak signifikan, ini merupakan indikasi bahwa residual merupakan white noise yang artinya modelnya telah cocok.
4.      Tahap Peramalan
yaitu menuliskan modelnya dan mengevaluasi nilai MSE.

Sabtu, 17 Desember 2011

case study part II

Data wei 6
Data akan di identifikasi statisioner dalam varians dan statisioner dalam means. Untuk melakukan identifikasi statisioner dalam varians dilakukan transformasi box cox, berikut, hasilnya ditampilkan dalam bentuk visual.
Dari hasil output diatas diketahui nilai Rounded Value (lambda) sebesar 0,5, jadi dapat disimpulkan bahwa data belum statisioner dalam varians. Selanjutnya akan dilakukan transformasi.
Dari hasil output diatas diketahui nilai Rounded Value (lambda) sebesar 1, jadi dapat disimpulkan bahwa data telah statisioner dalam varians.
Identifikasi selanjutnya yaitu statisioner dalam means yang dapat di lihat pada gambar time series plot. Berikut gambar hasil output  time series plot.
            Dari hasil diatas dapat diketahui bahwa data telah statisioner dalam means karena plotnya dapat ditarik garis lurus tepat di tengah atau konstan.

2. Estimasi
Menentukan model awal dengan ACF dan PACF yang dapat dilihat seperti Gambar di bawah ini. Untuk menentukan AR pada ARIMA maka menggunakan PACF sedangkan jika menentukan MA maka menggunakan ACF.
a. Autocorrelation Function (ACF)
b. Partial Autocorrelation Function (ACF)

Pada langkah estimasi dilakukan 3 pengujian asumsi, yaitu:
·      Arima (1, 0, 1)
a. White noise
Pada pengujian ini digunakan pengujian L-jung Box, dengan hipotesis sebagai berikut.
Hipotesis:
H0 : Data telah white noise
H1 : Data tidak white noise
Tingkat Signifikan: α= 5%
Hasil Output:
Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag            12     24     36     48
Chi-Square    4,7   11,3   22,0   36,3
DF              9     21     33     45
P-Value     0,863  0,957  0,927  0,821

Dari output di atas maka dapat diputuskan bahwa semua nilai p-value > α sehingga gagal tolak H0 . Jadi dapat disimpulkan bahwa data telah white noise pada arima (1, 0, 1).

a.    Residual Normal
Pada pengujian ini digunakan hasil output pengujian residual kolmogorov smirnov,dengan hipotesis sebagai berikut.
Hipotesis:
H0 : Residual telah berdistribusi normal
H1 : Residual tidak berdistribusi normal
Tingkat Signifikan: α= 5%

Dari pengujian residual dengan menggunakan kolmogorov smirnov dapat diputuskan bahwa gagal tolak H0. Jadi dapat disimpulkan bahwa data telah berdistribusi normal.

b.    Signifikansi parameter
Hipotesis:
H0 : Parameter tidak signifikan terhadap model
H1 : Parameter telah signifikan terhadap model
Tingkat Signifikan: α= 5%
Hasil Output
Final Estimates of Parameters

Type         Coef  SE Coef     T      P
AR   1     0,1471   0,1424  1,03  0,304
MA   1     0,7487   0,0980  7,64  0,000
Constant  0,17781  0,06344  2,80  0,006

Dari hasil output diketahui nilai p-value pada AR1, MA1 dan constant sebesar 0,304 , 0,000, 0,006. Sehingga dapat diputuskan tolak H0 karena nilai p-value < α yang berarti bahwa parameter telah signifikan terhadap model untuk MA1 dan constant sedangkan untuk AR1 diputuskan gagal tolak H0.

4. Tes diagnostik

SS =  776,666 (backforecasts excluded)
MS =  7,061  DF = 110

Pada tahap ini dapat diketahui nilai MSE sebesar 7,061 yang dapat dibandingkan dengan model Arima yang lain.

Kamis, 15 Desember 2011

case study part I


silahkan download terlebih dahulu http://robjhyndman.com/tsdldata/books/wei.dat

Data Wei 5.
1. Identifikasi
Terlebih dahulu menentukan data training dan testing dimana jika testing diambil 10% dari data training yakni dimulai pada data ke-65. Selanjutnya, akan dilakukan identifikasi statisioner dalam varians dan statisioner dalam means. Untuk melakukan identifikasi statisioner dalam varians dilakukan transformasi box cox, berikut, hasilnya ditampilkan dalam bentuk visual.
Dari hasil output diatas diketahui nilai Rounded Value (lambda) sebesar 1, jadi dapat disimpulkan bahwa data telah statisioner dalam varians.
Identifikasi selanjutnya yaitu statisioner dalam means yang dapat di lihat pada gambar time series plot. Berikut gambar hasil output  time series plot.
            Dari hasil diatas dapat diketahui bahwa data tidak statisioner dalam means karena plotnya membentuk pola trend naik, sehingga pada data dilakukan difference dengan lag = 1. Dengan dilakukannya difference maka akan diperoleh data baru yang nantinya akan dilakukan time series plot ulang. Berikut hasil output identifikasi statisioner dalam means dengan menggunakan data hasil difference.
Dari hasil diatas dapat diketahui bahwa data telah statisioner dalam means karena plotnya telah konstan berada ditengah dan dapat ditarik garis secara lurus tepat di tengah.

2. Estimasi
Menentukan model awal dengan ACF dan PACF yang dapat dilihat seperti Gambar di bawah ini. Untuk menentukan AR pada ARIMA maka menggunakan PACF sedangkan jika menentukan MA maka menggunakan ACF.
a. Autocorrelation Function (ACF)
b. Partial Autocorrelation Function (ACF)

Pada langkah estimasi dilakukan 3 pengujian asumsi, yaitu:
·      Arima (1, 1, 0)
a.    White noise
Pada pengujian ini digunakan pengujian L-jung Box, dengan hipotesis sebagai berikut.
Hipotesis:
H0 : Data telah white noise
H1 : Data tidak white noise
Tingkat Signifikan: α= 5%
Hasil Output:
Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag            12     24     36     48
Chi-Square    8,6   18,3   26,3   38,7
DF             10     22     34     46
P-Value     0,567  0,691  0,824  0,768

Dari output di atas maka dapat diputuskan bahwa semua nilai p-value > α sehingga gagal tolak H0 . Jadi dapat disimpulkan bahwa data telah white noise pada arima (1, 1, 0).

b.    Residual Normal
Pada pengujian ini digunakan hasil output pengujian residual kolmogorov smirnov,dengan hipotesis sebagai berikut.
Hipotesis:
H0 : Residual telah berdistribusi normal
H1 : Residual tidak berdistribusi normal
Tingkat Signifikan: α= 5%

Dari pengujian residual dengan menggunakan kolmogorov smirnov dapat diputuskan bahwa gagal tolak H0. Jadi dapat disimpulkan bahwa data telah berdistribusi normal.

c.    Signifikansi parameter
Hipotesis:
H0 : Parameter tidak signifikan terhadap model
H1 : Parameter telah signifikan terhadap model
Tingkat Signifikan: α= 5%
Hasil Output
Final Estimates of Parameters

Type         Coef  SE Coef      T      P
AR   1    -0,2990   0,1243  -2,41  0,019
Constant   3,0948   0,3078  10,05  0,000

Dari hasil output diketahui nilai p-value pada AR1 dan constant sebesar 0,019 dan 0,000. Sehingga dapat diputuskan tolak H0 karena nilai p-value < α yang berarti bahwa parameter telah signifikan terhadap model.

4. Tes diagnostik

SS =  363,973 (backforecasts excluded)
       MS =  5,967  DF = 61

            Pada tahap ini dapat diketahui nilai MSE sebesar 5,967 yang dapat dibandingkan dengan model Arima yang lain.

 5. Ramalan

Forecasts from period 64

                     95% Limits
Period  Forecast    Lower    Upper  Actual
    65   253,654  248,865  258,442
    66   255,716  249,868  261,564
    67   258,194  251,228  265,160
    68   260,548  252,680  268,415
    69   262,939  254,247  271,631
    70   265,318  255,878  274,759
    71   267,702  257,567  277,836

            Dari output di atas maka dapat diketahui bahwa ramalan (forecast) ke depan dimulai pada data ke-65.

·      Arima (0, 1, 1)
a.    White noise
Pada pengujian ini digunakan pengujian L-jung Box, dengan hipotesis sebagai berikut.
Hipotesis:
H0 : Data telah white noise
H1 : Data tidak white noise
Tingkat Signifikan: α= 5%
Hasil Output:
Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag            12     24     36     48
Chi-Square    8,0   17,4   24,8   38,1
DF             10     22     34     46
P-Value     0,630  0,740  0,876  0,790

Dari output di atas maka dapat diputuskan bahwa semua nilai p-value > α sehingga gagal tolak H0 . Jadi dapat disimpulkan bahwa data telah white noise pada arima (0, 1, 1).

b.    Residual Normal
Pada pengujian ini digunakan hasil output pengujian residual kolmogorov smirnov,dengan hipotesis sebagai berikut.
Hipotesis:
H0 : Residual telah berdistribusi normal
H1 : Residual tidak berdistribusi normal
Tingkat Signifikan: α= 5%

Dari pengujian residual dengan menggunakan kolmogorov smirnov dapat diputuskan bahwa gagal tolak H0. Jadi dapat disimpulkan bahwa data telah berdistribusi normal.

c.    Signifikansi parameter
Hipotesis:
H0 : Parameter tidak signifikan terhadap model
H1 : Parameter telah signifikan terhadap model
Tingkat Signifikan: α= 5%
Hasil Output
Final Estimates of Parameters

Type        Coef  SE Coef      T      P
MA   1    0,2872   0,1248   2,30  0,025
Constant  2,3811   0,2197  10,84  0,000

Dari hasil output diketahui nilai p-value pada MA1 dan constant yakni 0,025 dan 0,000. Sehingga dapat diputuskan tolak H0 karena nilai p-value < α yang berarti bahwa semua parameter telah signifikan terhadap model.

Ø Tes diagnostik

SS =  364,407 (backforecasts excluded)
MS =  5,974  DF = 61

            Pada tahap ini dapat diketahui nilai MSE sebesar 5,974 yang dapat dibandingkan dengan model Arima (1,1,0). Sehingga dapat disimpulkan bahwa kriteria kebaikan model yang terbaik adalah Arima (1,1,0) karena memiliki nilai MSE yang lebih kecil dibandingkan dengan Arima (0,1,1).

Ø Ramalan

Forecasts from period 64

                     95% Limits
Period  Forecast    Lower    Upper  Actual
    65   253,613  248,822  258,405
    66   255,994  250,110  261,879
    67   258,375  251,572  265,179
    68   260,757  253,144  268,370
    69   263,138  254,794  271,482
    70   265,519  256,503  274,535
    71   267,900  258,259  277,541

            Dari output di atas maka dapat diketahui bahwa ramalan (forecast) ke depan dimulai pada data ke-65.