speak with data

Senin, 19 Desember 2011

Sekilas tentang ARIMA

Peramalan merupakan bagian penting bagi setiap perusahaan/organisasi bisnis dalam setiap pengambilan keputusan manajemen yang sangat signifikan. Peramalan menjadi dasar bagi perencanaan jangka panjang perusahaan. Dalam area fungsional finansial, peramalan memberikan dasar dalam menentukan anggaran dan pengendalian biaya. Pada bagian pemasaran, peramalan penjualan dibutuhkan untuk merencanakan produk baru, kompensasi tenaga perjual, dan beberapa keputusan penting lainnya. Selanjutnya, pada bagian produksi dan operasi menggunakan data-data peramalan untuk perencanaan kapasitas,fasilitas, produksi, penjadwalan, dan pengendalian persediaan.

Peramalan dapat diartikan sebagai penggunaan data masa lalu dari sebuah variabel atau kumpulan variabel untuk mengestimasikan nilai dimasa yang akan datang. Untuk membuat peramalan dimulai dengan mengeksplorasi data dari waktu yang lalu dengan mengembangkan pola data tersebut.

Metode Peramalan

1. Metode Kualitatif (Non-Statistik)

Metode ini digunakan dimana tidak ada model matematik, biasanya dikarenakan data yang ada tidak cukup representatif untuk meramalkan masa yang akan datang. Peramalan ini menggunakan pertimbangan pendapat para pakar yang ahli dibidangnya. Teknik model peramalan kualitatif berusaha untuk menggunakan penilaian (judgement) atau faktor subyektif individu dalam peramalan. Model ini sangat berguna terutama ketika faktor subyektif diharapkan sangat penting atau ketika data kuantitatif yang akurat sulit didapatkan.

Analisis kualitatif dapat menjadi teknik peramalan yang sangat berguna jika memungkinkan pengumpulan dan organisasi yang sistematis untuk data yang diturunkan dari opini yang tidak terbias dan terinformasi tetapi metode-metode kualitatif dapat memberikan hasil yang membias ketika beberapa individu tertentu mendominasi proses peramalan melalui reputasi, kekuatan kepribadian atau posisi stategis dalam organisasi.

2. Metode Kuantitatif (Statistik)

Teknik peramalan kuantitatif sangat beragam, dikembangkan dari berbagai disiplin ilmu dan untuk berbagai maksud. Setiap teknik yang akan dipilih memiliki sifat, ketepatan, tingkat kesulitan dan biaya tersendiri yang harus dipertimbangkan. Makridakis, Wheelwright dan McGee (1992) menjelaskan bahwa pada umumnya peramalan kuantitatif dapat diterapkan bila terdapat tiga kondisi berikut.

1. Tersedia informasi tentang masa lalu (data historis).

2. Informasi tersebut dapat dikuantitatifkan dalam bentuk numerik.

3. Dapat diasumsikan bahwa beberapa aspek pola masa lalu akan terus berlanjut di masa mendatang.

Peramalan dengan menggunakan metode deret waktu didasarkan pada pendugaan masa depan yang dilakukan berdasarkan nilai masa lalu dari suatu variabel dan atau kesalahan peramalan di masa lalu. Tujuan metode peramalan deret waktu seperti itu adalah menemukan pola dalam deret data historis dan mengekstrapolasikan pola dalam deret data tersebut ke masa depan.

Pembagian metode mana yang akan digunakan didasarkan pada sifat data stationer (stabil) atau tidak stationer.

1. Peramalan untuk data stationer

Data stationer adalah data dimana rata-rata nilainya tidak berubah dari waktu ke waktu (bersifat stabil). Untuk data dengan sifat seperti ini salah satunya dapat diramalkan dengan menggunakan metode Moving Average.

2. Peramalan untuk data tidak stationer

Data tidak stationer mempunyai ciri adanya trend, seasonal (pengaruh musim) atau siklis. Metode yang digunakan sesuai dengan ciri-ciri tersebut sebagai berikut.

- Data dengan adanya pola trend

Trend ditandai dengan adanya kecenderungan arah data bergerak menaik (growth) atau menurun (decline) pada jangka panjang. Metode peramalan yang dapat digunakan untuk kondisi ini yaitu dengan menggunakan metode Kuadrat Terkecil (Least Square Method).

- Data dengan adanya pengaruh seasonal

Seasonal ditandai dengan adanya pola perubahan yang berulang secara otomatis dari tahun ke tahun. Metode peramalan yang digunakan: dekomposisi data, exponential smoothing, Winter dan ARIMA.

- Data dengan adanya pengaruh siklis

Siklis adalah fluktuasi bergelombang data yang terjadi di sekitar garis trend, sulit diprediksi karena cenderung tidak stabil. Metode peramalan yang digunakan: dekomposisi data, model-model ekonometrik, regresi berganda dan ARIMA.

ARIMA

Pengertian ARIMA (Autoregressive Integrated Moving Average)

Model ARIMA (p,d,q) merupakan campuran antara AR(p), MA(q) yang telah distasionerkan dengan melakukan pembedaan sebanyak d kali. Model umum ARIMA (p,d,q) yaitu

Ø_p (B) (1-B)^d Z_t = Ө_q (B) a_t

Dimana: (B) Z_t = Z_t-1 ; (B)² Z_t = Z_t-2 ; (B) a_t = a_t-1

Telah dijelaskan bahwa tidak mudah menentukan p dan q. Box dan Jenkins menawarkan 4 (empat) langkah-langkah permodelan ARIMA.

1. Identifikasi

Mengidentifikasi data dilakukan statisioner dalam varians dan statisioner dalam means. Untuk melakukan identifikasi statisioner dalam varians dilakukan transformasi box cox. Data dikatakan telah stasioner dalam varians jika nilai Rounded Value (lambda) sama dengan 1. Jika data tidak stasioner dalam varians maka menggunakan transformasi box-cox yang sesuai dengan nilai rounded value pada pengujian yang pertama. Identifikasi selanjutnya yaitu statisioner dalam means yang dapat di lihat pada gambar time series plot. Data dikatakan telah stasioner dalam means jika time series plot dapat ditarik garis tengah secara lurus. Jika data belum stasioner dalam means maka dilakukan differencing.

Lamdha (λ) value	Transformation
λ = 2	Y' = Y pangkat dua
λ = 0,5	Y' = akar Y
λ = 0	Y' = ln Y
λ = -0,5	Y' = 1/ akar Y
λ = -1	Y' = 1/Y

2. Estimasi

Setelah p dan q ditentukan, mengestimasi parameter AR dan MA yang ada pada model. Estimasi ini bisa menggunakan teknik kuadrat terkecil sederhana maupun dengan metode estimasi tidak linier. Menentukan model awal dengan ACF dan PACF.

3. Tes Hipotesis

Setelah model ARIMA nya ditentukan, parameternya telah diestimasi, kemudian kita akan cek apakah model ARIMA lain yang lebih cocok atau sama cocoknya dengan model terpilih. Syarat asumsi yang digunakan sebagai berikut.

a. White noise

Pada pengujian ini digunakan pengujian L-jung Box, dengan hipotesis sebagai berikut.

Hipotesis:

H₀ : Data telah white noise

H₁ : Data tidak white noise

b. Residual Normal

Pada pengujian ini digunakan hasil output pengujian residual kolmogorov smirnov,dengan hipotesis sebagai berikut.

Hipotesis:

H₀ : Residual telah berdistribusi normal

H₁ : Residual tidak berdistribusi normal

c. Signifikansi parameter

Hipotesis:

H₀ : Data tidak signifikan

H₁ : Data telah signifikan

Sebaliknya, bila tidak memenuhi salah satu asumsi maka harus melakukan pilihan ulang dari awal lagi. Oleh sebab itu, metodologi Box-Jenkins disebut juga suatu proses iterasi.

4. Tes Diagnostik

Pada tahap ini, akan dipilih model yang terbaik dengan kriteria kebaikan model yaitu dengan memilih berdasarkan nilai MSE, MA, AIC, SBC dan lain-lain.

5. Ramalan

Secara umum dan pada banyak hal, ramalan yang diperoleh dengan menggunakan model ARIMA lebih reliabel bila dibandingkan dengan ramalan yang menggunakan model ekonometri biasa.

Ø Rincian Tahapannya yaitu sebagai berikut.

1. Tahap Identifikasi

Seperti yang telah didiskusikan terdahulu, alat utama untuk identifikasi model ARIMA adalah Fungsi Autokorelasi (ACF) dan Fungsi Autokorelasi Parsial (PACF) melalui korelogramnya. ACF mengukur korelasi antar pengamatan dengan jeda k, sedangkan PACF mengukur korelasi antar pengamatan dengan jeda k dan dengan mengontrol korelasi antar dua pengamatan dengan jeda kurang dari k. PACF adalah korelasi antara y_t dan y_t-ksetelah menghilangkan efek y_t yang terletak diantara kedua pengamatan tersebut β Ingat bahwa dalam regresi berganda, k mengukur tingkat perubahan terhadap y bila x_k berubah satu unit dengan β menganggap regresor lainnya konstan. k disebut juga koefisien regresi parsial. Acuan model ACF dan PACF sebagai berikut.

Model	Pola ACF	Pola PACF
AR (p)	Menyusut secara eksponensial atau pola gelombang sinusoidal yang tidak begitu jelas	Ada tiang pancang sampai lag p


MA (q)	Ada tiang pancang yang jelas sampai lag q	Menyusut secara eksponensial

ARMA (p,q)	Menyusut secara eksponensial	Menyusut secara eksponensial

2. Tahap Estimasi Model ARIMA

Dari proses identifikasi, kita menduga bahwa series yang dianalisis merupakan proses ARIMA maka modelnya sebagai berikut:

Yt = δ + a₁Y_t-1+ a₂Y_t-2 + . . .+ e_t

3. Tahap Tes Diagnostik

Untuk meyakinkan apakah ARIMA merupakan model yang cocok dengan data yang dianalisis, kita perlu menguji apakah residual dari model tersebut merupakan white noise (random) atau tidak. Untuk itu lakukan tahapan sebagai berikut.

i. Estimasi model ARIMA

ii. Hitung residual dari model tersebut

iii. Hitung ACF dan PACF kemudian plot

iv. Uji apakah ACF dan PACF signifikan signifikan, ini merupakan indikasi

v. Bila ACF dan PACF tidak signifikan, ini merupakan indikasi bahwa residual merupakan white noise yang artinya modelnya telah cocok.

4. Tahap Peramalan

yaitu menuliskan modelnya dan mengevaluasi nilai MSE.

Sabtu, 17 Desember 2011

case study part II

Data wei 6

Data akan di identifikasi statisioner dalam varians dan statisioner dalam means. Untuk melakukan identifikasi statisioner dalam varians dilakukan transformasi box cox, berikut, hasilnya ditampilkan dalam bentuk visual.

Dari hasil output diatas diketahui nilai Rounded Value (lambda) sebesar 0,5, jadi dapat disimpulkan bahwa data belum statisioner dalam varians. Selanjutnya akan dilakukan transformasi.

Dari hasil output diatas diketahui nilai Rounded Value (lambda) sebesar 1, jadi dapat disimpulkan bahwa data telah statisioner dalam varians.

Identifikasi selanjutnya yaitu statisioner dalam means yang dapat di lihat pada gambar time series plot. Berikut gambar hasil output time series plot.

Dari hasil diatas dapat diketahui bahwa data telah statisioner dalam means karena plotnya dapat ditarik garis lurus tepat di tengah atau konstan.

2. Estimasi

Menentukan model awal dengan ACF dan PACF yang dapat dilihat seperti Gambar di bawah ini. Untuk menentukan AR pada ARIMA maka menggunakan PACF sedangkan jika menentukan MA maka menggunakan ACF.

a. Autocorrelation Function (ACF)

b. Partial Autocorrelation Function (ACF)

Pada langkah estimasi dilakukan 3 pengujian asumsi, yaitu:

· Arima (1, 0, 1)

a. White noise

Pada pengujian ini digunakan pengujian L-jung Box, dengan hipotesis sebagai berikut.

Hipotesis:

H₀ : Data telah white noise

H₁ : Data tidak white noise

Tingkat Signifikan: α= 5%

Hasil Output:

Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag 12 24 36 48

Chi-Square 4,7 11,3 22,0 36,3

DF 9 21 33 45

P-Value 0,863 0,957 0,927 0,821

Dari output di atas maka dapat diputuskan bahwa semua nilai p-value > α sehingga gagal tolak H₀ . Jadi dapat disimpulkan bahwa data telah white noise pada arima (1, 0, 1).

a. Residual Normal

Pada pengujian ini digunakan hasil output pengujian residual kolmogorov smirnov,dengan hipotesis sebagai berikut.

Hipotesis:

H₀ : Residual telah berdistribusi normal

H₁ : Residual tidak berdistribusi normal

Tingkat Signifikan: α= 5%

Dari pengujian residual dengan menggunakan kolmogorov smirnov dapat diputuskan bahwa gagal tolak H₀. Jadi dapat disimpulkan bahwa data telah berdistribusi normal.

b. Signifikansi parameter

Hipotesis:

H₀ : Parameter tidak signifikan terhadap model

H₁ : Parameter telah signifikan terhadap model

Tingkat Signifikan: α= 5%

Hasil Output

Final Estimates of Parameters

Type Coef SE Coef T P

AR 1 0,1471 0,1424 1,03 0,304

MA 1 0,7487 0,0980 7,64 0,000

Constant 0,17781 0,06344 2,80 0,006

Dari hasil output diketahui nilai p-value pada AR1, MA1 dan constant sebesar 0,304 , 0,000, 0,006. Sehingga dapat diputuskan tolak H₀ karena nilai p-value < α yang berarti bahwa parameter telah signifikan terhadap model untuk MA1 dan constant sedangkan untuk AR1 diputuskan gagal tolak H₀.

4. Tes diagnostik

SS = 776,666 (backforecasts excluded)

MS = 7,061 DF = 110

Pada tahap ini dapat diketahui nilai MSE sebesar 7,061 yang dapat dibandingkan dengan model Arima yang lain.

Kamis, 15 Desember 2011

case study part I

silahkan download terlebih dahulu http://robjhyndman.com/tsdldata/books/wei.dat

Data Wei 5.

1. Identifikasi

Terlebih dahulu menentukan data training dan testing dimana jika testing diambil 10% dari data training yakni dimulai pada data ke-65. Selanjutnya, akan dilakukan identifikasi statisioner dalam varians dan statisioner dalam means. Untuk melakukan identifikasi statisioner dalam varians dilakukan transformasi box cox, berikut, hasilnya ditampilkan dalam bentuk visual.

Dari hasil output diatas diketahui nilai Rounded Value (lambda) sebesar 1, jadi dapat disimpulkan bahwa data telah statisioner dalam varians.

Identifikasi selanjutnya yaitu statisioner dalam means yang dapat di lihat pada gambar time series plot. Berikut gambar hasil output time series plot.

Dari hasil diatas dapat diketahui bahwa data tidak statisioner dalam means karena plotnya membentuk pola trend naik, sehingga pada data dilakukan difference dengan lag = 1. Dengan dilakukannya difference maka akan diperoleh data baru yang nantinya akan dilakukan time series plot ulang. Berikut hasil output identifikasi statisioner dalam means dengan menggunakan data hasil difference.

Dari hasil diatas dapat diketahui bahwa data telah statisioner dalam means karena plotnya telah konstan berada ditengah dan dapat ditarik garis secara lurus tepat di tengah.

2. Estimasi

Menentukan model awal dengan ACF dan PACF yang dapat dilihat seperti Gambar di bawah ini. Untuk menentukan AR pada ARIMA maka menggunakan PACF sedangkan jika menentukan MA maka menggunakan ACF.

a. Autocorrelation Function (ACF)

b. Partial Autocorrelation Function (ACF)

Pada langkah estimasi dilakukan 3 pengujian asumsi, yaitu:

· Arima (1, 1, 0)

a. White noise

Pada pengujian ini digunakan pengujian L-jung Box, dengan hipotesis sebagai berikut.

Hipotesis:

H₀ : Data telah white noise

H₁ : Data tidak white noise

Tingkat Signifikan: α= 5%

Hasil Output:

Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag 12 24 36 48

Chi-Square 8,6 18,3 26,3 38,7

DF 10 22 34 46

P-Value 0,567 0,691 0,824 0,768

Dari output di atas maka dapat diputuskan bahwa semua nilai p-value > α sehingga gagal tolak H₀ . Jadi dapat disimpulkan bahwa data telah white noise pada arima (1, 1, 0).

b. Residual Normal

Pada pengujian ini digunakan hasil output pengujian residual kolmogorov smirnov,dengan hipotesis sebagai berikut.

Hipotesis:

H₀ : Residual telah berdistribusi normal

H₁ : Residual tidak berdistribusi normal

Tingkat Signifikan: α= 5%

Dari pengujian residual dengan menggunakan kolmogorov smirnov dapat diputuskan bahwa gagal tolak H₀. Jadi dapat disimpulkan bahwa data telah berdistribusi normal.

c. Signifikansi parameter

Hipotesis:

H₀ : Parameter tidak signifikan terhadap model

H₁ : Parameter telah signifikan terhadap model

Tingkat Signifikan: α= 5%

Hasil Output

Final Estimates of Parameters

Type Coef SE Coef T P

AR 1 -0,2990 0,1243 -2,41 0,019

Constant 3,0948 0,3078 10,05 0,000

Dari hasil output diketahui nilai p-value pada AR1 dan constant sebesar 0,019 dan 0,000. Sehingga dapat diputuskan tolak H₀ karena nilai p-value < α yang berarti bahwa parameter telah signifikan terhadap model.

4. Tes diagnostik

SS = 363,973 (backforecasts excluded)

MS = 5,967 DF = 61

Pada tahap ini dapat diketahui nilai MSE sebesar 5,967 yang dapat dibandingkan dengan model Arima yang lain.

5. Ramalan

Forecasts from period 64

95% Limits

Period Forecast Lower Upper Actual

65 253,654 248,865 258,442

66 255,716 249,868 261,564

67 258,194 251,228 265,160

68 260,548 252,680 268,415

69 262,939 254,247 271,631

70 265,318 255,878 274,759

71 267,702 257,567 277,836

Dari output di atas maka dapat diketahui bahwa ramalan (forecast) ke depan dimulai pada data ke-65.

· Arima (0, 1, 1)

a. White noise

Pada pengujian ini digunakan pengujian L-jung Box, dengan hipotesis sebagai berikut.

Hipotesis:

H₀ : Data telah white noise

H₁ : Data tidak white noise

Tingkat Signifikan: α= 5%

Hasil Output:

Modified Box-Pierce (Ljung-Box) Chi-Square statistic

Lag 12 24 36 48

Chi-Square 8,0 17,4 24,8 38,1

DF 10 22 34 46

P-Value 0,630 0,740 0,876 0,790

Dari output di atas maka dapat diputuskan bahwa semua nilai p-value > α sehingga gagal tolak H₀ . Jadi dapat disimpulkan bahwa data telah white noise pada arima (0, 1, 1).

b. Residual Normal

Pada pengujian ini digunakan hasil output pengujian residual kolmogorov smirnov,dengan hipotesis sebagai berikut.

Hipotesis:

H₀ : Residual telah berdistribusi normal

H₁ : Residual tidak berdistribusi normal

Tingkat Signifikan: α= 5%

Dari pengujian residual dengan menggunakan kolmogorov smirnov dapat diputuskan bahwa gagal tolak H₀. Jadi dapat disimpulkan bahwa data telah berdistribusi normal.

c. Signifikansi parameter

Hipotesis:

H₀ : Parameter tidak signifikan terhadap model

H₁ : Parameter telah signifikan terhadap model

Tingkat Signifikan: α= 5%

Hasil Output

Final Estimates of Parameters

Type Coef SE Coef T P

MA 1 0,2872 0,1248 2,30 0,025

Constant 2,3811 0,2197 10,84 0,000

Dari hasil output diketahui nilai p-value pada MA1 dan constant yakni 0,025 dan 0,000. Sehingga dapat diputuskan tolak H₀ karena nilai p-value < α yang berarti bahwa semua parameter telah signifikan terhadap model.

Ø Tes diagnostik

SS = 364,407 (backforecasts excluded)

MS = 5,974 DF = 61

Pada tahap ini dapat diketahui nilai MSE sebesar 5,974 yang dapat dibandingkan dengan model Arima (1,1,0). Sehingga dapat disimpulkan bahwa kriteria kebaikan model yang terbaik adalah Arima (1,1,0) karena memiliki nilai MSE yang lebih kecil dibandingkan dengan Arima (0,1,1).

Ø Ramalan

Forecasts from period 64

95% Limits

Period Forecast Lower Upper Actual

65 253,613 248,822 258,405

66 255,994 250,110 261,879

67 258,375 251,572 265,179

68 260,757 253,144 268,370

69 263,138 254,794 271,482

70 265,519 256,503 274,535

71 267,900 258,259 277,541

Dari output di atas maka dapat diketahui bahwa ramalan (forecast) ke depan dimulai pada data ke-65.

speak with data

Pages

Senin, 19 Desember 2011

Sekilas tentang ARIMA

ARIMA

Sabtu, 17 Desember 2011

case study part II

Kamis, 15 Desember 2011

case study part I

Let's learn ARIMA easily

Followers

Facebook Badge

Blog Archive

Featured Posts

Labels

Blog Archive