Rabu, 09 Januari 2019

KAGGLE

Assalamualaikum WR WB.
Halloo jumpa lagi dengan saya kali ini mari kita bahas sedikit tentang kaggle yuk langsung saja...

Kalau Anda berinteraksi dengan dunia data science (DS), machine learning (ML), atau artificial intelligence (AI), cepat atau lambat Anda akan bertemu dengan kata Kaggle, yang merujuk pada situs Kaggle.com. Misalnya, kalau Anda baca-baca lowongan untuk DS, ML, atau AI engineer, sering Anda temukan persyaratan yang berbunyi “partisipasi dalam Kaggle adalah nilai plus”. Atau kalau Anda bergaul dengan komunitas DS, ML, atau AI, kadang ada ajakan untuk bergabung dalam tim Kaggle.

Jadi apakah Kaggle itu?

Kaggle adalah situs dan platform untuk berlomba membuat model terbaik untuk menganalisa dan memprediksi suatu dataset. Dataset ini diberikan oleh suatu perusahaan, dengan suatu deskripsi masalah tertentu. Misalnya, diberikan data rumah beserta fitur-fiturnya dan harga jualnya, dan deskripsi masalahnya adalah buatlah model untuk memprediksi harga jual berdasarkan fitur-fitur tersebut.

Bagi kita praktisi atau pelajar data science, Kaggle sangat berguna untuk belajar, berlatih,  dan mempertajam skill dan insting data science kita. Dengan mempelajari write up atau ulasan orang lain dalam memecahkan suatu masalah, kita bisa mendapat banyak ide dan ilmu tentang bagaimana proses dan jalan berpikir dia memecahkan masalah data science. Lalu dengan ikut dalam kompetisi, kita akan diberi feedback tentang akurasi model kita, dan dari situ kita berlatih bagaimana membuat model yang lebih baik. Selama kompetisi, sering orang berbagi tips atau ide yang dia pakai, sehingga dari situ tidak hanya kita bisa memperbaiki model kita, tapi kita juga bisa belajar, menjadi lebih kreatif, sekaligus melatih insting pemecahan masalah kita.

 Berikut adalah penjelasan tentang komponen-komponen

  • Overview
     Berisi informasi dasar tentang spesifikasi kompetisi, yaitu deskripsi permasalahan yang hendak dipecahkan serta solusi apa yang diharapkan. Di laman overview ini juga ada laman Tutorials (di menu kiri) yang berisi petunjuk dan link-link ke kernel atau forum diskusi untuk memecahkan masalah di kompetisi ini.

  • Data/dataset
     Sebuah kompetisi akan memberi minimal dua data (dalam bentuk CSV), yaitu data training dan data test. Data training digunakan untuk melatih model Anda, lalu Anda memasukkan hasil prediksi model Anda dalam data test, untuk di-submit dan dinilai oleh platform kompetisi Kaggle.

  • Kernel
     Kernel adalah istilah Kaggle untuk workspace pekerjaan Anda di sebuah kompetisi. Tadinya saya bingung dengan istilah ini, karena kalau di IT biasanya istilah kernel dipakai untuk sesuatu yang menjadi core sebuah sistem.

     Sebuah kernel terdiri dari data (yang Anda ambil dari dataset spesifikasi kompetisi di atas), sebuah notebook (Python atau R), kode, dan komentar-komentar/diskusi yang Anda atau anggota tim Anda tuliskan untuk kernel itu. Kernel bisa dibuat dari nol, atau dengan cara mem-fork dari kernel orang lain.

Oke cukup sekian pembahasan yang singkat ini hheheh...
Wassalamualaikum WR. WB.

Selasa, 08 Januari 2019

IMPLEMENTASI SIDS

Assalamualaikum WR. WB.
Halooo ketemu lagi nih semoga gak bosan dengan saya kali ini mari kita membahas tentang Implementasi pada gis, Dalam implementasi gis saat ini sudah banyak menggunakan algoritma Ant Colony, Djikstra dll apa itu..?? yukk langsung saja

    - ACO atau Algoritma semut merupakan algoritma yang digunakan untuk menyelesaikan masalah-masalah optimasi yang terinspirasi dari perilaku semut. Sebut aja Artificial Ant (semut tiruan).

    Saat ini sedang banyak dilakukan penelitian terhadap perilaku alam yang mungkin bisa diterapkan untuk mencari solusi pada permasalahan2 optimasi. Kita sudah sering mendengar JST dan Algoritma Genetika yang meniru system kerja tubuh manusia. Perilaku hewan juga ditiru, burung, lebah, angsa… dan algoritma semut hanya salah satunya.

Perilaku Semut Yang Mana?

    Pada saat semut menemukan sumber makanan, maka semut perlu menentukan jalur yang terpendek antara sumber makanan dan sarang semut. Disinilah peran teman2 atau ‘koloni’ semut. Pekerjaan menelusuri jalur didistribusikan kepada beberapa agen semut. Pada awalnya semut2 tersebut akan melalui semua jalur yang memungkinkan secara acak. Kemudian jalur yang terpendek pada saat itu dibubuhi jejak, yang disebut dengan pheromone. Pada dunia nyata, pheromone merupakan alat komunikasi berupa hormon yang dikeluarkan oleh semut sebagai penunjuk jalan bagi semut yang lain.

    Dengan adanya informasi pheromone, maka semut2 selanjutnya tidak akan berjalan secara acak lagi, namun akan lebih tertarik mengikuti jalur yang ada pheromonenya. Semakin banyak semut melalui suatu jalur, semakin banyak pula jumlah pheromone yang tertinggal di jalur tersebut. Sehingga, lama kelamaan semua semut melalui satu jalur yang seragam, yaitu jalur yang terpendek. Perilaku semut yang seperti ini merupakan salah satu bentuk autocatalytic-suatu perulangan dengan feedback yang positif.

Macam-Macam Algoritma Semut?
  1. Versi pertama disebut dengan Ant System (AS), yang diaplikasikan pada TSP
  2. Elitist Ant System (EAS)
  3. Rank-Based ANt System (ASrank)
  4. Min-Max Ant System (MMAS)
  5. Ant Colony System (ACS)
  6. Approximate Nondeterministic Tree Search (ANTS)
  7. Hyper-Cube Framework for ACO
  8. Dsb
- Djikstra merupakan salah satu varian bentuk algoritma popular dalam pemecahan persoalan terkait masalah optimasi pencarian  lintasan terpendek sebuah lintasan yang mempunyai panjang minimum dari verteks a ke z dalam graph berbobot, bobot tersebut adalah bilangan positif jadi tidak dapat dilalui oleh node negatif. Namun jika terjadi demikian, maka penyelesaian yang diberikan adalah infiniti (Tak Hingga). Pada algoritma Dijkstra, node digunakan karena algoritma Dijkstra menggunakan graph berarah untuk penentuan rute listasan terpendek. Berikut Pseudo Code dan Flowchart Algoritma Djikstra:

 

Implementasi Djikstra
     Algoritma ini bertujuan untuk menemukan jalur terpendek berdasarkan bobot terkecil dari satu titik ke titk lainnya. Misalnya titik mengambarkan gedung dan garis menggambarkan jalan, maka algoritma Dijkstra melakukan kalkulasi terhadap semua kemungkinan bobot terkecil dari setiap titik.
     Pertama-tama tentukan titik mana yang akan menjadikan node awal, lalu beri bobot jarak pada node pertama ke node terdekat satu persatu, Dijkstra akan melakukan pengembangan pencarian dari satu titik ke titik lain dan ke titik selanjutnya tahap demi tahap inilah urutan logika dari algoritma Dijkstra :
  1. Beri nilai bobot (jarak) untuk setiap titik ke titik lainnya, lalu set nilai 0 pada node awal dan nilai tak hingga terhadap node lain (belum terisi)
  2. Set semua node “Belum Terjamah” dan set node awal sebagai “Node keberangkatan”
  3. Dari no keberangkatan, pertimbangkan node tetangga yang belum terjamah dan hitung jaraknya dari titik keberangkatan. Sebagai contoh, jika titik keberangkatan A ke B memiliki bobot jarak 6 dan dari B ke node C berjarak 2, maka jarak ke C melewati B menjadi 6+2=8. Jika jarak ini lebih kecil dari jarak sebelumnya (yang telah terekam sebelumnya) hapus data lama, simpan ulang data jarak dengan jarak yang baru.
  4. Saat kita selesai mempertimbangkan setiap jarak terhadap node tetangga, tandai node yang telah terjamah sebagai “Node terjamah”. Node terjamah tidak akan pernah di cek kembali, jarak yang disimpan adalah jarak terakhir dan yang paling minimal bobotnya.
  5. Set “Node belum terjamah” dengan jarak terkecil (dari node keberangkatan) sebagai “Node Keberangkatan” selajutnya dan lanjutkan dengan kembali ke step 3

 Okee cukup sekian kali ini sampai berjumpa di lain waktu hahahaha...
Wassalamualaikum WR. WB.

MEASUREMENT GIS

Assalamualaikum WR. WB.
Halloo lagi lagi bertemu dengan saya kemabli kali ini mari kita membahas tentang Measurement GIS yukk langsung saja...

 Perhitungan (Measurement)
- jarak antara dua titik
- jarak terpendek antara dua titik
- luas area/polygon

1. Measurements/Pengukuran adalah perpanjangan dari dimensi suatu objek.
2. Dalam sistem internasional dari quantitas, adalah sebuah kuantitas dari dimensi jarak.
3. Dalam konteks lainnya, pengukuran dimensi suatu objek.

Vector GIS Measurement

Pada pengukuran vektor, pengukuran panjang atau jarak menggunakan rumus pythagoras, dan pengukuran luas dan keliling menggunakan rumus geometri.

Raster GIS Measurement

1. Pythagorean Distance / Euclidean Distance
Menghitung panjang atau jarak antara dua titik menggunakan rumus pythagoras.

2. Manhattan Distance
Menghitung panjang atau jarak antara dua titik dengan menghitung jumlab sel yang dilalui oleh garis tersebut.

3. Proximity Distance
Menghitung panjang atau jarak antara dua titik dengan perkiraan. Proximity mirip dengan pythagorean, tetapi diterapkan pada setiap pixel. 

4. Perimeter and Area
Menghitung keliling (perimeter) dan luas (area) dari sebuah polygon dengan menggunakan rumus geometri dengan satuan cell unit.
 



Okee cukup sekian dulu kali ini mari bertemu di next time hehehehe....
Wassalamualaikum WR. WB.

 

SPATIAL ANALYSIS

Assalamualaikum WR. WB.
Hellooo bertemu kembali dengan saya kali ayo kita belajar bersama tentang Spatial Analysis yukk langsung saja

Apa itu Spatial Analysis?
• Mengidentifikasi lokasi dan bentuk dari fitur-fitur geografis dan relasi diantaranya.  • Berguna untuk evaluasi kesesuaian • Berguna untuk meningkatkan pemahaman yg baik akan bagaimana fitur-fitur geografis dan fenomena dilokasikan dan di distribusikan.

Spatial Analysis Membantu dalam:
• Menjawab pertanyaan2 geografis – Dimana sekolah yang terdekat dgn rumah? • Membantu pengambilan keputusan – Memilih dlm menentukan dimana lokasi kilang minyak • Menambil tindakan, membuat perubahan2 – Mengubah rute hiking • Membangun model-model yg akurat – Pemodelan dampak peningkatan CO2 .

- Apa itu Spatial Analyst ? Extension ArcGIS yg dpt digunakan utk mengintegrasikan analisa data raster dan vector serta create, query, map, dan analisa data raseter berbasis cell dan masih banyak lagi!


Pemrosesan Spasial

Pengolahan, pemorsesan dan analisa data spasial biasanya bergantung dengan model datanya. Pengolahan, pemrosesan dan analisa data spasial memanfaatkan pemodelan SID yang berdasar pada kebutuhan dan analitiknya. Analitik yang berlaku pada pemrosesan data spasial seperti overlay, clip, intersect, buffer, query, union, merge yang mana dapat dipilih ataupun dikombinasikan.
a. Overlay adalah merupakan perpaduan dua layer data spasial
b. Clip adalah perpotongan suatu area berdasar area lain sebagai referensi.
c. Intersection adalah perpotongan dua area yang memiliki kesamaan karakteristik dan kriteria.
d. Buffer adalah menambahkan area di sekitar obyek spasial tertentu.
e. Query adalah seleksi data berdasar pada kriteria tertentu.
f. Union adalah penggabungan / kombinasi dua area spasial beserta atributnya yang berbeda menjadi satu.
g. Merge adalah penggabungan dua data berbeda terhadap feature spasial.
h. Dissolve adalah menggabungkan beberapa nilai berbeda berdasar pada atribut tertentu. 

Berikut Contoh Beberapa : 
 
1.1 OVERLAY
 
1.2 DISSOLVE
 
1.3 INTERSECTION

Okee sekian dulu dari saya sekarang ini sampai jumpa next time...
Wassalamualaikum WR. WB.

 

MODEL BASIS DATA - SIDS

Assalamualaikum WR. WB.
Hallooo ketemu lagi kali ini akan belajar bersama tentang Model Basis Data yukk langsung saja....


Konsep Manajemen Basis Data Dalam Sistem Informasi Geografis (SIG)

SIG Sebagai Basis Data
Saat ini  SIG dikembangkan dengan menggunakan sistem manajemen basis data (DBMS). Beberapa fakta menunjukan bahwa sebagian besar biaya sistem perangkat lunak SIG adalah biaya untuk DBMS-nya. Selain itu, DBMS memiliki dan menangani fungsi-fungsi yang sangat diperlukan oleh SIG.
Ada dua pendekatan umum untuk menggunakan DBMS dalam SIG:
  1. Pendekatan solusi DBMS  total – data spasial dan non-spasial diakses melalui DBMS.
  2. Pendekatan solusi kombinasi – tidak semua data diakses melalui DBMS karena data-data tersebut telah sesuai dengan modelnya.
Sistem Manajemen Basis Data SIG
Hasil gambar untuk sistem manajemen basis data gis 
 
Basis Data Spasial yaitu :
  • Sekumpulan entity baik yang memiliki lokasi atau posisi tetap maupun tidak tetap
  • Tipe-tipe entity spasial meliputi lokasi, dimensi dan bentuk
  • Hampir semua SIG mempunyai campuran tipe-tipe entity spasial dan non spasia, dimana tipe entity non spasial tidak memiliki properti topografi dasar lokasi
DBMS yang digunakan dalam SIG :
  • Dengan pendekatan solusi DBMS yaitu semua data spasial dan non spasial diakses melalui DBMS sehingga data-data tersebut harus memenuhi asumsi yang telah ditentukan oleh perancang DBMS
  • Pendekatan Solusi Kombinasi yaitu mengadopsi dua sistem basis data yang pertama untuk data spasial (Map Info) dan yang kedua untuk data atribut (Database).
 
Model Basis Data Relasional

Model basisdata yang paling terkenal dalam DBMS ini banyak digunakan dalam SIG. Beberapa DBMS yang menggunakan model basis data relasional:
  1. Dbase(*.dbf) – digunakan oleh ArcView, PC Arc/Info, dan SIG lain
  2. INFO – Digunakan di dalam Arc/Info
  3. Oracle –  Digunakan dalam Arc/Info, Geovision, dll
Model Basis Data Hybrid 
  • Struktur data vektor dan struktur data raster dapat dipadukan pada suatu sistem, dengan melengkapi fasilitas konversi vektor ke raster dan raster ke vektor. Selain itu juga disediakan fungsi-fungsi untuk mengolah masing-masing struktur data.
  • Data SIG terdiri dari dua bentuk data: yaitu data grafis yang menyatakan entitas obyek dan data attribut. Data grafis yang terdiri dari data koordinat dan data topologi disimpan di berkas yang terpisah dari data atribut.  Data atribut ditangani oleh database management system.  Penggabungan kedua tipe data dilakukan melalui suatu kode identifikasi, misal kode identifikasi poligon, garis atau titik. Hal yang sama juga dapat dilakukan ‘linkage’ antara grid-cell modules dengan database management system.
  • Operasional SIG secara keseluruhan yang terdiri dari SIG software, CAD software, Image Processing software, GPS software, Open-Source components, DBMS system.
Model Basis Data Terintegrasi
  • Pendekatan modael data terintegrasi juga dideskripsikan sebagai pendekatan sistem pengelolaan basis data (DBMS) spasial, dengan SIG yang bertindak sebagai query processor. 
  • Kebanyakan implementasinya pada saat ini adalah bentuk topologi vektor dengan tabel-tabel relasional yang menyimpan data-data koordinat peta (titik, nodes, segmen garis, dl.) bersama dengan tabel lain yang berisi informasi topologi. 
  • Data-data atribut disimpan di dalam tabel-tabel yang sama sebagai basis data map feature (tabel internal atau abel yang dibuat secara otomatis) atau disimpan di dalam tabel-tabel yang terpisah dan dapat diakses melalui operasi relasioanl “JOIN”.
 
 Okee Sekian dari saya saat ini Wassalamualaikum WR. WB.