Pengenalan Data analytic dan Machine Learning

 Pengenalan Data analytic dan Machine Learning 


  •    DATA 
    Pengertian Data menurut para ahli: 
    
    1. Menurut Kuswandi dan E. Mutiara mendeskripsikan data sebagai sekumpulan informasi yg diperoleh dari pengamatan, dapat berupa simbol, angka, dan properti.     
    2. menurut Arikunto Suharsimi mendefinisikan data sebagai serangkaian fakta dan angka yang dapat digunakan sebagai komponen untuk menyusun informasi. 
    3. menurut Kamus Besar Bahasa Indonesia (KBBI) mengartikan data sebagai kumpulan fakta atau informasi yang diperoleh melalui pengamatan, pengukuran, atau penelitian, biasanya dalam bentuk angka, teks, atau gambar, dan dapat diolah serta dianalisis untuk mendapatkan pemahaman atau pengetahuan lebih lanjut. 

  • Data Analyst
    Data analyst adalah profesi pekerjaan yang tugasnya untuk membaca serta menganalisis data yang ada dari perusahaan dalam rangka keberlangsungan perusahaan tersebut.
  •    Big data 
    BIG data adalah istilah yg digunakan untuk menyimpulkan sebuah kumpulan data yang sangat besar dan kompleks untuk di analisis menggunakan teknik tradisional 
  •  Pandas Dataframe 
    dataframe itu sendiri merupakan struktur data dua dimensi dalam bahasa pemrograman, nah dalam python dataframe adalah objek dalam pustaka pandas. 
  • Library Visualisasi data pada bahasa python 
    1. Matplotlib, merupakan package visualisasi data yang banyak digunakan di Python. Library ini mampu untuk menghasilkan visualisasi seperti histogram, grafik, plot, serta bisa di custom hingga bagian terkecil.
    2. Seaborn, merupakan library yang sering digunakan bersamaan dengan matplotlib. Selain dibuat diatas library Matplotlib, library ini juga terintegrasi dengan numpy dan pandas. Warna dan tampilan yang disajikan dari library ini terlihat lebih menarik dan modern. 
    3.  Plotly. Selain R, Python juga memiliki library yang bernama plotly. Library ini menjadi salah satu library yang cukup interaktif serta memiliki banyak pilihan grafik, seperti histogram, heatmaps, dll. 
    4. Geoplotlib, merupakan salah satu library yang menyediakan visualisasi data dalam bentuk map geografis.
    5. Altair, merupakan package yang cukup interaktif serta tidak membutuhkan coding yang rumit. Hanya saja, untuk menggunakan library ini, kamu akan membutuhkan library lain seperti python 3.6, entrypoints, jsonschema, NumPy, Pandas, dan Toolz karena library ini sangat bergantung pada library tersebut.
  • Machine Learning 
    Teknologi machine learning (ML) adalah mesin yang dikembangkan untuk bisa belajar dengan sendirinya tanpa arahan dari penggunanya. Pembelajaran mesin dikembangkan berdasarkan disiplin ilmu lainnya seperti statistika, matematika dan data mining sehingga mesin dapat belajar dengan menganalisa data tanpa perlu di program ulang atau diperintah. 
  • Outlier
    Outlier adalah bagian dari data yang sangat berbeda dari sebagian besar data lainnya. 
  • Model Supervised Learning 
    Supervised learning adalah subkategori atau tipe dari machine learning yang menggunakan data-data yang berlabel sebagai inputnya. Data-data tersebut diharapkan dapat 'supervise' atau melatih algoritma sehingga nantinya dapat digunakan untuk proses klasifikasi atau prediksi suatu data baru secara akurat.
  • Cross validation sampling 
    Cross validation adalah teknik statistik yang digunakan dalam machine learning dan pemodelan prediktif lainnya untuk menilai kinerja dan kemampuan generalisasi suatu model.
  • Hyperparameter tuning 
    Hyperparameter tuning adalah proses mencari nilai optimal dari hyperparameter suatu model machine learning untuk memperbaiki performa model machine learning Ini dilakukan dengan mencoba berbagai nilai hyperparameter dan membandingkan hasil mereka dengan metrik performa seperti akurasi atau F1 score. 





sumber:










Comments