ANALITIK DATA DAN PEMBELAJARAN MESIN 

  • DATA : 

         data sebagai kumpulan fakta atau informasi yang diperoleh melalui pengamatan, pengukuran, atau penelitian, biasanya dalam bentuk angka, teks, atau gambar, dan dapat diolah serta dianalisis untuk mendapatkan pemahaman atau pengetahuan lebih lanjut.

  • ANALIS DATA :
        Analisis data  adalah proses inspeksi,  pembersihan  dan  pemodelan data  dengan tujuan menemukan informasi yang berguna, menginformasikan kesimpulan dan mendukung pengambilan keputusan. Analisis data memiliki banyak sisi dan pendekatan, mencakup beragam teknik dengan berbagai nama, dan digunakan dalam berbagai bidang  bisnis ilmu pengetahuan , dan  ilmu sosial . Dalam dunia bisnis saat ini, analisis data berperan dalam membuat keputusan lebih ilmiah dan membantu operasional bisnis lebih efektif.
  • DATA BESAR :
         Big Data adalah istilah yang digunakan untuk menggambarkan kumpulan data yang sangat besar dan kompleks yang terlalu banyak untuk dianalisis dan diproses menggunakan teknik dan metode tradisional. Istilah ini mencakup berbagai jenis data, termasuk data terstruktur dan tidak terstruktur, serta data yang dihasilkan dari berbagai sumber.

  • BINGKAI DATA PANDAS :
adalah struktur data tabular dua dimensi yang berpotensi berubah ukuran dan berpotensi heterogen dengan sumbu berlabel (baris dan kolom). Bingkai Data adalah struktur data dua dimensi, yaitu data yang disejajarkan dalam bentuk tabel dalam baris dan kolom. Pandas DataFrame terdiri dari tiga komponen utama,  data  ,  baris  , dan  kolom.
Di Python, DataFrame adalah objek dalam pustaka  panda . Pustaka panda adalah pustaka inti yang digunakan oleh Python di Excel, dan objek DataFrame adalah struktur kunci untuk menganalisis data dengan Python di Excel. 

  • VISUALISASI DATA PERPUSTAKAAN :
1. Matplotlib, merupakan paket visualisasi data yang banyak digunakan di Python. Library ini mampu menghasilkan visualisasi seperti histogram, grafik, plot, serta bisa di custom hingga bagian terkecil.
    2.  Seaborn, merupakan perpustakaan yang sering digunakan bersamaan dengan matplotlib. Selain dibuat diatas perpustakaan Matplotlib, perpustakaan ini juga terintegrasi dengan numpy dan pandas. Warna dan tampilan yang disajikan dari perpustakaan ini terlihat lebih menarik dan modern. 
    3.   Secara plot. Selain R, Python juga memiliki perpustakaan yang bernama plotly. Library ini menjadi salah satu perpustakaan yang cukup interaktif serta memiliki banyak pilihan grafik, seperti histogram, heatmaps, dll. 
    4.  Geoplotlib, merupakan salah satu perpustakaan yang menyediakan visualisasi data dalam bentuk peta geografis.
    5.  Altair, merupakan paket yang cukup interaktif serta tidak memerlukan coding yang rumit. Hanya saja, untuk menggunakan perpustakaan ini, kamu akan membutuhkan perpustakaan lain seperti python 3.6, entrypoints, jsonschema, NumPy, Pandas, dan Toolz karena perpustakaan ini sangat bergantung pada perpustakaan tersebut.
  • PEMBELAJARAN MESIN :

        Teknologi  machine learning  (ML) adalah mesin yang dikembangkan untuk bisa belajar dengan sendirinya tanpa arahan dari penggunanya. Pembelajaran mesin  dikembangkan berdasarkan disiplin ilmu lainnya seperti statistika, matematika dan  data mining  sehingga mesin dapat belajar dengan menganalisis data tanpa perlu di program ulang atau diperintah.

  • PENcilan :
Outlier adalah bagian dari data yang sangat berbeda dari sebagian besar data lainnya. 

  • SAMPLING VALIDASI LINTAS:
adalah teknik untuk memutar performa model machine learning pada data yang belum pernah dilihat sebelumnya (data unseen).

  • PENYESUAIAN HIPERPARAMETER :

Hyperparameter tuning adalah proses mencari nilai optimal dari hyperparameter suatu model machine learning untuk memperbaiki performa model machine learning.




SUMBER DARI YANG SAYA CARI:


Comments