Pengenalan Data analytic dan Machine Learning
- DATA
Pengertian Data menurut para ahli:
1. Menurut Kuswandi dan E. Mutiara mendeskripsikan data sebagai sekumpulan informasi yg diperoleh dari pengamatan, dapat berupa simbol, angka, dan properti.
2. menurut Arikunto Suharsimi mendefinisikan data sebagai serangkaian fakta dan angka yang dapat digunakan sebagai komponen untuk menyusun informasi.
3. menurut Kamus Besar Bahasa Indonesia (KBBI) mengartikan data sebagai kumpulan fakta atau informasi yang diperoleh melalui pengamatan, pengukuran, atau penelitian, biasanya dalam bentuk angka, teks, atau gambar, dan dapat diolah serta dianalisis untuk mendapatkan pemahaman atau pengetahuan lebih lanjut.
- Data Analyst
Data analyst adalah profesi pekerjaan yang tugasnya untuk membaca serta menganalisis data yang ada dari perusahaan dalam rangka keberlangsungan perusahaan tersebut.
- Big data
BIG data adalah istilah yg digunakan untuk menyimpulkan sebuah kumpulan data yang sangat besar dan kompleks untuk di analisis menggunakan teknik tradisional
- Pandas Dataframe
dataframe itu sendiri merupakan struktur data dua dimensi dalam bahasa pemrograman, nah dalam python dataframe adalah objek dalam pustaka pandas.
- Library Visualisasi data pada bahasa python
1. Matplotlib, merupakan package visualisasi data yang banyak digunakan di Python. Library ini mampu untuk menghasilkan visualisasi seperti histogram, grafik, plot, serta bisa di custom hingga bagian terkecil.
2. Seaborn, merupakan library yang sering digunakan bersamaan dengan matplotlib. Selain dibuat diatas library Matplotlib, library ini juga terintegrasi dengan numpy dan pandas. Warna dan tampilan yang disajikan dari library ini terlihat lebih menarik dan modern.
3. Plotly. Selain R, Python juga memiliki library yang bernama plotly. Library ini menjadi salah satu library yang cukup interaktif serta memiliki banyak pilihan grafik, seperti histogram, heatmaps, dll.
4. Geoplotlib, merupakan salah satu library yang menyediakan visualisasi data dalam bentuk map geografis.
5. Altair, merupakan package yang cukup interaktif serta tidak membutuhkan coding yang rumit. Hanya saja, untuk menggunakan library ini, kamu akan membutuhkan library lain seperti python 3.6, entrypoints, jsonschema, NumPy, Pandas, dan Toolz karena library ini sangat bergantung pada library tersebut.
- Machine Learning
Teknologi machine learning (ML) adalah mesin yang dikembangkan untuk bisa belajar dengan sendirinya tanpa arahan dari penggunanya. Pembelajaran mesin dikembangkan berdasarkan disiplin ilmu lainnya seperti statistika, matematika dan data mining sehingga mesin dapat belajar dengan menganalisa data tanpa perlu di program ulang atau diperintah.
- Outlier
Outlier adalah bagian dari data yang sangat berbeda dari sebagian besar data lainnya.
- Model Supervised Learning
Supervised learning adalah subkategori atau tipe dari machine learning yang menggunakan data-data yang berlabel sebagai inputnya. Data-data tersebut diharapkan dapat 'supervise' atau melatih algoritma sehingga nantinya dapat digunakan untuk proses klasifikasi atau prediksi suatu data baru secara akurat.
- Cross validation sampling
Cross validation adalah teknik statistik yang digunakan dalam machine learning dan pemodelan prediktif lainnya untuk menilai kinerja dan kemampuan generalisasi suatu model.
- Hyperparameter tuning
Hyperparameter tuning adalah proses mencari nilai optimal dari hyperparameter suatu model machine learning untuk memperbaiki performa model machine learning Ini dilakukan dengan mencoba berbagai nilai hyperparameter dan membandingkan hasil mereka dengan metrik performa seperti akurasi atau F1 score.
sumber:
Comments
Post a Comment