Machine Learning

Pengantar Machine Learning Dengan Python Beserta Contoh

Machine Learning adalah tindakan yang memungkinkan komputer untuk belajar tanpa diprogram secara eksplisit. Ini dilakukan dengan memasukkan data ke komputer dan mengubahnya menjadi model keputusan, yang kemudian digunakan untuk prediksi masa depan. Machine Learning Dengan Python adalah cara terbaik untuk membuat prediksi yang akan dilakukan.

Dalam tutorial ini, Labkom99 akan membahas Machine Learning dan beberapa konsep dasar yang diperlukan untuk memulai Machine Learning. Kami juga akan merancang beberapa contoh Python untuk memprediksi elemen atau event tertentu.

Pengantar Machine Learning

Machine Learning adalah teknik yang dirancang untuk belajar dari pengalaman. Misalnya, sebagai manusia, Anda dapat belajar bermain catur dengan melihat orang lain bermain catur. Dengan cara yang sama, komputer diprogram dengan memberi mereka data untuk dipelajari dan kemudian dapat memprediksi elemen atau kondisi di masa depan.

Sebagai contoh, katakanlah Anda ingin menulis sebuah program yang dapat mengetahui apakah jenis buah tertentu adalah jeruk atau lemon. Anda mungkin menemukan bahwa menulis program seperti itu mudah dan akan memberikan hasil yang diinginkan, tetapi Anda mungkin juga menemukan bahwa program tersebut tidak bekerja secara efisien untuk kumpulan data yang besar. Di sinilah Machine Learning berperan.

Machine Learning melibatkan beberapa langkah:

  • Pengumpulan data
  • Penyaringan data
  • Analisis data
  • Pelatihan algoritma
  • Pengujian algoritma
  • Menggunakan algoritma untuk membuat prediksi masa depan

Baca juga Daftar Algoritma Populer Untuk Machine Learning Beserta Jenis Dan Penjelasanya

Machine Learning menggunakan berbagai jenis algoritme untuk menemukan pola, yang terbagi dalam dua kategori:

  • Pembelajaran yang diawasi (supervised learning)
  • Pembelajaran tanpa pengawasan (unsupervised learning)

Pembelajaran Yang Diawasi (Supervised Learning)

Pembelajaran terawasi (supervised learning) adalah ilmu melatih komputer untuk mengenali elemen dengan menyediakan data sampel. Komputer kemudian belajar darinya dan mampu memprediksi kumpulan data masa depan berdasarkan data yang dipelajari.

Misalnya, Anda dapat melatih komputer untuk menyaring spam berdasarkan informasi sebelumnya.

Pembelajaran yang diawasi (unsupervised learning) telah digunakan di banyak aplikasi, seperti Facebook, untuk mencari gambar berdasarkan deskripsi tertentu. Anda sekarang dapat mencari gambar di Facebook menggunakan teks yang menjelaskan konten foto. Karena situs jejaring sosial sudah memiliki database gambar yang diberi teks, ia dapat mencari deskripsi dan mencocokkannya dengan fitur dalam foto dengan tingkat akurasi tertentu.

Pembelajaran yang diawasi hanya melibatkan dua langkah:

  • Training
  • Testing

Beberapa algoritma pembelajaran yang diawasi meliputi:

  • Decision Trees
  • Support Vector Machines
  • Naive Bayes
  • K-Nearest Neighbor
  • Linear Regression

Contoh Penerapan Machine Learning Dengan Python

Labkom99 akan menulis program sederhana untuk mendemonstrasikan pembelajaran yang diawasi menggunakan perpustakaan Sklearn dan bahasa Python. Sklearn adalah perpustakaan Machine Learning untuk bahasa pemrograman Python dengan berbagai fitur seperti analisis berganda, regresi, dan algoritma pengelompokan.

Sklearn juga beroperasi dengan baik dengan perpustakaan NumPy dan SciPy.

Install Python Dengan Sklearn Untuk Machine Learning

Pengantar Machine Learning Dengan Python

Panduan instalasi Sklearn menyediakan cara yang sangat mudah untuk menginstal di berbagai platform. Baca juga 12 Toolkit Machine Learning Dan Data Mining Python. Ini membutuhkan beberapa dependensi:

  • Python (>= 2.7 or >= 3.3),
  • NumPy (>=1.82)
  • SciPy (>=0.13.3)

Jika Anda sudah memiliki dependensi ini, Anda cukup menginstal Sklearn seperti ini:

pip install -U scikit-learn

Cara mudah adalah dengan menginstal Anaconda. Ini akan menangani semua dependensi sehingga Anda tidak perlu khawatir menginstalnya satu per satu.

Untuk menguji apakah Sklearn berfungsi, cukup impor dari interpreter Python sebagai berikut:

import sklearn

Jika tidak ada kesalahan yang terjadi, Anda siap melakukannya.

Sekarang setelah kita selesai menginstal, mari kembali ke masalah. Kami ingin dapat membedakan antara hewan yang berbeda. Oleh karena itu, kami akan merancang algoritme yang secara spesifik dapat mengetahui apakah hewan yang diberikan adalah kuda atau ayam.

Pertama-tama kita perlu mengumpulkan beberapa data sampel dari setiap hewan. Beberapa contoh data ditunjukkan pada tabel di bawah ini.

Tinggi (inchi)Berat (kg)Suhu (Celcius)Label
70.640Ayam (0)
70.641Ayam (0)
370.837Kuda (1)
370.838Kuda (1)

Data sampel yang kami peroleh memberikan beberapa karakteristik umum dari kedua hewan tersebut serta data dari kedua hewan tersebut. Semakin besar sampel data, semakin akurat hasilnya dan semakin kecil biasnya.

Dengan jenis data ini, kita dapat mengkodekan suatu algoritma dan kemudian melatih algoritma tersebut pada nilai-nilai yang dilatih untuk mengidentifikasi seekor binatang dan kemudian mengklasifikasikannya sebagai kuda atau ayam. Sekarang, kita akan beralih ke penulisan algoritme yang menyelesaikan pekerjaan.

Contoh Penerapan Machine Learning Dengan Python Sklearn

Pertama, impor modul tree dari Sklearn.

from sklearn import tree

Tentukan karakteristik yang akan digunakan untuk mengklasifikasikan hewan.

features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]

Tentukan output yang akan diberikan oleh setiap classifier. Ayam diwakili oleh 0, sedangkan kuda diwakili oleh 1.

#labels = [ayam, ayam, kuda, kuda]

# kami menggunakan 0 untuk mewakili ayam dan 1 untuk mewakili kuda

Kemudian, kita mendefinisikan classifier yang akan didasarkan pada pohon keputusan.

classifier = tree.DecisionTreeClassifier()

Masukkan data ke dalam atau sesuaikan dengan pengklasifikasi.

classifier.fit(features, labels)

Kode lengkap untuk algoritma ditunjukkan di bawah ini.

features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]

#labels = [ayam, ayam, kuda, kuda]

classif = tree.DecisionTreeClassifier()

classif.fit(features, labels)

Sekarang kita dapat memprediksi dataset yang diberikan Machine Learning Dengan Python. Berikut cara memprediksi hewan dengan tinggi 7 inci, berat 0,6 kg, dan suhu 41:

features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]

#labels = [ayam, ayam, kuda, kuda]

classif = tree.DecisionTreeClassifier()

classif.fit(features, labels)

print classif.predict([[7, 0.6, 41]])

Berikut cara memprediksi hewan dengan tinggi 38 inci, berat 600 kilogram, dan suhu 37,5:

features = [[7, 0.6, 40], [7, 0.6, 41], [37, 600, 37], [37, 600, 38]]

#labels = [ayam, ayam, kuda, kuda]

classif = tree.DecisionTreeClassifier()

classif.fit(features, labels)

print classif.predict([[38, 600, 37.5]])

Seperti yang Anda lihat di atas, Anda telah melatih algoritme untuk mempelajari semua karakteristik dan nama hewan, dan pengetahuan tentang data ini digunakan untuk menguji hewan baru.

Pembelajaran Tanpa Pengawasan (Unsupervised Learning)

Pembelajaran tanpa pengawasan adalah saat Anda melatih mesin hanya dengan satu set input. Mesin kemudian akan dapat menemukan hubungan antara data input dan data lain yang mungkin ingin Anda prediksi. Tidak seperti pembelajaran yang diawasi, di mana Anda menunjukkan kepada mesin beberapa data untuk dilatih, tujuan pembelajaran tanpa pengawasan adalah membuat komputer menemukan pola atau hubungan antara kumpulan data yang berbeda.

Pembelajaran tanpa pengawasan dapat dibagi lagi menjadi:

  • Clustering
  • Korelasi

Clustering : Clustering mengacu pada pengelompokan data yang melekat. Misalnya, Anda dapat mengategorikan kebiasaan belanja konsumen dan menggunakannya untuk iklan dengan menargetkan konsumen berdasarkan kebiasaan membeli dan kebiasaan berbelanja mereka.

Korelasi : Korelasi adalah tempat Anda mengidentifikasi aturan yang menggambarkan sejumlah besar data. Jenis pembelajaran ini dapat diterapkan pada buku-buku berdasarkan pengarang atau kategorinya, baik buku motivasi, buku fiksi, maupun buku pendidikan.

Beberapa algoritma pembelajaran tanpa pengawasan yang populer meliputi:

  • K-means clustering
  • Hierarchical clustering

Pembelajaran tanpa pengawasan akan menjadi teknologi penting dalam waktu dekat. Hal ini dikarenakan masih banyak data unfiltered yang belum didigitalisasi. Baca juga Dasar-Dasar Yang Harus Di Pelajari Untuk Machine Learning Developer.

Kesimpulan

Kami harap tutorial ini membantu Anda memulai Machine Learning dengan Python. Ini hanyalah pengantar Machine Learning memiliki banyak hal untuk dibahas, dan ini hanya sebagian kecil dari apa yang dapat dilakukan oleh Machine Laerning.

Keputusan Anda untuk menggunakan algoritme Machine Learning yang diawasi atau tidak akan bergantung pada berbagai faktor, seperti struktur dan ukuran data.

Machine Learning dapat diterapkan ke hampir semua bidang kehidupan kita, seperti pencegahan penipuan, mempersonalisasi umpan berita di situs media sosial agar sesuai dengan preferensi pengguna, penyaringan email dan malware, prakiraan cuaca, dan bahkan dalam e-commerce untuk memprediksi kebiasaan belanja konsumsi.

Wanglu Piao

Saya seorang content writer sekaligus editor di Labkom99.com. Menyukai dunia digital media dan SEO.

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button