Denetimli ve Denetimsiz Makine Öğrenimi Teknikleri – PromptCloud

Yayınlanan: 2017-10-21

İçindekiler gösterisi

Denetimli ve denetimsiz makine öğrenimi teknikleri

Denetimli Makine öğrenimi

Doğrusal regresyon

rastgele orman

Vektör makineleri desteklemek

Denetimsiz Makine öğrenimi

K-kümeleme anlamına gelir

Apriori algoritması

Çözüm

Denetimli ve Denetimsiz Öğrenme:

Akıllı algoritmalar kullanarak verilerden kalıpları keşfetmek, genellikle makine öğreniminin temel konseptidir. Bu keşifler genellikle eyleme geçirilebilir içgörülere, çeşitli trendlerin tahminine yol açar ve işletmelerin rekabet avantajı kazanmasına ve hatta bazen yeni ve yenilikçi ürünleri güçlendirmesine yardımcı olur. Bu blog yazısında yakın zamanda makine öğrenimi kavramını ve makine öğrenimi algoritmasının nasıl eğitileceğini açıklamıştık . ML algoritmalarının farklı türlerini ve nasıl çalıştıklarını derinlemesine incelemediğimiz için, makine öğrenimi algoritmalarının sınıflandırmalarını tahmin yapmayı 'öğrenme biçimlerine' göre açıklayacağımız bu gönderiyi hazırladık.

denetimli ve denetimsiz makine öğrenimi algoritmaları

Yüksek düzeyde, iki geniş makine öğrenimi tekniği türü vardır - Denetimli ve Denetimsiz. Birbirlerinden nasıl farklı olduklarına bakalım.

Denetimli ve denetimsiz makine öğrenimi teknikleri

Daha önce de belirttiğimiz gibi, denetimli ve denetimsiz makine öğrenimi teknikleri, bir makine öğrenimi algoritmasının tahminlerde bulunmayı öğrenmesinin 'yolunu' temsil eder.

Denetimli öğrenmede, makine öğrenimi algoritmasının yaratıcısı, makineden beklenen iyi tanımlanmış bir çıktıya sahiptir. Girdi ve ilgili çıktısı önceden tanımlanmıştır ve ML algoritması yalnızca girdiye dayalı çıktı verme sanatını zaman içinde daha yüksek doğrulukla mükemmelleştirmeyi öğrenir.

Denetimli öğrenme aynı zamanda bir öğretmenle öğrenmeye benzer. Öğretmen, bu durumda makine öğrenmesi sistemine sağlanan eğitim veri setidir.

Bir öğretmenle öğrenirken, öğrenciye neyin neyi temsil ettiği söylenir. Örneğin, bir çocuğa köpeğin diğer hayvanlardan ayırt edilmesine yardımcı olan farklı özelliklerini öğretebilirsiniz, örneğin:

Yüzlerinin şekli (Uzun)
Sesleri nasıl (Bark)
Vücut ölçüsü (Küçük ila orta)
Diğer özel özellikler (Köpekler sık sık kuyruk sallar)

Bu verilerle çocuk, çeşitli köpek türlerini tanımlayabilmelidir. Ne zaman yeni ve bilinmeyen bir köpek türü görse, aranması gereken özellikler daha fazla veri ile güncellenir. Örneğin, bir boksörün diğer köpek cinslerinin çoğu gibi uzun bir yüzü yoktur, ancak yine de bir köpektir. Çocuğa ilk önce bakması gereken bir dizi özellik verdiğimiz ve o bunu deneyimle mükemmelleştirdiği için bu denetimli öğrenmedir.

Ancak denetimsiz öğrenme durumunda çocuk kendi başınadır. Neyin ne olduğuna dair herhangi bir ipucu olmadan basitçe çeşitli hayvanlarla sunulur. Farklı hayvanları, gözlemlenen özelliklere göre gruplandırarak tanımlamayı öğrenir. Bu, kısaca denetimsiz makine öğrenimidir.

Basitçe söylemek gerekirse, denetimli öğrenme, beklenen sonuçlara sahip verilere dayalı makine öğrenimidir, denetimsiz makine öğrenimi durumunda ise makine öğrenimi sistemi, verilerden kalıpları kendi başına tanımlamayı öğrenir.

Denetimli Makine öğrenimi

Makine öğreniminin pratik uygulamalarının çoğu denetimli öğrenmeyi kullanır. Denetimli öğrenmede, girdi değişkenini (x) ve çıktı değişkenini (Y) tanımlarsınız ve girdiyi çıktıyla nasıl eşleştireceğinizi öğrenmek için bir algoritmayı etkinleştirirsiniz.

Bu Y = f(X) olarak tanımlanabilir.

Buradaki fikir, makineye attığınız herhangi bir yeni giriş verisi için çıktı değişkenlerini (Y) doğru bir şekilde tahmin edebilmesi için makineyi bu eşlemede mükemmel hale getirmektir. Algoritma, kabul edilebilir bir doğruluk düzeyine ulaştığında öğrenme etkinliğini yavaşlatır.

Denetimli öğrenme ayrıca sınıflandırma ve regresyon problemleri olarak gruplandırılabilir:

Sınıflandırma : Bir sınıflandırma probleminde, büyük, küçük, orta veya “kırmızı” veya “yeşil” gibi bir kategori olan bir çıktı değişkeni olacaktır.

Regresyon : Bir regresyon probleminde çıktı değişkeni “kilogram” veya “dolar” gibi gerçek bir değerdir.

Popüler denetimli makine öğrenimi algoritmalarından bazıları şunlardır:

Doğrusal regresyon

Regresyon algoritmaları, öncelikle sayısal değişkenler arasındaki istatistiksel bağımlılıkları tespit etmek içindir. Doğrusal regresyon modeli temel olarak veri temsiliniz için en iyi doğrusal yaklaşımı bulmaya çalışır. Bu yaklaşım başarılı olduğunda, bağımsız değişkenin herhangi bir değeri için bağımlı değişkenin değerlerini kolayca tahmin edebilirsiniz. Bu şekilde, algoritma, girdi veri kümenizdeki herhangi iki sayısal sütun arasındaki bağımlılığı belirlemek için kullanılabilir. Örneğin, geçmiş verileri girdi olarak kullanarak gelecek yıldaki satışları tahmin etmek için doğrusal regresyon kullanabilir veya sezonluk trendlere göre web sitenizi ziyaret edecek kişi sayısını tahmin edebilirsiniz.

rastgele orman

Random Forest, tüm veri bilimi algoritmalarının İsviçre çakısı gibidir. Daha hafif bir notta, probleminiz için belirli bir algoritma düşünemiyorsanız, rastgele ormana gidin. Random Forest, işlevsel gruplardaki veri noktalarını kümelemek için kullanılan denetimli bir makine öğrenimi algoritmasının başka bir örneğidir. Bu, tüm değişkenleri hesaba katarak verileri manuel olarak kümelemek zorlaştığından, özellikle çok sayıda değişkene sahip büyük veri kümeleri için kullanışlıdır.

Çok yönlü doğası nedeniyle, bu makine öğrenimi algoritması hem regresyon hem de sınıflandırma görevleri için kullanılabilir. Ayrıca boyut indirgeme yöntemlerini işleyebilir, eksik değerleri, aykırı değerleri ve diğer birçok veri araştırma yöntemini işleyebilir. Rastgele Orman, güçlü bir model olarak hareket etmek için bir grup zayıf modelin birleştirildiği bir topluluk öğrenme yöntemidir.

Vektör makineleri desteklemek

Destek Vektör Makineleri, regresyon veya sınıflandırma sorunları için kullanılabilecek başka bir denetimli makine öğrenme algoritmasıdır. SVM'de, her veri öğesi n boyutlu uzayda bir nokta olarak çizilir (n, sahip olduğunuz özelliklerin sayısıdır), her özelliğin değeri belirli bir koordinatın değeridir. Daha sonra iki sınıfı en iyi şekilde ayıran hiper-düzlem belirlenerek sınıflandırma gerçekleştirilir.

SVM genellikle istenmeyen posta algılama, duygu analizi ve kategori atama gibi metin sınıflandırmasını içeren görevler için kullanılır. Renk tabanlı sınıflandırma ve en-boy tabanlı tanımanın hayati öneme sahip olduğu görüntü tanıma projelerinde de yararlıdır. Dikkate değer başka bir uygulama, posta hizmetlerinin otomatikleştirilmesinde yararlı olan el yazısı rakam tanımadır.

Denetimsiz Makine öğrenimi

Denetimsiz makine öğreniminde yalnızca giriş verileri (X) vardır ve karşılık gelen çıkış değişkenleri tanımlanmaz. Buradaki fikir, modele kısıtlamalar getirmeden verilerin temel dağılımını veya yapısını ortaya çıkarmaktır. Denetimsiz makine öğrenimi modellerinde öğretmen olmadığı gibi doğru cevaplar da yoktur. Algoritmalar, verilerdeki ilginç yapıları keşfetmek ve sunmak için kendi başlarına bırakılır.

Denetimsiz öğrenme ayrıca Kümeleme ve İlişkilendirme sorunları olarak gruplandırılabilir:

Kümeleme : Bir kümeleme mücadelesinde, temel olarak, müşterilerin alışveriş davranışlarına göre gruplandırılması gibi verilerdeki temel gruplandırmaları keşfetmeye çalışıyorsunuz.

İlişkilendirme : Bir ilişkilendirme sorununda amaç, örneğin iPhone satın alan kişilerin pil paketleri satın alma eğiliminde olması gibi, verilerin büyük bölümlerini tanımlayan kuralları belirlemektir.

Denetimsiz algoritmaların popüler örnekleri şunlardır:

K-kümeleme anlamına gelir

K-means kümeleme, sahip olduğunuz verilerin etiketlenmemiş olduğu durumlarda (tanımlanmamış gruplar veya kategoriler içeren veriler) kullanılan denetimsiz bir makine öğrenme algoritmasıdır. Algoritma, grup sayısının K değişkeni ile gösterildiği verilerdeki grupları tanımlamaya yöneliktir. K-araçları, sağlanan özelliklere dayalı olarak her bir veri noktasını K gruplarından birine atayarak çalışır. Ardından, özellik benzerliklerine göre veri noktalarını kümelemeye devam eder.

Basitçe söylemek gerekirse, K-araç kümeleme, etiketlenmemiş verilerden tanımsız grupları ortaya çıkarır. Bu, özellikle büyük ve karmaşık veri kümelerinden iş varsayımlarını doğrulamak için kullanışlıdır. Algoritma çalıştırılıp gruplar tanımlandıktan sonra, doğru gruba kolayca yeni veri noktaları eklenebilir.

Apriori algoritması

Apriori, ilgili birliktelik kurallarının ve öğe kümelerinin madenciliği için kullanılan klasik bir denetimsiz makine algoritmasıdır. Müşteriler tarafından bir mağazadan satın alınan ürünler gibi çok sayıda işlemin bulunduğu bir veritabanına dağıtılmak için idealdir.

Apriori ilkesi, incelenmesi gereken öğe kümelerinin sayısını azaltacaktır. İlke, bir öğe kümesi sık değilse, alt kümelerinin hiçbirinin de sık olmayacağını belirtir. Birliktelik kurallarına dayalı makine öğrenimi için son derece iyi olan apriori algoritması, perakende şirketleri tarafından yaygın olarak kullanılmaktadır.

Birliktelik kurallarına dayalı öğrenmenin ilginç sonuçları, bira bezi hikayesinden anlaşılabilir. Bir perakende mağazası, Cuma öğleden sonra çocuk bezi satın alan genç Amerikalı erkeklerin de bira satın alma eğiliminde olduğunu bulmak için verilerini analiz etti. Daha sonra devam ettiler ve bira adasını bebek bezi adasının yakınına yerleştirdiler ve beklendiği gibi bira satışları arttı.

Bu muhtemelen çocuk yetiştirmenin yorucu olabileceğini ve ebeveynlerin streslerini azaltmak için tedbirsizce biraya yöneldiğini gösteriyor. Her neyse, bu hikaye makine öğrenimindeki birliktelik kurallarının mükemmel bir örneğidir.

Çözüm

Makine öğrenimi, işletmelerin daha önce hiç görülmemiş düzeyde verimlilik elde etmesine yardımcı oluyor ve yeni teknolojik yeniliklerin yolunu açıyor. Web'de bulunan veriler her geçen dakika nicelik ve nitelik olarak büyüdüğünden, bu veri kümelerinden çığır açan içgörüler ortaya çıkaran makine öğrenimi teknolojilerine güvenilebilir. Elinizdeki verilerin gerçek potansiyelini ortaya çıkarmak istiyorsanız, bu makine öğrenimi tekniklerine aşina olmak zorunlu olacaktır.