Please enable JavaScript.

Coggle requires JavaScript to display documents.

Uczenie maszynowe 2 (Regresja liniowa w NLP (Przykłady (Uczenie…

- - - - Analiza opinii
      - Przewidywanie zmian na giełdzie
    - - Google news
      - Google page rank
  - - - Rozwiązanie:
        
        Weź zbiór opinii o hotelu.
        
        Zbuduj Vector Model Space dla każdej opinii.
        
        Oznacz wszystkie opinie liczbą przyznanych gwiazdek.
        
        Zbuduj model regresji liniowej na danych.
- - - - Cel (zadanie): Przewidzieć czy cena akcji danej firmy spadnie czy skoczy.
        
        Dane trenujące:
        X: Raporty giełdy o firmie
        Y: 1(skoczy) lub o(spadnie) w kolejnym dniu
    - - Cel (zadanie): Przewidzenie typu funduszu inwestycyjnego bazując na opisie.
        
        Dane trenujące:
        X (wektor funkcjonalności): Opis funduszu inwestycyjnego w języku polskim - około 24 charakterystycznych słów w dokumencie.
        Y (etykieta): Typy funduszy inwestycyjnych
- - - - Dyskrymitywny
        
        Cel: Próba odseparowania klas obiektów
        
        Dyskryminatywny: grafika
        
        Obliczenia: Otrzymujemy bezpośrednio prawdopodobieństwo P(y|x)
      - Generatywny
        
        Cel: Próba określenia jak "wyglądają" poszczególne klasy
        
        Generatywny: grafika
        
        Obliczenia: Otrzymujemy pośrednio prawdopodobieństwo P(y|x) poprzez P(x|y) i P(y)
  - - - Analiza opinii
      - Klasyfikacja produktów
      - Katalogowanie emaili
      - Filtry antyspamowe
    - - Dokument jest reprezentowany jako wektor cech (np. częstości występowania słów). Jeden może wybrać jeden leksykon lub jego część.
    - - Zasady Bayes'a
    - - Prawdopodobieństwo a priori
        
        P(c) = ?
        Jak często występuje klasa c?
        Na przykład, jak często ocena jest pozytywna?
      - Prawdopodobieństwo warunkowe
        
        P(x1, x2, ...xn | c) = ?
        Niezależność złożenia:
        x1 | c, x2 | c, ... xn | c wszystkie zdażenia są niezależne
        
        Czy niezależność złożenia jest prawidłowa?
        
        Nie. Pojawiające się słowa nie są niezależne np. "Stół operacyjny"
        P(x1, x2, ...,xn) = P(x1) P(x2) ...P(xn)