Supervised Learning | 2 | Analysis using Orange

uma maneira simples de aplicar o
aprendizado de máquina é usar o Orange vamos dar uma olhada há uma grande variedade de
algoritmos de aprendizado supervisionado vimos a regressão vimos a regressão linear
quando temos dados relacionados e classificação analisamos o
suporte de regressão logística Máquinas vetoriais ok mais próximo vizinho e agora queremos
examinar algoritmos ligeiramente diferentes aqui temos uma árvore de decisão, então explicamos como isso funciona muitas árvores de decisão que podemos usar em florestas aleatórias Naive Bayes com base no teorema de probabilidade de Bayes
e redes neurais que temos de entrada e o resultado é a saída e entre essas camadas ocultas
há mais de uma que chamamos de aprendizado profundo, então vamos dar uma olhada nesta classificação
algoritmos de aprendizado supervisionado vamos ver uma árvore de decisão que vamos começar usando um arquivo
que contém dados meteorológicos weather.csv para que possamos carregar os dados que você pode
ver aqui temos o tempo nublado chuvoso ensolarado temperatura fresco quente ameno
umidade alta norma vento forte fraco e nosso alvo é se jogamos sim ou não então esses são nossos dados agora não temos muitos dados podemos ver isso na tabela podemos ver que jogamos sim e não
dependendo das condições do tempo então, vamos usar a árvore , vamos conectar nossa árvore e
queremos ver nossa árvore de decisão para que possamos usar o visualizador de árvore para
dar uma olhada em nossa árvore de decisão, então temos as configurações padrão para a árvore
e vamos conectá-lo a um visualizador de árvore, então vamos dar uma olhada em nossa árvore para que possamos ver que temos decisões sim ou não, então vamos dar uma olhada na temperatura se a temperatura estiver baixa sim,
vamos jogar então em dois de dois casos 100 se estiver temperatura baixa, tocaremos para que você possa ver o sim está
no vermelho e no azul por enquanto, então se a temperatura estiver quente ou amena, verificamos veja o tempo se estiver chovendo
não quatro de quatro vezes se estiver claro para o seu ensolarado olhamos para a
temperatura se estiver ameno então sim se estiver quente olhamos para t o clima novamente se estiver ensolarado, então quatro em quatro vezes se estiver nublado, então é 50 50 sim ou não, então não sabemos realmente se
a temperatura está quente ou amena e, no entanto, está nublado ou ensolarado e a temperatura
está quente e o o tempo está nublado então é 50 50.

Mas nas outras instâncias podemos dizer se está
frio sim se está chovendo não e quente e ameno se está quente e ameno nublado ou ensolarado e ameno sim então nossa árvore de decisão pode ser usada para tomar
decisões embora às vezes não está claro agora podemos usar esta árvore para previsões, então vamos procurar teste e pontuação conectar nossos dados e conectar nossa
árvore de decisão e podemos adicionar uma tabela para ver nossos resultados e quando virmos os resultados aqui
podemos ter nossas previsões de árvores , temos sim e não e tivemos
um 50 50 onde não temos certeza, talvez uma maneira melhor de ver isso
seria usar uma matriz de confusão para que possamos conectar a matriz de confusão
e podemos ver que temos os resultados que previram um sim real para
jogar cinco vezes não para não pagar nove vezes corretamente e temos uma previsão
ou dizemos não para jogar quando na verdade era sim, então essa é a nossa confusão Matrix agora, se você viu um vídeo no computador Matrix,
também mostramos coisas como a precisão das métricas, então temos uma precisão de 0,93 rechamada de precisão
bastante alta pontuação F1, então 0,932 é bastante alto para F1, então a árvore de decisão funciona muito bem, embora
esse conjunto de dados seja realmente muito pequeno , podemos ver agora, por exemplo, usando dados que
vêm com laranja usando os conjuntos de dados, então nós mova os conjuntos de dados do widget e então
queremos usar na verdade queremos usar o Titanic aqui e agora podemos conectar todos os
nossos widgets da mesma forma que antes para que possamos ver os dados aqui temos os sobreviventes sim ou não o status
o idade e o sexo e podemos obter nossa árvore e vamos olhar para o visualizador de árvore como fizemos antes, então, se olharmos para nossa árvore,
ela parece um pouco maior, então podemos apenas ajustar o zoom e a largura aqui Ok, então, se olharmos no gênero primeiro podemos ver e os sobreviventes principalmente de
mulheres em vez de homens, então, se olharmos para as pessoas
que sobreviveram, estamos olhando para homens , podemos olhar para a idade, então geralmente os adultos do sexo masculino não sobreviveram
enquanto as passageiras sobreviveram principalmente e olhamos em nosso árvore, temos alguns que
estão na terceira classe que não sobreviveram embora as crianças, os meninos, se estivessem
na primeira ou segunda classe, eles sobreviveram tão geralmente como uma generalização que poderíamos
dizer que os homens não sobreviveram ao Titanic e as mulheres fizeram isso esta é a árvore de decisão que podemos ver em cada etapa, olhamos
uma decisão decisão homem ou mulher aqui adulto ou criança a segunda ou terceira
classe classe ou tripulação primeira classe terceira classe segunda classe para que possamos percorrer cada caminho
na árvore para ler nossa árvore de decisão se quisermos ver nossos resultados podemos
usar um teste e pontuar como fizemos antes queremos conectar nossos dados e a
árvore e então podemos ver os dados podemos ver que há bastante muitos dados, então é difícil de ler, talvez
melhor usar uma matriz de confusão e, se conectarmos , podemos ver que isso é bastante difícil
então, onde previmos sobreviventes e não previmos que não sobreviveriam com bastante sucesso ,
mas onde previmos que pessoas não sobreviveriam na verdade, há bastante poucos que fizeram isso, nossa
árvore é um pouco pessimista em relação à sobrevivência, então podemos ver nessa confusão Matrix que
esse é um problema um pouco mais difícil de resolver usando uma árvore de decisão e se olharmos para nosso
teste e pontuação, podemos ver o a precisão é de 0,791, portanto, não tão alta quanto no primeiro exemplo, portanto, a rechamada tentando prever as
pessoas que sobreviveram não foi tão boa, então a precisão Recuperação de precisão F1 pontuação em torno
como 75 a 80, portanto, não tão alta quanto no primeiro exemplo mas que é usado na árvore de decisão em laranja agora podemos usar várias árvores de decisão
juntas para criar uma floresta aleatória, então vamos dar uma olhada no conjunto de dados usando
o conjunto de dados da íris e vamos começar vamos dar uma olhada nos dados que ele Agora
temos os diferentes tipos de planta de íris e vamos começar criando a árvore e vamos usar teste e pontuação e vamos ver os
resultados usando uma matriz de confusão, então esta é a nossa árvore de decisão que que usei antes, vamos conectar a árvore ao teste e pontuar, então aqui temos os diferentes tipos de íris e temos alguns resultados muito bons
na árvore de decisão, então a maioria desses resultados são os
mais dos resultados são correto, então temos três erros em nossos resultados
podemos ver em uma matriz de confusão agora o que podemos fazer é usar uma floresta aleatória
que usa várias árvores de decisão juntas e então veremos todos os resultados e então
escolher o que pensa os melhores resultados são então aqui vamos usar 10 árvores, mas
o ponto é que com nossa [floresta] podemos mesclar diferentes árvores de decisão e escolher os
melhores resultados delas em nossa floresta aleatória e devemos obter como você pode
ver aqui resultados melhorados para que os resultados possam mudar dependendo o n como
a floresta aleatória escolhe as árvores de decisão, mas você pode ver aqui, temos apenas um erro e
em nossa única árvore de decisão, tínhamos três florestas So Random uma maneira de
usar várias árvores de decisão agora temos vários
algoritmos de aprendizado supervisionados por classificação e diferentes abordagens , vimos a árvore de decisão.

Outra
maneira seria usar a probabilidade, então vamos dar uma olhada em um exemplo usando Naive Bayes. Então, vamos usar um conjunto de dados no marketing do banco , podemos olhar para nossa tabela ou adicionar dados e nós temos
muitos dados aqui, então estamos analisando diferentes recursos para
presumo que para obter um empréstimo, temos sim e não, então queremos usar Naive Bayes
para que possamos colocar dias ingênuos e conectar isso e novamente nós
vamos usar nosso teste e pontuação e novamente temos nossa tabela para que possamos ver nossos resultados novamente
há muitos resultados, então é difícil ter uma visão geral, mas
você pode notar se olharmos para as porcentagens podemos ver que Naive Bayes fornece uma
alta porcentagem de então achamos que é sim e uma porcentagem baixa quando é não e no meio quando a porcentagem é em
torno de 0,5 podemos ver que temos alguns erros para que possamos ver os resultados gerais talvez com uma confusão Matrix é o
melhor caminho e se conectarmos isso podemos ver , podemos ver os resultados, é muito difícil, então
previu sim e previu não , temos um sucesso relativamente bom,
mas muitos previram sim quando na verdade eram não, é uma porcentagem bastante alta, então, se olharmos em nosso teste e pontuar, podemos
veja a precisão em torno de 0,738, portanto, precisão não é tão ruim, lembre-se de uma pontuação F1 bastante baixa, não muito boa, então este é um problema difícil, mas podemos ver que podemos usar a probabilidade usando
baias ingênuas para obter esses resultados uma
ferramenta de aprendizado de máquina bastante poderosa é uma rede neural, então vamos dê uma olhada para ver se podemos usar uma
rede neural para o mesmo problema que usamos como naive bayes para que possamos conectar nossos conjuntos de dados e ter uma tabela outra tabela de dados e então
vamos usar uma rede neural para que possamos co Conectar nossos dados à rede neural, você pode ver, isso leva um pouco mais de tempo para o
laranja processar porque é um pouco mais confuso e complicado, então
conectamos nossos dados ao teste e pontuação.

Você pode ver novamente que ele terá que
fazer algum tempo para calcular os resultados e vamos dar uma olhada para ver se
podemos comparar a matriz de confusão com nossa matriz de confusão ingênua de Bayes
vimos alguns erros, então se compararmos os ingênuos Bayes você pode ver aqui
que sua rede neural tem muito maior sucesso para que possamos olhar em nosso teste e pontuação e
temos pontuação F1 muito alta como 99,9 muito bom para a rede neural como o ingênuo Bayes
apenas na probabilidade uma pontuação F1 de 0,784 então neste caso
a rede neural é muito bom em usar os recursos para classificar
nosso modelo em um alvo sim e não, então essa é a rede neural que
também podemos usar dentro da Orange se você acha que outras pessoas podem se beneficiar
assistir a este vídeo, então compartilhe com eles se não basta clicar em curtir se inscrever no
sino de notificações e até o próximo vídeo

Texto inspirado em publicação no YouTube.

Quer Saber Muito Mais? Venha para a MIND21 Educação

Posts Relacionados

Deixe um comentário Cancelar resposta