Programação de linguagem R para analistas de dados | Storay Amiri | Skillshare

Velocidade de reprodução


1.0x


  • 0.5x
  • 0.75x
  • 1x (Normal)
  • 1.25x
  • 1.5x
  • 1.75x
  • 2x

Programação de linguagem R para analistas de dados

teacher avatar Storay Amiri

Assista a este curso e milhares de outros

Tenha acesso ilimitado a todos os cursos
Oferecidos por líderes do setor e profissionais do mercado
Os temas incluem ilustração, design, fotografia e muito mais

Assista a este curso e milhares de outros

Tenha acesso ilimitado a todos os cursos
Oferecidos por líderes do setor e profissionais do mercado
Os temas incluem ilustração, design, fotografia e muito mais

Aulas neste curso

    • 1.

      Introdução ao curso

      2:44

    • 2.

      Aula 1: instalação de R e Rstudio

      3:56

    • 3.

      Aula 2: dados e projetos

      11:50

    • 4.

      Aula 3: pacotes

      13:22

    • 5.

      Aula 4: manchas de dispersão

      8:57

    • 6.

      Aula 5: gráficos de barras

      10:52

    • 7.

      Aula 6: mais visualização de dados

      5:45

  • --
  • Nível iniciante
  • Nível intermediário
  • Nível avançado
  • Todos os níveis

Gerado pela comunidade

O nível é determinado pela opinião da maioria dos estudantes que avaliaram este curso. Mostramos a recomendação do professor até que sejam coletadas as respostas de pelo menos 5 estudantes.

198

Estudantes

5

Projetos

Sobre este curso

Esta é uma introdução à linguagem de programação R — uma das linguagens mais usadas para análise de dados.

Neste curso, vamos passar do básico até os recursos avançados: desde a criação de um projeto e importação de dados até a criação de histogramas e capturas de caixa.

Não é necessário ter experiência prévia. Este curso vai ajudar você a construir a confiança para aprender R.

Conheça seu professor

Teacher Profile Image

Storay Amiri

Professor

Habilidades relacionadas

Desenvolvimento Linguagens de programação
Level: Beginner

Nota do curso

As expectativas foram atingidas?
    Superou!
  • 0%
  • Sim
  • 0%
  • Um pouco
  • 0%
  • Não
  • 0%

Por que fazer parte da Skillshare?

Faça cursos premiados Skillshare Original

Cada curso possui aulas curtas e projetos práticos

Sua assinatura apoia os professores da Skillshare

Aprenda em qualquer lugar

Faça cursos em qualquer lugar com o aplicativo da Skillshare. Assista no avião, no metrô ou em qualquer lugar que funcione melhor para você, por streaming ou download.

Transcrições

1. Introdução ao curso: Olá a todos e bem-vindos a este curso. Agora, neste curso, vou ensinar-lhe a linguagem de programação R desde o início até um lugar onde podemos nos tornar especialistas e resolver constantemente nossos problemas de dados. Agora, R é a linguagem dos dados, por isso é vital para a ciência e análise de dados. No entanto, para este curso, você não precisa ser um especialista. Você pode ser um iniciante completo, apenas interessado em aprender sobre ciência de dados. Ou um x-bar, procurando facilitar sua análise do dia-a-dia aprendendo. Agora r está se tornando muito popular nos dias de hoje por uma infinidade de razões. Principalmente porque as pessoas se interessaram mais em buscar a ciência de dados. Com o crescimento atual de big data e aprendizado de máquina em quase todos os setores, a demanda por dados continua e, portanto, a demanda por analistas continua aumentando. E isso abre muitas oportunidades para poder trabalhar em diferentes setores e diferentes áreas. E com o clima atual, as pessoas desejam poder trabalhar remotamente e trabalhar freelancer para ter um pouco mais de flexibilidade na forma como foram convertidas de volta. Então, com ciência e análise de dados, isso é definitivamente algo que você pode buscar. Agora, por que são importantes são, é uma das principais linguagens da ciência de dados. Outra linguagem principal é o Python. Mas Python é uma linguagem muito genérica que pode ser usada para muitas coisas diferentes. E é realmente a linguagem dos programadores. Emprestado. R é a linguagem dos cientistas de dados e estatísticos. Então, uma das principais razões pelas quais R é ótimo é porque é gratuito e de código aberto. E isso significa que nossas grandes comunidades trabalhando e que são comunidades muito solidárias que podem ajudá-lo se você tiver alguma dúvida ou qualquer problema com qualquer análise. E eles também trabalham continuamente na criação de pacotes. Pacotes são algo que você pode instalar e são para problemas de dados muito específicos. Isso facilita muito a resolução deles. Vou fazer três pacotes e vídeos futuros têm que instalá-los e como usá-los. Agora, algo que o ADH faz muito bem é a visualização de dados. E isso é algo que nenhuma outra linguagem de programação chega nem perto. E a visualização de dados é realmente importante para a ciência de dados, especialmente porque lidamos com gráficos, gráficos e dados. Então, isso é algo que é realmente bom e agora se você está interessado em ciência de dados ou R, e você acha que isso pode ser útil para você, então definitivamente dê uma olhada neste curso e espero que você goste. Obrigado. 2. Aula 1: Instalando R e Rstudio: Olá a todos e bem-vindos a este vídeo. Esta será uma breve introdução ao nosso download de R e RStudio e vinculado ao básico de como nossas funções e isso se parece. Ok, então para fazer o download do nosso, vamos para a organização do ponto r-project. Viemos aqui para baixar R e o Pentágono, nosso país em que estamos, clicamos no link relevante e isso nos levará a ter um E2. Ou poderíamos simplesmente ir para o Cloud, que nos redirecionará automaticamente para o servidor, dependendo do nosso país. Então você clica aqui e, em seguida, coletamos sobre o download é o que é para nossos computadores ou se estamos usando um Windows ou um Mac e baixamos novamente o download do LaCo, qualquer outra coisa? Ok, então uma vez que baixamos o R, é importante ter um bom IDE ou plataforma para ficar sem ele. E na minha opinião, o RStudio é muito bom. Então, só viemos aqui para pedir produtos do.com, RStudio. E há duas versões do RStudio. Existe a versão open source ou gratuita, e faz a versão anterior que vem com um preço. E, para ser honesto, realmente não há necessidade da versão anterior, a menos que seja uma grande instituição ou empresa naquele jogo de temporada. Para indivíduos, independentemente do que estejam usando, gratuitamente, deve ser mais do que suficiente para suas necessidades. Então, basta clicar aqui. E mais uma vez, clicamos na versão gratuita. E baixamos dependendo do nosso computador, se estamos usando um Windows ou Mac ou qualquer um dos relevantes. E nós nos conectamos. Certo, uma vez que temos a indústria F ainda, é assim que parece. Pode parecer um pouco complicado e complicado, mas é muito fácil e simples de usar. Tem quatro quadrantes. E o primeiro, é aqui que inseriríamos nosso código, seu direito, o que queremos. E o código, ele seria emitido aqui. Então, dependendo do que chamamos, veremos aqui na parte inferior. Agora, esse terceiro quadrante, cujo ambiente está vazio, mostra que é aqui que listará quaisquer funções ou objetos que criamos. Agora isso pode parecer um pouco estranho agora funções e objetos. Mas quando começarmos a usar o Got, ele se tornará uma segunda natureza. Comece a usar essas palavras. É muito fácil. E dois anos sob a montanha 10 estão. Ok, então o quarto quadrante provavelmente parece muito familiarizado com os títulos de arquivo e essas pastas diferentes que temos. Então, isso é basicamente o que é. Nesta primeira guia, temos nossos arquivos do que gráficos. Então, qualquer gráfico que criamos aqui no primeiro quadrante, podemos vê-lo aqui. Agora pacotes. O cabelo, falei brevemente sobre isso. É por isso que instalamos pacotes para nos ajudar com nosso treinador e gerente mais facilmente. E, claro, você pode usar a ajuda e o espectador. Agora, entraremos em tudo isso com muitos detalhes, mas isso é apenas uma visão geral básica de como o RStudio se parece. Portanto, não é tão assustador quando você o abre pela primeira vez. E, claro, esses quadrantes, podemos movê-los dependendo de como você gosta, que usamos mais, que olhamos mais. E é realmente muito fácil de usar e a densidade é como descobriremos em vídeos futuros. Ok, então obrigado por assistir a este vídeo. Espero que tenha sido útil e te vejo no próximo. 3. Aula 2: Dados e projetos: Olá a todos e bem-vindos de volta a este curso. Então, se tivéssemos tido uma breve introdução sobre como instalar o R e RStudio e uma breve olhada nos diferentes quadrantes e sobre o que eles fazem. Então, para esta lição, vamos nos concentrar em como importar dados criando projetos e alguma pequena manipulação de dados. Certo? Então, para importar dados e usá-los, a melhor coisa a fazer seria criar um projeto. Agora, com a criação de um projeto em shows muito pesados, ensine o dia para adicionarmos um novo filme, tudo permanece em um só lugar. Então, para iniciar um projeto, vamos aqui, criamos um projeto. Damos um nome a ele. Projeto 1. Não é muito imaginativo, mas faz o trabalho. Crie projeto agora, ok, vamos esperar que isso seja carregado. Certo? Então deixe-me consertar isso novamente. Certo? Então, ele criou este projeto aqui em nossa pasta. Agora, ele não só criou isso no RStudio também criou isso em nosso computador. Então, se eu for para meus arquivos, você verá esse projeto lá. Ok, então esta é a foto do meu laptop, e ela já criou isso automaticamente para mim no meu disco rígido. Não precisei vir aqui e criadores. Então, se eu fizer um projeto em Ostia, crie automaticamente dois para mim em minhas próprias pastas. Então, se eu vier aqui para projetar um, entre aqui, e esta é a pasta superior do projeto. Agora posso colar o que quiser e agora já copiei dados que eu quero. E eu coloquei o cabelo é Ei, eu gostaria de renomear isso para facilitar o tratamento. Só Theta um. Deixe-nos tornar mais simples lidar com isso. Certo? Então, dados um ou este é o arquivo que eu criei. Agora eu escolho fazer CSV porque é muito mais fácil de lidar. É muito eficiente. Agora, você também pode fazer isso com planilhas do Excel ou qualquer outra coisa. E vou te mostrar isso em vídeos futuros. Mas, por enquanto, vou fazer o CSV. E apenas para esclarecer, você pode baixar ou alterar sua planilha do Excel em um arquivo CSV. Isso também pode ser feito. Ok, então agora que estamos de volta, agora podemos ver que os dados que tínhamos colado em nossa pasta já apareceram aqui. No entanto, isso não é exatamente importado para o RStudio, só está aparecendo porque está nessa pasta. Agora podemos importá-lo clicando nele daqui ou vindo importá-lo de, Ei, acho que a melhor maneira de fazer isso é começar a escrever código e importá-lo via código. Então, uma maneira de fazer seria ler CSV. Então, ele aparece automaticamente. Vá lá, você escreve o título do que deseja importar. Nesse caso, são dados um, teta um ponto CSV. E nós fazemos Control Enter e herança. Estes são meus dados que eu tinha e agora estão lendo para mim. Então, esses são todos os nomes. A idade em anos, sexo, altura em metros. Então, como você pode ver, tudo aparece. No entanto, isso não é muito útil porque acabamos de ler os dados. A melhor maneira de utilizar esses dados é se transformar em um objeto. Então eu posso dar o, algum outro título. Posso chamá-lo de qualquer coisa, mas vou novamente com os dados um para facilitar a sensação com este sinal de seta. E deixe-me ler isso. Certo. Então, como você pode ver, ele é mostrado aqui. Agora, como eu disse, sempre que criamos um objeto, oh, ou, você sabe , quaisquer funções, ele aparecerá em nosso ambiente. Então, há nosso ambiente e o que fizemos agora é recriado um objeto. Este é o título dos dados do objeto um, e nós atribuímos algo a ele, e isso é esse arquivo. Nós atribuímos esse arquivo em dados um. Agora, para visualizar os dados, você pode facilmente clicar aqui e você poderá ver tudo isso. Nove observações para variáveis. Portanto, são quatro colunas e nove linhas, como podemos dizer aqui. Ok, então isso foi facilmente criado. É assim que você importa dados. É muito fácil e muito simples. E foi assim que criamos um objeto. Por isso, é muito fácil de usar e simples. Agora, iremos em frente e faremos alguma manipulação adicional desses dados. Então, as manipulações ou quanto mais rápido usaremos se forem bem simples. Apenas o básico disso. Então, por exemplo, podemos fazer isso. Certo? Então, novo direito, tinha dados de uma maneira que eles fazem. Ele nos dá as primeiras seis observações que temos e todos os dados de lá. Agora, como você pode, é claro que temos cauda e depois fazemos dados. Um. Sim, e claro Control Enter. Agora, é muito importante que sejamos realmente claros sobre o nosso intitulado, porque neste momento eles não estão identificando dados um com o t minúsculo, d minúsculo porque temos originalmente com um caso maior, então esta é a única maneira que eles reconheceria isso. Então, se eu mudar todo o T maiúsculo e tentar executar a lista. Então, como você se lembra, a execução é controlada. placenta nos dará a campainha seis. Ok, então isso foi simplesmente olhando para as cabeças e as caudas dos nossos dados. Bem, também podemos fazer é procurar os dados em si. Então, se VJ, VJ Dia 21 e clicarmos em Control Enter, nós automaticamente obtemos isso aqui. Esses dados para nós, nossos dados são apresentados em uma tabela muito boa aqui e podemos facilmente visíveis. Agora, vamos voltar a isso. E você pode voltar sempre que quisermos. É muito mais limpo do que dizer isso, porque isso é realmente apenas tentar armazenar da forma mais eficiente possível nove observações e quatro variáveis. Certo? Para que possamos voltar aqui. Ok, então agora que fizemos isso, vamos tentar extrair dados daqui. Por exemplo, queremos primeiro escrever o objeto que queremos abordar. Então, esses seriam dados um e o que queremos tirar deles. Então, por exemplo, eu quero ver. Portanto, o primeiro número que você sempre inserirá seria a RI. Então, qual papel eu quero abordar? Quero a terceira linha e quero ver qual coluna, digamos que a primeira coluna. E eu faço Control Enter. Agora, Zach, isso me dará a informação. Zach, porém, o resto é Charlie query, David, Emily, Molly, e que tipo de livro? Realmente o que fizemos foi apenas a terceira fila, se voltarmos aqui, que somos rápidos. Zach. Então isso está correto. Agora, se quisermos uma data específica em vez de abrigar uma data específica e podemos ter uma linha inteira. Assim, podemos fazer isso puxando para baixo, por exemplo, queremos a segunda linha, mas queremos, podemos deixar isso em branco. Então você pode deixar a coluna em branco. E então isso nos dará toda a linha. Como acontece aqui. Começou a ser Emily 26 feminino 175, Emily 26, feminino 175. E da mesma forma que podemos fazer isso pelo theta um. Podemos fazer, deixar isso em branco. Na quarta coluna D, temos uma quarta coluna sozinha. Basta verificar. Sim. Então você pode fazer Control Shift Enter e ele nos dará todos os dados da quarta coluna. Então, se apenas para comparar, aqui está. E você tem, e essas são apenas manipulações simples de como extrair dados específicos do nosso que quer que seja. Ok, então há um dado muçulmano em vez de apenas escrevê-lo como esse nível específico de demanda de linha e você está falando com alguém pode fazer é fazer dados um. Então esse é o nosso objeto que estamos tentando abordar, o cifrão. E, em seguida, inalar, podemos escolher a variável específica da qual queremos as informações. Por exemplo, quero a agenda. E se eu clicar em Control Enter, ele me dará todos os diferentes que me dará essa variável específica. Ah, sim, essa coluna em particular. Então, feminino-feminino, se eu puder clicar aqui e compará-lo com o DNA, e nós apenas vamos para o gênero. Fêmeas, três machos para fêmeas, três machos e mulheres, masculinos, femininos. Ele lhe dá uma coluna inteira. Agora podemos fazer isso para todas as outras variáveis também. Então cifrão e depois escolha qualquer um e ele deve lhe dar essa informação que diz respeito. Então, essa era uma maneira muito simples de extrair dados. Espero que este vídeo tenha sido útil. Então, apenas para recapitular, tivemos um também conhecido como dados importantes criando um projeto, criando um objeto. Então, como chegamos aqui, e depois extraindo dados usando métodos diferentes, não é a cauda da cabeça, extraindo dados específicos e, em seguida, uma variável específica. Então, espero que isso tenha sido útil e estou ansioso para vê-lo no meu próximo vídeo. Obrigado. 4. Aula 3: Pacotes: Olá a todos e bem-vindos a este curso. Então, hoje vamos continuar aprendendo sobre o are, e já tivemos uma breve introdução sobre o que é R, como instalar o R e o RStudio e como importar dados, criar um projeto e algumas pequenas manipulações de dados. Hoje vamos nos concentrar em pacotes. Já mencionei brevemente. Vamos entrar em um pouco mais de profundidade desta vez. Portanto, os pacotes são pequenos pacotes de código ou funções pré-programadas. Podemos, podemos instalá-los e usá-los para problemas tão específicos, problemas estatísticos muito específicos e para manipular dados da maneira que quisermos. Tão fácil depois de passarmos por eles e os entendermos com mais clareza. Certo, tão rápido queremos instalar um pacote, armazenar pacotes, código muito simples que escrevemos. Vamos instalar pacotes. E abrimos colchetes, marcas de fala e, em seguida, você escreve o nome do pacote que queremos instalar. Agora, eu quero tidyverse. E por causa das verticais, instaladas instaladas, não preciso instalá-lo. Então, uma vez que você não tenha armazenado no RStudio, você não precisará instalá-lo novamente. Mas toda vez que queremos usá-lo, precisamos escrever a biblioteca tidyverse control shift ou exigir tidyverse. E é claro que perdi as marcas de fala. Certo. Então, ele vai aparecer aqui. Quer ser lamentável que não tenhamos que usar os dois apenas uma vez e queremos gerar pagamentos. Já é um efeito. Certo? Então, a razão pela qual eu quero instalar o tidyverse é porque não é apenas um pacote. Tidyverse é uma coleção muito poderosa de pacotes. Ele usa muitos pacotes diferentes, como de playa, GG plot dois, muito bom para visualização de dados, mas você passará por isso à medida que avançamos em nosso curso. Então, depois de instalar a maré de nós, temos acesso a vários pacotes. Então, hoje vamos nos concentrar principalmente em pacotes relacionados à manipulação de dados. Portanto, as funções específicas em que vamos focar é, por exemplo, selecionar variáveis específicas de todo o conjunto de dados. Filtrando dados específicos que queremos de um grande conjunto de dados. Organizando dados, por exemplo, em uma ordem específica , alterando-os e resumindo. Então, para fazer essa manipulação, precisamos ter acesso aos dados. E se você assistiu minha lição anterior, já fizemos um objeto. Transformamos nossos dados em um objeto que podemos ver aqui. Portanto, esses são nossos dados que usaremos hoje e manipularemos esses dados. Ok, então agora que tivemos uma breve introdução, começaremos usando nossos dados e selecionando muito, selecionando variáveis muito específicas. Então, para começar, anotamos dados um que é nosso objeto, e são esses dados com os quais estamos lidando. E o que usamos é chamado de operador de tubulação. Então Control Shift mais M e relaciona esses três sinais juntos. E o que esse ponto é meio que tira dados para um caminho e faz com que eles passem como um sistema de filtragem para o que queremos fazer com eles. Então, o que vamos fazer é, por exemplo, você está selecionando poucas variáveis, como IEEE, apenas uma, o nome e a altura. Então agora que eu fiz o controle e, e temos especificamente apenas o nome e a altura de todos esses dados. Acabamos de obter os nomes e a altura. Muito fácil de usar. É claro que podemos adicionar mais variáveis, como você também quer idade? E para isso temos agora o nome aumentou a idade. Portanto, é muito fácil de usar. Acabamos de reduzir os dados no que queremos especificamente. Então isso é apenas selecionar. O que também podemos fazer é filtrar os dados. Então, para filtrar os dados, é o mesmo processo. Chegamos aos dados um. E novamente usamos o operador de tubulação. Agora escrevemos filtro e fazemos 24 anos. Então, se eu passar por isso, isso me dá a informação para qualquer pessoa com menos de 24 anos. Então, é sentido nos meus dados procurar exatamente o que estou procurando. Então, se eu mudar isso para qualquer um dia é oito. Se eu mudá-lo para qualquer coisa que tenha mais de 20 anos por mais de 24 anos, todos me dão o resto dos dados. Agora, se olharmos aqui, isso é o que temos agora porque estávamos fazendo isso mais ou menos do que não conseguimos David em nenhum deles porque não era igual a era só porque Davi já tem 24 e não o fizemos obtê-lo como um de nossos conjuntos de dados. Portanto, é muito importante ter cuidado com essas coisas. Então isso é chamado de filtrar nossos dados. E, claro, podemos adicionar mais a isso. Por exemplo, podemos fazer e e, e altura. Então, vamos tentar isso. Portanto, é qualquer pessoa com mais de 24 anos e altura de largura acima de 1,7. Então, ele nos deu todos os conjuntos de dados para eles. Podemos usar isso em combinação para que você possa selecioná-lo e queremos apenas o nome, a idade e a altura. E então podemos reabastecer o termo para os dados específicos para que não recebamos algo como Janda. Se não quisermos a agenda fora dela, não queremos os nomes. Poderíamos fazer isso e deixar-me tirar o nome disso. Agora só queremos a altura e a idade das pessoas, mas também queremos filtrar. Por exemplo, exatamente por que eu fiz antes apenas para mostrar como combinar diferentes funções. Então eu posso envelhecer e posso fazer 24 de novo, altura. Mais uma vez, posso fazer 1.71.7. E vamos fazer isso. Agora isso me dá os mesmos dados, mas acabamos de remover o nome dele. Nós, então, só queríamos que as idades mais elevadas vissem quantos dados, por exemplo, temos. É assim que combinamos funções diferentes também. Então, quem daria uma olhada na seleção de dados e na filtragem aqui? Agora, o que também podemos fazer é organizá-lo. Por exemplo, se eu olhar exatamente essa mesma função que fizemos, podemos organizar isso. E para organizar. E podemos fazer como arranjador por altura. Por isso, arranjou para nós ir do menor para o maior lado. Da mesma forma que podemos fazer isso, por exemplo, o iterador do TBA alto organizá-lo desde a idade. E isso porque de 2006 a Titan II, é claro, esses são apenas os dados que já filtramos para idade acima de 24 anos e altura acima de 1,7. Certo? Então, já passamos por cima selecionando, filtrando e organizando. Agora vamos passar por cima dos dados mutantes. Novamente, usamos o operador de tubulação, para que nossos dados passem por um operador de tubulação. E, por exemplo, queremos mutá-lo, digamos que queremos mudar a altura e queremos vezes isso em um 100. Então, porque a altura é em metros, se eu passar por uma imagem de 100%, então depende do que você quer olhar para fora. Por exemplo, é muito fácil se você quiser mudar as unidades de algo como heroína ou mudar as unidades de altura de metros para centímetros. E aqui está. São os mesmos dados, mas temos outro, temos outra linha, Outra, desculpe, temos outra variável, que é os metros vezes 100. Como você pode ver, o título mudou aqui porque eles mudaram o título para altura, metros vezes 100. Assim, nos daria os centímetros e nos dá a altura de todos em centímetros. O que torna muito fácil trabalhar com dados para você só deseja em uma unidade específica. Agora, isso é algo que podemos, você sabe, este é um exemplo muito pequeno, mas podemos usá-lo para funções mais complexas. E para se familiarizar mais com isso, você precisa, você sabe, uma pesquisa um pouco mais experiente, pouco mais de coisas on-line, como um tipo diferente de sites para ver que outro tipo de mutações podemos fazer. Porque realmente esse é um assunto sobre o qual precisamos continuar aprendendo. Não podemos aprender todas as funções de cor, mas sempre temos que pesquisá-las. Certo? Então, a última função em que eu quero focar é resumir dados um operador de pipe. Resuma. Certo? Então, o que isso faz é me dar uma variável específica. Por exemplo, a altura mediana é uma espécie de resume toda a variável, todas as variáveis ou toda a variável de altura. E isso me dá como, você sabe, uma mediana, a mediana que eu posso fazer max. Então, isso me dá a altura mais alta que existe, e isso é 1,82. E se compararmos isso com nossos dados, fazemos isso manualmente. Por que a mediana não pode? Deve ser a mesma coisa. Então, resumi, como mencionei, esses são alguns exemplos muito pequenos e muito básicos de manipulação de dados. Entenda funções mais complexas ou códigos mais complexos que podemos usar usando tidyverse ou outras funções. Teríamos que procurar mais pesquisas e pesquisar dependendo do que precisamos em nossos dados e do que estamos manipulando. Porque há toneladas de pacotes por aí que podemos usar para nossos dados para ajudar a criar um, torná-lo mais fácil e gerenciável para nós. Ok, então agora surge a pergunta onde pegamos os pacotes e de onde encontramos o que precisamos? A maneira mais fácil de fazer isso é entrar no site do nosso próprio. Ok, então agora estou de volta ao site antes do qual Ben, hey, buffoonery ou download. Se formos aqui, volte para o automático. Você pode ver aqui que há uma opção para pacotes. E assim que clicarmos aqui, isso nos mostrará uma tabela de pacotes disponíveis classificados por data de publicação ou por nome. E então, ei, podemos, por exemplo, procurar exatamente o que queremos. Então é um pouco disso, mas é assim que encontraremos o que queremos e, em seguida, podemos baixá-lo dependendo do que precisamos, do pacote específico que queremos para nossos dados, para o tipo de manipulação que queremos. Ok, então espero que isso tenha sido útil. Foi uma breve introdução à instalação de pacotes e alguma manipulação específica usando o pacote tidyverse ou de playa, que era o pacote específico em tidyverse que estávamos usando. E realmente isso novamente, estamos apenas explorando, aprendendo e nos divertindo usando isso. Então, espero que você tenha aprendido alguma coisa e eu o verei na minha próxima lição. Obrigado. 5. Aula 4: lotes de dispersão: Olá a todos e bem-vindos de volta a este curso. Então, continuaremos analisando pacotes. Já tivemos a sorte de instalar tidyverse e usar a maré de nós para manipular dados. Hoje eles vão ser como se um aplicativo fosse anti-diversificado para visualização de dados. Agora podemos usar isso para visualizar dados de muitas maneiras diferentes, de histogramas a boxplots e gráficos de linhas. Mas especificamente hoje estaremos olhando para gráficos de dispersão. Portanto, terei diretrizes sobre como você pode criar um gráfico de dispersão e fazer alterações nele usando os dados que temos. E em vídeos futuros estaremos nos concentrando em diferentes tipos de visualização de dados para criar um gráfico de dispersão com rapidez e ter acesso aos dados. Então, eu vou negritude está ligando a íris em nada. Estes são dados que existem com tidyverse. Então, se você usar isso, podemos anexar isso facilmente e visualizá-lo. Certo, está tudo bem. Agora eu posso ver o IRS. Isso é muito cuidadoso para ser todos os caps lock porque uma diferença muito pequena e faz uma mudança muito grande no código. Agora, isso é apenas dados que existem e vamos investir hoje para criar um gráfico de dispersão de ok, então, como eu disse antes em um dos primeiros e na primeira lição, acredito, o que temos agora são apenas dados, mas precisamos transformar isso em um objeto que podemos usar. Porque só ter o dia-a-dia de madeira, é realmente difícil de manipular. Então vou fazer um IRS de título agora, esse é o objeto que eu quero e fazer uma RI. E então eu quero atribuir algo ao assunto. Então, vou atribuir íris a isso. Agora, a maioria das pessoas quer mudar esse nome, esse objeto nomeou algo diferente pela vida para mantê-lo como está, mas facilita o uso e a compreensão. Ok, então criamos esse objeto de 150 observações de cinco variáveis. Então, vamos usar esse objeto com esses dados para criar nosso gráfico de dispersão. E é muito simples. Nós faríamos uma trama do GG. Agora estamos usando o gráfico GG porque este é um pacote específico dentro do tidyverse que é usado para visualização de dados. Então, os dados que queremos, íris e V, certo? Quanto à estática, e então abrimos colchetes e, como você pode ver, mostra-nos x e y rapidamente. Então, o que queremos como nosso eixo x e o que queremos ter todos os eixos y, nós o colocamos na mesma ordem. Então eu quero que meu comprimento padrão seja meu x e minha largura de pétala seja meu eixo y. Então, vou digitar isso na mesma ordem dentro dos meus colchetes. Comprimento da pétala, sim. E depois a largura das pétalas. Certo. Controle, Enter em um gráfico aparece aqui. Agora, se você puder ver que não há pontos em pontos geométricos para os dados, eles apenas plotaram como x e y. Para incluir isso, o que podemos fazer é adicionar ponto geom. E vamos executar isso. E aqui estamos nós. Isso nos deu os pontos geométricos para os dados também. Ok, então este é realmente o básico de criar um gráfico de dispersão. Nós misturamos gráficos GG, o pacote que você deseja usar. Planejamos, descanso os dados que queremos, depois uma estática, AES, nosso x e y. E depois dizer que queremos os gráficos de dados também. E podemos mudar isso um pouco também. Por exemplo, podemos acrescentar que queríamos que o tamanho de cada gráfico fosse, digamos, cinco, e depois executasse isso muito maior. 3, acho que é melhor. Certo? Assim, podemos fazer pequenos ajustes como quisermos. Certo? Agora, para esses dados específicos, essa linha não funciona porque não é algo conectado. São pétalas diferentes ou flores diferentes que estamos usando e não faz sentido usar alinhar o quadril. Agora isso é, vamos adicionar uma linha se você quiser criar um gráfico de linhas, mas este é um gráfico de dispersão, então não precisamos necessariamente dele. Então, estou feliz em deixá-lo assim. Deixe-me limpar meu console. E ele aparece com outras linhas. Como eu sei, podemos tornar isso um pouco mais complexo, por exemplo, adicionando uma cor que não é determinada apenas por uma cor aleatória. Então, se eu for, então a cor é igual a espécies. E execute isso. Ok, então, em nossos dados, tínhamos três tipos diferentes de espécies. Agora, o que eles fizeram é que isso separou as diferentes espécies em cores diferentes, apenas adicionando o tipo simples de cor igual a espécies. Portanto, é uma maneira muito boa de analisar nossos dados e facilitar a leitura. Então, antes eram apenas pontos diferentes e diferentes gráficos de dispersão em todos os lugares. Então, dessa forma, podemos ver dados específicos que queremos abordar, não ouvir, fizemos isso. Podemos manipular ainda mais fazendo alterações no tamanho dos diferentes pontos em vez de fazer o tamanho apenas três, digamos 50. Sinto falta disso. Posso vir aqui e posso dizer que o tamanho deve ser determinado por, por exemplo, o que queremos? Ei, os dados do Locard eram específicos, queremos que seja o comprimento sépal, por exemplo. Eu quero que isso seja determinado, que determine o tamanho das parcelas específicas. Então eu posso fazer isso. Aí está ele. E deixe-me executar este teste. Portanto, ele também tem outra chave que foi criada. Então, o comprimento diferente, o tamanho diferente do enredo como podemos ver. Portanto, essa é uma maneira muito boa de trazer diferentes variáveis de dados dentro de um gráfico de dispersão. Podemos alterar a cor, o tamanho do ponto e como, como você apresenta os dados. Agora, isso é bom e fácil de ler, mas há outra maneira apresentar os dados das diferentes espécies, por exemplo, ou podemos separar o que você quiser. Deixe-me mostrar isso a você. Então, se eu for aqui e adicionar um plus, posso fazer ativos. Agora ele vai comprar sozinho ou você pode simplesmente digitá-lo. Agora mesmo. Em que eu quero que ele seja invadido? Por exemplo, eu queria lidar especificamente com espécies. Ok, vamos apenas executar isso. Ok, assim como podemos ver esses dados, isso não é mais apenas separado pelas diferentes cores da espécie ou pelo comprimento sépal e o tamanho do ponto é criado seu próprio gráfico de dispersão para cada espécies diferentes. Ok, então espero que isso tenha sido útil. Nós analisamos como criar um gráfico de dispersão, temos que alterar o tamanho dos dados específicos e atribuí-lo a algo como fizemos o comprimento da sépica, atribuímos a cor a algo específico, criar diferentes gráficos de dispersão no mesmo gráfico. Então, foi breve por uma introdução completa em gráficos de dispersão. E isso lhe dará a confiança para fazer um pouco mais explorando uma boa visualização de dados. É uma área muito emocionante para se estar. E com nossa visualização de dados e gráficos diferentes são apresentados, uh, tão bem. Então eu acho que este definitivamente um dos melhores pontos do nosso, acho que espero que vocês tenham aprendido algo e eu os verei na minha próxima lição. Obrigado. 6. Aula 5: gráficos de barras: Olá a todos e bem-vindos de volta a este curso. Continuaremos aprendendo sobre a visualização de dados. E o vídeo anterior que aprendemos sobre gráficos de dispersão. E este vídeo se concentrará em gráficos de barras ou gráficos de barras. Então, a primeira coisa que precisamos saber é que existem dois tipos diferentes de gráficos de barras. Agora, se eu apenas escrever isso aqui, barra geom, ele aparece no cabeçalho. Existem dois tipos de gráficos de barras. Agora, para uma breve explicação para as diferenças na barra, barra de geom, a altura da barra é proporcional aos casos nesse grupo. Enquanto em G on Call, é aqui que escolhemos qual valor deve representar a altura. Então, em geom chamado, damos a eles dois valores, um x e y, e sujo e Bob, damos a eles um valor. E dependendo do número desses valores, é assim que o chefe estará alto na barra Gm. Isso será muito melhor explicado à medida que eu avançar quando eu mostrar exemplos de ambos. Certo? Então, apenas para explicar geom, geom bar ou geom chamados, ambos são gráficos de barras. E para criá-los, mais uma vez, estaremos usando o pacote tidyverse, que usamos para criar gráficos de dispersão também. E, mais especificamente, o gráfico GG. Então, se eu apenas escrever isso aqui, j plus GG plot e, em seguida, a data que queremos. Agora já discutimos isso antes que os dados da íris venham com o tidyverse, e já criamos um objeto na lição anterior. Então, vamos nos referir a isso que estou usando aqui. Então íris e uma estatística x. então abrimos isso e inalamos colocamos essa variável porque vamos ser barra de geom de zinco, só podemos pintar uma variável. Por exemplo, eu quero especificamente olhar para a espécie. Então, quantos tipos diferentes de espécies que estão no palco? Agora, se eu olhar para esses dados, como você pode ver, existem diferentes tipos de espécies aqui. Então eu quero dar uma olhada em quantos desses tipos diferentes de espécies temos. Como você coloca um, hey, do jeito que já é, o código não saberia que tipo de função executar, a menos que realmente façamos mais g, m. barra de sublinhado. E, claro, parênteses abertos e fechados. E cara pesado. Ok, então este não é um ótimo exemplo porque as diferentes espécies de todos os 50, 50, 50. Portanto, na verdade, não mostra a diferença entre eles porque não há diferença que, se obtiver os dados, como você pode ver, há 150, então 50 de cada espécie. Mas essa ainda é uma boa maneira de mostrar a diferença entre as diferentes maneiras pelas quais podemos representar dados em um gráfico de barras. Agora, algumas pequenas manipulações que podemos fazer, por exemplo, é que podemos adicionar sublinhado flip. E é claro que fui além de parênteses. Certo? Então é, acabamos de virar, então mudamos o eixo de como era antes. Agora isso é muito útil se você tiver muitos dados e não quiser que tudo isso seja muito agrupado no eixo x. Então, se você colocar isso, os escritos no eixo y, você pode ter muitos tipos diferentes de muitos gráficos de barras diferentes. Pode barras diferentes para o gráfico de barras. Acho que outra manipulação que não podemos fazer é mudar o título dos diferentes eixos. Podemos fazer isso pelos laboratórios da Denke plus. E então nosso x, que será o que colocarmos aqui, vírgula, e então y, que será o que você colocar nas marcas de discurso, vírgula, depois título. Certo? Agora, para o nosso eixo x, uma coisa a observar é que, mesmo que isso possa parecer nosso eixo x, este ainda é o eixo y. Acabamos de virar. O eixo em si não mudou. Então, se quisermos mudar isso, este ainda é o eixo y e podemos querer nomear isso, por exemplo, número nosso x em vez de espécie, nosso nome, por exemplo, SP. E com relação ao título, não tenho certeza, então talvez apenas nenhum. E vamos apenas executar isso. Certo. Aqui está o número da espécie dele e nenhum título porque não demos em um. Ok, então esta foi uma breve introdução à barra de geom, que é um tipo de gráfico de barras. O outro tipo de observador que vamos dar uma olhada é uma chamada geom. Ok, então uma coisa que temos que saber Fujian é que precisamos dar duas variáveis, e x e o y. Então, para fazer isso, temos que manipular nossos dados voltaremos a uma das lições que tivemos no início sobre manipulando dados e coloque-os em ação. Por exemplo, quero usar os dados da Iris. E eu quero controlar o Shift M, levá-lo pelo filtro. E então, por exemplo, quando um clipe por clipe na escola por espécie. Então, todos os dados que temos serão agrupados por espécies. E mais uma vez, podemos levá-lo através do tubo e podemos, por exemplo, e podemos resumir, por exemplo. Agora, quero aqui fazer uma nova variável, por exemplo, PM e igual à mediana do comprimento da pétala. Certo? Então agora que criamos essa corrida antiga e isso é o que obtemos para as diferentes espécies eram gangues de comprimento médio, então só obtemos um número para cada. Isso tornará o disposto aos gráficos de barras muito mais fáceis para nós. É por isso que estou fazendo dados tão pequenos e, claro será a segunda revisão de como manipular dados, o que aprendemos em nossas lições anteriores. Agora, esses dados por si só não são tão úteis, então temos que transformar isso em um objeto para torná-lo mais fácil de lidar. Então SB para espécies e comprimento de pétalas PL 4. Então podemos fazer isso e vamos executar isso. E aqui estamos nós. Criamos outro objeto com três observações de duas variáveis. Ok, então agora que temos esses dados, podemos traçar isso em um gráfico de barras. Então, vamos fazer colchetes abertos de plotagem GG. Agora os dados que você deseja usar, que seriam SP, PL, porque esses são os dados que temos aqui. E AES. Agora, como eu disse anteriormente, com o uso de uma barra G on call e strip Gm com a chamada Jiang, o que estaremos fazendo é que estamos dando a eles t variáveis. Então aqui temos que colocar duas variáveis diferentes e você já tem duas variáveis. Então, isso seria espécie, sim, e pl. Certo? Como você pode ver, nada apareceu porque não lhes demos uma função para trabalhar. Portanto, lembre-se sempre de colocar um G em plantão se a chamada B18 ou a barra de geom, se você quiser, Gm bar. Certo? Então, agora temos os comprimentos medianos de pétalas para todos os três tipos diferentes de espécies, como temos aqui. Agora uma coisa esta noite é que temos geom chamado HIPAA. Se mudarmos isso para G na barra, isso não funcionará. Você receberá uma mensagem de erro porque ela dirá aqui, ela só pode ter um x sobre y. Não podemos ter tendencioso se tivermos barra Gm, é por isso que você estaria usando G de plantão. Então, sim, mais uma vez, isso apareceu. Agora, podemos novamente usar as mesmas manipulações aqui também. Então vira mais uma vez para facilitar se houvesse muitas variáveis de dados diferentes, os vários tipos diferentes de espécies que facilitariam a visualização escrita em vez de todas as contas aqui em cima. Certo. Mas eu não quero necessariamente, então vou afastar isso. E, mais uma vez, podemos usar laboratórios para dar um título. Por exemplo, quero que x seja alto. Não é muito prático. Mas, apenas como exemplo, não se esqueça das marcas de fala. E então o título seria x. Agora isso definitivamente não é o que o gráfico está mostrando. Isso só para mostrar que podemos alterar a variável, os títulos desses diferentes x, y e o título de todo o gráfico de barras. Porque isso não é muito prático. Então, vamos apenas remover isso que fizemos nomear e mostrar que isso pode mudar. E podemos mudar isso com muita facilidade. E mais uma vez tomaremos seu próprio título de RP e espécie. Ok, então isso foi gráficos de barras e gráficos de barras, espero que tenha sido útil. Discutimos os dois tipos diferentes. Como traçá-los, como fazer alterações neles, como alterar o título. Se você quiser aprender mais sobre isso, é apenas uma questão de brincar com ele para ser honesto. Portanto, é um ótimo lugar para começar. E espero que você tenha aprendido alguma coisa. Vejo você na minha próxima lição. Obrigado. 7. Aula 6: mais visualização de dados: Olá a todos e bem-vindos de volta a este curso. Portanto, esta será nossa última lição sobre visualização de dados. Já demos uma olhada na visualização de dados em relação a gráficos de dispersão e gráficos de barras. Hoje vamos dar uma breve olhada nos outros tipos de visualizações de dados, como histograma, boxplots e gráficos de linhas. Ok, então vamos começar como costumamos fazer. Colchetes de gráfico Gg, nossos dados, IRS, suportes abs e os dados, a variável específica que queremos que eles abordem. Então, para isso mais rápido do que vamos fazer um histograma. E o histograma só podemos colocar em uma variável que o histograma deve nos apresentar. Então, aqui, eu ficaria com o comprimento da pétala. E como eu disse, temos que expressar a função que precisamos. Então, seria histograma sublinhado GO. E isso é executado isso. Certo, então este é o nosso histograma. Agora, é claro, aqueles que estão familiarizados com o histograma, se você quiser mudar a largura de banda, comem doces que podemos. Como um inhere já diz que ele se foi com o padrão. Então, ei, nós iremos para querer mudar. Teria que entrar nos suportes. Ben. Então largura, e eu vou com um que executa isso. Certo, e herança. Então, é claro que podemos mudar isso, no entanto, gostamos do que for adequado para nossos dados e os apresenta da maneira mais eficiente e eficaz. Então, 2s claramente não é bom. Podemos até ir com 0,5. Ok, então obrigado a todos. Obrigado por ouvir. Podemos brincar com isso para mudá-lo para o que for melhor para nossos dados. Então é assim que faríamos um histograma. Outro tipo de dados, porém, e um foco é criar boxplots. Então, trama GG, IRS e VS. E com boxplots temos que pagar em duas variáveis diferentes. Então, por exemplo, quero a espécie e, em seguida, o comprimento da sépica, por exemplo. E é claro que eu deveria dar-lhe uma função para criar um boxplot, boxplot de sublinhado geom. Ok, então Harris diz que isso está mostrando o boxplot para os diferentes tipos de espécies. Um boxplot é para o comprimento sepal diferente. Portanto, esse seria nosso intervalo interquartil, Q12 e 3, e nossos valores mais altos e mais baixos para cada espécie diferente. E eles também fizeram uma anomalia aqui para nós. Ok, então esta é uma maneira muito fácil de desenhar um boxplot. Quanto mais formos experientes e começamos a usá-lo, mais você pode fazer mudanças, mas isso irá concertar a experiência e o tempo e quanto da pesquisa sobre ele. Ok, então o terceiro toque em um breve toque é um gráfico de linhas. Então, gráfico GG, IRS, como por exemplo, quero fazer o comprimento da pétala e a largura da pétala. Certo? Agora colocamos a função e, neste caso, quero linha de sublinhado G M. E vamos executar isso. Ok, então ele nos mostrou essa linha. Tosse. Agora, é claro que isso não é ideal porque em um gráfico de linhas, esperaríamos ter um dado. Seria um dado para cada eixo x e y. E à medida que olhamos nossos dados, esses não são os melhores dados a serem usados para desenhar um gráfico de linhas. Mas tivemos a ideia de como se juntar ao que mudar. Agora, é, como podemos dizer, são os mesmos princípios. Geom boxplot, histograma geom, linha geom. E há muitas outras funções que podemos encontrar em terra. Então eu tenho, isso tem sido útil e espero que seja mais do que apenas lhe dito sobre como usar esses diferentes aspectos dada a você a confiança para aprender sobre si mesmo. Porque acho que essa é a coisa mais importante com o aprendizado sobre programação. E a aprendizagem é especialmente porque há pacotes sendo desenvolvidos o tempo todo. Então, se houver algo específico que você está procurando, você teria que cavar e encontrar o pacote que você precisa. É muito importante dominar a habilidade de procurar, pesquisar e encontrar o que queremos. Ok, então obrigado a todos. Obrigado por ouvir.