Transcrições
1. Introdução: Olá a todos. Meu nome é Tyler Pernes e sou analista de dados e engenheiro de dados. Hoje, vou falar com vocês sobre nenhuma surpresa, Data. Normalmente, quando as pessoas falam e mencionam dados na conversa cotidiana, elas estão falando de uma descoberta específica, como 80% das pessoas têm [inaudível]. Então eles mencionaram por que isso importa. Mas talvez seja uma opinião específica que eles tenham. Talvez haja uma ação que eles gostariam de ver com base nessa descoberta. Mas o que não é mostrado aqui são todos os passos envolvidos para chegar a essa conclusão e é isso que eu gosto de passar neste curso. Gosto de rever ambos os lados do que chamo de fluxo de processo de dados. O primeiro lado será o lado da ciência. Isso é muito focado em obter os dados em primeiro lugar, estruturá-los e certificar-se de que eles são armazenados de forma lógica. É mais o lado da engenharia dos dados. Agora, uma vez que você tenha o lado da ciência para isso, você pode se concentrar no outro lado, que é o lado da arte dos dados. Este nível precisa de criatividade muito mais. Isso é mais sobre a criação de visuais para, em última análise, ganhar valor com esses dados, que é realmente o ponto completo dos dados, em primeiro lugar. Neste curso, vamos passar por cima de cada etapa neste fluxo de processo. Usaremos essas descobertas trabalhando
juntos em um projeto focado em obter clareza em sua própria vida. Espero que até o final deste, não só maneira você terá uma boa compreensão dos dados em um nível muito alto, você também tem alguma boa experiência para que você possa apenas experimentá-lo com seus próprios projetos.
2. O que é dados e quem realmente se importa?: Pessoal, obrigado por sintonizarem este curso. Como mencionado no trailer, este curso vai ajudá-lo a começar com a análise de dados, seja para a sua vida cotidiana ou para o seu negócio. Neste vídeo, eu gostaria de falar sobre algumas coisas. Primeiro, o que exatamente são dados? Qual é o objetivo de usar dados? Então eu vou passar por cima de cada etapa no fluxo de processo está em um nível alto, bem
como os períodos restantes vão se parecer. Durante todo este curso, eu sugiro se você tem alguma dúvida para chegar nos comentários porque eu quero que isso seja muito interativo. Então, vamos começar. É a primeira coisa a falar. O que exatamente são dados? Dados em sua forma mais pura, tem uma definição muito simples. Informação. Isso significa a cor da sua camisa. Isso significa qualquer voz que sai da sua boca. Isso significa que deixa para trás, cada folha de grama em que estou sentado é informação e, portanto, dados. A questão é que os dados estão em todos os lugares. Mas o truque é ser capaz de filtrar os dados que você não se importa, para que você possa se concentrar nas informações que são relevantes para você. Mas como sabemos quais dados filtrar? Bem, você precisa ter certeza que você sempre tem uma pergunta abrangente. Isso é, em última análise, o que você está tentando responder usando os dados. Digamos que você está em casa e conversando com um de seus bons amigos, vamos chamá-lo de Johnny, e no meio da conversa, você percebe algo, você não fala por 30-40 minutos agora, e Johnny continua para falar sobre coisas que você honestamente não se importa. Isso faz você pensar, “Johnny nunca fala sobre tópicos importantes?” Esta é a sua pergunta abrangente, e você quer inferir isso. Então o que você decide fazer é em sua próxima conversa, você pega seu telefone, e você coloca o botão de gravação, que significa que você grava cada palavra, tanto você quanto Johnny e falar sobre isso é você extraindo os dados da fonte. A fonte neste caso será Johnny, e seu método de extração é o gravador. Você faz isso por algumas semanas, talvez até alguns meses, que você tenha uma quantidade sólida de dados que você pode fazer referência para avançar. Quando você se sentir confortável com a quantidade de dados que
você tem, você descobre que é hora de realmente colocá-lo em bom uso. Para fazer isso, você começa a ouvir todas as gravações que você tem, você começa a perceber algo. Essas são muitas coisas extras e há muitas palavras aqui que não é útil responder à sua pergunta. Então, o que você decide fazer é em vez de digitar cada palavra na gravação, você escolhe apenas os tópicos que ele está falando, e então você coloca cada um deles, digamos, uma nota pegajosa para que você possa tê-lo armazenado para o futuro usar. Isto é você transformando os dados neste caso a partir da gravação, em forma de conversa em um ou tópicos que são armazenados em uma nota adesiva. Agora que você tem todos os tópicos, em forma de nota adesiva, e percebeu que é hora de realmente aproveitar esses tópicos e usá-los para responder à sua pergunta. A coisa é que você tem cerca de 200 notas adesivas diferentes aqui. É realmente difícil organizá-lo, então o que você faz é abrir uma planilha, digamos Microsoft Excel, e você começa a digitar cada um dos tópicos. Este é o seu processo de carregar e armazenar as informações. Então, agora que você tem uma planilha configurada, você quer analisar, você quer descobrir como usá-la para responder a sua pergunta. Você abre a planilha e está pronto para começar, mas ainda tem espaço baixo, mesmo que esta seja uma maneira mais estruturada de mostrar os dados, ainda
é uma parede de texto. Ainda não é particularmente intuitivo o que fazer com ele. Então você leva algum tempo para olhar para ele e você explora os dados para ver como eles são,
então você decide tornar visual para que seja um
pouco mais fácil entender exatamente o que está acontecendo. Você construiu alguns visuais e agora está pronto para cavar fundo e descobrir : “A ação Johnny fala sobre coisas úteis?” Você vê um gráfico que mostra seus principais tópicos ou tópicos mais usados, e você vê os três primeiros são: celebridades que te irritam, tipos de molho picante e filhotes. Você também percebe que esses três tópicos representam a grande maioria de todas as conversas. Na verdade, eles representam 90% das nossas conversas. Este é você na análise dos dados para reunir descobertas específicas. Agora que você tem essas descobertas lá, o que isso significa? Bem, além de pensar nisso, dos três tópicos principais, apenas um deles é particularmente importante, e isso são filhotes. Os outros dois estão realmente mais próximos daquele lado “quem se importa” do espectro. Então você categoriza cada gravação. Você faz isso por todos os tópicos e percebe algo. Setenta e dois por cento de todas as conversas de Johnny são baseadas em tópicos que não são importantes. Os outros 28 por cento, de que 28 por cento, 99 por cento dele está relacionado com filhotes. O que isso significa, então, é que Johnny fala sobre tópicos importantes na ocasião, mas é quase são devido a um tópico de filhotes. Esse é um exemplo de você contar uma história para ajudar a obter uma conclusão para responder a sua pergunta abrangente. Uma visão geral rápida do que acabamos de fazer. Descobrimos o que é uma questão abrangente, extraímos os dados de uma fonte, transformamos os dados em forma de nota adesiva, carregamos e armazenamos os dados em uma planilha, e então exploramos e visualizou os dados para que possamos analisá-los para obter descobertas e embarcar na história para finalmente tirar uma conclusão. Vamos repassar todos esses passos em detalhes nos próximos vídeos, e então vamos aplicá-los através de um projeto que eu acho que vai ser particularmente relevante para vocês, na verdade
vai ser um projeto focado em ajudar Vocês mantenham o controle de algo muito importante, pelo
menos eu presumo que seria muito importante para vocês. Acredito que os dados devem ser usados com mais frequência em nossas vidas cotidianas porque o objetivo dos dados é nos ajudar a informar decisões, e esse é o ponto. Eu não vejo por que não devemos usar dados em nossa vida cotidiana com mais frequência, eu realmente acho que o principal obstáculo é que as pessoas simplesmente não sabem como começar, apesar do fato de que ele é realmente muito simples, completamente gratuito, e não investimento muito tempo.
3. Fluxo de processo: Lado de ciência: Ei, todo mundo. Neste vídeo, vamos começar com os fundamentos de dados desde
o início do fluxo do processo de dados, que é o lado da ciência. O objetivo principal do lado da ciência é preparar os dados de forma estruturada para que possamos finalmente ganhar valor com eles usando o lado da ciência, pensar nisso como esta fase de preparação. Mas o que quero dizer quando digo estrutura? Geralmente você deseja que seus dados sejam configurados em um formulário de tabela, que consiste nas colunas e linhas. As colunas são encontradas na parte superior da tabela e os dados encontram os dados para responder à pergunta, o que esses dados representam? Por exemplo, digamos que você seja mostrada uma série de números em uma planilha sem cabeçalhos de coluna. Não temos idéia do que esses dados representam até vermos o que o cabeçalho mostra. Então, se uma das colunas diz receita, então é muito claro o que esses números representam. As linhas, por outro lado, armazenam as informações na tabela. Eles realmente atuam como os dados em si. Se não temos linhas e apenas colunas, então nós não temos dados, nós apenas temos definições de dados que poderiam estar lá em recurso. Como você sempre pode obter mais informações sobre um assunto, o número de linhas pode e deve flutuar, adicionando
e removendo linhas. No entanto, as definições de dados realmente não devem mudar. Então, por causa disso, o número e a ordem das colunas devem permanecer iguais. Tudo bem, então é assim que uma mesa é montada e este é o nosso objetivo. Queremos chegar a um ponto em que temos uma estrutura de tabela consistente que faz sentido. Então, como chegamos lá? Bem, vamos dar uma olhada em um framework, que sempre vem de uma ou mais fontes, e isso pode ser através de e-mail ou isso pode ser através de um aplicativo, isso pode ser diretamente da boca de alguém. O ponto é que os dados podem vir de uma variedade de fontes. Isso também significa que os dados podem vir em uma variedade de formas. Às vezes pode ser forma de mesa. Às vezes, podemos ter apenas uma linha de texto que representa dados. Às vezes, você pode ter um memorando de voz real ou um código que você precisa usar. Independentemente de onde o formulário esteja, primeiro precisamos extrair os dados, e esse é um passo muito importante. Uma vez que você tem os dados, precisamos começar a olhar para a estrutura e precisamos responder a pergunta, esta configuração de dados
é de uma forma lógica? Considere estas duas mesas. A mesa à direita é a nossa tabela de objetivos. É assim que queremos que os nossos dados sejam parecidos. A tabela à esquerda é a nossa tabela extraída. Observe a diferença entre os dois, na tabela de metas temos três colunas, mês de
país e população. Os mesmos dados são armazenados na extração de seu arquivo, mas temos uma coluna para cada mês, e as populações são armazenadas em cada uma dessas colunas. Pense em como esses dados extraídos podem caber dentro do conjunto de dados ouro. Eles podem se encaixar como um quebra-cabeça? Caso contrário, precisamos de uma maneira de transformar
os dados extraídos para que eles possam se encaixar melhor com nossos conjuntos de dados de meta. Em termos de carregamento dos dados, isso é apenas pegar os dados que você acabou transformar e colocá-los na tabela que você criou. Se esta for a primeira vez que você tiver esse conjunto de dados, provavelmente será necessário criar uma tabela para que você possa carregar os dados. Em termos de armazenamento de status, há dois tipos diferentes de sistemas de armazenamento. Primeiro, planilha de dados. Esta é mais uma solução em pequena escala. É uma configuração muito simples. O benefício de usar uma planilha, é muito rápido. O problema com planilhas, você não quer usá-lo se você tiver muitos dados. Alguns exemplos serão o Planilhas Google no Microsoft Excel. O outro tipo de sistema de fonte de dados é um banco de dados. Agora, esta é mais uma solução em larga escala. Demora um pouco mais de tempo para configurar e requer mais habilidades técnicas. É muito mais robusto e você quer usá-lo quando tiver muitos dados. Mas porque é preciso uma quantidade decente de configuração e requer uma quantidade decente de conhecimento, vamos nos concentrar no uso de planilhas. É isso, pessoal. Esse é o quarto passo no lado científico do fluxo do processo de dados. Agora, uma coisa que eu quero mencionar é como esses passos podem ser extremamente simples ou extremamente complicados. Depende do número de fontes, da quantidade de dados, da frequência dos dados
e da complexidade dos dados. Para nossos propósitos, quando
analisarmos o projeto, teremos uma configuração muito básica para a qual vocês não precisam nenhum histórico técnico e podem começar com projetos adicionais usando o mesmo processo. No próximo vídeo, aprenderemos como aproveitar esse conjunto de dados preparado passando pelo lado dos dados.
4. Fluxo de processo: arte: Muito bem, pessoal, neste momento descobrimos como preparar um conjunto de dados estruturados. Agora vamos falar sobre como realmente aproveitar esses dados para alcançar nosso objetivo geral, passando pelo lado artístico do fluxo do processo de dados. Para trazer de volta um tópico anterior, nosso objetivo é responder à nossa pergunta abrangente. Antes de entrarmos nisso, eu gostaria de falar primeiro sobre um tipo específico de ferramenta, e isso é uma ferramenta de Business Intelligence ou BI para encurtar. As ferramentas de BI se conectam a um conjunto de dados e nos permitem criar diferentes tipos de visuais, que torna muito mais fácil entender o que um dado está mostrando versus digamos, olhando para a própria tabela. Usaremos uma ferramenta em particular durante este curso, que é o Tableau. A principal razão pela qual vou usar o Tableau é simplesmente porque é onde eu tenho experiência, mas dado que há uma tonelada de ferramentas diferentes no espaço. Portanto, sinta-se livre para usar qualquer ferramenta com a qual você está mais confortável. Direi que o Tableau tem uma versão paga, mas não se preocupe, usaremos uma versão pública gratuita para nosso projeto. Vejamos a parte externa do fluxo do processo de dados. Semelhante ao lado da ciência. Há quatro etapas: explorar, visualizar, analisar e contar histórias. Antes mesmo de começarmos com o estágio de exploração, primeiro
você precisa conectar dados à sua Ferramenta de BI. Normalmente, há uma interface de usuário intuitiva para configurar essa conexão. Uma vez que os dados estão conectados, podemos começar a investigar os dados através do estágio de exploração. Esta etapa consiste em testar diferentes maneiras de visualizar os dados. Basta arrastar e soltar colunas em sua Ferramenta de BI e ver quais visuais ficam bem. Ao olhar para um visual, pense nessas perguntas. O visual fornece insights úteis? Alguma coisa neste visual é fora do comum? Esse visual se relaciona com nossa pergunta abrangente? Nem todos os visuais que testar serão relevantes. Então espere jogar alguns deles fora. Após esse estágio, você deve ter alguns visuais relevantes para usar nas etapas restantes. O próximo passo é visualizar os dados criando um painel. Um painel é uma coleção de visuais que fornecem uma grande quantidade de informações ao mesmo tempo. Muitas vezes vem com interatividade, que lhe dá a capacidade de filtrar dados
específicos ou desenhar para baixo em seções específicas. Como um painel é conectado nativamente ao seu conjunto de dados. À medida que mais dados fluem para o conjunto de dados, mais dados aparecerão automaticamente no painel. Uma vez que você tem uma configuração de painel é hora de realmente analisar os dados. Essa etapa se concentra em transformar o painel que você incorporou em descobertas significativas. Quais são as principais conclusões deste painel? Como esse traço ajudaria a apoiar ou substituir a pergunta? Pense em algumas idéias diferentes e não se preocupe em colocá-las juntas por enquanto, basta colocar as idéias em algum papel ou algum documento para que você possa deixá-las se encaixar em frente, observe
que é melhor do que ter muitos achados versus muito poucos. Se você não tem certeza se as descobertas vão ser particularmente relevantes, não olhe para elas de qualquer maneira. Uma vez que você tenha essa lista de descobertas, é hora de juntar tudo e construir uma história que responda à nossa pergunta abrangente. Construir uma história neste caso é simplesmente responder, como nossas descobertas se relacionariam com nossa pergunta? forma como você mostra essa história depende completamente de você e geralmente depende do seu público. Se o seu público vai ser um cliente ou cliente. Será que vai ser uma aula específica que você está dando? Ou você está apenas apresentando algo para um amigo. Ou talvez você apenas mostrando algo para si mesmo para que você possa descobrir o que você precisa fazer a seguir. Há um monte de maneiras diferentes que você pode mostrar na história de construção, como um PowerPoint, uma apresentação ou apenas escrever as coisas no papel. Mas novamente, pense no seu público. Pense sobre qual é a melhor abordagem, e isso pode realmente orientar como você realmente apresenta a história. É isso pessoal, é tudo o que temos para o Art Side Of Data. Esses são os quatro passos e, neste momento, passamos por todas as oito etapas do fluxo do processo de dados, ambas a ciência no lado da arte. Agora que sabemos cada passo, podemos usar esses aprendizados para trabalhar juntos em um projeto, que será o que nos próximos três vídeos nos concentraremos.
5. Visão de projeto: Haptracker: Recapitulação rápida de onde estamos. Vamos rever o fluxo do processo de dados passo a passo. Tanto o lado da ciência quanto o lado da arte. A próxima é a parte divertida. Vamos aplicar nosso conhecimento a uma situação da vida real. Para este projeto, vamos analisar algo muito simples. Felicidade. Especificamente, vamos criar um projeto para rastrear nossa felicidade em diferentes pontos de um dia e construir um painel para nos ajudar a analisá-lo. Para o propósito deste curso, vamos chamar isso de rastreador de felicidade, ou Haptrack para abreviar. O primeiro passo com qualquer projeto é o planejamento. Para manter isso simples, vamos nos concentrar em responder a essas quatro perguntas. Número um, qual é a nossa grande pergunta. Para nós, estamos apenas procurando aumentar nossa felicidade. Então a questão geral vai ser simplesmente, como podemos aumentar nossa felicidade geral? Número dois, quais são as fontes de dados? Bem, a fonte precisa entender como você está feliz em um determinado momento. Então, há realmente apenas uma opção aqui, e é você, você vai ser a fonte de dados. Número três, quais ferramentas vamos usar e quais processos teremos para aproveitar essas ferramentas. Para a fase de extração, eu sugiro ter um aplicativo que é muito rápido e simples de usar para que você possa facilmente anotar onde sua classificação de felicidade está em qualquer ponto do dia. Vamos usar rascunhos. Esta é uma ferramenta muito rápida, muito simples. Não há tempo baixo e é básico. Nós realmente não precisamos ficar muito loucos com a ferramenta de extração aqui. Agora, a síntese também está acontecendo várias vezes do dia. Pode ser muito fácil para nós esquecer de dar entrada no que é a nossa felicidade. Então eu sugiro colocar um par de lembrar configuração diária para que possamos facilmente ser lembrados, é hora de realmente anotar isso para baixo. Para as etapas de transformação, carregamento e armazenamento, precisamos ter algum tipo de planilha. Sugiro usar o Planilhas Google. Agora, o que eu gosto no Google Sheets versus Excel é que ele está conectado on-line, ele é coletado em um servidor, que significa que ele pode conectar nativamente o Tableau sem que você precise fazer qualquer intervenção manual. Se você armazenar o Microsoft Excel, ele será armazenado localmente, que significa que ele não será atualizado automaticamente quando você se conectar à ferramenta de BI. Isso é tudo para a ciência. Para o lado da arte, tudo vai usar o tableau. Não é muito que temos que ir por aqui. Direi que a fase de exploração é uma fase de planejamento. Então não temos que entrar em muitos detalhes. Agora a última pergunta é, quem é o público? Isso simplesmente vai guiar o que sua abordagem de contar histórias vai ser. Então é bom saber isso de antemão. O público neste caso vai ser você mesmo. Por causa disso, você não tem que ser muito louco com seu método de contar histórias. Você não precisa ter uma apresentação ou um PowerPoint ou qualquer coisa chique, contanto que você tenha uma idéia de como suas descobertas se relacionam com você em uma compressão, então você deve ser bom. É isso para a fase de planejamento. No próximo vídeo, vamos colocá-lo em ação.
6. Haptracker, parte I: Tudo bem, vamos começar a construir o nosso projeto. Neste vídeo, vamos construir cada um dos passos de sinalização, e o próximo vídeo será focado nos outros passos. Agora, primeiro passo, antes mesmo de começar com a etapa de extração, primeiro
temos que baixar nossa ferramenta de extração, que será o aplicativo de rascunhos. Abra seu celular, vá até a loja de aplicativos e baixe rascunhos. Uma vez que você tenha os rascunhos baixados, vamos entrar nele. Você verá uma tela em branco, basta tocar nela e você pode começar a digitar o que você sabe, talvez, para nós, sugiro que coloquemos um número para que você possa entender
facilmente por que seu [inaudível] estava naquele momento determinado. Agora, se você clicar no canto superior esquerdo aqui, você verá outras notas, bem como quando foi acessado pela última vez, data
e hora. Se você clicar em uma nota específica e ir para o topo, você verá as informações sobre ela, incluindo quando e onde ela foi criada. Só algumas informações extras que você não precisa digitar. Última coisa a saber sobre, quando você vai para a seção de notas, você pode deslizar para a esquerda e direita para o lixo ou arquivá-lo. Isso é tudo que você precisa saber sobre rascunhos. Outra coisa a observar é que se você apenas digitar um número e, em seguida, bloquear seu telefone, ele irá salvá-lo automaticamente. Você não precisa se preocupar em ter tempo para salvar o botão, mas um recurso de salvamento automático. Como isso vai acontecer tantas vezes durante o dia, vamos configurar algumas linhas apenas para que possamos obter um lembrete para isso. Vamos abrir um lembrete e você pode ver aqui, eu apenas configuro linhas diárias de manhã, e à tarde, e à noite, você é mais do que bem-vindo para escolher o horário que quiser rastrear, quantas vezes você quer acompanhar e assim por diante. Só uso isto porque se encaixa bem com a minha agenda. É isso para a etapa de extração. Em seguida, vamos nos concentrar nas três etapas que vão
exigir que usemos o Planilhas Google. Vamos investigar isso. Para acessar o Planilhas Google, abra seu navegador e digite google.com/sheets. Agora você usa o Planilhas Google, você precisará de uma conta do Google,
então, se você não tiver no make um, é totalmente gratuito. Na tela do Google Sheets, você verá na parte inferior serão algumas das suas planilhas existentes, mas basta clicar em uma nova folha em branco e ela o levará para a planilha sem título. Esta é uma planilha, planilhas gostam de se mover e manobrar para diferentes células ou selecionar várias células, e permite que você insira dados, sejam números ou texto. Para nossos propósitos, vamos apenas usar uma planilha para construir uma tabela com três colunas. Dia. Vamos ter 'hora do dia' e vamos ter 'felicidade desaparecendo. ' Agora você conhece rascunhos e vai começar a digitar
as informações encontradas em cada uma das notas de rascunho. Digamos que temos uma nota em 27/8/2017 para a manhã que teve uma classificação de felicidade de seis. Você insere cada um em conformidade, faça a mesma coisa tanto para a tarde quanto para a hora da noite dos dias. Agora eu sugiro que isso é preciso um pouco de investimento para abrir a planilha, talvez fazer isso uma vez por semana para não se preocupar em fazê-lo todos os dias. Mas uma coisa que eu quero saber é que você tem a capacidade de copiar e colar clicando com o botão direito do mouse e pressionando “Copiar” ou apenas pressione “Control C” e clique com o botão direito do mouse para pressionar “Colar” ou “Control V.” Isso torna um pouco mais fácil de usar quando você já criou, para que você não precise digitar tudo do zero. A última coisa que eu quero falar no fundo aqui é
que eles são a capacidade de adicionar mais guias. Isso pode ser útil se você quiser ter dois conjuntos de dados diferentes. Por exemplo, os dados de Johnny e meus dados, o que é maior é isso. Em seguida, você pode alterar o título da planilha na parte superior. Vamos chamar isso de “Haptracker para Tyler e Johnny.” Agora vai levar algum tempo para você obter um conjunto de dados robusto, já que você só vai adicionar três linhas no máximo todos os dias. O que eu vou fazer é compartilhar meu conjunto de dados para que você possa começar com o lado das artes. Você pode ver o conjunto de dados na descrição. Quando abrir este conjunto de dados, verá os dados desde o início de 2017. Clique neste quadrado no canto superior esquerdo, clique com o botão direito do
mouse e clique em “Copiar” e, em seguida, abra o seu próprio ou apenas pressione “Arquivo”, “Novo”. Vá para a primeira célula, clique com o botão direito do mouse e pressione “Colar”. Isso é tudo que você realmente tem que fazer aqui para obter os dados. Novamente, isso vai permitir que você configure um painel com meus dados e, em seguida, o que você pode fazer é, você pode simplesmente substituir meus dados com seus dados para que nada realmente não tenha mudado. Agora que, como você já construiu
tudo, tudo vai fluir naturalmente com os novos dados que você tem. Tudo bem, é isso para configurar o tamanho do sinal para este projeto. Em geral, havia muitas maneiras diferentes de configurar esse processo. Assim, à medida que você tem mais projetos avançando, use qualquer abordagem com a qual você se sentir mais confortável. Eu diria que há muitas maneiras de automatizar isso, mas não vamos repassar isso ainda. Vamos repassar isso talvez em um vídeo futuro. Tudo bem, vamos continuar e depois olhar para o lado da arte deste projeto.
7. Haptracker, parte II: Em termos de configuração do lado da arte, tudo vai ser focado em nossa ferramenta de business intelligence, que vai ser tableau. primeiro passo é baixar o Tableau Public. Abra seu navegador, digite public.tableau.com e vírus em seu e-mail, basta digitar e-mail aqui, clique em baixar o aplicativo e isso deve começar a baixar o Em estoque. Aqui está o Tableau, você realmente se importa com o lado esquerdo quando ele abriu. Esta é a tela de conexão. Role para baixo até ver folhas do Google, que é armazenado na memória para mim, você pode ter que clicar na seção “Mais” e você pode ver tudo o que o Tableau conecta, é um pouco. Você também pode apenas procurar se você está sobrecarregado. Basta clicar no Google Sheets e ele vai aparecer uma janela de login. Não foi possível abrir as informações da folha. Uma vez que você está logado clique em “Permitir” e, em seguida, ele vai mostrar todas as suas folhas duplas que você se conectar a. Agora, eu vou me conectar a este. Pressione “Conectar” e pode levar um segundo para se conectar. Aqui, agora você vê a tela de interface de usuário de conexão real. Agora você realmente não precisa se preocupar com muita coisa aqui. Ele deve ser preenchido automaticamente com seus dados. Há opção de folha múltipla se você tiver dados em mais de uma guia e você pode simplesmente arrastar e soltar nesta interface. De qualquer forma, vamos passar para a planilha real. Ok, então é assim que a interface do usuário
se parece para a escola do Tableau em um nível alto. Na parte superior, aqui você vê a própria fonte de dados e se você clicar com o botão direito do mouse, você pode ver informações sobre os dados. Você pode visualizar os dados. Por exemplo, se você quiser ver como ele se parece, que deve ser o mesmo que a sua Planilha Google. Esta seção, são suas dimensões e medidas, que é apenas outra maneira de dizer, colunas diferentes. Você vê data, hora do dia e classificação de felicidade, todas as três colunas que temos. Você vai notar esses três outros que estão em itálico. Eles vêm com qualquer conjunto de dados padrão no Tableau. Não se preocupe com isso por enquanto. Vamos repassar isso em um vídeo diferente. Agora tudo neste lado direito da tela é realmente um visual realmente acontece. Colunas e linhas apenas representa quais colunas serão dentro de uma coluna em ambas as seções. Você também tem a capacidade de arrastar e soltar colunas diferentes em cada uma das seções aqui e no cartão Marcas sobre esta área, o quadrado aqui, permite que você altere a visualização em si. Aqui está um exemplo. Vamos arrastar e soltar a hora do dia em, digamos, colunas. Em seguida, arraste e solte classificação de felicidade em duas linhas. Lá vai você, você tem um gráfico de aparência decente que mostra qual é a
sua classificação geral de felicidade para cada um dos tempos dos dias. O que acontece aqui se eu clicar duas vezes em algo e ele automaticamente filtrado. Você pode ver a foto aqui em cima. O que é legal sobre o Tableau é que
há a capacidade de desfazer, que você pode ver aqui clicando em Control-Z ou simplesmente clicando no botão Desfazer e você sempre pode refazer. É muito semelhante a qualquer pessoa que tenha tido experiência com o Excel. Basta Control-Z, Control-Y para desfazer ou refazer de acordo. Agora, há muitas maneiras diferentes de mostrar isso e você pode clicar no botão Mostrar “Eu”
na linha superior para mostrar diferentes tipos de visualizações, especialmente se você nunca usar o Tableau antes, isso será Muito, muito útil. Vá aqui, você pode ver tabelas de texto. Vamos clicar nisso. Agora só nos deu uma versão de texto. Voltar em barras horizontais é muito semelhante ao que temos, exceto que tudo é comutado. Uma coisa a saber é que clicamos em um desses botões “Mostre-me”. Reparem como as colinas mudam. Nas barras você tem uma coluna aqui para classificação de felicidade e , em seguida, aqui para os textos que temos isso em um texto é tecnicamente é o texto. Você pode mudar o tipo aqui. Agora mostrado quadrado e este é um exemplo de um visual que simplesmente não faz sentido. Não há razão para querermos ter ambos os textos
na praça atrás dele, então isso é algo que você não usaria. Vamos controlar esses também. Experimente coisas diferentes. Veja o que parece bom, veja o que não parece bom e você pode arrastar e soltar um monte de coisas diferentes também. Agora, vamos voltar para o bar. Na verdade, ao contrário do outro bar, um pouco melhor, mais fácil de ver. Há um botão que permite que você troque linhas e colunas, aqui em
cima ou até mesmo fazê-lo na própria pílula. Isto é o que eu estou dizendo quando eu digo que é bastante intuitivo por causa dos recursos de arrastar e soltar. Agora uma coisa que eu quero mostrar a vocês é que esses números são muito maiores do que 10, apesar do fato de que a classificação de felicidade interna escala se entre um e 10. A razão pela qual isso está acontecendo é que você vai notar que você vê uma soma de classificação de felicidade. Em outras palavras, não está tomando a média para todas as tardes. Está resumindo todas as tardes e a classificação é muito maior do que 10. Você pode fazer é clicar neste menu suspenso ou apenas clicar com o botão mouse e quando você vê a medida, alterá-lo para a média. Agora isso parece muito melhor. Isso mostra o que cada uma das diferentes médias são. Digamos que queremos mudar, adicionar alguma corrente à hora do dia. Você pode arrastar e soltar a hora do dia na cor e você pode ver a mudança aqui. Digamos que também queremos ver alguns rótulos, arrastar e soltar talvez na hora do dia. Você pode ver o que acontece. Eles literalmente mostram qual era a hora do dia para cada hora do dia, o que não faz sentido. Podemos tirá-lo e levá-lo para fora você pode anotar como arrastar e soltá-lo para fora do caminho. Você pode ver este X vermelho ao lado do mouse. Isso significa, ok, nós vamos nos livrar disso. Mas poderia fazer sentido como poucos arrastar e soltar classificação felicidade. Nos rótulos e está fazendo a mesma coisa espelho, ele vai padrão para somar. Essas poucas coisas que você pode fazer aqui. Você pode alterar as propriedades padrão e alterar a agregação para ser média. Agora preciso arrastar e soltar. Vai mostrar automaticamente a média. Na verdade, não gosto de quantas casas decimais estão aqui. Vamos clicar com o botão direito do mouse no texto e alterar o formato. Agora, neste caso, na verdade, há muitas maneiras diferentes de
formatar e eu não quero formatar muito. Vamos realmente dar um passo atrás e em vez de alterar o formato aqui, vamos alterar o formato de número de propriedades padrão, e vamos alterá-lo para número personalizado com uma casa decimal. Agora eu acho que parece um pouco melhor e este é um gráfico decente. Para voltar à nossa estrutura, o primeiro passo é explorar e é aí que será a maior parte do nosso tempo para este lado inteiro. Porque uma vez que você tenha explorado os dados e uma vez que você tenha alguns visuais configurados, o resto das etapas simplesmente se encaixam. Vamos continuar. Vamos experimentar alguns visuais diferentes. Agora, já que este é um que podemos acabar usando, vamos mantê-lo. Você pode renomear a planilha na parte inferior, então vamos chamar essa comparação de hora do dia. Então você pode fazer é apenas fazer um novo gráfico ou um novo visual, eu diria. É como tentar coisas diferentes. Agora, uma outra grande coisa a saber é que quando você arrastar-e-soltar data, ela vai mostrar automaticamente o ano. As poucas maneiras que você pode mudar isso, para nós, já que tudo é 2017, não
é particularmente útil para mostrar data, mas você pode clicar em “Plus” para desenhar para baixo, todo o caminho até o dia, mas eu não gosto a forma como isto é configurado. Eu só vou desfazer isso algumas vezes, e em vez de arrastar e soltar data com o clique esquerdo, eu vou segurar o botão direito do mouse e arrastar e soltar data. Normalmente você quer fazer algo verde. Verde significa contínuo, azul significa discreto. Não se preocupe muito com isso ainda. Digamos que você queira ver o mês, vamos ficar com o verde. Agora, você tem um mês no eixo x. Vamos fazer a mesma coisa de classificação de felicidade. Agora você pode ver como a classificação geral de felicidade está mudando ao longo do tempo. Eu gosto de barras, você pode rolar para a seção de marcas e você pode mudar diferentes tipos em área, linha, eu vou mantê-lo como barras por enquanto. Eu não gosto do tamanho, o caminho para ele, basta clicar em “Tamanho” e mudá-lo. Está alterando automaticamente a largura da data. Eu gosto de manual, assim eu posso mudar o quão grande ou pequeno. Vamos com isso. Você pode ver aqui que a classificação geral de felicidade está aumentando ao longo do tempo, isso parece que ele. Particular, uma melhor compreensão, você pode literalmente clicar com o botão direito do mouse em “Linhas de tendência”, “Mostrar linhas de tendência” e uma vez que está subindo isso é bom. Isso significa que, em geral, estamos aumentando nossa felicidade. Consideraria isto útil também. Vamos renomear isso e chamá-lo de felicidade mensal. Agora, já temos dois gráficos diferentes que podem ser relevantes. Vamos continuar, e isso é literalmente apenas arrastar e soltar coisas, vamos deixar isso aqui. Hora da queda do dia, dia da gota, vamos olhar por dia da semana. Isto é fixe. Na verdade, dá um tipo de exibição de calendário. Não exatamente, mas pode ser útil. Não gosto de SMS. Eu acho que o texto em si, é difícil realmente entender exatamente o que está acontecendo. Acho que é muito mais fácil ver a cor. Vamos ver como podemos mudar. Vamos clicar nesta “Tabela de Destaque”, lá vai você. Você pode ver aqui, é um pouco mais fácil não saber quais
dias específicos em que hora específica dos dias são os melhores para mim. Você pode ver aqui que sábados e domingos parecem ser o [inaudível] que provavelmente é redondo, onde todos estão felizes por razões óbvias. Por alguma razão, na terça à tarde, não me sinto muito bem. Você pode ver isso aqui. Agora você pode mudar a cor, clique em “Cor”, “Editar uma Cor”. Talvez você queira ver alguma comparação vermelho-verde clique em “Aplicar”, e você verá mais de um tipo de configuração de semáforo aqui. Continue explorando alguns visuais diferentes. Continue explorando o conjunto de dados, até que você tenha um número de visuais que você se sinta bastante confortável usando para seu painel. Quando você estiver confortável com os visuais que você tem, é hora de passar para o estágio de visualização, que é simplesmente configurar um painel. Se você rolar a parte inferior, esse botão do meio será um novo painel. Clique nesse botão e você verá a tela de criação do painel. Agora, um painel está simplesmente arrastando e soltando diferentes visuais. Ele só permite que você configure um traço, como você quiser. Em outras palavras, você pode arrastar e soltar este gráfico aqui, arrastar e soltar outro aqui. Você pode muito bem é brincar com o que você acha que faz sentido. Agora, eu vou para o Controle Z tudo isso e mostrar duas maneiras diferentes de mostrar dados. O que você acabou de ver foi a tela de azulejos. Você vê esses quadrados que é como, você sabe, é azulejo. Está a dizer que este traço ou este visual se encaixa neste tracejado através deste azulejo. Pessoalmente, não gosto disso. Eu preferiria usar a opção flutuante, que você pode fazer pressionando o botão Shift e, em seguida, arrastar e soltar. Você vê que não há preenchimento quadrado, apenas um quadrado flutuante acima de toda a tela widescreen. O que isso permite que você faça, ele lhe dá um pouco mais de flexibilidade para escolher exatamente onde cada traço e cada gráfico vai mostrar. Vamos colocar a comparação da hora do dia aqui. Talvez você queira colocar mensalmente e hora do dia no topo. Ambos são provavelmente mais como coisas de alto nível. Faz sentido tê-los no topo. Eu não quero mostrar esta cor muito óbvia onde cada cor representa aqui. Vou me livrar dessa lenda. Vamos redimensionar isso. Você pode apenas brincar em torno de cada um desses. Se algo estiver mostrando que você não quer, basta apertar o botão “X”. A outra coisa que eu quero mencionar é sempre que você clicar em um desses visuais, clicar no menu suspenso e clicar em muitos “Fit”, ele muda a maneira como isso se encaixa dentro da tela. Você pode ver aqui que é barra horizontal. Eu não gosto disso. Preferia ser capaz de ver toda a vista. Clique em “Ajustar toda a vista” e talvez seja expandido um pouco. Isso é bastante decente. Agora continue isso e, eventualmente, você pode ter um painel de aparência decente que pode lhe dar algumas percepções. A última coisa que quero mencionar é a capacidade de filtrar. Acho que não começamos com filtro, vamos para o lençol. Vamos arrastar e soltar dia e clicar em “Mês”, que é clicar com o botão direito, arrastar e soltar. Clique em “Mês e Ano”. Digamos, janeiro artificial e não foi particularmente usado para isso, tentou fazer isso. Vamos tentar uma tribo diferente. Claro, vamos fazer este. Mesma coisa, vários anos. Vamos apenas fazer genérico. [ inaudível], você verá os números mudarem porque ele vai para todo o meu conjunto de dados e sugere janeiro. Agora você pode fazer é clicar na tabela que você acabou de adicionar o filtro. botão direito do mouse ou clique no menu suspenso, pressione “Filtros” e adicione o filtro que você acabou de adicionar, que era Mês, Ano do dia. Então você vê isso popular. Agora, o que é legal é clicar no menu suspenso neste filtro aplicado às Planilhas, todas usando essa fonte de dados. Agora isso vai terminar tudo de uma vez. Agora você pode ver tudo só para maio. Se você quiser, você pode ter uma mosca apenas a planilha que você se importa. Para mim, eu não queria filtrar por mês desde que este mostra mês de qualquer maneira. Vou tirar a felicidade mensal como opção. Lá vai você. Agora você pode ver que isso afeta os dois esquerdos, e este é ficar intacto. Quando você terminar com o estágio visualizado, você deve ter um painel criado de volta para permitir que você tenha esperança em dados de vida. Nós já temos algumas descobertas do estágio de exploração de volta e anotar, como 12 de março como classificação bastante alta. No geral, estou aumentando a felicidade, o que é bom. Terça-feira à tarde é muito baixo, que é algo que eu poderia querer levar em conta mudar para e talvez eu possa tentar ser feliz com esse dia. Você pode continuar investigando qualquer visualização que você tem. Se você tem interatividade pode estar clicando nas coisas. Aqui está algo interessante. Em 6, 19 em 620, eu tenho três baixa felicidade em relação a tudo o resto. Motor. Talvez eu verifique meu calendário e veja o que aconteceu aqueles dias foram causados que baixa classificação de felicidade. De qualquer forma, faça isso para sua visualização, descubra algumas descobertas e, em seguida, o último passo é contar histórias. Realmente, não há muito a dizer em termos de contar histórias já que você é o público. Mas use isto para responder à sua pergunta. Olhe para suas descobertas. Veja quais as incidências mais baixas e mais altas instâncias de felicidade e tente entender o que causou aqueles. Se você pode talvez seguir em frente, você pode ser mais real sobre isso. Você pode fazer coisas que aumentarão sua felicidade geral. A coisa principal é que, como você continua a acompanhar sua felicidade, você pode realmente ver se o que você está fazendo está funcionando. Digamos que você tenha uma estratégia, experimente por um mês e sua felicidade não aumenta. Pode ser que sua estratégia suspeita seja um golpe, mas, é isso pessoal. Quando terminar o orçamento,
você o salvará no Tableau Public e fique à vontade para compartilhar o que você tem na seção Projeto de descrição do curso. Continuar no Tableau Public é que tudo é de código
aberto, o que significa que você tem a capacidade de baixar seus livros onde outras pessoas têm livros, para ver como eles fizeram as coisas. Vamos fazer isso interativo, vamos fazer isso colaborativo. Talvez possam aprender com as descobertas um do outro.
8. Considerações finais: Isso é tudo para esta aula, pessoal. Espero que você tenha ganhado valor com isso, seja através do projeto que você construiu, ou apenas obtendo uma melhor compreensão de como os dados se encaixam do início ao fim. Uma coisa que vou dizer é que mal arranhamos a superfície desta coisa toda. Cada um desses passos pode realmente ter uma carreira inteira dedicada a ele. O que eu quero fazer é obter feedback de vocês em termos do que vocês querem que a próxima aula seja focada. Talvez você realmente goste de fazer os painéis. Podemos ter outro vídeo focado na criação mais avançada do painel do Tableau. Ou talvez você queira obter uma melhor compreensão de como
despejar dados e armazená-los em um banco de dados. Podemos ter um curso inteiro sobre conceitos de banco de dados e usar alguma sequela para mover esses dados. Muito obrigado por se juntarem a esta aula, pessoal. Eu realmente aprecio isso e espero que você continue a aprender mais sobre este tópico. Este é o primeiro dia que eu nunca [inaudível]. Se vocês não se importam de colocar algum feedback para baixo ou talvez esquecer vocês e ser honesto com isso, eu não quero dizer que é incrível se não foi incrível, e se houvesse algo em particular que você pensou que eu poderia trabalhar, Por favor, me avise. Eu realmente apreciaria isso por seguir em frente. Espero vê-lo em breve.