Quer ser um cientista de dados? | Kumaran Ponnambalam | Skillshare

Velocidade de reprodução


  • 0.5x
  • 1x (Normal)
  • 1.25x
  • 1.5x
  • 2x

Assista a este curso e milhares de outros

Tenha acesso ilimitado a todos os cursos
Oferecidos por líderes do setor e profissionais do mercado
Os temas incluem ilustração, design, fotografia e muito mais

Assista a este curso e milhares de outros

Tenha acesso ilimitado a todos os cursos
Oferecidos por líderes do setor e profissionais do mercado
Os temas incluem ilustração, design, fotografia e muito mais

Aulas neste curso

17 aulas (3 h 2 min)
    • 1. O que é este curso

      5:38
    • 2. Sobre V2 de Maestros

      2:07
    • 3. O que é a ciência de dados - parte um

      11:51
    • 4. O que é a ciência de dados - parte dois

      10:44
    • 5. O que é uma ciência de dados parte

      12:55
    • 6. O que é uma ciência de dados parte

      9:31
    • 7. Casos de uso de dados

      7:47
    • 8. Ciclo de vida de dados de vida para a Ciência - configuração

      11:46
    • 9. Ciclo de vida de dados de vida para ciência de

      11:57
    • 10. Ciclo de vida de dados de vida - análise e produção

      19:16
    • 11. Habilidades necessárias para a ciência de dados — parte 1

      12:48
    • 12. Habilidades necessárias para a ciência de dados - parte 2

      10:48
    • 13. Funções na ciência de dados

      11:56
    • 14. Desafios para uma cientista de dados

      14:27
    • 15. Como criar seu conjunto de habilidades

      14:55
    • 16. Procurando oportunidades

      13:02
    • 17. Conclusão

      0:49
  • --
  • Nível iniciante
  • Nível intermediário
  • Nível avançado
  • Todos os níveis

Gerado pela comunidade

O nível é determinado pela opinião da maioria dos estudantes que avaliaram este curso. Mostramos a recomendação do professor até que sejam coletadas as respostas de pelo menos 5 estudantes.

1.321

Estudantes

--

Sobre este curso

Data Science é a vida mais sexos do século do século de 2de É um campo híbrida que requer habilidades is Você já ouviu sobre em sua parte, mas não sabe o que é exatamente o trabalho e se é uma boa escolha de carreira para você. Este curso tem a sua se educar sobre você

  1. O que é a vida de uma cientista de dados?
  2. Quais as habilidades são necessárias para se tornar uma

Cursos de Data Science e degress é uma boa ideia para saber o que seu está para se entrar em antes de gastar seu dinheiro.

Conheça seu professor

Teacher Profile Image

Kumaran Ponnambalam

Dedicated to Data Science Education

Professor

V2 Maestros is dedicated to teaching data science and Big Data at affordable costs to the world. Our instructors have real world experience practicing data science and delivering business results. Data Science is a hot and happening field in the IT industry. Unfortunately, the resources available for learning this skill are hard to find and expensive. We hope to ease this problem by providing quality education at affordable rates, there by building data science talent across the world.

Visualizar o perfil completo

Nota do curso

As expectativas foram atingidas?
    Superou!
  • 0%
  • Sim
  • 0%
  • Um pouco
  • 0%
  • Não
  • 0%
Arquivo de avaliações

Em outubro de 2018, atualizamos nosso sistema de avaliações para melhorar a forma como coletamos feedback. Abaixo estão as avaliações escritas antes dessa atualização.

Por que fazer parte da Skillshare?

Faça cursos premiados Skillshare Original

Cada curso possui cursos curtas e projetos práticos

Sua assinatura apoia os professores da Skillshare

Aprenda em qualquer lugar

Faça cursos em qualquer lugar com o aplicativo da Skillshare. Assista no avião, no metrô ou em qualquer lugar que funcione melhor para você, por streaming ou download.

Transcrições

1. O que é este curso: Olá. Bem-vindo a esta apresentação aqui. Este é o seu instrutor, Cameron nesta seção da apresentação, vamos ver o que este curso quer ser um cientista de dados é tudo sobre. Então vamos começar a rolar. A demanda por ciência de dados e cientistas de dados tem crescido dia a dia. É considerado o trabalho mais sexy do século XXI. Você sabe, a última palavra de ônibus e o final Você continua ouvindo sobre essa diversão em todos os lugares na internet, em todos os seus filhos em todos os seus e-mails, sempre que você está falando de quem você está falando e é o coração e acontecendo campo em software, ele tem uma demanda significativa projetada para empregos em todo o mundo. Você está levando em consideração algum tipo de artigo? Nosso boletim informativo que está saindo sobre as demandas de trabalho projetadas no campo I T. Você vê, que os dados atribuem é um dos empregos mais bem classificados em todo o mundo. Para o futuro dado, todos estão interessados em se tornar um em você veria um monte de ônibus em torno dessas pessoas falando sobre Ok, eu não quero ser um cientista de dados. Eu também quero fazer sinais de dados. Mas a questão é que há muitas perguntas fora. Eles não estão lá em sua mente. E quais são essas perguntas? O que é exatamente um cientista de dados? - Você? Este é um termo bastante único. Um cientista de dados. Não é como um programador é um arquiteto ou um designer. Mas você vê a palavra cientistas entrando em jogo no que eu acho, então você está meio curioso sobre o que é tão único sobre o cientista de dados de trabalho. O que os data centers fazem? Quem? Como se parece um data center todos os dias de trabalho? Ele vai fazer muita programação e nossa análise e design vai escrever apresentações de documentação? Você só vai administrar projetos? Você não sabe quais habilidades e treinamento são necessários? A ciência de dados é um novo conjunto de habilidades que está entrando em vigor. Você definitivamente não é. Não são aprendidos sobre isso em seus bacharelados ou mestrado. Então você tem a Dra. Weir algumas habilidades para se tornar uma. Então, quais são as habilidades? Quais desafios um cientista de dados enfrenta? E isso é uma coisa boa e ruim. Às vezes, dados de qualquer tipo de trabalho meu fornecem desafios únicos, e algumas pessoas adoram eles. Algumas pessoas os odeiam. Então, o que é que os dados de trabalho assinados isto te dão? Como isso te desafia? E então você vai adorar ou não? É um bom ajuste para mim? Esta é a grande questão que todos têm em mente em que Você quer ver se este perfil de trabalho vai ser um ajuste para você Assim que uma vez que você se tornar um cientista de dados de jato, você ainda estará interessado em continuar o trabalho por um longo tempo. Como você adquire as habilidades necessárias? Este é outro desafio. Como vamos adquirir as habilidades? Estas são novas habilidades. Então, como é que os consegues, Andi? Finalmente prestes a procurar emprego? O que é o site? Sabes, como é que vais à procura de emprego e coisas assim? Então, qual é o objetivo fora deste curso? Estas são as respostas para todas as suas perguntas estão atualmente espalhadas por toda a web. Há tantos bits intermediários por toda a web. Um barco sobre o que um atribui é como eu ia parecer um dos desafiantes. Que habilidades existem? Mas estes são Há difíceis de encontrar respostas definitivas porque há muito viés e o que as pessoas estão escrevendo sobre muitas opiniões pessoais estão entrando em vigor. Então, como você realmente projetou o curso? Fornece um lugar para obter todos eles, e esse é o objetivo do curso é colocar todos eles juntos em um tribunal para que você possa passar por eles em, em seguida, tomar uma decisão informada sobre se você quer se tornar um dado cientista ou não. O curso explica o campo da ciência de dados e o que é necessário para desenvolver as habilidades para ela . E o objetivo é ajudá-lo a decidir se deseja se tornar um data center novamente. A primeira pergunta é, se você quer se tornar um cientista de dados, e se você decidir se tornar um, como você pode se tornar assim? Há uma pergunta se, e há uma pergunta que será respondida com base neste curso. Então esse é o objetivo deste curso, o público esperado para o curso. Qualquer um que esteja pensando em entrar em profissionais de software de sinais de dados será a primeira categoria de pessoas que estariam interessadas em chegar aqui gerentes de projeto porque de repente eles vêem que projetos de ciência de dados estão entrando em sua foto. Matemáticos em, em seguida, um especialista em domínio de negócios. O que não é discurso. Essa é a próxima coisa. Eu não vou disputar. Para ser muito claro, nosso amigo é que não há treinamento técnico que está sendo apresentado como parte da pontuação . Estava só a dar-te informação suficiente para tomares uma decisão. Se você quer ser um cientista de dados ou não, e não há habilidades de software pensadas neste curso, espero que este curso esteja pronto para acasalar para você e ajudá-lo a tomar uma decisão. Boa sorte na promotoria. Vamos continuar conversando, obrigado. 2. Sobre V2 de Maestros: Olá. Oi. Bem-vindo a nós ao Mastro que seus especialistas em ciência. Então esta é uma introdução à nossa empresa e instrutor quem somos. Nós fazemos. A Mastro é uma organização de treinamento totalmente comprometida com a educação em ciência de dados. Não estamos nos concentrando em outras habilidades que foram puramente focadas em sinais de dados em Nós nos concentramos na criação de dados implantáveis. As habilidades científicas foram focadas em habilidades de ciência de dados implantáveis que as pessoas podem assumir usadas em seu trabalho diário. Através de treinamento on-line, também nos concentramos em fornecer nossos treinamentos através de mídia on-line. Nosso objetivo é desenvolver profissionais de sinalização de dados que possam fornecer tranças de negócios em organizações comerciais. Não estamos em teoria. Não estamos em pesquisa. Estamos no reboque, desenvolvendo profissionais de ciência de dados que podem entrar em organizações comerciais no uso de suas habilidades para entregar negócios em. Temos uma experiência significativa no setor na prática de ciência de dados. Então, sobre o instrutor e este sou eu. Meu nome é Cameron Porn Emblem. Eu sou um líder experiente em ciência de dados com uma paixão por ensinar permitido ensino, permitir, fazer cursos e fazer habilidades com outras pessoas. Eu tenho 22 anos de experiência em desenvolvimento de software em geral em que eu tenho experimentado em missão aprender seus sistemas de nuvem base em domínios de gerenciamento de projetos. Onda. Tenho experiência no ensino de ciência de dados através de cursos online. Antes que você possa olhar para o meu blawg em comum p m dot blocos parte ponto com, você iria encontrar mais detalhes sobre mim em alguns dos trabalhos de pesquisa que eu tenho feito. Então, obrigado por fazer este curso e ajudar. Isso vai ser fora de interesse e fora de valor para vocês. Obrigado. 3. O que é a ciência de dados - parte um: Olá. Aqui é o seu instrutor, Cameron nesta seção. Vamos ver o que são sinais de dados. Ciência de Dados é algo que temos ouvido falar muito. Mas em que consiste exatamente a ciência de dados? O que? Do que se trata realmente? Então, vamos ver duas coisas na sessão. A primeira coisa é sobre dados de águas, e o segundo 1 é querer é aprender. Então vamos ver algumas definições fora da água. As coisas constituem uma ciência de dados. Então, algumas das coisas que você verá nesta sessão são talvez coisas que você possa dizer que são coisas óbvias inerentes. Eu acho que você já esteve acostumado, mas é bom dedo do pé. Dê uma segunda olhada nas definições de cada um deles porque eles significam muito em um sinais de dados . Eles, de fato, formam a base da ciência de dados. Então vamos passar por todas essas definições aqui. A primeira coisa que vamos começar sobre o que é Data Saints, David Signs é a habilidade de extrair conhecimento de dados. Temos algo chamado dados. E então há algo assim tão bruto e então você olha para os dados e você extrai conhecimento , conhecimento poderia ser pensado sobre essa informação dentro de seu sinal. Existem diferentes termos sendo usados para o conhecimento da pessoa surda, mas basicamente pode algo que você extrair de dados que é útil. E então você usa esse conhecimento para prever o desconhecido. Então você aprende algo sobre o passado com dados, e então usa essa informação para prever o que vai acontecer no futuro. E isso é o que os sinais de dados são tudo sobre. David Sames. Uma das meninas é melhorar os resultados de negócios com o poder dos dados, você pode fazer previsão, mas qual é o uso fora? O uso disso é que você deseja usar os sinais de dados para melhorar os resultados de negócios, e você estará melhorando os resultados de negócios usando dados. E é disso que se trata a ciência de dados. Não há. Os funcionários são tecnologias. Teorias são desenhadas a partir de várias áreas amplas áreas que não estão restritas a um único domínio. Então você tem matemática em suas estatísticas, dados de tecnologia da informação. Se as tecnologias inteligentes linguagens de programação, nós realmente usar uma série de diferentes técnicas e teorias e áreas. Quando se trata de ciência de dados E o que é um cientista de dados? Outro cientista é um praticante fora do praticante de sinais de dados. Quando é que sai um praticante? Sua Desde que estamos falando de alguém que usa as teorias e teorias e todas as tecnologias e as habilidades de sinais de dados para produzir um melhores resultados de negócios Andon atribuído isso tipicamente tem ah, ou deve ter experiência em um conhecimento de engenharia de dados ticks estatísticas sobre DA qualquer outro no domínio de negócios. Também em dados tipicamente assinados. Isso investiga problemas complexos de negócios e usa dados para fornecer soluções. Então a coisa mais importante aqui é usado ODA para fornecer soluções ou dados é o driver para um cientista de dados. Então vamos entrar em algumas das definições de dados. Do que exatamente estamos falando aqui? Quando dizemos dados, quais são as várias coisas que você faz aprender sobre quando você está falando sobre dados. Então vamos passar por um conjunto de definições aqui novamente. Eles podem ser óbvios para você, mas vai dizer, dê uma segunda olhada em todos eles. A primeira coisa que vamos falar é o que é chamado de NDP. Uma entidade é uma coisa que existe que iria pesquisar e prever na ciência de dados. Então uma entidade é uma coisa, um objeto, algo que existe no mundo real sobre o qual vamos trabalhar. Então você tem um problema de ciência de dados no problema de envio de dados. Você tem um conjunto de entidades que você caraças em. Você faz alguma pesquisa sobre eles. Você obtém dados sobre essas entidades e, em seguida, trabalha nelas para fazer previsões. As entidades sempre têm um contato comercial. Há um contexto de negócios, que é o problema de negócios que você está tentando resolver em que o indeedy existe. Então, exemplo de uma entidade como um cliente, um cliente fora de uma empresa é uma entidade. Cliente é uma entidade a mais popular entrou A. Eu veria sobre quem fazemos um monte de pesquisa e fazer previsões. Uma pessoa em um hospital é outra entidade. Agora você vê que o cliente de uma empresa e o paciente do hospital podem realmente estar apontando para a mesma pessoa, mas eles têm diferentes contatos comerciais. Contatos comerciais diferentes significam a mesma pessoa. Nós nos preocupamos com informações diferentes sobre a pessoa que a pessoa pode estar fazendo coisas diferentes como um cliente, ao contrário do que ele estaria fazendo como um paciente. Entidades também podem ser coisas não vivas . Como, por exemplo, um carro. Então o cartão é no tipo que não estão fora de coisas não vivas em que você também coletar informações e você prever coisas acontecendo para o próximo item. São características que são características. Cada entidade tem um conjunto de características, modo que estas são propriedades oferecidas entidade que é informação sobre a identidade nós. Nós os chamamos de informação estática, porque eles estão limitados à entidade como nome, número de telefone, idade. Essas são todas as características, muitas vezes entidade em propriedades também novamente têm um contexto de negócios em fazer diferentes contatos comerciais . Você quadra sobre características diferentes para a mesma entidade ou o lugar da pessoa em particular nesse contexto de negócios específico. Por exemplo, se as características do cliente você se incomodaria com a nossa faixa etária de educação de gênero para um paciente, seu corpo duplo novamente sobre AIDS, então a característica chamada idade se repete. Mas agora você tem um conjunto diferente de características, especialmente para ser um paciente como pressão arterial, peso, história familiar. Então, novamente, há um contexto de negócios da exigência de negócios, que impulsiona quais características você incomoda a bordo de uma entidade novamente. Carros. Quando você olha para carros, você fala sobre fazer ano modelo do tipo de motor de motor como quatro cilindros ou seis cilindros sobre o número de vento do carro. Então, estes são todos exemplos de características. Você também pode chamá-los de peça apropriada dos EUA. Por exemplo, propriedades que pensei que um de vocês se importava é o que é meio ambiente? Ambiente aponta para o ecossistema em que a entidade ex são funções. Entidade não existe no vácuo. Existe um ambiente no qual existe uma entidade. Então, nesse ambiente ou em outras entidades, outras entidades do mesmo tipo outras entidades de um tipo diferente, como um paciente e estar existe no hospital, juntamente com outras entidades fora do mesmo DeBlanc com outros pacientes. Isso também pode ser outros tipos de entidades, como médicos e enfermeiros, entidades que não são seres vivos, como ambulâncias, um registro de entidade. Um sistema que é usado para monitorar pacientes pode ser uma entidade. Então, sob estes, todas essas entidades existem em um ambiente tão ambiente. As imunidades sombra em múltiplas entidades existem no mesmo ambiente, ambiente afeta um no comportamento de hoje, modo que isso é a coisa mais importante. A mesma entidade pode se comportar de forma diferente em ambientes diferentes são mesmo para o mesmo ambiente em condições diferentes, experiência no ambiente. A mesma entidade pode estar aqui também. Exemplos amigáveis de alho unção para um cliente, o país, a cidade, o mundo perto. O cliente reside em persa novamente que talvez a cidade o clima com hospital onde o paciente está atualmente em um carro. - É. Mas o cartão está sendo usado principalmente para a condução da cidade na estrada que se torna o ambiente que os carros climáticos desempenham de forma diferente sob diferentes condições climáticas como coração. Se não havia condições de neve, carros têm comportamento diferente. Então todo esse caso é o que você vê é que o ambiente afeta como o indeedy se comporta agora vem e até mesmo o que é desigual, desigual. Há uma atividade comercial significativa na qual a entidade participa. Entidades não se sentam simplesmente lá. Ele faz alguma coisa. Se alguém faz algo para a identidade, isso é o que você chama de uma atividade comercial mesmo e até mesmo acontecer novamente exceto ambiente. Você, uma entidade como um persa, vai para o hospital e para o hospital. A entidade é tratada para se não há set off s que são administrados do paciente dado em. Então você tem alguns resultados saindo desses testes. Todos estes são uniformes. Exemplo fora desigual. Pode ser o cliente navegando em um site cliente fazendo uma loja, visitar um cliente recebendo uma chamada de vendas de alguma empresa para vender algo. Todos estes são uniformes nas meninas fora de porções. É como os médicos. Foi um exame de sangue para um carro? O inteligente faz isso de acordo com vai o teste de comparação. Como se você ir a qualquer um desses sites relacionados com carros, você vê que eles gostam de testes de comparação. Todos eles são uniformes em que uma entidade participa comportamento. Então, até faz algo lá na entidade participa. Mas o que significa comportamento? O que a entidade faz no dado? Mesmo que seja o comportamento das entidades. Então até uma entidade vai, faz algo na água. Melhor nisso, dado que mesmo é o que ele chamou de comportamento da entidade terminou. Ele pode ter um comportamento diferente em diferentes ambientes e situações diferentes em , por exemplo, no caso, fora de um cliente, um telefonema em uma água chamada telefônica onde o cliente palestras é o comportamento dos clientes. A sala de cliques para uma visita ao site como o que vincula os visitantes do site personalizado particular clicando quando ele está navegando no site que tem outro tipo de comportamento? Não, a resposta. O cliente tem que dizer a sua oferta. Eu estava vendo anos. Não, disse o cliente feliz. Todos eles são diferentes comportamentos fora dos pacientes clientes não cr iluminado e enfermeira cãibras as poções reclamando de algo. Os pacientes, você sabe, adormecendo, mostrando qualquer tipo de depressão, qualquer tipo de sintomas. Todos eles são comportamentos do paciente e carros gostam de boa aceleração, as distâncias de parada, todos eles representam como uma forma de comportamento fora das entidades. Não, essas são todas aquelas coisas que você vê no mundo real, como as entidades uniformizam e comportamento em Agora vem a introdução dos dados 4. O que é a ciência de dados - parte dois: introdução dos dados dos pés. Não, há algo chamado resultado. Então, o que é um resultado? O resultado muitas vezes atividade considerada significativa pelo negócio. Então você tem eventos no mesmo nível. Existem entidades e é se comportar de forma diferente em diferentes uniformes. Mas todos esses uniformes tipicamente têm alguma forma off resultado que é importante com o negócio no resultado é um resultado muitas vezes atividade o resultado de uma atividade de negócios, por exemplo, assim em resultados pode ser valor. Os resultados são valores, certo? Então os valores do resultado podem ser barras como sim, não, que alguém em particular fez um teste. Eles passaram o nosso fracasso. É um ouro. Berlim é basicamente sim ou não em fita de dados. O antigo pode ser como um valor contínuo como um valor numérico. Alguém fez um exame de pressão arterial para a pressão arterial. Valor é um valor contínuo. Pode variar em qualquer lugar, você sabe, $100 abaixo. Isso é valor contínuo ou pode ser alguma forma de uma classificação. Aulas. Basicamente, alguém fez uma crítica fora. Uma revisão de um filme Onda relacionando que você deu pode ser uma classe como excelente, muito bom grupo feira. Mas isso é um tipo de classificações são do tipo que, como os resultados podem ser de qualquer uma dessas fitas diferentes. Exemplos de resultados nas meninas do cliente onde o cliente faz uma venda é um ouro no valor da venda. Quanto eles compraram como um valor contínuo continua, significa que o valor ou que você é um presente é basicamente qualquer lugar de 0 a 100 ou 2000. É um paciente de valor contínuo, as meninas do paciente. O resultado pode ser a leitura da pressão arterial, que é um resultado contínuo no tubo de diabetes. Depressão nos identificou na classe como dieta A diabetes são tipo B morrer, mas estes é uma classe. No caso dos carros, os níveis de poluição atmosférica são uma classificação. O nível de pequenos glóbulos como ABC. Há uma classificação parando os negócios. Isso acontece porque você faz um teste para um carro, o que é um par neles. Nesse caso, você está medindo as distâncias de parada quando você bloqueia os freios e a distância que levaria para parar parar parar. Esse é um resultado contínuo. O passado inteligente, os nossos fracassos há um valentão e um resultado. O tipo de carro. Digamos que um canto esportivo de sedan familiar que é uma espécie de classificação, Então estes são resultados diferentes que acontecem como resultado de alguns. Mesmo assim, os resultados estão desligados. Mas o importante na ciência de dados, porque normalmente atribui o que você está tentando prever como resultados no futuro. Já viu mais sobre isso? Mais tarde? Agora vem o que é chamado de observação. Então, o que é uma observação? Uma observação é uma medida. É com o meu presidente muitas vezes. Mesmo assim, você mede algo sobre um mesmo considerado significativo pelo negócio. Então você basicamente mede e até mesmo mede coisas importantes e desiguais que são importantes para o negócio de que estamos falando. Ele captura informações sobre as entidades e bola. Assim, dado que mesmo minhas entidades não múltiplas envolveram as características das entidades, o BA curioso das entidades, a informação sobre o ambiente em que o mesmo acontece sobre os resultados. Então, na observação há informações sobre todas essas coisas que acontecem e desiguais. Você basicamente ir e coletar todas essas informações e gravado de alguma forma em observação é tipicamente chamado de sistema off record. Então você onde quer que vá, você vê que as pessoas estão gravando informações nos outros dias para gravá-las em diários, alguns diários de bordo e coisas assim. Não, tudo é automatizado, informatizado. Há scanners que estão escaneando essas informações automaticamente. Alguém está entrando no computador, que são para assassinatos. É chamado o sistema off Record no exemplo de observações são, no caso de clientes, há um cartão de telefone Rikard. Também se chama CDSS no departamento telefônico. Na transação como uma transação de compra, alguém vai para a loja em fantasmas por algo que ele vai para o ponto off balcão de venda na transação é gravado lá. Nossa, hum, oferta de e-mail. Um e-mail chega até você, oferecendo algum produto a algum valor. Não é excitante. Você compra algo, então todos eles são observações. Se você olhar para um paciente, Dr. Bissett se repete no resultado do teste, uma captura de dados de um dispositivo de monitoramento. Todas estas são observações, diferentes tipos de observações. E finalmente, vamos dar uma olhada no carro. No caso de um carro, um Ricard selvagem é uma observação. O carro vai para pesquisas e o fim. Suas descobertas do mecânico estão registradas no registro de serviço. Um inteligente como resultado, é uma observação. Então, todas essas diversões foram capturadas de alguma forma, gravador e armazenamento. Então finalmente chegamos aos dados o que faz um conjunto de dados? Adela disse, como uma coleção fora de observação. Assim, cada observação, registros e até mesmo sobre o centro das entidades, uma coleção de observações para uma empresa se torna um conjunto de dados. Oito. A observação em um conjunto de dados é tipicamente um recorde esta semana. Chamá-lo menor registro lógico que olhar para registro físico pode ser dado. A observação pode ser registada em várias formas. Várias interfaces de usuário que podem ser como relacionamentos detalhados mestre. Tudo isso é bom, mas aqui estamos falando de um registro lógico que representa uma observação. Normalmente, você teria observações tendo uma hera como uma idéia de transação, idéia teste número de série, algo assim. Então, um dia eu disse que a coleção de observações soltas cada registro tem um conjunto de atributos que apontam características, resultados de comportamento. Então, se você olhar para a planilha do Excel, você verá que normalmente cada regra representaria como um registro em uma observação. A planilha do Excel em si é, um dado dito. Em cada porta foi uma observação em cada coluna é basicamente atributo que aponta para qualquer uma das características das entidades. Os comportamentos são todos vem endereço que pode ser estruturado leitor Expedia, registros policiais, planilhas Pode ser desestruturado. Além disso, os feeds do Twitter são um exemplo de dados não estruturados em artigos de jornal. Eles não são chamados para ser como semi estruturados como e-mail. Então, um cientista de dados, você normalmente lida com diferentes tipos de dados, como dados de estrutura. Dados não estruturados são dados de estrutura alguém e criador SanDisk eleger e trabalhar em dados disse que é o pão e manteiga para um cientista de dados é dados e mais dados sobre dados coletados como conjuntos de dados coletados, armazenados, trabalhado em previsões são feitas com base nos conjuntos de dados. Então, eles disseram, é o núcleo fora da ciência de dados. Ah, o que são dados estruturados? O exemplo que você vê no lado direito é um exemplo de dados de estrutura que onde os atributos são rotulados e claramente visíveis. Você vê que cada atributo em particular vocês rotular separadamente, como quando pronto quando o nome moeda eu d observando número. Tudo é Lobel. É claramente visível se ele está sendo usado nos EUA . . Se ele foi armazenado no banco de dados. Há o que você chama de dados de estrutura sendo rotulados e armazenados separadamente. Foi facilmente pesquisável em, adicionalmente, adicionalmente, credível porque eles tinham rotulado separadamente mesmo em novo fazer armazenamento em um banco de dados, seu aluno, colunas diferentes. Portanto, é um direito vital e SQL instrução toe consulta Estes dados. Pode ser, claro, sua história facilmente nas tabelas do Terrível, talvez, talvez, como tabelas de banco de dados ou planilhas do Excel, é fácil armazenar dados de estrutura em geral. Os dados não estruturados, por outro lado, não são rotulados. Então vai ser como Tex contínuo como você vê no lado direito é um país de texto sobre um mestre três por carro. Portanto, este é o estoque contínuo em que os atributos não são distantemente rótulo, mas seu presente dentro dos dados. Então as coisas que são destacadas, um ardente que você vê, são atributos diferentes como compacto é o tipo de sacos de carro hodge, um tipo de carro. Uma transmissão de seis velocidades é a transição do tribunal, então todos eles estão presentes dentro dos dados, mas não distintamente rotular. Então é assim que você nos chama. Os dados não estruturados continuam paus. Não há nada longe, mas na sua filha está escondida estão embutidos dentro do próximo. E silenciar, claro, é claro,não vai ser fácil quando está adquirindo. Estamos falando mais de não inspeção visual, mas estamos falando de escrever programas de computador para extrair informações. Estes não vão ser fáceis. Agora vem a terceira fazenda com apenas dados semiestruturados. O que você vê aqui, um exemplo aqui é um e-mail. Então, o que está no e-mail é parte dos dados é estruturado e parte dos dados está na estrutura. Então, nos e-mails, você vê que alguns meus tributos são claramente rotulados. Como, você sabe, o de endereço 200 cc assunto seu melhor em Lobel e disponível como um colunas separadas são pedaços separados de informação, enquanto outros talvez ele não fez dentro do uso endear mensagens de texto também. Então você é estruturado e estruturado um que misturado no caso de um dados semiestruturados . Alguns exemplos de alguns dados de instrutor também podem ser como exemplo. Os documentos são dados semiestruturados. Algumas informações estão disponíveis no atributo algumas informações na parte síria de documentos externos . Isso é tudo exemplos fora de alguém estruturar dados tão em resumo. O que? O que é que vimos? Com relação aos dados temos visto uma entidade características, ambiente, ambiente, até mesmo resultados de comportamento em observações e, finalmente, conjunto de dados. Então esta é a chave, uh, fundações sobre quais dados e há e apenas construir sobre. Portanto, é bom para você conhecer e entender cada um deles. Então isso completa esta parte fora da seção. Continuaremos em mais A. Nada da apresentação. Obrigado. 5. O que é uma ciência de dados parte: Olá. Este é o seu instrutor Cameron aqui, continuando em sinais de dados de águas. Vamos falar sobre o que está aprendendo na linguagem da ciência de dados. O que é aprender sobre o qual é descobrir conhecimento a partir de dados? A primeira coisa que queremos notar como o que é uma relação de relacionamento novamente forma uma das bases da ciência de dados quando falamos sobre relacionamentos com conversa sobre relações entre atributos. Então, depois de Buttes em um dado disse exibir relações, isto é, você tem uma não-observação. Você tem um conjunto de observações em um conjunto de dados sobre atributos que você vê nessas observações exibem o que são chamados relacionamentos, relacionamentos, modelar o mundo real e não têm explicação lógica. Quando dizemos modelo, as relações do mundo real são basicamente algo que está acontecendo no mundo real. Não é algo fora do azul que você veria algo no conjunto de dados. Os dados diziam. Independentemente dos dados que você tem, a relação que mostra é algo que existe no mundo real. Por exemplo, idade e níveis de pressão arterial. A relação entre eles é que, à medida que o idoso sobe, a propensão para a pressão arterial mais alta continua subindo. Quanto maior a sua idade. Quanto mais altos podem ser os níveis de pressão arterial. Há sempre uma explicação lógica associada com isso em. A razão no campo médico,dizem eles, dizem eles, é que se você tem mais peso, obviamente você permite mais gordura você Larmore entupiu artérias, que levaria a uma pressão arterial mais alta. Então, há algo que está acontecendo no mundo real, e há uma explicação lógica para isso. Uma explicação é uma parte muito importante da ciência de dados. Quando você vê seu relacionamento, você deve ser capaz de explicar por que isso está acontecendo, porque é quando podemos dizer se o relacionamento é incidental ou aconteceu por acaso que acontece. Existe algo assim. Para os atributos A e B, a relação pode ser como quando um ocorre ser também ocorre. Você tem dois atributos e ser assim sempre que uma abelha atual também concorda, Digamos, sempre que uma venda acontece, algo mais também acontece como quando uma vela de um celular acontece. Uma vela de uma capa de celular também aconteceu. Então as coisas que aconteceram juntas quando um porque B não ocorre não gostam da relação negativa . Quando você e ser seu tipo de exclusividade mútua mutuamente exclusiva é novamente uma espécie de relacionamento. O 3º 1 tem sido muito sobe, ser também sobe. Então isso é sob esse tipo de relacionamento e onde um aumento ser diminui. Então isso é como outra relação negativa. Então, quando você tem dois atributos os valores desses atributos, os valores que são vistos nesses atributos mostram qualquer fora desse tipo de relação. Nem todas as entidades exibirão relacionamento que será sempre algumas entidades onde você verá alguns relacionamentos alguém que é, não exibem qualquer relacionamento em tudo. Outro Golden Learning é procurar entidades que juntos exibem alguma forma de relacionamento em relacionamentos podem envolver vários atributos para gostar. Quando um está presente e ser aumenta ver vai diminuir de modo que várias atividades juntas podem exibir alguma forma de relacionamento. Então isso é uma espécie de visão geral. Relacionamentos fora da água são agora. Vamos ver quais são alguns dos exemplos fora para relacionamentos como qualquer um. Pegue um cliente como envelhecido sobe, capacidade de gasto sobe, então há um relacionamento. Ele envelhecerá na receita do cliente, então na idade sobe, capacidade de gasto sobe. Há uma explicação lógica de que à medida que a idade aumenta, possivelmente a pessoa está ganhando mais dinheiro para que a capacidade de gasto também seja alta. Agora, quando falamos de relacionamentos e ciência de dados, estes não são relacionamentos muito concretos. Você sabe, não é literalmente como um rapaz de fazenda que eles acontecem o tempo todo. Agora esse tipo de coisas, como 100% tipo de relacionamento é bom. Mas o que vemos aqui é geral, em geral, tipo de relacionamentos, como quando envelhecem por causa da capacidade de gasto. O Koza. Nem todos os clientes, nem todos os clientes de moldes vão enviar mais, mas a maioria deles, é disso que falamos como um relacionamento. O outro é o nosso pão. Os clientes compram mais largura de banda da Internet Existe uma relação entre a localização do cliente nos patches de largura de banda, mas um cliente novamente, possivelmente porque ele está fazendo mais navegação e você olha para o paciente novamente. Há muitos relacionamentos que você pode ver. Como todos os persas têm mais prevalência de diabetes. Existe a relação entre idade e nível de doença em todo o caminho. Os pacientes geralmente apresentam níveis de colesterol mais altos. Ou seja, a relação entre peso e cabeça. Na verdade, há razões científicas pelas quais essas coisas acontecem. Você levaria um carro. A relação entre o número de cilindros e a quilometragem que dá mais faz Linda, a menos que a quilometragem. Porque há mais queimaduras acontecendo quando há mais cilindros. Carros esportivos têm taxas de seguro mais altas agora. Este não é um relacionamento acelerado, mas você vai ver isso como um relacionamento de negócios como cartão de esportes. Sempre que os carros fora de um tipo de despeito um carro esportivo, é taxas de seguro são tipicamente mais altas. Portanto, há uma loção para entre o tipo de carro sobre as taxas de seguro, um pouco coisas sobre relacionamentos. Uma das coisas que você quer se preocupar é a relação Benussi entre dois atributos. A relação é consistente? São as relações incidentais também pode ser dito como padrões, padrões que você vê em padrões de dados de comportamento. Às vezes, o padrão de comportamento pode ser consistente porque acontece o tempo todo. Você pode repetidamente, quando isso acontece o tempo todo, você pode realmente prever esse comportamento no futuro. Mas como pode haver padrões incidentais, incidente esse relacionamento. Além disso, quando é por acaso, aconteceu por acaso. Isso pode não ser uma explicação lógica para um incidente de que o comportamento é um padrão de incidente . Portanto, sempre que você vê um relacionamento, é muito importante para você ter certeza de que o relacionamento é consistente. Era é incidental. Relacionamentos consistentes são o que você precisa para a ciência de dados. Relacionamentos também são chamados de correlações, ou seja, o termo técnico que você verá estão sendo usados. Correlação entre dois são entidades são dois atributos é quando com o que você vê como quando um sobe e ser sobe, Ele sobe. E Biscoe não Austin. Esse é o corpo chamado correlações de correlação. É esse o termo matemático que você fala quando fala de relacionamento? É e finalmente você poderia ser as pessoas falam sobre sinais e ruído quando se trata de ciência de dados sinais são nada além de padrões consistentes são consistentes. Relacionamentos que você vê em dados Narcisse. Padrões incidentais são relacionamentos incidentes. Você dia em dados. Então, se você tem ouvido sobre esses termos, sinal e barulho lá, nada sobre relacionamentos, relacionamentos que são significativos foram seus relacionamentos que aconteceram por acaso, que não são previsíveis, que são apenas incidentais. Então essa é a diferença. Mas sendo sinais e bom agora vem, o que significa aprender Nós levamos falar sobre aprendizagem de missão e este aprendizado e aquele aprendizado e todas as formas de aprendizagem. Então, o que exatamente está aprendendo? Aprendizagem implica aprender sobre relacionamentos. Essa é a coisa mais importante que você quer saber sobre dados que santos fazem. Seus santos têm aprendizado de missão. Aprender aqui significa que você está apenas tentando aprender sobre as relações entre esses atributos. É disso que se trata aprender. Envolve tomar um domínio como um negócio de dominó hospital perna permanecem. Não se preocupe em entender as entidades e os atributos que podem representar o domínio coletando dados sobre todos eles na compreensão das relações. Sendo esses atributos, essa compreensão das relações entre esses atributos é o que é aprender. Então os modelos são o resultado da aprendizagem. Então, o que você faz depois de aprender sobre algo é construir um modelo sobre isso agora? Este aprendizado quando você está falando aqui aprender acontece o tempo todo dentro do cérebro humano estava consistentemente coletando dados dentro de um ser humano cérebro humano, consistentemente continuamente aprendendo sobre as coisas e continuamente construindo modelos. Usamos estes modelos todo o avião sem sequer o nosso conhecimento. Subconscientemente, estamos continuamente aprendendo sobre as coisas sobre o que estamos falando aqui em termos de ciência de dados é apenas aprender este tipo fora transformado em um processo adequado sobre o aprendizado acontece fora do cérebro humano em missões. Isso é o que, como uma pequena diferença entre aprender que acontece dentro do cérebro humano, e aprender que acontece com missões é como um processo mais a esperar. Há mais dados fora dele, e há mais de um de fazê-lo. Então, o que é um moderno? Um modelo é uma representação simplificada e aproximada de um fenômeno do mundo real. Portanto, há um fenômeno muito bom. Estava acontecendo. E quando você faz um modelo você está tentando primeiro construir uma moral simplificada. Você não está tentando colocar muitas coisas no modelo. Você apenas tentando tomar as coisas mais importantes sobre o fenômeno do mundo real em então, construindo uma representação simplesmente luta na apresentação re aproximada fora do fenômeno do mundo real . Você pode realmente ir em conta modelos tão complexos como ele queria uma pessoa segurando, mas geralmente pin pessoas construir modelos. Eles queriam ser simplificados, por isso traz à tona todos os fatores importantes que você quer incomodar e ignora tudo que você não quer se preocupar. Então é um simples fato aproximado a apresentação de um fenômeno do mundo real. Ele captura os atributos chave, os atributos chave das entidades em suas relações em Vamos Digamos, um exemplo de um Modelo poderia ser um modelo matemático. Um modelo matemático é algo que representa as relações como uma equação. Então você pode escrever uma equação que presente relação entre os atributos como, por exemplo, você pode vir para cima. Mas este é um baile que recebi de algum lugar do mundo. Você é uma fazenda. Adoro como consegues fazer a mente. Pressão sanguínea. Isto é uma equação. Então, um registro de pressão negra de 56 mais a idade de uma pessoa no 560,8 mais o peso da opressão em 2,14 mais o nível de Israel de opressão em 2.9 Então o que você vê aqui é que você está tentando calcular a pressão arterial a partir de um atributo da pressão arterial três outros atributos H peso e LDL. Agora, esta é uma competição aproximada da pressão arterial. Nunca vai lhe dar o valor exato de uma altura, mas poderia ser. Pode ser aproximadamente próximo do valor do mundo real, então aqui está uma fórmula que apresenta um modelo matemático de como a pressão arterial pode ser relacionada com o dedo do pé. Três outros atributos. Peso, idade e níveis de Ellie. Isso poderia ser outro modelo, que é clicar em um modelo de árvore de decisão. É como um modelo lógico onde você faz uma série de perguntas sobre a série de perguntas que você faz. Você inclui perguntas sobre vários atributos e, base nisso, surge com um resultado como você quer ser, você quer ver. Você quer prever algo como comprar uma cidade de música e para esse pensamento que você pode chegar a um modelo de decisão como este se envelhecer os clientes. Legenda 25 sobre Gênero dos Clientes enviada por Beyonce Uma cidade chamada Sim, Então você costumava atribuir gênero e idade em com base neles, você está tentando prever com o resultado, que é com o cliente calendário por de Beyonce CDR. Não Este é outro tipo de mortais. Do Acura. Seus modelos dependem da força das relações entre os atributos. Às vezes, a relação entre os atributos são muito fortes, tal forma que você pode prever, como com 100% de garantia de que Ok, se eu ver isso. Tenho certeza de que esse será o resultado. Às vezes a precisão não é muito. Então, nesse caso, você pode querer combinar vários atributos NC se você pode aumentar o nível de precisão. Às vezes não há nenhuma relação, não é? Então pode ser em qualquer forma ou qualquer tipo de escala variável que você possa chegar lá. Mas modelo geral é um simplificado aproximado a apresentação de algo que está acontecendo no mundo real. 6. O que é uma ciência de dados parte: Uma vez que você tem um modelo, o que você pode fazer é previsão, um modelo possa ser usado para prever atributos desconhecidos. Exemplo simples. Este ano já vimos que existe uma fórmula. Pressão arterial igual a 56 mais agente 2,8 mais espera, 2,14 mais cedo, Linda apontou um +09 Então você tem aqui uma fórmula que se relaciona com atributos de pressão arterial, idade grande e LDL sabe o que isso significa é que se você sabe três fora deste para atributos, você pode prever o pé um, modo que é o que nos chamamos. Predição. Então, quando você sabão um computador, você pode dizer computação é que você pode dizer prever quando ele é uma computação, você está garantindo 100% de precisão que você sabe, esta é a fórmula quando você está pintando sua maioria aproximando. Então você tem quatro atributos três ou quatro atributos aqui. Se eu conheço qualquer um deles, eu posso realmente pegar este dedo de fórmula. Calcule o que for depois, mas eu quero Oh, se nós conhecermos três deles, eu posso prever o 4º 1 Isto é o que você chama de previsão. A previsão a partir de uma equação dupla de modelo pode ser considerada um algoritmo de previsão simples. Coisa simples na dilatação. Os saltos podem ser muito mais complexos, levando a modelos mais complexos e algoritmo de previsão. Então o que você vê em que as equações são muito simplesmente encontrar modelo de nós ou algo realmente simples como um problema fica mais complexo, cada um um um pouco mais tarde, mais complexo, aprendendo modelos mais complexos em mais complexos Algoritmo de predição. Então é sobre isso que temos aprendido tudo isso. Aprendizagem é tudo sobre dados, conjuntos, relacionamentos, modelagem e previsão. Então vamos falar sobre o que eu prevejo o nosso sobre o resultado. Então, quando você está sempre que estamos falando sobre nossos dados 100 eu sinto que você fala sobre preditores e resultados. Então, o que são eles? Os resultados são atributos que você deseja prever. Então, quaisquer atributos que você queira prever, eles são chamados de resultados, como na fórmula do ano anterior. Queremos prever a pressão arterial. Chama-se o resultado. Senadores são atributos que você deseja usar para prever o resultado, então você tem um conjunto de atributos. O que você quer prever? O resultado? Tudo o resto que você usa para prever o resultado, nossos preditores carro para que você possa ter 10 atributos em seus dados, disse que um deles pode ser o seu resultado, e três outros podem ser a sua prática. Nem todos os atributos têm relação com o resultado. Atribuir apenas aqueles que têm um bom relacionamento com o resultado. As variáveis obviamente se tornarão preditoras de modo que preditores e resultados e, obviamente preditores e resultados mostrarão alguma forma de relacionamento, porque isso é tudo que você pode prever resultados a partir deles preditores. Então, aprender é tudo sobre a construção de modelos que podem ser usados para prever resultados, que é a saída usando os preditores, que é a criança. Aqui estão alguns exemplos que vamos voltar para os mesmos três exemplos. No caso de um cliente, os preditores são idade, renda, faixa e localização em. O resultado pode ser O cliente vai comprar sua proteção ou não um paciente? As impressoras podem ser idade, pressão arterial e peso no órgão pode ser. É o paciente que morre? Mas eles não poderiam no exemplo de um carro pode ser como os preditores, talvez usar coisas como cilindro, número de cilindros e aceleração em. Você pode querer prever onde o carro vai estar. Um carro esportivo é um carro de família. Então, esses são o que você nos chama de preditores e resultados. Uma das coisas mais importantes que você quer saber é que os humanos eram submissões. Os seres humanos entendem as relações e prevêem o tempo todo que acontece no cérebro humano sem sequer uma semana, estamos conscientes, abortados. Continuamos coletando dados, mantemos, continuamos entendendo relacionamentos. Continuamos construindo modelos em nossas cabeças. Nós continuamos prevendo o tempo todo, sempre que você produz, você prevê. Ok, eu acho que isso vai acontecer. Significa que você está usando um modelo que você construiu dentro de sua cabeça para prever algo que você diz. Acho que pode acontecer. É modelo de uma semana. Digamos que estou 100% certo de que isso vai acontecer. É um ser moderno muito forte, mas humano só pode lidar com a quantidade de dados noturnos, certo? Mas, por exemplo, vou manter os lojistas. Você os viu. Eles sabem sobre o seu melhor cliente dos clientes de longa data. Eles sabem o que seus clientes gostam e o que os clientes querem. Andi, sempre que um cliente entra, geralmente se dirige a ele. Meu nome e o imediatamente saber o que esses clientes querem. Mesmo com o cliente pedindo isso, eles vão ficar grandes, morreram. Hum, e seriam eles. Mas o ser humano só pode lidar com preencher a quantidade de dados para que eles possam saber sobre as preferências de 100 clientes. Não a uns 10 milhões deles. O que acontece então? É quando máquinas são computadores que entram em jogo, certo? Queremos armazenar tudo isso geral em informações de clientes em computadores. Andi Deixe que os computadores aprendam sobre as preferências em ajudá-lo. As missões vêm para entrar em jogo quando o número de entidades sobre o tédio de dados é grande são enormes e seus rendimentos missão aprendizagem quando você 100 ou trabalhar com o dedo do pé do seu computador , coletar todos os dados, fazer tudo a aprendizagem, construir todos os modelos. Ondo. A previsão. É aí que se trata, torna-se aprendizagem de missão. É aí que ele se torna aprendizado de missão, análise preditiva e sinais de dados. Então, o que faz santos de dados, entidades , relacionamentos, modelagem e previsão. Então, o que são centavos de dados? É tudo sobre escolher um problema em um domínio especificado. Compreender o domínio do problema, as entidades e os atributos e o comportamento e os uniformes coletando conjuntos de dados que representam as entidades vamos coletar todos os dados que você precisa e, em seguida, você descobre relacionamento a partir do O Reiter. Isso é o que você chama de aprender quando computadores fazem isso. Chama-se Mission Dunning. Permissão. Aprender não é algo, embora o mundo não seja nada. É tudo a bordo de missões. Aprender sobre certas coisas estão descobrindo relacionamentos a partir da leitura oito como e, em seguida, construir modelos. A relação com o presidente. O mortal pode ser como um modelo matemático. Pode ser um modelo de árvore de decisão. Pode haver outros tipos de modelos complexos para, e o que fazemos em realmente construir modelos é usar dados passados quando você sabe sobre os protestos . Você conhece o carro, os resultados. Então você conhece os valores das crateras. Você conhece os valores dos resultados. Andam usando esses valores, estabeleça relacionamentos a partir dos relacionamentos que você constrói modelos. E uma vez que você construir um moderno, você pode então começar a prever Você pode começar a prever para os dados atuais ou futuros quando você conhece os protótipos. Mas você não sabe os resultados, então use o passado para aprender os modelos de construção, e então você prevê os futuros quando você não sabe sobre os resultados. Aqui está um exemplo do que o comprador do site faria no caso de sinais maiores. Isso não é um exemplo, o problema seria prever que o comprador vai comprar o seu smartphone sobre o que eles vão fazer sobre isso. Você tem todos os retratos do passado de todos os compradores, certo? Você coleta características do comprador como idade, um nível de renda de gênero. Você coleta informações sazonais quando eles fazem compras, como o tipo de coisas que eles compram durante o inverno era um verão. Foi no Dia das Bruxas? O que é uma onda de quarta-feira? Você coleta todos esses 11 dados que estão lá. Então você constrói modelos. Você constrói modelos que falam sobre relacionamentos, sobre o que sobe ou o que vem tom. Quando o cliente compra, o cliente não compra. Então você basicamente tentou deixar os outros atributos que você conhece para o resultado. Então você olha para todos os valores fora dos outros atributos quando os clientes estão comprando, O que isso valores dos atributos quando os clientes não estão comprando? Então você vê que uma dama o valor fora em uma idade tributo é maior que 25. O cliente compra o valor das idades que levam menos de 25 anos. O cliente não morde. Aí vem uma relação. Vamos tentar usar essa relação para construir um modelo e então você tenta prever, que é sempre que você vê um cliente com idade maior que 25 anos. Sim, esse cara vai comprar isso. Então você faz previsões. Então, quando um comprador nuclear de navegação previu, o comprador vai comprar, você usa o modelo e prever em tempo real. Mas o cliente vai comprar um produto ou não. Ok, o que eu vou fazer com a produção agora que você sabe que os clientes sabem que vão comprar não vão comprar é que você pode fazer algumas ações como você quer oferecer Childhelp nestes dias, sempre que você vai a qualquer site, Você vê que um pequeno pop-up aparece e diz: “ Você quer falar com seu agente vivo? Então agentes vivos são caros. Eles são seres humanos. Você paga muito dinheiro a eles, então você só quer oferecer ao vivo, idade e ajuda. Então os compradores que você acha que vão comprar seu produto para que você possa tomar uma decisão inteligente sobre qual comprador você deseja. Quero sair do agente vivo. Com base nessa previsão, este é um exemplo de como os sinais de dados funcionariam para você. Obrigado 7. Casos de uso de dados: Então, olá. Aqui é o seu instrutor Cameron. E nós vamos olhar para alguns dos casos de uso da ciência de dados. Eles não vêem como o mundo está se beneficiando da ciência posterior. O uso da ciência de dados está crescendo exponencialmente. Todos os dias têm crescido exponencialmente nos últimos anos. Eu estava me espalhando por vários domínios e, como sinais de negócios, são finanças e vida impessoal. Também em um recente avanço no poder de computação. Em termos de hardware, em termos, fora de software, muito fora abre ou até agora está vindo para o mundo como o todo são ecossistema de drogas em algoritmos preditivos. A combinação de tudo isso tornou muito econômico para você aplicar ciência de dados em uso comercial nos dias de hoje. Ok, vamos ver alguns dos exemplos de uso da ciência de dados. A primeira carta começa com finanças para finanças. Todos a bordo ganhando dinheiro economizando dinheiro. Então, redução de fraude. redução de fraudes de cartão de crédito é uma aplicação muito importante dos nossos dados. A ciência está sendo usada. Então, o que acontece na fraude de cartão de crédito é que a fraude de cartão de crédito exibem em matiz certos padrões em que eles acontecem sempre que você olha para transações que estão relacionadas à fraude de cartão de crédito . Eles exibem algum padrão, algum tipo fora de uma relação entre as várias entidades e seus atributos. E são esses padrões que são basicamente capturados no histórico mais tarde. Eles são usados para construir modelos fora férteis e transações. Assim, os dados históricos têm boas transações e transações de fraude, e lá, em seguida, usado para construir modelos de como uma transação fraudulenta vai se parecer. Então, sempre que uma nova seção de crime ocorre, essa transação é imediatamente elevada. Usando computadores, usando o modelo para descobrir o que ele nos chamou de fraude. Uma escola judicial de fraude basicamente lhe diz se a transação em particular é uma fraude, transação fraudulenta ou não. É uma escola, talvez a partir de 1 200 em diante, sempre que há causas pontuadas, especialmente limiar. É imediatamente sinalizado como um adereço. Possível transação fraudulenta É. Em seguida, algumas ações são tomadas como as chamadas estão sendo feitas para o proprietário do cartão de crédito como toe perguntando. Se não é fazer todas essas transações. Às vezes, o cartão de crédito é imediatamente bloqueado de outras transações até que eles façam a verificação. Portanto, há algumas ações tomadas como esta Até agora, a direção é uma aplicação muito importante para a ciência posterior no mundo financeiro. A segunda aplicação que você veria é sobre varejo, Então você verá que sempre que você vai a um site e fazer suas compras e colocar alguns itens em seu carrinho de compras imediatamente, você verá algumas recomendações chegando. Como no caso de uma Maison, você veria imediatamente uma recomendação como itens frequentemente reunidos. Como eles fazem essas recomendações é novamente? Itens exibem padrões sobre como sua aberração trouxe juntos, como telefones celulares e acessórios livros, alguns itens que são frequentemente comprados juntos. Eles exibem esses padrões de afinidade. Então, com base em que o projeto de lei, o que são chamados de afinidades curso entre os itens. Então, entre qualquer tentativa para cinco que é uma pontuação de afinidade atribuída. Quanto mais alto, definido é chamado, mais frequentemente esses itens foram reunidos. Então, o que acontece a seguir? Sempre que um fora aqueles que eu tentei comprar por um novo comprador imediatamente, itens com pontuações de alta afinidade para o pedido de item como eles são imediatamente recomendados. Então você usou o curso de vídeos para recomendar mais itens para o Sharper, com a idéia de que, se os compradores de energia compraram o dedo do pé juntos. Possivelmente é assim que a próxima loja. Mas também vai fazer e que o valor para fazer mais cross-selling e absolutamente centro de contato . Portanto, temos centros de contato, que têm sido tradicionalmente usados para atendimento ao cliente. O uso de contatos e não tem crescido hoje para domar ou vendas muito fora, mais vendas e suporte high-end, e eles também começaram a usar sinais de dados para melhorar seu desempenho. E como fizeram ou fizeram isso é isso Eles começaram a marcar cores. Quanto a menos agentes, então interações passadas são usadas para marcar cores estourar em seu valor em termos de quanto o valor do negócio era, ah, tipo guerra de cor. Eles são a quantidade de negócios que eles já fizeram com o com a empresa que eles estão usando. Isso se chamava “As cores”. Eles também desculpar traz curso para agentes com base na capacidade de vender órgãos altamente vendidos . Foi um agente de baixa venda ou agentes que são a capacidade de lidar com um tipo específico de problema , como agentes que podem lidar com problemas no produto específico são tipo específico de vamos e problema de rede foi é um problema de telefone que coisas como Então o que fez então é que eles estão tentando fazer as cores certas com o agente certo. Baseado neste curso na idéia é, uma vez que você pode estar certo, nos ligue com os agentes certos. Ele vai otimizar seus resultados de negócios e, em seguida, chamar gravações com tão carro. Você vê que sempre que você está falando com um contact center, eles sempre vão dizer que sua chamada pode ser gravada para fins de qualidade e o que eles fazem com essas gravações de chamadas é que eles vão jogar algoritmos de aprendizado de máquina nesses gravações para entender a qualidade da chamada no resultado e usá-las para aprimoramentos futuros . E, finalmente, olhamos para os cuidados de saúde agora prevendo que os operadores de doenças foram um amigo. O que aconteceu é que você pode prever surtos de doenças olhando para o que as pessoas estão pesquisando no Google e o que eles estão tweetando e twitter. Assim, o conjunto de dados deste coletor de domínios públicos, como pesquisadores do Google e feeds do Twitter e coisas assim nesses dados estão sempre vinculadas com as informações de localização. Então, sempre que você está pesquisando algo sobre, você sabe onde você está colocando algo. A localização de Mario fazendo isso é sempre coletada, e, em seguida, essa informação é coletada. Como o que você está colocando sobre nossa água que você está pesquisando no Google aerobarco junto com o dedo local, venha com Pat. E assim são as pessoas fazendo este tipo fora de consultas sobre uma doença específica de uma localidade específica . Esse item queria que quanto mais no momento em que você começa a ver alguns padrões fora do pé, as pessoas estão tweetando mais sobre um local específico da doença. Essa é a possibilidade de haver um surto que está a acontecer aí. Esse tipo de informação está sendo usada agora para começar a prever que são objetos. O que é bom em fazer previsões sobre surtos de doenças é que o governo pode criar de forma mais proativa. Você vê que isso está começando o dedo do pé ou quebrando uma localidade específica. O governo pode começar imediatamente a reunir seus recursos para começar a enviar alguns cuidados preventivos. Ou muitos enviam mais médicos. Coisas assim não pode organizar, como um par de dias de antecedência em evitar mais ou cinta que está acontecendo na mesma área. Então, não designar está ajudando a prevenir nosso, pelo menos, gerenciar esses surtos de doenças. Então estas são algumas das aplicações interessantes em cientistas de dados é como uma aplicação muito poucos popular. Isso é, de fato, muita coisa que está acontecendo lá em duh. Espero que consigam fazer mais leitura, indústria e todas elas. Ah, e em um futuro próximo, obrigado. 8. Ciclo de vida de dados de vida para a Ciência - configuração: Olá. Este é o seu instrutor comum aqui. Estou nesta seção. Vamos ver o que é um ciclo de vida de projetos de Sinais de Dados. Então vamos falar sobre projetos de ciência de dados quais são suas atividades, como elas são sequenciadas. Então vamos começar com algumas notas introdutórias. esforços de ciência de dados são tipicamente projetos ex Urano. Então, quando qualquer uma das muitas empresas são negócios quer fazer qualquer coisa além de sinais de dados, eles normalmente criam projetos como as pessoas querem construir software. Eles criam projetos de software em para o projeto. Eles estabelecem um objetivo, um pouco de ouro e depois vão executá-los. Semelhante a isso, eles tinham outros sinais. Os esforços também são executados como projetos. Então, uma coisa a observar aqui é que o projeto de ciência de dados deve ser considerado como projetos de pesquisa . Eles não são como construir projetos operados, eles não são. Eles não têm coisas realmente certa pedra que você pode simplesmente ir e executar e ficar longe dele. Estes são projectos de investigação. Há muito fora de pensar envolvido. Havia um monte fora retrabalho bordo e até que você alcançar o objetivo para que eles devem ser considerados como projetos de pesquisa, não como construir software e operar tipo de projetos. Os projetos estão começando inundar como qualquer outro projeto que eles fazem sobre os projetos. Tem rostos e atividades na transição acontece entre rostos e atividades, e enviou projetos envolvem um monte de ida e volta entre os rostos. Então é a estrela da manhã, como realmente um modelo de cachoeira. É mais como um modelo iterativo se você quiser associar isso a algo relacionado ao desenvolvimento de software. Então, nesta seção, vamos falar sobre o que dados santos, rostos de projetos e atividades são. Qual é a importância de cada uma dessas atividades sobre como sua transição tipo de uma para outra, e também algumas das melhores práticas? Vamos falar sobre eles? Então, aqui está uma visão geral do leitor. Projetos científicos e atividades que você verá, existem, como categorias ou estágios completos, amplos no leitor. Desde o projeto que é o conjunto de fase em, há a engenharia de dados enfrentar a face de análise na fase de produção na fase central , você apenas preparar a equipe com o que eles têm que fazer. A lesão de dados por anos é tudo sobre a obtenção de dados e treinamento de dados sobre como trabalhar com dados do bom caminho. Barra de forma. Você pode fazer o terceiro estágio, que é o estágio analítico. Então Alex é tudo sobre explorar os dados e obter alguma informação significativa ou o Fed . Então, é tudo sobre aprender e prever em Uma vez que você faz a cara de análise e vem com algum tipo de recomendações, você pode então ir para o estágio de produção onde eu realmente construir alguns produtos de dados que, em seguida, fazer tudo o que você apenas fez de uma forma automatizada e de uma forma repetível em continua produzindo resultados que você deseja. Eu só vou para a primeira face de atividade, que é o conjunto de fase. A primeira coisa que você quer ir em qualquer projeto de inocência é o que você chama de definição de metas para o Projeto Inocência. Todos os dias, o projeto de essência terá e deve ter um ouro. Se alguém quiser. Que projeto dúzias, que é como, Ok, vamos olhar para os dados e ver o que você pode obter com isso. Esse projeto está condenado ao fracasso. O Projeto de Ciência de Dados deve ter um ouro específico que eu faço para a equipe ir atrás. Assim, o esforço da equipe será focado em alcançar esse objetivo, e as atividades também serão baseadas no que você quer alcançar tão espaço. Mas há que projetos sem metas são motoristas, nossos carros sem motorista. Então, se alguém causar que venha e diga isso, vamos fazer o que tem sido desde trágico. Basta olhar para os dados e ver o que podemos descobrir. Esse projeto não vai a lugar nenhum. Então essa tem sido a experiência de muitas, muitas pessoas que tentam fazer. Eles não projetam alguns exemplos de ouro definindo nossa perna. Não há previsão de quais clientes irão gerar nos próximos três meses. Esse é um grupo objetivo que trata que estamos recebendo sobre nossa empresa e, em seguida, agrupá-los com base no sentimento fora dos tweets são identificar pacientes que têm a possibilidade de ter um ataque cardíaco nos próximos três meses. Então você vai prever os clientes, Joan, você vai prever o sentimento dos tweets? Vai prever pacientes que vão ter ataques cardíacos? As meninas podem ser qualquer coisa assim, mas o mais importante é ter um objetivo bem definido antes de começar o seu projeto. A segunda coisa muito importante na qual você deseja se concentrar é entender o domínio do problema . Ao contrário de projetos de software, mesmo em projetos de software, eu diria que entender o domínio de negócios é um zoológico. Uma coisa boa no caso sobre o projeto de ciência de dados, é necessário que todos os membros da equipe para ter alguma compreensão básica sobre o que o problema de negócios restante é tudo sobre. Então, quando dizemos que precisamos, estávamos falando sobre um problema chegando. Estamos falando sobre o básico de negócios como se você estivesse na sensação financeira do Sierra ou do campo médico, entenda alguns conceitos básicos sobre o negócio, sabe? O que é esse negócio? Como é que esse negócio ganha dinheiro? Um dos processos de negócios envolvidos em quais são o fluxo de trabalho em algumas das principais métricas de desempenho nos negócios? E isso é muito mesmo em uma equipe de ciência de dados maiores. Há sempre alguém chamado de nós não se importa de exportação. Eu não me importo. Exportação é muito crítica A minha experiência é uma parte crítica de uma equipe de ciência de dados, então grandes equipes tipicamente podem ter um especialista em domínio que pode não ser um cara técnico não é um sentar estático como cara, não um cara de programação, é apenas alguém que conhece o negócio. Mantenha-o na equipa para te ajudar a compreender o problema. Submissões de domínio? Não, isto é uma coisa importante. Missões apenas números nobres e cordas. Eles só fazem lixo no lixo. Eles precisam de humanos para associar qualquer significado a esses números e força. A missão Não missões não entendem negócios. Os seres humanos entendem os negócios na ciência de dados. É importante para você entender e validar qualquer coisa que lá vai vir acima com e que só pode ser feito por humanos e para os seres humanos para fazer isso, eles precisam de compreensão do problema. Conhecimento do domínio ajuda as equipes a entender as entidades envolvidas o relacionamento, os padrões, qualquer tipo de descoberta de conhecimento que você precisa para validá-los. E a violação só pode ser feita se você souber que o problema não se importa é sobre um adulto. Nesta compreensão do problema, domínio ajuda você a validar todas as suposições. Mais importante ainda, você identifica o erro Então os dados têm alguns assuntos. Como você sabe? E se, por exemplo, você está olhando para um dia Dan, e digamos que a idade da pessoa aparece 600 anos. No momento em que você olha para ele, você sabe que estendido não é o número errado porque não há ninguém que tem 600 anos de idade. Mas você só pode fazer isso porque você sabe, a idade do domínio é um termo muito comumente usado. Todos entendem do que se trata. O que? Que tal algo como o nível de colesterol? Como você sabe o que é um nível de colesterol válido? O que não é um questionável válido? Se alguém tem um ilegal fora 1000 é possível? É um número normal para o número alto não é um número convidado? Você só pode dizer se você conhece o domínio, e é por isso que especialista em domínio é necessário para você depois de entender o domínio. A próxima fase é compreender os dados associados aos dados. Já vimos o suficiente sobre os dados e algumas das outras seções. Então, aqui, volta a ele, os processos de negócios em fluxos de livros geram dados. Muitos dados, alguns capturados, outros não capturados. Mas onde quer que os dados sejam capturados, há várias coisas como os dados do aplicativo 100 que você faz em vários aplicativos de entrada que são relatórios Existem visualizações. Há dados automatizados vindo de Desde nossos feeds de dados, há cliques da Web que você obtém em um navegador. Cada clique é também um dos pés de dados que o nosso ponto de venda transação que foram gravados e há redes sociais nossos feeds de dados. Além disso, todos esses são dados de negócios que estão sendo gerados através de várias fontes. Eles foram armazenados em vários sistemas. Alguns estão na rede cooperativa. Summer on se desenvolve. Há dados em todos os lugares que você pode querer usar. Os dados, é claro, podem ser estruturados, não estruturados ou semiestruturados. Isto novamente, nós vimos isso antes em dados têm origens diferentes. Existem tipos de violoncelos diferentes E eles podem ter um monte de relacionamentos lógicos, relacionamentos, é claro, é claro, ou a chave para qualquer tipo de compreensão de gerenciamento de lanchonete, dados Compreender quais dados você tem é um coisa muito importante para um cientistas de dados. O que é isso que você quer? Entende sobre os dados? Você não entenderá a fonte dos dados. Como o rótulo é o dado é ele está na máquina gerada ou ele é inserido pelos humanos ? Seres humanos Isso é uma possibilidade de alguém? - Homem? Carregar a entrada de dados é colocar em desenhar dados e ficar longe dele porque nosso quão bom os dados que você vai usar para sua análise é o que está indo para a mina, quão boas suas previsões vão ser. Assim, os dados tem que ser válido seu para se certificar de que esses dados não é homem operado por alguém. Por alguns outros motivos, você precisa entender que tipo de etapas de processamento e transformação são executadas nos dados. Amore supostamente tem alguns dados que foram descartados por alguém durante a passagem porque eles pensaram que não é importante como alguns dados duplicados fazendo seu ser para o processamento. Você está perdendo alguns dados porque está fazendo algum resumo ou não? Todas essas coisas que você precisa entender sobre a antiga Lolita como os líderes em relação a outros bancos de dados empresariais de estudantes nublam Neuf esses feeds como os dados são sincronizados entre essas diferentes fontes de dados. Você sabe, quando alguém e como dados no lugar um dia também pode estar indo no lugar ser então o que? Eles estão realmente sincronizados entre si. Qual é a relação que existe dentro dos dados. Eu sei. Vamos ver que tipo de coisas? Como a relação de chave estrangeira entre os dados, o i d aqui deve coincidir com o I d lá e coisas assim. Ordenar fora criação quando é ordenar, você sabe, usar como o primeiro ordenar algo como, Ok, no agente primeiro vai e digite algo no sistema pode. Então ele vai, e as crianças estão de acordo com o sistema ser. Então ele faz algo insistente. Steve, é aqui que a compreensão do seu processo de negócios ajuda você a entender como os dados estão sendo criados em que ordem estão sendo criados. Também na compreensão dos dados ajuda a equipe a identificar possíveis fontes fora de seus padrões preditivos . E onde você está recebendo esses padrões do Rio sempre violar sempre que você vê uma parte sobre se há ou não válido. Portanto, é importante para você entender como o dia sai e como ele foi criado. Entenda seus próprios padrões. Às vezes, os padrões podem ser criados por causa do edifício. Também foi criado. Então coisas que são realmente complexas neste ponto para explicar. Mas uma compreensão dos dados em geral é uma coisa boa a ter para um cientista de dados 9. Ciclo de vida de dados de vida para ciência de: A próxima fase sobre a qual vamos falar é a face duradoura de dados onde você configura configuração e a engenharia de dados feitos sempre. É todo o trabalho sujo que você tem que fazer para obter os dados de vários hoje para a forma que queríamos ser. Então há lá fora por todo o lado. Terapia não controlada. Tens de juntar esses dados. Recomponha-se, reúna todos os dados, bata neles, coloque-os todos em um único destino lógico e agradável, onde você pode fazer qualquer análise posterior. A primeira etapa na engenharia de dados é a aquisição de dados. Então, onde seu trabalho é adquirir filha de diferentes fontes de dados que eles podem ser base de dados corporativos, como talvez sentar em um banco de dados de artigos em meus bancos de dados de sequela, agora pode ter que ser feito através de pilares nublados. Há muitas obrigações na nuvem. Eles dão a você um P. A está na nuvem como a equipe de vendas, por exemplo, você tem que ir e obter dados através do AP. Olhos lidos. Eu posso estar vindo a um scanner alimenta-se de sensores como scanners de código de barras. Ele pode estar vindo através de mídias sociais, você pode ter um download. Mídias sociais como Twitter e Facebook. Todos eles são fontes de dados. Cada um deles apresenta um tipo diferente de caso de uso em um tipo diferente de desafio para você . Às vezes, os ajustes de dados também podem estar chegando em tempo real. Pode estar vindo em massa. Pode estar vindo, introvertido. Um dado também. Então tudo isso cria problemas diferentes para você. Uma das coisas mais importantes sobre a aquisição de dados é a sanidade. Verifique a verificação, certificando-se de que você tem todos os dados que você precisa. E não há dados perdidos na camada de transporte. Eso, o curtume. A verificação de testes é uma parte importante da aquisição de dados. É um passo muito pesado e demorado para definir por que é pesado. Um demorado para configurar em não dizer toe adquirido para configurar é porque quando você tem todas essas fontes de dados, o que vem, mas isso é coisas como segurança. Há pessoas que possuem esses bancos de dados. Há políticas de segurança envolvidas. Há políticas de partilha envolvidas. Então você vai passar um monte de tempo estabelecendo conexões com as missões envolvidas nos seres humanos que controlam as missões sobre isso pode ser realmente tempo primeiro frustrante. Porque eu acho que os cientistas de dados, se você é realmente perto, certo, maior que nós gostamos do céu. Se você já é o Departamento de Indiciados na porta. Também é do departamento 90. Possivelmente Você não tem um monte de problemas, mas você não está no departamento de energia, você ou talvez um concerto e você está em um departamento diferente em seus dados está sentado lá e base de dados corporativos. Está sentado na nuvem. Em seguida, torna-se ainda mais complicado conversa para todas as pessoas em Wall explicou a eles por que os dados que você precisa, o que você precisa dos dados e que guerra ex-editores e obtê-los para compartilhar os dados sobre passar por todos os porcaria organizacional vai ser muito tempo e esforço envolvidos . Então este é um muito pesado, frustrante Este é o dia em que eles trabalharam para fazer a limpeza de dados. Uma vez que você obtém os dados, você teve que limpá-los. Por que você tem o limpador? Porque os dados têm diferentes graus de limpeza e integridade. Nem todos os dados que você vai obter são dados de estrutura limpos e completos de aplicativos corporativos como, você sabe, sentar no banco de dados são realmente limpos e completos, então você não tem muito sobre isso . Este já limpo, já completo já no primeiro. Você quer que eles sejam? Sem problemas, mas dados que você está obtendo da Internet a partir de mídias sociais da Transcrição de Voz , todos eles podem precisar de limpeza significativa. Você sabe, há sujo incompleto em todos os tipos de múltiplos formatos em Digamos, se você olhar para qualquer um dos feeds do Twitter, você sabe, eles não são frases completas, eles não são frases completas, que muitas abreviaturas e Parkins de coisas Junkin sentado lá, todos precisam ser limpos, examinados e dados perdidos. Esse é outro ponto importante. E quanto aos dados perdidos? Você pode estar faltando atributos com certeza. Collins são uma espécie de valores talvez ausentes para certos atributos. Como vai lidar com eles? Vai dar-lhes um valor? Porque se você colocar algo como um principal lá, por exemplo, seu algoritmo de aprendizagem de missão não entende nenhum vai pensar que detentos sob esse valor se você colocar zero como um valor para algum número. O teu jardim ia aguentar. Ok, zero é algum valor. Como é que te diz? Mission Learning algoritmo zero significa e não disponível Outro onde diz que tem algum valor. Não é uma coisa fácil de se fazer. Muitas vezes você tem que colocar um substituto e antes que eles morram lá e eles fizeram afetar seus algoritmos de aprendizagem missão. Portanto, a falta de tratamento de dados é uma decisão muito importante a tomar aqui. Exemplo de limpeza são como se você estivesse normalizando formatos de data ali mesmo. Às vezes percebem um imã dd dd mm Óleo sobre mm realmente sabe todos os tipos de ex-. Você quer uma facilidade normal e padroniza-los até 14 meses antes de poder começar a usá-los padronizando em casas decimais. Às vezes, os dados estão chegando em 1.23 Às vezes, ele é usado indo para usar o formato exponencial para um número. E tudo o que precisa ser estratégia é mais uma vez sob o clássico. Um é o sobrenome. Primeiro nome era o primeiro sobrenome. Como um nome representado nos dados. Então você está ficando sabendo quais fazendeiros eles são. Todos eles precisam ser padronizados. Há uma parte do processo de limpeza. Mais importante ainda, se você está recebendo como feeds de texto de algum lugar, você tem que fazer um monte de limpeza para o texto que é uma desminagem inteira em si. O que você faz com a limpeza de texto? Isso é tudo o que o trabalho precisa ser feito antes que você possa começar a usar os dados para qualquer outra análise. Os dados de transformação de dados após uma limpeza podem ter que ser grampos no dedo do pé. Um antigo diferente tem uma forma diferente antes de começar a usá-lo. Portanto, a razão para a transformação de dados é extraído informações dos dados enquanto descarta bagagem desnecessária. O que faz bagagem desnecessária é contra a mente pela garota com o que você está pesquisando os dados. Então, se você não precisa de alguns dados, não precisamos de alguns níveis de detalhes. Você pode resumi-los e descobrir toda a bagagem desnecessária que é o processamento e resumo de Moore típico auxiliado . Você tenta verão atividades lógicas associadas. Níveis de transformações ajudam a reduzir o dia. Há sinais em muitos labirintos para a ideia de processamento usado. Por que você quer Oh, então alguma transformação é que você quer com esses dados em uma forma que você quer saber pode entender melhor, como você pode recolher um número fora do curso em um registros lógicos que representam o tudo o que aconteceu a partir de exemplos que você pode querer ver aqui é que o visitante vem a um site e ele clica em um número fora das páginas do site. Você pode pensar que alguém é todos eles em um único disco. Mas se esse é todo o nível de que você precisa, você pode querer fazer algumas traduções linguísticas entre vários idiomas. Se há um sensor médico que está vindo, digamos que há um sensor que está captando sua pressão arterial a cada segundo e enviando você e leitura da pressão arterial. Talvez queira resumi-lo por intervalo. Você pode tomar um intervalo de 30 minutos e, em seguida, resumos e dizer neste intervalo de 30 minutos, qual é o máximo de negociação? Qual é a classificação mínima? Qual é a média de ler coisas assim e resumi-lo. Além disso, posso depender de alguém seu caso de uso, que tipo de transformação você quer fazer e resumi-lo. Neste caso, resumos Após a transformação vem dados e Dishman. Embellishment é sobre adicionar alguns atributos adicionais mais tarde que melhora a qualidade da informação. Você quer adicionar mais algumas informações aos seus dados que podem tornar sua análise muito melhor. Então, que tipo de informação você pode adicionar? Ah, por exemplo, você pode obter informações, as informações demográficas de um banco de dados de clientes para um registro de transação de ponto de venda . Então, o registro de transação do ponto de venda terá o nome do cliente, o número do cartão de crédito e os produtos que ele trouxe. Agora você pode obter os clientes informações demográficas de 1/3 partido que eu ser como um desses clientes ajuda, você sabe, estado civil, educação, educação, níveis de renda. E você pode anexar isso a esses dados. Uma vez que você disse que para os dados do que o que ele pode fazer é fazer alguma análise sobre quais produtos as pessoas compram como as pessoas. Digamos que leite, que compra leite outras pessoas que são homens ou mulheres são as pessoas com mais de 20 justo abaixo 25. Você pode fazer todo esse tipo de análise assim que puder. Dados intermináveis para a nossa tradição. Informação. Coisas como você não pode agrupamentos lógicos de pacientes pelo histórico médico passado, como você pode anexar o histórico médico passado de um paciente à sua visita atual. Então você pode olhar e ver, você sabe como as pessoas lutam com histórico médico passado. Diferentes tipos de história médica, executar, são, estão andando fora das coisas que você faz para eles. Portanto, incentivar os dados é um passo muito importante. Adicionar mais dados, dados mais significativos dá a você melhores insights sobre quais dados você tem lá. E uma vez que você terminar com todos eles, você está indo para o pé. Persistir seus dados, mas você salva seus dados em alguma necessidade. Um processo de moda sensato. Os dados são armazenados em uma sincronização de dados confiável e recuperável. Então você quer processar toda a sua filha e colocá-los em um bom relabeled dados recuperáveis . Sincronize em todas as informações do fígado capturadas em um único registro de olhar, tanto quanto possível. Você tem dados provenientes de várias fontes diferentes. A melhor coisa para você fazer é se você pode obter todos os organistas como registro lógico como um único registro longo que contém todas as informações que você precisa. Você não deveria estar fazendo muitas coisas fora de chave estrangeira. Você prefere querer normalizá-los e colocá-los todos no mesmo disco e colocá-los todos juntos. Portanto, mais questionamentos e análises são muito fáceis para você. Um exemplo, seria como uma pequena transação de almas. Você pode pegar os dados do ponto de venda. São as informações demográficas do cliente para ele sobre as características do item para ele, como você tem o item que é comprado, você pode dizer tipo de item. É diário em um trabalho, atualizado Faz coisas assim e você também pode adicionar, como vendas associar informações de desempenho a ele para que você possa ser então uma nova análise um desempenho de Sales Associates com base no produto que está sendo vendido baseado na demografia dos clientes e coisas assim. Então você pode querer colocar todos eles juntos em um único disco reto e armazená-los. Esse é o passo que chamou a persistência de dados e, finalmente, estão escalando o desempenho da consulta são fatores muito importantes. Claro que sim. Há bom no reboque. O domínio da arquitetura de dados onde os Data Architects estão. O trabalho é para os arquitetos. Trabalho é projetar seus dados, cantar de tal forma que ele pode conter todos os dados que você tem e tem uma escala razoável . Seu desempenho tem boa qualidade e tudo isso para ajudá-lo na próxima etapa, que é os dados passos analíticos, é claro, você pode armazená-los como arquivos simples, bancos de dados SQL tradicionais. E então, é claro, hoje você tem todas as tecnologias de big data como Hadoop on Hard Open seus bancos de dados, como base de hedge que você deseja armazenar seus dados. Então isso completa a segunda face de um projeto de ciência de dados. 10. Ciclo de vida de dados de vida - análise e produção: Olá. Este é o seu instrutor Cameron aqui está continuando no ciclo de vida da ciência de dados. Essa fase de pensamento é uma narcóticos onde você está tentando aprender com os dados e fazer suas previsões. O primeiro passo na análise é o que é chamado de explorar três análise de dados R E d A. Em forma de tiro. Uma forma curta muito famosa em ciência de dados. O que você vai fazer quando o E.A. E.A. estiver? Você deseja entender os padrões de atributos individuais que você toma uma idade como atributos . Você não vai entender coisas como o intervalo de valores mínimos, valores máximos, a distribuição de frequência, eu, coisas assim. A próxima coisa que você queria um era entender a relação entre os atributos como o que faz a relação entre idade e você está comprando relação padrão entre renda na da gênero, coisas assim. Como uma mudança em uma afeta a outra? Em outras palavras, você está se transformando em relacionamentos nessa cara que está tentando fazer. Alguns gráficos estão tentando fazer alguma análise e entender mais sobre o que você vê nos dados. Então você faz. O raciocínio é explicável? Quaisquer relações acima em padrões que você está vendo nos dados, há uma explicação para por que ele é para que ele não. Se você não encontrar uma explicação do que possivelmente, há uma possibilidade. Muitas vezes melhor. Ou talvez seja um novo padrão. Isso é algo que você quer discutir e depois descobrir que você é. Olhe para os nossos jogadores e, em seguida, decidir o que você quer ir com eles que você quer, se incluí-los ou excluir, hum, são depende de osso. O Outlier Valley West. E é um caso de uso a base de caso de uso. Você decide sobre o que você quer fazer sem jogadores. Possíveis erros no processamento que você só pode encontrar, mas explorou e escuta. Esse é um bom uso fora do processo. Vamos dar um exemplo novamente em espera fora do paciente. Acabamos de discutir alguns escravos. No momento em que você vê oito off como 600 você imediatamente sabe que há algo errado com isso. Existe um possível erro. Foi também o que você chama jogadores supor que há um par de pacientes que são um 70 75 anos de idade. Todo mundo é como 40 lição para 40 anos de idade que talvez você queira decidir e eliminar esses dois discos sem jogadores. Esse é um possível processamento do nosso cliente. Você quer ir em você? Claro que você quer entender a relação entre o paciente Espere e no nível de diabetes , o nível de colesterol na história familiar e coisas assim. E, finalmente, você viola suas descobertas com os especialistas do domínio quando diz, ei, isso é o que estou vendo nos dados. Será que gel com o que você já sabe sobre algo novo, você quer falar com eles e entender como as coisas são. O próximo passo é a análise inferencial. O que você faz na análise inferencial é procurar sinais. Sabe, você procura padrões, procura consistência nas costas e procura correlações. Você procura raciocínio. Isto é uma espécie de sobreposição com explorar um tratado abaixo. A menos que seja, isso é mais profundo e mais focado e mais metódico que você faz aqui em francês em análise, então você verifica e vê se os padrões são consistentes e reproduzíveis. O que você quer dizer com consistente é que você vê a mesma parte mês após mês após mês? Você vê que isso é um À medida que a taxa aumenta, você vê que os níveis de colesterol aumentam isso acontece para seus pacientes? Todo mês, todo mês, você recebe um novo conjunto de pacientes e você continua vendo o mesmo padrão. Você vê o mesmo padrão? Vamos ver cidades de países em diferentes raças, tudo isso como parte da análise inferencial. E então você faz algum teste estatístico para ver que as descobertas que você vê com os dados dizem que você tem. Isso pode ser extrapolado para a população da Índia como você tem dados de San Francisco pode o mesmo, e isso é ser com resultados, ser o mesmo se você extrapolar para que eles e seus nós fora do mundo inteiro são eles Vai ser diferente? É tudo o que você faz como parte de uma análise de violação de novo. E vamos dar um exemplo de paciente. Espere, foi a diabetes. Você faz tudo isso em francês Em análise como se você pudesse pegar dados rápidos de um estado que Califórnia faz a análise e então ver como a Califórnia se compara com Nova York nos padrões de ver R Calif. São o então você olha para fora raças. Olhe para Asiáticos Americanos para Asiáticos Americanos na Califórnia mostraram o mesmo padrão de localização Americanos em Nova York. Nossa doação americana mostrou o mesmo padrão que afro-americanos. Pior são as outras pessoas. Então você faz todo esse tipo de segmentação e então você faz todos esses perfis durante a análise inferencial em você sair e valorizar todas as suas descobertas durante este processo ? Uma vez que você sabe, análise inferencial os próximos estágios modelagem. Este é o lugar onde toda a sua missão de aprendizagem todos os guardas vem pontapé em jogo é você está jogando imersão precoce aprendendo todos os jardins para construir modelos sobre o que você faz na construção de modelos é o seu tipicamente tentou construir vários modelos usando diferentes algoritmos em conjuntos de dados diferentes. Estas são todas as técnicas que estão lá e aprendizagem de missão. Existem algumas técnicas sobre como você pode segmentar seus conjuntos de dados e a substância múltipla e, em seguida, usá-los para construir modelos e modelos de teste. Então, como diferentes algoritmos podem ser usados nisso é todo o domínio fora do aprendizado de missão é tudo sobre. Se você fizer um curso de aprendizagem missionária, foi apenas uma linha que explodiu por todo o curso. Você, é claro, tem que testar seus modelos eram um louco novamente. Seus métodos de como você faz isso em aprendizado de máquina. Finalmente, eu sou. Se eu seus modelos de melhor desempenho quando dizemos melhor desempenho, falamos sobre precisão. Falamos sobre o tempo de resposta e os recursos utilizados, então você tem que fazer novamente algumas compensações. No entanto, quanto ao que é o seu modelo de melhor desempenho, vamos dizer um modelo contra você. 80% de precisão leva um minuto de corrida. Esse é outro modelo que lhe dá 85% de precisão, mas leva uma hora torrent. Então, qual deles é mais importante para você? Os mais pendurados para os 85 ou 80? Estranho. Tudo bem para você ter uma precisão de 80% mas ter um tempo de resposta razoável? Então ouvimos falar sobre isso. Veja todas essas três coisas, como a precisão, o tempo de resposta e os recursos usados. O poder de computação que é necessário. Um edifício modelos Andi. Então, para dizer, o que vai ser o seu melhor modelo de modo que o modelo que você constrói no final poderia ser tão simples quanto uma árvore de decisão ou equação. Pode ser solicitado complexos. A rede neural para depende do problema e dos dados em questão. Então, mas no final do processo, você tem um modelo que você seleciona com base nos diferentes algoritmos e nos diferentes testes que você conhece affray, 1.000.000.000 modelos. Então você vai fazer todas as suas produções usando novos dados novamente que adverso tem você pode testar a previsão, testar seus modelos novamente, uma parte dos cursos de aprendizagem de missão que você verá. Você tem que continuar validando a precisão do seu modelo. Então você apenas se juntar a construir um modelo testado uma vez e ficar longe dele. Mas você vai tentar. Befriend modelos são, por vezes, mesmo combinação de diferentes modelos e, em seguida, ver qual deles lhe dá a melhor precisão possível. Você vai tentar que meu povo seja pneus e variações neste processo de julgamento . Maris novamente o melhor momento que você pode usar o seu Há muito disso é por isso que eu chamo de projeto de pesquisa. No início, você vai fazer um monte de bandeja de anos de pesquisa de diferentes coisas e ver qual deles funciona melhor para o seu projeto específico, um tempo de resposta, pesquisa de recursos, todos os mecânica, especialmente quando você tem que fazer previsões em tempo real como uma pesquisa na Web. Sharper acaba de entrar em seu site e está navegando através de seu site fazendo cliques, e você quer uma previsão em tempo real. Mas os compradores vão comprar não. Essas decisões foram tomadas como em tempo real, você sabe, em um segundo com o mínimo de resultados possível. Então você é uma escolha seus algoritmos. Com base nisso, você quer continuar medindo melhorias. Então, como você continuar trabalhando ou diferentes combinações fora da produção de guardiões de governos tradicionais têm duas partes. Uma é a parte de construção do modelo, e a segunda é a parte de previsão. Então você tem que olhar para ambos e ver se há melhor em ambos. Às vezes, alguma produção de droga leva mais e o modelo de construção, mas eles podem ser muito rápido fazendo as peças de produção fora de coisas diferentes lá. Então, novamente, você tem que continuar medindo todos os seus algoritmos como eles funcionam, e então eles continuam comparando-os e então ver qual deles é o melhor que você quer escolher . Você pode até ter simulações. A assimilação pode ser tão simples quanto simulações matemáticas, ou você pode construir um software que pode similar determinados casos de uso. Assimilação é usado para validar se a água suprimir seu jardim estava dizendo que nesta dada situação este poderia ser o resultado. Então unidade é semelhante lá que pode, mesma forma, esse ambiente. Ele pode ser semelhante ao que o NDP está fazendo em seu ambiente e, em seguida, ver se o resultado que você está prevendo é o que você vai obter. Então simulações são uma peça complexa de software. Às vezes as pessoas não as constroem para validar as previsões. Depois de fazer todos esses modelos de construção na produção, o último passo que você faz neste caso veio com um conjunto de recomendações. O que você faz aqui? É que no final deste projeto, uma recomendação precisa ser fornecida aos proprietários do projeto Ok, sobre o que você fez, quais são os algoritmos a serem usados e onde estão os benefícios esperados? Então todos eles, se você colocar juntos em uma agradável apresentação e apresentar seu dedo do pé os proprietários de produtos e aqui vem para pegar outro projeto científico feito não tem recomendações para torná-lo os dados que não exibem qualquer padrões explicáveis. Nós temos falado sobre a essência de tudo ser sobre aprender com relacionamentos. Se os dados que você tem não exibem qualquer padrão, qualquer padrão entre o resultado em qualquer outra variável. Se o resultado não é previsível a partir dos dados que você tem, não há nada que você possa prever Desai. Simples assim. Isso não significa que os dados desde o projeto é um fracasso. Você pode ter um produto com calafrios. Vamos olhar para o nosso banco de dados de clientes e ver se podemos prever a rotatividade de clientes no final do projeto. Nós para que você possa vir acima e dizer, Com base nos dados que temos, não podemos prever o cliente Chung que isso não significa que o projeto Essence é um fracasso . O projeto de neurociência só funcionará se os dados tiverem encargos, por isso não é padrão fora dos dados. Cientistas, se seus dados não têm culpa, são quaisquer padrões, claro, é o pai de dados Cientista é os dados tem padrões e o cientista de dados não consegue encontrá-los . Mas os dados não têm nenhum padrão. Não é culpa dos cientistas de dados, então esta é outra coisa importante a notar. Às vezes são descobertos padrões inesperados que levaram a outros benefícios, então você pode estar olhando para o Dodi com um objetivo especial em mente. Como se estivesses a olhar para a rotatividade do cliente de crédito. Mas você pode ver isso. Ok, eu vejo alguns padrões bonitos. Esses padrões podem ser usados para prever outra coisa. Como você pode estar usando esses dados para prever transtornos, por exemplo. Então, um projeto de ciência de dados pode fazer com que este site tire um benefício paralelo. Então você pode dizer, OK, eu vejo este belo padrão aqui. Talvez tenhamos que cavar mais fundo. Então você vai criar outro dia, dezenas de projetos para isso, e depois continuar por aquelas partes fora da porta. Um projeto de ciência também surgiria com esses locais de benefícios. Na verdade, muitos deles podem surgir durante o processo uma vez que você começa a olhar para os dados. E, claro, você finalmente faz uma apresentação sobre as recomendações. Disse às partes interessadas a última das coisas que você quer não fez. Aqui estão as iterações que são exigem, mesmo que os passos são menos do que aqui eles devem ser feitos em sequência. Você vai continuar indo e voltando entre esses passos em que talvez estourar no intermediário ou no final, análise e feedback Então, depois de fazer toda a sua análise, você gritou com o especialista em domínio. Você gritou com as outras partes interessadas do projeto. Eles podem voltar com alguns comentários que podem forçá-lo a voltar e, em seguida, refazer a explosão de análise em uma nova luz que foi compartilhada nos dados que você tem. Assim, as pessoas podem ter objetivos diferentes, diferentes prospectores que podem dar novos gatilhos para voltar e olhar para os dados que são um comentário. Índia assina o produto em que sua resposta às descobertas nos dados em seguida, ele pode levá-lo em várias partes de análise. Se você tiver, então vem a face final que é a face de produção ou a face de gelo de produção. Implementamos processos contínuos que vocês dois advogados são todo o trabalho que fizeram nas caras anteriores. Ondo começar a fazer algo em um ano base contínua. Então aqui vem o que é chamado de construir produtos de data up. Então, qual é a data? Um produto eo produto é um aplicativo que funciona com dados, obtém algo fora de dados e usá-lo para alcançar algum objetivo. É simples como esse produto ordem Mais tarde. Então uma vez que uma modelagem de dados e previsão. Eu guardava a si mesmo, firmeu-se. Você sabe, exatamente o que você tem que fazer, então é melhor você conseguir um produto. Então, o que é o melhor produto é basicamente produzir, você sabe, tornando o tribunal o quarto não mais e não girando de 80. Você não pode nada. Você faz 1/4. Esta qualidade de produção vai toda a verificação de erros no lugar com toda a gestão e monitoramento no lugar que pode fazer isso vai fazer todas as etapas que temos falado. Todas as etapas de injeção de dados. Então você está nos dando automatizar recebendo feeds de dados de todas as suas fontes de dados e, em seguida, você tem que automatizar esses aplicativos para executar regularmente. Olhe para os dados que estão chegando e ele começa a limpeza dos dados, transformando os dados, persistindo os dados. Então todo o seu código de análise vai funcionar. Andre começará a analisar os dados regularmente e começará a construir modelos. Então, todos eles são produtos filha em uma palavra, eles têm que estar rodando continuamente e continuar produzindo, continuar recebendo dados e produzindo esses modelos. E, claro, a parte de produção depois de marcas em tempo real, sabe, bash para qualquer maneira que tem que ser executado. E isso novamente é outro produto de dados que os pais usam regularmente. Quanto mais modelo o modelo que foi construído para fazer previsão quando e onde for necessário. Então construir lá há proteção do ar, a parte final que é mais como isso é muito mais como software originando este projeto de software motor. Na verdade, se você quiser dizer porque você sabe exatamente o departamento em que eles estão já os converte em um produto de software, você seria apenas um precisa ter rigor de software de qualidade tanto no desenvolvimento quanto no teste sobre ele pode estar implantando modelos corporativos e de nuvem depende da fronteira produto mais tarde deve fazer. Claro, a coisa mais importante aqui também é que você precisa obter feeds de dados operacionalizados. Os dados são transmitidos de todas as fontes de radar. Não, eles têm que continuar. Quando digo contínuo, é instantâneo. Você continua pegando como eles acontecem. Às vezes você está recebendo isso diariamente. Faça isso, Adams. Às vezes você sabe, uma vez que um V 15 minutos e viagem 30 minutos defesa imprimível depende do seu caso de uso, mas ele tem que ser operacionalizado para que lá que continua vindo regularmente. Você não tem que trabalhar com alguém todos os dias para obter os dados. É tudo automatizado aqui. E, claro, nós conversamos. Como nós médico fronteira, há produtos executar toda a transformação limpeza sob relatórios cada relatório é uma coisa chave que você quer estar fazendo aqui e, finalmente, retirar todos os dados podem ser necessários. Sabe, medida que você começa a cometer o Gator, isso vai ser um monte de dados, especialmente quando você transformar o direito para o formulário que você quer todos os dados brutos. Sabe, você pode querer mantê-los por 10 dias, 15 dias e depois jogá-los fora. Então isso completa todas as etapas que você tem que fazer em um típico nosso projeto de ciência de dados. Mas há sempre algo chamado, ah melhoria contínua. Depois de implantar um produto de dados, eles são sempre alterações no ambiente de negócios que podem afetar todo o seu aprendizado em produção. Então isso é algo para sonhar. Lembre-se de tudo o que você criou como um produto de dados. Sem algoritmos, os algoritmos para modelos que eles fizeram que sua precisão pode ir para baixo porque fora mudanças no ambiente de negócios e também o material de aprendizagem e produção tem que ser o valor que periodicamente em intervalos aproximados para se certificar de que eles estão continuando a mostrar seus níveis de carreiras que orginalmente sobre Minto tem em revalidação precisa acontecer quando seu gene processo de negócios , Você sabe que há uma mudança algo no processo de projeto de negócios que onde o entidades se comportam está mudando o mundo, o meio ambiente. E Richard vai nos fazer mudar. Então, obviamente, você tem um muito, muito feito tudo o que está fazendo aqui. Então, isso pode ter que estar sob o projeto filho que foi Maker feito em seu projeto são um projeto de melhoria que tem que vir até periodicamente para validar. O que você tem feito está tudo bem. Uma agenda de forças melhor modelo deve estar em curso. Não, isso é importante. Nós simplesmente não podemos querer e parar por aí nós fazemos para ser contínuos. Então, em alguém pelo que vimos até agora, projetos de ciência de dados seguem um ciclo de vida. Projetos de ciência de dados são pesquisar seus projetos. Há muita experimentação e às vezes não entendo. Então isso é alguma coisa. É por isso que continuamos ligando. É um sinal de projeto de pesquisa nos resultados do pai deles, não o guarda vem. Duda é mais importante do que os próprios algoritmos. Várias iterações podem ser necessárias antes de resultados razoáveis serem alcançados. Isso é outra coisa que você quer se lembrar. Portanto, não há um estágio muito sério em um projeto de ciência de dados onde pensa que é feito ou deve ser feito. Então ajude-me. Isso tem sido útil para você. Obrigado por ouvir, mas 11. Habilidades necessárias para a ciência de dados — parte 1: Olá. Aqui é o seu instrutor, Cameron. Bem-vindo à sessão sobre habilidades e funções de sinal beta. Então é sobre detentores. O que e quais habilidades são necessárias para eles. Então vamos falar sobre as habilidades que são necessárias para ser um cientista de dados. E você deveria ter visto muitos diagramas como este sobre que tipo de habilidades são necessárias para a ciência de dados na Web. Então é sobre o que diz o testamento. Eles falam sobre habilidades de hacking, matemática e estatísticas e conhecimento, aprendizagem de missão, conhecimento substantivo, metodologia científica. Mentalidade de hacker, conhecimento de domínio, especialização, computação avançada. Então você continua ouvindo todos esses termos por todo o lado, e você pode estar se perguntando quais outras escolas reais eu preciso construir longe de onde você vem. A maioria de vocês vai vir de um fundo de 90 anos. Então, o que é isso? Você tem que aprender? Então vamos andar pelas águas necessárias. Aqui eles são santos praticantes em geral precisam de um mais amplo onde 80 off habilidade do que qualquer profissional. Então isso é algo que você quer entender e aceitar o fato de que se você tem um profissional idéia , você pode trabalhar em um campo estreito Lee relacionado dentro direito conjunto de habilidades estreitas, e você deve estar muito bem com. Mas se você quer ser um praticante de ciência de dados, você precisa ter uma maior onde 80 dos crânios são habilidades de computação que você precisa A geralmente cai em dois domínios principais. Você precisa saber a linguagem de programação de ar. Além disso, são bancos de trabalho e ferramentas associadas a isso, e você precisa conhecer uma tecnologia de banco de dados até saber várias coisas. Sim, isso foi mais do que bom, mas não. Para começar, você quer pelo menos dominar uma linguagem de programação, e um dia dessa tecnologia, vamos ver o que eles estão nos aproximando e chegando Matt. Estatísticas sobre conceitos de aprendizado de máquina são necessárias em um nível básico, então você precisa aprender todos eles para outra escola que você pode precisar Nossas habilidades de visualização , soft skills e escolas de gerenciamento são, então vamos começar a percorrer cada um deles. Agora vamos começar com a habilidade mais controversa que eu chamaria de matemática e estatística controversa talvez uma palavra demais para usar. Mas a razão pela qual eu estou usando isso é toda vez que as pessoas olham para o registro da escola para ciência de dados , e eles vêem matemática e estatísticas. Isso meio que deixa eles fora quem tem feito Ah, um monte de pessoas que fazem engenharia eles podem ter um curso e começar varas no DNA. Não há muitas pessoas como esse curso, por qualquer razão, que as pessoas que realmente amaram isso e há pessoas que não gostam dele. E assim, no momento em que eles vêem algo como estatística e matemática aparecendo como um requisito para dados santos, eles começam a se perguntar, eu sou um profissional. Por que eu deveria saber estatísticas e louco? Nunca me senti confortável com esses tópicos antes. Não estou dizendo que todos nós estamos... talvez pelo menos metade de nós não esteja confortável. Talvez essa seja a natureza do assunto e a natureza das pessoas. Seja qual for a razão, são os questionadores. Eu tenho que aprender? Sabe o quanto irritado por se tornar um dado? Os cientistas vamos primeiro abordar a questão semelhante a qualquer outro entendimento importante de engenharia de algum conceito louco como essencial para santos de dados. A matemática é a base da engenharia em muitos outros assuntos também. Então é bom conhecer um tapete. Ah, conceito que você precisa entender para seus sinais são coisas como tendência central como modo mediano médio, variância, desvio padrão. Provavelmente uma regressão em algumas estatísticas inferenciais. Ah, praticamente quando você pega qualquer tipo de livro sobre estatísticas são bastões básicos de serviço. Deve cobrir todos esses. O problema é que qualquer um desses livros começa a mostrar-lhe a fórmula após a reforma das terras agrícolas . É quando você fica confuso e fica frustrado lá. Claro, alguns livros que apenas se concentram em teoria e norte toda a fórmula Você pode querer ir atrás deles. Você fez no caso. As habilidades de nível de especialistas são necessárias apenas para especialistas. Se você é um estatístico foi uma parte da equipe, então você pode precisar deste nível de exportação escolas de outras maneiras. Sabe, escolas de nível básico estão bem. A razão é que muitas dessas técnicas necessárias já estão implementadas como bibliotecas em várias linguagens de programação. Então você não vai estar lendo muito fora do casaco, implementar qualquer um desses. Você não vai escrever código para completar a computação, média e desvio padrão. Isso já são ferramentas que entregaram suas bibliotecas que fazem isso. Você só precisa entender o conceito e ser capaz de chamar essas bibliotecas para fazer o trabalho. A recomendação aqui aprendeu o básico. É sempre útil. É bom ter algum status. Seis. Antecedentes Se você está no campo da ciência de dados, nossos conceitos de aprendizagem de missão são a área-chave para a ciência raider. Uma coisa que você quer perceber, e isso é algo que muitas pessoas estão confusas. Praticantes de sinais de dados não implementam os algoritmos. Quando eu digo implementar, eles não vão sentar e escrever código para implementar os algoritmos reais. Eles só os usam. É muito semelhante a dizer, você sabe, sistemas operacionais. Nem todo mundo no I d Feel vai sentar e escrever sistema operacional chamado “Eles não são”. Eles não são. Todo mundo vai escrever desenvolver seu próprio sistema operacional. Há poucos sistemas operacionais que você tem lá algumas pessoas que os chamaram, Mas a maioria de nós vai apenas sentar e usar o sistema operacional na mesma informação aprendendo seu inaugural ir e sentar e implementar Emission Learning Court. Você está sentado e vai usá-los. Então essa é uma distinção que você quer entender. Se você está muito interessado em escrever o tipo de aprendizado de máquina de tribunal, você pode querer se concentrar em ser um campo acadêmico ou algo assim. O praticante típico do naufrágio não vai fazer isso múltiplos algoritmos. Missão exurbana. Aprendendo. Portanto, existem diferentes tipos de algoritmos baseados em nossos diferentes domínios, como seus algoritmos baseados em Matt provavelmente estar em estatísticas e redes neurais. Informação Terry. Muitos deles. A. Nenhum deles é, ah, melhor para todos os casos. Então é por isso que várias cercas de jardim, cada uma realizada diferente. Eles dão o melhor desempenho em diferentes casos de uso, então você não sabia todos eles em Eles ainda estão sendo inventados. Existem os algoritmos básicos, e todos estão tentando criar um híbrido, especialmente no mundo acadêmico. Há muitos deles sendo inventor e implementar a compreensão do que esta missão algoritmos de aprendizagem é bastante obrigatório. Pelo menos os nove ou 10 algoritmos básicos que você tem é um militar na implementação, fornecendo várias linguagens de programação da biblioteca. Então, todos eles, principalmente todos esses algoritmos são bibliotecas s disponíveis, na verdade, se você ir para o pé algo como Há várias bibliotecas implementação múltipla fora um do outro? Conceitos de aprendizagem de missão disponíveis para que não haja sujeira para implementação é apenas Você precisa saber como isso tem itens livro sobre. Ser capaz de chamar as bibliotecas e usá-los diferenças entre uma menina. E isso é uma coisa importante pela qual você precisa aprender. Sobre a missão. Aprendizagem é o que esses algoritmos são. Como eles diferem um do outro? Quais são as vantagens e deficiências e quais casos de uso fazem seu trabalho e eles não funcionam? Como são os níveis de precisão como são os níveis de desempenho? Esses outros você não vai entender porque isso ajuda você a escolher o melhor guarda impossível. Sempre que você tem um projeto de ciência de dados sobre a recomendação é obrigatório. Você precisará aprender a usá-los. Não há nenhuma maneira de você estar indo para longe disso, a menos que você só queira se concentrar na parte de engenharia de dados de nossos sinais de dados estão passando para a outra tecnologia. Vamos começar com a tecnologia de banco de dados. SQL. Quando dizemos que é legal, é tudo sobre escrever. Tudo bem do SQL Statesman, consultas extraindo dados inserindo dados e as várias ferramentas e bancos de trabalho que estão disponíveis para uso. S Cuba em manipular dados. É o mais estável, mais popular e amplamente utilizado. Morto. Quatro. Data ST Então, sim, SQL é uma escola muito popular para sinais de dados. Conhecimento de leitura de SQL é obrigatório. Eu diria que você pode ser um cientista de dados sem saber instruções SQL definitivas. Você sabe que é uma das habilidades muito obrigatórias que você precisa normalmente vem com um produto de banco de dados como Article, minha sequela e Microsoft SQL. Você sabe que há sempre e produtos de banco de dados associados e com os dados vai recitar , mesmo que o final em vez faz produz indo residir e algo como um sistema difícil, o socio que talvez ainda sentado em uma habilidade base, nossas ferramentas e quebrado apenas fazendo álbuns este ano. Esta é uma tecnologia muito madura, Então, obviamente, há uma série de ferramentas, e temos certeza que ferramentas e bancos de trabalho disponíveis que tornam sua vida muito mais fácil. Quando se trata de análise e mutualização. As deficiências incluem a escala de será para muito grande, com ativos no tratamento de dados não estruturados. Os dois principais motivos pelos quais 100 entraram em cena. Estas são as duas razões pelas quais as pessoas foram e desenvolveram tecnologia dura. E isso é porque eu sei que Sq tinha essas deficiências. A recomendação é que você precisa se quiser trabalhar com os EUA EUA , então não há como pesar sobre isso no dia seguinte. A melhor tecnologia que você quer se preocupar é com o ecossistema amontoado. Agora, sq, aprender SQL é talvez fácil são feitas. Você já pode saber que isso matou, mas como é que uma tecnologia bastante nova que existe há alguns anos? É a tecnologia mais popular quando se trata de domínios problemáticos. Onde há sexo de dados grandes, há desertos maiores, e isso são dados não estruturados. Essa é a principal razão pela qual toda a cobertura t de US cinco sistema no mapa produzido tecnologia veio em imagem. As ferramentas a serem aprendidas aqui em sua área de busca primeiro mapa, produzir alta base H Impala. Há um monte deles, então eles ainda estão sendo inventados. Minha esperança é a Biblioteca de Aprendizagem Mission que vem com amontoada, e tem um conjunto limitado de skate off de algoritmo muito escalável, por isso é muito funcional. Mas a usabilidade não é tão bom Com o meu capuz nele é a tecnologia de código aberto, e torna muito fácil adaptá-lo a tecnologia de código aberto, e você pode facilmente baixado e sólido e usá-lo se você é realmente próximo sistema. Esta é outra questão principal. Este é o principal problema com Hard Up é que ele não é fácil o uso Quando eu disse não fácil relacionado Lee quando comparado a outras coisas como SQL, não um uso da cidade precisa de programação significativa pagar para fazer qualquer tipo de trabalho e você olhar duro para cima e é ferramentas. Há apenas as regras do tribunal que estão disponíveis lá. As interfaces de usuário não são tão grandes. As saídas não são tão boas. Você precisa ler muito fora de acordo com qualquer tipo de trabalho com o ecossistema de esperança, as ferramentas e trepar, mas apenas estão evoluindo. As pessoas estão apenas chegando sobre as ferramentas e sexo de trabalho e ainda descobrindo tecnologia lá e ainda estão trabalhando em progresso no desenvolvimento de habilidades, Rick, Rick, esforço de tempo mais significativo e limite de investimento de recursos que você não pode ter Só um laptop em você. Você quer sentar-se e aprender toda a sua tecnologia rígida hard up trans apenas no próximo. Se você quiser instalar uma base Lennox baseado hot up o que eles chamam de uma caixa de configuração que você tem. Bradley tem, como um banco de dados de memória em sua caixa para ter qualquer tipo de corpo de tempo de resposta razoável com coisas simples. Portanto, há alguns resultados tempo de investimento, e nós gastamos uma fortuna. A maioria significava retribuição aqui. Se você quiser aprender sobre o sistema herético na recomendação é verificar se você está confortável antes que isso aconteça, esta tecnologia. Então verifique antes que você queira dizer que eu queria mergulhar profundamente nesta tecnologia e aprender sobre ela. Envolve um investimento significativo de tempo, esforço e resultados para você aprender esta tecnologia, então lembre-se que 12. Habilidades necessárias para a ciência de dados - parte 2: linguagens de programação. A primeira linguagem de programação que queremos falar sobre nós é que é a linguagem mais popular para ele atribui seguido de perto por Python No mais, esta é a linguagem mais popular para a ciência surda que começou. Começou como uma linguagem de programação para os estatísticos, principalmente para fazer o trabalho estatístico. Are está lá há algum tempo, como mais de 10 anos. Mas fora tarde, ele evoluiu de apenas ser uma linguagem de programação para estatística. Estão apoiando muitas bibliotecas e ferramentas. Isso é sobre todos os estágios do sentido de dados quando eles dizem, também apenas de dados dizendo Tentado de aquisição posterior toe toe jantar transformação toe análise de desejo realização pode fazer todas as coisas. Há um monte de boas bibliotecas disponíveis, torna muito fácil de usar que é muito mínimo. De acordo envolvido no nosso. Ele também tem uma bancada onde você só é como tipo programa CN de coisa. Basta escrever uma linha de código imediatamente, executá-la e ver os resultados do outro lado. Você pode apenas dobrar seu casaco passo a passo. É, é incrível. É uma coisa muito boa. Bom espaço para fazer ciência de dados. Meio que funciona muito bem com dados. O único problema que você tem virá a isso mais tarde. Está aberta. Fonte são serpentes são as ferramentas, idéias e bibliotecas também estão abertas. Fonte. Há um sistema de eco de suporte muito bom na web, inicialmente vai encontrar todos os tipos de ajuda na web. É um excelente conjunto de bibliotecas. Faz qualquer trabalho uma brisa tão excelente nesse sentido, sobre a única limitação e a única limitação é a escalabilidade. E isso é uma grande, grande, grande limitação. Sua credibilidade em termos de quanto de dados eu posso lidar. A quantidade de dados que eu posso lidar é a quantidade de memória que você tem em sua missão. Ele tem que carregar todos os dados e memória e apenas que ele pode usar. Essa é a maior limitação por causa da qual só são usados durante a face experimental fora de sua ciência. Mas você está obtendo os dados olhando para os dados, pegando um pequeno pedaço de dados e testando algoritmos Natalia. Então é aí que a arte está sendo usada. No momento em que você entrar em produção. Se você tem este enorme, você tem o registro sua coisa em outra linguagem de programação que pode roubar. Então isso é uma limitação. Grande limitação para o nosso Mas são é uma habilidade muito importante para a ciência de dados, porque muitas vezes você está apenas sentado e trabalhando com dados, licitando mais tarde disputando com dados. Então, nossa é uma ótima ferramenta para isso, e você verá que somos a melhor escola exigida em qualquer um dos requisitos de trabalho relacionados à ciência de dados . Recomendação é escolher nossa luta em um deles. Se você quer aprender os dois muito bem, mas você sempre tem que começar em algum lugar. Assim como a nossa luta na próxima linguagem de programação é, claro, morder igualmente popular como o nosso para sinais de dados. Então vem com meu passado diferente, mas é igualmente popular novamente. É a agenda. Item tem uma linguagem de programação de propósito geral que pode fazer mais do que apenas mais do que sinais de dados como ele pode. Você pode criar um aplicativo da Web com ele. Você pode fazer muitas coisas que eu faria sob os sinais deles com Brighton. Então é uma linguagem muito finalmente madura que está lá. É, claro, código aberto nele fácil para programação, bancos de biblioteca extensa e pacotes e a escalabilidade fora minha vez depende do pacote é usado. É uma espécie de também é uma linguagem de programação direta. Está indo para você programar. Você precisa construir escalável, ser suportado, são usar um pacote que são quatro escalabilidade. Então não há nada diferente lá na recomendação aqui é que os judeus estão mordendo em um deles . Vais ter com o Joe? Alguém que, na verdade, ambos parecem muito parecidos. Quando você começar a usá-los, não vai ser algo Se você já tem um fundo e pytoch ir com tempo de torta você quer escolher o nosso que você está confortável com Não alguma pesquisa pouco e, em seguida, suco Whatever você está confortável com SAS, Stata, SPS s e meu clube o Zahra lançou produtos que estão disponíveis no mercado que faz semelhante, enquanto estes são bancos de trabalho de ciência de dados lated é nossas alternativas para o nosso e lutar em. Eles têm excelente suporte para nossas funções de ciência de dados bebês como adquirir o escuro, transformando sua querida começou máquina de análise de aderência aprendendo todos eles o único problema com eles são um grande problema com números. Eles não são código aberto seu produto que precisa comprar, e há produtos muito caros. Então esse é o que está limitando o uso de Grady. Estes produtos estão lá há algum tempo, mas eles não são produtos novos em seu muito caro em suas empresas que não têm parado lá dentro, e eles estão usando-os seu dominante. Mas o uso tem sido relacionado, Lee declarando por causa do surgimento de outros pescadores de água de código aberto. Isso é o que está acontecendo neste campo. A recomendação aqui é que aprenda somente se sua organização já estiver usando. Eu não recomendaria que você vá direto para eles sem aprender são pelo tempo a menos que a agonia de sua organização já está usando e você foi aprendido. Portanto, há a recomendação que eu tenho. Outras pessoas podem ter opiniões diferentes, mas esta é a recomendação que eu tenho tanto para o material técnico, o conhecimento principal, uma habilidade chave muito importante que vimos em outros lugares. Como quando olhamos para o ciclo de vida da ciência de dados Bem, quando você olhou para quais sinais de dados vemos, o conhecimento do domínio é uma habilidade muito crítica. Há todos os números e caracteres. As missões só podem triturá-las, mas não podem interpretá-las. O conhecimento fictício é fundamental para entender o que o leitor diz e uma vez menina que você não pode simplesmente construir, mas treinar. Você não vai ter nenhum treinamento disponível para usá-lo. Construir sobre o meu conhecimento e espadas são idiotas. Era algo em que o seu cão latiu. Você tem que aprender no trabalho e construir Escalon. As recomendações olham que se você tem trabalhado em um domínio específico, você está trabalhando em uma empresa que a Sierra, que está em um financiamento para mina ou domínio médico, meio que aprender mais sobre isso e construir sobre ele. Quero dizer, use o uso que a empresa explorou que você tem Dr. People que conhece bem o domínio e construir algumas habilidades lá dentro. Se você está mais fresco fora da faculdade e quer entrar na ciência de dados, a recomendação é que não se concentre mais em tipos de trabalhos duradouros para começar, que é principalmente programação de linguagem, trabalhos para extração Eles morrem. E eu sei que dados de limpeza e coisas assim e, em seguida, no trabalho construir domínio habilidades de linguagem longa , habilidades de apresentação estão indo outra coisa muito importante. Sua capacidade de ficar sem sapatos Joe Dan President resulta de uma maneira convincente é uma habilidade criadora grande quebra em ciência de dados para que você possa sentar e fazer todo o trabalho que quiser em sua dentro e com dados. Mas a coisa mais importante é finalmente convencido as partes interessadas do projeto sobre o que você está encontrando Zach e que você só pode fazer com boas habilidades de apresentação. Você precisa saber que não se trata apenas de obter bons dados. Você também precisa saber como apresentar os dados das pessoas de forma convincente. Essa é uma habilidade muito importante. Eu não vejo o seu incluir qualquer um dos pacotes gráficos do escritório da Microsoft, é claro, em seguida, bibliotecas gráficas e luta em nosso ou qualquer um dos bancos de trabalho. JavaScript. Há um monte de ferramentas para apresentação que está disponível, e, claro, é bom aprender. Eu não os conheço. E novamente, você pode não estar indo para um treinamento específico sobre esses. Em vez disso, você aprende como parte de outros treinamentos, como nossa luta ou mesmo como o Microsoft Office. Nossos projetos de ciência de dados geralmente encontram deficiências em outras pessoas que trabalham com a mãe. Quando você está olhando para dados e seus provérbios que há uma oportunidade aqui para melhorar. A primeira pergunta é, por que essa oportunidade não está exposta a você? O Leo. Quem era o cara que está trabalhando neste domínio e por que isso? Por que essa garota não tem essa oportunidade antes? Então, obviamente, é meio que encontrar falhas com outro trabalho. Sabe, pelo menos algumas pessoas tentando pensar assim e não ficam na defensiva. Então, é muito importante para você ter habilidades de apresentação onde você pode conversar com as pessoas uma forma que não as machuque, não as faça se sentir de volta e, em vez disso, dizer-lhes isso. Está bem, está bem. É assim que os dados são. Não, não, não é sua culpa que não tenha sido descoberto até agora. Mas agora estamos descobrindo algo aqui. Vamos melhorar isso. É uma habilidade muito importante o presidente, que não pode ser subestimada. Quanto essa habilidade é necessária para você, especialmente se você é um veterano lá, um cientista ou um tipo de pessoa concertante. Outras escolas não técnicas. Você não vai aprender isso em lugar nenhum. Mas lembre-se que você tem que construir esses no trabalho em equipe mais do que o necessário e mais do que a equipe de irregularidade onde você precisa. Mas acredito que trabalha com coisas não técnicas e não cooperantes. Você vai achar isso muito. Há um monte de pessoas não técnicas que vão questionar sua ciência, você sabe, nós temos um trabalhador com eles. Pode haver adolescentes que não cooperam. Tens de aprender a trabalhar com eles. Você precisa de uma mentalidade inicial. É aí que eles continuam dizendo que o hacker, quando certo, não espera processos suaves e requisitos bem definidos. Você sabe, eles não vão ser construídos seus comentários, e eu concordo. Processadores suaves. Vai haver algum problema. As coisas vão mudar muito dinâmicas, e você deve ser capaz de trabalhar com isso. Você precisa de um hacker na segunda-feira 50 porque você tem que hackear os dados para obter informações dele. Você deve se sentir confortável em comoção. Vai haver comoção com os dados. Um monte de pessoas falando um monte de coisas desta forma que costumava ser conta confortável, mas que pode ter uma comoção e ser capaz de obter a sua recepção. Você sabe, você não pode esperar processos suaves, especialmente em sinais de dados. Você precisa ser capaz de lidar com a frustração, especialmente quando você não está vendo os sinais. Você quer ver os níveis de precisão sempre Predição. Algoritmos não estão à altura da marca. Sim, isso vai ser muita frustração, qual você vai trabalhar. Você deve finalmente ser capaz de lidar com críticas. As pessoas vão criticar sobre o trabalho os dados que os pesquisadores teoria da evidência, tudo. Então, esteja pronto para lidar com críticas. Isto é tudo o que vale. Este é um enorme conjunto de habilidades que são necessárias para os outros sinais. Alguns você pode obter por treinamento, alguns você não pode obter por treinamento e que alguns o que você precisa aprender no trabalho. Obrigado. 13. Funções na ciência de dados: Olá. Aqui é o seu instrutor Cameron. Então, esta apresentação é sobre os vários papéis que você verá na ciência de dados sobre. Você ouve que um profissional de software é um título de geração. Então, quando você diz que alguém é um profissional de software, é um título de geração que você pode chamar alguém. Esta é a oferta programadores fora. A menos que algo assim, é um título de geração, e assim é. Como cientistas sobre novos dados da cidade Cientista, ele aponta para uma ampla categoria de papéis e responsabilidades. Como você diria, alguém é um profissional suave. Um profissional de software pode desempenhar papéis diferentes em uma equipe com base em habilidades. Experiência interessante como testes de design de acordo, gerenciamento de arquitetura. ESO é um cientista de dados, então a data atribuída a isso também pode desempenhar papéis diferentes novamente com base em suas habilidades. Experiência interessante. Então isso é algo que você pode querer perceber que o cientista de dados é um rolo muito geral de nossa categoria, e há muitas sublinhas e subcategorias em que você pode estar realmente trabalhando em equipes inteligentes. Todo mundo, todo mundo, todo mundo faz tudo ou apenas uma pessoa faz tudo. Em grandes equipes, há papéis e responsabilidades distintos. Então, mais tarde assinou nós é uma categoria ampla em termos de definição de papel. Então, que outros vídeos? Montes. Na ciência de dados, começamos com o primeiro papel, que é o engenheiro de dados antigo. Os papéis de engenharia de dados responsabilidades são escrever código O jantar lá vai estar lendo muito fora do tribunal A maioria pego tentar código de gravação de dados para aquisição de dados, persistência, operacionalização, qualquer coisa para fazer com a transformação de dados. Tudo isso geralmente é devolvido por um engenheiro de dados os dados e você sabe, soldados para ajudar o analista. Há analistas notáveis que vamos ver ajudar o analista a construir algoritmos preditivos . Ajude os líderes no liberal. Vamos ver Ajudar o líder com relatórios e visualização. Então esse cara é como o Handelman para a equipe fazendo um monte de trabalho de cortejamento muito, muitas vezes trabalho integrativo para ajudar os outros papéis. Eso as habilidades e experiência necessárias para um engenheiro de dados é basicamente chamaria um I P. Grau 0 a 5 anos de experiência. Então isso é o tipo de programador júnior da sua equipe. As habilidades necessárias são a nossa luta em SQL e big data para começar na posição, e este é o impulso em que, se você é um mais fresco, se você tem, como um ou dois anos de experiência, você pode esperar entrar nesse tipo de pergunta. Isso não requer qualquer tipo de experiência de domínio, mas nós. Você trabalha no papel que constrói essa experiência de domínio, garota, que vai te ajudar em outras regras avançadas futuras. O próximo mundo que vamos ver é que muitas vezes analista os analistas novamente, eu estou dizendo que é um papel que pode ser chamado de O amigável em diferentes empregos estão em diferentes empresas, mas ele teve o papel responsavelmente desassociado aqui Rolls nome. Eu tenho nos dado analistas que talvez novamente chamado de outra coisa. As principais responsabilidades são disputar com os dados. Então, olhando para os dados e vendo ah, trabalhando fora coisas que você tem a ver com esses dados, visitando em que tipo de transformações são necessárias, que tipo de limpeza é necessária? As análises disputando com os dados a menos que o dedo do pé de dados em diferentes padrões, então o analista faz, o explorar um analistas tratados, é identificar nossos padrões de dados e relacionamentos em relacionamentos bastante previsíveis. Coisas como essa construção de testículos, algoritmos preditivos, olhe para os vários algoritmos. Eu tentei usá-los para os dados e ver que tipo de precisão você está recebendo e continuar jogando o nosso próprio, resistiu e, em seguida, finalmente, produziu as recomendações sobre como você pode usar os dados para produzir algumas boas previsões. Então este é o tipo de carnudo papel carnudo técnico enrolado. E há sinais de que reunião técnica e com um papel muito crítico, como você pode ver as habilidades e experiência necessárias para isso nos disse como uma idéia ou um mestrado , até mesmo um PhD. Você verá um monte de perfis de cientistas de dados pedindo um grau de PhD lutando 20 anos de experiência como uma enorme quantidade de incidente XB onde isso é mais como um arquiteto de software . Nosso analista sênior tipo de uma posição bebês, programação ou fundo estatístico é necessário para não analistas. A maioria dos estatísticos menos banco de dados e programação também vêm a desempenhar esse papel depois que eles se tornam alguns pegar algumas habilidades de programação. Nossa luta em SQL e Big Data novamente, o padrão definir habilidades que são necessárias para um dia em que os cientistas que tem que ser experiência de domínio significativa para analistas a menos que precisa ter isso para ser bem sucedido em seu trabalho. Eu vi que essa é a definição de Theodore para analista. Algo como um papel técnico chave, como o líder técnico do arquiteto, tipo um papel quando você chama alguém é. E a menos que o mundo da ciência de dados, próximos rolos que sempre estatístico, que é um rolo muito especializado. As responsabilidades aqui incluem recomendar que eu vou guardar Adams, e estratégias disse que decisões não são que em equipe pequena. Eles geralmente estão em grandes equipes tentando resolver problemas realmente complexos. Então eles vão ser, a menos que eles mesmos os algoritmos e, em seguida, chegar com novos algoritmos, se necessário. Chegando com novas estratégias se necessário para resolver os problemas, eles fazem muito fora análise inferencial, que é mais como fazer todos os seus testes estatísticos sobre os dados para ver se as inferências manterão bem. O nível de validação estatística sobre eles geralmente não são encontrados em equipe pequena. Eles geralmente encontraram em equipes muito grandes dedicadas o tipo de pessoa estatística. As habilidades necessárias para um estatístico são como um diploma estatístico, geralmente um lutador de doutorado. 20 anos de experiência são minúsculos, é o que eles costumam ser família, apenas manipulando dados. Não realmente qualquer tipo fora trabalho de programação são também está sendo usado mais como um banco de trabalho tipo de coisa. Em vez de ser como um programador. Experiências de domínio significativas novamente necessárias para um estatístico vão fazer seu ouro melhor. O último papel que você vai estar olhando é que fora de um líder, o líder é mais como um gerente de projeto é o líder de equipe ou gerente de engenharia . Você sabe, como você quer chamá-lo este cara é o gerente fora todas as outras pessoas que trabalham no reitor suas responsabilidades? R. Principalmente o nosso gerenciamento de projetos, um gerenciamento de todo o projeto comprar de partes interessadas, o outro que nós vamos estar falando com as partes interessadas para obter a compra em que as nossas previsões a equipe é vai produzir. Pessoas e gestão de expectativas são grandes trabalhando com pessoas dentro do demônio fora da equipe para fazer as coisas. gerenciamento das expectativas para a ciência de dados está pronto. trabalho crítico que eles têm que fazer uma visualização é uma responsabilidade para eles. Eles tinham aquele que vão estar preparando as apresentações em louvor de sino e coisas assim para que este é estes são novamente caras, eu disse, eu disse, Como os gerentes de projeto na equipe, seu conjunto de habilidades são como um grau profissional. Mesmo MBS conduit gerentes de projeto com certificação de gerenciamento de projetos. Cando isso com alguém como com um 90. Processador em segundo plano. Coisas como essa lutando 20 anos de experiência Mais uma vez, eles vêm de uma gerência. Artistas oferecem formação em engenharia. Esta é uma oportunidade para as pessoas que não são. 90 pessoas, alguém com um MBE ou algo assim para entrar na ciência de dados e fazer algo aqui. Gestão de projetos vai em silêncio, é claro. Sim, a experiência de domínio é preferida. É bom ter o dedo do pé do líder ter alguma inexperiência fraca de novo, eu não sou. Você vai estar vendo pessoas para cada Dole pessoas combinando papéis e fazendo o trabalho . Isso é apenas para entender quais são os papéis, responsabilidades e requisitos de habilidade. Estrada adicional que você vai encontrar principalmente em grandes equipes são equipes de teste e validação. O mesmo onde você tem equipes de garantia de qualidade no desenvolvimento de software. Você fez nosso teste em equipes de violação cujo trabalho é escrever casos de teste para execução de tarefas duradouras de dados como editores são semelhantes aos revisores de garantia de qualidade de engenharia de software são outra coisa importante que você pode querer em sua equipe. Estes são basicamente experimentos de domínio sênior e especialistas. Seu trabalho é rever as descobertas e recomendações sobre basicamente vir sobre eles porque estes são especialistas em domínio. Quando você vir acima com descobertas, eles podem tomar uma revisá-los e dizer que suas recomendações são boas. Outros implementar em outros são o Há qualquer tiro cai em suas recomendações são quedas afiadas nas coisas de análise que você pode ter perdido como parte de sua análise sobre eles são basicamente como um defensor do diabo. É bom tê-los como parte de sua equipe se você tem uma equipe grande e você se você pode pagar esses revisores, em seguida, vem a Operação Spartan fora da nova produção go. Quando você vai para a produção com todos os seus produtos de dados e obtém todos os seus feeds de dados, você precisa de pessoas que possam gerenciar esse ambiente de produção basicamente feito em todos os seus bancos de dados e eles estão configurados. Execute todos os seus produtos de dados como processadores, e se a deficiência entrar dia após dia, certificando-se de que os dados estão entrando quando eles têm que entrar, todos os seus programas estão sendo executados a tempo. As operações eso estão sob sua parte fora da equipe científica. Normalmente, eles podem fazer parte de uma equipe diferente. Eles podem não fazer parte de sua equipe de ciência de dados, mas isso é um papel. Às vezes, em equipes muito pequenas, os próprios data centers desempenham esse tipo de papel na composição da equipe de operações. Você pode começar com uma pessoa coisas. Você os chama de comandante porque eles fazem tudo. Isso é muito, você vê, Job respondeu. Ele ligou para cientistas de dados. Vemos que há sempre vagas de emprego chamadas cientistas de dados, porque a maioria dos problemas você está sentado e fazendo todas as coisas. Mas provavelmente você só está fazendo outro trabalho. Só Toto. Equipes de quatro pessoas. Os papéis são combinados entre a experiência e os membros juniores. O estatístico geralmente está ausente. Uma das pessoas sênior geralmente é o analista Andy Project líder sobre as pessoas juniores. Faz toda a codificação e o trabalho de faz-tudo. Últimas equipes têm membro dedicado para cada espera em, mas haverá vários membros jogando uma estrada, o semelhante a um projeto de desenvolvimento de software aqui. É assim que ele vai fazer a transição de uma equipe C uma pessoa para equipes realmente grandes e é sempre recomendado toe. Tenha equipes externas de revisão como parte de suas habilidades. Tosse sua equipe. Então estes são os diferentes papéis desejo, diferentes papéis que você tem em um grupo de dados de ciência. Quando você liga para alguém que a data nos designou você basicamente vai estar fazendo um são mais fora desses exercícios. Eso Hope acha que ajudou você a entender o que os rolos fora dos sinais de ciência de dados cientistas são. Obrigado. 14. Desafios para uma cientista de dados: Olá. Este é o seu instrutor Cameron nesta seção, vamos ver quais são desafios desonestos para um cientista de dados. Um Esses desafios, quais são esses desafios que são únicos para seus signos? O desafio é ferido vai ser positivo e negativo. Um desafio é um desafio. Vai ser positivo. Se você gosta do desafio e quer trabalhar nesse desafio, é negativo. Se você não gosta do desafio, é tudo sobre sua perspectiva e sua preferência. Então um desafio é um desafio. Nós lough desafiantes em algo que amamos algum tipo de desafios que não gostamos de outros tipos de desafios. Então é tudo sobre nossa própria perspectiva e preferência. Entrar na ciência de dados é um investimento significativo de tempo e esforço. Você vai estar fazendo um monte de estudar um monte de preparador, então alguma consideração cuidadosa é necessária sobre o que você pode esperar na Adidas e trabalho. Você está pronto para isso? - Você? Você gosta dos desafios oferecidos pelo trabalho, mas é sempre melhor conhecer um amigo e, em seguida, perceber mais tarde de tentar fazer algo você não gosta Então, quais são os vários desafios? O primeiro desafio? De fato. Nossa ciência é o desafio tecnológico. É um campo novo e em evolução, especialmente pensa como tecnologias de big data. É um novo. Campo em evolução. Várias novas tecnologias e ferramentas são necessárias aqui para a ciência de dados. Coisas como linguagens de programação como nossa e Pitre estão bem. Não, as pessoas estão criando mais ferramentas em ferramentas e técnicas, principalmente conjuntos de ferramentas e produtos em um nível muito mais alto. E isso é algo que ainda está evoluindo. Então novas opções estão ficando velhas rapidamente que muitas pessoas trabalhando em um novo tipo de tecnologia na estabilização desta tecnologia vai levar alguns anos. É muito semelhante a 24 anos atrás. Quando você olha para tecnologias de banco de dados, eles gostam de cerca de 2030 produtos de banco de dados no mercado. Agora você vê que tudo o que estabilizou muito as pessoas desapareceram. São apenas duas ou três tecnologias que estão ficando. Esse tipo de tecnologia. A estabilização nos sinais de dados vai levar alguns anos, então esteja pronto para se adaptar ao descarte como você vai com relação à tecnologia que vai ser esforço adicional contínuo em aprender essas novas tecnologias e se adaptar a elas. Então você vai estar investindo em treinamento e aprender um monte de tempo para um continuar. Vai ser um processo contínuo se você gosta de aprender coisas novas o tempo todo. Não, este é o emprego dos seus sonhos. Então você gosta de aprender coisas novas, novas tecnologias à medida que elas continuam saindo. Este vai ser o emprego dos seus sonhos. O próximo desafio é o das habilidades de azar que são necessárias para seus sinais No primeiro, é claro, claro, são as estatísticas de Martin. Então Martin começou seis. Algumas pessoas adoram. Algumas pessoas odiavam, então esse é o desafio. Nem todo mundo está confortável com minhas perguntas prontas ou quando você estava usando todas essas equações chegando ou você não está muito confortável. Algumas pessoas são realmente legais, mas é assim que nos data centers, você deve aprender o básico sobre as estatísticas desta montanha, e você pode ter que usá-las para justificar seu trabalho. Mas a questão é, você está confortável com isso? Se não uma engenharia de dados dentro de dados, ciência é uma espécie de uma boa adoção normanda que você pode querer buscar conhecimento de domínio é outro objeto qualificado que vimos em outras apresentações como toe Ah White é crítico. Conhecer e se especializar em um domínio é fundamental para o sucesso a longo prazo. Para o crescimento, é uma ótima oportunidade para aprender o lado empresarial das coisas, se você gosta. Mas se você está de novo, você só quer estar em sua programação mais. Você não quer se concentrar no conhecimento do domínio. Mais uma vez, persistência de dados é uma boa alternativa com a OTAN. Sign Então estatísticas matemáticas e não, meus conhecimentos são considerados habilidades chave em um domínio de ciência gerador. Portanto, cabe a você se você quer aceitar esses desafios não são dados em si é um desafio estar confortável. Mas grandes quantidades de dados são fundamentais para o sucesso e as coisas de dados. Então eu vi muitos profissionais de I D que não estão tão confortáveis trabalhando com dados. A questão é, Você está confortável com tabelas enormes e folhas de excel e todos os tipos de dados? Você tem uma tela de dados de amor e números e cordas você está confortável com todos eles? Ah, pechincha. Dados incompletos podem ser frustrantes quando você trabalha no dia em que tentar disputar com dados da barra de dados e dados incompletos pode ser muito frustrante. Ler um Breda e uma forma adequada que pode ser um muito eu tinha avaliado um processo demorado seu para fazer algo que algo pode levar cinco minutos, volta e ver que não é suficiente. Então faça outra coisa e continue continuando. E este pode ser um processo muito demorado. Então são quatro dados, então remonta e será um desafio na ciência de dados se você não estiver confortável com ele , procurando sinais. Então, sempre que você está fazendo essa parte de análise, você está tentando procurar sinais dentro dos dados. Você está tentando procurar a relação entre várias entidades e atributos. Então o que vai acontecer eles estão procurando sinais em dados é como resolver um mistério de assassinato . Isso é algo que você encontraria com experiência que é como resolver um mistério de assassinato. Não, você estava olhando para pistas. Estás à procura das roupas que estás a tentar localizá-las perto de alguma coisa. Você vai atrás de algo, você encontra outra coisa, você pode não encontrar algo em tudo, e você pode simplesmente amar ou odiar, e você pode não resolver tudo. Você sabe, essa é a coisa. Você não vai resolver o problema misterioso. Mas isso pode ser intelectualmente recompensador para você. A curiosidade de um cartão é necessária para ser um líder. Cientistas têm que se meter em problemas por causa disso. Esta é apenas uma viagem que é longa. Mas o resultado final pode ser gratificante. Mas eles se instalaram. Procurar sinais pode ser muito frustrante. Você pode quebrar sua cabeça. Você pode ter dormido descansado em relação a nós acontecendo com os dados. Por que não há mais tarde não se comportando como é suposto se comportar? Você sabe, tudo isso vai ser um pouco. É um desafio. Você ama ou odeia isso estão lá Desde que os projetos são projetos de tipo de pesquisa, então eles projetam projetos em mais tipos de pesquisa de projetos, eles não são projetos bem definidos não como um projetos de desenvolvimento de software onde o requisitos são definidos em pedra. Cada sentimento que você eu sei exatamente quando o campo nós a ser trabalhado por relações tem que ser feito, como ele tem que ser gravado. Mas não é assim que os projetos residentes são que a exigência é principalmente como um objetivo em então você apenas ir atrás do objetivo e você continuar mudando. Continue trocando partes, até mesmo o objeto. Você pode começar a evoluir à medida que o projeto continua. Portanto, os requisitos não são definidos em pedra. Eles vão continuar mudando à medida que o projeto progride. Retrabalho é um dado. Você vai fazer um monte de trabalho livre com dados. E isso, também, com dados, confusão e conflitos serão perfis no projeto do presidente. Pode não ter desinteressado no sentido de que, no final do projeto, você pode achar que não há nenhuma assinatura no seu projeto. Tudo bem. Você tem habilidade para todas essas coisas. Processos operacionais, metodologias de ciclo de vida, práticas recomendadas. Todos eles ainda estão evoluindo para ciência de dados. Vai levar alguns anos até você ter algumas coisas sólidas. Neste caso está em processos operacionais uma vida segunda metodologias, Asprilla e melhores práticas. Mas você faz bem no trabalho organizado. Você está permitindo estar no meio do caos? Não. Este é o projeto tipo de pesquisa. Você quer fazer o tipo de pesquisa. Sim, este é um ótimo lugar para se estar. Então saiba disso antes de entrar em ciência de dados. A dinâmica do trabalho laminado a vapor são mais urinadas pela gripe. Um projeto científico comparado a um projeto de desenvolvimento de software. Pelas várias razões que demos antes, haverá desafios tecnológicos que desafiam o processo mudando de direção. Tudo isso faz com que nossa dinâmica de trabalho em equipe seja mais fluida. Haverá muito mais interações dentro da equipe. Muito mais conflitos dentro da equipe s o b pronto para tudo isso. Se você está interessado em ciência, você deve ser um jogador trooping trabalho dedo do pé em grandes projetos. E se você é um guerreiro solitário, talvez você queira se concentrar em pequenos projetos onde é só você e você está apenas sentado e fazendo todo o trabalho. Mas em grandes equipes, ser trabalho é mais importante do que está lá no projeto de desenvolvimento de software, eu gostaria de enfatizar que o próximo ladrilhos é muito importante. Os ecossistemas compreendendo os sinais de dados. O que você quer dizer com o ecossistema? Ecossistema aqui significa as outras equipes e departamentos em uma organização que você trabalha com as outras equipes e departamento. Talvez seus clientes, você dobrar nosso pessoal de vendas, mais marketing, logística, operações, icty, outras pessoas em geral. Gestão de topo. Isto é o que chamamos aqui como o ecossistema, e qual é o desafio aqui? Eles estão dizendo que é um sentimento muito novo e nem todos estão entendendo isso. Da mesma forma que o termo lições diurnas em si como tantos significados, tantas definições, ainda está evoluindo. Uma das razões pelas quais eu pensei neste curso é porque essa compreensão é algo que não é mesa. Então isto é, há um todo. Claro que ele tem que entender as ciências dos dados do conselho. Então, se este é o seu caso do que o que é o caso de todo o seu ecossistema, as pessoas têm compreensão diferente do que os santos da área podem fazer por eles. Algumas pessoas, todo mundo já ouviu falar sobre isso na Internet nas notícias e conversas e outras coisas. Algumas pessoas pensam que é uma solução para os nossos problemas. É mágica. Algumas pessoas dedos Bure, o que o nosso Então há todos os tipos de opiniões sobre. As pessoas são opiniões em qualquer lugar entre essa magia e qualquer tipo de opinião. Então o problema com tudo isso como suas expectativas não será como se eles tivessem expectativas diferentes do que o sentido de dados pode realmente fazer por eles. O que isso significa é que você sabe, todo mundo está aprendendo mais atualmente. Nem todo mundo entende que a ciência de dados e a água podem fornecer para a verdadeira forma dos EUA. Então você deve ser paciente e você deve ser Eric educando-os, nem ficar frustrado com isso. Então isso é um desafio com a ciência deles. Dado que se trata de um novo campo, os ecossistemas compreendendo mais tarde, ciência não está totalmente correta. O próximo desafio, claro, é trabalhar com outras equipes como se houvesse o negócio. O que é um conflito? Seus sentidos equipes podem sair da equipe de negócios são da idéia, adolescente , qualquer lugar que sai, que é sempre o conflito com a outra equipe, que é eu não construir sua condução. Às vezes, suas equipes de ciência de dados estão vindo com a noite ser, e nesse caso, o que acontece é que a ciência de dados vai estar fazendo muito mais trabalho influenciador. Então eu faria do que o negócio pode não gostar se a equipe de ciência de dados está vindo do lado de negócios das coisas. As ideias, Quinn, uma pergunta que eu ia fazer para requisitos o tempo todo e coisas assim e eles não vão gostar. Então, haverá muito conflito entre o melhor como um i d. Quando se trata dessa ciência, essa é sempre a coisa de selar o trabalho de outra pessoa, porque o que quer que tenha sido feito, o que quer que estejamos planejando fazer com suas designações, alguém já está fazendo lá em suas mentes. Então, quando você olha para falar sobre como prever coisas como, o que vai acontecer a seguir, há pessoas. Quero dizer, a previsão sempre aconteceu nos negócios, mas as previsões foram feitas por pessoas. Isso é o que eles nos chamam de experiência. Eles usam essa experiência para prever como o futuro vai se comportar. Você tem uma experiência serve por vendedor na experiência outra pessoa pagar por ir para começar a falar com o cliente e dizer, Este cliente vai comprar no braço Você sabe que não sai de sua própria experiência , que não é nada além de seus próprios dados internos e seus próprios em feito e modelagem e aprendizagem. Agora que ia ser substituído por um computador que vai ser sempre este desafio porque você vai substituir essa pessoa do serviço de inteligência pela ordem da empresa, que agora vai prever se o cliente vai comprar, não são assim. Há sempre um roubo do trabalho de outra pessoa. Acho que isso vai acontecer como nós mesmos. Você verá alguma resistência. Você verá algumas ações negativas. Então trabalhar comigo que essas equipes serão um desafio se você for um cientista de dados e esta é a última de todas as críticas. Portanto, esteja pronto e fique confortável com críticas mais do que o esperado. A crítica virá do ecossistema. Vai vir de sua própria equipe da alta gerência. Vai ser crédito. Haverá críticas sobre a ciência de dados em si. Haverá questionamentos sobre o que ele pode fazer que vai ser questionamento e crítica. O prêmio, o trabalho que você faz como cientista de dados. Eles vão questionar os resultados do seu projeto. Então isso vai ser todo tipo de coisa que vai estar sempre, você sabe, você sabe, antes de se tornar um dia. Esse sinal não sabe como você é sensível. Você deve aprender a lidar positivamente com as críticas, então esteja pronto para a crítica. Não é como se você tivesse um equipamento. Druckerman que chamou contra ainda e entregar aspecto desse comentário em seu centavo. Isso não vai acontecer. As pessoas vão criticar sobre o trabalho que você faz até que você saiba que o negócio atribui cianose coisa. É um evolui. As pessoas melhores entendem isso como ciência melhor. Isso vai levar alguns anos abaixo. Então é uma situação muito fluida neste momento. Você está se metendo agora. Você tem habilidade para tudo isso. Então esta é uma lista de desafios que você pode enfrentar. Se você é um cientista de dados, cabe a você. Avalie-os e veja se você vai estar pronto para tudo isso. Este vai ser o Howard. É e este trabalho vai parecer. Então eleva isso e tome uma decisão informada. Essa é a minha recomendação. Obrigado. 15. Como criar seu conjunto de habilidades: Olá. Este é o seu instrutor, Cameron. Nesta seção, vamos ver como você pode construir um conjunto de habilidades que você porque definido para se tornar um cientista de dados. Assim, as habilidades para se concentrar em nós vimos isso anteriormente nos papéis e requisitos de habilidades para ciência de dados. Você deve se concentrar em alguma habilidade de programação como nossa luta ou até mesmo assassino Jabba. SPS é produto ormat. O que de nós matou você escolheu se concentrar. Você precisa se concentrar em uma habilidade de banco de dados como s Cuba são o ecossistema amontoado. E você tem que aprender algo sobre matemática e estatística. Além disso, algo sobre a construção de conhecimentos no domínio. Então você tem esse monte de habilidades para se concentrar. Então, tenha esta lista de verificação no lugar. Então, como você vai desenvolver essas habilidades? Então, antes disso, você quer decidir qual é o papel que você vai desempenhar? Eu vou ser como um cruzado solitário, nesse caso você vai aprender todas as habilidades. Você vai fazer parte da equipe para que você possa apenas se concentrar em um rolo? Eu vou fazer, como consultoria, como consultoria, não um trabalho a tempo inteiro? Se você é uma pessoa consultor novamente. Você tem que aprender, Mestre, muitas habilidades devem aprender. Se você está procurando um emprego em tempo integral, você pode apenas focar em uma escola novamente. Tens de escolher o teu papel. Se você vai ser como um engenheiro de dados não foi menos para estatística. O que é o líder? - Você? Você pode apenas com base em sua experiência ou sua falta de amor fora é tudo, mas também a bordo . Que tipo de coisas você quer se concentrar na primeira coisa que você quer fazer e folclar o mundo em suas habilidades que está explorando o que você já tem. Se você tem trabalhado no que eu sinto por algum tempo, você já adquiriu algumas habilidades técnicas. Você sabe que tem habilidades no desenvolvimento de banco de dados SQL, como desenvolver programas que funcionam com bancos de dados. Gerenciamento de banco de dados, como um banco de dados, um tipo de trabalho fora. Você também pode já estar fazendo isso, então tente explorá-los, usá-los e projetá-los. Ter você vai a entrevistas, programar habilidades em projetar arquitetos, habilidades, coisas assim. Eu me lembro se você olhar para sinais de dados, exigência de trabalho que, digamos, 10 anos de experiência em ciência de dados você conhece esse tipo de coisa. Eles nunca vão conseguir uma pessoa assim. Então você tem que, você sabe, usar essas escolas que você já tem e projetá-las como parte de seus dados. ciências, escolas de domínio. Se você tem trabalhado em um domínio adaptado, você sabe, você estava trabalhando em uma empresa financeira Tente aprender algo mais sobre finanças e dizer isso. OK, estou familiarizado com este domínio. Coisas assim. Tente aprender mais sobre seu dormitório e construir suas escolas que em seu domínio isso não é algo Você está indo sozinho em um curso de treinamento. Então você tem que usar sua experiência de trabalho atual para construir esse tipo de habilidades e, finalmente, escolas de gestão se você está fazendo consultoria, se você está fazendo gerenciamento de projetos, se você está fazendo entrega como você é como um gerente de 90 em gerente de engenharia, todas essas habilidades vão entrar em jogo e ajudá-lo em seu trabalho por ser um cientista de dados . Então, se você estiver fazendo qualquer um desses, isso vai lhe dar muita experiência e trabalhar com equipes que se conectam com diferentes departamentos, trabalhando com pessoas, ficando preocupados, em seguida, em levá-los a Coisas uppal e coisas assim. Então tudo isso vai entrar em jogo quando você vai estar fazendo ciência de dados. Então tente explorar todas essas habilidades que você já possui habilidades de construção. Qual é o seu tipo? Você sabe que tipo de pessoa aprendente você é. Pessoas diferentes têm níveis de conforto com diferentes tipos de aprendizagem. Sabe, coisas como auto-estudo. Pior é estudos guiados. Algumas pessoas gostam de fazer auto-estudo. Algumas pessoas gostam de estar em um guia e ambiente. Algumas pessoas tentaram aprender lendo. Algumas pessoas tentam aprender ouvindo. Sabe, há opções de ganho que as pessoas têm online. Qual é a sala de aula dele? espécie de ambiente outra vez. Diferentes níveis de conforto para pessoas diferentes. Então, quais foram, uma vez que você escolher qual nossa fazenda fora de estudo habitual. Esteja pronto para muitas mãos em exercícios. Você sabe, sinais de dados envolvem um escoamento e nas próximas fases casais fazendo-os, você vai se divertir muito. Com todos esses exercícios, você definitivamente precisará de ajuda técnica. Você sabe, Web é um ótimo recurso para obter ajuda técnica. Há um monte de fazendas lá fora onde você pode ir e fazer perguntas e obter ajuda sobre quando você está fazendo qualquer um desses estudos. Tente construir um bom sistema de amigos com quem você possa conversar e, você sabe, interagir e entender as coisas. Sistema do corpo é uma boa maneira de aprender dados, ciência , seus sentidos, não amor ou algo como Há um livro Java mastering que você vai ler e sua família com isso não vai ser tão fácil ferramentas. Claro, isso combina com você baseado no continente. Flexível Bi Onda, a orientação que está disponível no curso. O que quer que você conheça, faça uma avaliação sobre o que você precisa e escolha com base nisso. Então vamos olhar para auto-estudo. Quais são as vantagens do auto-estudo? É barato. Era flexível. Faça isso em seu próprio tempo, e o mais importante, você pode criar seu próprio programa em que mata você pode escolher as coisas que você quer aprender e ignorar as coisas que você não quer sozinho. O desafio é, assim, um novo campo. Sabe, os líderes acabaram. Silver é um novo campo. Um livro não vai sufixar. Não é como se eu tivesse feito um mestrado em livro Java, e então eu terminei com isso. Não vai ser assim em muitos livros. Acompanhar o sucesso requer muita disciplina em muita persistência. Andi, você vai precisar de um lugar para conseguir alguns estudos de caso e trabalho de projeto. Você sabe, quando você faz auto-estudo, isso não é algo que você vai ter quando você ler um livro, você sabe, encontrar caminho para algum projeto pior e obter algumas mãos em exercícios sobre o que centros de dados todos a bordo se você fizer um curso guiado que Brundage , é claro, será uma orientação e orientação. Dado que este é um novo campo, acho que eles ainda estão evoluindo. Este tipo de orientação e orientação pode ser realmente inestimável. Berços de previsão e conclusão de conforto. Quando você tem uma costa fechada, ele tem seu próprio agendado. Está em tarefas. Você tinha que completar as coisas, seus testes, e isso faz muito mais disciplina que tem geralmente aparecer rede de estudantes, quem pode com quem você pode trabalhar para fazer as coisas e aprender mais. Os desafios, é claro, nos cursos graduados vão ser caros. Você precisa ter tempo para eles, e alguns tópicos podem ser desafiadores contra o artístico. Você sabe, pode haver alguns tópicos lá, mas você não quer sozinho. Você não está confortável aprendendo, mas você tem que fazê-lo porque é uma parte do curso. Haverá certas coisas que você já sabe, mas você deve adorar fazê-las por causa da parte do curso. Então, se você está fazendo seu próprio estudo, você pode escolher o que você quer aprender em um curso guiado. Você é um porco, todos eles, sabe. Portanto, isso é um desafio. Então, uma das opções de aprendizagem para começar com diplomas e certificados são para três universidades. Muitas universidades estão chegando com diplomas e certificados para sinais de dados, como algumas pessoas chamam. Eles assinaram algumas pessoas chamam isso e tudo leva dados, e eu vou enviar um monte de nomes diferentes sendo dado para esses diplomas e certificados. Mas todas as universidades estão percebendo que seu data center será um campo muito próximo com a banha fora da tração estudantil. Então eles estão tentando criar um lá. É um nascimento disponível na sala de aula. Mais pedir menos no modo online comum. Era um currículo completo e fresco. Os professores e eles estão dentro. As universidades estão ensinando. Há reconhecimento para esses graus e certificados, o que é bom. Você pode dizer que eu tenho um diploma ou um certificado deste reconhecimento. Era suposto eu dizer que o tinha para auto-estudar. Isso é sempre uma grande diferença. Leva muito tempo de calendário, especialmente em meio período. Leva tempo e dar ao luxo de obter diplomas e certificados. Sabe , não vai ser simples. É muito caro. Saiba que os cursos universitários são muito caros. Tenho que gastar muito dinheiro tentando pegá-los. Portanto, isso é algo que você deseja considerar com base na disponibilidade de seus recursos. A próxima opção é M. O. C. Todos os cursos on-line, massivamente abertos que estão saindo por aí. Esta é a nova forma de aprendizagem que evoluiu nos últimos dois anos. Em ciência de dados está novamente no topo dessa lista que coursera oferece os sinais de dados certificados de especialização . Depois que a senhora verificou, ouvi que o em pro tops e 14 quando o discurso começou. Há 2,8 milhões de inscrições para pelo menos um curso com o certificado que é enorme. Udacity e editais também oferecem pontuações e os tribunais, e eles são sinais Isso é muito barato. os cursos de Coursera, como $500 em, fazem todos os detalhes de veracidade. Todos eles são como menos de US $1000. Você pode obter um certificado completo. Eles são apoiados por uma universidade muito legal. Então isso é bom. Mas principalmente o estudo assim e ajuda de pares. Sim, tem algumas palestras lá fora. Sim, mas muito disso vai ser estudo e ajuda a si mesma. É assim que você mais desejaria isso novamente, a menos que eles e revisá-los e ver se você quer fazê-los. Em seguida, vem o mercado online, onde há um monte de sites fora que estão dando-lhe uma série de ofertas em cursos cursos on-line. Neste ponto, quero dizer que o Veto Mastro também está a elaborar os nossos próprios cursos sobre ciência de dados. Então, faça check-out do mesmo site. Aqui estão dois c. Procure os cursos. Então, novamente, um pouco de marketing aqui para nossa própria empresa que sabemos também estará fazendo cursos on-line sobre ciência de dados. Então, no mercado online, há uma série de ofertas lá fora, as baratas, mais baratas. É flexível para a sua agenda. Tem acesso em todo o mundo. Então, se você é uma pessoa viajante não importa. Você pode ir a qualquer lugar e aprender que se você é mais uma parte do globo em que não importa , você ainda pode aprender. Ah, os problemas com isso como ele faz mentoria limitada, você sabe que você está sozinho por conta própria. Andi, certifique-se de ler os comentários e pedir opiniões sobre as várias opções que estão disponíveis no mercado online novamente, algo que você quer fazer. Uma consideração cuidadosa pois há uma nova opção que está chegando que é chamada de opção de boot camp. Há uma nova categoria de treinamento que está chegando. Há algumas empresas que oferecem este tipo de treinamento de acampamento de livros. É um treinamento intensivo em mãos que é fornecido por algumas semanas ou um par de meses que são realmente alimentos projeto Fletch que são oferecidos como parte desses campos de inicialização, mas a questão é que você precisa fazer investimentos de tempo significativos. Alguns desses acampamentos são realmente, como eso em tempo integral. Você tem um divórcio como 34 semanas no campo de treinamento. Você não pode fazer mais nada para aqueles que eu sou compromissos que são necessários. Então você está em todos eles se Deus é um gráfico e custa, claro, mas é uma boa opção para alguém que é novo, eu d. Porque você tem alguma experiência realmente programando projeto riel muito rapidamente, e isso é algo que você pode mostrar em sua estimativa. Dedo dos EUA. Você fez um tipo de treinamento on-line de projeto contra algo que você acabou de ler algo ou um completo e único certificado. Tem mais valor dessa maneira novamente, você tem o acesso avaliar a adequação fora deste tipo de treinamento, Faça sua própria coisa. A última coisa correta vem bem. Eu vou aprender todas essas coisas, mas como você vai praticar suas habilidades? Sabe, as pessoas estão sempre perguntando sobre experiência e de onde você vai conseguir essa experiência? Você pode aprender de qualquer lugar. Há muitas oportunidades para aprender. Mas há oportunidades muito limitadas para você para o bom Experian sob habilidades que você está aprendendo o primeiro lugar para procurar isso, como em sua própria organização, ver se sua organização atual tem algumas oportunidades para sua sentido. Esse é um lugar feliz para você começar várias razões quando você já está na organização, que você possa executar através da organização em Obter algumas atividades realizadas aqui. E segundo, você já está familiarizado com a massa. A minha, a tua família. Com esse negócio, você está familiarizado com a empresa e exatamente como sua empresa faz o negócio. Essas são todas as vantagens para você. Você sabe que pode usar isso como uma vantagem para participar de um projeto de ciência de dados. Sua empresa está tendo. Você tem experiência com a empresa, e isso faz um grande conjunto de habilidades para ciência de dados, você possa usar esse bom em uma equipe de maior sentido. Se a sua empresa começar uma, a outra opção é que você pode iniciar seu projeto sob dezenas e dizer às suas barras ou alguém que está disposto a ouvir que você quer experimentar algo que você sabe que quer experimentar algo com os dados que você já tem e veja se você pode prever algo claramente seu próprio projeto de ciência de dados e tentar ver se você pode criar algo para sua empresa. Esse é um ótimo lugar para começar a praticar habilidades para ciência de dados. Há uma competição aberta disponível. Há uma série de sites que, na verdade, hospeda muito fora de concursos abertos, embora eles vêm com algumas pessoas oferecem conjuntos de dados para essas empresas, então eles muitas vezes este conjunto de dados para consumo público. E eles também colocaram uma declaração problemática sobre qualquer pessoa em todo o mundo pode participar deles também. Resolva-os. Existem alguns incentivos e preços para eles. A boa coisa sobre isso é que estes são cenários do mundo real são problemas que você está tentando resolver. Você pode aprender com esses sites e multidão Kagel em nossa classificação de hacker copo X k d d. Você pode ir olhar para as competições existentes. Você pode olhar para a submissão que essas pessoas outras pessoas fizeram e aprender como eles resolvem os problemas. Você pode praticar no mesmo conjunto de dados e ver o que você pode criar. Você também pode participar nestas competições para ver Você já se apresentou? Estas são todas ótimas opções para você praticar suas habilidades que você construiu para sempre deles. Mas há que as pessoas vão estar perguntando sobre você já praticou suas habilidades que sua experiência prática e estes são alguns lugares. Mas você pode ir e construí-lo conveniência tão acima esta apresentação tem sido útil para você em termos de ter você construir seu conjunto de habilidades. Obrigado. 16. Procurando oportunidades: Olá. Este é o seu instrutor, Cameron. Nesta seção, vamos estar olhando por nós podemos encontrar oportunidades para trabalhar em ciência de dados. Começaremos com cientistas de dados aos sábados. Você já deve ter ouvido falar de pedidos, mas os salários dos centros de dados estão passando pelo telhado. Isso é um fato, não apenas uma propaganda. Seus salários são altos para dados. Cientistas, Europa e Ásia ficam mais tarde. A ciência continua a aumentar na Europa. Na Ásia, EUA geralmente estão na vanguarda da tecnologia. Qualquer tecnologia geralmente começa nos EUA . EUA Começa no Vale do Silício. Começa no novo é que você é área gays e, em seguida, começar a se espalhar através de nós e, em seguida leva algum tempo antes que ele entra em sua aberto. Isha, Os sinais maiores ainda está pegando na Europa na Ásia, e os rácios de moeda também desempenham um fator em termos do que os salários estão sendo oferecidos em vários outros países. Uma boa pesquisa dos EUA pesquisas salariais disponíveis a partir de vidoeiro funciona ponto com. Eles aconteceram em uma pesquisa salarial muito boa para cientistas jantar nos EUA A pesquisa salarial informa sobre diferentes categorias de trabalho, habilidades diferentes necessárias em diferentes áreas do que nós e que tipo fora de sanidade o comando abordou pesquisa salarial fazer dar uma olhada nele. Os salários são geralmente uma melhor do que outras disciplinas I D. Este é um dos salários mais elevados dentro da idéia. Domínio para gerentes de sinais de dados, é claro. Você tem um melhor? É uma grande oportunidade. Se você é uma transição profissional experiente de um regular, eu estaria trabalhando durante uma ciência. Os salários de ciência de dados são bons. Novas oportunidades são cães chegando. Então isso é algo experimentado. O atirador profissional deve considerar a transição para a ciência de dados. Então, quais são as oportunidades em vários países idiotas? Geografias e comece com The USA USA é o país líder em software de cientistas de dados e onde as empresas estão desenvolvendo sua experiência em ascensões. Grandes empresas como Lincoln e Google e Facebook e Amazon. Agora essas pessoas têm pro no mundo o que você pode fazer com o sentido de dados. Eles têm enormes vapores de sinais de dados e enormes investimentos e ciência de dados em seus milhões de dólares feitos usando sinais de dados já, e eles mostraram ao mundo como os sinais de dados podem ser usados nos negócios. Agora, há uma série de novas startups de molho que estão chegando. Eles estão focados em algum tipo de sinais de dados. Você sabe, algumas das empresas que são para sinais de dados como um serviço, algumas fora para ferramentas e tecnologias. Então, há muito trabalho acontecendo em sinais de dados no U vai inter lugares. Outras empresas comerciais estão começando a explorar sinais de dados para melhorar seus resultados de negócios . Eles estão vendo o que as grandes empresas como LinkedIn, Google e Facebook fizeram. Eles estão tentando ver se eles podem novamente, uh, fazer a mesma coisa com o Dota deles. Então, nossas empresas têm investimento, investiram muito dinheiro e caráter, muitos dados ao longo dos anos. Então eles estão tentando ver se eles podem usar sinais posteriores para fazer algo com os dados que eles já têm e começar a prever resultados de negócios. Então, nós é o país de redução para a ciência de dados. Neste ponto, trabalhos de consultoria e terceirização estão apenas falando consultoria. Sim, há muito mais oportunidades na consulta com entra em seus sinais porque muitas empresas estão tentando primeiro fazer uma sensação tipo de coisa, tentando fazer um consultor olhar para os dados e ver se há oportunidades antes de começarem a investir em suas próprias coisas em terceirização é meio que pegar. As pessoas não estão na subterceirização que são tanto em sua ciência, mas pode vir à tona mais tarde. A terceirização está apenas pegando. nossa pergunta é, na Europa, se reside, sabe, quais são as suas oportunidades? Estavam a trabalhar. Na verdade, são santos. Geralmente, a Europa fica EUA por um par de anos em termos de adoção de tecnologia. Então qualquer nova tecnologia normalmente começa nos EUA EUA e, lentamente, Mostow, Europan, Isha, uma adoção de tecnologia está apenas pegando. Há um grande interesse esporádico em sinais de perigo em empresas de negócios de raio que você pode esperar um aumento considerável nessas oportunidades abaixo da linha. Em alguns anos, você pode ver muito mais interessantes empresas de sentido de dados fazendo muito mais investimentos e sinais de dados em muito mais oportunidades de emprego chegando para sinais de dados em toda a Europa, esperar oportunidades nas finanças, bancários, setoresbancários, CRM e ciência, aqueles dos domínios onde você veria algum grande crescimento na ciência de dados nas instituições de ensino da Europa novamente estão começando a se acumular em nossas ofertas de dados Santos. Mas a boa notícia é que, claro, há muitas ofertas de Weber que qualquer um pode aprender de qualquer lugar do mundo . Portanto, a educação não deve ser um problema para as pessoas na Europa. As oportunidades de emprego começarão a escorrer à medida que o tempo passa. Então essa é a notícia. O que eu emitiria uma Austrália do Pacífico é liderar em oportunidades e salários quando se trata de sinais de dados, na verdade, tem sido o estrangeiro para ciência de dados na região Ásia-Pacífico . Singapura está mostrando muito fora de promessa, e há sinais que parecem ter muito interesse nessa pequena área. prisões de negócios estão mostrando interesse em construir equipes de ciência de dados e fazer algum trabalho de ciência de dados para que você encontre oportunidades em Cingapura para sinais de dados. A China está lentamente começando a pegar na parte de adoção de tecnologia do negócio. Você ainda não viu muito fora da adoção de negócios, apenas uma tecnologia, uma adoção de tecnologia que está começando a crescer fora do curso, você verá mais oportunidades chegando na China. A Índia está queimando uma base de talentos significativa, pois há sinais de que estão um número fora mercados na Índia oferecendo seus cursos de ciência fora. Os alunos mostraram interesse e escolheram esses cursos. Empresas offshore estão construindo ilha e antecipação de obras. Muitas empresas estão investindo indiano, EUA e estilo, e e construindo um Breda em libra e e a Índia continuará a ser um grande provedor de recursos off source como eles estão sendo em i d. Então você vai ver um Playoff talentoso. Talentoso. O que? Nós e a Europa nos próximos anos da Índia. É assim que, ah, as várias geografias aumentam em termos de suas oportunidades de ciência de dados hoje. Onde é que arranjas emprego? Sabe, vamos começar com quais são as posições para as quais as pessoas estão pedindo? Há, evidentemente, mais postos de trabalho técnicos do que cargos de gestão. Doors Doors ainda está sendo considerado dentro da linguagem. Muitas vezes eu D equipe estão na equipe de engenharia, modo que o gerente de regularidade do gerente de engenharia normalmente continua a gerenciar as equipes de ciência de dados também, então há mais trabalhos técnicos do que cargos de gerenciamento. Neste ponto, títulos para os trabalhos muito parecidos com seus designados Advanced Knowledge leva engenharia de dados, gerenciamento de dados, análise preditiva. Este lote cortou diferentes tipos de títulos. Os títulos estão saindo. Então, o que é importante para você é olhar para os requisitos do trabalho para entender qual é o papel exato. Então, olhe para os requisitos do trabalho e veja o que é. O que o trabalho exige de você para entender o que exatamente esse papel vai ser. Então, há muitos nomes sendo usados em todo o mundo. Cientista de dados Bonito meio-dia. Então, você sabe, não muitos têm mais de dois anos de experiência. Então o que isso significa é que se alguém está pedindo para a abertura de ciência de dados Jerious, eles não vão encontrar muita experiência. As pessoas estão jogando por isso. Assim, a educação e o entusiasmo podem ser grandes alternativas à experiência. Você sabe, você ainda pode se inscrever, e então você sabe que você está interessado em ir lá e aprender algo novo. Sabe que pode ser interessante recrutá-lo. Isso não vai ser um monte de pessoas que têm mais de dois anos de experiência em ciência de dados . Mesmo que a posição exija algo como sete anos e 10 anos de experiência em ciência de dados . Eles não vão encontrar alguém com esse tipo de experiência tão fácil. Que outro trabalho? Sexta-feira, você pode ir à procura de emprego para os santos. Internet continuará a ser a melhor opção de busca de oportunidades. Nenhuma Internet é, na verdade, quase como adicionar 90% do trabalho. Então só hoje acontecem através da Internet e todos os sites de trabalho populares regulares fazem Cataldo a especialização. Você sabe onde quer que seja. Onde quer que você tenha procurado empregos para 80 você pode ir lá e procurar por suas vidas e empregos . Não há nada de especial nisso. Um aqui é considerado uma resinas é considerado uma das categorias grandes categorias dentro I . D. Jobs para que você possa ir lá e procurar a especialização. Eu não vou falar aqui mais sobre quais sites de tamanho de trabalho usar. Você pode já ser família com muitos desses sites de trabalho, então vá e use o que você estiver confortável com. Você deve ser capaz de procurá-los. Existem alguns sites especializados onde você pode encontrar trabalhos específicos assinados de dados. Estes são esses sites, ciência de dados dedicada, então, então, como dados assinados, carga central e Cody Nuggets são algum site que eu dediquei a ciência de dados. Então, um monte de dados Pessoas que procuram por profissionais de ciência de dados fazer um jogo neste site. Eles não têm um fórum de emprego no qual eles vão em um prato. Então faça o que você poderia verificar esses pais porque eles oferecem centavos de dados empregos exclusivos nestes sites, educação e treinamento. Muito bons trabalhos que estamos falando quando esta educação e treinamento, treinamento de educação, empregos como um professor e Ayla sinais são um professor e instrutor de sinais de dados. E há sinais que até esses estão começando a pegar. Então essa é outra oportunidade para você conservar fora, colocar o estrogênio na fantasia. Mas os trabalhos de consultoria são contra começar a pegar eso. Você também pode procurar por esses tipos de empregos, você sabe, consultoria para sinais de dados, empregos temporários em um trabalho contratado. Eles também estão começando a pegar. Mas eles ainda estão em uma espécie de fantasia para quando se trata de seus sinais. O melhor lugar para procurar um trabalho de ciência de dados hoje é a sua empresa atual. Esta é a minha opinião pessoal. Por que sua empresa atual é o melhor lugar para procurar em um emprego dezenas porque você já sabe que ele faz o meu. Negócios e organização. Habilidade de domínio e experiência é uma habilidade muito importante quando se trata de sinais de jantar. E você já tem essa experiência para sua empresa atual, o ótimo lugar para, uh, jogar suas habilidades recém-desenvolvidas que você passou por um treinamento. Você coloca um conjunto de habilidades, você precisa de um lugar para jogá-lo. Sua empresa atual é um ótimo lugar para um avião. Como você pode fazer isso? É que você pode oferecer para trabalhar em um projeto sentido maior. Você sabe, se você tem pessoas, você pode falar com algumas pessoas e você tem. Você pode criar uma oportunidade você mesmo, falar com seu povo. Seu empresário. É o gerente do “Diga isso”. Acho que posso usar ciência de dados para algo aqui. Eu posso usar alguns dados que temos aqui e tentar olhar para os dados e ver se há algo que eu possa inventar com algum tipo de oportunidade de negócio, algum tipo de implementação do negócio. Eu posso ir usando preditivo e outros dias que você pode fazer dentro de sua própria empresa que é ótimo porque você pode encontrar um emprego dentro de sua empresa para fazer suas coisas. Você vai ter alguma experiência em sua empresa também vai se beneficiar oferecido. E você vai estar, tipo, tipo, pagar ou não dentro da sua empresa quando se trata de tecnologia. Então, tudo isso é ótimo para você. Então criar oportunidades, se você puder, dentro de sua própria empresa, assim você pode eu só para projetos gênero. Seus gerentes controlam. Que ciência de dados pode melhorar os negócios. Mostrar possíveis receitas difíceis são economia de custos para em projetos, e isso é mais importante, seus sinais. O benefício que você vai projetar mas cientistas de dados tem que ser algo como receita forte e cortes duros. Economia de custos. Você tem um projeto? Tem certeza de alguns números de dólares. As pessoas vão se interessar. Eles podem dizer o suficiente em um projeto. Você pode fazer um pequeno projeto. Sabe, isso pode não custar muito dinheiro. Se você estiver usando recursos existentes, mostre alguma receita na definição. Essa receita. Pense em provas ou tabaco? Sim, sua empresa pode crescer em sinais de dados. Pelo menos você terá alguma oportunidade de trabalhar no projeto real e obter algum expediente. Então sua empresa atual é uma ótima cama quando se trata de, uh, usar suas habilidades no eBay e ganhar alguma conveniência. Espero que esta apresentação seja útil para você. Obrigado. 17. Conclusão: O instrutor, Cameron, aqui chegamos ao fim. Queremos ser um curso de cientista de dados. Um grande obrigado por se inscrever para o curso e ser um estudante. Esperamos que este curso esteja sendo útil para você. Nós adicionamos ler um mestre estabelecido com um objetivo do curso para educá-lo sobre o quê? O campo de sinais de dados Todos a bordo. E creio que conseguimos isso. Então, obrigado pelo seu tempo. Esperamos que esta seja uma experiência gratificante para você. Se você não gosta do curso, por favor, faça o comum positivo para o curso em, por favor, recomende o curso para as pessoas que você conhece Para que todos os outros possam se beneficiar dele. Não espere mais cursos sobre sinais de dados do Vito Mastro Este é o seu instrutor mais calmo e desligando. Obrigado Por