Quantos participantes são suficientes? Tamanhos de amostra para pesquisa de UX

Gavin Lew, I believe experiences matter.

Tenha acesso ilimitado a todos os cursos

Oferecidos por líderes do setor e profissionais do mercado

Os temas incluem ilustração, design, fotografia e muito mais

Tenha acesso ilimitado a todos os cursos

Oferecidos por líderes do setor e profissionais do mercado

Os temas incluem ilustração, design, fotografia e muito mais

Aulas neste curso

- 1.
  
  Introdução
  
  0:54
- 2.
  
  Vamos definir a pesquisa
  
  3:28
- 3.
  
  Por que é o número de participantes Importantes?
  
  3:50
- 4.
  
  Testes de usuário formativo
  
  14:43
- 5.
  
  Reaspiração de sumário
  
  8:21
- 6.
  
  Tanto?
  
  8:59
- 7.
  
  Melhor que a B? Testes de hipóteses
  
  11:28
- 8.
  
  Exercício de teste
  
  4:37
- 9.
  
  Conclusão
  
  2:00

Nível iniciante

Nível intermediário

Nível avançado

Todos os níveis

163

Estudantes

Projeto

Sobre este curso

Algo que você pode ser solicitado ao fazer em um estudo de pesquisa de UX é:

Quantos participantes está usando?
E por quê.?

Todas muitas vezes, usamos o que foi feito no passado como a resposta. “normalmente, vamos apenas executar de cinco ou sete." Este curso vai fornecer a ciência por trás da resposta para ajudar a decidir, mas melhor — justificar sua resposta.

Você vai aprender

- Por que o tamanho de amostra

- Factores que influenciam o tamanho de amostra para testes de usabilidade (de aderência)

- Quando importante importa: estudos de Summative como a validação antes de lançar em estudos de pesquisa de mercado de mercado

- Ferramenta de decisão para o UX

Este curso é para qualquer pessoa que esteja envolvido em na realização ou patrocinadora de UX de de , incluindo

- pesquisadores de UX que desenham e conduzam o estudo

- Gestores que pagam pelo estudo em seu produto ou serviço

- Designers que usam a pesquisa UX para melhorar seus designs (eu pode ser que eu pode ser para a maior parte nos resultados?)

Alguns background no UX é útil, mas não é necessário necessário. Vamos mergulhar!

Conheça seu professor

Gavin Lew

I believe experiences matter.

Professor

Hello, I'm Gavin. I believe experiences matter.

For the past 25 years, my career has been focused on those four words. My work has centered around research that informs design to make products successful. This is not about "satisfaction," but what I call UX Adjectives and Adverbs. These are the words that evoke more tangible experiences, such as Intuitive, Engaging, Inspirational, Fun... These are the terms we want to hear about our product designs! This is where the bar should be! This requires pushing the UX envelope to new levels of design thinking.

I have taught UX at the undergraduate and graduate level for over 10 years--specifically at DePaul University, UC San Diego, Management Centre of Innsbruck, and recently at Northwestern University. I hold Adjunct ... Visualizar o perfil completo

Habilidades relacionadas

Design Design de UI/UX

Level: All Levels

Projeto prático de curso

Como pesquisadores de UX, somos solicitados para capturar experiências e o método pode variar tremendamente e a amostra de tamanho. Como este curso fornece alguns da ciência por trás de UX, peço que você publice em sua empresa de projeto, para que possamos ter uma sensação para a diversidade de aplicativos de pesquisa em UX e a mesma tamanho.

A melhor maneira de ser excelentes pesquisadores Publique resumidos de seus projetos e vou tentar refletir e fornecer alguns a sua alimentação para pensar. Esse caminho, podemos entender coletivamente sobre UX na prática! Saiba que há em todos os projetos se orçamento ou artefato para ser testado para simplesmente tempo. Mas, vamos aprender com as outras!

Então, de presente informação na galeria de projetos usando os exemplos de dado no curso como seu guia. Seu projeto pode ser algo em que no momento esteja trabalhando ou pode ser um dispositivo hipotético, ferramenta ou recurso:

Qual foi o objetivo de pesquisa? Exemplo pode ser tão simples como "Device A de melhor que o dispositivo B?. para "queríamos encontrar o melhor nos atributos do curso em um número de dispositivos competitivos.”
Em que método e medida você decidiu Isso pode ajudar a dar o sabor para o que você fez
Quantos participantes deve ter em seu estudado? Este é o número interessante e eu espero que haja variabilidade enquanto houver a pesquisa é variável!
Como você justificou essa recomendação? Por favor, seja seus pensamentos sobre a razão por que você escolheu o número de participantes que usou ou vai usar. E fique à vontade para indicar qualquer caveats que ajudaria a que os leitores a entender seus desafios.

O objetivo não é crita, mas nos ajudar em respeitar e reconhecer as complexidades e trades que tornam a pesquisa UX tangível para nós. Todos estamos nas de situações em que você fez não era ideal, mas foi melhor do que não fazer a pesquisa.

Agradecemos por seus projetos. Espero que todos fique útil e esclarecedora. E vou fazer o meu melhor para responder à postagem

Nota do curso

Por que fazer parte da Skillshare?

Faça cursos premiados Skillshare Original

Cada curso possui aulas curtas e projetos práticos

Sua assinatura apoia os professores da Skillshare

Aprenda em qualquer lugar

Faça cursos em qualquer lugar com o aplicativo da Skillshare. Assista no avião, no metrô ou em qualquer lugar que funcione melhor para você, por streaming ou download.

Transcrições

1. Introdução: Oi, meu nome é Gavin Lou. E imagine o diretor Bold Insight, uma consultoria global de UX baseada em Chicago. Eu venho fazendo seu ex por cerca de 25 anos agora. Nos últimos 10 anos, lecionei aulas de pós-graduação em várias universidades. O que eu gostaria de fazer nesta série é trazer a ciência de volta à UX. Nesta aula. Quero que responda à pergunta. Quantos participantes são suficientes? É uma pergunta de tamanho amostral. É realmente importante porque os participantes custam tempo e dinheiro e realmente a peça chave para qualquer projeto de pesquisa que você faz. Então o que eu gostaria de fazer é dar a vocês as perspectivas do que as pessoas estão dizendo em termos de regras básicas, todo o caminho até a ciência e racional por trás disso. Assim, você pode justificar o tamanho amostral que você escolher, seja 57 21 ou muito mais. Então, ao longo desta série, vamos ter uma série de tópicos que tenho durante as minhas aulas. Espero que goste 2. Vamos definir a pesquisa: Então, a resposta. Quantos participantes são suficientes? Vamos começar com a definição da pesquisa de experiência do usuário, porque eu acho que isso é realmente importante para nós entender o tipo de estudos que exigem diferentes tipos de resultados mas também diferentes tipos de participantes e diferentes números de participantes. A primeira coisa que quero falar é que a pesquisa de mercado e a pesquisa de experiência do usuário são muito complementares. Então, quando penso em quantos participantes é suficiente, realmente depende do tipo de estudo. Então o que eu quero fazer é ter certeza de que todos nós estamos na mesma página do tipo de pesquisa que está sendo realizada. E vamos começar o mais alto nível. A diferença entre experiência do usuário, pesquisa e pesquisa de mercado. Eles são muito complementares, mas eles são diferentes em pesquisa de mercado. Você está tentando fazer perguntas como Quais recursos as pessoas querem? O que eles inspiraram para saber se suas necessidades e muitas vezes quanto eles vão pagar? Agora? Essas perguntas são muito importantes em um produto de construção, mas o que você tira daí é que você realmente tem que construir algo, e é aí que você X entra. É aí que você pesquisa X entra, onde você está tirando a pesquisa de um protótipo, um design, e você está informando que o está melhorando. Então, de certa forma, gosto de pensar nisso como pesquisa de mercado é de natureza muito atitudinal. Ele fala sobre quais são os elementos no caso de negócios, mas então você pesquisa X leva para realmente construir. Então, em algum sentido, é garantir a entrega da marca. É garantir que o produto é bom e, portanto, são os comportamentos que importam. Não é o que as pessoas aspiram, o que é o que realmente fazem com ele, mas eles realmente o tocam. Então não é sobre a estética. Não se trata de opiniões ou aceitação. Quando estamos falando de você X, é sobre comportamento, e esses tamanhos de amostra são diferentes. Então aqueles que são aspiracionais e fundamentalmente quando pensamos em você saem realmente duas coisas. É a medida. Como capturamos essa experiência e como a mudamos? Porque as informações que coletamos irão realmente informar o design, moldar a linha no design que você realmente quer, e, em última análise, esse é o comportamento que você deseja. Então, estamos procurando por nós. De quantos participantes você precisa? Então nesta aula gostaria que você fizesse é como um exercício. Considere duas coisas. Considere o dispositivo a e dispositivo. Imagine. dispositivo A é o seu produto existente. É um produto de próxima geração. Onde está o dispositivo? Pode ser uma parte competitiva, ou talvez uma versão mais antiga dessa linha de produtos. Mas, essencialmente, a questão é, o dispositivo é melhor do que falar dispositivo? E quantos participantes você deve testar? Isso lhe dará justificação suficiente na diferença que você poderia então realmente agir sobre ele e mudar o design, uma decisão de negócios? Era o que procurávamos quando pensamos no que é certo. Tamanho amostral, ok, e como capturamos experiências? O que eu gostaria de fazer quando digo justificar é que eu gostaria de trazer da ciência de volta à experiência do usuário . O que isso significa é eu gostaria de dizer o que eu realmente gostaria de ter aprendido na pós-graduação. 10 anos após a pós-graduação, começo a ver todas essas peças entrarem em jogo em termos de tamanho amostral, justificando-a. Quantos é o suficiente? Eu gostaria de trazer isso para este curso para que você possa tipo de ter uma noção do que eu realmente gostaria que alguém tivesse me falado na escola de pós-graduação 3. Por que é o número de participantes Importantes?: Então, nesta próxima seção do que eu quero fazer é falar sobre testes anteriores para pesquisa de experiência do usuário . Então essa é a coisa típica. Você traz pessoas aqui quando pensam em um teste de usabilidade. Mas antes de chegar a isso, quero que todos pensem sobre por que os participantes, e saber quantos são suficientes é importante. É uma questão muito importante para nós pensarmos, porque, para ser honesto, os participantes são caros. Eles custam dinheiro para recrutar ou eles levam seu tempo para recrutar. Quando eles entrarem, você tem que pagar uma compensação. Leva tempo para realmente coletar seus dados. Imagine se você estiver executando seis participantes versus 100 participantes, primeiro de 1000 que leva tempo, e também leva tempo para analisar e sintetizar todos esses dados. Então, quando pensamos sobre o tamanho amostral, muitas vezes é considerado como um custo. Mas também é tempo, tempo para analisar e um grande compromisso de tempo. Então sentindo-se realmente confortável, sentindo-se muito confiante e justificando o número certo participantes que suficiente para obter a resposta e você pode acreditar que é a chave porque é uma questão importante. Então nosso objetivo aqui é aprender. Qual é o número mínimo de participantes que nos fará sentir confiantes de que o que encontramos podemos agir. Ok, então o que você vai aprender nesta seção é quantos? Bem, isso depende. E o que eu vou fazer é dizer que depende da questão de tentar responder o tipo de dados que você precisa e o tipo de pesquisa. Então, o que? Gostaria de apresentar a sua árvore decisória. E nas próximas seções e na seção, você passará por elementos da árvore de decisão. Isso deve dar-vos uma boa ideia de como divido a questão no tipo de estudo que, em última análise, lhe dará o número de participantes. Então a primeira parte desta entrada é pensar em quantos participantes sua primeira pergunta é, ele formou ou isso está nela. E o que eu gosto de pensar sobre a formação é como eu mencionei, é um teste de usabilidade, e a imagem que eu estou mostrando aqui é uma foto de alguém que, você pode dizer, está fazendo uma receita na cozinha. Eles estão construindo um prato. Certo, isso é formativo. Eles estão tentando refinar a receita em si. Agora que é diferente do Summit, onde em summited é mais como, Hey, ele não está testando a receita ou realmente ter todos os convidados para jantar agora é onde a borracha encontra estrada. É hora de realmente se apresentar. Enquanto formativo podemos aprender com a cúpula. É o negócio real. Então, neste exemplo que eu estou mostrando você pensar em formativo é muito útil para o estágio inicial. É útil para a qualidade. Tende a ser um diagnóstico. O que você está vendo na sua frente é um amigo de escuta. Não tem todos os sinos e assobios. Não é todo o tratamento gráfico porque estamos testando a base porque podemos melhorá-la e melhorá-la. Isso é formativo. Podemos informar o projeto. Então, uma pergunta típica, alguém pode fazer. Queremos melhorar o site onde ele está aberto para que os usuários possam encontrar mais facilmente o que estão procurando. Essa é uma forma clássica de estudo, agora que alguns dos estudos ligeiramente diferentes, é um pouco mais tarde no ciclo de desenvolvimento. Pode ser uma verificação. Você poderia ser benchmarking e outros produtos. É um pouco mais de quantidade e uma pergunta como eu mostrei na foto aqui é que pode ser um rótulo de drogas, e nós estamos tentando entender que esse rótulo de drogas nós queremos ter certeza de que ele não vai aumentar o número de dispensação erros levam a esse tipo de confusão. Slot em questão diferente um pouco mawr mais tarde no ciclo de vida, e isso é uma cúpula de estudo. E esse é o tipo de áreas que eu preciso que você pense enquanto nos movemos para quantos participantes testam. 4. Testes de usuário formativo: nesta seção, eu gostaria de falar sobre a forma de teste de usabilidade testando testes de usabilidade para a experiência do usuário. pesquisa tende a ser o tipo muito clássico de pesquisa de pão e manteiga usado para informar ALS I para melhorar os projetos. É muito importante para a metodologia de design centrada no usuário. É algo que a maioria de nós aprende a fazer quando começam a última carreira. Ao fazer isso, quando pensamos sobre a frente dos testes, não executamos centenas, mesmo 20, 30 ou 50 participantes. Nós tendemos a executar um número muito pequeno, o racional em torno de seu conceito deste Magic 5 e eu vou entrar nele. E o que eu quero fazer é falar sobre quais participantes particípios você precisa, quantos e dar-lhe um pouco mais de ciência por trás do que acontece. Então, na Flórida Geral de testes de usabilidade requer menos participantes em algo, e a razão é porque você quer encontrar de alguma forma o número mínimo de participantes para encontrar a maioria ou maximizar o número de problemas. Então, idealmente, você só quer realmente olhar para os problemas graves que você corrigi-lo e, em seguida, testado novamente e continuar este processo de design analfabeto para chegar à verdade, para melhorar seu design. E fazendo isso, muitas vezes é melhor usar um tamanho amostral menor, que é onde chegamos neste conceito de fogo mágico. Foi dito que você só precisa de cinco participantes para executar esses testes de construção e, de certa forma começou com Jacob usando seu. Ele chamou-lhe “arquivo mágico”. E a razão aqui é que o número perfeito é cinco participantes. Você não precisa de mais. É o que Jacob diz. Por outro lado, você tem outros, quer seja Jared Spool, Malek, Malek, outros pesquisadores que olham para esta questão fora são cinco o suficiente, e é aqui que eu quero deixá-los. Eu quero que você pense sobre tudo o que aconteceu com isso para que quando você tomar sua decisão, você possa justificá-la e você possa viver com os resultados. Você pode criar seu estudo, projetá-lo, executá-lo, analisá-lo e fazer as coisas funcionarem. Sabendo se escolheste cinco para sete, 15 ou 21, quero que possas justificar porque escolheste o fogo mágico. Você pode ver um gráfico bem aqui no eixo X. Ele mostra o número de problemas de usabilidade para baixo. Então, realmente, você quer encontrar um monte de para quantas pessoas você quer realmente testar? E a lógica aqui é que se você testar ninguém, você vai ter zero insetos. Se você testar um participante, você vai notar na linha. Ele recebe cerca de 25 30% de problemas de usabilidade lá fora. Então lá está ele com um participante para encontrar 1/3 fora dos problemas. Mas geralmente 1/3 não é suficiente. Você quer fazer um pouco mais se você testar um segundo propósito. Esta segunda parte não vai encontrar alguns dos mesmos problemas que o primeiro fez e de novos . Quando você vai para 1/3 participante, eles vão continuar a adicionar ao número de problemas e vai continuar a encontrar os problemas os outros fizeram. Então, com três participantes, você chega realmente perto de 70 60% de intervalo de feno do número de problemas lá fora que existe naquele dispositivo que interface três pessoas confinaram cerca de 60% dos iniciantes. À medida que você recebe participantes Mawr e Mawr, você encontra cada vez menos novos problemas fazem problemas. Então isso é o que eles chamam de retornos decrescentes. O conceito. Anos após o quinto participante, você está começando a perder tempo e dinheiro porque você está recebendo as mesmas descobertas uma e outra vez, e aqueles que se sentaram no teste de usabilidade. Exorto as pessoas a fazerem isso. Se você está sentado em um teste e talvez você tenha passado por cinco ou seis participantes em um único dia, você verá esse conceito de retorno decrescente que eu provei que as pessoas que são vice-presidente sentam no fundo da sala, e eles olham para mim em Hago. É o primeiro dia. No dia 16 de sete pessoas falharam miseravelmente no elenco, e todos disseram aproximadamente a mesma coisa. Qual é a sua aposta? Que amanhã, se fizéssemos exatamente a mesma tarefa em sete novos participantes iriam ver seis deles . Esse é o conceito de retornos decrescentes. Você vai continuar adicionando mais participantes, mas você não está recebendo mais insights. Nós ainda estamos vendo o mesmo problema, e essa é realmente a lógica que foi usada por Jacob. E se você levar isso ao extremo usando sua lógica com 15 participantes, você vai encontrar 100% dos principais problemas de usabilidade, e é por isso que você não precisa necessariamente de 1 15 agora. Como mencionei, há escolas de pensamento e outras pessoas que tentaram investigar se 5 15 ou suficiente e eles chegam ao número conclusão. Não é o suficiente. Você precisa de muito mais de cinco para encontrar o que está procurando. Então, o que você faz agora? Você tem um pensamento de escola em cinco, outra escola de pensamento que diz muito mais do que quebrar a ciência disso. Estou mencionando retornos decrescentes. O maior estrondo para o seu dinheiro está certo tem 55 resultados. Faça uma mudança, teste outros cinco e continue fazendo isso. Você vai ficar cara no processo de design centrado no usuário. Mas vamos quebrar como Jacob Nielson realmente surgiu com esse hálito. Então, estou mostrando o gráfico novamente. Acredite ou não, não é baseado em dados reais. Não é baseado em participantes reais. O que é é uma aproximação estatística. É uma probabilidade binomial, basicamente fez duas perguntas. Qual é a probabilidade de você encontrar um problema de usabilidade? É baseado em quantos problemas você realmente quer encontrar. Você quer encontrar muitos deles? Digamos 99%? Em que você quer encontrar a maioria deles? Digamos que 85% é o primeiro lugar. A segunda pergunta é: Quão difíceis são os problemas de encontrar? Você pode imaginar que há esses problemas que batem na sua cara. Esses são os grandes problemas, e é sobre isso que Jacob cozinha e normalmente pensa. Quando ele escreveu seu livro, eu sou engenharia de usabilidade. Ele estava pensando sobre os grandes problemas, os showstoppers. Então, se você queria encontrar a maioria das rolhas do show, ele pensou que cinco participantes não eram assim. O que eu quero fazer é realmente dar-lhe a ciência que eu sou por não. Então o que você vê aqui e eu dou todo o crédito do mundo, Just Sora. Ele executa o ciclo de medição de usabilidade ponto com. Exorto-vos a ir a ele. Ele tem ótimos artigos e calculadoras, e eu peguei um lá de dentro. É uma calculadora de tamanho de amostra para os problemas de Severin em um teste de usabilidade ou interface de usuário , então basicamente há apenas alguns valores. Você coloca, você coloca em quantos problemas você quer encontrar? E neste exemplo, 85. Então vamos encontrar a maioria dos problemas. A próxima pergunta é, quão difícil é para o problema ser encontrado? E isso é uma porcentagem. E neste caso, coloquei 0,3 ou mais ou menos. Sabe, três em cada 10 pessoas vão encontrar esse problema, então eu não vou colocá-lo onde é Oh meu Deus, é realmente difícil encontrar apenas uma em cada 100 pessoas. É que uma em cada três pessoas vão encontrar este problema, e eu quero encontrar a maioria deles. Quando você colocar esse cálculo, essas duas variáveis em Dores calculadora para o tamanho amostral. Você vê 5.3 pessoas são necessárias para descobrir a maioria dos 85% do problema, sabendo que o problema aconteceu um em cada 33 Esse é o número mágico cinco. É assim tão simples. Então, se você fosse quebrar e dizer, Bem, se quiséssemos encontrar um conjunto diferente de problemas? Eu queria que Onley encontrasse coisas que aconteceram com muita frequência, então eu mudaria para no primeiro exemplo que eu quero encontrar todos os problemas que aconteceram em um em cada dois. Então você pode imaginar que você está fazendo um teste. Você pode não encontrar o problema, mas você encontra outro problema em outra tarefa. Bem, se houver outra pessoa tomando este dia, descubra o problema. Isso acontece com mais frequência. Se você quer encontrar todos os problemas que aconteceram com apenas duas pessoas, o que é que duas pessoas vão ver? Você precisa de 6,6 ou sete pessoas. Você vê os números para mudar ou o quê? Se você quisesse dizer não? Você sabe o que? Isto vai ser liberado 40 milhões de pessoas. Preciso encontrar muitos dos pequenos problemas, bem como os grandes. Então, vamos tornar mais difícil encontrar um problema. Então eu quero encontrar todos os problemas. 99%. Mas não quero encontrar nada com o Zach na cara. Mas pode levar um a cada cinco. Então, o problema que 20% de seus usuários vão ter agora que pode parecer um problema difícil. Imagine que 40 milhões de pessoas vão usá-lo um em cada cinco desses 40 milhões vão ter esse problema. É um grande problema. Não se acumula na cara. Nesse caso, você precisa de 21 participantes. Então, basicamente, você pode construir sua própria garra. Você poderia dizer, quer saber? Eu quero encontrar esses problemas feitos, mas eu só estou procurando para mostrar rolhas. Eu posso ter cinco ou sete anos, mas se eu realmente quiser cavar um pouco mais fundo, encontrar problemas que você sabe o que quatro pessoas passaram por ele. Mas normalmente, como a quinta pessoa tem alguns problemas. Agora precisamos de mais participantes. É aí que você pode construir seu dedo do pé de confiança. Entenda quantos participantes eu deveria ter, seja cinco ou quer saber, eu me sinto mais confortável se for 21 porque estou procurando no meu problema aqui, todos os problemas e é 20% do tempo que você vai encontrar. Mas há outras questões. Então, você inventa o seu número, justifica o 57 qualquer número que justifique. Há também outras razões para ter mais pessoas no seu filho. Um exemplo é que você tem usuários diferentes. Você tem que grupos de usuários o que você deseja fazer é, você pode considerar dobrar sua amostra. Então, se você decidir sobre sete agora, você pode correr 14. Ou talvez você queira fazer um híbrido onde, você sabe que há muita sobreposição. Seu teste, um paciente na enfermeira. Eles são diferentes, mas há um pouco de sobreposição em suas tarefas. Talvez você teste quatro e quatro e eu tenho oito. Então, em vez de só ter cinco, você consegue. Ok, então essa é uma consideração outra pode ser, como eu posso mostrar aqui que o site de saúde infantil você tem uma seção de pais, uma seção de crianças e uma seção de adolescentes. Agora temos três grupos de usuários. Agora você pode querer considerar se eu comecei com cinco meu alvo ou sete e multiplicá-lo por três e agora recuando 15 participantes, cinco em cada sala. É assim que você constrói e justifica o número de participantes que você precisa. A outra razão pela qual você pode querer mais participantes é a complexidade. No exemplo. Aqui você está procurando modelo de gato. Você pode ter muitas tarefas, ou talvez realmente complexas, e um usuário em sua sessão não pode executar todas as 20 tarefas. Então talvez eu tenha uma amostra onde metade do meu grupo faz cerca de 10 tarefas e outra metade faz os outros 10 passados. Neste caso, se eu escolhi sete participantes, eu preciso de 14 para que eu possa obter cobertura em todas as tarefas nos tamanhos amostrais que eu decidi justificar . Então, essas foram as maneiras que você se define em um número, você justifica obter sua confiança certa, e então você considera, se eu tenho participantes suficientes? Porque se grupos de usuários fossem complexidade, mas vamos também ser honestos. É uma neve. Eu tive situações em que eu olho para alguém, e o diretor de marketing diz que eles vêm de um fundo de pesquisa de mercado, aquele fundo de pesquisa de experiência de usuário e diz, Ei, eu não vou acreditar se eu Só tenho cinco participantes, mesmo se você tiver, ele está dizendo que eu preciso de 50 participantes. E acredite em mim, se eu amarrar essa pessoa e tê-lo assistido 50 participantes pelo participante 25 26 27 eles sentirão retornos decrescentes. Mas, em última análise, essa pessoa não vai se sentar, e você tem que convencer essa parte interessada a fazer uma mudança. Nesse caso, é uma escultura, então talvez cinco não sejam suficientes, mesmo que você possa justificá-lo e você escolha 20 terceiro porque alguém vai agir sobre tantos participantes. Ele fornece conforto e confiança que as pessoas que você descobre sobre mentirosos que é o cheiro. Cheque. Então, enquanto você pensa sobre uma forma de teste, isso é realmente sobre a questão fora. Estou fazendo teste de usabilidade. Você sabe, o número mágico cinco. - Mim. Preciso de um pouco mais por várias razões, seja um tipo de dificuldade ou só preciso de mais para justificar a verificação ortográfica. Como você pensa sobre esses tipos de coisas, você vai percorrer isso no velho justificado. Então o que eu acabei de descrever se eu levá-lo de volta ao exercício inicial do curso é ah, estudo formativo é a usabilidade. É o que você avaliou apenas uma coisa? Vice A. Não é o vício e contra de gelo T único dispositivo A e para a pergunta, quantos participantes? Então eu preciso testar se eu estou apenas testando o dispositivo A. Espero que através deste exercício você possa justificar sua recomendação. Ir para a árvore de decisão em que vai ser baseado é uma formação, ok, é para eles. Que tipo de problemas. Quero ver quantas pessoas, qual é a complexidade, qual é a complexidade, quantos grupos de usuários e, finalmente, qual é o meu cheiro? Verifique e é assim que você define a frente do tamanho amostral com base em. 5. Reaspiração de sumário: Então, nas próximas seções, eu quero falar sobre maior tamanho amostral Mawr pesquisa summited. Como eu mencionei antes. É o momento em que não é formativo. Nós não estamos preparando a receita ou realmente pronto para um jantar formal. Vamos lançar este produto. Então, antes de entrar, eu quero dar a todos um exemplo deste conceito fora de manteiga ou digamos precisão. Então, no exercício do curso novamente, você pensa em dispositivo a versus de gelo ser. Ainda estamos falando de um dispositivo e estamos tentando entender quantos participantes você precisa. Então, quando eu penso sobre isso, nós temos que nos perguntar quantos participantes eu preciso quando eu sei que o tamanho amostral vai ser um pouco maior. E a primeira pergunta que vou fazer é se você está planejando um jantar, você está planejando muitos produtos. Você realmente quer saber a resposta definitivamente, ou você só quer direção? Eu gosto de fazer essa pergunta, e isso realmente surge porque muitas vezes as pessoas querem fazer a pesquisa habitual e querem entender e responder. Mas o quanto eles sabem o quanto eles realmente querem saber. É definitivamente? Ou eu só gosto de saber direção, porque se é direcionalmente, é como colocar o dedo do pé na água para ver o quão frio isso, nesse caso, eu recomendaria usar a mesma lógica que eu usei com Formative 57 21 participantes Esse cheque de cheiro. É a noção da pergunta direcional colocar o dedo do pé na água se vai ser um problema ou vamos ficar bem. Isso realmente funciona com o avançado da lógica usando essa erupção agora. Mas se alguém olhar para dentro e dizer, você sabe o que? Não, eu realmente preciso saber definitivamente. Agora estamos entrando em um mundo onde alguém pode dizer, você sabe, esta decisão vai afetar 40 milhões de pessoas. Preciso de um pouco mais com um maior grau de precisão. É quando você precisa saber a verdade. E é aí que o tamanho amostral mais alto acontece. Ok, então o que eu quero fazer é que eu preciso que você pense sobre essa noção de uma resposta definitiva e este é o meu termo, e eu estou usando isso de novo. Eu te disse, essas são as coisas que eu gostaria que as pessoas me dissessem na faculdade que eu vou chamar de procedimento. Então você é. Você tem um alvo e quer saber se o que encontrou no estudo? A pontuação que você encontrou é generalizar ervas para o que aconteceria na população real . Não vamos testar toda a gente no mundo. Então eu vou pegar uma pequena amostra e vou testá-la. Vou conseguir um resultado. É esse resultado Generalize, herbal. E para fazer isso, o que eu quero fazer é pensar sobre a diferença entre A e B. Você tem dispositivo A e você tem dispositivo ser. Estamos recebendo dados de A e B. Eles são diferentes? Mas vamos pensar na precisão. E a maneira mais fácil que posso fazer por isso por você é te dar essa noção. O que é uma pontuação? Um único placar. Nós gostamos neste mundo de ter um meio para que todos possam fazer este teste, mas nós sempre gostamos de pensar na média. Então pense na taxa de aprovação. Você tem muitas pessoas que entram em um índice de aprovação presidencial. Você tem um número, mas é que o número preciso não é realmente, é generalizar capaz para a população uma das coisas que percebemos é que se pegarmos todos os dados de um estudo, se são 20 participantes ou centenas ou milhares, nem todos pontuam quando você diz isso, você pode colocá-los em uma curva, como eu vejo aqui. E o que é interessante sobre isso é que enquanto você obtém uma média, o resto da curva descreve as pessoas de variação que são um pouco mais altas do que isso . As pessoas que são um pouco mais baixas. E o que é realmente legal sobre esse conceito de “ela normal “nas estatísticas é que se você pegar todos esses dados, eu conseguir uma média e eu poderia começar a entender as características desse conjunto de dados e que eu vou te dar um exemplo só para dar a todos o sentido. O que significa coletar dados que parecem um número ou uma pontuação? Então aqui vai uma pergunta simples. Vou te mostrar uma foto em um momento de pessoas, e tudo que você precisa responder é uma única pergunta. A única questão é um homem de camisa vermelha, então vou te mostrar a foto. Tudo que você tem que fazer é decidir. Sim, senhor. Agora você vai ver um número que meio que passa e como é o tempo e mostra 123 tudo mostra o tempo e tudo o que eu preciso que você faça mentalmente é dizer que o homem vestindo uma camisa vermelha Você acha que sim ou agora. E sabe o tempo que levou para chegar a isso? Ok, você tem então isso é uma pergunta de sim ou não. Há um correto e incorreto. É uma medida de precisão ou eficácia. E digamos que se levarmos todos os participantes estavam assistindo ao longo do mês, é 77% correto. Ok, você também tem tempo próprio relatório, mas você me contou sobre isso, me levou três segundos e eu disse que sim. Algumas pessoas dizem que não, levei quatro segundos. Você tem dois pontos de dados nessa pergunta simples. Bem, e você poderia imaginar coletando muitas outras perguntas sobre satisfação. Outras variáveis. Mas nessa simples questão de é um homem vestindo uma camisa vermelha que coletamos aos jogadores. Ok, então eu vou te dar uma tarefa um pouco mais difícil. Isto é um ambiente hospitalar. O médico está preocupado com os pacientes M C H, pois agora é maior do que o normal. A questão é simplesmente, em 27 de janeiro de 2001 o valor de N. C H dos pacientes foi maior do que o normal? Você decide sim ou não e sabe o tempo que levou. Então, quantas pessoas esqueceram a pergunta? Estes são alguns dos desafios que temos. Eu explodi a mesa para você, e você poderia olhar para ela em 27 de janeiro e eu vou deslizar para a coluna genuína. E então eu vou olhar em 27 de janeiro de 2001. Eu vou até o M, C, C, H Value e o Emcee. Cada valor é 30,8, e é branco. E olha para a minha lenda. É normal. Então o valor do estágio Pacers m foi maior do que o normal? A resposta não está bem, e eu meio que explodi isso para que você possa dar uma olhada. Mas isso é um processo de pensamento. Você encontra o dia, atravessa e olha e então você verifica a lenda, e provavelmente você vai e volta. É assim que as pessoas vêm com a resposta. Alguns dos desafios que algumas pessoas esquecem. A resposta. Tenho medida de precisão no tempo. Mas o que você faz se alguém esqueceu do câncer? O que pode acontecer? E você tira o tempo de folga de alguém que esqueceu a resposta? O que eu faço é fazer uma pergunta simples, e isso é se alguém tiver a resposta, certo? Sim, eles poderiam ter adivinhado. Mas aqueles que receberam a resposta na hora certa é uma medida deles indo para baixo a coluna olhando através de M. C H. C H. A lenda que volta para confirmar que é uma medida dessa eficiência. Se alguém estava errado, você não tem idéia do que eles estavam fazendo. Então amarrar realmente não reflete o que eles pensam porque você não sabe o que eles fizeram . Considerando que se eles obtiveram a resposta correta, é mais provável que você pense que houve uma eficiência no processo que eles usaram. Então lembre-se de sua coleta de duas medidas precisão e precisão de tempo é realmente importante para sentir um monte de pessoas falhar. Isso pode ser mais importante do que falhar, mas o tipo de eventos é muito rápido. Ok, então com essas duas medidas, a pergunta surge com eu tenho um número. Quantos participantes eu preciso para se sentir confiante de que eu tive que generalizar esse número para que seja real para precisão, e, em seguida, esta próxima seção vai realmente você tamanho sela 6. Tanto?: Então eu falei sobre esse conceito de fazer um estudo e obter um número e sentir que esse número é preciso. É generalizado. Então, quantas pessoas você precisa se quiser fazer isso? E quando você pensa em obter um número e coletar participantes, muitas pessoas pensam em estatísticas e o que muitas pessoas pensam da equipe. Eles pensam nisso. É uma foto. Ah, USA Today ou algum fato oy. É algum número que colocou em um rascunho muito bom, e é polonês. Isso é o que as pessoas pensam quando pensamos em equipes. E o que eu quero que vocês pensem é o que é um tamanho amostral que vai fazer vocês se sentirem confortáveis para que possamos generalizar encontrar Teoh. Então imagine um mundo e você pode ver esta imagem de um monte de ervilhas e EPS, ervilhas ou passes e depois falhar. Então, para cada pessoa você recebe um P orna e essa é a população. E com base nesta imagem, acredite ou não, há 60% ervilhas e 40% s, então o após 60 para ele, isso é realidade na população. Como eu sei que o que eu pego representa a população. Então coloque minha mão que são, tire uma pequena amostra, e olhe, vou encontrar sessenta por cada quatro falhas. Esse é o conceito de tamanho amostral. Quantos eu preciso fazer se eu pegar uma quantidade de dedos ou um punhado cheio? Como dinheiro eu preciso fazer para capturar, para me sentir bem com o número? Ok. E para me sentir confiante, há um conceito que eu quero que você pense, e minha analogia é baseada no dardo. É a probabilidade de você ter encontrado resultados por acaso por acidente só porque você acidentalmente pegou a quantidade errada. Isso é confiança, e eu gostaria que você pensasse nisso como um escuro. Então o que eu fiz foi mostrar uma foto de todas as vezes possíveis que você poderia fazer agarras e estudos de vovó . Eu gostaria que você pensasse nos escuros como a chance de você realmente encontrar algo por acaso sozinho. Então, há 20 escuros na imagem e um dos escuros caiu fora dessa área de confiança , e a caixa realmente poderia representar, digamos, 95% de confiança. Se é 95% confiante, isso significa que se eu fizesse este estudo 20 vezes. Apenas um em cada 20 encontrei os resultados acidentalmente. Você vê aquele conceito sombrio da sociedade, Doc Sis. Se eu quiser uma confiança de 99%, isso significa ah, 100 escuros e apenas um foi encontrado meus bens. Essa é a confiança. A outra coisa que você precisa para determinar o tamanho amostral se você quiser ser preciso, é o seu nível de nível de ar exemplo uma posição? Algumas pessoas pensam nisso como mais ou menos 5%. Então você pode imaginar que é o índice de aprovação presidencial, mais ou menos 3% mais para o meu lugar. É esse conceito, eu acho, um monte de mar profundo e, na verdade, brinquedos. A última coisa que você precisa é o número de pessoas na população que você está olhando. Estamos falando do mundo inteiro, da população dos EUA EUA ou de um subconjunto? Você precisa saber quantos. Ok, então aqui vai um exemplo. Há muitas calculadoras de sete tamanhos lá fora. Você só precisa de três coisas. Você precisa saber toda essa confiança. É 95% 1920 escuro ou 99 você precisa saber bem, colocar verão três mais ou menos cinco. Então nós vamos obter um resultado mais ou por algum número e você conhece a população e isso vai dizer o número de pessoas que você precisa. Então aqui está um exemplo. Ah, pesquisa eleitoral presidencial. Digamos que eu queria 95%. Então a probabilidade de eu ter encontrado isso por acaso é 5% de maravilha. Então agora meus níveis de conferência 95. A pontuação que recebo é mais ou menos três. Bonita, bonita, precisa, bonita, muito precisa. E a população não é a nossa população. São cerca de 100 milhões. Você coloca esses números e a resposta é que você precisa 1000 vendo os 1000 participantes se esses parâmetros. Então a questão se torna, bem, House é um monte de gente. 1067 muito. Bem, o que acontece se eu trouxer o erro em vez de obter uma loja e uma pontuação de 70% aprovação classificação mais ou menos três? E se eu fizesse um irmãozinho mais ou menos cinco? Não me enfatiza ir para cima ou para baixo, certo? Faça mais ou menos. E se eu fizer mais ou menos sete? Ok, então o que eu fiz aqui é que eu peguei o estoque lá e coloquei os mesmos números de treino exceto aumentar o mais ou menos três para mais no meu lugar. E a resposta vai de 1000 67 participantes para 384. E se você for para mais nas minhas 70 gotas para 166 ok, isso é um tamanho amostral. Você precisa estar confiante de que a pontuação que você tem é generalizada capaz de despovoamento. Dadas estas orações, deixe-me fazer qualquer coisa. Vamos mudar a população. Então, em vez de fazer a metade da população ou da população, quem votaria? Vamos fazer, digamos, um tipo específico de insulina e torná-lo apenas um milhão de pessoas. Judy mais ou menos pessoas. E este é um desafio porque este é um tipo de conceito que os humanos não eram realmente bons em grandes números. Certo, então o que eu fiz foi dividi-lo para um intervalo de confiança de 95. Aceitabilidade são amostragem aceitável de mais ou menos três mais ou menos cinco perto sete e um 1.000.000 pessoas. E o que eu descobri é que se você verificar esses números, os números realmente não mudam. É 1066 384 e 166 quase exatamente iguais. Ok, então este é um conceito meio estranho, então eu coloquei em uma espécie de mesa. Então, com 100 milhões, os números não mudam entre 101.000.000. Como isso muda se eu for para 100.000 ou cinco habitantes é 10.000 ou 1000 ou menos. O que você vai encontrar aqui é como você quer generalizar a pontuação alta tamanhos de amostra necessários a menos que a população seja muito pequena. OK, então como você pode ver aqui, se a população é de 10.000 você ainda precisa de 960 pessoas, que não é muito diferente de 1000 pessoas, que é de 100.000. É só quando se tem populações muito pequenas. Isso é precisão que aumenta o tamanho. Então, um exemplo. Se houvesse 100 pessoas fazendo isso por último, e eu quisesse dar a todos um teste no meu material e eu queria saber que a pontuação que eu obtive refletia todas as 100 pessoas e eu só levei cinco pessoas. Mas se eu levasse 92 pessoas, quão confiante você está que eu provavelmente não encontrei por acaso que a loja que eles obtiveram mais ou menos 3%. Eu teria 92 anos se quisesse ser mais ou menos cinco. Só 80 e 66. Faz sentido na população pequena. Mas quando a população fica realmente grande 1.10.000 não sabe que você precisa de 1000 381 100. E esse é um conceito que se mantém verdadeiro. Falei com pessoas de ciências de dados, e isto é o que você acabou de falar do apartamento dele. Cópula. Calculou o número de pessoas que precisa para encontrar os resultados. Você pode generalizar o que isso também lhe diz. São 2000 pessoas demais. Esse é o conceito chave. Onde não é que você pode encontrar a quantidade certa de pessoas para recrutar, pagar e analisar, sabendo que você poderia ter confiança que você poderia generalizar e você não encontrou por acaso, no entanto, e esse é o conceito. Então, voltando a esta história, se é um assunto para nós e você sabe que precisa de uma resposta definitiva, é teste de precisão. Se você está testando apenas um dispositivo e aqui está a tabela, ok, e isso é um monte de participantes 384.000 ea resposta é você. Isso é o que você precisa se quiser que uma única loja reflita a população. Felizmente, experiência do usuário estudos UX. Ainda não precisamos do 384. Não precisamos de 1000 pessoas, e é nisso que entrarei na próxima seção. 7. Melhor que a B? Testes de hipóteses: Então esta próxima seção é sobre o tamanho amostral, mas para um vs B, também uma espécie de hipótese. Avaliar. Este é o tipo de onde UX realmente pode entrar em estatísticas e entender o tamanho amostral para comparar uma diversidade. Então, voltando ao nosso exercício original, você tem dispositivo um produto pescoço 10. Eu vejo um ER competitivo ou talvez uma divisão mais antiga fora versão mais antiga, vamos dizer que a questão é assim quantas pessoas eu preciso testar para saber se um é realmente melhor ser? E eu quero que você compre isso. Então nós conversamos sobre essa noção de uma resposta definitiva, e eu falei sobre precisão como uma única pontuação. Bem, isso é um vício A Então, digamos, dispositivo, eles tiveram 85% de sucesso. É mesmo? Você precisa de muitas pessoas para saber que aquele número preciso Israel mais ou menos alguma porcentagem, e você normalmente vê isso em pesquisas. Mas quando pensamos em um versus B, nos afastamos da precisão de um número para a precisão da diferença. Essa é umaperspectiva leve e diferente, perspectiva leve e diferente, e eu quero te dar uma analogia. Digamos que o vício leva 85% e o dispositivo que ele tinha 60%. Não é se a 85 anos sessenta precisa, é se essa diferença. Israel. Se você estava fazendo um estudo de novo, talvez não seja 85 60. Talvez seja 90 e 40, mas ainda há uma diferença. E essa diferença. Israel A é melhor do que essa noção, e esse conceito reduz o tamanho amostral. Você não precisa da precisão que você precisa, é por isso que você não vê estatísticas nas Eleições. Mas se você fez isso não em centenas, se não em milhares. Então o que eu quero fazer é não dizer que é uma pontuação geral acessível? Qual é a diferença? Sempre será melhor do que ser? Isso é generalizado? Ok, então neste caso, você tem noções que você tem que dizer e as hipóteses usarão conceitos de justiça. Mas, neste caso, é chamado de equipes inferenciais. É comparar um vs abelhas como se fosse um teste ou um noma coisas. Você pode ter ouvido estatísticas, e o tamanho amostral que você precisa é derivado de um poder desligado constante. Seu poder significa que eu tenho uma boa chance de detectar uma diferença significativamente se a diferença estiver realmente lá. Se realmente há uma diferença, eu vou encontrá-la. De quantas pessoas eu preciso? O poder dele? Então, um exemplo que eu tenho aqui é Você pode ver esses pacotes de ar em busca usando o hospital era realmente grande e um pequeno, os antigos realmente grandes nos novos ou impacto condensado. E é metade do tamanho. Isso é redundante. Uma pergunta poderia ser um melhor do que B é conhecido melhor do que o velho ou outro exemplo. Vamos ao basquetebol. Vamos reverter alguns anos para 2017. Os Warriors estão indo para os Cats. Quem vai ganhar em algum estudo? Em qualquer jogo, alguém pode ganhar. Outro pode perder. Mas se você cuidasse disso, fôssemos fazer esse teste 100 vezes. Quantas vezes seria Golden State Wing contra Caps? Então pense no jogo como um estudo, e neste caso os visitantes marcaram 54 a equipe da casa marcou 49. Não é o número e a pontuação de cada um. São aqueles 11 contra os outros perdidos. O que é mais generalizar ervas. E então a questão é, digamos que a guerra está vencida e volte para a minha guarda. Exemplo. Na última etapa da última seção, se você tiver um dardo e a probabilidade de que você acidentalmente encontrou isso por acaso é 5% é como correr de repente 20 vezes. E só uma vez aconteceu por acidente. Em geral, as melhores feridas da equipe em geral. Se um é melhor do que ser um em geral ganha e isso é um conceito. Certo, então são essas duas cópulas. Então novamente, se você olhar para minhas ervilhas verdes e APS vermelho, vamos dizer que um grupo tem um monte de falhas e o outro tem um monte de sucesso. Se eu enfiei minha mão lá e fazer o estudo e enfiou minha mão no outro e olhei são a diferença, Eu uso minhas pontas de dedo ou fazendo agarrar ou meu pobre balde velho dedo do pé? Quantas pessoas eu preciso? Esse é o propósito desta seção. É o nível de confiança que você pega a quantidade certa. Então, em hipóteses, testando como poder que usamos para tamanho amostral para precisão, você não precisa de confiança não é 95 ou 99. Você tem uma amostra aqui que você tem uma ruga, e isso é chamado de tamanho de fato. Então, se o imposto especial de consumo é importante, porque ele vai dizer o quão grande é uma diferença, OK e pensando em escuros, você ainda usa 1920 dardos ou um conceito de um Alfa 05 O que é interessante é que eu sempre fui ensinado Hey, Você escolhendo de 05 É um de 20 escuros por acaso. Se você obter um resultado significativo, você pode publicar. Você poderia conseguir sua dissertação, mas talvez um remédio queira uma rua móvel mais alta. Eles podem querer ter 1% de chance. Você o encontrou por acaso, enquanto um negócio talvez não queira resultados publicáveis. Mas quer saber? Ei, há 10% de chance de eu ter encontrado só por acaso. É assim que os negócios podem olhar para isso. Então, sabendo esses fatores que você tem seu como seus escuros, o que é nos afeta tamanhos de efeito, quão grande o problema ou eu vou ser A discrepância é ok, então aqui está o meu exemplo. Temos dois rostos de duas pessoas e vemos quais são mais atraentes. O que estou mostrando aqui é um pequeno exercício na minha próxima vida. Quem é mais atraente? Vizinhos? Este é um tamanho de efeito grande. É uma distinção como você hoje. Ok, outro. Se eu contratei 1/4 em um campo de futebol, você tem 5 minutos para encontrá-lo. Se o encontrares em cinco minutos, dou-te um milhão de dólares. Quantas pessoas você quer ir? Ajude-o na busca em suas amostras contra se eu me esconder. Ah, disco de hóquei para o campo de futebol e você tem cinco minutos. Você pode não precisar desse minuto frizzy, por exemplo. Você pode não precisar de tantas pessoas porque o tamanho do efeito é maior e você não precisa de muitas pessoas. Ok, então é por isso que eu gostaria de ter aprendido na pós-graduação, porque esta é uma mesa. As pessoas me mostraram literalmente. É uma tabela de cálculo de poder, e vou descrevê-la. Há uma seção que é ponto ninguém 0.5 ponto 10 Estes são seus pontos escuros Ninguém é para medicina 0.5 é publicar, e 0.1 poderia ser usado para negócios ao longo das estradas. Você tem o tipo de teste, então o tipo de facada que você faz pode ser mais pessoas do que outros. Então vamos escolher o 1º 1 sendo diferente. Vamos chamar isso de teste T, certo? Existem três outras colunas pequenas, médias e grandes. Isso é um tamanho de fato. Então você escolhe seus escuros. Seu perfil. Escolheste os teus testes. É a diferença média da primeira fila, e eu encaixote-a. Se você tem um tamanho de efeito pequeno, estamos falando de 1/4 contra um moribundo no campo de futebol. Cada pequena diferença você precisa 393 pessoas para que seja médio você precisa 64 é em grande parte um sentido. Deixe-me ir direto à perseguição da escola seca. Quando eu perguntei quantas pessoas devem concorrer para a minha dissertação, meus professores uma corrida até o nosso cálculo e você está olhando para agora e sair bem. Como posso saber se é pequeno, médio e grande? Porque, acredite em mim, eu levei 26 participantes no meu estudo contra 393. Estarei testando o verão todo para uma frase, e preciso demiti-los. Quando eu olhei para eles, eles disseram, Oh, apenas para um cálculo de poder, e quando você fizer seus estudos, você vai saber se é pequeno, médio, médio, grande como o What Você precisa saber? No final, eu perguntaria ao diretor do programa de pós-graduação à vista, você sabe, psicologia. Ei, um local experimental. Quantas pessoas devem fugir? Eles correm 16 ou 20. Eu amo esta mesa, e eu não poderia encontrar 16 ele, na verdade, eu encontrei 20 centavos. Encontrei 64. Eu encontrei 3 93 e eu apenas sentei lá e disse, Eu não entendo por que todos os estudos que eu estou lendo sobre tentar ser como eles para obter minha dissertação. Eles só cerca de 16 20 pessoas, mas nenhuma da mesa do vaso sanitário. Triste o que estava acontecendo? A realidade é esta vida, e isso é usabilidade. Testes normalmente não precisam de estatísticas. Seus objetivos irão defini-la. Vamos amostrar você. O é impulsionado por muitos fatores, e eles dirão que você execute uma análise de energia. Mas vamos falar sobre o que acontece se anteciparmos resultados. Se você quer um estudo e você não encontrar uma diferença, talvez A e B talvez não seja realmente melhor. Ou talvez você não tenha participantes, então eles dizem, Oh, galão. Você não tinha um power run mais OK, mas e se eu corresse 393 e eu poderia tê-lo encontrado 20? Perco meu verão. Eu uso o meu eu perder muito tempo. Então aqui está o segredo sujo, e esse é o último ponto que tenho aqui. O que acontece se você encontrar significado com 20 pessoas? A resposta é que é real. E isso é o que meu professor, todos os estudos que foram publicados antes de mim tinham 16 1 pessoas. Se eu fizer um atordoamento e correr 16 20 achar que a é significativamente melhor do que ser Israel, é generalizar. Herbal exceto o escuro ea porta é um outro 20 I por cento chance. Encontrei-o por acidente. Se eu corri 20 ou 393 o resultado seria significativo. Isso é o que eles estão tentando dizer a sua pragmática. Execute o estudo com amostra menor. Se você achar significado, use isso como sua linha de base. E foi assim que muitas estatísticas saíram nas ciências sociais e passaram para a interação humana com computadores em psicologia, em pesquisa de usuários e experiência do usuário. Então, se você está olhando para uma diferença para você realmente não precisa ter participantes testis 16 20 se você encontrar o resultado, não é bebê, que realmente não é 8. Exercício de teste: Agora, nesta última seção, quero que você sinta a diferença para um vs B. Quero que você consiga um motivo sensato. Ah, tamanho amostral menor importa. Então é realmente uma demonstração. Então vamos voltar à nossa tarefa de um contra B. E neste caso, vou te dar um elenco. E isso é um hospital. Sete. Você está avaliando diferentes avisos para interface de forno de interação. Digamos que é uma interface de ordem onde o médico coloca todos esses pedidos para nós, um paciente. Agora, digamos que neste exemplo, estamos chamando este três de um projeto A. Os pacientes encontram tratamento adicional. Então o médico pediu-lhe para entrar no sistema. Olhe para todas as ordens que eles colocaram e verifique. , cheque , cheque, cheque. Verifique todos eles e pressione o botão cancelar. Mas vou mostrar-te um problema. Tudo que você precisa fazer é decidir. Sim, senhor. Agora vamos começar. Então você entrou no sistema. Você verifica, cheque, cheque, cheque, cheque. Você pressiona o botão cancelar e isso é o que adereços. Então os adereços dizem: “Não cancele todos os pedidos dos pacientes.” Sim, e a resposta deve ser não. Ok. Então, à medida que você passa por isso, há um número de vocês que pode ter tido talvez quatro segundos. Talvez tenha conseguido seis segundos. Alguns podem ter pego três. É uma distribuição interessante. Enquanto faço isso com todas as minhas aulas, às vezes vejo uns três ou quatro segundos. Cinco segundos. Vamos fazer o dispositivo ser. Ei! hospital disse que é o mesmo bezerro. Você está avaliando problemas diferentes. Os pacientes uma posição de tratamento escalar ainda mais Pedir-lhe para entrar no sistema para entrar no sistema e cancelar todas as ordens. Você verifica. , cheque , cheque, cheque. Você seleciona as ordens e pressione cancelar você decide sim ou não? E você sabe que na hora vamos começar. Eu nem preciso ir para sete segundos no trabalho que eu faço. O prompt é cancelar todos os pedidos do paciente. Sim, o que eu acho se eu pegar este grupo e a maioria das pessoas obter essa resposta em 123 segundos contra 36 segundos, nós temos duas distribuições diferentes. Tamanho de efeito decente e eu posso dizer se eu dou tarefa ser primeiro ou tarefa primeiro. Eu troquei a ordem. Faço isso na Alemanha. Faço isso na Ásia. Faço isso nos EUA e nas minhas aulas. Este aviso que diz, cancelar todos os pedidos de pacientes. Sim é sempre melhor do que o oz primeiro, e isso é uma sensação de é o resultado. Generalizar Herbal. Não era se eram dois segundos contra seis para 1,3 contra sete. Sente-se a diferença, e generaliza que é sempre diferente. É sempre melhor. Ok? E assim, neste exercício do curso, o que eu espero que você tenha é se você tem dispositivo um dispositivo, você pode justificar quantos participantes unem um teste. E neste caso, talvez sejam apenas 16 ou 20. Porque se eu encontrar a resposta e você já sentiu, é generalizar ervas exceto o acaso. E esse é o escuro. Ok, então quando você voltar para a árvore de decisão completa, você deve ter uma noção de tamanho amostral para o teste da Flórida. E é esse o tipo de problemas que estamos procurando para descobrir o quão difícil é isso. Então você começa a olhar para os Cinco Mágicos. Você pensa sobre o número de grupos de usuários, quão complexo e dança. Não está verificada. Se você quer algo estudar, você passou do estágio da receita para realmente ir para fazer o jantar completo. Você precisa saber se é direcional. Eu só quero colocar o dedo do pé na água, e nesse caso vai ser muito parecido com a verificação formativa e de cheiro. Mas se você precisa saber definitivamente, então você se pergunta não é uma questão de precisão. Então eu preciso obter essa pontuação agora você vê a tabela que tivemos que calcula 300 participantes 196 ou 1000? Ou é? Tenho testes de escritório. Eu não estou olhando apenas o vício uma pontuação, mas A contra B e, nesse caso, você tem uma cópula de poder. Mas eu também estou pedindo que você teste em 16 20 ver se você tem uma diferença significativa se o tamanho do efeito parece muito forte. 9. Conclusão: Durante este curso, eu dei um exercício e, em seguida, essencialmente fazer pergunta É dispositivo um dispositivo melhor? Seja Quantos participantes você teria em seu estudo e por favor justifique agora? Eu dei alguns exemplos porque o dispositivo A versus B pode ser qualquer coisa do telefone. Ou pode ser, como eu mostro aqui, um pedaço de papel. Pode ser um muito poderia ser este velho pedaço de papel que é duas vezes mais longo em termos de instruções e conteúdo que B. Isso pode ser o A versus B desafiado. Então, o que eu amo para todos fazer é pegar uma galeria de projeto e postar online as respostas para esta pergunta. Adoraria que descrevesse seu dispositivo, A versus dispositivo. Ser desafiado agora. Pode não ser um dispositivo. Pode ser capaz de ser em papel ou uma ferramenta ou algum tipo de interface, mas eu adoraria que você descrevesse isso. Se você puder usar fotos, isso seria ótimo, porque isso sempre dá uma boa perspectiva. Mas para me dizer quantos participantes você sugere usar e para justificar, obviamente, seria ótimo se você usar o fluxograma e você sabia que você era um motivo e você precisava de uma resposta definitiva. E então você queria essa noção de teste de hipóteses. Mas se você estava realmente apenas fazendo o trabalho formativo apenas dispositivo A e você está tentando torná-lo melhor. Eu ainda gostaria de ver quantos participantes você escolhe e como você justificou isso, usando algumas das técnicas que você pode ter aprendido no curso. Então, essa é a pergunta para a foto de atribuição da galeria do projeto on-line, e eu adoraria ver a sua. Espero que gostem desta palestra e desta partilha de habilidades. O que eu quero fazer é dar-lhe um pouco de ciência que vai por trás de algumas das coisas que fazemos em você. Pesquisa X. Se você tiver alguma dúvida, sinta-se à vontade para entrar em contato comigo. Uma visão ousada ponto com e eu posso responder suas perguntas. Mas eu também espero montar uma fumaça ou desses tópicos para que você possa aprender um pouco mais do seu lado prático. Pesquisa X. Muito obrigado.

Quantos participantes são suficientes? Tamanhos de amostra para pesquisa de UX

Gavin Lew, I believe experiences matter.

Assista a este curso e milhares de outros

Assista a este curso e milhares de outros

Aulas neste curso

1.

Introdução

0:54

2.

Vamos definir a pesquisa

3:28

3.

Por que é o número de participantes Importantes?

3:50

4.

Testes de usuário formativo

14:43

5.

Reaspiração de sumário

8:21

6.

Tanto?

8:59

7.

Melhor que a B? Testes de hipóteses

11:28

8.

Exercício de teste

4:37

9.

Conclusão

2:00