Em 2025, para o problema apresentado em 12:30, eu vi algumas pesquisas de soluções em : kzbin.info/www/bejne/jYumgKekirljmJIsi=x3qqinuJ144s3O__
@arcarvalhojrАй бұрын
Cai nesse vídeo após horas na internet buscando como criar uma tabela no r. Muito bom conteúdo, tirei várias dúvidas. Obrigado!!
@carvalhoribeiroАй бұрын
Qual o termo que você usou na busca? Eu posso inserir na descrição do vídeo pra facilitar a busca por outros pesquisadores. O gtsummary é um pacote excelente tem muito material no YT e para publicação de artigo científico se for o caso talvez o Quarto + Zotero seja útil. Grande abraço e boa pesquisa.
@arcarvalhojrАй бұрын
@@carvalhoribeiro Na realidade, é meio que um costume desses anos de pós-graduação buscar tudo em inglês. Agora no fim do dia, cansado, resolvi buscar em prt e encontrei seus vídeos logo de cara. Obrigado pela dica, estou mesmo buscando esses temas para a escrita da tese e do artigo cientifico. Já vi que tem muita informação no seu canal e já estou maratonando. Excelente conteúdo, muito obrigado.
@carvalhoribeiroАй бұрын
Fico feliz pelo conteúdo ser útil, abaixo algumas pessoas que abordam mais profundamente esses temas: Daniel Dsjoberg - gtsummary (tabelas) Minie Setinkaia Hundel - Quarto (publicação de artigos) Varios cientistas no YT - Zotero - (Gerenciador de citação e referências)
@WendelAzevedo-n3dАй бұрын
não existe mais esse recurso de editar pdf no ano de 2024?
@carvalhoribeiroАй бұрын
O S Note a Samsung descontinuou. Já o Samsung Notes tem algumas opções de editar PDF mas nem todas.
@XandBaptista2 ай бұрын
Vlw pela dica,joguei na época do lançamento,zerei sem muita exploração.Voltei agora em 2024 e vou platinar.✌🏽
@amandalucenamoreira95983 ай бұрын
POXA O MEU NAO TEM A OPÇÃO PYTON
@carvalhoribeiro2 ай бұрын
Eu vi agora que tem alguns requisitos 1. Ter assinatura do office 365 2. Estar conectado a internet pois o código python é executado na núvem da microsoft.
@fabiomonteirocruz54804 ай бұрын
Ótimo vídeo, Marcelo!!! Muito obrigado por fazê-lo… foi realmente muito didático e esclarecedor! Vc mencionou que já havia feito um vídeo falando sobre como contornar o efeito de dados desbalanceados… eu procurei mas não achei… vc poderia deixar o link aqui? Isso seria muito útil! Desde já te agradeço
@carvalhoribeiro4 ай бұрын
tem sim kzbin.info/www/bejne/eJ-VnXWAeaisj6c
@fabiomonteirocruz54804 ай бұрын
Show!!!!
@mauvanju4 ай бұрын
Parece besta mas como recorto uma imagem de um PDF para colocar no PowerPoint?
@carvalhoribeiro4 ай бұрын
geralmente eu abro o pdf, clico com a caneta em smart select, seleciono a parte que eu quero recortar e salvo ou colo no powerpoint.
@tatianacustodio37884 ай бұрын
Vídeo excelente! Parabéns!!! 😁
@carvalhoribeiro4 ай бұрын
fico feliz que o conteúdo tenha sido útil pra você
@fabiomonteirocruz54804 ай бұрын
Marcelo, bom dia! Parabéns pelo canal e pelo conteúdo, que tem sido muito útil nos meus estudos recentes sobre modelagem de dados e inteligência artificial. Marcelo, eu sempre vejo você dividir a sua base dados em treinamento e teste, mas já vi em vários outros materiais de suporte a base ser dividida em treino, teste e validação. Quais as diferenças entre as classes e quando devo usar também uma categoria de validação? Desde já te agradeço a gentileza da resposta.
@carvalhoribeiro4 ай бұрын
A ideia central de dividir os conjuntos é fazer com que o modelo treinado generalize bem diante de novos dados que ele encontrar pela frente. 1. teste-t simples usa apenas dados de treino 2. machine learning, usamos treino + teste...só que do conjunto de treino fazemos reamostragens(chamados cross validation) são poucos dados e o custo de rodar o modelo é baixo. 3. deep learning como uma LLM, ao invez de cross validation é dividido em treino, validação e teste. Por que? por custa caro rodar um modelo devido ao tamanho dos dados 10terabites de dados + 2 milhões de dólares para rodar + 12 dias para as 6.000 gpus rodarem.
@fabiomonteirocruz54804 ай бұрын
@@carvalhoribeiro Obrigado novamente. Foi bastante esclarecedora a sua resposta. Abs
@driju124 ай бұрын
sobre a questão de balanceamento, eu costumo usar muito o Smote, você acha uma boa?
@carvalhoribeiro4 ай бұрын
Sim, é uma excelente opção
@kaioalbarado32734 ай бұрын
Entao nesse caso eu interpreto a rede neural em cima do menor erro que o modelo dará?
@carvalhoribeiro4 ай бұрын
Para interpretar o por que a rede neural gerou o resultado, se for uma rede de apenas uma camada você pode usar o pacote DALEX. Agora se o seu objetivo for avaliar quão bom é o modelo, aí sim é pelo menor erro que o modelo dará quando você testá-lo usando o conjunto de testes. O objetivo de um modelo de rede neural é minimizar o erro ou seja, a diferença entre o valor previsto pelo modelo versus o valor real.
@kaioalbarado32734 ай бұрын
@@carvalhoribeiro criei um modelo que gerou duas camada, mas não sabia como interpreta-lo. Estou tentando trabalhar com predições. Daí acredito que interpretar com o menor erro do modelo seja o mais adequado.
@kaikdon015 ай бұрын
Nem f... nem tinha visto isso
@aleserain5 ай бұрын
Ola boa tarde, excelente aula, a maioria dos videos apenas expõe o assunto portanto muitas vezes sinto falta de critica, como foi sua aula. como posso avaliar um bom valor de precisão, especificidade etc? ja vi matriz de confusão com valores de falso positivo e verdadeiro negativo quase iguais e a pessoa defendendo que era um bom modelo... tenho dificuldade de avaliar bons valores, teria um artigo pra indicar? obrigada
@carvalhoribeiro5 ай бұрын
Olha Alessandra, o pensamento crítico é uma das caracteristicas de maior valor em um profissonal nas próximas décadas (falando de Estados Unidos), e o seu interesse é muito pertinente. Eu não sei qual é o nível conhecimeto em modelos mas um livro que eu gosto muito e recomendo para compreender o valor e riscos em uma análise de dados principalmente quando lida-se com vidas é A Arte da Estatística do David Spiegelhalter. Já específico sobre matriz de confusão talvez na ncbi pois vai depender do caso. Obrigado pelo comentário e sucesso em suas pesquisas
@aleserain5 ай бұрын
@@carvalhoribeiro Muito obrigada pela resposta. Eu trabalho com a area da saúde e penso que essa área está ainda mais em falta.. obrigada pela recomendação do livro!
@carvalhoribeiro5 ай бұрын
Concordo plenamente e não tenho dúvida sobre a importância e potenciais levando em consideração as oportunidades(riquezas vegetais) e desafios(transição demográfica). Por curiosidade mas sem ter competência para isso(apenas pra entender o processo de pesquisa), eu pesquisei sobre a Terminalia catappa durante anos procurando se havia relação do uso do extrato vs neutralização do processo de metastase e as possiveis causas mas faltam estudos. Parabéns pelos seus estudos e siga em frente. Fico feliz que o conteúdo foi útil pra você.
@anapaulaincerti42125 ай бұрын
Marcelo, gostei muito desse vídeo. Embora eu não entenda do R, mas os conceitos e a forma de olhar para os dados que você explana aqui são muito importantes pra mim. E são importantes por que me chama a atenção para não cair em falácias do "é só apertar um botão", por que mesmo tendo boas perguntas e sabendo o que queremos, a base nem sempre (no caso do BR na maioria das vzs) onde está buscar os dados está muito ruim e isso induzir a uma resposta errada pode ter um efeito devastador.
@carvalhoribeiro5 ай бұрын
Obrigado pelo comentario Ana. O R é apenas uma ferramenta assim como excel ou outra. Quanto as informações, quanto mais estaveis forem os ambientes e mais consistentes forem as bases de dados, mais valiosa será a informação, e o contrário também é verdadeiro.
@Leonardo-h2j5 ай бұрын
Vc explica de maneira muito didática e clara, parabens, gostei muito do conteúdo. Estou lendo a versão em português do R para Data Science mas estava confusa a explicação e agora ficou muito clara.
@carvalhoribeiro5 ай бұрын
fico contente que o conteudo tenha sido útil.Siga firme na leitura e praticando logo ficará expert.
@joaopedroventuraazara53145 ай бұрын
Tenho uma dúvida, quando eu importo uma planilha minha, ao inves dos meu dados ficarem no lugar do row names, eles ficam ocupando a coluna 1
@joaopedroventuraazara53145 ай бұрын
e com isso não consigo proceder a analise do dendograma
@carvalhoribeiro5 ай бұрын
Você pode usar a função meus_dados %>% column_to_rownames(var = "nome_da_variavel") Mas note que a variável que irá para row_names não pode ter valores repeditos...exemplo se você tem banana, laranga, tomate e cebola vai funcionar, agora se você tiver banana, laranja, tomate, laranja não funciona
@lucashoffmann11855 ай бұрын
Eu achei esse lugar aí, mas diferente do vídeo eu não consigo interagir 😢
@anna_tetzner5 ай бұрын
Professor, onde posso achar o código usado?
@carvalhoribeiro5 ай бұрын
Você pode encontrar no Blog carvalhoribeiro.netlify.app/posts/pca-explore/pca-explore
@rafaelalbino11605 ай бұрын
teria com fazer com numeros negativos, quando faço eles ficam abaixo do eixo x
@carvalhoribeiro5 ай бұрын
Tem sim, no excel do office 365 eles já incluiram o waterfall nos gráficos padrão...basta você ir em Inserir>Graficos>Waterfall. Você pode usar o exemplo abaixo e plotar direto. Tanto no lucro bruto quando no lucro líquido, você dando um duplo clique na barra, você consegue colocar a opção "definir como total" Receita 150000 custo -80000 lucro bruto 70000 despesa -27000 lucro liquido 43000
@sailesemanoel27556 ай бұрын
Obrigado
@rickysodre6 ай бұрын
eu não to conseguindo
@jacksmaia6 ай бұрын
Agora entendi bem como funciona a analise de agrupamentos pelo R. Achei mais fácil do que pelo Python
@carvalhoribeiro6 ай бұрын
fico feliz que o conteúdo tenha sido útil.
@herlonnadolny6 ай бұрын
Professor, seu modelo "tosco" para explicar os ruídos foi um tosco refinado, gostei muito, obrigado 😂😂.
@carvalhoribeiro6 ай бұрын
Fico feliz que tenha sido útil. As vezes eu uso exemplos toscos na tentativa de que conteúdo novo e complexo faça sentindo no primeiro momento. Fico feliz com seu feedback. Boa sorte em seus projetos.
@herlonnadolny6 ай бұрын
@@carvalhoribeiro professor, poderia usar um desses modelos para deixar bem claro para mim os erros tipo 1 e tipo 2? Esse é outro detalhe que faço bastante confusão ainda. Obrigado
@carvalhoribeiro6 ай бұрын
Isso talvez lhe ajude: kzbin.info/www/bejne/m6LZnqePjc2SeZYsi=GxebyTPp1vFPaXUC
@caiofelipe6807 ай бұрын
Eu não entendo eu conclui os 12 circulos de pedra e tenho 61 sílicas e mesmo assim não tá dando pra interagir
@carvalhoribeiro6 ай бұрын
rapaz.....na hora que você chega na camara, você tentou observar se no teto todos os pontos estão acesos?
@caiofelipe6806 ай бұрын
@@carvalhoribeiro não estão todos acesos
@caiofelipe6806 ай бұрын
@@carvalhoribeiro vim do futuro pra dizer que eu já consegui só precisava cumprir as missões principais pra poder desbloquear a interação
@hrodmoreira7 ай бұрын
Marcelo, fiquei encantado com o resultado do trabalho. Tentei replicar em um estudo que estou fazendo, mas essa mensagem de erro aparece insistentemente: "Error in vctrs::vec_chop(do.call(render_row_data, body_rows_data_flat), : unused argument (sizes = ns)". Já li vários fóruns, procurei diversas soluções, mas não consigo resolver. Nem replicando o seu script dá certo. Tem alguma orientação do que pode ser? Valeu!
@carvalhoribeiro7 ай бұрын
Esse erro está dizendo que esse argumento sizes não existe na função que você está tentando utilizar. #criando uma função raiz quadrada raiz_quadrada <- function(x){ sqrt(x) } #executando com o argumento x raiz_quadrada(x = 9) #colocando um argumernto y que não existe na função e var dar erro raiz_quadrada(x = 9, y = 12)
@hrodmoreira7 ай бұрын
@@carvalhoribeiro Entendi. Valeu pela explicação e parabéns pelo trabalho!
@fernandesdeoliveira17 ай бұрын
Marcelo, boa noite, tento rodar meus scripts conforme você exxplica, baixo os pacotes , mas não compreendo porque meu R não reconhece %>%
@carvalhoribeiro7 ай бұрын
para o R reconhecer esse pipe aí %>% você precisa carregar o pacote tidyverse library(tidyverse) Caso você não carregue o tidyverse o R tem um pipe nativo esse aqui |> é praticamente a mesma coisa e o atralho no teclado é ctrl + shift + m se não me engano
@elissonhaas6 ай бұрын
Olá Marcelo!! Entre em contato comigo.. saudade amigo
@Rikardomcarvalho7 ай бұрын
Muito obrigado pelo vídeo. Não entendo mesmo como demorei a achar seu canal. Tô assistindo tudo que consigo. Uma dúvida: eu estou trabalhando com os dados do Censo 2010 e em minha base eu estou aplicando o peso amostral a partir do código: base = svydesign( id = ~ Controle, strata = ~ AreaPonderacao , weights = ~ PesoAmostral, fpc= ~ qtpessoas, nest = TRUE, data = ceara, lonely.psu="adjust") Quando eu crio qualquer gráfico, é plotado apenas com os "valores brutos" da base, em o peso amostral. Então, o que era pra aparecer nos rótulos cerca de 30 milhões, só aparece uns 200 mil. Poderia orientar em como eu adiciono o peso para criar gráficos? Desde já meu muito obrigado.
@carvalhoribeiro7 ай бұрын
Esta é uma questão bem específica e dificil de analisar apenas com código. A minha sugestão seria criar um exemplo reproduzível com o gráfico resultante e também com o desejado e postar a dúvida no forum.posit.co/tag/surveys Outra sugestão é usar um dataset comum para facilitar a compreensão do cientista que vai lhe ajudar acredito ser a Stephanie Zimmer por que ela ajuda todo mundo e é ótima. Portanto usar um dataset disponibilizado por ela ou o padrão data(api) > apiclust1 pode acelerar o processo de obtenção de respostas.
@Rikardomcarvalho7 ай бұрын
Estou com o seguinte código para plotar uma tabela: ce2010 %>% tbl_svysummary(include = c(Sexo, RacaCor), by = Uniao, percent = "row", digits = list(all_continuous() ~ c(2,2), all_categorical() ~ c(0,2)), statistic = list(all_continuous() ~ "{mean} ({sd})", all_categorical() ~ "{n} ({p})")) %>% add_difference() %>% add_p(test = list(all_continuous() ~ "svy.t.test", all_categorical() ~ "svy.chisq.test")) Queria adicionar os intervalos de confiança. Tentei inserir: %>% add_difference(), mas não deu certo. Por gentileza, poderia ajudar?
@carvalhoribeiro7 ай бұрын
para plotar add_difference() você precisa ter dois grupos para comparar. Já para inserir o intervalo de confiança você pode tentar add_ci() exemplo usando tbl_summary e survey data. *tbl_summmary* mtcars %>% select(mpg, cyl, hp) %>% tbl_summary( by = cyl, statistic = all_continuous() ~ "{mean} ({sd})" ) %>% add_ci() *survey data* library(survey) data(api) #Academic performance Index in California svydesign(id = ~dnum, #district number weights = ~pw, #sampling weights fpc = ~fpc, #compute finite population corrections to variance data = apiclus1 ) %>% tbl_svysummary( include = c(api00, hsg, stype), statistic = hsg ~"{mean} ({sd})" ) %>% add_ci( method = api00 ~ "svymedian") #quero saber mais sobre o data set ?apiclus1
@MrJeanlopan7 ай бұрын
Explicação sensacional.
@carvalhoribeiro6 ай бұрын
fico feliz que tenha sido útil
@fisionicolly7 ай бұрын
MUITO OBRIGADA!!! DIRETO AO PONTO. EXCELENTE
@carvalhoribeiro7 ай бұрын
Fico contente que o conteúdo tenha sido útil pra você
@fernandesdeoliveira17 ай бұрын
Marcelo, boa noite, belissimo trabalho, o script ficou?
@carvalhoribeiro7 ай бұрын
Fico feliz que o conteúdo tenha sido útil pra você. Os códigos estão no blog: carvalhoribeiro.netlify.app/posts/gts-themes/gts-themes
@jeffersonfernandonavespint99327 ай бұрын
Oi Marcelo, seus vídeos são ótimos. Gostaria de aaber qual é o comando que você utiliza quando vai escrever a camada dos packages (3:11 minutos do vídeo).
@carvalhoribeiro7 ай бұрын
Fico feliz que o conteúdo tenha sido útil. O comando que uso é ctrl + alt + seta pra cima
@jeffersonfernandonavespint99327 ай бұрын
Muito obrigado pela atenção.
@driju128 ай бұрын
Incrível vídeo
@carvalhoribeiro7 ай бұрын
Fico feliz que o conteúdo tenha sido útil
@fernandesdeoliveira18 ай бұрын
prestei bastante atençaõ desde o inicio e pude ver que talves meu problema esteja na forma de construção das tabelas
@carvalhoribeiro8 ай бұрын
Tem conteúdo no canal específico sobre tabelas talvez possa ser útil: kzbin.info/www/bejne/jJnYoGxsisl5q5osi=fy7GkxTYExptkaRe
@fernandesdeoliveira18 ай бұрын
Marcelo, pode ser que minha maior dificuldade esteja em formato errado de minhas tabelas?
@carvalhoribeiro8 ай бұрын
talvez. Eu fiz um vídeo em 2022 sobre tabelas que talvez possa ser útil: kzbin.info/www/bejne/jJnYoGxsisl5q5osi=fy7GkxTYExptkaRe
@LucasSilva-xw7jg8 ай бұрын
Vídeo espetacular, muito obrigado!
@carvalhoribeiro8 ай бұрын
fico contente que o conteúdo tenha sido útil
@fernandesdeoliveira18 ай бұрын
você pode deixar o script ?
@carvalhoribeiro8 ай бұрын
Tem sim...está no blog: carvalhoribeiro.netlify.app/posts/table-gt/table_gt
@ericap88468 ай бұрын
Fantástico! Vídeo super didático! Obrigada!
@carvalhoribeiro8 ай бұрын
Fico feliz que o conteúdo tenha sido útil
@lins1848 ай бұрын
É possível utilizar Dalex\Dalex extra na elaboração de Shap value global?
@carvalhoribeiro8 ай бұрын
Até o momento que eu saiba, não. Para usar shap em multiplas observações(global) você vai precisar do pacote kernelshap para gerar o shap e o pacote shapviz para visualizar em gráfico beeswarm por exemplo. library(tidyverse) library(randomForest) library(shapviz) library(kernelshap) data_iris <- iris %>% janitor::clean_names() mdl_fit_iris_rf <- randomForest(sepal_length ~., data = data_iris) shap_values <- permshap(mdl_fit_iris_rf, X = data_iris, bg_X = data_iris, feature_names = data_iris %>% select(-sepal_length) %>% names()) shap_viz <- shapviz(shap_values) sv_importance(object = shap_viz, kind = "beeswarm")
@lins1848 ай бұрын
@@carvalhoribeiro É o que tenho feito. Obrigado, Professor.
@fernandesdeoliveira18 ай бұрын
Você tem material de apoio para iniciantes?
@carvalhoribeiro8 ай бұрын
Eu sugiro os livros na seguinte ordem 1. A arte da estatística: Como aprender a partir de dados de David Spiegelhalter ele mostra por que a estatística é importante na vida das pessoas. 2. R Para Data Science de Hadley Wickham ele mostra como usar o R para analisar dados. 3. O canal SisLAu FMUSP que mostrará fundamentos importantes da estatística
@fernandesdeoliveira18 ай бұрын
Muito obrigado pela atenção
@carvalhoribeiro8 ай бұрын
Não há de que. Em breve vou fazer um vídeo sobre tidyverse para facilitar para quem está começando mas já tem vídeo sobre tidyverse no canal
@deboradede298 ай бұрын
Boa noite. Como faço pra copiar as fotos da câmera para o PC?
@carvalhoribeiro8 ай бұрын
Ou via cabo..ou adquirindo um leitor de cartão USB no caso de PC. Se for notebook a maioria já tem leitor de cartão.
@fernandesdeoliveira18 ай бұрын
rapaz , estou iniciando, seus comandos são muito r´paidos
@carvalhoribeiro8 ай бұрын
Você pode colocar na velocidade 0.5x e alguns conteúdos também estão no blog onde é possível acompanhar com mais calma. Espero que o conteúdo esteja sendo útil pra você
@fernandesdeoliveira18 ай бұрын
Estou iniciando com o programa, estou aprendendo
@tiagosouza99988 ай бұрын
Marcelo uma dúvida, como acompanho as funções novas que vc comenta no vídeo? Pela página do próprio pacote ? Ou no livro ?
@carvalhoribeiro8 ай бұрын
Tanto pelo livro quanto pelo site tidymodels org. No livro vai ter explicações e na página você vai encontrar vários exemplos de uso prático. Quais funções você precisa se aprofundar?
@tiagosouza99988 ай бұрын
Muito obrigado professor !!! 👊👊👊👊
@carvalhoribeiro8 ай бұрын
Não há de que
@izaiasdesouzasilva28859 ай бұрын
Mais uma ótima aula. Obrigado!
@carvalhoribeiro9 ай бұрын
Muito obrigado fico feliz que o conteúdo tenha sido útil
@joaorafaelsilvasoares66089 ай бұрын
Olá Marcelo, tudo joia?! Curto bastante seus vídeos, parabéns pela didática. Eu tenho uma pergunta: você já usou o pacote DALEX para interpretação de modelos? Poderia ser assunto de algum vídeo no futuro?
@carvalhoribeiro9 ай бұрын
Nunca usei o DALEX vou ver se ele funciona com o tidymodels e como funciona. Obrigado pela sugestão.
@joaorafaelsilvasoares66089 ай бұрын
@@carvalhoribeiro pelo que vi em alguns posts da Julia Silge, é possível sim. Mas eu também nunca fiz um teste para ver como é
@carvalhoribeiro8 ай бұрын
Eu fiz alguns testes e dei uma olha no livro é bem denso...vou ver se faço algo sobre o que aprendi e posto aqui. Obrigado pela sugestão
@joaorafaelsilvasoares66088 ай бұрын
@@carvalhoribeiro legal demais! Eu pensei em dar uma olhada sobre também, porém estou na reta final do doutorado e tempo para estudar sobre tá meio escasso.