Grupo de Ciência de Dados
A atividade de Data Science é um momento ótimo para nos encontrarmos para discutir e aprender sobre diversos assuntos relacionados ao tema. Embora os assuntos abordados possam ser avançados, nada impede que alguém que esteja começando na área não possa participar, mas é bom lembrar que provavelmente haverá bastante matemática no meio. É importante salientar que os encontros são para discutir os temas, não necessariamente para ensinar. Não é objetivo dos encontros que eles sejam vistos como cursos de data science.
Sempre que possível, traga seu notebook para trabalharmos juntos nos problemas, discutindo e programando. Não há uma programação fixa, uma vez que a ideia é que os interessados se encontrem e os projetos surjam espontaneamente, no máximo planejamos o encontro da semana seguinte.
Para quem está iniciando nos estudos, há vários materiais muito bons online e vale olhar antes, durante e depois de cada reunião. Se você tiver dificuldades em encontrar um bom material, venha às reuniões para possamos encontrá-los juntos.
Participe do nosso grupo do Telegram: https://t.me/DS_Garoa
Visite nosso repositório no GitHub!: https://github.com/victorantoniassi/DS_GaroaHC
Data Science
Ciência de dados (em inglês: data science) é uma área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou insigths para possíveis tomadas de decisão, de maneira similar à mineração de dados. Ciência de dados alia big data e machine learning, além de técnicas de outras áreas interdisciplinares como estatística, economia, engenharia e outros subcampos da computação como: banco de dados e análise de agrupamentos (cluster analysis). A ciência de dados é um campo que já existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como: o surgimento e popularização do Big Data e o desenvolvimento de áreas como o machine learning. A ciência de dados pode, por exemplo, transformar essa grande quantidade de dados brutos em insights de negócios, e com isso, auxiliar empresas em tomadas de decisões para atingir melhores resultados.¹
¹Slveira, Debora Priscila (20 de julho de 2016). O que é Data Science?. Consultado em 13 de agosto de 2018
Encontros
24/outubro/2018
Talk: Programação visual com Orange Orange é um projeto Open Source baseado em programação visual que nos permite carregar bases de dados, fazer transformações e pré-processamento, visualizar os dados de forma interativa, executar e avaliar algoritmos de Machine Learning tudo isso apenas com alguns cliques: https://orange.biolab.si/ Organizador: Victor Antoniassi Associado responsável: Juca
Eventos Passados
17/outubro/2018
Talk: Processo de ETL com dados públicos Palestrante: Edson Bomfim Organizador: Victor Antoniassi Associado responsável: Vitor Fernandes
19/setembro/2018
Criação de gráficos II Instruções para o pré-estudo em: https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912 Atividade organizada por: Victor Antoniassi Estudo proposto por: Danilo Bellini Associado responsável: Vitor Fernandes
12/setembro/2018
Criação de gráficos Instruções para o pré-estudo em: https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912 Atividade organizada por: Victor Antoniassi Estudo proposto por: Danilo Bellini Associado responsável: Vitor Fernandes
05/setembro/2018
Análise Exploratória de Dados IV * Visualização de dados em geral; * Estatística descritiva; * Insight sobre os dados; Atividade coordenada por: Victor Antoniassi Associado responsável: Vitor Fernandes
29/agosto/2018
Análise Exploratória de Dados III * Visualização de dados em geral; * Estatística descritiva; * Insight sobre os dados; Atividade coordenada por: Victor Antoniassi Associado responsável: Vitor Fernandes
22/agosto/2018
Análise Exploratória de Dados II * Visualização de dados em geral; * Estatística descritiva; * Insight sobre os dados; Atividade coordenada por: Victor Antoniassi Associado responsável: Vitor Fernandes
15/agosto/2018
Análise Exploratória de Dados I * Visualização de dados em geral; * Estatística descritiva; * Insight sobre os dados; Tutorial sobre o tema Quarta-feira, 15 de agosto, das 19h30 às 22h na Sede do Garoa Hacker Clube. Atividade coordenada por: Victor Antoniassi Associado responsável: Vitor Fernandes
08/agosto/2018
Reformulação e planejamento do Grupo de Data Science do Garoa Quarta-feira, 08 de agosto, das 19h30 às 22h45 na Sede do Garoa Hacker Clube. Atividade coordenada por: Victor Antoniassi Associado responsável: Juca
01/agosto/2018
Desafios de Data Science #02.1 Continuação da resolução do segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site Code:Nation Associado responsável: Juca
25/Julho/2018
Desafios de Data Science #02 Bora resolver o segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site Code:Nation?! Das 19h30 às 22h45 na Sede do Garoa Hacker Clube. Atividade coordenada por: Victor Antoniassi Associado responsável: Juca
18/Julho/2018
Desafios de Data Science #01 Das 19h30 às 22h45 na Sede do Garoa Hacker Clube Bora colocar a mão na massa resolvendo desafios de Ciência de Dados? Desafios em Data Science é a nova série de atividades do Data Science Group do Garoa Hacker Clube. De forma coletiva e colaborativa iremos em busca de soluções para os desafios de Data Science do site Code:Nation. Atualmente o site oferece 4 desafios de Data Science, você pode verificar o conteúdo e o enunciado do primeiro desafio no link: https://app.codenation.com.br/acceleration/data-science Spoiler do segundo desafio: Modelo preditivo! Conhecimentos recomendados para a atividade: Alguma familiaridade com programação em geral e Python Esse link oferece uma visão geral do básico da linguagem: https://learnxinyminutes.com/docs/pt-br/python3-pt/ Traga seu laptop(se possível) e principalmente sua vontade de ensinar e aprender com o coletivo! Atividade coordenada por: Victor Antoniassi Associado responsável: Juca
Repositório com a solução do primeiro desafio "Melhores colocados ENEM": https://github.com/victorantoniassi/desafios_DS_GaroaHC
26/Julho/2017
Contingency table, statistics and independence
aula de hoje pode ser visualizada ou clonada
https://github.com/flalix/statistics
código em R, pode abrir pdf, html ou pegar os códigos em markdown Rmd. (não esqueçam das imagens).
abr
Flavio
19/Julho/2017
Como ficou combinado, nessa próxima quarta-feira vamos conversar sobre o Perceptron (que é a unidade básica de uma rede neural). Vou tentar seguir a estrutura das apresentações do Danilo, mas com algumas alterações.
Meu objetivo é passar a motivação e a base teórica do trabalho original e também que cada um consiga implementar o código na sua linguagem de preferência. Eu vou mostrar o código from scratch em R, ou seja, sem nenhuma biblioteca adicional. Acredito que vai ser bem tranquilo pra todo mundo traduzir para a sua linguagem pois o código só usa loops e operações matriciais.
Não esqueçam de levar os notebooks. =)
Abraços,
Gabriel Perez
31/Maio/2017
Hey guys !
This Wednesday (31/05), it is going to be the fourth Datascience Group meeting! In this session, we plan to apply our skills on a kaggle competition project (https://www.kaggle.com/).
You are very welcome to join, play, share ideas and have fun with us !
abs Tom