Grupo de Ciência de Dados

De Garoa Hacker Clube
Ir para navegação Ir para pesquisar

A atividade de Data Science é um momento ótimo para nos encontrarmos para discutir e aprender sobre diversos assuntos relacionados ao tema. Embora os assuntos abordados possam ser avançados, nada impede que alguém que esteja começando na área não possa participar, mas é bom lembrar que provavelmente haverá bastante matemática no meio. É importante salientar que os encontros são para discutir os temas, não necessariamente para ensinar. Não é objetivo dos encontros que eles sejam vistos como cursos de data science.

Sempre que possível, traga seu notebook para trabalharmos juntos nos problemas, discutindo e programando. Não há uma programação fixa, uma vez que a ideia é que os interessados se encontrem e os projetos surjam espontaneamente, no máximo planejamos o encontro da semana seguinte.

Para quem está iniciando nos estudos, há vários materiais muito bons online e vale olhar antes, durante e depois de cada reunião. Se você tiver dificuldades em encontrar um bom material, venha às reuniões para possamos encontrá-los juntos.

Participe do nosso grupo do Telegram: https://t.me/DS_Garoa

Visite nosso repositório no GitHub!: https://github.com/victorantoniassi/DS_GaroaHC

Data Science

Ciência de dados (em inglês: data science) é uma área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou insigths para possíveis tomadas de decisão, de maneira similar à mineração de dados. Ciência de dados alia big data e machine learning, além de técnicas de outras áreas interdisciplinares como estatística, economia, engenharia e outros subcampos da computação como: banco de dados e análise de agrupamentos (cluster analysis). A ciência de dados é um campo que já existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como: o surgimento e popularização do Big Data e o desenvolvimento de áreas como o machine learning. A ciência de dados pode, por exemplo, transformar essa grande quantidade de dados brutos em insights de negócios, e com isso, auxiliar empresas em tomadas de decisões para atingir melhores resultados.¹


¹Slveira, Debora Priscila (20 de julho de 2016). O que é Data Science?. Consultado em 13 de agosto de 2018

Encontros

24/outubro/2018

Talk: Programação visual com Orange
   
Orange é um projeto Open Source baseado em programação visual que nos permite carregar bases de dados, fazer transformações e pré-processamento, visualizar os dados de forma interativa, executar e avaliar algoritmos de Machine Learning tudo isso apenas com alguns cliques: https://orange.biolab.si/
 
 Organizador: Victor Antoniassi
 Associado responsável: Juca

Eventos Passados

17/outubro/2018

Talk: Processo de ETL com dados públicos

 Palestrante: Edson Bomfim
 Organizador: Victor Antoniassi
 Associado responsável: Vitor Fernandes

19/setembro/2018

Criação de gráficos II
   
Instruções para o pré-estudo em:
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912

 Atividade organizada por: Victor Antoniassi 
 Estudo proposto por: Danilo Bellini
 Associado responsável: Vitor Fernandes

12/setembro/2018

Criação de gráficos
   
Instruções para o pré-estudo em:
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912

 Atividade organizada por: Victor Antoniassi 
 Estudo proposto por: Danilo Bellini
 Associado responsável: Vitor Fernandes

05/setembro/2018

Análise Exploratória de Dados IV
   
 * Visualização de dados em geral;
 * Estatística descritiva;
 * Insight sobre os dados;

 Atividade coordenada por: Victor Antoniassi 
 Associado responsável: Vitor Fernandes

29/agosto/2018

Análise Exploratória de Dados III
   
 * Visualização de dados em geral;
 * Estatística descritiva;
 * Insight sobre os dados;

 Atividade coordenada por: Victor Antoniassi 
 Associado responsável: Vitor Fernandes

22/agosto/2018

Análise Exploratória de Dados II
   
 * Visualização de dados em geral;
 * Estatística descritiva;
 * Insight sobre os dados;

 Atividade coordenada por: Victor Antoniassi
 Associado responsável: Vitor Fernandes

15/agosto/2018

Análise Exploratória de Dados I  

 * Visualização de dados em geral;  
 * Estatística descritiva; 
 * Insight sobre os dados;
 
 Tutorial sobre o tema
 
Quarta-feira, 15 de agosto, das 19h30 às 22h na Sede do Garoa Hacker Clube.

 Atividade coordenada por: Victor Antoniassi
 Associado responsável: Vitor Fernandes

08/agosto/2018

Reformulação e planejamento do Grupo de Data Science do Garoa

 Quarta-feira, 08 de agosto, das 19h30 às 22h45
 na Sede do Garoa Hacker Clube.

Atividade coordenada por: Victor Antoniassi
Associado responsável: Juca

01/agosto/2018

Desafios de Data Science #02.1

 Continuação da resolução do segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site 
 Code:Nation

Associado responsável: Juca

25/Julho/2018

Desafios de Data Science #02

 Bora resolver o segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site 
 Code:Nation?!
 
 Das 19h30 às 22h45 na Sede do Garoa Hacker Clube.

Atividade coordenada por: Victor Antoniassi
Associado responsável: Juca

18/Julho/2018

Desafios de Data Science #01
Das 19h30 às 22h45 na Sede do Garoa Hacker Clube

Bora colocar a mão na massa resolvendo desafios de Ciência de Dados?

Desafios em Data Science é a nova série de atividades do Data Science Group do Garoa Hacker Clube.
De forma coletiva e colaborativa iremos em busca de soluções para os desafios de Data Science do site Code:Nation.
Atualmente o site oferece 4 desafios de Data Science, você pode verificar o conteúdo e o enunciado
do primeiro desafio no link: https://app.codenation.com.br/acceleration/data-science

Spoiler do segundo desafio: Modelo preditivo!

Conhecimentos recomendados para a atividade:
  Alguma familiaridade com programação em geral e Python
  Esse link oferece uma visão geral do básico da linguagem: https://learnxinyminutes.com/docs/pt-br/python3-pt/

Traga seu laptop(se possível) e principalmente sua vontade de ensinar e aprender com o coletivo!

Atividade coordenada por: Victor Antoniassi
Associado responsável: Juca
Repositório com a solução do primeiro desafio "Melhores colocados ENEM": https://github.com/victorantoniassi/desafios_DS_GaroaHC

26/Julho/2017

Contingency table, statistics and independence

aula de hoje pode ser visualizada ou clonada

https://github.com/flalix/statistics

código em R, pode abrir pdf, html ou pegar os códigos em markdown Rmd. (não esqueçam das imagens).


abr

Flavio

19/Julho/2017

Como ficou combinado, nessa próxima quarta-feira vamos conversar sobre o Perceptron (que é a unidade básica de uma rede neural). Vou tentar seguir a estrutura das apresentações do Danilo, mas com algumas alterações.

Meu objetivo é passar a motivação e a base teórica do trabalho original e também que cada um consiga implementar o código na sua linguagem de preferência. Eu vou mostrar o código from scratch em R, ou seja, sem nenhuma biblioteca adicional. Acredito que vai ser bem tranquilo pra todo mundo traduzir para a sua linguagem pois o código só usa loops e operações matriciais.

Não esqueçam de levar os notebooks. =)


Abraços,

Gabriel Perez


31/Maio/2017

Hey guys !

This Wednesday (31/05), it is going to be the fourth Datascience Group meeting! In this session, we plan to apply our skills on a kaggle competition project (https://www.kaggle.com/).

You are very welcome to join, play, share ideas and have fun with us !

abs Tom