Mudanças entre as edições de "Grupo de Ciência de Dados"

De Garoa Hacker Clube
Ir para navegação Ir para pesquisar
 
(93 revisões intermediárias por 4 usuários não estão sendo mostradas)
Linha 5: Linha 5:
 
Para quem está iniciando nos estudos, há vários materiais muito bons online e vale olhar antes, durante e depois de cada reunião. Se você tiver dificuldades em encontrar um bom material, venha às reuniões para possamos encontrá-los juntos.
 
Para quem está iniciando nos estudos, há vários materiais muito bons online e vale olhar antes, durante e depois de cada reunião. Se você tiver dificuldades em encontrar um bom material, venha às reuniões para possamos encontrá-los juntos.
   
  +
Participe do nosso grupo do Telegram: https://t.me/DS_Garoa
   
  +
Visite nosso repositório no GitHub!: https://github.com/victorantoniassi/DS_GaroaHC
 
=Data Science=
 
=Data Science=
   
  +
Ciência de dados (em inglês: data science) é uma área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou insigths para possíveis tomadas de decisão, de maneira similar à mineração de dados. Ciência de dados alia big data e machine learning, além de técnicas de outras áreas interdisciplinares como estatística, economia, engenharia e outros subcampos da computação como: banco de dados e análise de agrupamentos (cluster analysis). A ciência de dados é um campo que já existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como: o surgimento e popularização do Big Data e o desenvolvimento de áreas como o machine learning. A ciência de dados pode, por exemplo, transformar essa grande quantidade de dados brutos em insights de negócios, e com isso, auxiliar empresas em tomadas de decisões para atingir melhores resultados.¹
Trata de analisar dados utilizando matemática, estatística, computação e as vezes algum conhecimento da área que está estudando.
 
   
Nossa lista de emails no Google Groups é: https://groups.google.com/forum/#!forum/garoa95
 
   
  +
¹Slveira, Debora Priscila (20 de julho de 2016). [https://www.oficinadanet.com.br/post/16919-o-que-e-data-science O que é Data Science?]. Consultado em 13 de agosto de 2018
 
=Encontros=
 
=Encontros=
   
== Próximas atividades ==
+
=== 14/novembro/2018 ===
  +
  +
* '''19h30''': Overview à Pandas- Patricia Guisordi
  +
* '''20h30''': Usando python e teoria de redes complexas para fazer estatísticas de usuários de Twitter - Priscila
  +
Organizadora: Priscila
  +
Associado responsável: Priscila
   
=== 15/agosto/2018 ===
+
== Eventos Passados ==
   
  +
=== 7/novembro/2018 ===
'''* Análise Exploratória de Dados I - Dados não categóricos'''
 
  +
  +
* '''19h30''': Porque cientistas de dados adotaram Python: sequências, operadores, e memoryviews (''Luciano Ramalho'')
  +
* '''20h00''': Python em Ciências Sociais (''Guilherme Kenzo'')
  +
* '''20h30''': Intervalo
  +
* '''21h00''': Um modelo de aprendizagem em R (''Yumi Ambriola'')
  +
Organizador/Associado responsável: [[User:LucianoRamalho|Luciano Ramalho]]'''
  +
  +
=== 24/outubro/2018 ===
  +
  +
'''Talk: Programação visual com Orange'''
  +
  +
Orange é um projeto Open Source baseado em programação visual que nos permite carregar bases de dados, fazer transformações e pré-processamento, visualizar os dados de forma interativa, executar e avaliar algoritmos de Machine Learning tudo isso apenas com alguns cliques: https://orange.biolab.si/
  +
  +
19h30
  +
  +
'''Organizador:''' [https://github.com/victorantoniassi Victor Antoniassi]
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
  +
=== 17/outubro/2018 ===
  +
  +
'''Talk: Processo de ETL com dados públicos'''
 
 
  +
'''Palestrante:''' [https://github.com/edinhodiluviano Edson Bomfim]
* Visualização de dados em geral;
 
  +
'''Organizador:''' [https://github.com/victorantoniassi Victor Antoniassi]
* Estatística descritiva;
 
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
* Insight sobre os dados;
 
  +
  +
=== 19/setembro/2018 ===
  +
  +
'''Criação de gráficos II'''
  +
  +
Instruções para o pré-estudo em:
  +
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912
 
 
  +
'''Atividade organizada por:''' Victor Antoniassi
Quarta-feira, 15 de agosto, das 19h30 às 22h45
 
  +
'''Estudo proposto por:''' [https://github.com/danilobellini Danilo Bellini]
na [[Sede]] do Garoa Hacker Clube.
 
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 12/setembro/2018 ===
  +
  +
'''Criação de gráficos'''
  +
  +
Instruções para o pré-estudo em:
  +
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912
 
 
  +
'''Atividade organizada por:''' Victor Antoniassi
 
  +
'''Estudo proposto por:''' [https://github.com/danilobellini Danilo Bellini]
'''Atividade coordenada por: Victor Antoniassi'''
 
'''Associado responsável:''' [[User:Juca|Juca]]'''
+
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
   
=== 22/agosto/2018 ===
+
=== 05/setembro/2018 ===
  +
 
'''* Análise Exploratória de Dados II - Dados categóricos'''
+
'''Análise Exploratória de Dados IV'''
 
 
 
* Visualização de dados em geral;
 
* Visualização de dados em geral;
 
* Estatística descritiva;
 
* Estatística descritiva;
 
* Insight sobre os dados;
 
* Insight sobre os dados;
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
   
 
=== 29/agosto/2018 ===
 
=== 29/agosto/2018 ===
  +
  +
'''Análise Exploratória de Dados III'''
 
 
'''* Projeto de Visualização de Dados'''
+
* Visualização de dados em geral;
  +
* Estatística descritiva;
  +
* Insight sobre os dados;
 
 
  +
'''Atividade coordenada por:''' Victor Antoniassi
* Aplicação de todo conteúdo trabalhado nos encontros anteriores;
 
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
   
== Eventos Passados ==
+
=== 22/agosto/2018 ===
  +
  +
'''Análise Exploratória de Dados II'''
  +
  +
* Visualização de dados em geral;
  +
* Estatística descritiva;
  +
* Insight sobre os dados;
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 15/agosto/2018 ===
  +
  +
'''Análise Exploratória de Dados I'''
  +
  +
* Visualização de dados em geral;
  +
* Estatística descritiva;
  +
* Insight sobre os dados;
  +
  +
[http://minerandodados.com.br/index.php/2017/04/27/exploratory-data-analysis-eda/ Tutorial sobre o tema]
  +
  +
Quarta-feira, 15 de agosto, das 19h30 às 22h na [[Sede]] do Garoa Hacker Clube.
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
   
 
=== 08/agosto/2018 ===
 
=== 08/agosto/2018 ===
Linha 61: Linha 137:
 
'''Desafios de Data Science #02.1'''
 
'''Desafios de Data Science #02.1'''
 
 
Continuação da resolução do segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site
+
Continuação da resolução do segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site
[https://www.codenation.com.br/journey/data-science/index.html Code:Nation]
+
[https://www.codenation.com.br/journey/data-science/index.html Code:Nation]
  +
 
 
'''Associado responsável:''' [[User:Juca|Juca]]
 
'''Associado responsável:''' [[User:Juca|Juca]]
   
 
=== 25/Julho/2018 ===
 
=== 25/Julho/2018 ===
   
'''Desafios de Data Science #02'''
+
'''Desafios de Data Science #02'''
 
 
Bora resolver o segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site
+
Bora resolver o segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site
[https://www.codenation.com.br/journey/data-science/index.html Code:Nation]?!
+
[https://www.codenation.com.br/journey/data-science/index.html Code:Nation]?!
  +
 
Das 19h30 às 22h45 na Sede do Garoa Hacker Clube
+
Das 19h30 às 22h45 na Sede do Garoa Hacker Clube.
  +
 
'''Atividade coordenada por:''' Victor Antoniassi
+
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Juca|Juca]]
 
'''Associado responsável:''' [[User:Juca|Juca]]
 
   
 
=== 18/Julho/2018 ===
 
=== 18/Julho/2018 ===

Edição atual tal como às 11h57min de 10 de novembro de 2018

A atividade de Data Science é um momento ótimo para nos encontrarmos para discutir e aprender sobre diversos assuntos relacionados ao tema. Embora os assuntos abordados possam ser avançados, nada impede que alguém que esteja começando na área não possa participar, mas é bom lembrar que provavelmente haverá bastante matemática no meio. É importante salientar que os encontros são para discutir os temas, não necessariamente para ensinar. Não é objetivo dos encontros que eles sejam vistos como cursos de data science.

Sempre que possível, traga seu notebook para trabalharmos juntos nos problemas, discutindo e programando. Não há uma programação fixa, uma vez que a ideia é que os interessados se encontrem e os projetos surjam espontaneamente, no máximo planejamos o encontro da semana seguinte.

Para quem está iniciando nos estudos, há vários materiais muito bons online e vale olhar antes, durante e depois de cada reunião. Se você tiver dificuldades em encontrar um bom material, venha às reuniões para possamos encontrá-los juntos.

Participe do nosso grupo do Telegram: https://t.me/DS_Garoa

Visite nosso repositório no GitHub!: https://github.com/victorantoniassi/DS_GaroaHC

Data Science

Ciência de dados (em inglês: data science) é uma área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou insigths para possíveis tomadas de decisão, de maneira similar à mineração de dados. Ciência de dados alia big data e machine learning, além de técnicas de outras áreas interdisciplinares como estatística, economia, engenharia e outros subcampos da computação como: banco de dados e análise de agrupamentos (cluster analysis). A ciência de dados é um campo que já existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como: o surgimento e popularização do Big Data e o desenvolvimento de áreas como o machine learning. A ciência de dados pode, por exemplo, transformar essa grande quantidade de dados brutos em insights de negócios, e com isso, auxiliar empresas em tomadas de decisões para atingir melhores resultados.¹


¹Slveira, Debora Priscila (20 de julho de 2016). O que é Data Science?. Consultado em 13 de agosto de 2018

Encontros

14/novembro/2018

* 19h30: Overview à Pandas-  Patricia Guisordi
* 20h30: Usando python e teoria de redes complexas para fazer estatísticas de usuários de Twitter - Priscila
Organizadora: Priscila
Associado responsável: Priscila

Eventos Passados

7/novembro/2018

* 19h30: Porque cientistas de dados adotaram Python: sequências, operadores, e memoryviews (Luciano Ramalho)
* 20h00: Python em Ciências Sociais (Guilherme Kenzo)
* 20h30: Intervalo
* 21h00: Um modelo de aprendizagem em R (Yumi Ambriola)
Organizador/Associado responsável: Luciano Ramalho

24/outubro/2018

Talk: Programação visual com Orange
   
Orange é um projeto Open Source baseado em programação visual que nos permite carregar bases de dados, fazer transformações e pré-processamento, visualizar os dados de forma interativa, executar e avaliar algoritmos de Machine Learning tudo isso apenas com alguns cliques: https://orange.biolab.si/
 
 19h30
 
 Organizador: Victor Antoniassi
 Associado responsável: Vitor Fernandes


17/outubro/2018

Talk: Processo de ETL com dados públicos

 Palestrante: Edson Bomfim
 Organizador: Victor Antoniassi
 Associado responsável: Vitor Fernandes

19/setembro/2018

Criação de gráficos II
   
Instruções para o pré-estudo em:
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912

 Atividade organizada por: Victor Antoniassi 
 Estudo proposto por: Danilo Bellini
 Associado responsável: Vitor Fernandes

12/setembro/2018

Criação de gráficos
   
Instruções para o pré-estudo em:
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912

 Atividade organizada por: Victor Antoniassi 
 Estudo proposto por: Danilo Bellini
 Associado responsável: Vitor Fernandes

05/setembro/2018

Análise Exploratória de Dados IV
   
 * Visualização de dados em geral;
 * Estatística descritiva;
 * Insight sobre os dados;

 Atividade coordenada por: Victor Antoniassi 
 Associado responsável: Vitor Fernandes

29/agosto/2018

Análise Exploratória de Dados III
   
 * Visualização de dados em geral;
 * Estatística descritiva;
 * Insight sobre os dados;

 Atividade coordenada por: Victor Antoniassi 
 Associado responsável: Vitor Fernandes

22/agosto/2018

Análise Exploratória de Dados II
   
 * Visualização de dados em geral;
 * Estatística descritiva;
 * Insight sobre os dados;

 Atividade coordenada por: Victor Antoniassi
 Associado responsável: Vitor Fernandes

15/agosto/2018

Análise Exploratória de Dados I  

 * Visualização de dados em geral;  
 * Estatística descritiva; 
 * Insight sobre os dados;
 
 Tutorial sobre o tema
 
Quarta-feira, 15 de agosto, das 19h30 às 22h na Sede do Garoa Hacker Clube.

 Atividade coordenada por: Victor Antoniassi
 Associado responsável: Vitor Fernandes

08/agosto/2018

Reformulação e planejamento do Grupo de Data Science do Garoa

 Quarta-feira, 08 de agosto, das 19h30 às 22h45
 na Sede do Garoa Hacker Clube.

Atividade coordenada por: Victor Antoniassi
Associado responsável: Juca

01/agosto/2018

Desafios de Data Science #02.1

 Continuação da resolução do segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site 
 Code:Nation

Associado responsável: Juca

25/Julho/2018

Desafios de Data Science #02

 Bora resolver o segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site 
 Code:Nation?!
 
 Das 19h30 às 22h45 na Sede do Garoa Hacker Clube.

Atividade coordenada por: Victor Antoniassi
Associado responsável: Juca

18/Julho/2018

Desafios de Data Science #01
Das 19h30 às 22h45 na Sede do Garoa Hacker Clube

Bora colocar a mão na massa resolvendo desafios de Ciência de Dados?

Desafios em Data Science é a nova série de atividades do Data Science Group do Garoa Hacker Clube.
De forma coletiva e colaborativa iremos em busca de soluções para os desafios de Data Science do site Code:Nation.
Atualmente o site oferece 4 desafios de Data Science, você pode verificar o conteúdo e o enunciado
do primeiro desafio no link: https://app.codenation.com.br/acceleration/data-science

Spoiler do segundo desafio: Modelo preditivo!

Conhecimentos recomendados para a atividade:
  Alguma familiaridade com programação em geral e Python
  Esse link oferece uma visão geral do básico da linguagem: https://learnxinyminutes.com/docs/pt-br/python3-pt/

Traga seu laptop(se possível) e principalmente sua vontade de ensinar e aprender com o coletivo!

Atividade coordenada por: Victor Antoniassi
Associado responsável: Juca
Repositório com a solução do primeiro desafio "Melhores colocados ENEM": https://github.com/victorantoniassi/desafios_DS_GaroaHC

26/Julho/2017

Contingency table, statistics and independence

aula de hoje pode ser visualizada ou clonada

https://github.com/flalix/statistics

código em R, pode abrir pdf, html ou pegar os códigos em markdown Rmd. (não esqueçam das imagens).


abr

Flavio

19/Julho/2017

Como ficou combinado, nessa próxima quarta-feira vamos conversar sobre o Perceptron (que é a unidade básica de uma rede neural). Vou tentar seguir a estrutura das apresentações do Danilo, mas com algumas alterações.

Meu objetivo é passar a motivação e a base teórica do trabalho original e também que cada um consiga implementar o código na sua linguagem de preferência. Eu vou mostrar o código from scratch em R, ou seja, sem nenhuma biblioteca adicional. Acredito que vai ser bem tranquilo pra todo mundo traduzir para a sua linguagem pois o código só usa loops e operações matriciais.

Não esqueçam de levar os notebooks. =)


Abraços,

Gabriel Perez


31/Maio/2017

Hey guys !

This Wednesday (31/05), it is going to be the fourth Datascience Group meeting! In this session, we plan to apply our skills on a kaggle competition project (https://www.kaggle.com/).

You are very welcome to join, play, share ideas and have fun with us !

abs Tom