Mudanças entre as edições de "Grupo de Ciência de Dados"

De Garoa Hacker Clube
Ir para navegação Ir para pesquisar
 
(149 revisões intermediárias por 4 usuários não estão sendo mostradas)
Linha 1: Linha 1:
A atividade de Data Science é um momento onde nos encontrarmos para discutir e aprender sobre diversos assuntos relacionados ao tema. Quase todas as vezes estaremos falando sobre os assuntos de forma avançada, isso quer dizer que terão contas. Não problema de participar se não souber do assunto, mas lembre-se que os encontros não são cursos e sim discussões.
+
A atividade de Data Science é um momento ótimo para nos encontrarmos para discutir e aprender sobre diversos assuntos relacionados ao tema. Embora os assuntos abordados possam ser avançados, nada impede que alguém que esteja começando na área não possa participar, mas é bom lembrar que provavelmente haverá bastante matemática no meio. É importante salientar que os encontros são para discutir os temas, não necessariamente para ensinar. Não é objetivo dos encontros que eles sejam vistos como cursos de data science.
   
Geralmente os participantes trazem seu notebook para discutir e trabalhar. Não há uma programação fixa: a ideia é que os interessados se encontrem e os projetos surjam espontaneamente, no máximo planejamos o encontro da semana seguinte.
+
Sempre que possível, traga seu notebook para trabalharmos juntos nos problemas, discutindo e programando. Não há uma programação fixa, uma vez que a ideia é que os interessados se encontrem e os projetos surjam espontaneamente, no máximo planejamos o encontro da semana seguinte.
   
Para quem não tem conhecimento prévio tem muito material online sobre esse assunto, mas se for até o Garoa podemos ajudar a encontrar um que te ajude. Computador seria melhor trazer, estamos atualmente com apenas um para uso publico.
+
Para quem está iniciando nos estudos, há vários materiais muito bons online e vale olhar antes, durante e depois de cada reunião. Se você tiver dificuldades em encontrar um bom material, venha às reuniões para possamos encontrá-los juntos.
   
  +
Participe do nosso grupo do Telegram: https://t.me/DS_Garoa
   
  +
Visite nosso repositório no GitHub!: https://github.com/victorantoniassi/DS_GaroaHC
 
=Data Science=
 
=Data Science=
   
  +
Ciência de dados (em inglês: data science) é uma área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou insigths para possíveis tomadas de decisão, de maneira similar à mineração de dados. Ciência de dados alia big data e machine learning, além de técnicas de outras áreas interdisciplinares como estatística, economia, engenharia e outros subcampos da computação como: banco de dados e análise de agrupamentos (cluster analysis). A ciência de dados é um campo que já existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como: o surgimento e popularização do Big Data e o desenvolvimento de áreas como o machine learning. A ciência de dados pode, por exemplo, transformar essa grande quantidade de dados brutos em insights de negócios, e com isso, auxiliar empresas em tomadas de decisões para atingir melhores resultados.¹
Trata de analisar dados utilizando matemática, estatística, computação e as vezes algum conhecimento da área que está estudando.
 
   
Nossa lista de emails no Google Groups é: https://groups.google.com/forum/#!forum/garoa95
 
   
  +
¹Slveira, Debora Priscila (20 de julho de 2016). [https://www.oficinadanet.com.br/post/16919-o-que-e-data-science O que é Data Science?]. Consultado em 13 de agosto de 2018
 
=Encontros=
 
=Encontros=
   
== 18/Julho/2018 ==
+
=== 14/novembro/2018 ===
  +
  +
* '''19h30''': Overview à Pandas- Patricia Guisordi
  +
* '''20h30''': Usando python e teoria de redes complexas para fazer estatísticas de usuários de Twitter - Priscila
  +
Organizadora: Priscila
  +
Associado responsável: Priscila
   
  +
== Eventos Passados ==
'''Desafios em Data Science''' com Victor Antoniassi
 
  +
A partir das 19h30 na [[Sede]] do Garoa Hacker Clube
 
  +
=== 7/novembro/2018 ===
  +
  +
* '''19h30''': Porque cientistas de dados adotaram Python: sequências, operadores, e memoryviews (''Luciano Ramalho'')
  +
* '''20h00''': Python em Ciências Sociais (''Guilherme Kenzo'')
  +
* '''20h30''': Intervalo
  +
* '''21h00''': Um modelo de aprendizagem em R (''Yumi Ambriola'')
  +
Organizador/Associado responsável: [[User:LucianoRamalho|Luciano Ramalho]]'''
  +
  +
=== 24/outubro/2018 ===
  +
  +
'''Talk: Programação visual com Orange'''
  +
  +
Orange é um projeto Open Source baseado em programação visual que nos permite carregar bases de dados, fazer transformações e pré-processamento, visualizar os dados de forma interativa, executar e avaliar algoritmos de Machine Learning tudo isso apenas com alguns cliques: https://orange.biolab.si/
  +
  +
19h30
  +
  +
'''Organizador:''' [https://github.com/victorantoniassi Victor Antoniassi]
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
  +
=== 17/outubro/2018 ===
  +
  +
'''Talk: Processo de ETL com dados públicos'''
  +
  +
'''Palestrante:''' [https://github.com/edinhodiluviano Edson Bomfim]
  +
'''Organizador:''' [https://github.com/victorantoniassi Victor Antoniassi]
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 19/setembro/2018 ===
  +
  +
'''Criação de gráficos II'''
  +
  +
Instruções para o pré-estudo em:
  +
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912
  +
  +
'''Atividade organizada por:''' Victor Antoniassi
  +
'''Estudo proposto por:''' [https://github.com/danilobellini Danilo Bellini]
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 12/setembro/2018 ===
  +
  +
'''Criação de gráficos'''
  +
  +
Instruções para o pré-estudo em:
  +
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912
  +
  +
'''Atividade organizada por:''' Victor Antoniassi
  +
'''Estudo proposto por:''' [https://github.com/danilobellini Danilo Bellini]
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 05/setembro/2018 ===
  +
  +
'''Análise Exploratória de Dados IV'''
  +
  +
* Visualização de dados em geral;
  +
* Estatística descritiva;
  +
* Insight sobre os dados;
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 29/agosto/2018 ===
  +
  +
'''Análise Exploratória de Dados III'''
  +
  +
* Visualização de dados em geral;
  +
* Estatística descritiva;
  +
* Insight sobre os dados;
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 22/agosto/2018 ===
  +
  +
'''Análise Exploratória de Dados II'''
  +
  +
* Visualização de dados em geral;
  +
* Estatística descritiva;
  +
* Insight sobre os dados;
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 15/agosto/2018 ===
  +
  +
'''Análise Exploratória de Dados I'''
  +
  +
* Visualização de dados em geral;
  +
* Estatística descritiva;
  +
* Insight sobre os dados;
  +
  +
[http://minerandodados.com.br/index.php/2017/04/27/exploratory-data-analysis-eda/ Tutorial sobre o tema]
  +
  +
Quarta-feira, 15 de agosto, das 19h30 às 22h na [[Sede]] do Garoa Hacker Clube.
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]'''
  +
  +
=== 08/agosto/2018 ===
  +
  +
'''Reformulação e planejamento do Grupo de Data Science do Garoa'''
  +
  +
Quarta-feira, 08 de agosto, das 19h30 às 22h45
  +
na [[Sede]] do Garoa Hacker Clube.
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' Juca
  +
  +
=== 01/agosto/2018 ===
  +
  +
'''Desafios de Data Science #02.1'''
  +
  +
Continuação da resolução do segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site
  +
[https://www.codenation.com.br/journey/data-science/index.html Code:Nation]
  +
  +
'''Associado responsável:''' [[User:Juca|Juca]]
  +
  +
=== 25/Julho/2018 ===
  +
  +
'''Desafios de Data Science #02'''
  +
  +
Bora resolver o segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site
  +
[https://www.codenation.com.br/journey/data-science/index.html Code:Nation]?!
  +
  +
Das 19h30 às 22h45 na Sede do Garoa Hacker Clube.
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Juca|Juca]]
  +
  +
=== 18/Julho/2018 ===
  +
  +
'''Desafios de Data Science #01'''
  +
Das 19h30 às 22h45 na [[Sede]] do Garoa Hacker Clube
 
 
 
Bora colocar a mão na massa resolvendo desafios de Ciência de Dados?
 
Bora colocar a mão na massa resolvendo desafios de Ciência de Dados?
Linha 33: Linha 173:
 
 
 
Traga seu laptop(se possível) e principalmente sua vontade de ensinar e aprender com o coletivo!
 
Traga seu laptop(se possível) e principalmente sua vontade de ensinar e aprender com o coletivo!
  +
  +
'''Atividade coordenada por:''' Victor Antoniassi
  +
'''Associado responsável:''' [[User:Juca|Juca]]
   
  +
Repositório com a solução do primeiro desafio "Melhores colocados ENEM": https://github.com/victorantoniassi/desafios_DS_GaroaHC
[[Categoria:Eventos]]
 
 
== Histórico ==
 
   
 
=== 26/Julho/2017 ===
 
=== 26/Julho/2017 ===
Linha 79: Linha 220:
 
abs
 
abs
 
Tom
 
Tom
  +
  +
[[Categoria:Eventos]]

Edição atual tal como às 11h57min de 10 de novembro de 2018

A atividade de Data Science é um momento ótimo para nos encontrarmos para discutir e aprender sobre diversos assuntos relacionados ao tema. Embora os assuntos abordados possam ser avançados, nada impede que alguém que esteja começando na área não possa participar, mas é bom lembrar que provavelmente haverá bastante matemática no meio. É importante salientar que os encontros são para discutir os temas, não necessariamente para ensinar. Não é objetivo dos encontros que eles sejam vistos como cursos de data science.

Sempre que possível, traga seu notebook para trabalharmos juntos nos problemas, discutindo e programando. Não há uma programação fixa, uma vez que a ideia é que os interessados se encontrem e os projetos surjam espontaneamente, no máximo planejamos o encontro da semana seguinte.

Para quem está iniciando nos estudos, há vários materiais muito bons online e vale olhar antes, durante e depois de cada reunião. Se você tiver dificuldades em encontrar um bom material, venha às reuniões para possamos encontrá-los juntos.

Participe do nosso grupo do Telegram: https://t.me/DS_Garoa

Visite nosso repositório no GitHub!: https://github.com/victorantoniassi/DS_GaroaHC

Data Science

Ciência de dados (em inglês: data science) é uma área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou insigths para possíveis tomadas de decisão, de maneira similar à mineração de dados. Ciência de dados alia big data e machine learning, além de técnicas de outras áreas interdisciplinares como estatística, economia, engenharia e outros subcampos da computação como: banco de dados e análise de agrupamentos (cluster analysis). A ciência de dados é um campo que já existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como: o surgimento e popularização do Big Data e o desenvolvimento de áreas como o machine learning. A ciência de dados pode, por exemplo, transformar essa grande quantidade de dados brutos em insights de negócios, e com isso, auxiliar empresas em tomadas de decisões para atingir melhores resultados.¹


¹Slveira, Debora Priscila (20 de julho de 2016). O que é Data Science?. Consultado em 13 de agosto de 2018

Encontros

14/novembro/2018

* 19h30: Overview à Pandas-  Patricia Guisordi
* 20h30: Usando python e teoria de redes complexas para fazer estatísticas de usuários de Twitter - Priscila
Organizadora: Priscila
Associado responsável: Priscila

Eventos Passados

7/novembro/2018

* 19h30: Porque cientistas de dados adotaram Python: sequências, operadores, e memoryviews (Luciano Ramalho)
* 20h00: Python em Ciências Sociais (Guilherme Kenzo)
* 20h30: Intervalo
* 21h00: Um modelo de aprendizagem em R (Yumi Ambriola)
Organizador/Associado responsável: Luciano Ramalho

24/outubro/2018

Talk: Programação visual com Orange
   
Orange é um projeto Open Source baseado em programação visual que nos permite carregar bases de dados, fazer transformações e pré-processamento, visualizar os dados de forma interativa, executar e avaliar algoritmos de Machine Learning tudo isso apenas com alguns cliques: https://orange.biolab.si/
 
 19h30
 
 Organizador: Victor Antoniassi
 Associado responsável: Vitor Fernandes


17/outubro/2018

Talk: Processo de ETL com dados públicos

 Palestrante: Edson Bomfim
 Organizador: Victor Antoniassi
 Associado responsável: Vitor Fernandes

19/setembro/2018

Criação de gráficos II
   
Instruções para o pré-estudo em:
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912

 Atividade organizada por: Victor Antoniassi 
 Estudo proposto por: Danilo Bellini
 Associado responsável: Vitor Fernandes

12/setembro/2018

Criação de gráficos
   
Instruções para o pré-estudo em:
https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912

 Atividade organizada por: Victor Antoniassi 
 Estudo proposto por: Danilo Bellini
 Associado responsável: Vitor Fernandes

05/setembro/2018

Análise Exploratória de Dados IV
   
 * Visualização de dados em geral;
 * Estatística descritiva;
 * Insight sobre os dados;

 Atividade coordenada por: Victor Antoniassi 
 Associado responsável: Vitor Fernandes

29/agosto/2018

Análise Exploratória de Dados III
   
 * Visualização de dados em geral;
 * Estatística descritiva;
 * Insight sobre os dados;

 Atividade coordenada por: Victor Antoniassi 
 Associado responsável: Vitor Fernandes

22/agosto/2018

Análise Exploratória de Dados II
   
 * Visualização de dados em geral;
 * Estatística descritiva;
 * Insight sobre os dados;

 Atividade coordenada por: Victor Antoniassi
 Associado responsável: Vitor Fernandes

15/agosto/2018

Análise Exploratória de Dados I  

 * Visualização de dados em geral;  
 * Estatística descritiva; 
 * Insight sobre os dados;
 
 Tutorial sobre o tema
 
Quarta-feira, 15 de agosto, das 19h30 às 22h na Sede do Garoa Hacker Clube.

 Atividade coordenada por: Victor Antoniassi
 Associado responsável: Vitor Fernandes

08/agosto/2018

Reformulação e planejamento do Grupo de Data Science do Garoa

 Quarta-feira, 08 de agosto, das 19h30 às 22h45
 na Sede do Garoa Hacker Clube.

Atividade coordenada por: Victor Antoniassi
Associado responsável: Juca

01/agosto/2018

Desafios de Data Science #02.1

 Continuação da resolução do segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site 
 Code:Nation

Associado responsável: Juca

25/Julho/2018

Desafios de Data Science #02

 Bora resolver o segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site 
 Code:Nation?!
 
 Das 19h30 às 22h45 na Sede do Garoa Hacker Clube.

Atividade coordenada por: Victor Antoniassi
Associado responsável: Juca

18/Julho/2018

Desafios de Data Science #01
Das 19h30 às 22h45 na Sede do Garoa Hacker Clube

Bora colocar a mão na massa resolvendo desafios de Ciência de Dados?

Desafios em Data Science é a nova série de atividades do Data Science Group do Garoa Hacker Clube.
De forma coletiva e colaborativa iremos em busca de soluções para os desafios de Data Science do site Code:Nation.
Atualmente o site oferece 4 desafios de Data Science, você pode verificar o conteúdo e o enunciado
do primeiro desafio no link: https://app.codenation.com.br/acceleration/data-science

Spoiler do segundo desafio: Modelo preditivo!

Conhecimentos recomendados para a atividade:
  Alguma familiaridade com programação em geral e Python
  Esse link oferece uma visão geral do básico da linguagem: https://learnxinyminutes.com/docs/pt-br/python3-pt/

Traga seu laptop(se possível) e principalmente sua vontade de ensinar e aprender com o coletivo!

Atividade coordenada por: Victor Antoniassi
Associado responsável: Juca
Repositório com a solução do primeiro desafio "Melhores colocados ENEM": https://github.com/victorantoniassi/desafios_DS_GaroaHC

26/Julho/2017

Contingency table, statistics and independence

aula de hoje pode ser visualizada ou clonada

https://github.com/flalix/statistics

código em R, pode abrir pdf, html ou pegar os códigos em markdown Rmd. (não esqueçam das imagens).


abr

Flavio

19/Julho/2017

Como ficou combinado, nessa próxima quarta-feira vamos conversar sobre o Perceptron (que é a unidade básica de uma rede neural). Vou tentar seguir a estrutura das apresentações do Danilo, mas com algumas alterações.

Meu objetivo é passar a motivação e a base teórica do trabalho original e também que cada um consiga implementar o código na sua linguagem de preferência. Eu vou mostrar o código from scratch em R, ou seja, sem nenhuma biblioteca adicional. Acredito que vai ser bem tranquilo pra todo mundo traduzir para a sua linguagem pois o código só usa loops e operações matriciais.

Não esqueçam de levar os notebooks. =)


Abraços,

Gabriel Perez


31/Maio/2017

Hey guys !

This Wednesday (31/05), it is going to be the fourth Datascience Group meeting! In this session, we plan to apply our skills on a kaggle competition project (https://www.kaggle.com/).

You are very welcome to join, play, share ideas and have fun with us !

abs Tom