Mudanças entre as edições de "Grupo de Ciência de Dados"
(150 revisões intermediárias por 4 usuários não estão sendo mostradas) | |||
Linha 1: | Linha 1: | ||
− | A atividade de Data Science é um momento |
+ | A atividade de Data Science é um momento ótimo para nos encontrarmos para discutir e aprender sobre diversos assuntos relacionados ao tema. Embora os assuntos abordados possam ser avançados, nada impede que alguém que esteja começando na área não possa participar, mas é bom lembrar que provavelmente haverá bastante matemática no meio. É importante salientar que os encontros são para discutir os temas, não necessariamente para ensinar. Não é objetivo dos encontros que eles sejam vistos como cursos de data science. |
− | + | Sempre que possível, traga seu notebook para trabalharmos juntos nos problemas, discutindo e programando. Não há uma programação fixa, uma vez que a ideia é que os interessados se encontrem e os projetos surjam espontaneamente, no máximo planejamos o encontro da semana seguinte. |
|
− | Para quem |
+ | Para quem está iniciando nos estudos, há vários materiais muito bons online e vale olhar antes, durante e depois de cada reunião. Se você tiver dificuldades em encontrar um bom material, venha às reuniões para possamos encontrá-los juntos. |
+ | Participe do nosso grupo do Telegram: https://t.me/DS_Garoa |
||
+ | Visite nosso repositório no GitHub!: https://github.com/victorantoniassi/DS_GaroaHC |
||
=Data Science= |
=Data Science= |
||
+ | Ciência de dados (em inglês: data science) é uma área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou insigths para possíveis tomadas de decisão, de maneira similar à mineração de dados. Ciência de dados alia big data e machine learning, além de técnicas de outras áreas interdisciplinares como estatística, economia, engenharia e outros subcampos da computação como: banco de dados e análise de agrupamentos (cluster analysis). A ciência de dados é um campo que já existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como: o surgimento e popularização do Big Data e o desenvolvimento de áreas como o machine learning. A ciência de dados pode, por exemplo, transformar essa grande quantidade de dados brutos em insights de negócios, e com isso, auxiliar empresas em tomadas de decisões para atingir melhores resultados.¹ |
||
− | Trata de analisar dados utilizando matemática, estatística, computação e as vezes algum conhecimento da área que está estudando. |
||
− | Nossa lista de emails no Google Groups é: https://groups.google.com/forum/#!forum/garoa95 |
||
+ | ¹Slveira, Debora Priscila (20 de julho de 2016). [https://www.oficinadanet.com.br/post/16919-o-que-e-data-science O que é Data Science?]. Consultado em 13 de agosto de 2018 |
||
=Encontros= |
=Encontros= |
||
− | == |
+ | === 14/novembro/2018 === |
+ | |||
+ | * '''19h30''': Overview à Pandas- Patricia Guisordi |
||
+ | * '''20h30''': Usando python e teoria de redes complexas para fazer estatísticas de usuários de Twitter - Priscila |
||
+ | Organizadora: Priscila |
||
+ | Associado responsável: Priscila |
||
+ | == Eventos Passados == |
||
− | '''Desafios em Data Science''' com Victor Antoniassi |
||
+ | |||
− | A partir das 19h30 na [[Sede]] do Garoa Hacker Clube |
||
+ | === 7/novembro/2018 === |
||
+ | |||
+ | * '''19h30''': Porque cientistas de dados adotaram Python: sequências, operadores, e memoryviews (''Luciano Ramalho'') |
||
+ | * '''20h00''': Python em Ciências Sociais (''Guilherme Kenzo'') |
||
+ | * '''20h30''': Intervalo |
||
+ | * '''21h00''': Um modelo de aprendizagem em R (''Yumi Ambriola'') |
||
+ | Organizador/Associado responsável: [[User:LucianoRamalho|Luciano Ramalho]]''' |
||
+ | |||
+ | === 24/outubro/2018 === |
||
+ | |||
+ | '''Talk: Programação visual com Orange''' |
||
+ | |||
+ | Orange é um projeto Open Source baseado em programação visual que nos permite carregar bases de dados, fazer transformações e pré-processamento, visualizar os dados de forma interativa, executar e avaliar algoritmos de Machine Learning tudo isso apenas com alguns cliques: https://orange.biolab.si/ |
||
+ | |||
+ | 19h30 |
||
+ | |||
+ | '''Organizador:''' [https://github.com/victorantoniassi Victor Antoniassi] |
||
+ | '''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]''' |
||
+ | |||
+ | |||
+ | === 17/outubro/2018 === |
||
+ | |||
+ | '''Talk: Processo de ETL com dados públicos''' |
||
+ | |||
+ | '''Palestrante:''' [https://github.com/edinhodiluviano Edson Bomfim] |
||
+ | '''Organizador:''' [https://github.com/victorantoniassi Victor Antoniassi] |
||
+ | '''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]''' |
||
+ | |||
+ | === 19/setembro/2018 === |
||
+ | |||
+ | '''Criação de gráficos II''' |
||
+ | |||
+ | Instruções para o pré-estudo em: |
||
+ | https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912 |
||
+ | |||
+ | '''Atividade organizada por:''' Victor Antoniassi |
||
+ | '''Estudo proposto por:''' [https://github.com/danilobellini Danilo Bellini] |
||
+ | '''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]''' |
||
+ | |||
+ | === 12/setembro/2018 === |
||
+ | |||
+ | '''Criação de gráficos''' |
||
+ | |||
+ | Instruções para o pré-estudo em: |
||
+ | https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912 |
||
+ | |||
+ | '''Atividade organizada por:''' Victor Antoniassi |
||
+ | '''Estudo proposto por:''' [https://github.com/danilobellini Danilo Bellini] |
||
+ | '''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]''' |
||
+ | |||
+ | === 05/setembro/2018 === |
||
+ | |||
+ | '''Análise Exploratória de Dados IV''' |
||
+ | |||
+ | * Visualização de dados em geral; |
||
+ | * Estatística descritiva; |
||
+ | * Insight sobre os dados; |
||
+ | |||
+ | '''Atividade coordenada por:''' Victor Antoniassi |
||
+ | '''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]''' |
||
+ | |||
+ | === 29/agosto/2018 === |
||
+ | |||
+ | '''Análise Exploratória de Dados III''' |
||
+ | |||
+ | * Visualização de dados em geral; |
||
+ | * Estatística descritiva; |
||
+ | * Insight sobre os dados; |
||
+ | |||
+ | '''Atividade coordenada por:''' Victor Antoniassi |
||
+ | '''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]''' |
||
+ | |||
+ | === 22/agosto/2018 === |
||
+ | |||
+ | '''Análise Exploratória de Dados II''' |
||
+ | |||
+ | * Visualização de dados em geral; |
||
+ | * Estatística descritiva; |
||
+ | * Insight sobre os dados; |
||
+ | |||
+ | '''Atividade coordenada por:''' Victor Antoniassi |
||
+ | '''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]''' |
||
+ | |||
+ | === 15/agosto/2018 === |
||
+ | |||
+ | '''Análise Exploratória de Dados I''' |
||
+ | |||
+ | * Visualização de dados em geral; |
||
+ | * Estatística descritiva; |
||
+ | * Insight sobre os dados; |
||
+ | |||
+ | [http://minerandodados.com.br/index.php/2017/04/27/exploratory-data-analysis-eda/ Tutorial sobre o tema] |
||
+ | |||
+ | Quarta-feira, 15 de agosto, das 19h30 às 22h na [[Sede]] do Garoa Hacker Clube. |
||
+ | |||
+ | '''Atividade coordenada por:''' Victor Antoniassi |
||
+ | '''Associado responsável:''' [[User:Vitor_fernandes|Vitor Fernandes]]''' |
||
+ | |||
+ | === 08/agosto/2018 === |
||
+ | |||
+ | '''Reformulação e planejamento do Grupo de Data Science do Garoa''' |
||
+ | |||
+ | Quarta-feira, 08 de agosto, das 19h30 às 22h45 |
||
+ | na [[Sede]] do Garoa Hacker Clube. |
||
+ | |||
+ | '''Atividade coordenada por:''' Victor Antoniassi |
||
+ | '''Associado responsável:''' Juca |
||
+ | |||
+ | === 01/agosto/2018 === |
||
+ | |||
+ | '''Desafios de Data Science #02.1''' |
||
+ | |||
+ | Continuação da resolução do segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site |
||
+ | [https://www.codenation.com.br/journey/data-science/index.html Code:Nation] |
||
+ | |||
+ | '''Associado responsável:''' [[User:Juca|Juca]] |
||
+ | |||
+ | === 25/Julho/2018 === |
||
+ | |||
+ | '''Desafios de Data Science #02''' |
||
+ | |||
+ | Bora resolver o segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site |
||
+ | [https://www.codenation.com.br/journey/data-science/index.html Code:Nation]?! |
||
+ | |||
+ | Das 19h30 às 22h45 na Sede do Garoa Hacker Clube. |
||
+ | |||
+ | '''Atividade coordenada por:''' Victor Antoniassi |
||
+ | '''Associado responsável:''' [[User:Juca|Juca]] |
||
+ | |||
+ | === 18/Julho/2018 === |
||
+ | |||
+ | '''Desafios de Data Science #01''' |
||
+ | Das 19h30 às 22h45 na [[Sede]] do Garoa Hacker Clube |
||
Bora colocar a mão na massa resolvendo desafios de Ciência de Dados? |
Bora colocar a mão na massa resolvendo desafios de Ciência de Dados? |
||
Linha 33: | Linha 173: | ||
Traga seu laptop(se possível) e principalmente sua vontade de ensinar e aprender com o coletivo! |
Traga seu laptop(se possível) e principalmente sua vontade de ensinar e aprender com o coletivo! |
||
+ | |||
+ | '''Atividade coordenada por:''' Victor Antoniassi |
||
+ | '''Associado responsável:''' [[User:Juca|Juca]] |
||
+ | Repositório com a solução do primeiro desafio "Melhores colocados ENEM": https://github.com/victorantoniassi/desafios_DS_GaroaHC |
||
− | [[Categoria:Eventos]] |
||
− | |||
− | == Histórico == |
||
− | == 26 |
+ | === 26/Julho/2017 === |
'''Contingency table, statistics and independence''' |
'''Contingency table, statistics and independence''' |
||
Linha 53: | Linha 194: | ||
Flavio |
Flavio |
||
− | == 19 |
+ | === 19/Julho/2017 === |
Como ficou combinado, nessa próxima quarta-feira vamos conversar sobre o Perceptron (que é a unidade básica de uma rede neural). Vou tentar seguir a estrutura das apresentações do Danilo, mas com algumas alterações. |
Como ficou combinado, nessa próxima quarta-feira vamos conversar sobre o Perceptron (que é a unidade básica de uma rede neural). Vou tentar seguir a estrutura das apresentações do Danilo, mas com algumas alterações. |
||
Linha 68: | Linha 209: | ||
− | == 31 |
+ | === 31/Maio/2017 === |
Hey guys ! |
Hey guys ! |
||
Linha 79: | Linha 220: | ||
abs |
abs |
||
Tom |
Tom |
||
+ | |||
+ | [[Categoria:Eventos]] |
Edição atual tal como às 11h57min de 10 de novembro de 2018
A atividade de Data Science é um momento ótimo para nos encontrarmos para discutir e aprender sobre diversos assuntos relacionados ao tema. Embora os assuntos abordados possam ser avançados, nada impede que alguém que esteja começando na área não possa participar, mas é bom lembrar que provavelmente haverá bastante matemática no meio. É importante salientar que os encontros são para discutir os temas, não necessariamente para ensinar. Não é objetivo dos encontros que eles sejam vistos como cursos de data science.
Sempre que possível, traga seu notebook para trabalharmos juntos nos problemas, discutindo e programando. Não há uma programação fixa, uma vez que a ideia é que os interessados se encontrem e os projetos surjam espontaneamente, no máximo planejamos o encontro da semana seguinte.
Para quem está iniciando nos estudos, há vários materiais muito bons online e vale olhar antes, durante e depois de cada reunião. Se você tiver dificuldades em encontrar um bom material, venha às reuniões para possamos encontrá-los juntos.
Participe do nosso grupo do Telegram: https://t.me/DS_Garoa
Visite nosso repositório no GitHub!: https://github.com/victorantoniassi/DS_GaroaHC
Data Science
Ciência de dados (em inglês: data science) é uma área interdisciplinar voltada para o estudo e a análise de dados, estruturados ou não, que visa a extração de conhecimento ou insigths para possíveis tomadas de decisão, de maneira similar à mineração de dados. Ciência de dados alia big data e machine learning, além de técnicas de outras áreas interdisciplinares como estatística, economia, engenharia e outros subcampos da computação como: banco de dados e análise de agrupamentos (cluster analysis). A ciência de dados é um campo que já existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como: o surgimento e popularização do Big Data e o desenvolvimento de áreas como o machine learning. A ciência de dados pode, por exemplo, transformar essa grande quantidade de dados brutos em insights de negócios, e com isso, auxiliar empresas em tomadas de decisões para atingir melhores resultados.¹
¹Slveira, Debora Priscila (20 de julho de 2016). O que é Data Science?. Consultado em 13 de agosto de 2018
Encontros
14/novembro/2018
* 19h30: Overview à Pandas- Patricia Guisordi * 20h30: Usando python e teoria de redes complexas para fazer estatísticas de usuários de Twitter - Priscila Organizadora: Priscila Associado responsável: Priscila
Eventos Passados
7/novembro/2018
* 19h30: Porque cientistas de dados adotaram Python: sequências, operadores, e memoryviews (Luciano Ramalho) * 20h00: Python em Ciências Sociais (Guilherme Kenzo) * 20h30: Intervalo * 21h00: Um modelo de aprendizagem em R (Yumi Ambriola) Organizador/Associado responsável: Luciano Ramalho
24/outubro/2018
Talk: Programação visual com Orange Orange é um projeto Open Source baseado em programação visual que nos permite carregar bases de dados, fazer transformações e pré-processamento, visualizar os dados de forma interativa, executar e avaliar algoritmos de Machine Learning tudo isso apenas com alguns cliques: https://orange.biolab.si/ 19h30 Organizador: Victor Antoniassi Associado responsável: Vitor Fernandes
17/outubro/2018
Talk: Processo de ETL com dados públicos Palestrante: Edson Bomfim Organizador: Victor Antoniassi Associado responsável: Vitor Fernandes
19/setembro/2018
Criação de gráficos II Instruções para o pré-estudo em: https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912 Atividade organizada por: Victor Antoniassi Estudo proposto por: Danilo Bellini Associado responsável: Vitor Fernandes
12/setembro/2018
Criação de gráficos Instruções para o pré-estudo em: https://github.com/victorantoniassi/DS_GaroaHC/tree/master/grupo_de_estudos/180912 Atividade organizada por: Victor Antoniassi Estudo proposto por: Danilo Bellini Associado responsável: Vitor Fernandes
05/setembro/2018
Análise Exploratória de Dados IV * Visualização de dados em geral; * Estatística descritiva; * Insight sobre os dados; Atividade coordenada por: Victor Antoniassi Associado responsável: Vitor Fernandes
29/agosto/2018
Análise Exploratória de Dados III * Visualização de dados em geral; * Estatística descritiva; * Insight sobre os dados; Atividade coordenada por: Victor Antoniassi Associado responsável: Vitor Fernandes
22/agosto/2018
Análise Exploratória de Dados II * Visualização de dados em geral; * Estatística descritiva; * Insight sobre os dados; Atividade coordenada por: Victor Antoniassi Associado responsável: Vitor Fernandes
15/agosto/2018
Análise Exploratória de Dados I * Visualização de dados em geral; * Estatística descritiva; * Insight sobre os dados; Tutorial sobre o tema Quarta-feira, 15 de agosto, das 19h30 às 22h na Sede do Garoa Hacker Clube. Atividade coordenada por: Victor Antoniassi Associado responsável: Vitor Fernandes
08/agosto/2018
Reformulação e planejamento do Grupo de Data Science do Garoa Quarta-feira, 08 de agosto, das 19h30 às 22h45 na Sede do Garoa Hacker Clube. Atividade coordenada por: Victor Antoniassi Associado responsável: Juca
01/agosto/2018
Desafios de Data Science #02.1 Continuação da resolução do segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site Code:Nation Associado responsável: Juca
25/Julho/2018
Desafios de Data Science #02 Bora resolver o segundo desafio "Prever nota de matemática do ENEM" da Jornada de Data Science do site Code:Nation?! Das 19h30 às 22h45 na Sede do Garoa Hacker Clube. Atividade coordenada por: Victor Antoniassi Associado responsável: Juca
18/Julho/2018
Desafios de Data Science #01 Das 19h30 às 22h45 na Sede do Garoa Hacker Clube Bora colocar a mão na massa resolvendo desafios de Ciência de Dados? Desafios em Data Science é a nova série de atividades do Data Science Group do Garoa Hacker Clube. De forma coletiva e colaborativa iremos em busca de soluções para os desafios de Data Science do site Code:Nation. Atualmente o site oferece 4 desafios de Data Science, você pode verificar o conteúdo e o enunciado do primeiro desafio no link: https://app.codenation.com.br/acceleration/data-science Spoiler do segundo desafio: Modelo preditivo! Conhecimentos recomendados para a atividade: Alguma familiaridade com programação em geral e Python Esse link oferece uma visão geral do básico da linguagem: https://learnxinyminutes.com/docs/pt-br/python3-pt/ Traga seu laptop(se possível) e principalmente sua vontade de ensinar e aprender com o coletivo! Atividade coordenada por: Victor Antoniassi Associado responsável: Juca
Repositório com a solução do primeiro desafio "Melhores colocados ENEM": https://github.com/victorantoniassi/desafios_DS_GaroaHC
26/Julho/2017
Contingency table, statistics and independence
aula de hoje pode ser visualizada ou clonada
https://github.com/flalix/statistics
código em R, pode abrir pdf, html ou pegar os códigos em markdown Rmd. (não esqueçam das imagens).
abr
Flavio
19/Julho/2017
Como ficou combinado, nessa próxima quarta-feira vamos conversar sobre o Perceptron (que é a unidade básica de uma rede neural). Vou tentar seguir a estrutura das apresentações do Danilo, mas com algumas alterações.
Meu objetivo é passar a motivação e a base teórica do trabalho original e também que cada um consiga implementar o código na sua linguagem de preferência. Eu vou mostrar o código from scratch em R, ou seja, sem nenhuma biblioteca adicional. Acredito que vai ser bem tranquilo pra todo mundo traduzir para a sua linguagem pois o código só usa loops e operações matriciais.
Não esqueçam de levar os notebooks. =)
Abraços,
Gabriel Perez
31/Maio/2017
Hey guys !
This Wednesday (31/05), it is going to be the fourth Datascience Group meeting! In this session, we plan to apply our skills on a kaggle competition project (https://www.kaggle.com/).
You are very welcome to join, play, share ideas and have fun with us !
abs Tom