Bem-vindo 🤗 ao repositório de estudos sobre Ciência de Dados, com foco Análises Exploratória de Dados e modelagens em machine learning aplicadas à ciência de dados e análise. A modelagem em machine learning consiste no processo de criar, treinar e validar modelos computacionais que aprendem padrões a partir de dados. São uma gama de modelos amplamente utilizados para resolver problemas complexos em diversas áreas, os quais envolvem a previsão (regressão), classificação, agrupamento/segmentação e detecção de anomalias (por exemplo, outliers). Compartilho exemplos práticos sobre a para utilização de bibliotecas em Python, voltadas:
- Exemplos práticos para Análise Exploratória de Dados usando bibliotecas como:
- Matplotlib para criação de gráficos e visualizações;
- Pandas para manipulação e análise de dados;
- Seaborn para visualização e análieses estatística de dados;
- Numpy para computação numérica, incluindo arrays multidimensionais.
- Construção e avaliação de modelos de regressão, classificação e agrupamento usando bibliotecas, como:
- Scikit-learn para modelagens preditivas usando aprendizado de máquina.
- SnapML, desenvolvida pela IBM, com ênfase em alto desempenho e escalabilidade, projetada para lidar com grandes volumes de dados, utilizando técnicas de paralelismo e aceleração por GPU.
- Compartilhar soluções didáticas e bem documentadas para quem está estudando Ciência de Dados, servindo como base de consulta.
- Modelagens utilizando Machine Learn:
- Regressão
- Classificação
- Agrupamento/Clustering
- Comparação de Desempenho Preditivo:
Machine Learning with Python
This credential earner understands the basics of machine learning using Python such as:
Distinguishing the difference between the two main types of machine learning methods: supervised & unsupervised;
Identifying supervised learning algorithms, including classification & regression;
Identifying unsupervised learning algorithms, including Clustering & Dimensionality Reduction;
Determining how statistical modeling relates to machine learning & comparing them;
How machine learning affects society.
- BARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar / tese (doutorado) - PPgEEC/UFRN, Natal/RN, 2020.
- GÉRON, A. Hands-On machine learning with scikit-learn, keras & tensorflow farnham. Canada: O’Reilly, 2023.
- GUJARATI, Damodar N. Essentials of econometrics. Sage Publications, 2021.
Contribuições são bem-vindas! Se você deseja aprimorar as soluções ou adicionar explicações, sinta-se à vontade para abrir um Pull Request.
🚀 Compartilhe conhecimento e inspire futuros cientistas de dados!