Bem-vindo 🤗 ao repositório de estudos sobre Ciência de Dados, com foco Análises Exploratória de Dados e modelagens em machine learning aplicadas à ciência de dados e análise. A modelagem em machine learning consiste no processo de criar, treinar e validar modelos computacionais que aprendem padrões a partir de dados. São uma gama de modelos amplamente utilizados para resolver problemas complexos em diversas áreas, os quais envolvem a previsão (regressão), classificação, agrupamento/segmentação e detecção de anomalias (por exemplo, outliers). Compartilho exemplos práticos sobre a para utilização de bibliotecas em Python, voltadas:
- Exemplos práticos para Análise Exploratória de Dados usando bibliotecas como:
- Matplotlib para criação de gráficos e visualizações;
- Pandas para manipulação e análise de dados;
- Seaborn para visualização e análieses estatística de dados;
- Numpy para computação numérica, incluindo arrays multidimensionais.
- Construção e avaliação de modelos de regressão, classificação e agrupamento usando bibliotecas, como:
- Scikit-learn para modelagens preditivas usando aprendizado de máquina.
- SnapML, desenvolvida pela IBM, com ênfase em alto desempenho e escalabilidade, projetada para lidar com grandes volumes de dados, utilizando técnicas de paralelismo e aceleração por GPU.
- Compartilhar soluções didáticas e bem documentadas para quem está estudando Ciência de Dados, servindo como base de consulta.
- Modelagens utilizando Machine Learn:
- Regressão
- Classificação
- Agrupamento/Clustering
- Comparação de Desempenho Preditivo:
![Badge IBM](https://private-user-images.githubusercontent.com/176045600/405377154-8d25464f-0d04-450d-907c-c932c6fef15e.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3Mzg4OTkxOTIsIm5iZiI6MTczODg5ODg5MiwicGF0aCI6Ii8xNzYwNDU2MDAvNDA1Mzc3MTU0LThkMjU0NjRmLTBkMDQtNDUwZC05MDdjLWM5MzJjNmZlZjE1ZS5wbmc_WC1BbXotQWxnb3JpdGhtPUFXUzQtSE1BQy1TSEEyNTYmWC1BbXotQ3JlZGVudGlhbD1BS0lBVkNPRFlMU0E1M1BRSzRaQSUyRjIwMjUwMjA3JTJGdXMtZWFzdC0xJTJGczMlMkZhd3M0X3JlcXVlc3QmWC1BbXotRGF0ZT0yMDI1MDIwN1QwMzI4MTJaJlgtQW16LUV4cGlyZXM9MzAwJlgtQW16LVNpZ25hdHVyZT0yZWFiZTQ3OGNjNzRkYWEwN2ZmMDUwYWVlNzgzZTM3ODBhZTg5MjI5NGIzNGQ1ZWVkNjY5NThmZWZkMTdhYTdkJlgtQW16LVNpZ25lZEhlYWRlcnM9aG9zdCJ9.WcbC043OOVH1jCi9xOiaQsjGgdYBJ2ZdKsP9XIc5R6s)
Machine Learning with Python
This credential earner understands the basics of machine learning using Python such as:
Distinguishing the difference between the two main types of machine learning methods: supervised & unsupervised;
Identifying supervised learning algorithms, including classification & regression;
Identifying unsupervised learning algorithms, including Clustering & Dimensionality Reduction;
Determining how statistical modeling relates to machine learning & comparing them;
How machine learning affects society.
- BARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar / tese (doutorado) - PPgEEC/UFRN, Natal/RN, 2020.
- GÉRON, A. Hands-On machine learning with scikit-learn, keras & tensorflow farnham. Canada: O’Reilly, 2023.
- GUJARATI, Damodar N. Essentials of econometrics. Sage Publications, 2021.
Contribuições são bem-vindas! Se você deseja aprimorar as soluções ou adicionar explicações, sinta-se à vontade para abrir um Pull Request.
🚀 Compartilhe conhecimento e inspire futuros cientistas de dados!