Como comecei em Ciência de Dados?

Written by:

O meu primeiro curso no mundo da IA

Neste post eu falo um pouco de como iniciei meus estudos em Ciência de Dados, onde aprendi e como foi a adaptação para um desenvolvedor Java.

No mundo passando por uma pandemia, eu me vi fechado em um apartamento por mais tempo do que qualquer pessoa poderia aguentar. Eu, minha esposa e meu filho estávamos no isolamento e o jeito que encontrei para preencher o dia, foi fazer alguns cursos.
No final de 2020 eu fiz o curso livre de introdução à inteligência artificial, um curso de extensão da PUC-RIO. Ali eu tive contato com Python pela primeira vez.

A professora apresentou a tecnologia que naquele momento parecia mágica.
Era uma área de aprendizado totalmente nova na minha carreira.
Eu lembro que na época da faculdade de informática da UERJ, vinte anos antes, eu fiz uma disciplina eletiva muito interessante chamada IA, que ensinava busca em profundidade, as antigas linguagens LISP e Prolog, dentre outros… Foi um contato inicial com livros técnicos que abordavam o assunto. Mas nada parecido com o que eu estava vendo agora: uma grande revolução na área de Machine Learning estava acontecendo bem agora, em plena pandemia, diante de meus olhos.

Neste curso, que foi uma parceria entre a universidade e a Intel Brasil, eu vi alguns projetos bem legais de aprendizado de máquina. Olhando em perspectiva, esta área já estava muito avançada e naquele momento é que surgiam os primeiros cursos dedicados à esta disciplina. Acredito que em termos de graduação, ainda não existia um curso aqui no Brasil totalmente direcionado para formar cientistas de dados.

Este curso foi uma bela surpresa para um curso inicial. Ele dava a visão geral da área, mostrando a evolução histórica, passando pelos longos períodos de inverno da Inteligência Artifical, chegando aos famosos casos de uso como Deep Blue, ImageNet, AlphaGo e finalmente o massivo uso de Deep Learning pela indústria: algoritmos de recomendação presentes nas redes sociais, os primeiros carros autônomos, os sistemas de navegação por rotas, sistemas de tradução em tempo real e todas essas novidades que hoje conhecemos.

Na parte prática do curso, iniciamos com o aprendizado do Workflow de resolução de problemas de ciência de dados. Novamente o curso mostra de forma clara o conceito geral antes de se aprofundar nos detalhes de implementação. Didática nota dez!
A professora mostrava em suas vídeo-aulas a resolução de problemas usando a ferramenta visual RapidMiner Studio e em seguida a implementação da mesma solução usando Python. O primeiro era muito simples de usar e resolver problemas de aprendizado de máquina. Já a montagem do ambiente Python era desafiadora.

Para um desenvolvedor Java era bem diferente aquele modo de programar. Se na programação tradicional implementamos a resolução específica de um problema, agora a programação é orientada aos dados apresentados no treinamento do seu modelo: a máquina aprende através de reconhecimento de padrões dos dados que ela conhece, de forma que ela consiga, dependendo de diversos fatores, generalizar bem aquele padrão para dados não apresentados na etapa de treino.

Além do paradigma ser diferente, a interface usando Notebooks e a linguagem Python te levam, num primeiro momento, para fora da sua zona de conforto. Depois com os primeiros exercícios, os primeiros Datasets, você vai entendendo como aplicar o processo e vai se sentindo mais à vontade. Hoje eu ainda uso notebooks mas dentro do VS Code e crio classes em Python para melhorar a estrutura e reaproveitamento de código.

Aqui no site, ao longo das próximas semanas, eu vou disponibilizar os projetos em Python criados no curso. Até lá!

Links do post:

https://especializacao.ccec.puc-rio.br/cursos-extensao

https://www.intel.com/content/www/us/en/developer/topic-technology/artificial-intelligence/training/course-artificial-intelligence.html

Leave a comment