Aqui você encontrará os melhores cursos, livros e blogs on -line para aprender como aplicar aprendizado profundo em aplicativos de visão computacional.
Justin Johnson faz um trabalho fenomenal, descrevendo todos os aspectos do aprendizado profundo de uma perspectiva de visão computacional. Você aprenderá tudo o que precisa saber de conceitos fundamentais, como retropropagação e redes neurais convolucionais, para detecção de objetos e segmentação de imagens. Um obrigatório para iniciantes
Instrutores: Justin Johnson
Tópicos que chamaram nossa atenção:
-
Visão 3D
-
Aprendizagem de reforço
-
Modelos generativos
https://www.youtube.com/watch?v=djygatp4sva
Parte da profunda especialização de aprendizado da Coursera, este curso foi projetado para ensinar tudo sobre redes neurais convolucionais e como elas são aplicadas em imagens e vídeos. Você começará com as fundações das redes neurais convolucionais e, em seguida, verá alguns estudos de caso, continuará com a detecção de objetos. Finalmente, você se aprofundará no reconhecimento de rosto e na transferência de estilo neural (NST).
O NST é uma técnica de otimização usada para tirar duas imagens – uma imagem de conteúdo e uma imagem de referência de estilo (como uma obra de arte de um pintor famoso) – e misturá -las para que a imagem de saída se pareça com a imagem de conteúdo, mas “pintada” no estilo da imagem de referência de estilo.
Fonte:xpertup
Instrutores: Andrew NgAssim, Younes Bensouda Mourri
https://www.youtube.com/watch?v=arpaax_phis
Aqui incluímos dois cursos em uma seção, porque uma é uma continuação da outra. Em particular, se você estiver interessado apenas em visão computacional, concentre-se nos seguintes sub-cursos:
Como você deve ter adivinhado, você aprenderá como resolver aplicativos de visão computacional do mundo real com o TensorFlow. Portanto, esteja preparado para uma análise completa da estrutura e de seus meandros.
Instrutores: Laurence MoroneyAssim, Eddy Shyu
Divulgação: Observe que alguns dos links desta postagem podem ser links de afiliados e, sem nenhum custo adicional, ganharemos uma comissão se você decidir fazer uma compra depois de clicar.
Este curso se concentra principalmente nos fundamentos da visão computacional e não gasta muito tempo em redes neurais profundas. No entanto, achamos que sempre devemos aprender o princípio básico antes de continuar em conceitos avançados. Portanto, se você concorda conosco, definitivamente deve conferir este curso.
Exemplo de tópicos:
-
Modelos de câmera e visualização
-
Iluminação
-
Monitorando
-
Movimento da imagem
Instrutores: Aaron BobickAssim, Irfan EssaAssim, Arpan Chakraborty
https://www.youtube.com/watch?v=gaazmnasiyg
O CS231 é um dos cursos mais conhecidos em visão computacional e provavelmente um dos mais abrangentes. As palestras de vídeo público no YouTube são de 2017, para que possa parecer um pouco desatualizado às vezes, mas isso não significa que não seja extremamente bem escrito e concebido. Uma grande vantagem são as notas incríveis que se pode encontrar no site do curso.
Exemplo de palestras:
-
Arquiteturas da CNN
-
Detecção e segmentação
-
Aprendizagem de reforço profundo
-
Exemplos adversários e treinamento adversário
Instrutores: Fei-FEI LiAssim, Justin JohnsonAssim, Serena Yeung
https://www.youtube.com/watch?v=vt1jzlth4g4
O principal programa de visão computacional da Udacity é um curso prático que combina conceitos teóricos com tutoriais práticos e projetos da vida real. É necessário conhecimento intermediário em Python, estatística e aprendizado de máquina. Ele tem um custo reconhecidamente alto, mas compensa o suporte técnico do mentor, uma grande comunidade estudantil e serviços de carreira personalizados.
Projetos:
-
Detecção de ponto de chave facial
-
Legenda de imagem automática
-
Detecção de marco e rastreamento
Instrutores: Sebastian ThrunAssim, Jay AlmasAssim, Luis Serrano
Este curso da UDEMY tem um foco duplo: explora os princípios básicos da visão computacional, bem como as técnicas avançadas de aprendizado profundo. Você usará Numpy, OpenCV, Tensorflow/Keras para resolver uma variedade de problemas práticos.
Lições de exemplo:
Instrutores: Jose Portilla
Outro curso da Udemy, que lida fortemente com arquiteturas de aprendizado profundo. Você aprenderá sobre redes neurais convolucionais, detectores curtos únicos e redes adversárias generativas.
Lições de exemplo:
-
Detecção de rosto com OpenCV
-
Detecção de objetos com SSD
-
Geração de imagens com Redes adversárias generativas (Gans). Os Gans se referem a duas redes neurais que jogam um jogo Min-Max ao longo do treinamento (gradiente Ascend Descend), a saber, o gerador G e a entrada do discriminador D. G é o ruído aleatório que é amostrado de uma distribuição em uma pequena gama de números reais. Para geração de imagens, a saída de G será uma imagem gerada. A principal diferença é que agora nos concentramos em gerar exemplos representativos de uma distribuição específica (ou seja, cães, pinturas, fotos de rua, aviões etc.) o discriminador nada mais é do que um classificador binário que se concentra em aprender a distribuição da classe.
Instrutores: Kirill EremenkoAssim, Hadelin de PontevesAssim, Equipe de Ligência
Um livro de 480 páginas que cobre tudo o que você precisa saber sobre os modernos sistemas de visão computacional. É dividido em 3 partes diferentes: Fundação de aprendizado profundo, classificação e detecção de imagens, modelos generativos e incorporações visuais. Uma ótima opção para programadores intermediários de Python e iniciantes de aprendizado profundo.
Capítulos que atraíram nosso interesse:
-
Arquiteturas Avançadas da CNN: LeNet, Alexnet, VGGNET, Inception
-
Você só olha uma vez (YOLO). O YOLO Família de arquiteturas são uma série de modelos de aprendizado profundo projetados para detecção de objetos rápidos, desenvolvida por Joseph Redmonet al.
-
Transferência de estilo profundo e estilo neural. DeepDream é uma idéia experimental que visa visualizar padrões de rede neural. Esses padrões são aprendidos por uma rede neural durante o treinamento. Na prática, o DeepDream aprimora os padrões que vê em uma imagem.
-
Incorporações visuais
Um exemplo de uma imagem profunda. Fonte: Tutoriais do TensorFlow
Autor: Mohamed Elgendy
Blogs de visão computacional
Outros cursos de visão computacional
A lista a seguir é baseada no incrível Página do Github de @jbhuang0604:
* Divulgação: Observe que alguns dos links acima podem ser links de afiliados e, sem nenhum custo adicional, ganharemos uma comissão se você decidir fazer uma compra depois de clicar.

Luis es un experto en Ciberseguridad, Computación en la Nube, Criptomonedas e Inteligencia Artificial. Con amplia experiencia en tecnología, su objetivo es compartir conocimientos prácticos para ayudar a los lectores a entender y aprovechar estas áreas digitales clave.