Saltar al contenido principal

Introducción

¿De qué trata este contenido?

Este contenido corresponde a un material introductorio en Visión por Computadora, un área de la Inteligencia Artificial dedicada a enseñar a las máquinas a interpretar, procesar y comprender imágenes o videos del mundo real. Su propósito es entregar una base sólida en los conceptos fundamentales, técnicas básicas y aplicaciones prácticas, de manera clara y accesible.

Propósito del contenido

El objetivo principal es motivar y guiar a quienes desean comenzar a explorar esta área, ofreciendo explicaciones claras, ejemplos concretos y recursos útiles. La idea es que puedas aprender paso a paso, sin necesidad de conocimientos previos en inteligencia artificial.

Público objetivo

Este contenido está pensado para personas interesadas en introducirse a la Visión por Computadora, ya sea con fines académicos, profesionales o simplemente por curiosidad personal. No se requiere experiencia previa en el área, solo interés y disposición para aprender.

Materiales en los que se apoya esta página

El contenido presentado en la página se apoya de distintos recursos académicos y prácticos. Entre ellos:

  • Libros:
    • Goodfellow, I., Bengio, Y., & Courville, A. (2017). Deep Learning. MIT Press.
    • Fernández Villán, A. (2019). Mastering OpenCV 4 with Python. Packt Publishing Ltd.
    • Chollet, F. (2021). Deep Learning with Python (2nd ed.). Manning Publications.
  • Artículos cientificos:
    • Hubel, D. H., & Wiesel, T. N. (1959). Receptive Fields of Single Neurones in the Cat's Striate Cortex. The Journal of Physiology, 148(3), 574–591. PDF
    • Roberts, L. G. (1963). Machine Perception of Three-dimensional Solids. MIT PhD Thesis. PDF
    • Marr, D. (1982). Vision: A Computational Investigation into the Human Representation and Processing of Visual Information. W.H. Freeman. PDF
    • Fukushima, K. (1980). Neocognitron: A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position. Biological Cybernetics, 36, 193–202. PDF
    • Viola, P., & Jones, M. (2001). Rapid Object Detection using a Boosted Cascade of Simple Features. IEEE CVPR. PDF
    • Russakovsky, O., Deng, J., Su, H., Krause, J., et al. (2015). ImageNet Large Scale Visual Recognition Challenge. International Journal of Computer Vision (IJCV), 115(3), 211–252. PDF
    • Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). ImageNet Classification with Deep Convolutional Neural Networks. Advances in Neural Information Processing Systems (NeurIPS). PDF
    • Redmon, J., Divvala, S., Girshick, R., & Farhadi, A. (2016). You Only Look Once: Unified, Real-Time Object Detection. IEEE CVPR. PDF
  • Sitios web:
    • Sitio oficial - Kurzweil, R. (1974). Kurzweil Computer Products: Omni-font OCR.
    • OpenCV – Biblioteca fundamental para el procesamiento y análisis de imágenes.
    • Hugging Face – Plataforma de modelos pre-entrenados, datasets y herramientas de IA.
    • Kaggle – Comunidad para ciencia de datos con datasets, notebooks y competencias.