Introducción
¿De qué trata este contenido?
Este contenido corresponde a un material introductorio en Visión por Computadora, un área de la Inteligencia Artificial dedicada a enseñar a las máquinas a interpretar, procesar y comprender imágenes o videos del mundo real. Su propósito es entregar una base sólida en los conceptos fundamentales, técnicas básicas y aplicaciones prácticas, de manera clara y accesible.
Propósito del contenido
El objetivo principal es motivar y guiar a quienes desean comenzar a explorar esta área, ofreciendo explicaciones claras, ejemplos concretos y recursos útiles. La idea es que puedas aprender paso a paso, sin necesidad de conocimientos previos en inteligencia artificial.
Público objetivo
Este contenido está pensado para personas interesadas en introducirse a la Visión por Computadora, ya sea con fines académicos, profesionales o simplemente por curiosidad personal. No se requiere experiencia previa en el área, solo interés y disposición para aprender.
Materiales en los que se apoya esta página
El contenido presentado en la página se apoya de distintos recursos académicos y prácticos. Entre ellos:
- Libros:
- Goodfellow, I., Bengio, Y., & Courville, A. (2017). Deep Learning. MIT Press.
- Fernández Villán, A. (2019). Mastering OpenCV 4 with Python. Packt Publishing Ltd.
- Chollet, F. (2021). Deep Learning with Python (2nd ed.). Manning Publications.
- Artículos cientificos:
- Hubel, D. H., & Wiesel, T. N. (1959). Receptive Fields of Single Neurones in the Cat's Striate Cortex. The Journal of Physiology, 148(3), 574–591. PDF
- Roberts, L. G. (1963). Machine Perception of Three-dimensional Solids. MIT PhD Thesis. PDF
- Marr, D. (1982). Vision: A Computational Investigation into the Human Representation and Processing of Visual Information. W.H. Freeman. PDF
- Fukushima, K. (1980). Neocognitron: A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position. Biological Cybernetics, 36, 193–202. PDF
- Viola, P., & Jones, M. (2001). Rapid Object Detection using a Boosted Cascade of Simple Features. IEEE CVPR. PDF
- Russakovsky, O., Deng, J., Su, H., Krause, J., et al. (2015). ImageNet Large Scale Visual Recognition Challenge. International Journal of Computer Vision (IJCV), 115(3), 211–252. PDF
- Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). ImageNet Classification with Deep Convolutional Neural Networks. Advances in Neural Information Processing Systems (NeurIPS). PDF
- Redmon, J., Divvala, S., Girshick, R., & Farhadi, A. (2016). You Only Look Once: Unified, Real-Time Object Detection. IEEE CVPR. PDF
- Sitios web:
- Sitio oficial - Kurzweil, R. (1974). Kurzweil Computer Products: Omni-font OCR.
- OpenCV – Biblioteca fundamental para el procesamiento y análisis de imágenes.
- Hugging Face – Plataforma de modelos pre-entrenados, datasets y herramientas de IA.
- Kaggle – Comunidad para ciencia de datos con datasets, notebooks y competencias.