Algoritmo basado en inteligencia artificial para el procesamiento de libros caja manuscritos y su conversión a archivos de datos estructurados

dc.contributor.advisorQuinde Li Say Tan, Mario José
dc.contributor.authorChapilliquen Nicolas, Daniel Alexander
dc.coverage.spatialPerú
dc.date.accessioned2024-04-09T23:45:38Z
dc.date.available2024-04-09T23:45:38Z
dc.date.issued2024-03
dc.description.abstractLa digitalización de libros antiguos es una tarea que es aún desafiante en la actualidad, a pesar del avance tecnológico. No toda la información disponible en el mundo ha sido digitalizada, por ende, aún se desconocen varios hechos importantes de la historia. Ante esto, la inteligencia artificial es una herramienta que nos permite convertir texto escrito o impreso en un formato digital manejable, el Reconocimiento Óptico de Caracteres (OCR por sus siglas en inglés). Sin embargo, esta herramienta no entrega un resultado legible si no se tiene en cuenta la estructura de la información a procesar. La tesis tiene como objetivo diseñar y validar un algoritmo basado en inteligencia artificial para el procesamiento de libros caja manuscritos de la empresa Duncan-Fox de los años 1881-1889 y su conversión a archivos de datos estructurados. La solución propuesta es una herramienta que permitiría estudiar la historia económica de Piura mediante la influencia de la casa comercial Duncan-Fox, empresa de gran participación en el mercado piurano entre los siglos XIX – XX. Para la metodología de esta investigación se analizó la precisión de lectura de diversas OCR disponibles en internet, algunas de paga y otras gratuitas, con el fin de encontrar la más adecuada para las características de los libros. Por otra parte, fue necesario el uso de materiales como cámara profesional, guantes quirúrgicos y copy stand para la digitalización de las páginas de los libros caja. Así como el empleo de redes neuronales para diseñar modelos de detección que permitan identificar la estructura de las páginas para, posteriormente estructurar la información mediante programación. El algoritmo diseñado se define en una secuencia de seis pasos: digitalización de libro, normalización, detección de líneas verticales, detección de líneas horizontales, detección de texto y estructuración. Este algoritmo fue validado cumpliendo con el objetivo planteado y sembrando ideas de trabajo a futuro para expandir la investigación.
dc.formatapplication/pdf
dc.identifier.citationChapilliquen, D. (2024). Algoritmo basado en inteligencia artificial para el procesamiento de libros caja manuscritos y su conversión a archivos de datos estructurados (Tesis para optar el título de Ingeniero Industrial y de Sistemas). Universidad de Piura. Facultad de Ingeniería. Programa Académico de Ingeniería Industrial y de Sistemas. Piura, Perú.
dc.identifier.urihttps://hdl.handle.net/11042/6646
dc.language.isospa
dc.publisherUniversidad de Piuraes
dc.publisher.countryPE
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttps://creativecommons.org/licenses/by-nd/4.0/
dc.sourceUniversidad de Piuraes
dc.sourceRepositorio Institucional Pirhua - UDEPes
dc.subjectLibros de contabilidad -- Digitalización
dc.subjectLibros antiguos -- Digitalización -- Inteligencia artificial
dc.subjectManuscritos -- Inteligencia artificial -- Aplicación
dc.subject.ddc006.42
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#2.11.04
dc.titleAlgoritmo basado en inteligencia artificial para el procesamiento de libros caja manuscritos y su conversión a archivos de datos estructurados
dc.typeinfo:eu-repo/semantics/bachelorThesis
renati.advisor.dni44370672
renati.advisor.orcidhttps://orcid.org/0000-0003-1053-1326
renati.author.dni71710065
renati.discipline722076
renati.jurorAgurto Adrianzén, Marcos
renati.jurorCarrasco Fonseca, Julio Gustavo
renati.levelhttps://purl.org/pe-repo/renati/level#tituloProfesional
renati.typehttps://purl.org/pe-repo/renati/type#tesis
rim.academicdepartmentÁrea de Sistemas de Informaciónes
rim.collegeFacultad de Ingenieríaes
rim.departmentDepartamento de Ingeniería Industrial y de Sistemases
thesis.degree.disciplineIngeniería Industrial y de Sistemas
thesis.degree.grantorUniversidad de Piura. Facultad de Ingeniería
thesis.degree.nameIngeniero Industrial y de Sistemas
Files
Original bundle
Now showing 1 - 4 of 4
No Thumbnail Available
Name:
ING_2412_cREST.pdf
Size:
434.19 KB
Format:
Adobe Portable Document Format
Description:
Archivo principal
No Thumbnail Available
Name:
Autorización-Chapilliquen_Nicolas.pdf
Size:
499.09 KB
Format:
Adobe Portable Document Format
Description:
Autorización de publicación
No Thumbnail Available
Name:
Reporte-Chapilliquen_Nicolas.pdf
Size:
3.84 MB
Format:
Adobe Portable Document Format
Description:
Reporte de Turnitin
No Thumbnail Available
Name:
ING_2412.pdf
Size:
4.03 MB
Format:
Adobe Portable Document Format
Description:
Archivo completo
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: